第六章2数据挖掘计算.pptVIP

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * 计算样本分别按三种属性分类的后验熵 由此可见,应选“体形”为第一次分类的属性 由于“体形”不能完全分类,因此在剩下的8个样本中,分“中”和“小” 再按“颜色”和“毛形”属性分别计算其第二次分类的后验熵 体形为“中”的: 可任选其中一种属性 体形为“小”的: 也可任选其中一种属性作为第二次分类标准 最后,得到的决策树如下图示 体形 + 颜色 颜色 大 中 小 + 毛型 + 毛型 黑 棕 黑 棕 + - + - 卷毛 光滑 卷毛 光滑 习题2: 设样本集合如下所示,其中A、B、C是F的属性,试根据信息增益标准(ID3 算法)求解F的决策树。 A B C F 0 0 0 0 0 0 1 1 0 1 0 0 0 1 1 1 1 0 0 1 1 0 1 1 1 1 0 0 (已知log2(2/3)= -0.5842, log2(1/3)= -1.5850, log2(3/4)= -0.41504, ) 计算样本分别按三种属性分类的信息熵 所以 第一次分类选属性C,对C=0的四个例子再进行第二次分类。 所以,可任选属性A或B作为第二次分类的标准,如选属性A, 则A=1的两个例子再按属性B分类,得到 最后,得到F的决策树如下: C A + C=1 C=0 — B A=0 A=1 — + B=0 B=1 * * * * * * * * * * * * * * * * * * * * * * * * 决策树的学习 如果学习的任务是对一个大的例子集作分类概念的归纳定义,而这些例子又都是用一些无结构的属性值对来表示,则可以采用示例学习方法的一个变种──决策树学习,其代表性的算法是昆兰(J.R.Quinlan,1986)提出的ID3。 决策树(Decision Tree) 一种描述概念空间的有效的归纳推理办法。基于决策树的学习方法可以进行不相关的多概念学习,具有简单快捷的优势,已经在各个领域取得广泛应用。 决策树学习是以实例为基础的归纳学习。 从一类无序、无规则的事物(概念)中推理出决策树表示的分类规则。 概念分类学习算法:来源于 Hunt,Marin和Stone 于1966年研制的CLS学习系统,用于学习单个概念。 197

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档