第14课《机器学习算法初步(2) 决策树》 课件 粤教版信息技术九年级.pptx

第14课《机器学习算法初步(2) 决策树》 课件 粤教版信息技术九年级.pptx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《第十四课机器学习算法初步(2)

—决策树》

粤教版信息技术

九年级

内容总览

目录

教学目标

1、信息意识:能够理解决策树在数据分类和预测中的应用,能够识别在日常生活和工作中决策树所能发挥的作用。

2、计算思维:能够从数据中推导出基于特征的决策规则,提高逻辑思考和推断的能力。

3、数字化学习与创新:能够寻找并尝试将决策树方法应用到不同领域的新创意,如医疗保健、金融等,以拓展创新潜力。

4、信息社会责任:能够审视决策树在现实世界中的局限性和可能的社会影响,培养对算法应用的批判性思维。

新知导入

决策树导入视频

03、决策树

新知讲解

决策树(DecisionTree)是一种通过对历史数据进行测算,实现对新数据进行分类和预测的算法。每棵决策树都表述了一种树形结构,由它的分支来对该类型的对象依靠属性进行分类。

新知讲解

如图14-1所示,决策树主要由三个部分组成,分别为决策节点、分支和叶子节点。其中决策树最顶部的决策节点是根决策节点,每一个分支都有一个新的决策节点,决策节点下面是叶子节点。每个内部节点表示一个属性的测试,每个分支代表一个测试输出,每个叶子节点代表一种类别。整个决策的过程从根决策节点开始,由上到下,根据数据的分类在每个决策节点给出不同的结果。决策树仅有单一输出,若需要多个输出,可以建立独立的决策树以处理不同输出。

学习任务

如图14-2所示是预测贷款用户是否具有偿还贷款能力的决策树。贷款用户主要具备三个属性:是否拥有房产,是否结婚和平均月收入。每一个内部节点都表示一个属性条件判断,最终节点表示贷款用户是否具有偿还能力。例如:用户甲没有房产,没有结婚,平均月收入5000元。通过决策树先判断是否拥有房产,用户甲符合右边分支(“是否拥有房产”为“否”);再判断是否结婚,用户甲符合左边分支(“是否结婚”为“否”):然后判断平均月收入是否大于4000元,用户甲符合左边分支(月收入大于4000元),该用户落在“可以偿还”的叶子节点上。所以预测用户甲具备偿还贷款能力。

学习任务

根据决策树,完善表14-1,并做出预测。

用户

现状

预测结果

没有房产,没有结婚,平均月收入5000元

具备偿还贷款能力

没有房产,没有结婚,平均月收入3500元

不具备偿还贷款能力

没有房产,已经结婚,平均月收入3500元

具备偿还贷款能力

有房产,没有结婚,平均月收入5000元

具备偿还贷款能力

04、决策树学习的应用

新知讲解

在机器学习中,决策树是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。从数据产生决策树的机器学习技术叫作“决策树学习”。决策树学习包含特征选择、决策树的生成与剪枝过程。

决策树学习算法通常采用递归法选择最优特征,并用最优特征对数据集进行分割。决策树生成时,首先构建根节点,选择最优特征,该特征有几种不同取值就分割为几个子集,每个子集分别递归调用此方法,返回的就是上一层的子节点。直到所有特征都已经用完,或者数据集只有一维特征为止。

新知讲解

在决策树学习中,为了尽可能地正确分类训练样本,节点划分过程将不断重复,有时会造成决策树分支过多、导致过拟合,因此可以通过主动去掉一些分支来降低过拟合的风险。剪枝的基本策略包括预剪枝和后剪枝。

使用鸢尾花数据集,调用Scikit-learn内嵌的决策树分类器构造决策树:

新知讲解

调用Python数据可视化模块graphviz,导出上面构造的决策树,结果保存在文件iris.pdf中,构造的决策树如图14-3所示。

新知讲解

图14-3基于鸢尾花数据集生成的决策树。

新知讲解

当我们遇到一株新的鸢尾花时,如果想知道它属于哪个品种,可以根据如图14-3所示的决策树来帮助判断。从树的根节点来看,应该首先判断它的花瓣长度。如果花瓣长度小于或等于2.45cm,那么它应该属于山鸢尾;否则,再判断花瓣宽度是否小于等于1.75cm,得出这一层的判断结果后,根据分支走向以此类推,直到找到叶子节点的位置,即没有分支再需要判断时,叶子节点给出的类别也就是我们想要的答案。

小组讨论

结合决策树学习的应用例子,填写表14-2。

序号

应用场景

特点

1

决策树是什么

决策树是一种常见的机器学习算法,它可以用于分类和回归任务。决策树通过创建一个类似树状结构的模型来学习数据特征之间的关系,并对新实例进行预测。

2

决策树学习的应用有哪些

医疗诊断:决策树可以用于辅助医生进行疾病诊断或预测患者的疾病风险,根据症状和检测结果进行分类。

反思评价

学而不思则罔,思而不学则殆。对自己在本课中的学习进行评价,对照表14-3,在相应的O里画“✓”,在“其他收获”栏里留言。

序号

学习内容

能否掌握

1

文档评论(0)

***** + 关注
实名认证
内容提供者

如有问题,请于后台留言联系上传者解决,如文档无法编辑,课件中音视频无法播放等。

版权声明书
用户编号:8116111057000017

1亿VIP精品文档

相关文档