- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《第十三课机器学习算法初步(1)—K-Means算法》粤教版信息技术九年级
内容总览目录05拓展延伸07板书设计课堂总结06K-Means算法的应用04K-Means算法03教学目标01新知导入02
教学目标1、信息意识:能够识别K-Means算法在数据聚类和模式识别方面的重要性,并了解其在实际生活中的应用。2、计算思维:能够对分群和聚类问题的理解,寻找问题解决方案,提出假设并构建算法解决问题的能力。3、数字化学习与创新:能够学会使用K-Means算法处理现实数据集,发现数据中的隐藏模式和规律。4、信息社会责任:在使用K-Means算法时能遵循道德规范和法律要求。
新知导入K-Means算法导入视频
03、K-Means算法
新知讲解K-Means算法是发现给定数据集的h个簇的算法。簇个数h是用户给定的,每个簇通过其质心(Centroid),即簇中所有点的中心来描述。K-Means算法工作时,首先随机确定k个初始点作为质心;接着将数据集中的每个点分配到一个簇中,即为每个点找距其最近的质心,并将其分配给该质心所对应的簇:然后把每个簇的质心更新为该簇所有点的平均值。上述流程可用如下伪代码表示:
新知讲解上面提到的距离计算方法D(XC)可以使用任何合适的距离度量方法。K-Means算法在数据集上的性能会受到所选距离计算的影响。
04、K-Means算法的应用
新知讲解K-Means算法通常可以用于处理维数、数值都很小且连续的数据集,主要应用于从随机分布的事物集合中对相似事物进行分组。例如,对一个营销组织来说,将不同客户根据他们的特点分组,从而有针对性地定制营销活动;对学校老师来说,将学生根据特点分组,从而有所侧重地进行教育活动。K-Means在不同领域都有类似的应用案例。
新知讲解鸢尾花数据集(Iris是一类多重变量分析的数据集。它最初是从尾属花朵样本中提取的地理变异数据,后来作为判别分析的一个例子,运用到统计学中。
新知讲解鸢尾花数据集包含150组数据,分为三类,包含山鸢尾(IrisSetosa)、变色尾(IrisVersicolor)和维吉尼亚尾(IrisVirginica),如图13-1(a)所示。每类50组数据,除花卉种类信息以外,每组数据还包含四个属性,分别是花萼长度(sepallength,单位cm)、花萼宽度(sepalwidth,单位cm)、花瓣长度(petallength,单位cm)、花瓣宽度(petalwidth,单位cm)。可通过四个属性预测鸢尾花属于三个种类中的哪一类。在如图13-1(b)所示的特征空间中,紫色的种类与其余两个种类可通过一个空间中的平面分隔区分,而另外的两个种类则难以通过一个分类面来区分。
小组讨论结合K-Means算法的应用例子,填写表13-1序号应用场景特点1K-Means算法是什么K-Means算法的目标是最小化集群内部的平方距离之和,同时最大化不同集群之间的距离。这一过程使得数据点被分配到与其最相似的集群中,并且各个集群之间的差异被最大化。2K-Means算法的应用有哪些生物信息学:在基因组学和蛋白质组学研究中,K-Means算法可用于对基因表达数据进行聚类分析,以发现潜在的基因模式或蛋白质功能。
反思评价学而不思则罔,思而不学则殆。对自己在本课中的学习进行评价,对照表13-2,在相应的O里画“√”,在“其他收获”栏里留言。序号学习内容能否掌握1知道K-Means算法的概念能√不能O2了解K-Means算法的应用能√不能O其他收获:帮助我们更好地理解K-Means算法在实际应用中的限制和适用范围。
05、知识拓展
知识拓展1、K-Means算法详细介绍。
知识拓展2、K-Means算法实现聚类分析。
知识拓展3、K-Means算法在生活中有哪些应用?(1)图像压缩:通过使用K-Means算法对图像中的像素进行聚类,可以实现图像的压缩,减少存储空间需求。(2)市场分析:在市场营销和消费者行为分析中,K-Means算法可用于对消费者群体进行聚类,从而识别不同的市场细分。(3)无监督学习:K-Means算法通常用于无监督学习中,即从未被标记、分类或分组的数据中找到隐藏的结构。
知识拓展4、K-Means算法优点?(1)简单且高效:K-Means算法易于理解和实现,计算速度快,适用于大规模数据集。(2)可扩展性:在处理大规模数据时,K-Means算法效果良好,能够处理较大规模的数据集。(3)对处理离群值较为鲁棒:K-Means算法对离群值的影响较小,因为离群值对聚类中心的影响会被平均化。
06、课堂总结
课堂总结通过机器学习算
您可能关注的文档
- 第9课《认识大数据》 课件 粤教版信息技术九年级.pptx
- 第10课 网页的编辑与发布 教案 浙教版信息科技八年级上册.doc
- 第10课《大数据的处理》 课件 粤教版信息技术九年级.pptx
- 第11课《大数据的应用》 教案 粤教版信息技术九年级.doc
- 第11课《大数据的应用》 课件 粤教版信息技术九年级.pptx
- 第12课《机器学习概述》 教案 粤教版信息技术九年级.doc
- 第12课《机器学习概述》 课件 粤教版信息技术九年级.pptx
- 第13课《机器学习算法初步(1) K-Means算法》 教案 粤教版信息技术九年级.doc
- 第14课《机器学习算法初步(2) 决策树》 教案 粤教版信息技术九年级.doc
- 第14课《机器学习算法初步(2) 决策树》 课件 粤教版信息技术九年级.pptx
文档评论(0)