(1.10)--第10章 聚类分析人工智能导论.ppt

(1.10)--第10章 聚类分析人工智能导论.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第十章聚类分析ClusterAnalysis

PPT模板下载:/moban/行业PPT模板:/hangye/节日PPT模板:/jieri/PPT素材下载:/sucai/PPT背景图片:/beijing/PPT图表下载:/tubiao/优秀PPT下载:/xiazai/PPT教程:/powerpoint/Word教程:/word/Excel教程:/excel/资料下载:/ziliao/PPT课件下载:/kejian/范文下载:/fanwen/试卷下载:/shiti/教案下载:/jiaoan/PPT论坛:目录CONTENTS简单聚类方法一二谱系聚类三K-均值聚类四无监督学习与聚类本章主要参考教材:《模式识别》刘家锋等

一、无监督学习与聚类有监督学习确切地知道每一个训练样本所属的类别;利用训练样本学习分类器,对未知类别样本分类。关键问题:如何度量样本间的“相似性”。无监督学习无监督样本集:已知训练样本集合中的样本,不能确切知道每个样本所属的类别利用无监督样本集,希望能够学习出某种规律性的东西,构造相应的分类器.

一、无监督学习与聚类聚类(Clustering)根据某种原则将样本或者数据集合划分为若干个“有意义”的子集(聚类)同一子集内的样本之间具有较大的“相似性”不同子集样本之间具有较大的“差异性”。

一、无监督学习与聚类聚类(Clustering)根据某种原则将样本或者数据集合划分为若干个“有意义”的子集(聚类)同一子集内的样本之间具有较大的“相似性”不同子集样本之间具有较大的“差异性”。

一、无监督学习与聚类聚类(Clustering)根据某种原则将样本或者数据集合划分为若干个“有意义”的子集(聚类)同一子集内的样本之间具有较大的“相似性”不同子集样本之间具有较大的“差异性”。类别数K=2

1、为什么要进行无监督学习?理论意义——科学归纳知识都是实践过程中通过经验的积累、整理和对事物规律的发现所得到的对各种纷繁复杂的事物进行分类,是认识世界的重要科学方法实践意义——揭示观测数据的内部结构和规律对海量数据进行分析网络的普及和发展,获取大量训练样本变得容易,逐一对这些样本进行标注,非常耗时耗力。需要利用聚类对这些数据进行概括和解释描述样本集合的有关结构信息,帮助监督学习更好设计分类器

2、聚类分析的应用信息检索检索结果聚类商业应用:用户的属性聚类,商品属性聚类图像分割图像中所有像素点的聚类过程数据压缩通过聚类找到相似数据的“中心”医学应用:药物反应、医疗数据挖掘

3、聚类分析的过程同样的一组对象采用不同的特征聚类,结果可能是完全不同1)聚类分析过程

2)聚类和分类有什么不同?聚类(Clustering)分类(Classification)给出/构造相似性测度(Similaritymeasure)给出标签(Labels)通过相似性推测标签通过标签推测相似性只讨论如何对当前样本集合中样本进行分类对样本集之外的其它样本进行分类发现知识学习知识,解决问题3、聚类分析的过程

3)聚类中的两个关键问题怎样度量样本间的“相似性”? 如何定义相似性测度(Similaritymeasure)3、聚类分析的过程

3)聚类中的两个关键问题怎样度量样本间的“相似性”? 如何定义相似性测度(Similaritymeasure)3、聚类分析的过程

3)聚类中的两个关键问题怎样度量样本间的“相似性”? 如何定义相似性测度(Similaritymeasure)3、聚类分析的过程

3)聚类中的两个关键问题怎样度量样本间的“相似性”? 如何定义相似性测度(Similaritymeasure)样本间的距离3、聚类分析的过程

3)聚类中的两个关键问题怎样才算好的聚类? 如何构建聚类的准则函数,用于评价聚类效果。3、聚类分析的过程

4、聚类问题的描述每个聚类至少包含一个样本任何一个样本属于且只属于一个聚类。聚类结果是对集合D的一个划分聚类的数学描述怎样才算一个好的划分?——聚类准则

思路:类内散布程度低、类间散布程度高模型:1)类内距离准则:用每个样本与其所属聚类中心之间的距离平方和来度量2)类间距离准则:用每个聚类的中心到样本整体中心之间的加权距离平方和度量4、聚类问题的描述聚类准则——怎样才算一个好的划分?

4、聚类问题的描述3)类内、类间“散布矩阵”第j类内散布矩阵:总的类内散布矩阵:类间散布矩阵:总体散布矩阵:协方差矩阵估计

PPT模板下载:/moban/行业PPT模

文档评论(0)

185****8578 + 关注
实名认证
内容提供者

热爱教育,专注于教育领域创作与分享。

1亿VIP精品文档

相关文档