基于Python的聚类分析及其应用.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Python的聚类分析及其应用.pdf

第 24 卷第 1 期 上  海  工  程  技  术  大  学  学  报 Vol . 24 No . 1 20 10 年 3 月 J OU RN AL O F SHAN GHA I UN IV ER SI T Y O F EN GIN EERIN G SCIEN CE Mar . 20 10 ( )   文章编号 : 1009 - 444X 20 10 0 1 - 0047 - 04 基于 Python 的聚类分析及其应用 庄怡雯 , 吴金桥 , 黄润才 , 曹奇英 ( 东华大学 计算机科学与技术学院 , 上海 20 1620) 摘要 : 在研究聚类基本原理及相应算法的基础上 ,着重分析了层次聚类算法和 kmean s 分割聚 类算法 ,并比较了这两种算法的特点. 结合 Pyt ho n 语言的特点 ,编写程序实现了kmean s 聚类算 法在博客数据集上的聚类应用 ,给出了详细的聚类实验结果分析. 关键词 : 聚类分析 ; Pyt hon 语言 ; 层次聚类 ; kmean s 聚类 中图分类号 : TP 39   文献标志码 : A PythonBased Cluster Analysis and Its Appl ication ZHU AN G Yiwen , WU J inqiao , HU AN G Runcai , CA O Qiyin g ( College of Comp ut er Science and Technology , Donghua U niver sit y , Shanghai 20 1620 , China) Abstract : Ba sed on t he re search of t he p rincip le and algorit hm s of clu st er analy si s ,t he analy si s of t he hi erarchcal clu st er algorit hm an d kmean s p artitional clu st er algorit hm were focu sed . Charact eri stics of t wo algorit hm s were co mp ared . Co mbination of Pyt hon lan guage , kmean s clu st ering algorit hm wa s imp le ment ed in a blo g dat a set ,and a det ailed analy si s of exp eriment al clu st erin g re sult wa s given . Key words : clu st er analy si s ; Pyt hon language ; hierarchical clu st erin g ; kmean s clu st ering   聚类作为数据挖掘中的一项重要技术 ,常被用 在相似性划分为多个类别 ,使类别内的数据相似度 于大数据量的信息挖掘 ,如零售商可以利用聚类算 较大 ,而类别间的数据相似度较小. 通常 ,聚类算法 法跟踪消费者的购买行为 ,并据此策划相应的市场 所需的数据预处理是定义一组公共的数值型属性 , 策略. 聚类属于无监督学习方法 ,无监督学习算法 然后 ,利用这些属性对数据项进行比较. 的特点 ,即它不是利用带有正确答案的样本数据进 1. 1  聚类的基本要素 行训练 ,而是在一组数据中找到某种结构 ,数据本

您可能关注的文档

文档评论(0)

wfkm + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档