基于Hadoop的灰狼优化K-means算法在主题发现的研究.docx

基于Hadoop的灰狼优化K-means算法在主题发现的研究.docx

  1. 1、本文档共13页,其中可免费阅读8页,需付费150金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.?? 引言 热点主题发现[1~3]是包含一系列数据处理技术一项综合性的研究,目的是用于发现话题事件并追踪.现如今,社交平台、智能终端的普及使得互联网每日产生的信息数据以几何形式急速膨胀.根据CNNIC发布的统计报告,微博已经成为中国网民网络互动并提供各种信息的主流源头之一,现实社会中发生的几乎都能在微博被传播,但并不是所有的事件或言论都能形成热点,这使得如何快速准确的进行信息价值挖掘、发现热点主题面临着挑战. 现如今聚类算法有很多,K-means算法凭借其理论易懂,实现难度低的优势,已成为数据挖掘领域具有代表性的聚类算法[4][5].K-means算法在初始化阶段预先输入聚类数K,然后通过

文档评论(0)

罗伯特之技术屋 + 关注
实名认证
内容提供者

畅游技术蓝海,八大领域技术领先解读!

1亿VIP精品文档

相关文档