基于大规模数据的社会影响力分析.docxVIP

基于大规模数据的社会影响力分析.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大规模数据的社会影响力分析 1 社会影响在中国在线社会网络中的度量 社会影响是指一个人的情绪、意见或行为受到他人影响的现象。社会网络(社交网络)的传播方式和作用是社会学研究的长期对象。自上个世纪中期以来,社会学家先后提出了两个传播理论:弱势势力理论——优势势力理论——强势力优势理论——结构理论——等理论来分析和解释社会网络中的社会影响现象,为该领域建立理论基础。 但是, 由于真实世界中的社交关系和社会影响往往是难以观测的, 社会影响的形式也往往是复杂而多样的, 对社会影响的实证研究受到了很大的限制.而这种情况, 随着一些在线社会网络的出现和兴起, 得到了改善.大型在线社交网站因其用户数量大、用户行为活跃、用户交互方式较为一致、用户行为和关系记录完整等特点, 为研究社会网络中的社会影响现象提供了一个较为理想的实验环境.同时, 更好的理解社会影响这一现象及衡量在在线社会网络中社会影响力的大小能够加深我们对在线社会网络的认识, 并且能够改进好友推荐[5]、专家用户发现[6]、垃圾信息发现、病毒营销和内容排序等应用.所以, 通过挖掘在线社交网站的数据, 分析社会影响现象, 度量社会影响力大小成为了当前的一个研究热点. 具体到国内互联网环境, 微博类网站是用户数最多的在线社交网站.根据CNNIC在2013年1月公布的中国互联网络发展状况统计报告[7], 微博用户在2012年末达到3.09 亿, 年增长率达23.5%, 网民中微博用户的比例达到54.7%, 报告认为微博已经成为中国网民使用的主流应用, 处于网络舆论传播中心地位.所以, 更好地分析微博类网站中的信息传播和社会影响现象, 度量中文微博环境中的用户社会影响力大小, 有着尤为重要的意义. 通过比较, 我们认为微博类网站与其它在线社交网站的主要区别有两点.首先, 微博用户间的关系是单向关注关系, 而其它社交网站用户间的关系是双向的好友关系.在一个典型的微博类网站中, 系统通常展示给用户一条实时更新的、包含其所有被该用户关注的用户的一段时间内所有微博的时间线1, 供其进行浏览和阅读. 其次, 与其它社交网站提供了发布状态 (类似微博的短消息) 、发布日志 (有格式的长文章) 、分享图片或视频等多媒体内容, 以及评论和转发其它用户发布的内容等较为多样的使用方式不同, 在微博类网站上, 用户通常只能发布一条140个字符以内的微博, 或者转发一条他所阅读过的微博.而一个用户所有发布或转发的微博, 都会以相对统一的形式被展现在关注了该用户的其它用户的时间线上. 以上两个特点使得微博类网站更类似于一个社会化的媒体, 而不是普通的社会网络[8].因此, 我们认为在微博类网站上, 应该以媒体传播效果而非网络拓扑结构中的重要性作为影响力度量的标准.具体来说, 可以通过用户所发布的一条微博的平均被阅读次数作为该用户影响力大小的一个可行的度量指标.同时, 微博上信息传播扩散的主要机制是转发, 而转发一条微博这一行为本身也是受到影响的标志, 所以我们还考虑了用户所发布的一条微博的平均被转发次数这一指标. 本文第2节将主要调研在线社会网络社会影响力研究方面已有的成果和存在的问题;第3节将简要介绍论文工作所基于的数据集合, 并从时间维度分析微博发布行为与转发行为之间的关联关系;第4节将基于数据观察, 提出影响力估计模型和相关参数的估计方式;第5节介绍实验设置和实验结果;最后给出总结和对未来研究工作的思考. 2 用户社会影响力 正如在第1节中提到的, 影响力分析是当前在线社会网络研究中的热点方向, 研究者们从不同的角度分析了不同形式的社会影响现象. 2003年, 早在微博类社交网站出现前Kempe等人[9]就研究了“影响力最大化 (Influence Maximi-zation) ”模型, 并对在给定传播模型参数的条件下, 如何寻找最优的种子用户集合, 使得最后社会影响的传播扩散规模最大这一NP难问题给出了近似解.但他们的研究并没有将重点放在从实际的数据中推测传播模型的参数上, 所以不能直接用于分析微博用户的社会影响力大小.2010年, Goyal等人[10]基于上述传播模型, 从图片分享网站Flickr的用户行为记录中推测模型参数.他们基于得到的参数, 分析了互为好友的用户对之间的影响力大小, 而没有分析用户在社会网络中全局意义上的影响力大小. 在微博类社交网站中, 研究者较为集中关注Twitter网站上的各种影响力传播现象, 并用不同方式开展了针对Twitter用户的社会影响力的分析工作. 2010年, Cha等人[11]比较分析了按照被转发次数、被提及 (@mention) 次数和关注者数量3种衡量用户影响力的方式, 并分析了影响力随时间变化的规律.他们发现, 拥有较多关注者的用户并不一定能引发更多

文档评论(0)

xcwwwwws + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档