- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DOI:10.13878/ j.cnki.jnuist.2017.06.003
1,2 1,2 3 3 1,2
金志威 曹娟 王博 王蕊 张勇东
融合多模态特征的社会多媒体谣言检测技术研究
摘要 0 引言
以微博为代表的社会媒体的蓬勃发
展在加速信息交流的同时,也促使虚假 随着Web2.0时代的到来,各种社会媒体应运而生.以微博为代表
谣言信息迅速在社会网络上传播,造成 的社会媒体通过开放平台鼓励用户自己生产内容(User Generated
严重的后果. 自动谣言检测问题受到了
国内外学术界、产业界的广泛关注.围绕 Content,UGC),并通过社交网络进行发布、分享、交流和传播.这种基
社会多媒体谣言检测这一问题,本文总 于社会媒体发布、分享多媒体内容的社交行为方式成为人们生活中
结了融合多模态特征的谣言检测相关技
不可或缺的一部分,对社会产生了巨大的影响.
术.首先从基本概念出发,阐述了谣言的
定义和社会多媒体的特点,给出了社会 社会媒体平台以其开发与便捷性,极大地促进了新闻信息的快
多媒体谣言检测问题的定义.针对谣言 速交流,成为当今社会人们获取信息资源的重要手段.根据中国互联
检测面临的多模态特征抽取和模型构建
网络信息中心(CNNIC)2017年1月发布的第39次《中国互联网络发
两大难点,分别总结和归纳了各种类型
[1]
的特征及其提取方法和不同的机器学习 展状况统计报告》 表明,截止2016年12月,我国网民规模已达7.31
检测模型.这些特征和算法是检测谣言 亿,其中84%的网民通过互联网获取新闻.对媒体工作者而言,社会媒
的基本手段,也是接下来研究的基础,可 体也是重要的新闻线索来源:根据2011年的统计数据,超过80%的社
为进一步谣言检测的研究提供参考.
[2]
关键词 会重大新闻第一手信息来源于微博 .
谣言检测;社会媒体计算;多媒体计 然而,社交平台在加速信息公开的同时,也带来了谣言等虚假信
算;深度学习;多模态特征融合;新闻 息的泛滥.由于普通用户的媒介素养参差不齐,造成UGC新闻普遍存
认证
在着虚假、差错、欠准确等问题.在缺乏有效的新闻认证技术以及“抢
中图分类号 TP393092 新闻”、“追热点”的心态下,大量公众人物和主流媒体无意间推转相
文献标志码 A
关虚假新闻,成为很多网络谣言和虚假报道的推波助澜者,严重损害
[3]
了他们的媒体公信力.据《中国新媒体发展报告( 2013 )》 统计的
2012 年的 100 件微博热点舆情案例中,有 1/ 3 的热点事件出现了谣
言.国外的网络谣言问题同样不容乐观.在2016 年美国总统大选期
间,大量谣言在Facebook、Twitter上广泛传播,甚至被指控严重影响了
收稿日期 2017⁃08⁃28 [4]
美国大选结果 .
资助项目 国家自然科学基金;中
国电科创新基金;中国电科联合 网络谣言的广泛传播会侵害到个体和社会的发展,对个体情感、
基金(2
文档评论(0)