新媒体舆情监控系统方案课件.pptxVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

新媒体舆情监控系统方案

1.现状分析2.系统功能与架构3.成功案例4.应用场景

如何应对舆情监控难点l如何第一时间掌握到“与我相关”的重大事件?l如何能准确地收集到“我最需要”的舆情信息?l如何能不留死角的全网监控到舆情信息?l如何防止网上“神不知鬼不觉”的舆情发生?l如何防止网上有害信息泛滥和舆情失控?l如何追溯网上重点内容的传播途径?l如何化解网络危机?l如何应对网络突发公共事件?l如何全面掌握社情民意?l如何为上级部门推送网络舆情简报?

如何应对舆情事件l应对方法之未雨绸缪l参考新闻五要素(人、事、时、地、因)l准备危机防控预案l应用方法之快速反应l根据危机防控预案,快速分类处置l常见、特殊事件的基调和处理流程l媒体快发,迅速将自己的声音大过媒体进行传播l抢发正面、删除负面、终结谣言l有问题自己说,少让别人传l应对方法之媒体关系l纸媒、广播、电视、网络、手机等l全方位整合营销

舆情监控的意义1、当今社会,互联网已经成为中国主流舆论场,占据第一影响力位置。2、越来越多的企业危机来自于互联网。3、网络是社会信息的集散地,也是社会舆论的放大器。很多言论,是通过网络放大、推进、炒作并形成舆论的。

1.现状分析2.系统功能与架构3.成功案例4.应用场景

系统整体架构

系统网络架构数据清洗整合转换数据集运算文本分类和搜索数据清洗整合舆情监控系统协同化信息采集信息采集网络目标网站层叠式分类器集群舆情监测应用逻辑统计报表文本分类信息管理和平台管理访问控制全文搜索

舆情监控系统特点

微博舆情监控特征n社会化媒体?新浪微博?腾讯微博?搜狐微博?人人网语义标注信息采集?其它社交网站n社会化媒体特征n内置浏览器引擎以采集动态网页内容,弥补普通网络爬虫的不足n基于语义标注的精确采集,将碎片化信息结构化转换,便于挖掘深层情报n基于云计算框架的跨地域协同化网络爬虫,应对海量的社会化媒体?快速传播?碎片化?海量数据?去中心化?……

技术实现?技术实?技术实现2现1碎片化信息的结构化转换动态网页数据采集语义标注和结构化转换网络爬虫采集云?技术实现4?技术实现3

动态网页数据采集HTML不见了大片的JS代码人在浏览器上看到的网络爬虫看到的无法搜索内嵌浏览器渲染自动模拟用户点击所见即所得采集方式

碎片化信息的结构化转换影响力人口地理特性社交媒体传播角色性别,城市碎片化的内容转发传播关系路径分析,社交图谱新鲜度实效影响碎片化内容情报结构化数据挖掘商业竞争社会舆情品牌口碑丰富的语义数据

语义标注和结构化转换语义标注第一步:语义标注第二步:自动算出采集规则第三步:采集规则发布给协同化爬虫第四步:采集和结构化转换后续:入库和文本挖掘原文评论数发布时间转发数评论数

网络爬虫采集云北京上海网络爬虫网络爬虫XML/HTTPWebServiceAPI深圳广州网络爬虫网络爬虫

五大功能特色

数据采集全自主研发专为舆情系统设计的智能网络爬虫系统,可以实现高质量的抓取,还支持对新浪微博、腾讯微博、搜狐微博等主要微博平台信息的实时抓取。新闻平面媒体……搜索引擎汇集了绝大部分的网络舆论。借助搜索引擎,我们实现了更全面的网络舆论监测。论坛/社区博客/微博

数据筛选准?基于机器学的垃圾机制可以微博博文告、水等无效垃圾信息。信息过滤智能去重内容聚合?根据微博博文内容的匹配程度确定是否重复、去重的根据不同的需要特色分:URL去重、去重、正文去重三个?自提取任意复网中的、内容、作者、布等信息,自跟踪博文分;于信息自分主、回帖及作者信息等。

数据分析强舆论信息数量载体分布量:新闻、论坛、平媒、博客、微博等载体分布博客/微博:浏览量、评论量新闻/平面媒体:转发量论坛/社区:浏览量、回复量媒体排行:媒体、网民发布声量、转载等排行关注度:品牌提及信息占行业的比率影响力:提及媒体的价值占行业整体价值的比例美誉度(正负面):品牌的正面或积极舆论占自身舆论总量的比值推荐率:媒体、网民在发表针对某品牌的舆论时,明确对该品牌进行推荐的舆论占自身舆论总量的比值

监测纬度广站内搜索:通模用行,行站内关字网爬虫:通网爬虫行搜索引擎搜索:根据关字及站点通搜索引擎行搜索。据抓取。搜索,如新浪微博。通网爬虫技、站内搜索、搜索擎多度数据采集,建立数据。

危机预警快?短信警?件警?窗警?信息重?体重?相似性?正?声量化

舆情监控适用范围客服人员公关人员市场人员企业·监测企业话题·分析品牌、媒介·寻找领袖意见·监测解答用户问题·预警负面信息·搜藏精华信息·追踪敏感话题·监测竞争对手·监测用户反馈意见·监测营销效果·行业热门话题·对比竞品·分析产品活跃领袖意见·监测竞品动态

1.

文档评论(0)

139****0945 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档