互联网信息搜索与监测系统_网络舆情..docx

互联网信息搜索与监测系统_网络舆情..docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互联网信息搜索与监测系统_网络舆情.

互联网信息搜索与监测系统白皮书江苏金鸽网络科技有限公司2014年7月目录一、开发背景1二、系统概述1三、系统结构2四、功能简介3(一)信息采集3(二)信息监测4(三)智能分析5(四)信息预警5(五)统计报告6(六)舆情导控7(七)辅助功能8(八)系统管理9五、系统特色9(一)深度与广度相结合的信息采集方式9(二)基于语义的负面信息过滤技术9(三)智能的行业核心智能体10(四)信息采集智能调度10(五)属性自动提取技术10(六)来源规则匹配技术10(七)黑名单网站自动发现技术10(八)移动终端信息展示技术11六、运行环境11七、公司资质13八、联系方式14开发背景根据《第33次中国互联网络发展状况统计报告》,截至2013年12月,中国网民规模达6.18亿,互联网普及率为45.8%。其中,手机网民规模达5亿。中国进入“大众麦克风”时代,各类网络媒体如微博、微信等新兴媒体层出不穷,导致社会舆论格局发生巨大变化,每一位网民和手机用户都可能成为“公民报道者”,在一些突发公共事件中经常成为第一信源。特别是微博客、微信的异军突起,成为新闻曝光和舆论发酵的重要平台,信息的传播速度足以在数小时内传遍全球,因此,及时掌握舆论相关信息,无论对政府还是企事业单位,都有着至关重要的意义。由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、传播思想。但是,网络信息存在很大的不可控性,使网络更容易成为一种非理性的表达渠道,任何一个被关注的事件,都容易在网上产生舆论风暴效应,短时间内形成新闻热点,进而对政府、公众产生巨大的舆论压力。为了有效的解决舆情管理工作中存在的滞后、被动的弊端,达到全面、及时的获取互联网信息的目的,需要建立互联网信息搜索与监测系统,形成全方位的监测网络体系,实现手工监测模式向信息化监测模式的转变。系统概述互联网信息搜索与监测系统软件,是一款集信息的搜索、采集、分析、预警、整合、呈报、导控为一体的海量信息挖掘工具软件,以实现“发现信息源头,追踪传播路径,监控传播主体,导控舆论倾向”为总体目标。系统针对不同行业的业务需求,在领域专家的协助下,实现对互联网上的论坛、博客、新闻、贴吧、微博、搜索引擎、微信等各类媒介信息的精准搜索与实时监测;系统采用自然语言理解、知识挖掘、本体构建等核心技术,对信息进行有效的提取、分析、过滤、聚类、分类和预警,以满足广大用户对信息“及时性、全面性、智能性、精准性”的使用要求;系统提供官方信息权威发布和精准信息定向回复功能,以达到“早监测、早发现、早处置、早导控”的目的。系统结构系统采用 B/S(Browser/Server,浏览器/服务器)系统结构。数据的分析和存储由位于网络中心的服务器处理,不管是系统管理员还是终端用户,都通过浏览器来访问本系统获取、分析和处理信息。这种结构能做到真正的分布式网络计算,有效降低网络流量,减轻客户端负担,还能安全、方便地与互联网接口。另外用户分布或行走于全国各地,通常都有移动办公需求,系统提供移动终端访问接口,用户只需随身携带移动通信设备,就可以访问系统,获取最新舆情信息。系统结构图功能简介系统首页信息采集系统采用定向采集和全网搜集相结合的信息采集方式,针对与日常业务具有密切关系的网站进行实时监控,使网站的任何新的信息能快速及时的被采集。(1)内置的搜索信息整合功能系统内置了几十个搜索引擎,支持对知名新闻媒体、论坛、贴吧及微博网站、微信平台的站内垂直搜索,扩大了信息采集的范围。管理员根据系统的运行状态、服务器资源使用情况,灵活设置搜索引擎的启用或暂停,提升系统搜索引擎的自动调度能力。采用基于知识库的信息提取技术,过滤掉部分无效的信息,提取出关键、敏感的信息,达到精确搜索。 (2)新闻、资讯类网站的采集系统支持对新闻网站上的新闻、资讯信息的采集,可以采集信息中的标题、作者、来源、时间、正文、点击率等信息项,可采集网站包括新华网、人民网、中国政府网、新浪新闻、搜狐新闻、联合早报、路透中文网、中国网、环球网、网易新闻、正义网等等。(3)博客类网站的采集系统支持对博客网站上的博文信息进行采集,可以采集博文标题、发表时间、内容、标签、分类、评论、评论人、阅读人次、转发量等信息项,可采集网站包括新浪博客、博客网、网易博客、搜狐博客等等。(4)论坛、贴吧类网站的采集系统支持对论坛、贴吧网站上的发帖回帖信息进行采集,可以采集帖子标题、发表时间、发帖人昵称、帖子内容、浏览次数、回复次数、回帖人昵称、每个回帖内容等信息项,可采集网站包括强国论坛、天涯社区、西祠胡同、新浪论坛、百度贴吧等等。(5)微博、微信类网站的采集系统支持对新浪、腾讯、搜狐、网易等各大微博网站上的信息进行采集,同时支持对微信平台信息的搜索采集,可以采集微博网站首页的热点信息、各行业及

文档评论(0)

kakaxi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档