- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机科学与技术学院 毕业设计(论文) 论文题目 基于RDF三元组的微博数据格式化存储方法 指导教师 职 称 博士讲师 学生姓名 学 号 专 业 网络工程 班 级 系 主 任 院 长 起止时间
目 录
摘要 i
Abstract ii
引言 1
第一章 微博数据获取 2
1.1 新浪微博开放平台 2
1.1.1 简介 2
1.2 微博数据获取 2
1.2.1 微博数据获取流程图 2
1.2.2 应用的创建 3
1.2.3 下载软件开发包(SDK) 4
1.2.4 获取微博数据 5
1.3 本章小结 9
第二章 微博数据转换 10
2.1 微博数据分析 10
2.2 微博数据转换 11
2.2.1 RDF简介 11
2.2.2 微博数据转换的实现 12
2.3 本章小结 20
第三章 微博RDF数据的存储及查询 21
3.1 Openlink Virtuoso数据库 21
3.1.1 Virtuoso数据库简介 21
3.1.2 Virtuoso数据库的安装及使用 21
3.2 微博RDF数据的存储 22
3.3 微博RDF数据的查询 23
3.3.1 SPARQL查询语言简介 23
3.3.2 微博数据查询 23
3.4 本章小结 29
第四章 总结与展望 30
4.1 总结 30
4.2 展望 30
参考文献 31
谢辞 33
附录 34
基于RDF三元组的微博数据格式化存储方法
摘要:语义网为Web上日益增长的大数据提供了有效的智能化处理手段,它使用资源描述框架(Resource Description Framework,RDF)来描述网络数据。本文通过对新浪微博上较为杂乱的微博数据进行分析,根据RDF三元组规则,为其中所需有用信息数据添加语义,并以XML为语法,编写算法将其转换为RDF文件;此外,研究了RDF 数据库Virtuoso的使用方法,并将微博的RDF数据导入Virtuoso,使用SPARQL语言对其进行快速查询和验证。总之,本文为微博数据的语义转换提供了借鉴,对于提高网络资源的检索效率具有重要意义。
关键词:数据;RDF;三元组;存储
RDF-Formatted Data Storage Method for Weibo
Abstract: Semantic Web provides an effective measure of intelligent processing for the growing big data on the Web,which uses the Resource Description Framework(RDF) to description the network data.This article through to make an analysis of the messy Weibo’s data,and to add semantics for the needed and useful data by the rules of RDF triples, then, write algorithms to convert it to RDF file by the grammar of the XML, in addition, studied the use of RDF database Virtuoso and import the RDF file of Weibo’s data into Virtuoso,using SPARQL language for its fast query and validated. All in all, this article provides reference for the Weibo data semantic conversion, and has great significance for improvig the retrieval efficiency of the network resources.
Key words:data, RDF, triples, storage
引 言
如今,随着社交网络化时代的逐步到来,各种社交软件和社交平台接踵出现,而微博,这种基于用户关系进行信息分享、传播的平台开始被越来越更多的人喜爱和使用。因此,随着微博用户的增多以及时间的推移,微博上的信息数据量也开始越来越庞大而复杂,所以,要想从这些信息数据中获取某相关数据或分析某相关数据不是一件容易的事情。虽然现在有各种搜索引擎的帮助,但是仅凭靠利用关键字的
您可能关注的文档
- 基于ADSP-BF533的数码相框系统的设计与实现毕业论文设计.doc
- 基于FPGA的16QAM调制解调电路设计毕业设计(论文).docx
- 基于FPGA的串口设计毕业设计论文.doc
- 基于GIS的物联网监测信息查询与可视化毕业设计(论文).doc
- 基于J2EE交友网站的设计与实现学士学位毕业论文.doc
- 基于JSP+MYSQL职业培训学校招生管理系统毕业设计(论文).doc
- 基于JSP技术的企业商品展示网站设计与实现毕业设计论文.doc
- 基于JSP综合新闻发布系统设计与实现毕业论文.doc
- 基于Matlab的IIR数字滤波器设计(毕业论文).doc
- 基于Matlab的IIR数字滤波器设计毕业设计(论文).doc
文档评论(0)