- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于社交网络的用户需求发现与物品推荐.doc
基于社交网络的用户需求发现与物品推荐
摘要:微博作为当下最受欢迎的社交网络之一,包含了大量的用户需求和兴趣偏好信息,如何动态地从微博内容中提取用户的需求和偏好信息,将推荐算法结合社交网络产生推荐结果,解决信息过载的问题,目前暂时还没有相关的较为成熟的应用。本文设计并实现了基于社交网络的物品推荐系统,提取用户微博内容关键词作为用户需求特征,建立物品信息库,通过文本相似度计算用户需求和物品信息之间的匹配度,采用基于内容的推荐算法产生推荐结果。最后进行离线实验,对推荐系统产生的推荐结果进行评测分析。
关键词:社交网络;用户需求;基于物品推荐算法;微博
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)24-0260-03
Abstract: Microblog is one of the most popular social networks, containing plenty of information of users’ preference and needs. However, there are still no mature applications to extract the information of users’ preference and needs from microblogs and combine those with recommendation algorithms to recommend items. Thus, this paper proposes and implements a recommendation system for social networks. First of all, users’ content of weibo was crawled and keywords were extracted as characteristics of users’ needs. Next, an item repository was built with specific characteristics of the items. Using the text similarity algorithm, similarity between users’ needs and items’ characteristics can be computed. Then with the content-based recommendation algorithm, we produced recommendation results for users which they may be interested in. At last four offline experiments on the recommendation results were done to evaluate and analyze the performance of this recommendation system.
Key words:social networks; users’ interests; content-based recommendation algorithm; Microblog
1 背景
近年来,社交网络的发展引人注目。目前据百度百科的统计,约有一半以上的中国网民通过社交网络进行沟通交流、分享信息。据尼尔森2010年的报告,全球用户在互联网上22%的时间花费在社交网站和社交媒体上[1]。通过社交网络不仅可以很好地获取用户社交关系,并且允许用户公开地展现自己,表达用户个人兴趣,对于研究个性化推荐系统具有很好的价值。本文利用社交网络信息对用户进行个性化物品推荐。
目前流行的推荐算法主要有基于内容的推荐算法[2]、协同过滤推荐算法[3]和混合推荐算法等。本文采用基于内容的推荐算法,其不需要获取大量的用户评分数据,因此不存在评分数据稀疏性问题;对于新物品,一旦提取新物品的特征建立物品配置文件后即可向相似用户进行推荐,解决了新物品的冷启动问题;并且易于实现自动化提取物品特征算法。
2 基于社交网络的物品推荐系统设计
2.1 系统框架
本文基于腾讯微博获取用户的需求与兴趣并进行物品推荐,设计整体框架如图1所示。通过爬虫[4]爬取腾讯微博较为简便,IP地址不容易被封锁,能够快速爬取大量用户数据。
在用户需求发现阶段,首先通过爬虫根据API爬取大量用户的微博内容,存储到数据库中。然后对每一个用户的所有微博内容提取关键词作为每一个用户的需求模型,构成了用户特征库。
在物
文档评论(0)