- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
协同过滤算法在问卷平台中的研究与应用
?
?
鲍庆森董艳雪
摘要:问卷发布者由问卷用户获取海量调研数据,通过分析用户的以往行为记录,使用Jaccard相似系数计算用户之间的相似度,应用基于用户的协同过滤算法,并辅以问卷的类别限制对推荐进行调整,从而实现问卷的定向推荐。将协同过滤算法应用于问卷用户的问卷定制,可以有效提高问卷平台的问卷回收率和有效率,明显提升问卷平台的使用效率。
关键词:问卷平台;协同过滤算法;Jaccard系数
近年来,随着我国网络信息化的发展,各种网络调查问卷平台应运而生。网络调查问卷平台是提供给调研人员,在网络上通过制定详细周密的问卷,要求被调查者据此进行回答以收集资料的工具。经调研发现,市面上的调查问卷平台存在以下几点不足:
1.问卷不能有指向性地推荐给目标人群,发布者也就不能高效获取到准确的调研数据;
2.问卷平台缺乏良好的运营模式,无法实现问卷发布者与被调研者间的“共赢”;
3.对于手机等移动端的适配不够便捷完善。
目前,许多平台如亚马逊网站、豆瓣网、今日头条等都采用了页面定制的功能,即采用过滤算法,向用户实现个性化页面呈现,其中应用较广泛的算法是基于领域的协同过滤算法。
本文主要探讨协同过滤算法在网络调查问卷平台中的研究与应用。
1、相关研究
1.1协同过滤算法
协同过滤算法分为基于用户的和基于物品的两种:
(1)基于用户的协同过滤(UserCF,UserBasedCollaborativeFiltering)
算法思想包含两步,首先,计算登录用户a与其他用户之间的相似度,依据相似度进行排序后得到与用户a相似度最高的用户集合;然后,找出这个集合中的用户做过的,且用户a没有做过的问卷进行推荐。任意两个用户a,b之间相似度的计算可以通过Jaccard相似度系数求得,公式如下:
考虑到系统中存在大量并无交集的用户,为了提高计算效率,首先排除与被推荐用户a没有交集的用户,得到U(a,k),其中k表示用户数量,a表示被推荐用户;其次,利用相似度公式(式1-1)计算用户相似度Wab;最后,通过(式1-2)计算问卷的推荐指数,其中,i表示问卷编号,N(i)表示完成问卷i的用户集合,表示用户b对i问卷的兴趣度,在这里默认为1。
它同样需要两步,首先计算出问卷与问卷之间的相似度序列,从中得到用户做过问卷的相似度集合;然后,排序后找出问卷相似最高的问卷集合,排除掉用户已经做过的问卷之后给出推荐。与UserCF不同的是,ItemCF是以问卷为计算的主体,其相似度计算同UserCF。
2、基于用户的协同过滤推荐问卷的实现
2.1问卷平台推荐模型
2.2推荐算法应用
通过对协同过滤算法的研究,笔者认为用户对问卷的行为记录是实现推荐功能的关键信息,所以选择了基于用户的协同过滤算法和使用Jaccard相似度系数来计算用户之间的相似度。
前台设置推荐按钮,用户登陆后点击,进入推荐问卷页面。后台设置存储推荐问卷号的数组Recommend,存储相似度的数组Similar,存储交集问卷数的数组In与存储并集问卷数的数组Unt。首先使用SQL查询语句到数据库查询登录用户有过行为记录的问卷号,和与登录用户有交集的用户号,并存入User数组中。然后使用Jaccard相似度系数计算出用户相似度存储在数组Similar中,对Similar排序后取出前五位用户号。再次到后台数据库分别查询该五位用户和目标用户有过行为记录的问卷号,进行差运算后,将目标用户没有做过的问卷号放入数组Recommend中,最后使用公式1-2来进行问卷推荐值的计算。
平台在运用协同过滤算法的同时,加入了问卷的类别限制。创建问卷时,问卷发布者可以选择问卷的目标人群基本信息,比如性别,职业,年龄等,先对用户群体进行初步的过滤,因为每位用户在注册时都填写了用户信息存储在数据库中,所以系统辅以对这些条件的限制,对推荐的结果进行了进一步的修正。推荐界面使用bootstrap提供的星级评价插件:bootstrap-star-rating来显示问卷的推荐指数,从而形象地提示用户问卷的推荐值。
2.3结果分析
验证推荐算法应用到问卷平台的效果,笔者从数据库中随机选取若干用户登录平台进行测试,登录后,进入问卷推荐页面,页面可展示推荐问卷以及问卷的推荐指数,点击问卷可进入问卷调研。说明问卷类别限制与推荐算法可以正确运行,从而实现了基本的个性化推荐功能。
3、结语
进入大数据时代,数据显得尤为重要,哪一个企业掌握了更加准确全面的市场信息,哪个企业就掌握了竞争的主动权,因此,能否准确及时方便地找到目标人群,获取到需要的数据信息成为了各个企业之间竞争的关键。本平台对用户问卷行为进行挖掘,通过基于用户的协同过滤算法,实现了问卷的推荐,并加入生成问卷二维码的功能,来
您可能关注的文档
- 小学作文教学要向自主写作发展.docx
- 李斯特《匈牙利狂想曲》第六号的民族音乐元素分析.docx
- 新型环保小型水轮机节能开发探究.docx
- 体验探究过程注重知识建构.docx
- 民国时期在华俄侨文化史研究述评.docx
- 新课程下高中英语教学反思初探.docx
- 新形势下发挥县级党委政法委职能作用思考.docx
- 女性计划生育工作中计划生育宣教护理的应用体会.docx
- 空天地大数据在管道完整性管理中的应用.docx
- 基于档案信息化建设与档案管理的研究.docx
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)