- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
随手快递中的服务及时性研究
?
?
刘璐黄伟
摘要:分析如何提高随手快递中的及时性,为此开展随手快递中的个性化推荐研究,在充分考虑用户信息、配送信息、随手人信息、时间等信息基础上,解决项目初期信息冷启动问题,获得个性化的预测评分值公式,提出了推荐算法.
关键词:随手快递;个性化推荐;协同过滤;多指标
:F27:Adoi:10.19311/j.cnki2018.30.023
1推荐服务研究
1.1收集用户信息,配送信息
定义1(将收集信息进行分析形成信息簇)。
现在常用的聚类算法有K-means、DBSCAN等,本文选择聚类速度快且能够有效处理噪声点和发现任意形状簇的DBSCAN算法。DBSCAN算法需要两个参数:扫描半径(eps)和最小包含点数(minPts)。通过实验我们将半径eps设置为0.6,将最小包含点数设置为150。
具体过程如下:
(1)在信息集P中任选一个未被访问的元素a,a属于信息集P,找出与a元素距离在eps之内(包括eps)的附近元素。
(2)如果附近的元素的数量大于minPts,则当前元素与其附近元素形成一个簇。并且将该元素标记为已经访问,重复步骤1选取簇内未被访问的元素作为a,直到簇内元素全部被访问。
(3)如果附近的元素的数量少于minPts,则该元素暂时被标记为噪声元素。
(4)重复步骤1,直到集合P内的所有元素全部被访问。
通过上述4个步骤我们将暂时被标记的噪声元素集记为元素集Z。
定义2(相似用户群体)。
设用户Ui和Uj的服务评价分别是LUi=(USi,O.DEi)和LUj=(USj,O.DEj),如果USi∩USj≠□且|USi∩USj|≥M,则称用户Ui与Uj之间为偏好相似用户。M为条件限数,M的大小将影响到用户与偏好相似用户之间的数量。
本文采用的算法为文献中的算法,该算法通过分析UDDI和WSDL文件提供的信息对服务的类别进行划分,从而具有较好的可行性、通用性和易操作性。本文中的推荐用户的推荐等级指的是推荐用户推荐信息被采纳的概率,其主要依赖于用户对推荐信息的反馈信息。
由定义2可知,如果两个用户存在推荐关系,那么他们之间必然是偏好相似用户,反之则不成立.从而可以看出无论用户间是否存在推荐关系,都不会影响信息多指标相似度的計算。
1.2多属性多时序性分析
用户之间产生的推荐以及系统针对某个用户群体产生的推荐并非盲目的推荐,而是限定于某个特定的集合之中。这不仅符合现实情况中选取服务时互联网用户的实际特征,同时能够较好地解决稀疏矩阵带来的问题。
一般情况下,都是使用{u1,u2,…,un}表示n个用户,{i1,i2,…,in}表示n个指标,rij表示用户的多指标值。表1给出了用户-多指标矩阵例子。计算用户指标的相似度有多种算法,其中,皮尔森相关相似性如下:
sum(u,v)=∑i∈Puv(rui-ru)(rvi-rv)∑i∈Puv(rui-ru)2∑i∈Puv(rvi-rv)2(1)
公式(1)中,ru和rv分别表示用户u和v的指标平均值,Puv表示用户u和v共同指标的集合。
使用预测评分公式(2)计算得到目标用户对指标的预测评分值,实现推荐:
Pui=ru+∑v∈NBSsim(u,v)×(rvi-rv)∑v∈NBSsim(u,v)(2)
公式(2)中,Puv表示用户u对指标i的预测评分值,ru-rv分别表示用户u和v的指标平均值,rvi表示用户v对指标i的评分,NBSu表示用户u的近邻集合。
定义3(信息多指标相似度)设两个相似用户Ui和Uj的指标评价分别是LUi=(USi,O.DEi)和LUi=(USj,O.DEj),其信息多指标相似度定义为:
SSUiUi=rij,rij≥00,rij0(3)
其中,rij为两用户在共同指标访问项集USi∩USj评价值上的皮尔逊相关系数。
定义4(用户推荐度)若用户Uj为Ui关于服务lujk的推荐用户,则用户Uj对Ui对服务lujk的推荐度为:
RUjUi(lujk)=O.DEj(lujk)×SUiUj×(1+α+β)(4)
在该式子中,α是用户在领域相关度所产生的增值系数,0α1;β是根据用户的推荐等级所产生的增值系数,0β1。在确定α和β时,需要注意体现群体之间协同的思想。
本文中的指标数一般指的是通过用户行为而收集的数据,因此一般情况下是不会存在非公正的因素。Sensoy针对用户打分主观性的问题,提出了基于经验的服务选择方法。
如前所述,在计算用户信息多指标相似度时,我们并不区分两个用户是否存在推荐关系。
2实验结果与分析
2.1数据集预处理与度量标准
本文采用从数据堂中某研究机构中收集的用户在一些随手快递类型APP上的行为记录数据来进行实验,将收集到的数据进行预处理后,使得该数据集包
您可能关注的文档
- 首次载人迎对接.以人为本保成功-上海航天技术研究院攻坚克难确保交会对接成功记.docx
- 预见性护理在阴道分娩产后出血护理中的应用分析.docx
- 非法传销参与者犯罪的成因分析-以武汉市新洲区人民检察院相关案件办理为视角.docx
- 青城山道教建筑与四川民居比较研究.docx
- 阿托伐他汀钙片治疗冠心病伴心力衰竭的临床分析.docx
- 问题导向式学习法结合情景模拟在专科应急预案护理教学中的应用效果分析.docx
- 跨国代孕亲子关系确定研究-从儿童最大利益原则角度.docx
- 起重机械能效测试与节能措施研究.docx
- 贵州某市GPS城市图根控制测量技术研究.docx
- 跨境电商创业可行性分析-以婴幼儿产品为例.docx
文档评论(0)