一种多markov链预测模型的web缓存替换算法.docxVIP

下载本文档

0
0
约5.97千字
约 6页
2023-10-02 发布于广东
举报
版权申诉

一种多markov链预测模型的web缓存替换算法.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种多markov链预测模型的web缓存替换算法 1 多模型优化算法由于用户数量的急剧增加和当前网络速度的双重限制，人们在接收网络信息时往往害怕长期等待。web缓存技术允许用户访问的对象减少网络连接量，改善响应时间，这是一个简单有效的解决方案。缓存的性能很大程度上依赖于缓存替换算法, 虽然经典算法使Web缓存的性能得到了一定程度的提高, 但由于缺乏预测机制缓存的性能作用有限.文献中通过研究社交网站 (SNS) 中用户的访问行为模型, 提出了具有预测机制、面向SNS用户的缓存替换算法, 但是算法只面向SNS用户无法适应通用的网络环境中.文献中利用PPM预测模型根据上下文关系和序列匹配得到预测对象集, 该模型在预测精度与空间复杂度间难以达到平衡.文献中将预处理后会话得到的序列构建访问模式树, 并根据最小支持度进一步建立频繁访问模式树, 该方法没有考虑各个用户浏览过程中的差异性.目前还没有一种可以适应任意网络环境表现出较好性能的替换算法.替换算法的优劣衡量通过多个性能标准综合评估, 好的算法需要在多个性能标准间取得平衡. 文献中使用Markov链模型描述Web中用户的浏览特征, 进而对用户的访问进行预测, 该类方法取得了较高的预测准确率.针对已有算法的缺陷, 本文充分考虑Web中各个用户浏览过程的差异性, 将具有相同或相近浏览特征的用户用同一个模型描述, 建立多Markov链模型, 利用该模型对用户的访问对象进行预测, 使替换算法保留将要访问的对象.在GDSF算法的基础上引入平均间隔时间, 避免缓存保留大量不再具有存储价值的对象, 并将新算法命名为PGDSF-AI (Prediction Greedy Dual Size Frequency-Average Interval) 算法.通过轨迹实验表明, PGDSF-AI算法的多个性能指标取得了较好的效果. 2 存储的状态序列缓存替换问题可以描述如下:假设O是有限Web访问对象数据集, 对任意请求对象d∈O, 有相应的对象大小为sd和取回代价cd.假定缓存总容量为C, 当前请求序列R = (R1, R2, …, Rn) 导致缓存的一个状态序列 (S1,S2, …, Sn) , 已使用的缓存容量为Cused, 对任意的Sk(k=1, 2, …, n) 有式中, Ek是移除缓存的对象的集合, 且, 缓存的所有状态的迁移均满足式 (1) . 缓存替换算法就是在所有满足上式的状态序列中, 找出一个状态序列使目标函数的数值最小.通常情况下使用一个目标函数衡量缓存中对象的价值, 选择价值最小的对象从缓存中替换出去. 3 多因素链预测模型 3.1 u3000sqp的生成多Markov链模型根据Web中各个用户浏览过程表现的差异性和相似性, 将Web上所有的用户分为多个类别, 用四元组表示为:< X, K, P (C) , MC >.其中, X = {x1, x2, …, xn}是一个离散随机变量, 每个xi为一个网页, 称为模型的一个状态;K表示用户类别的数目;C = {c1, c2, …, ck}表示用户的类别, 其分布函数P (C) 表示不同类别用户的概率分布;MC = {mc1, mc2, …, mck}为类Markov链的集合, mck是描述类别为ck的用户浏览特征的Markov链, 称为类Markov链, 其概率转移矩阵Ak和初始状态分布Bk分别表示为式中, pku3000ij表示从状态Xi到状态Xj的转移概率, 即属于ck类别的用户访问页面xi后接下来访问页面xj的概率;pki表示状态Xi的初始状态概率. 3.2 概率转移矩阵ak 将用户的访问历史页面以时间顺序排列, 获得该用户的浏览序列.设有学习数据D = {d1, d2, …, dm}是m个用户的浏览序列, 第k类用户有mk个浏览序列.利用最大似然估计计算用户的类别C的概率分布P (C=ck) =mk/m.将初始状态看成特殊的聚类结果, 将每个用户的浏览序列看成一个类, 为每一类别用户建立类Markov链, 并使用式 (4) 和 (5) 计算概率转移矩阵Ak中的每一项pkij和初始状态分布Bk中的每一维pki的值, 从而得到m个类Markov链. 式中, Skij表示在第k类所有用户浏览序列中, 状态对 (xi, xj) 出现的次数;αkij是超级参数, 取值为β/n2, β为问题域空间的大小. 同理, 计算任意两个类Markov链mck和mcl合并后的类Markov链mc (k+l) 为式 (6) 和 (7) 中的所有参数与式 (4) 和 (5) 的参数相同. 任意两个概率转移矩阵Ak和Al的相似度定义为矩阵中行的交叉熵的平均值: 式中, pkij、plu3000ij分别表示概率转移矩阵Ak和Al中从状态Xi到状态