手机上网用户行为分析系统.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
手机上网用户行为分析系统.ppt

* * 研究总体框架中如涉及标准化组织工作内容,应阐述在本课题内我公司标准化组织相关的研究和标准推进工作。如果该项目包含标准化组织中的立项工作,须重点阐述该标准立项的研究内容 * * * * 通过上面的网页语义分析,我们就可以得到用户和网页以及类别之间建立了关联。从而为后面的用户行为分析,网站内容分析及对比提供基础。 * * 流量 同比增幅 用户数 渗透率 * * 注: 填写各项指标数值时,请在数值后一并填写指标数值的度量单位(如RMB万元、万人、%等)和指标数值对应的应用范围(如XX地市、X省全省、31省全网等)。 项目特征指标是本项目应用后产生的主要可量化成效,最多不超过3个。如《传输灾难性设备故障抢修系统》项目应用的可量化直接成效表现为“缩短故障处理时间”,此即项目特征指标。其EAVc为××小时,其EAVe为××分钟,其ΔEAV=EAVe – EAVc。 企业特征指标是本项目应用后对企业生产(产品及服务)和经营(市场及财务)带来的可量化成效,分为“网络及生产类(EAV-PS)”和“市场及财务类(EAV-MF)”,指标清单请见本模板附件1。如《传输灾难性设备故障抢修系统》通过缩短故障定位时间,使“客户网络类投诉解决及时率”从×小时降低到×小时,使设备故障抢修时间缩短,由原来需要投入×人耗时×小时降低为×人耗时×小时,全省每年节省人工成本××万元。其中“客户网络类投诉解决及时率”为EAV-PS指标,“人工成本”就属于EAV-MF指标。 以上指标中,项目特征指标和企业特征指标的名称和数值都为必填项。企业绩效指标为选填项。建议项目经理尽量填全以更好地体现本项目对企业的贡献。 * 注: 填写以上项目特征指标数值时,请在数值后一并填写指标数值的度量单位(如RMB万元、万人、%等)和指标数值对应的应用范围(如XX地市、X省全省、31省全网等)。 对于某些项目,若项目成果所依附的业务或网络在若干年后将退网,则请在预计的退网年度予以注明。如:应用于TDM交换机的某项目成果,预计该TDM交换机在X年后退网,则请在“项目应用X年后指标预期值”中填上“退网”。 * 手机上网用户行为分析系统 一. 课题目标实现情况 目 录 二、主要研究成果(整合后) 研究背景 “十一五”期间,我国网民规模跃居全球第一,宽带普及率接近100%,手机网民规模迅速发展,互联网应用更加深入,推动着社会进步和人们生活方式的变革。随着移动互联网近几年快速的发展,作为移动互联网关键环节的中国移动正在感受这个浪潮带来的冲击。 上网流量同比上升112.3% 流量收入同比上升49.4% 高速发展的流量并没有带来相关收入的同步增长 研究背景 在以用户为中心的发展时代下,了解用户需求成为我们面对课题的第一步工作,这就需要我们对我们网络中的流量有深入的了解,掌握我们用户的行为情况,便于我们针对性的调整运营战略,在正在到来的移动互联网大潮中未雨绸缪,迎接即将到来的挑战。 针对用户的需求分析作为中国移动具有先天的优势,海量的CMWAP、CMNET的日志信息蕴含着巨大的财富,通过用户移动互联网行为分析,一方面让我们更了解我们的用户,实现个性化需求的识别。同时在有限的资源情况下及时的为用户提供个性化的产品生产、个性化的匹配/分发。 通过针对用户上网行为的分析实现个性化需求的识别,成为数据部迫不及待需要解决的问题;同时在流量经营和精细化的营销方面具有非常重要的战略意义。 研究目标 建立一套完善的手机上网用户行为分析系统, 通过对用户手机上网访问行为进行分析,获取用户的访问轨迹、浏览页面内容、网站信息、浏览客户端信息、移动终端信息等,进行各类分析,形成各类用户模型。 网络爬虫 GPRS 网站 内容分析 用户行为分析 数据分析 爬虫数据 网站树 内容树 数据清洗 WAP黄页库 数据分析 网关数据 数据清洗 用户行为模型 数据索引 用户属性 内容属性 结果呈现 5个应用 细分营销活动 精确发展用户 引导自有业务 分析竞争业务 个性化内容 日志采集 研究目标 研究一种适应分类体系变化的海量网页快速分类系统,要求如下: 实现一个快速爬取手机用户访问日志的方法,需要深入到用户访问页面的标题、正文信息以及相关网页链接。 针对手机互联网,提出一种正文提取的方法。基于分块的基础上,提取每个信息块的信息量,并计算各个分块和网页title的相似度,最终确定正文块。 基于主题的多分类方法。文本不被看作仅仅是由一些特征词所组成的,而是被看作是由一些主题构成的,主题是由一些特征词构成的。通过样本中不同类别的主题分布,实现预测出一个新的文本到底属于什么类别。 研究总体框架 手机上网用户行为分析项目研究的总体架构如下: 多数据海量数据预处理 海量数据存储和计算 “客户-内容”特征类标签分层可扩充体系 “客户-内容-业务”三维

文档评论(0)

cnsg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档