- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
消费记录统计结果 经过过滤,我们共得到939个用户的消费记录。 对每个用户各自所购商品的品牌进行统计若某个用户购买某个品牌产品次数不低于5则记录该用户编号及该品牌。 共得到546个用户的喜好品牌 ID 品牌 1000007 三星 5 1000015 爱普生5 联想 16 1000017 亨氏 10 德力西5 1000018 迪士尼5 惠普 5 1000026 铼德 6 闪迪 7 困难与问题 程序语言对中文的处理能力一般 关联分析的困难 用户评价的分析 展望 我们认为,京东与淘宝不同的是,一般情况下京东的商品大部分都是自己配送,而不是通过其他物流公司。所以,建立更加快捷高效的物流体系不仅可以节约运输成本,还可以给客户提供更加快捷优质的服务。利用已有的销售数据,完全可以对货物的分配、存储以及送货点的布局进行精确布控,从而实现智能物流。 Content Layouts (虽然这样会使得该店铺的商品品种单一,但是从网络营销的特点来看,买家更关注整个淘宝的商品多样性,而非某一个店家的商品多样性,因而该决策可使得买家利益最大化) * 华为P6 * Content Layouts LOGO LOGO 电商销售记录分析 严智强、贺强、刘瑞、 崔亚松、臧茹歌 Background 网购流行 电商崛起 消费人群 消费习惯 潜在价值 消费记录 消费喜好分析 市场方向 Contents contents 电商数据 天猫手机销售数据分析 京东商城销售数据分析 数据的获取与预处理 替代商品的挖掘 价格空洞的发现 牛仔裤销售数据的分析 用户消费记录的分析 淘宝网作为国内第一大电商,占有近50%市场份额,而天猫商城则是所有优质店铺的集合,每月会产生大量销售数据,这里以天猫近一个月的手机销售数据进行分析,找出这些数据隐含的价值。 天猫手机销售数据分析 天猫手机销售数据分析 数据的获取与预处理 替代商品的挖掘 价格空洞的发现 数据的获取与处理 构建一个爬虫脚本,从天猫上获取销量前600的手机销售记录,并匹配出每条记录的机型、售价、销量。 How to get the data 爬虫脚本 #coding=gbk import urllib import re f1=open(rE:\tmao\shoujihtml.txt)#此处存储了销量前600的网页地址 http=f1.readlines() f1.close() f2=open(rE:\tmao\shouji.txt,a) for i in http: content=urllib.urlopen(i.strip()).read() f2.write(content) f2.write(\n) f2.write(#*50) f2.write(\n) f2.close() f3=open(rE:\tmao\shouji.txt) lines= for line in f3.readlines(): lines+=line.strip() f3.close() pattern=rp class=productPriceem title=(.*?).*?p class=productTitle.*?target=_blank title=(.*?).*?p class=productStatusspanem(.*?)/embr result=re.findall(pattern,lines) f4=open(rE:\tmao\shoujiInformation.txt,w)#该文件中存储了每件手机的记录(机型、售价、销量) for item in result: for j in range(3): f4.write(item[j]) f4.write(\t) f4.write(\n) f4.close() 销量——价格 散点图 替代商品的挖掘 我们认为,如果两件手机的售价和销量十分接近,则认为这两件手机互为替代商品。从网络营销的特点来看,从店铺的角度出发,选择进价更低的手机可获得更多利润。 替代商品的挖掘 我们以欧氏距离小于等于2为标准 sqrt((a.price-b.price)^2+(a.sales_number-b.sales_number)^2)=2 将手机聚类,找出互为替代的手机。 替代商品的挖掘 from __future__ import division from math import sqrt #coding=gbk f1=op
文档评论(0)