- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
项目九综合案例:电商销售大数据分析大连理工大学出版社DALIANUNIVERSITYOFTECHNOLOGYPRESS《Hive数据仓库应用教程》
电商销售大数据分析任务9-1《Hive数据仓库应用教程》
9.1.1任务描述全世界有数十亿人在使用电商平台进行购物,这些平台在较短的时间内产生了大量的数据。本项目将学会如何使用Hive数据仓库来载入电商销售的历史数据,并使用HiveQL对各项指标进行统计分析,进一步熟悉Hive数据仓库的实际应用。
9.1.2任务准备知识1.电商销售大数据(1)电子商务通常是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于客户端/服务端应用方式,买卖双方不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动。(2)电商数据包括所有注册用户的浏览信息、购买消费记录、用户对商品的评价、在其平台上卖家的买卖记录、产品交易量、库存量,以及商家的信用信息等等。(3)电商经历了基于用户数量的时代,基于销量的时代,目前已处于基于大数据的时代,电子商务的竞争在很大程度上就是大数据的竞争。
9.1.2任务准备知识2.数据概况本案例数据来自奢侈品电商后台的部分历史销售数据,平台为了创造更多的销售利润,现需要对已有的销售大数据进用户销售数据的分析,通过对各项指标的统计分析,进行用户画像,提出合理的促销方案,从而进行精准营销。用户的历史销售数据以txt的文本格式存储,每条数据是订单记录,销售订单的格式描述如下:序号字段描述序号字段描述1uid用户标识7livetime居住时间2pid商品标识8marriage婚姻状况3sex性别9level1商品一级分类4age年龄10level2商品二级分类5vocation职业11level3商品三级分类6city居住城市12sale销售额
9.1.2任务准备知识2.数据准备我们将历史数据上传到node2虚拟机的data目录里,然后加载到Hive数据库中,操作的步骤如下:步骤1:将本机的历史销售数据e-data.txt上传到node2的data目录下,如图9-1所示:步骤2:创建Hive数据库eshop,如图9-2所示:图9-1图9-2
9.1.2任务准备知识2.数据准备步骤3:创建Hive销售订单表sales,如图9-3所示,建表成功如图9-4所示图9-3图9-4
9.1.2任务准备知识2.数据准备步骤4:将历史数据装载到订单表sales里,HiveQL脚本设计如下:loaddatalocalinpath/data/e-data.txtoverwriteintotablesales;查询一下数据,如果看到如下图9-5所示表示历史数据加载成功。图9-5
9.1.3任务实施1.统计订单总数统计订单历史数据中订单总数,我们使用count函数来完成这个统计需求,count(1)可以对所有数据行进行统计,也就是统计出了所有的订单数,HiveQL脚本设计如下:运行结果如图9-6所示。selectcount(1)asitemsfromsales;图9-6
9.1.3任务实施2.统计总销售额HiveQL脚本设计如下:selectsum(sale)sales,sum(sale)/count(distinctuid)avg_pay,sum(sale)/count(sale)avg_pricefromsales;运行结果如图9-7图9-7
9.1.3任务实施3.统计各性别消费情况HiveQL脚本设计如下:select*,cast(users/(sum(users)over())asdecimal(8,2))assex_percent,cast(sum_pay/(sum(sum_pay)over())asdecimal(8,2))aspay_percentfrom(selectsex,count(distinctuid)users,cast((sum(sale)/count(distinctuid))*100asdecimal(8,2))avg_user,sum(sale)sum_payfromsalesgroupbysex)assorderbypay_percentdesc;运行结果如图9-8图9-8
9.1.3任务实施4.统计各年龄段消费情况HiveQL脚本设计如下:withsas(selectage,count(distinctuid)users,sum(sale)sum_pay,cast(sum(sale)/count(distin
您可能关注的文档
- Hive数据仓库应用教程项目1 认识Hive.pptx
- Hive数据仓库应用教程项目2 Hive环境搭建.pptx
- Hive数据仓库应用教程项目3 Hive基本语法.pptx
- Hive数据仓库应用教程项目4 Hive数据定义.pptx
- Hive数据仓库应用教程项目5 数据的导入与导出.pptx
- Hive数据仓库应用教程项目6 Hive数据查询.pptx
- Hive数据仓库应用教程项目7 Hive函数.pptx
- Hive数据仓库应用教程项目8 Hive优化.pptx
- 建筑设备安装识图与施工1. 项目一任务一 建筑室内给水系统识读.pptx
- 建筑设备安装识图与施工2.项目一任务二 建筑室内排水系统识读.pptx
- DELIXI德力西电气说明书 CDFXL-20-63系列单相电气防火限流式保护器.pdf
- ASUS华硕台式电脑迷你台式机VivoMini UN62VAsus_small_computer_warranty_card (Japanese).pdf
- Haier海尔218升风冷定频三门冰箱 BCD-218WGHC3R9B1说明书用户手册.pdf
- Fujitsu富士通将军空调挂壁式LN(CA) ASQG09LNCA说明书用户手册.pdf
- ASUS华硕服务器 工作站服务器选件PEB-10G SFP PLUS SINGLEPEB-10G SFP+Series User Guide (English).pdf
- ASUS华硕台式电脑PN 系列Mini PC PN60PN60 匈牙利文版使用手册.pdf
- ASUS华硕MotherboardThin-Mini ITX MotherboardsPro H610T D4-CSMPRO H610T D4 繁体中文版使用手册.pdf
- Processor Programming Reference (PPR) for AMD Family 17h Models A0h-AFh, Revision A0 Processors (PUB)技术文档用户手册.pdf
- Garmin佳明GPSMAP 67 多功能户外GPS手持机说明书用户手册.pdf
- ASUS华硕台式电脑迷你台式机VivoMini UN42 (commercial)Vivo Mini User's Manual (Czech).pdf
文档评论(0)