- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
模块六订单数据分析Python数据分析与可视化典型项目实战(微课版)
【任务描述】Excel文件“order_report.xlsx”共有28010行、7列数据,列名分别为:订单编号、总金额(即订单总金额)、实际支付金额(即在已付款的情况下为总金额与退款金额之差;在未付款的情况下则为0)、收货地址(即各个省市区)、订单创建时间(即下单时间)、订单付款时间(即付款时间)、退款金额(即付款后申请退款的金额,如未付过款,退款金额为0)。针对该数据集完成以下数据分析与可视化操作。(1)计算总体转化率与单一环节转化率。(2)绘制总体转化率漏斗图与单一环节转化率漏斗图。(3)绘制按日统计的订单数量趋势折线图。(4)绘制销量区域分布的柱形图。(5)绘制全国各地区订单数分布地图。【任务实现】在JupyterNotebook开发环境中创建tc06-01.ipynb,然后在单元格中编写代码并输出对应的结果。【任务6-1】订单数据分析
订单数据分析1.导入模块importdatetime2.提取数据df=pd.read_excel(r.\data\order_report.xlsx)df.head()
订单数据分析3.数据清洗查看数据集的列名df.columns输出结果:Index([订单编号,总金额,实际支付金额,收货地址,订单创建时间,订单付款时间,退款金额],dtype=object)通过info()函数查看数据各字段的详细信息()输出结果:
订单数据分析数据重复值、缺失值处理重复值统计输出结果:0df.duplicated().sum()缺失值统计输出结果:df.isnull().sum()对于缺失值,订单付款时间缺失3923个,因为实际支付金额未缺失,所以订单付款时间缺失值可以不做处理,也可以填充“0”。
订单数据分析4.绘制总体转化率漏斗图与单一环节转化率漏斗图统计各字段数量dict_convs=dict()key=总订单数dict_convs[key]=len(df)key=付款订单数#订单付款时间不为空的,表示付过款df_payed=df[df[订单付款时间].notnull()]dict_convs[key]=len(df_payed)key=到款订单数#实际支付金额=总金额-退款金额(在已付款的情况下)#实际支付金额不为0的,说明订单商家收到货款df_trans=df_payed[df_payed[实际支付金额]!=0]dict_convs[key]=len(df_trans)key=全额到款订单数
订单数据分析#在付款订单中,退款金额为0的,说明没有退款,表示全额收款df_trans_full=df_payed[df_payed[退款金额]==0]dict_convs[key]=len(df_trans_full)len(df_trans_full)df_convs=pd.Series(dict_convs,name=订单数).to_frame()df_convs计算总体转化率name=总体转化率total_convs=df_convs[订单数]/df_convs.loc[总订单数,订单数]*100df_convs[name]=total_convs.apply(lambdax:round(x,0))绘制总体转化率漏斗图name=总体转化率funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],
订单数据分析is_selected=True,label_opts=opts.LabelOpts(position=inside))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter={a}br/{b}:{c}%))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name),)funnel.render_notebook()计算单一环节转化率name=单一环节转化率single_convs=df_convs[订单数].shift()#默认下移一位df_convs[name]=single_convs.fillna(df_convs
您可能关注的文档
- 模块八 电商客户消费偏好特征分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块二 天气与空气质量数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块九 广告投放效果分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块七 电商客户行为分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块三 房源数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块十 股票数据分析与股价趋势预测.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块四 旅游景点数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块五 商品销量数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块一 人口与 GDP 数据分析.pptx
- 芯片设计 CMOS模拟集成电路设计与仿真实例基于Cadence IC 617 课件 第4章 运算放大器.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块六 订单数据分析.pptx
- 汽车营销(第二版)课件 第五章 客户关系管理及客户满意度.pptx
- 芯片设计 CMOS模拟集成电路设计与仿真实例基于Cadence IC 617 课件 第1-2章 CMOS模拟集成电路设计流程简介、ADE仿真概述.pptx
- 【2024新教材-教科版】一年级科学上册全册教案.pdf
- 【2024新教材教科版】科学-二年级科学上册【全册教案】.pdf
- 【新教材】2024教科版科学-二年级科学上册【全册教案】.pdf
- RDPAC考试易错难题完整版.docx
- 阳光成长心理健康主题班会教案.docx
- 2022年中小学党组织领导下的校长负责制实施方案(共3篇).docx
- 20201130华润武汉二十四城对标分析.pptx
最近下载
- 构建水利安全生产风险管控“六项机制“工作指导手册(正文部分).pdf VIP
- 数字媒体技术(共9单元)03数字媒体技术.pptx VIP
- 重点领域敏感岗位廉洁风险防控实施细则.docx
- HGT 21547-2016 管道用钢制插板、垫环、8字盲板系列.pdf
- 湖南省水利建设工程安全生产责任保险费率表【模板】.pdf VIP
- (高清版)B-T 41246-2022 项目、项目群和项目组合管理 项目群管理指南.pdf VIP
- 07CJ03-1 轻钢龙骨石膏板墙.docx VIP
- 电子档案管理系统需求.pdf VIP
- 人教八年级上册物理《跨学科实践 制作望远镜》PPT教学课件.pptx
- gb501220XX工业设备及管道绝热工程施工规范.pdf
文档评论(0)