- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 概论西华大学数据分析基础与实践第十章 学生校园消费行为分析《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第1页。
目录Contents明确数据分析任务数据分析的主要流程详细实现及结果展示《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第2页。
数据分析任务一《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第3页。
1 数据分析任务4校园一卡通是集身份认证、金融消费、数据共享等多项功能于一体的信息集成系统。在为师生提供优质、高效信息化服务的同时,系统自身也积累了大量的历史记录,其中蕴含着学生的消费行为以及学校食堂等各部门的运行状况等信息。本章将实现利用 Python 进行学生校园消费行为分析的完整案例。根据这些数据实现以下数据分析目标:分析学生的消费行为和食堂的运营状况,为食堂运营提供建议。构建学生消费细分模型,为学校判定学生的经济状况提供参考意见。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第4页。
数据分析的主要流程二《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第5页。
2.1 数据分析6《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第6页。
2.2 原始数据采集7本案例的数据来源于国内某高校校园一卡通系统一个月的运行数据。在最原始的数据中,不仅包括了学生的消费数据,还包含了学校教职工的消费数据。在对数据正式处理之前,还需要将学生的消费数据提取出来。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第7页。
2.3 数据预处理8数据有现成的,为什么还要预处理数据,不能直接拿来进行数据挖掘吗?回答是,当然能。但是,现实往往是残酷的!但现实世界的数据是肮脏的(不完整,含噪声,不一致)。同时,没有高质量的数据,就没有高质量的挖掘结果。因此,在对数据进行分析挖掘之前,就很有必要对数据进行预处理。在本案例中,主要针对数据的异常和缺失值进行相关处理。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第8页。
2.3 数据分析9所谓数据分析就是将产品相关的数据收集整合,然后利用特定的方法去分析这些数据,从中发现规律或是得到结论。在本案例中,我们将从两个方面进行分析:①食堂就餐行为可视化分析,根据食堂的交易流水,挖掘不同食堂的受欢迎程度和运营状况以及就餐高峰时段等信息;②学生消费行为可视化分析,根据学生的交易流水,挖掘性别与消费能力的关系,根据学生的月消费金额分类分析等。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第9页。
详细实现及结果展示三《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第10页。
3 .1 原始数据预处理11 上图是原始数据的示例,右图是对原始数据的说明。可以看到,原始数据中有许多我们不需要的数据,例如Index,OperNo等所属的数据都是需要的。对于原始数据,需要进行相关预处理,以便后面的数据分析结果准确。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第11页。
3 .1 原始数据预处理 12 上面的代码是导入数据预处理所需要的各种库文件,同时,删除不需要的列,对对列名重新命名。启动Jupyter并建立源文件,在一个cell中输入上面的代码。注意代码中的data2.csv文件,需要放到和代码文件的同一个文件地址里。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第12页。
3 .1 原始数据预处理 13 上面的代码是对时间处理,归类消费时间属于一周中的周几。在上面的代码中,创建了一个get_week_day的函数,此函数的主要目的就是归类消费在周几。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第13页。
3 .1 原始数据预处理 14 这段代码的作用,是归类消费时间属于哪个就餐时段。将0:00-9:00的消费定义为早餐;9:00-15:00的消费定义为午餐;15:00-23:59的消费定义为晚餐。《Python工程应用—数据分析基础与实战》教学课件—10学生校园消费行为分析全文共28页,当前为第14页。
3 .1 原始数据预处理
您可能关注的文档
- python画离散点-python画散点图.pdf
- Python疫情数据分析,并做数据可视化展示.pdf
- Python的Web可视化框架Dash(1)---简介.pdf
- Python的数据分析与挖掘.docx
- Python的数据分析可视化十种技能总结.pdf
- python的电影数据可视化分析心得体会.docx
- python相关性分析及画图-Python数据分析matplotlib可视化之绘图.pdf
- python相关性分析可视化-Python数据分析-可视化“大佬”之Seaborn.pdf
- python离散数据时间序列图-python数据分析之数据离散化——等宽等频聚类离散....pdf
- python科学计算常用包-python常用包及功能介绍.pdf
文档评论(0)