- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经济管理学院
数据分析综合实训 课程设计
课 设 题 目 大数据精准营销项目
专 业 班 级
学 号 姓 名
指 导 教 师
2020年 12 月 20 日
指导教师评语及成绩
指导教师评语
成绩
签字:
年 月 日
?录
1 项?背景与?标
1.1 项?背景
1.2 项??标
2 客户数据预处理与客户交易?为分析
2.1 数据集介绍
2.2 数据预处理
2.3 客户交易?为分析
3 客户标签体系构建
3.1 客户标签体系介绍
3.2 事实类标签构建
3.3 规则类标签构建
3.4 预测类标签构建
3.5 ?本类标签构建
3.6 典型客户画像分析
4 精准营销应?
4.1 商品兴趣排?榜的构建
4.2 ? 标客户的筛选
5 项?总结与?得体会
5.1 项?总结
5.2 项??得
1 项目背景与目标
1.1项目背景
该项目是针对客户所进行的分析报告,再报告中根据不同的角度,对确定目标客户以及客户对商品的选择等方面进行了一系列的分析。面对越来越多的竞争者,如何将商品销售出去是面临的首要问题,现代的销售模式不同于以往的经营模式,从大批量的采购货物再进行销售,逐渐转变为有目标性的采购并进行有目标性的营销,确定目标客户,并通过统计等进行分析,采取一系列的有利于企业的措施,增加最终的利润。
1.2 项目目标
该项目的目标是通过对顾客行为分析的研究,找出符合要求的客户,锁定目标客户。在进行过程中,将理论的知识与实际的知识相结合,通过实践对老师所讲的内容进行深入的理解。
2 客户数据预处理与客户交易?为分析
2.1 数据集介绍
该项目用到了四个数据集,数据集的分类汇总分别为data,dbo,user_too, user_labels。
(1)data数据集:在data数据集中,涉及到的属性是用户的ID,不同用户交易的数额和时间,以及用户进行交易时所采用的具体方式。
(2)dbo数据集:该数据集表示用户是否为潜在客户,1表示是,0表示否。
(3)user_too数据集:在此数据集中,用户的交易额度,交易方式,进行交易的时间以及次数,平均消费水平,具体消费是哪一项商品,且在该商品上消费的金额等详细信息有具体的统计。
(4)user_labels数据集:包括了用用户交易的最大金额数,交易的频率,是否使用网络进行交易等信息。
2.2 数据预处理
首先进行客户数据进行格式转换,才能保证以后的程序正常进行。
预处理
2.2.1 统计分析
统计分析数据
查看客户信息
2.2.2 异常值处理
正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配,利用正则表达式对数据进行异常值处理。
(1)交易时间
Unix时间戳是指格林尼治时间1970年01月01日00时00分00秒起至现在的总秒数。 ? Unix时间戳通常为10位数字(如果精确到毫秒为13位),我们使用正则表达式对数据进行匹配, 发现有一些异常值。
检查时间异常值
对交易时间异常值进行处理
(2)交易金额
检查交易金额异常值并对异常值处理
2.2.3 缺失值处理
缺失值是指某一数据集由于信息缺失等主客观因素 导致的字段记录的缺失,遗漏等现象,本项目中的交易附言字段存在数据缺失的情况。交易记录中存在交易附言为空的行,但其交易金额与交易时间都是完整的,这部分数据可以描绘一些客户的消费习惯, 我们不进行删除。
筛选附言缺失值并处理
2.2.4 数据格式转换
(1)时间和时区
对时间格式进行转换,将时间戳转换成“年-月-日 时:分:秒”的格式 ? 对时区进行转换,将格林威治时间转换为北京时间。
对时间和时区进行转换
(2)单位转换
交易金额(payment)字段以分为单位,为了符合我们的观察习惯,我们将其单位改为元。
计价单位转换
2.2.5 重复数据过滤
无重复值的行标记为False,有重复值的行标记为True。
处理交易记录的重复数据
2.3 客户交易?为分析
该过程包括四个方面:时间维度、交易属性、文本数据预处理和文本数据的分析。
2.3.1 时间维度的分析
(1)交易时间和交易金额
交易时间与交易次数的关系
交易时间与金额的关系
由图像可以看出,交易主要集中在2016年7月至2017年12月在本项目后续环节,我们选取该时间段的交易记录进行重点分析。
(2)交易时间细分
在对24小时的交易次数进行统计后,发现凌晨1点至7点交易数量较少,其余时间段交易数量分布较为均衡,大部分交易的时间集中在0点附近,这可能是金融机构进行清算的时间段。
2.3.2 交易属性
(1)不同客户交易次数
不同客户交易次数与所占比重
从不同客户的角度出发,我
文档评论(0)