DEEP大数据分析实验报告.pdfVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

DEEP大数据分析实验报告

2022年9月12

专业电子商务班级学号姓名成绩

实验

DEEP大数据分析实验项目DEEP大数据分析指导教师

名称

一、实验目的

培养数据思维,建立基本的数据能力。

二、实验内容

用线性回归选择广告投放方案

性别、年收入、年龄对自行车购买的影响

用神经网络发现潜在购买自行车用户

用决策树审核交通事故是否理赔

电商平台数据分析

三、实验步骤及结果(包括所用实验设备及软件)

实验软件:DEEP大数据教育非IT版

(1)用线性回归选择广告投放方案

①总体步骤

②线性回归建模

③通过模型预测

(2)性别、年收入、年龄对自行车购买的影响

①性别、年收入是否影响购买

可以看出,男性和女性购买自行车的数量都没要显著差异,因此可以任务性别这个因素基本上对购买自

行车的行为不产生影响。

②客户年龄离散化

③年龄是否影响购买

从图中可以看出,各个年龄段的总人数和购买者有着明显的差异,33岁到63岁之间人群是购买自行车

的主力。

(3)用神经网络发现潜在购买自行车用户

在图中,predict列的1表示需要购买自行车。这样,可以对需要购买自行车的人员进行精准营销。

(4)用决策树审核交通事故是否理赔

①计算相关系数

②使用决策树审核

其中“col_1”是预测结果,0表示理赔,1表示不理赔。

(5)电商平台数据分析

母婴电商数据分析

可视化仪表盘

用户行为分析

四、问题讨论及实验心得

大数据全链路处理工作流程一般包括六个步骤:数据源、数据汇集、数据湖、数据加工、分析挖掘、

数据可视化。

数据源是指原始数据的最初来源,它存贮在企业不同业务部门之间的。

数据汇集是指根据业务目标,把这些不同部门之间原始数据进行整合,转化为容易分析的统一存储

格式进行存储的过程。

数据湖是指把数据汇集结果集中存贮起来,以便后续分析挖掘。这种方式极大的方便用户对数据进

行分析和利用。

数据加工是指对数据湖中的数据进行诸如去重、处理空值、数据降维、数据标准化等数据预处理过

程,其工作量一般占整个流程的大约60%。

分析挖掘是指在对数据加工后的数据进行分析、建模、预测的过程。

数据可视化是指把分析挖掘结果利用图标等方式展示出来,方便决策者进行决策。

学会一个大数据的工具,具备了基本的操作能力,让我们已经具备了

解决大数据业务问题的能力。通过解决一系列的商科专业的业务问题,进行实操训练。让我们在就业之

前,了解一下在企业当中各个商科领域里面有哪些大数据能够解决的业务问题,让我们通过大数据的方

式对这个领域的问题进行学习和思考,将来上岗之后在企业或许能够很快的入手。

数据可视化是我印象最为深刻的部分,从无数的数字转变为直观的图的时候,用图片对数据、研究

框架等进行更直观清晰的表达,让人觉得眼前一亮。仔细观察,无论是颜色,还是对应的图表,其实都

大有讲究。由于课程实训太短,有些方面还没有太理解。未来可以在课外,继续探究关于数据可视化的

学习。让我们在未来的学习生活中可以更加清晰有效地传达与沟通信息。

文档评论(0)

186****3086 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档