- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Python已经成为数据分析和数据挖掘的首选语言,作为除了Java、C/C++/C#
外最受欢迎的语言。
本课程基于Python工具来实现大数据的数据分析和数据挖掘项目。基于业
务问题,在数据挖掘标准过程指导下,采用Python分析工具,实现数据挖掘项
目的每一步操作,从数据预处理、数据建模、数据可视化,到最终数据挖掘结束,
匡助学员掌握Python用于数据挖掘,提升学员的数据化运营及数据挖掘的能力。
通过本课程的学习,达到如下目的:
1、全面掌握Python语言以及其编程思想。
2、掌握常用扩展库的使用,特殊是数据挖掘相关库的使用。
3、学会使用Python完成数据挖掘项目整个过程。
4、掌握利用Python实现可视化呈现。
5、掌握数据挖掘常见算法在Python中的实现。
5天时间
(全部模块讲完需要5天时间,可以根据时间需求拆份内容模块)。
业务支持部、IT系统部、大数据系统开辟部、大数据分析中心、网络运维
部等相关技术人员。
课程为实战课程,要求:
1、每一个学员自备一台便携机(必须)。
2、便携机中事先安装好Excel2022版本及以上。
3、便携机中事先安装好Python3.6版本及以上。
注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。
语言基础+挖掘模型+案例演练+开辟实践+可视化呈现
采用互动式教学,环绕业务问题,展开数据分析过程,全过程演练操作,让
学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
目的:掌握基本的Python编程思想与编程语句,熟悉常用数据结构的操作
1、Python简介
2、开辟环境搭建
Python的安装
扩展库的安装
3、掌握Python的简单数据类型
字符串的使用及操作
整数、浮点数
4、掌握基本语句:
if、while、for、print等
基本运算:
函数定义、参数传递、返回值
5、掌握复杂的数据类型:列表/元组
列表操作:访问、添加、修改、删除、排序
列表切片、复制等
列表相关的函数、方法
元组的应用
6、复杂数据类型:字典
创建、访问、修改、删除、遍历
字典函数和方法
7、复杂数据类型:集合
8、掌握面向对象编程思想
创建类、继承类
模块
9、函数定义、参数传递、返回值
10、标准库与扩展库的导入
11、异常处理:try-except块
演练:基本的Python编程语句
目的:掌握数据集结构及基本处理方法,进一步巩固Python语言
1、数据挖掘常用扩展库介绍
Numpy数组处理支持
Scipy矩阵计算模块
Matplotlib数据可视化工具库
Pandas数据分析和探索工具
StatsModels统计建模库
Scikit-Learn机器学习库
Keras深度学习(神经网络)库
Gensim文本挖掘库
2、数据集读取与操作:读取、写入
文档评论(0)