教学课件第3章数据分析的基础.pptx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章数据分析的基础 第3章 数据分析的基础 3.1 认识Numpy和Pandas 3.2 Numpy的基本使用 3.3 Pandas的基本使用 3.1 认识Numpy和Pandas Numpy(Numerical Python)提供了python对多维数组对象的支持:ndarray,具有矢量运算能力,快速、节省空间。Numpy支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 Pandas(Python Data Analysis Library)是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量的数据分析函数库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。除此以外,Pandas还提供了大量能使快速便捷地处理数据的函数和方法,使得Python成为强大而高效的数据分析环境的重要因素之一。 3.2 Numpy的基本使用 3.2.1 创建ndarray数组 ndarray数组是一个N维数组对象(矩阵),它里面设置的所有元素必须是相同的类型。现在通过如下的代码,先来尝试的创建一个ndarray数组。 import numpy as np  x=np.array([1,2,3,4])  print(x) print(type(x)) 3.2 Numpy的基本使用 如果设定的值为不相同类型,那么会统一按照其某一种类型进行统一。 import numpy as np y=np.array([[1,2.,3],[4,5,6]]) print(y) print(type(y)) 类型 类型代码 说明 int8、uint8 i1、u1 有符号和无符号的8bit(1个字节)整型 int16、uint16 i2、u2 有符号和无符号的16位(2个字节)整型 int32、uint32 i4、u4 有符号和无符号的32位(4个字节)整型 int64、uint64 i8、u8 有符号和无符号的64位(8个字节)整型 float16 f2 半精度浮点数 float32 f4/f 标准的单精度浮点数 float64 f8/d 标准的双精度浮点数。 float128 f16/g 扩展精度浮点数 complex64、complex128、complex256 c8、c16、c32 分别用2个32位、64位或128位浮点数表示的复数 bool ? 存储True和False值得布尔类型 object O Python对象类型 string_ S 固定长度的字符串类型(每个字符1个字节) unicode_ U 固定长度的unicode类型(字节数由平台决定) 3.2 Numpy的基本使用 3.2 Numpy的基本使用 3.2.2 运用ndarray数组 ndarray数组是一个多维的数组,多维数组中的维度称之为“轴”(axis),想要了解一个新的数据参数它是多少维度,可以通过ndim属性来进行访问。而shape属性是可以用来访问多少维度以及每一个维度所对应的它的长度。 1、ndarray的算术运算 2、ndarray的切片 3.2 Numpy的基本使用 1、ndarray的算术运算 ndarray数组使用非常的灵活,它不需要使用循环就可以对列表里的元素执行算术运算,语法和对标量元素的操作一样。 3.2 Numpy的基本使用 2、ndarray的切片 切片(slice)是指从数据的位置中找出符合对应位置的数据出来。在进行切片时,通常需要为数组的每个维度指定一个切片位置,每个维度之间用逗号分割,如果没有逗号,表示只在第一维上进行切片。 3.3 Pandas的基本使用 3.3.1 Series数据结构 1、创建Series数据结构 在Pandas中的Series数据结构是一个像数组一样的一维对象,可以存储很多类型的数据。 3.3 Pandas的基本使用 2、访问Series的元素 Series可以同时使用下标和标签两种方式进行访问。 3.3 Pandas的基本使用 3.3.2 DataFrame数据结构 1、DataFrame数据结构的创建 Series对象的index数组存放有每一个元素的标签,而DataFrame对象则有所不同,它有两个索引数组,第一个数组与行相关,它与Series的索引数组极为相似。每个标签与标签所在行的所有元素相关联。而第二个数组包含一系列列标签,每个标签与一列数据相关联。 3.3 Pandas的基本使用 2、DataFrame数据结构的创建 访问DataFrame,需要先使用列的名称,如图3-2所示通过名字、成绩和ID,得到该列对应的Series对象,然后使用下标或者标签访问Series中的元素。

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5342120324000033

1亿VIP精品文档

相关文档