数据分析应用项目化教程(Python) 课件 任务4.4 层次化索引.pptx

数据分析应用项目化教程(Python) 课件 任务4.4 层次化索引.pptx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第四章使用pandas进行数据对象构建和数据运算

任务4.4层次化索引操作pandas的索引分层索引MultiIndex数据源小费数据集tipsSeries的多层索引MultiIndexSeries有多层索引怎样筛选数据DataFrame的多层索引MultiIndexDataFrame有多层索引怎样筛选数据

pandas的索引pandas的索引:负责管理轴标签和其他如轴名称等元数据。构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index。Pandas的数据处理:pandas作为python中非常重要的数据处理工具,它提供了很多灵活的数学和统计方法。在数据处理中,经常需要对数据进行索引的转换,以适应不同的统计和作图的需要。

分层索引MultiIndexPandas高维数据结构:?Pandas库的名字来源于其中3种主要数据结构开头字母的缩写,Panel、Dataframe、Series,其中Series表示一维数据,Dataframe表示二维数据,Panel表示三维数据。当数据高于二维时,我们一般用包含多层级索引的Dataframe进行表示,而不是使用Panel。原因是使用多层级索引展示数据更加直观,操作数据更加灵活,并且可以表示3维,4维乃至任意维度的数据。MultiIndex:层次化索引对象,表示单个轴上的多层索引,可以看做由原数组组成的数组。MultiIndex可以理解为堆叠的一种索引结构,官方文档提及到它为一些相当复杂的数据分析和操作打开了大门,尤其是在处理高维数据的时候显得十分便利。从本质上讲,有了多级索引就可以在Series和DataFrame等低数据结构中存储和处理任意维数的数据。

数据源小费数据集tips使用seaborn库自带的小费数据集tips,数据集中含有7个字段:消费总金额(totall_bill)(不含小费)小费金额(tip)顾客性别(sex)消费的星期(day)消费的时间段(time)用餐人数(size)顾客是否抽烟(smoker)

Series的多层索引MultiIndex使用分组创建多层级索引

Series有多层索引怎样筛选数据图1多层索引Series对象图2取level=0级索引是Thur图3取0级索引是Thur和Fri图4取0级索引是Thur并且1级索引是Dinner图5取1级索引是Dinner图6按0级索引统计

DataFrame的多层索引MultiIndex使用set_index方法将普通列转成多层级索引tips.set_index([‘day’,‘time’],inplace=True)#将列变成行索引,并且修改原数据集,如图1tips.sort_index(inplace=True)#按行索引排序,并替换原数据集,如图2图1列转成行图2行索引排序

DataFrame有多层索引MultiIndex怎样筛选数据

在选择数据时:元组(key1,key2)代表筛选多层索引,其中key1是索引0层,key2是1层,比如ey1=Thur,key2=Lunch列表[key1,key2]代表同一层的多个KEY,其中key1和key2是并列的同层索引,比如key1=Thur,key2=Fri

DataFrame有多层索引MultiIndex怎样筛选数据

DataFrame有多层索引MultiIndex怎样筛选数据在索引运算[]里面使用:,:表示切片。但是在非索引运算[]以外,比如元组或列表中使用:则不能表示:是切片运算符。在非索引运算[]以外,要表达切片,需使用slice()或pandas.IndexSliceslice(None)表示切片:,slice(a,e)表示a:eidx=pandas.IndexSlice,idx[:]表示切片,idx[a:e]表示a:e

小结pandas的索引分层索引MultiIndex数据源小费数据集tipsSeries的多层索引MultiIndexSeries有多层索引怎样筛选数据DataFrame的多层索引MultiIndexDataFrame有多层索引怎样筛选数据

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档