- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
深入浅出Python编程
(模块3数据结构)第5单元绘制CPC历史决议词云图
直接显示词云图片使用jieba模块实现分词操作使用with-as语句打开文件;使用列表/元组实现对关键词的统计;使用列表推导式获取前20的关键词。Outcome
单元目标/Objectives?理解线性(linear)数据结构?熟练掌握列表list的使用?熟练掌握元组tuple的使用?理解Python对象的可变与不可变?掌握文件数据输入基本操作⑥具有爱国情怀和民族自信心
内容及计划/AgendaSchedule8/6ClassHoursDetails专科应用本科00:1000:10回顾成果目标00:2500:25文件的基本操作02:4002:00使用列表创建词云图02:0001:20元组使用及改写实现00:0500:05课堂小结Total:8/6hours(6/4hPractice)Total:54Hours(24hPractice)
01《决议》词云图CloudWord
1.任务分析目标解构一是,从《决议》文件读取全文本内容二是,提取关键词并统计关键词出现的次数三是,生成并显示词云图片模式识别文件数据输入/只读分词-过滤-去重-统计-排序Top20
1.任务分析模式归纳(关键词1,出现次数),(关键词2,出现次数)……的数据结构来表示“关键词-次数”数据对序列结构可以使用列表(list)统计结果可以使用列表或元组算法设计open()函数等方法打开文件/jieba第三方模块实现分词列表/元组操作数据/sort()方法或sorted()函数实现排序wordcloud+matplotlib绘制并显示词云图
2.任务准备jieba模块第三方中文分词函数库jieba.lcut()WordCloud模块第三方词云库,根据你给出字符串,以不同的大小、颜色显示出来中文需要提供使用字体的路径,否则会出现乱码wordcloud.WordCloud()创建词云图
2.任务准备matplotlib模块Python最著名的2D绘图库只使用matplotlib.pyplot绘制wordcloud生成的词云图片matplotlib模块①引入模块初始化环境,设想已经准备好了一块画板;②准备好要使用的数据;③把数据装入坐标轴,画图/渲染两种方法:①axes.Axes对象在画板figure.Figure上画图;②matplotlib.pyplot()
02文件输入FileInput
1.读取文件输入认识文件文本文件(textfile):基于字符编码(ASCII、UTF-8等)的文件,能够使用字符串str对象读写的文件对象(fileobject)二进制文件(binaryfile):基于值,没有编码,只是一个字节序列,存储的是二进制数据打开文件语法:stream=open(file_name,mode)r-以只读方式(read)打开文件;如果省略时,默认值为rw-以写(write)数据方式打开文件,如果同名文件已经存在,则会被覆盖a-打开文件并追加(append)内容,任何写入的数据会自动添加到文件末尾t-表示操作的是一个文本(text)文件b-表示操作的是一个二进制(binary)文件
1.读取文件输入f.read(size):读取并返回最多size个字符f.readline():读取单行数据f.write(str):把str的内容写入文件f.close():关闭文件
2.使用with打开文件with-as上下文管理器(contextmanager)
读取决议文件数据并分词
03列表List
1.列表的基本操作—?创建中文标点符号列表创建列表[]/list()元素是有位序的
1.列表的基本操作—?创建中文标点符号列表创建拼音字符列表的两种方式[]:直接赋值创建list():将一个字符串进行类型转换创建
1.列表的基本操作—?访问和遍历列表访问列表数据项索引切片
1.列表的基本操作—?访问和遍历列表遍历列表数据项值迭代索引遍历
1.列表的基本操作—?修改列表及计算在列表中添加元素append()extend()
1.列表的基本操作—?修改列表及计算更新列表中的元素重新赋值数据项要确保“回写”
1.列表的基本操作—?修改列表及计算列表的计算操作加法:合并列表乘法:重复列表
1.列表的基本操作—?(逆序)删除标点符号列表的删除操作pop()方法:按元素的位置删除remove()方法:按元素的值删除del命令
1.列表的基本操作—?(逆序)删除标点符号删除标点符号执行删除操作的过程中数据项的位置会发生改变故采用逆序搜索前进
1.列表的基本操作—?列表的嵌套:r
您可能关注的文档
- Python编程基础 课件 CH01顺序:使用海龟画太极图.pptx
- Python编程基础 课件 CH02数值字符:打印计算机信息图卡.pptx
- Python编程基础 课件 CH03循环:使用海龟画五角星.pptx
- Python编程基础 课件 CH04分支:凯撒密码加解密信息.pptx
- Python编程基础 课件 CH06字典集合:绘制人口普查数据图表.pptx
- Python编程基础 课件 CH07普通函数:获取照片拍摄地址信息.pptx
- Python编程基础 课件 CH08高阶函数:批量创建文件夹GUI工具.pptx
- Python编程基础 课件 CH09面向对象:采集网络图书数据.pptx
- Python编程基础 课件 CH10Web开发:Flask开发系统监控看板应用.pptx
- Python编程基础 课件 附录1:搭建Python开发环境.pptx
- 中国国家标准 GB/T 4214.17-2024家用和类似用途电器噪声测试方法 干式清洁机器人的特殊要求.pdf
- GB/T 4214.17-2024家用和类似用途电器噪声测试方法 干式清洁机器人的特殊要求.pdf
- 《GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法》.pdf
- GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法.pdf
- 中国国家标准 GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法.pdf
- 中国国家标准 GB/T 32455-2024航天术语 运输系统.pdf
- GB/T 32455-2024航天术语 运输系统.pdf
- 《GB/T 32455-2024航天术语 运输系统》.pdf
- GB/T 44369-2024用于技术设计的人体运动生物力学测量基础项目.pdf
- 中国国家标准 GB/T 44369-2024用于技术设计的人体运动生物力学测量基础项目.pdf
文档评论(0)