- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python爬虫助力疫情数据追踪
摘要
随着信息化的高速发展,大数据的引用越来越受到重视,应用也日益广泛,与此同时,
数据可视化为此次新型冠状病毒肺炎疫情防控提供了有力的支持。本文旨在利用数据挖掘技
术、挖掘出有关国内疫情和海外疫情的现有确诊、累计确诊、累计治愈和累计死亡等相关的
数据情况,为疫情防控提供更多有效可靠信息,采用可视化工具使对疫情数据有一个更加直
观了解分析,以及将可视化数据分析结果在前端进行展示。
第一,疫情相关数据的爬取与分析。本文运用Python 爬虫爬取疫情相关数据并对数据
进行整合。其中,爬取数据前需要获取网页的源代码,不同的数据结构都有指定的URL,
根据需要选择特定的URL。获取相关数据后对数据进行解析,最后将以JSON 格式存储的
数据转换为字典,为后续的疫情数据可视化操作提供数据支撑。
第二,对所获取的疫情相关数据进行可视化。为了能更加深入挖掘出这些疫情数据隐藏
的信息,以便对中国以及世界的疫情信息的分布以及变化趋势有更加清晰直观的了解,本文
采用Pyecharts 库对所获取的疫情的相关数据进行可视化,最终以图像形式、地图类型将疫
情数据展示出来。其中绘制了中国各省市 (区)总体疫情信息、治疗率、死亡率,中国个省
市 (区)总体疫情信息、世界总体信息等折线图、散点图、柱状图,以及绘制世界疫情以及
地级市疫情一系列交互地图。
关键字:Python 数据分析、Python 网络爬虫、Python 数据可视化
目录
1 背景与目标3
1.1 研究背景3
1.2 挖掘目标3
1.3 研究思路4
2 信息采集5
2.1 Python 爬取数据的流程5
2.2 获取疫情数据5
2.2.1 数据来源说明5
2.2.2 Python 获取网页数据任务的方法6
2.2.3 爬取中国疫情和国外疫情数据6
2.3 获取疫情数据实现过程7
2.3.1 获取实时疫情页面网页源码并解析JSON 数据8
2.3.2 爬取国内疫情数据8
2.3.3 爬取国外疫情数据8
2.3.4 爬取国外疫情趋势数据9
2.3.5 获取疫情数据结果展示10
3 疫情现状分析与可视化成果10
3.1 中国疫情现状分析10
3.1.1 总体情况分析10
3.1.2 部分省份情况分析13
4 总结15
5 难点与解决方式16
1 背景与目标
1.1 研究背景
数据新闻是一种集大数据处理以及新闻叙事为一体的新型新闻传播活动,不仅涉及数据
挖掘技术,还包括数据的可视化。基于数据可视化技术的数据不再是乏味的文字数字,而是
扩展到图表甚至视频、动画等,同时加上交互式的展现。比如在疫情报道中,患者所在地点
查询地图、某个国家疫情确诊、治愈等情况的发展趋势,以可视化的方式呈现疫情相关数据
能给读者们更多的参与。
2020年初,由于一场突如其来的疫情影响,中国全国乃至全世界进入了疫情防控的紧
张时期,对于这场特殊的疫情攻坚战,疫情实时地图、感染人数建模、问卷信息收集等手段
对疫情相关数据分析不仅是国家相关部门的工作,也是人们日常关心的话题之一,但是单单
凭借人民日报客户端、新华网、央视新闻、微博、抖音等多媒体平台发布的数据的难以让人
们直观的看到疫情总体的发展趋势,将众多庞杂的数据和新闻转变成普通人能看懂的图像内
容,可以全面地展现了疫情形势。因此,我们利用数据挖掘等技术对所获取的数据进行可视
化分析,让疫情相关数据以更直观、准确、快速的方式体现。
1.2 挖掘目标
疫情数
文档评论(0)