- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据应用专业
Spark 大数据技术与应用课程标准
一 、 基本信息
1.课程名称: Spark 大数据技术与应用
2.课程编码:
3.适应对象:三年制大数据应用专业
4.总学时:64 学时
5.学分:5
6.教学条件: 一体化教室、武汉伟创聚赢科技有限公司
7.建设团队:共有教师x 人,专职讲师x 人
8.审定机构:教务处
9.审定日期:
二、 课程理念
1.课程定位
本课程是为大数据技术类相关专业学生开设的课程。 Spark 继承了 MapReduce 分布式计
算的优点并改进了 MapReduce 明显的缺陷。 Spark 拥有 Hadoop MapReduce 所具有的优点,
但不同于 MapReduce,Spark 的中间输出结果可以保存在内存中,从而大大减少了读写
HDFS 的次数,因此 Spark 能更好地适用于数据挖掘与机器学习中需要迭代的算法。目前,
Spark 在企业中的运用越来越广泛,学习 Spark 分布式计算框架已然是进入大数据行业所必
不可少的一步。
2.课程改革理念
大数据技术蓬勃发展,基于开源技术的 Hadoop 在行业中应用广泛。但是 Hadoop 本身 还存在诸多缺陷,最主要的缺陷是其 MapReduce 计算模型延迟过高,无法胜任实时、快速
计算的需求。 Spark 的诞生弥补了MapReduce 的缺陷。
3.课程设计思路
本课程采用理论与实践相结合的教学方法。在理论上,通过典型案例引入概念、原理 和方法。在实践上,由教师讲解案例背景,提供简单思路。引导学生对案例进行针对性的 分析,审理和讨论,扩展学生的思维,增加学生的兴趣。通过学生的讨论、自主实践和练
习,提高学生的判断能力,专业能力和综合素质。
要求学生自主搭建 Spark 集群、完成章节任务、掌握基本理论和提升专业能力。在每
章的任务教学中,可适当布置联系、组织讨论、引导提出扩展的解决方案,充分调动学生
的主观能动性,锤炼学生的专业精神并提升动手能力,以达到本课程的培养目的。
三、课程目标
1.总目标
通过本课程的学习,使学生对 Spark 分布式计算框架有一个全面的理解,课程内容主 要包括了Spark 基本原理与架构、集群安装配置、 Scala 与 Spark 编程、 Spark 代表组件,
完整项目案例等精选内容。涉及的知识点简要精到,实践操作性强。
2. 具体目标
(1)知识目标 1. 了解Spark 概念
2掌握如何搭建Spark 分布式环境
3掌握Spark RDD 的概念
4了解Spark 的运行流程和原理
5掌握RDD 的转化操作和行动操作方法
6掌握键值对RDD 的操作
7掌握文本文件的读取和存储
(2)能力目标
1 掌握如何在IDEA 中配置Spark 编程环境
2 掌握Spark 程序的编写
3掌握Spark SQL 使用方法
4掌握Spark Streaming 使用方法
5 掌握Spark GraphX 使用方法
6 掌握Spark MLlib 使用方法
7 学习ALS 算法
8 掌握MLlib 算法包的使用
(3)素质目标
①学生自主探究学习状态
②学生合作学习状态
③学生的自我感受(共鸣度、愉悦度、价值度)
④与人合作的积极性
四、 课程教学内容
本课程由8个教学项目组成,课程具体教学内容见表1。
表 1 课程教学内容一览表
序 号
项目/模
块/任务
教学内容/任
务
教学/学习目标
教学活动设计
教学资源
学习地点
学时
1
Spark
基础知
识
Spark概述
Spark基本概念
Spark发展和应用 Spark环境配置方
法
Spark架构及原理
了解Spark概念 掌握如何搭建 Spark分布式环
境
掌握Spark RDD
的概念
了解Spark的运
行流程和原理
课件、教
案、素材、 教学环境、
实践项目
实训机房
4
2
Spark编程
从内存中已有数据
创建RDD
从外部存储创建
RDD
RDD转化操作和行
动操作方法
RDD键值对操作
文件读取与存储
掌握RDD的转化 操作和行动操作
方法
掌握键值对RDD
的操作
掌握文本文件的
读取和存储
课件、教
案、素材、 教学环境、
实践项目
实训机房
8
3
Spark编程进
阶
下 载 与 安 装
IntelliJ IDEA
Scala插件安装与
使用
配置Spark运行环
境的方法
运行Spark程序的
方法
持久化方法
数据分区方法
掌握如何在IDEA 中配置Spark编
程环境
掌握Spark程序
的编写
课件、教
案、素材、 教学环境、
实践项目
实训机房
10
4
Spark SQL:$ 结构化数据文
件处理
Spark SQL简介
park SQL CLI配
置
Spark SQL与Shell
交互
您可能关注的文档
- 面试PPT演示课件.ppt
- 普通地质学-(谢文伟-黄体兰-周仁元-王嵩莉)-第四章-风化作用.ppt
- 光伏电厂危险源辨识、风险分析资料.docx
- 妇产科学(第九版教材)第十章 胎儿异常与多胎妊娠 第六节 多胎妊娠 教案.docx
- 普通地质学(谢文伟-黄体兰-周仁元-王嵩莉)-第五章-地面流水的地质作用.ppt
- 进行心理健康教育是当好班主任应探索的新课题课件.ppt
- 工法培训课件.pptx
- 主体工程防水质量责任与落实.docx
- HDPE管道施工方案.docx
- 技术质量培训习题.docx
- 计及电动汽车移动储能动态电价的微电网优化调度研究及解决方案.pdf
- 浅谈电动汽车充电桩绝缘智能化自检装置的设计与应用 .pdf
- 浅谈电动汽车公共充电桩布局方案评价方法.pdf
- 浅谈基于弹性响应的电动汽车快充电价定价策略 汽车充电桩有序充电.pdf
- 浅谈光储充一体化社区的有序充电策略及解决方案.pdf
- 晚期肾透明细胞癌系统性治疗中国专家共识(2024版).pptx
- 中国膀胱癌保膀胱治疗多学科诊治协作共识(2022版).pptx
- 成人心血管外科手术体外循环患者血液管理指南.pptx
- 下尿路修复重建移植物应用规范中国专家共识.pptx
- 中国儿童急性非静脉曲张性上消化道出血诊治指南(2024).pptx
文档评论(0)