课程标准 - spark大数据技术.docxVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据应用专业 Spark 大数据技术与应用课程标准 一 、 基本信息 1.课程名称: Spark 大数据技术与应用 2.课程编码: 3.适应对象:三年制大数据应用专业 4.总学时:64 学时 5.学分:5 6.教学条件: 一体化教室、武汉伟创聚赢科技有限公司 7.建设团队:共有教师x 人,专职讲师x 人 8.审定机构:教务处 9.审定日期: 二、 课程理念 1.课程定位 本课程是为大数据技术类相关专业学生开设的课程。 Spark 继承了 MapReduce 分布式计 算的优点并改进了 MapReduce 明显的缺陷。 Spark 拥有 Hadoop MapReduce 所具有的优点, 但不同于 MapReduce,Spark 的中间输出结果可以保存在内存中,从而大大减少了读写 HDFS 的次数,因此 Spark 能更好地适用于数据挖掘与机器学习中需要迭代的算法。目前, Spark 在企业中的运用越来越广泛,学习 Spark 分布式计算框架已然是进入大数据行业所必 不可少的一步。 2.课程改革理念 大数据技术蓬勃发展,基于开源技术的 Hadoop 在行业中应用广泛。但是 Hadoop 本身 还存在诸多缺陷,最主要的缺陷是其 MapReduce 计算模型延迟过高,无法胜任实时、快速 计算的需求。 Spark 的诞生弥补了MapReduce 的缺陷。 3.课程设计思路 本课程采用理论与实践相结合的教学方法。在理论上,通过典型案例引入概念、原理 和方法。在实践上,由教师讲解案例背景,提供简单思路。引导学生对案例进行针对性的 分析,审理和讨论,扩展学生的思维,增加学生的兴趣。通过学生的讨论、自主实践和练 习,提高学生的判断能力,专业能力和综合素质。 要求学生自主搭建 Spark 集群、完成章节任务、掌握基本理论和提升专业能力。在每 章的任务教学中,可适当布置联系、组织讨论、引导提出扩展的解决方案,充分调动学生 的主观能动性,锤炼学生的专业精神并提升动手能力,以达到本课程的培养目的。 三、课程目标 1.总目标 通过本课程的学习,使学生对 Spark 分布式计算框架有一个全面的理解,课程内容主 要包括了Spark 基本原理与架构、集群安装配置、 Scala 与 Spark 编程、 Spark 代表组件, 完整项目案例等精选内容。涉及的知识点简要精到,实践操作性强。 2. 具体目标 (1)知识目标 1. 了解Spark 概念 2掌握如何搭建Spark 分布式环境 3掌握Spark RDD 的概念 4了解Spark 的运行流程和原理 5掌握RDD 的转化操作和行动操作方法 6掌握键值对RDD 的操作 7掌握文本文件的读取和存储 (2)能力目标 1 掌握如何在IDEA 中配置Spark 编程环境 2 掌握Spark 程序的编写 3掌握Spark SQL 使用方法 4掌握Spark Streaming 使用方法 5 掌握Spark GraphX 使用方法 6 掌握Spark MLlib 使用方法 7 学习ALS 算法 8 掌握MLlib 算法包的使用 (3)素质目标 ①学生自主探究学习状态 ②学生合作学习状态 ③学生的自我感受(共鸣度、愉悦度、价值度) ④与人合作的积极性 四、 课程教学内容 本课程由8个教学项目组成,课程具体教学内容见表1。 表 1 课程教学内容一览表 序 号 项目/模 块/任务 教学内容/任 务 教学/学习目标 教学活动设计 教学资源 学习地点 学时 1 Spark 基础知 识 Spark概述 Spark基本概念 Spark发展和应用 Spark环境配置方 法 Spark架构及原理 了解Spark概念 掌握如何搭建 Spark分布式环 境 掌握Spark RDD 的概念 了解Spark的运 行流程和原理 课件、教 案、素材、 教学环境、 实践项目 实训机房 4 2 Spark编程 从内存中已有数据 创建RDD 从外部存储创建 RDD RDD转化操作和行 动操作方法 RDD键值对操作 文件读取与存储 掌握RDD的转化 操作和行动操作 方法 掌握键值对RDD 的操作 掌握文本文件的 读取和存储 课件、教 案、素材、 教学环境、 实践项目 实训机房 8 3 Spark编程进 阶 下 载 与 安 装 IntelliJ IDEA Scala插件安装与 使用 配置Spark运行环 境的方法 运行Spark程序的 方法 持久化方法 数据分区方法 掌握如何在IDEA 中配置Spark编 程环境 掌握Spark程序 的编写 课件、教 案、素材、 教学环境、 实践项目 实训机房 10 4 Spark SQL:$ 结构化数据文 件处理 Spark SQL简介 park SQL CLI配 置 Spark SQL与Shell 交互

文档评论(0)

159****7880 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档