Microsoft Word - 《Hadoop大数据技术与应用》教学大纲.doc

Similar documents
《C#基础入门》课程教学大纲

Microsoft Word - JavaWeb程序开发入门—教学大纲.doc

合集

处理 BLOB 数据 实现第一个 JDBC 程序 PreparedStatement 对象 CallableStatement 对象 ResultSet 对象 案例 -JDBC 的基本操作 PreparedStatement 批处理 CallableStatement 对象 案例 -JDBC 的基本

Microsoft Word - 第4章 MapReduce分布式计算框架 -教学设计.doc

博学谷 让 IT 教学更简单, 让 IT 学习更有效 跨平台 UI 设计宝典 课程教学大纲 ( 课程英文名称 ) 课程编号 : 学分 :5 学分学时 :80 学时 ( 其中 : 讲课学时 :36 学时上机学时 :44 学时 ) 先修课程 :Photoshop 后续课程 : 网页设计与制作 (HTML

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

<4D F736F F D F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63>

Microsoft Word - 《C语言开发入门》课程教学大纲-2.doc

是 证 券 市 场 的 后 来 者, 但 在 前 景 广 阔 的 道 路 上 前 行, 终 将 成 为 这 个 市 场 的 领 先 者, 这 里 会 给 你 一 个 巨 大 的 舞 台, 这 里 有 你 需 要 的 机 会, 这 里 欢 迎 优 秀 的 你! 二 招 收 条 件 1. 遵 守 国 家

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...

Microsoft Word - 第7章 初识Hibernate—教学大纲.doc

教学〔2016〕120号

PowerPoint 演示文稿

Spring 的入门程序 依赖注入的概念 依赖注入的实现方式 Spring 的核心容器 Spring 的入门程序 依赖注入的概念 依赖注入的实现方式 依赖注入的概念 了解 Spring 的概念和优点 理解 Spring 中的 IoC 和 DI 思想 掌握 ApplicationContext 容器的

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

電機工程系認可證照清單 /7/1

Reducing Client Incidents through Big Data Predictive Analytics

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

2019 级大数据技术与应用专业人才培养方案 一 专业名称及代码专业名称 : 大数据技术与应用专业代码 : 二 入学要求高中阶段教育毕业生或同等学力人员三 修业年限三年, 专科四 职业面向 ( 一 ) 服务面向 所属专业大类 ( 代码 ) 所属专业类 ( 代码 ) 对应行业 ( 代码 )

考 試 日 期 :2016/04/24 教 室 名 稱 :602 電 腦 教 室 考 試 時 間 :09: 二 技 企 管 一 胡 宗 兒 中 文 輸 入 四 技 企 四 甲 林 姿 瑄 中 文 輸 入 二 技 企 管 一

PowerPoint Presentation

我国计算机本科专业教育未来格局与发展方式探讨

什么是 Servlet 技术 Servlet 与 JSP 的联系与区别 实例介绍了解 Servlet 技术的特点和应用领域, 以及与 JSP 的联系与区别 4.EJB 技术 EJB 技术基础 EJB 基本环境的建立 实例介绍了解 EJB 技术的特点和应用领域, 熟悉 EJB 应用的部署和维护 5.S

PowerPoint 演示文稿

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

untitled

秘密

E11701


Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

PDO 处理结果集 PDO 错误处理机制 mysql 扩展常用函数 PDO 连接和选择数据库 PDO 执行 SQL 语句方法 PDO 处理结果集的方法 PDO 预处理语句 PDO 错误处理机制 可以描述 PHP 访问 MySQL 数据库的基本步骤 掌握 mysql 扩展的常用函数, 可对 MySQL

基于 SQL-on-Hadoop 的 网络日志分析

Microsoft Word - 教学大纲.doc

MySQL 数据库原理 设计与应用 课程教学大纲 ( 课程英文名称 ) 课程编号 : 学 分 :5 学分 学 时 :50 学时 ( 其中 : 讲课 38 学时上机 12 学时 ) 先修课程 : 计算机基础 适用专业 : 信息技术及其计算机相关专业 开课部门 : 计算机相关院系 一 课程的性质与目标


PowerPoint Presentation

应 用 英 语 J102 会 学 基 础 2 3 月 1 日 12:30-14:30 1 号 教 学 楼 104 应 用 日 语 J102 日 汉 互 译 1 3 月 1 日 12:30-14:30 1 号 教 学 楼 104 应 用 日 语 J102 职 业 教 育 2 3 月 1 日 9:00-

个人介绍 思考数据分析系统的基本指标 Hadoop 史前和史后的数据仓库流程 Hadoop 史前和史后的数据分析流程 思考 Hadoop 解决了什么样的根本问题 演讲大纲 Python 如何在构建数据仓库系统的作用 1. 使用 Python 快速构建数据分析模块 ComETL 2. 基于 Pytho

大数据开发工程师 ( 基础级 ) 考试大纲解析 Big Data Development Engineer Level I Examination Note 根据 BDDE 大数据开发工程师认证考试大纲, 泰迪智能研究院给出了详细解析, 以 领会, 熟知, 应用 三个不同的级别将每一个知识点进行分解

Microsoft Word zw

“百企入校——广西青年企业家协会高校

操 守, 爱 岗 敬 业 诚 实 守 信 办 事 公 道 服 务 群 众 奉 献 社 会 ; 具 备 从 事 职 业 活 动 所 必 需 的 基 本 能 力 和 管 理 素 质 ; 脚 踏 实 地 严 谨 求 实 勇 于 创 新 3. 人 文 素 养 与 科 学 素 质 : 具 有 融 合 传 统

水晶分析师

南京市人才服务中心

浦发银行总行实习人员招募启事 一 招募基本条件 年满 18 周岁 ; 具有全日制高校学籍的在校学生 ; 所在高校能够出具同意实习的证明 ; 身心健康 乐观积极 ; 遵纪守法 品行端正 ; 责任心强 善于沟通, 团队协作意识 强 二 报名方式 登录我行网站 : 点击 招

1

Apache CarbonData集群模式使用指南

5 2. 过程与方法 情感 态度与价值观 三 知识结构图 四 教学内容和教学要求 课 程 教学要求 课时安排

PowerPoint 演示文稿

大数据分析技术 [13] 1.1 大数据 Big Data [2] IBM 5V Volume Velocity Variety Value Veracity Volume Velocity Variety Value Veracity 表 1 大数据特征表 Tab.1

/ 149 / / / / / 500 1, / / / / / / / / 1,000 3, / / IT 157 / /

第五届高等学校软件工程人才培养高峰论坛

<4D F736F F D20B1B1BEA9D3CAB5E7B4F3D1A7B3F6B0E6C9E7CDBCCAE9D7DCC4BFC2BCA3A8D7EED6D5A3A9B0D8BABAD0C E392E646F63>

第五届高等学校软件工程人才培养高峰论坛

美國政府推行 大數據的研究與發展計畫, 希望藉著提升從大型複雜的資料中提取知識的能力, 能加快科學和工程的開發並保障國家安全 資料科學與大數據 National Institute of Standards and Technology, NIST Jim Gray NI

Microsoft Word 期交所簡章 _110805_

1. 标准学制 :4 年 2. 修业年限 : 可根据学生具体情况适当缩短或延长, 修业年限最短为 3 年, 最长不得超过 7 年 五 毕业要求及授予学位条件毕业要求 : 本专业学生在校期间必须修满本培养方案所规定的 167 学分, 方能毕业 授予学位 : 取得毕业资格并符合学校规定的学士学位授予条件

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

计算机科学与技术学院 2016 级通信工程 学年教学计划 班级 : 通信 1601, 通信 1602 人数 :67 第一学期 课程性质课程名称学分总学时讲课实验实践上机讨论开课学院备注 选修 选修 通信类专业写作 计算机科学与技术学院 选修通信系统实验 3.0

使用Spark SQL读取Hive上的数据

大数据技术原理与应用

Microsoft Word - Long-term Chinese course list Nov 2017.doc

Microsoft PowerPoint - 第一讲 概论.ppt

加 入 网 络 帝 国 的 学 习 狂 欢 仅 1989 年, 互 联 网 缔 造 者 蒂 姆 伯 纳 斯 李 爵 士 将 web 服 务 器 命 名 为 world wide web 开 始, 这 个 www 为 开 场 癿 新 时 代 就 引 収 了 一 连 串 癿 革 命, 幵 迚 而 成 为

Microsoft PowerPoint - wu_si_chong_2nd_hua_zu_hun_su

先生別耍我

政 治 经 济 学 ( 财 经 类 ) 高 等 数 学 ( 一 ) 基 础 会 计 学 经 济 法 概 论 ( 财 经 类 ) 计 算 机 应 用 基 础 国 民 经 济 统 计 概 论 企 业 会 计


Azure_s

数据科学与大数据技术专业本科 人才培养方案 一 招生对象及学习年限 ( 一 ) 招生对象 : 全日制普通中学高中毕业生, 招生方式为普通高考招生 ( 二 ) 学习年限 : 基本学制四年, 实行弹性学制, 学生在校时间原则上不能少于三年, 总在校时间 ( 含休学 ) 不得超过七年 二 培养目标 数据科

<4D F736F F D C4EABCC6CBE3BBFAB4F3C8FCCDA8D6AA E646F63>



云南民族博物馆文物保护与修复云南民族博物馆文物保护与修复云南民族博物馆文物保护与修复

山西医科大学 2016 级一系 学年第五学期周教学进度表 学院 系 ( 部 ): 第一临床医学院年级 / 专业 :2016 级一系班级 : (10) 人数 : 315 实习分组 : 序号 课程名称 总学时 理论课 实验

壹 依 據 : 臺 北 市 105 學 年 度 市 立 國 民 中 學 正 式 教 師 ( 巡 迴 ) 聯 合 甄 選 簡 章 一 高 級 中 等 以 下 學 校 教 師 評 審 委 員 會 設 置 辦 法 臺 北 市 政 府 教 育 局 105 年 4 月 20 日 北 市 教 中 字 第 105

Transwarp Data Hub including Apache Hadoop 2.0

思 想, 还 是 思 想 才 使 我 们 与 众 不 同 编 辑 部 : 工 业 和 信 息 化 部 赛 迪 研 究 院 通 讯 地 址 : 北 京 市 海 淀 区 万 寿 路 27 号 电 子 大 厦 4 层 邮 政 编 码 : 联 系 人 : 刘 颖 董 凯 联 系 电 话 :010

附件5

云 计 算 集 群 架 构 师 高 居 服 务 器 / 系 统 / 运 维 / 架 构 职 业 方 向 的 塔 尖 在 最 活 跃 的 移 动 互 联 网 时 代, 云 端 架 构 师 年 薪 普 遍 超 过 25 万 九 年 三 万 多 名 高 端 学 员, 全 国 唯 一 的 自 主 高 端 成

云南中医学院 701 中药学综合 1 全套考研资料 <2016 年最新考研资料 > 1-1 本套资料没有真题注 : 若考前收集到最新考研真题, 我们将免费邮件发送给购买资料的考生, 若考生自己购买到的话, 本店以市场价格报销购买真题的费用! 2-2 中药学 笔记, 此笔记为高分研究生复习所用, 借助

Microsoft Word - CDA LⅡ大数据分析师考试大纲(第四届).docx

中南大学第二届软件创新大赛

(Microsoft Word - \244\255\246~\257\305\244O\246\346\265\243\301n73\264\301.doc)

! & ( )! # # # # # # # # # & ) # # #

大数据关键技术发展趋势及产业构成

马克思主义基本原理 通识教育课程范俊玉 1 08:00-08:50 数值分析 专业必修课程张亚楠 2 09:00-09:50 苏州大学 学年第 1 学期数学科学学院课程表 班级名称 :2014 基地人数 :37 辅导员 : 周扬实行日期 : 201

PowerPoint 演示文稿

2 第 章 绪 论 Internet 2.0 使 得 消 费 型 电 子 产 品 用 户 可 以 通 过 多 种 不 同 的 数 据 网 络 访 问 互 联 网 内 容 用 户 可 以 使 用 便 携 式 消 费 型 电 子 设 备, 如 智 能 手 机 触 屏 平 板 电 脑 电 子 书, 甚 至

b. Java 基础 (4%) c. Python 基础 (4%) d. Linux & Ubuntu 基础 (2%) PART 2 Hadoop 理论占比 (15%) a. Hadoop 安装配置及运行机制解析 (3%) b. Hadoop 分布式文件系统 (2%) c. MapReduce 理论

Tech Radar2015修改111

山西医科大学 2017 级英语 学年第三学期周教学进度表 学院 系 ( 部 ): 外语系年级 / 专业 :2017 级英语 ( 医学英语 ) 班级 : (2) 人数 :64 人实习分组 : 序号 课程名称 总学时 理论课 实验

Information in this document, including URL and other Internet Web site references, is subject to change without notice. Unless otherwise noted, the e

优迈科技教学大纲2009版本

PowerPoint 演示文稿

幻灯片 1

《教育信息化前沿》

考生编号 科目代码 科目名称 成绩 复核结果 翻译硕士英语 66 无误 翻译硕士英语 65 无误 翻译硕士英语 58 无误 日语 ( 外 )

Transcription:

Hadoop 大数据技术原理与应用 课程教学大纲 ( 课程英文名称 ) 课程编号 :201800522062 学分 :5 学分学时 :63 学时 ( 其中 : 讲课学时 51 上机学时 :12) 先修课程 : 后续课程 :Spark 适用专业 : 大数据应用技术开课部门 : 一 课程的性质与目标 Hadoop 大数据技术原理与应用 是互联网 + 创业教育学院软件工程 ( 大数据 人工智能 ) 专业的一门校定必修专业课 通过学习课程使得学生掌握大数据分析的主要思想和基本步骤, 并通过编程练习和典型应用实例加深了解 ; 同时对 Hadoop 平台应用与开发的一般理论有所了解, 如分布式数据收集 分布式数据存储 分布式数据计算 分布式数据展示 开设本学科的目的是让学生掌握如何使用大数据分析技术解决特定业务领域的问题 完成本课程学习后能够熟练的应用大数据技术解决企业中的实际生产问题 操作系统 :Center OS Hadoop 版本 :Hadoop2.7.4 开发工具 :Eclipse 二 教学条件要求 三 课程的主要内容及基本要求第 1 章初识 Hadoop 章名初识 Hadoop 学时 4 1. 了解什么是大数据及其特征 2. 熟悉大数据的典型应用

3. 了解 Hadoop 的发展历史及其版本 4. 掌握 Hadoop 的生态体系 什么是大数据 大数据的特征 研究大数据的意义 大数据的应用场景 Hadoop 的发展历史 Hadoop 的优势 Hadoop 的生态体系 Hadoop 的版本 第 2 章构建 Hadoop 集群 章名 Hadoop 集群构建学时 5 1. 了解虚拟机的安装和克隆 2. 熟悉 Linux 系统的网络配置和 SSH 配置 3. 掌握 Hadoop 集群的搭建和配置 虚拟机安装 虚拟机克隆 4. 掌握 Hadoop 集群测试 5. 熟悉 Hadoop 集群初体验的操作 知识点了解掌握重点难点 Linux 系统网络配置 SSH 服务配置 Hadoop 集群部署模式 JDK 安装 Hadoop 安装 Hadoop 集群配置 格式化文件系统 启动和关闭 Hadoop 集群 通过 UI 界面查看 Hadoop 运行状态 Hadoop 集群初体验 第 3 章 HDFS 分布式文件系统 章名 HDFS 分布式文件系统学时 5 1. 了解 HDFS 演变 2. 掌握 HDFS 特点 3. 掌握 HDFS 的架构和原理 4. 掌握 HDFS 的 Shell 和 Java Api 操作

HDFS 的演变 HDFS 的基本概念 HDFS 的特点 HDFS 架构和原理 HDFS 的 Shell 操作 HDFS 的 Java API 操作 第 4 章 MapReduce 分布式计算系统 章名 MapReduce 分布式计算框架 学时 8 1. 理解 MapReduce 的核心思想 2. 掌握 MapReduce 的编程模型 3. 掌握 MapReduce 的工作原理 4. 掌握 MapReduce 常见编程组件的使用 MapReduce 核心思想 MapReduce 编程模型 MapReduce 编程实例 词频统计 MapReduce 工作过程 MapTask 工作原理 ReduceTask 工作原理 Shuffle 工作原理 MapReduce 编程组件 MapReduce 运行模式 MapReduce 性能优化策略 MapReduce 经典案例 倒排索引 MapReduce 经典案例 数据去重 MapReduce 经典案例 TopN 第 5 章 Zookeeper 分布式协调服务 章名 Hadoop 进阶学时 10 1. 了解 Zookeeper 的概念和特性 2. 理解 Zookeeper 数据模型 3. 掌握 Zookeeper 的 Watch 机制和选举机制 4. 掌握 Zookeeper 的集群部署 5. 掌握 Zookeeper 的 Shell 操作和 Java API 操作 6. 熟悉 Zookeeper 的应用场景 Zookeeper 的简介 Zookeeper 的特性

Zookeeper 集群角色 Zookeeper 的数据模型 Zookeeper 的 Watch 机制 Zookeeper 的选举机制 Zookeeper 分布式集群部署 Zookeeper Shell 操作 Zookeeper Java API 操作 Zookeeper 典型应用场景 第 6 章 Hadoop2.0 新特性 章名 Hadoop2.0 新特性学时 3 1. 掌握 YARN 的体系结构和工作流程 2. 掌握 HDFS 的高可用架构 3. 会搭建 Hadoop 高可用集群 Hadoop2.0 改进与提升 YARN 体系结构 YARN 工作流程 HDFS HA 的搭建方式 Hadoop 的高可用架构 启动 Hadoop HA 方式 第 7 章 Hive 数据仓库 章名 Hive 数据仓库学时 7 1. 了解 Hive 的相关功能和特点 2. 熟悉 Hive 的简单安装和配置 3. 掌握 HiveQL 的相关操作 数据仓库简介 数据仓库的结构 数据仓库数据模型 Hive 简介 Hive 系统架构 Hive 工作原理 Hive 数据模型 Hive 安装模式 Hive 的管理方式 Hive 内置数据类型 Hive 的操作方式

第 8 章 Flume 日志采集系统 章名 Flume 日志采集系统 学时 6 1. 了解 Flume 的作用 2. 熟悉 Flume 的运行机制 3. 掌握 Flume 的安装部署 4. 熟悉 Flume 的可靠性保证 5. 熟悉案例 日志采集的编写 Flume 简介 Flume 运行机制 Flume 日志采集系统结构 Flume 基本使用 Flume 安装配置 Flume Sources Flume Channels Flume Sinks Flume 负载均衡 Flume 故障转移 Flume 拦截器 第 9 章 Azkaban 工作流管理器 章名 Azkaban 工作流管理器 1. 了解 Azkaban 的结构 2. 掌握 Azkaban 的部署 学时 5 3. 熟悉 Azkaban 的基本使用 工作流管理器简介 Azkaban 特点 Azkaban 组织结构 Azkaban 部署模式 Azkaban 安装配置 Azkaban 启动方式 Azkaban Job Azkaban 工作流 Azkaban 嵌入流 依赖任务调度管理

MapReduce 任务调度管理 Hive 脚本任务调度管理 第 10 章 Sqoop 数据迁移 章名 Sqoop 数据迁移 学时 3 1. 了解 Sqoop 基本概念 2. 掌握 Sqoop 安装配置 3. 熟悉 Sqoop 常用的相关指令 4. 掌握使用 Sqoop 进行导入导出 Sqoop 简介 Sqoop 导入导出工作原理 Sqoop 安装配置 Sqoop 指令介绍 MySQL 表数据导入 HDFS 增量导入 MySQL 表数据导入 Hive MySQL 表数据子集导入 Sqoop 数据导出 第 11 章综合项目 网站流量日志数据分析系统 章名 综合项目 网站流量日志数据分析系统 学时 7 1. 熟悉日志分析系统的架构 2. 熟悉系统环境搭建的步骤 3. 掌握日志分析系统业务流程 4. 掌握人均浏览页面模块的实现方法 系统背景介绍 系统架构设计 模块开发 - 数据预处理 模块开发 - 数据仓库开发 模块开发 - 数据分析 模块开发 - 数据导出 模块开发 - 日志分析系统报表展示 四 学时分配

章目 讲课 上机 合计 第 1 章初识 Hadoop 4 学时 0 学时 4 学时 第 2 章构建 Hadoop 集群 4 学时 1 学时 5 学时 第 3 章 HDFS 分布式文件系统 4 学时 1 学时 5 学时 第 4 章 MapReduce 分布式计算系统 7 学时 1 学时 8 学时 第 5 章 Zookeeper 分布式协调服务 7 学时 3 学时 10 学时 第 6 章 Hadoop2.0 新特性 2 学时 1 学时 3 学时 第 7 章 Hive 数据仓库 6 学时 1 学时 7 学时 第 8 章 Flume 日志采集系统 5 学时 1 学时 6 学时 第 9 章 Azkaban 工作流管理器 4 学时 1 学时 5 学时 第 10 章 Sqoop 数据迁移 2 学时 1 学时 3 学时 第 11 章综合项目 网站流量日志数据分析系统 6 学时 1 学时 7 学时 合计 51 学时 12 学时 63 学时 五 考核模式与成绩评定办法 本课程为考试课程, 期末考试采用百分制的闭卷考试模式 学生的考试成绩由平时成绩 (30%) 和期末考试 (70%) 组成, 其中, 平时成绩包括出勤 (5%) 作业(5%) 上机成绩 (20%) 六 选用教材和主要参考书 本大纲是根据教材 Hadoop 大数据技术原理与应用 所设计的 七 大纲说明 本课程的授课模式为 : 课堂授课 + 上机, 其中, 课堂主要采用多媒体的方式进行授课, 并且会通过测试题阶段测试学生的掌握程度 ; 上机主要是编写程序, 要求学生动手完成指定的程序设计或验证 撰写人 : 审定人 : 批准人 : 执行时间 :