幻灯片 1

Similar documents
大数据技术原理与应用

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 专业成绩 美术学 ( 地方免费师范生 ) 综合成绩 提前艺术体育本 科 提前一批本科 体育 ( 文 ) 体育 ( 理 ) 文史 体育教育 ( 地方免费师范生 ) 专

大数据技术原理与应用

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管

大数据技术原理与应用

国内高等医学院校基础医学二级学科评价结果(1)

序号学校名称公示网址 1 北京大学 2 中国人民大学 34f629c9c4bd25b25f046.pdf 3 清华大学


西北师大学报 ( 社会科学版 ) 18 山东大学学报 ( 哲学社会科学版 ) 18 中南民族大学学报 ( 人文社会科学版 ) 18 同济大学学报 ( 社会科学版 ) 17 国家检察官学院学报 17 武汉大学学报 ( 哲学社会科学版 ) 17 陕西师范大学学报 ( 哲学社会科学版 ) 17 中国劳动关

期刊名称 转载数 名次 西南大学学报 ( 社会科学版 ) 19 浙江大学学报 ( 人文社会科学版 ) 18 南京农业大学学报 ( 社会科学版 ) 18 杭州师范大学学报 ( 社会科学版 ) 广州大学学报 ( 社会科学版 ) 18 首都师范大学学报 ( 社会科学版 ) 17 中国青年社会科

厦门大学辅助国内高校开设大数据课程公益项目 一 项目名称厦门大学辅助国内高校开设大数据课程公益项目二 项目介绍大数据时代的到来, 迫切需要高校及时建立大数据技术课程体系, 为社会培养和输送一大批具备大数据专业素养的高级人才, 满足社会对大数据人才日益旺盛的需求 本项目旨在为高校教师开设入门级大数据课

国家检察官学院学报 16 山东大学学报 ( 哲学社会科学版 ) 16 财经科学 16 现代传播 ( 中国传媒大学学报 ) 16 上海大学学报 ( 社会科学版 ) 15 云南大学学报 ( 社会科学版 ) 15 华东政法大学学报 15 中央民族大学学报 ( 哲学社会科学版 ) 15 中国劳动关系学院学报

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

求是学刊 19 北京工商大学学报 ( 社会科学版 ) 18 山东大学学报 ( 哲学社会科学版 ) 18 北京第二外国语学院学报 18 同济大学学报 ( 社会科学版 ) 17 华东师范大学学报 ( 哲学社会科学版 ) 17 安徽大学学报 ( 哲学社会科学版 ) 17 中央民族大学学报 ( 哲学社会科学

期刊名称 转载数 名次 东南大学学报 ( 哲学社会科学版 ) 18 华中师范大学学报 ( 人文社会科学版 ) 18 财经科学 ( 西南财经大学学报 ) 18 华南师范大学学报 ( 社会科学版 ) 18 法律适用 ( 国家法官学院学报 ) 18 南国学术 ( 澳门大学文科学报 ) 17 北京工商大学学

中国科学技术大学 材料工程 05 校外调剂 0870 化学工程 吉林大学 应用化学 05 校外调剂 0870 化学工程 四川大学 制药

<4D F736F F D F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63>

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理

大数据技术原理与应用

是 证 券 市 场 的 后 来 者, 但 在 前 景 广 阔 的 道 路 上 前 行, 终 将 成 为 这 个 市 场 的 领 先 者, 这 里 会 给 你 一 个 巨 大 的 舞 台, 这 里 有 你 需 要 的 机 会, 这 里 欢 迎 优 秀 的 你! 二 招 收 条 件 1. 遵 守 国 家

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工

36 SQ2016YFHZ 能源相关方向组 7 月 17 日 ( 星期一 ) 黑龙江 2 11:20-11:55 37 SQ2016YFHZ 能源相关方向组 7 月 17 日 ( 星期一 ) 广东 2 13:00-13:35 38 SQ2016YFHZ 能源相关方

5 2. 过程与方法 情感 态度与价值观 三 知识结构图 四 教学内容和教学要求 课 程 教学要求 课时安排

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

电院 2018 年硕士夏令营暨自主招生复试成绩公示 (7 月 ) 各位考生, 下面表中是参加电院 2018 年硕士夏令营暨自主招生的复试成绩公示名单, 具体拟录取情况要等 9 月中旬才能得知 名单中的考生如有放弃或没有取得本科推免资格的, 请及时邮件通知马老师

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批



什么是 Servlet 技术 Servlet 与 JSP 的联系与区别 实例介绍了解 Servlet 技术的特点和应用领域, 以及与 JSP 的联系与区别 4.EJB 技术 EJB 技术基础 EJB 基本环境的建立 实例介绍了解 EJB 技术的特点和应用领域, 熟悉 EJB 应用的部署和维护 5.S

马克思主义基本原理 通识教育课程范俊玉 1 08:00-08:50 数值分析 专业必修课程张亚楠 2 09:00-09:50 苏州大学 学年第 1 学期数学科学学院课程表 班级名称 :2014 基地人数 :37 辅导员 : 周扬实行日期 : 201

气溶胶光学厚度 的测量原理 Ê

合集

! % % % % % %!


( ) %


1. 标准学制 :4 年 2. 修业年限 : 可根据学生具体情况适当缩短或延长, 修业年限最短为 3 年, 最长不得超过 7 年 五 毕业要求及授予学位条件毕业要求 : 本专业学生在校期间必须修满本培养方案所规定的 167 学分, 方能毕业 授予学位 : 取得毕业资格并符合学校规定的学士学位授予条件

本科一批文史一志愿平行投档情况统计 院校名称 非定向 投档最低分 总分 ( 含优惠 ) 语文数学外语 安徽财经大学 安徽大学 北方工业大学 北京大学 北京第二外国语学院 6

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...


北京市招生情况一览表 专业 年份 专业名称 2014 招生计划 最高分 文 2015 最低分 史 平均分 招生计划 最高分 类 文 2016 最低分 史 平均分 招生计划 最高分 类 文 最低分 史 平均分 类 金融学 财政学

< F63756D656E D2DBAD8EEDAB2A92DB3AFBBD42D DB3C9B9FBBBE3B1E02DBBE3B1E02E6D6469>

安徽 专业 科类 最高分 最低分 专业 科类 最高分 最低分 社会学 理 哲学 文 网络与新媒体 理 社会学 文 公共事业管理 理 翻译 文 经济学 理 网络与新媒体 文

福建 本科一批 文史 国际商务 ( 厦门大学马来西亚分校 ) 福建本科一批文史汉语言文学 ( 厦门大学马来西亚分校 ) 福建本科一批文史会计学 ( 厦门大学马来西亚分校 ) 福建本科一批文史金融学 ( 厦门大学马来西


大数据分析技术 [13] 1.1 大数据 Big Data [2] IBM 5V Volume Velocity Variety Value Veracity Volume Velocity Variety Value Veracity 表 1 大数据特征表 Tab.1

旅游科学

山西 体育教育 ( 师范类 ) 体育文 368 休闲体育 体育教育 ( 师范类 ) 体育理 350 运动人体科学

成立于 2013 年 1 月 19 日, 是由中国人民大学与上海重阳投资管理有限公司联合创办的一所现代化智库 中国人民大学校长 央行货币委员会委员 金融学家陈雨露教授任院长 中国人民大学重阳金融研究院以 立足人大, 放眼世界 ; 把脉金融, 观览全局 ; 钻研学术, 关注现实 ; 建言国家, 服务大

计算机科学与技术学院 2016 级通信工程 学年教学计划 班级 : 通信 1601, 通信 1602 人数 :67 第一学期 课程性质课程名称学分总学时讲课实验实践上机讨论开课学院备注 选修 选修 通信类专业写作 计算机科学与技术学院 选修通信系统实验 3.0

PowerPoint 演示文稿

公共事业管理 理 政治学与行政学 文 国际政治 理 法学 ( 涉外法律人才培养模式实验班 ) 文 法学 ( 涉外法律人才培养模式实验班 ) 理 社会工作 文 德语 理 英语 文 628 6

二 外汇风险溢酬的度量及其时间序列模型

大数据技术原理与应用

国内高等医学院校基础医学二级学科评价结果(1)


PowerPoint 演示文稿

安徽 北京 表 3 天津师范大学 2018 年艺术本科各专业录取情况统计表 专业或方向 计划数 录取人数 文化 录取分数线 综合成绩 环境设计不分 服装与服饰设计不分 戏剧影视文学不分 7 7 广播电视编导不分 舞蹈学 ( 国标舞方向

厦门大学2003年陕西省本一批录取情况统计表

Reducing Client Incidents through Big Data Predictive Analytics

大数据技术原理与应用

数据科学与大数据技术 ( 云计算方向 ) 专业人才培养方案 一 专业名称 代码专业名称 : 数据科学与大数据技术 ( 云计算方向 ) 专业代码 :080910T 二 培养目标本专业培养德 智 体 美全面发展, 具有良好的人文素质和科学素养, 具备数据科学与大数据技术 ( 云计算方向 ) 专业基本理论

Azure_s

旅游管理 3 电气自动化技术 3 酒店管理 3 智能控制技术 4 计算机网络技术 2 供热通风与空调工程技术 2 电子信息工程技术 2 汽车检测与维修技术 2 物联网应用技术 2 汽车营销与服务 2 会计 3 软件技术 2 财务管理 2 计算机网络技术 2 金融管理 2 电子信息工程技术 2 工商企

孙 蓝等 基于目标导向的研究生英语学习模式创新

一 我国部分研究型大学 大学生创新性实验计划 实施的现状 莙政基 莙政基金 外 在学生中有

浙江 云南 山西 学院 最高分 最低分 一本线 二本线 最高分 最低分 一本线 二本线 最高分 最低分 一本线 二本线 机械工程 能源与环境系统工程 机械设计制造及其自动化

目 录

中北中学 ( 初中 ) 大寺中学 ( 初中 ) 富力中学 ( 初中 ) 富力中学 ( 初中 ) 06 中学历史教师 0 07 中学物理教师 0 08 中学信息技术教师 0 08 中学物理教师 0 中等专业学校 09 中学语文教师 0 中等专业学校 09 中学英语教师 0 中等专业学校 09 中学美术

<4D F736F F D C4EA39D4C B7D6D1A7BFC6C5C5C3FBBCF2B1A8A3A8B4F3C2BDB8DFD0A3A3A92E646F63>

PowerPoint Presentation

大数据关键技术发展趋势及产业构成

福建 甘肃 美术学文 绘画文 合计 4 4 戏剧影视文学文 理 摄影文 广播电视编导文 合计 省级统 成绩 = 高考成绩 美术学不分 绘画 不分 视觉

公务员版 B 河北 公务员版 B 河北 公务员版 C 河北 公务员版 C 河北 公务员版 C 河北


大数据技术原理与应用

山西医科大学 2017 级英语 学年第三学期周教学进度表 学院 系 ( 部 ): 外语系年级 / 专业 :2017 级英语 ( 医学英语 ) 班级 : (2) 人数 :64 人实习分组 : 序号 课程名称 总学时 理论课 实验

内外网.frx

附件 : 清华大学机械工程等 131 个专业认证结论 序号认证学校及专业名称认证结论认证结论有效起止时间 1 清华大学机械工程 2 北京工业大学机械工程 3 北京石油化工学院机械工程 4 浙江工业大学机械工程 5 东北大学材料成型及控制工程 6 燕山大学材料成型及控制工程 7 华中科技大学材料成型及

水晶分析师

b. Java 基础 (4%) c. Python 基础 (4%) d. Linux & Ubuntu 基础 (2%) PART 2 Hadoop 理论占比 (15%) a. Hadoop 安装配置及运行机制解析 (3%) b. Hadoop 分布式文件系统 (2%) c. MapReduce 理论

0202 应用经济学 上海财经大学 0202 应用经济学 西南财经大学 0202 应用经济学 暨南大学 0202 应用经济学 北京交通大学 0202 应用经济学 对外经济贸易大学 0202 应用经济学 山东大学 0202 应用经

Microsoft Word - CDA LⅡ大数据分析师考试大纲(第四届).docx

大数据技术原理与应用



8 中国科学院大学 134 1,276 9, 南昌大学 , 上海交通大学 , 山东农业大学 ,344 6

大数据技术原理与应用


美國政府推行 大數據的研究與發展計畫, 希望藉著提升從大型複雜的資料中提取知識的能力, 能加快科學和工程的開發並保障國家安全 資料科學與大數據 National Institute of Standards and Technology, NIST Jim Gray NI

课程设置—国民经济学


(更多的相关文章请访问岳阳公务员考试网:

浙江长征职业技术学院文件

成教2014招生计划.xls

<4D F736F F D C4EA31D4C B7D6D1A7BFC6C5C5C3FBBCF2B1A8A3A8B4F3C2BDB8DFD0A3A3A92E646F63>


Transcription:

高校大数据应用与学科人才培养研讨会 厦门大学林子雨博士 / 助理教授 ziyulin@xmu.edu.cn 2017 年 8 月 3 日山东. 烟台

内容提要 大数据课程公共服务平台 大数据技术原理与应用课程建设经验 大数据处理技术 Spark 课程建设经验

大数据课程公共服务平台

大数据课程公共服务平台 建设周期四年 (2013-2017) 投入资金 100 万 +

大数据课程公共服务平台 打造 11 大工程 平台每年访问量超过 100 万次

大数据课程公共服务平台 1 份精美的平台宣传册

大数据课程公共服务平台

大数据课程公共服务平台 制作 5 分钟培训基地宣传片

大数据课程公共服务平台

大数据课程公共服务平台 开展大数据公开课全国高校巡讲计划巡讲 10 个省 13 个高校 1 个科研院所 15 场公开课, 累计听众人数超过 2000 人

大数据课程公共服务平台 全力打造示范班级 大数据技术基础 2013 班级 大数据技术基础 2016 班级 大数据处理技术 Spark2017 班级 大数据技术原理与应用 2017 班级

大数据课程公共服务平台 入门级大数据在线课程 大数据技术原理与应用, 开辟大数据课程网络讲授平台

大数据课程公共服务平台 2016 年 3 月 28 日林子雨主讲 大数据技术原理与应用 在网易云课堂正式上线 2017 年 8 月 1 日学习人数超过 4 万人 99% 为 5 星级最高评价 长期稳居热门排行榜第一名 被众多网友评为 经典课程 MOOC 版本即将发布

大数据课程公共服务平台 建设 1 个大数据课程教师培训交流基地

大数据课程公共服务平台 2016 年 8 月 1 日 -7 日第 1 期 2016 年 8 月 14 日 -20 日第 2 期 2016 年 9 月 2 日 -4 日第 3 期 2017 年 1 月 16 日 -22 日第 4 期 2017 年 7 月 24 日 -31 日第 5 期

大数据课程公共服务平台 举办 4 次大数据课程教师研讨会

大数据课程公共服务平台 承办 3 次全国高校教学研讨会

大数据课程公共服务平台 承办 NDBC2016 全国高校大数据教学论坛

大数据课程公共服务平台

大数据课程公共服务平台

大数据课程公共服务平台

大数据课程公共服务平台 2013 年 9 月, 发布在线免费电子书 大数据技术基础 2014-2016, 发布并持续更新在线教程 大数据软件安装和基础编程指南 2016 年 10 月, 发布免费在线教程 Spark 入门教程

大数据课程公共服务平台 大数据课程实验案例 : 网站用户购物行为分析 Spark 课程综合实验案例 : 淘宝双 11 数据分析与预测 Spark 课程实验案例 :Spark+Kafka 构建实时分析 Dashboard

大数据课程公共服务平台 大数据课程教师交流群 (QQ 群号 :461510122) 促进大数据课程教师之间的沟通和交流 截至目前, 已经有来自全国 300 多所高校的 400 多名教师加入交流群 厦门大学 福建师范大学 厦门理工学院 同济大学 浙江财经大学 安徽大学 大连海洋大学 中北大学 河海大学 中山大学 浙江大学 中国农业大学 重庆邮电大学 华中师范大学 武汉理工大学 贵州师范大学 江西财经大学 山西大学 河北经贸大学 东北大学 山东农业大学 海南大学 中国地质大学 武汉大学 中国传媒大学 湖南大学 中国科技大学

大数据课程公共服务平台 微信公众号名称 : 云谷大数据 公众号定位 : 跟踪行业热点 汇集百家观点 分享教学经验 推荐经典书籍

内容提要 大数据课程公共服务平台 大数据技术原理与应用课程建设经验 大数据处理技术 Spark 课程建设经验

大数据技术原理与应用课程建设经验 课程定位 01 04 实验内容 教材选择 02 05 考核方法 课时安排 03 06 课程资源

大数据技术原理与应用课程建设经验 课程定位 01 入门级课程构建知识体系 阐明基本原理引导初级实践 了解相关应用 授课对象 : 本科生 ( 计算机相关专业 ) 知识储备 : 编程 操作系统 数据库

大数据技术原理与应用课程建设经验 教材选择 02

大数据技术原理与应用课程建设经验 教材选择 02 云计算课程知识要点 云计算概念 云计算体系架构 数据中心 虚拟化技术 ( 平台虚拟化 资源虚拟化 虚拟机的动态迁移 云操作系统 ) SOA 架构及开发技术 云数据中心设计与测试 云数据中心维护与管理 云安全架构 桌面云 PaaS 应用开发平台 开源的云计算管理平台 Openstack Docker 容器 大数据存储与管理 大数据课程知识要点 大数据处理架构 Hadoop 分布式文件系统 HDFS 分布式数据库 HBase NoSQL 数据库 云数据库 分布式并行编程模型 MapReduce 流计算 图计算 Spark

大数据技术原理与应用课程建设经验 课时安排 03 章或节 主要内容 学时安排 1 介绍大数据的基本概念和应用领域, 并阐述大数据 云计算和物联网 2 的相互关系 2 介绍大数据处理架构 Hadoop 2 3 分布式文件系统 HDFS 的基本原理和使用方法 4 4 分布式数据库 HBase 的基本原理和使用方法 4 5 NoSQL 数据库的概念和基本原理 2 6 云数据库的概念和基本原理 2 7 分布式并行编程模型 MapReduce 原理和使用方法 6 8 流计算基本原理 2 9 图计算基本原理 4 10 数据可视化概念 工具和案例 2 11 大数据在互联网领域的典型应用 : 推荐系统 2

大数据技术原理与应用课程建设经验 04 实验内容 全套机房上机实验指南, 包含题目和答案 用于入门级大数据课程的上机实验课 每个实验都需要连续 4 节上机课来完成 每个实验的设计, 都充分考虑了学生的基础和能力, 力求学生能够在连续 4 节课的上机时间内, 顺利完成课程实验, 提交实验报告 实验一 : 熟悉常用的 Linux 操作和 Hadoop 操作实验二 : 熟悉常用的 HDFS 操作实验三 : 熟悉常用的 HBase 操作实验四 :NoSQL 和关系数据库的操作比较实验五 :MapReduce 初级编程实践 免费在线访问地址 :http://dblab.xmu.edu.cn/post/6131/

大数据技术原理与应用课程建设经验 04 实验内容 大数据课程实验案例 网站用户购物行为分析 采用 2000 万条用户购物数据集 案例涉及数据预处理 存储 查询和可视化分析等数据处理全流程所涉及的各种典型操作 涵盖 Linux MySQL Hadoop HBase Hive Sqoop R Eclipse 等系统和软件的安装和使用方法 案例适合高校 ( 高职 ) 大数据教学, 可以作为学生学习大数据课程后的综合实践案例 免费访问地址 :http://dblab.xmu.edu.cn/post/7499/

大数据技术原理与应用课程建设经验 05 考核方法 平时签到考勤 10% 上机实验报告 20% 期末大实验 20% 期末笔试成绩 50%

大数据技术原理与应用课程建设经验 06 课程资源 大数据软件安装和编程实践指南 详细学习如何安装运行各种大数据软件以及如何进行初级编程实践, 包括 Hadoop HDFS HBase MapReduce Spark MongoDB 等安装 操作 编程指南 访问地址 :http://dblab.xmu.edu.cn/post/5663/

大数据技术原理与应用课程建设经验 06 课程资源 大数据技术原理与应用 备课指南 详细说明了教师如何备课, 包括教学大纲 讲义 PPT 授课视频 课后习题 上机题目等访问地址 :http://dblab.xmu.edu.cn/post/5637/

大数据技术原理与应用课程建设经验 06 课程资源 大数据技术原理与应用 授课视频 网易云课堂 林子雨主讲的全套大数据课程视频, 供老师上课参考 课程内容涵盖大数据 云计算和物联网概念及其相互关系 大数据处理架构 Hadoop 分布式文件系统 HDFS 分布式数据库 HBase NoSQL 数据库 云数据库 分布式并行编程模型 MapReduce 图计算 流计算 基于内存的大数据处理框架 Spark 基于 Hadoop 的数据仓库 Hive 大数据在不同领域的应用等 访问地址 :http://dblab.xmu.edu.cn/post/bigdata-online-course/

大数据技术原理与应用课程建设经验 06 课程资源 大数据技术原理与应用 实验指南 用于机房统一上机, 包含题目和答案 实验一 : 熟悉常用的 Linux 操作和 Hadoop 操作实验二 : 熟悉常用的 HDFS 操作实验三 : 熟悉常用的 HBase 操作实验四 :NoSQL 和关系数据库的操作比较实验五 :MapReduce 初级编程实践 访问地址 :http://dblab.xmu.edu.cn/post/6131/

大数据技术原理与应用课程建设经验 06 课程资源 大数据课程教师交流群 (QQ 群号 :461510122) 促进大数据课程教师之间的沟通和交流 截至目前, 已经有来自全国 300 多所高校的 400 多名教师加入交流群 厦门大学 福建师范大学 厦门理工学院 同济大学 浙江财经大学 安徽大学 大连海洋大学 中北大学 河海大学 中山大学 浙江大学 中国农业大学 重庆邮电大学 华中师范大学 武汉理工大学 贵州师范大学 江西财经大学 山西大学 河北经贸大学 东北大学 山东农业大学 海南大学 中国地质大学 武汉大学 中国传媒大学 湖南大学 中国科技大学

内容提要 大数据课程公共服务平台 大数据技术原理与应用课程建设经验 大数据处理技术 Spark 课程建设经验

大数据处理技术 Spark 课程建设经验 课程定位 01 04 实验内容 教材选择 02 05 考核方法 课时安排 03

大数据处理技术 Spark 课程建设经验 课程定位 01 大数据技术进阶学习课程授课对象 : 本科生 研究生 ( 计算机相关专业 ) 知识储备 :Java 编程 数据库 操作系统 Hadoop 先修课程 : 入门级大数据课程, 比如 : 大数据技术原理与应用

大数据处理技术 Spark 课程建设经验 教材选择 02 在线免费 Spark 入门教程 Spark 是当前最热门的大数据处理框架, 林子雨编著 Spark 入门教程, 让初学者零基础零障碍学习 Spark 教程采用 Scala 语言编写 Spark 应用程序, 因此, 教程包括 Scala 入门和 Spark 入门两个部分的内容 免费在线教程 :http://dblab.xmu.edu.cn/blog/spark/ 扫一扫手机访问在线教程

大数据处理技术 Spark 课程建设经验 教材选择 02 第一部分 : 快学 Scala 第一章 Scala 简介第二章 Scala 安装第三章 Scala 基础声明值和变量 基本数据类型和操作 Range 打印语句 读写文件第四章控制结构 if 条件表达式 while 循环 for 循环 数据结构 数组 列表 元组 集 映射 迭代器第六章类第七章对象第八章继承第九章特质第十章模式匹配第十一章函数式编程函数定义和高阶函数 针对集合的操作 遍历操作 map 操作和 flatmap 操作 filter 操作 reduce 操作 fold 操作 函数式编程实例 WordCount

大数据处理技术 Spark 课程建设经验 第二部分 :Spark 速成 (Spark2.1.0 版本 ) 第 1 章 Spark 的设计与运行原理 Spark 简介 Spark 运行架构 RDD 的设计与运行原理 Spark 的部署模式第 2 章 Spark 的安装与使用 Spark 的安装与使用 第一个 Spark 应用程序 :WordCount 使用开发工具 Intellij idea 和 Eclipse 编写 Spark 应用程序 Spark 集群环境搭建 在集群上运行 Spark 应用程序第 3 章 Spark 编程基础 RDD 编程 键值对 RDD 共享变量 数据读写 ( 文件数据读写 读写 HBase 数据 ) 第 4 章 Spark SQL Spark SQL 简介 DataFrame 与 RDD 的区别 DataFrame 的创建 从 RDD 转换得到 DataFrame 读取和保存数据 ( 读写 Parquet 通过 JDBC 连接数据库 连接 Hive 读写数据 ) 第 5 章 Spark Streaming 流计算简介 Spark Streaming 简介 DStream 操作 (DStream 操作概述 输入源 [ 文件流 套接字流 RDD 队列流 Apache Kafka Apache Flume] 转换操作 输出操作 ) 第 6 章 Spark MLlib Spark MLlib 简介 机器学习工作流 ( 机器学习工作流 构建一个机器学习工作流 特征抽取 转化和选择 [TF-IDF Word2Vec CountVectorizer 标签和索引的转化 卡方选择器 ]) 分类与回归 ( 逻辑斯蒂回归分类器 决策树分类器 ) 聚类算法 (KMeans 聚类算法 高斯混合模型 (GMM) 聚类算法 ) 推荐算法 ( 协同过滤算法 )

大数据处理技术 Spark 课程建设经验 课时安排 03 章 ( 或节 ) 主要内容学时安排 第 1 章大数据技术概述大数据的基本概念 关键技术和代表性软件 2 第 2 章 Scala 语言基础介绍 Scala 语言基础语法 6 第 3 章 Spark 设计与运行原理 Spark 概述 Spark 生态系统 Spark 运行架构 Spark 的署和应用方式 3 第 4 章 Spark 安装和使用方法 第 5 章 Spark 编程基础 第 6 章 Spark SQL 安装 Spark 在 Spark Shell 中运行代码 编写 Spark 独立应用程序 第一个 Spark 应用程序 :WordCount 使用开发工具编写 Spark 应用程序 Spark 集群环境搭建 在集群上运行 Spark 应用程序 RDD 编程 键值对 RDD 共享变量 数据读写 ( 文件数据读写 读写 HBase 数据 ) Spark SQL 简介 DataFrame 读写 Parquet 通过 JDBC 连接数据库 连接 Hive 读写数据 第 7 章 Spark Streaming 流计算简介 Spark Streaming 简介 DStream 操作 3 第 8 章 Spark MLlib Spark MLlib 简介 机器学习工作流 特征抽取 转化和选择 分类与回归 聚类算法 推荐算法 合计 32 3 6 3 6

大数据处理技术 Spark 课程建设经验 04 实验内容 实验 1:Linux 系统基本命令和 Hadoop 使用方法实验 2:RDD 基本操作实验 3: 迭代式算法编程实践实验 4: 自定义分区 排序 合并实验 5: 利用 DataFrame 实现数据库的读写实验 6: 利用 Spark Streaming 实现流数据处理 备注 : 将放入 Spark 入门教程 教材一起出版

大数据处理技术 Spark 课程建设经验 04 实验内容 Spark 课程综合实验案例 : 淘宝双 11 数据分析与预测 本案例涉及数据预处理 存储 查询和可视化分析等数据处理全流程所涉及的各种典型操作, 涵盖 Linux MySQL Hadoop Hive Sqoop Eclipse ECharts Spark 等系统和软件的安装和使用方法 案例访问地址 :http://dblab.xmu.edu.cn/post/8116/

大数据处理技术 Spark 课程建设经验 04 实验内容 大数据课程实验案例 :Spark+Kafka 构建实时分析 Dashboard 案例由厦门大学数据库实验室团队开发, 旨在满足全国高校大数据教学对实验案例的迫切需求 本案例涉及数据预处理 消息队列发送和接收消息 数据实时处理 数据实时推送和实时展示等数据处理全流程所涉及的各种典型操作, 涵盖 Linux Spark Kafka Flask Flask-SocketIO Highcharts.js sockert.io.js PyCharm 等系统和软件的安装和使用方法 案例适合高校 ( 高职 ) 大数据教学, 可以作为学生学习大数据课程后的综合实践案例 免费在线实验案例主页 :http://dblab.xmu.edu.cn/post/8274/

大数据处理技术 Spark 课程建设经验 05 考核方法 平时签到考勤 10% 上机实验报告 20% 期末大实验 20% 期末笔试成绩 50%

总结 : 大数据课程建设模式 以大量教学实践推动课程和教材建设 以平台思维促进教学资源汇聚和共享 以迭代方法不断优化升级教学内容 自我造血为课程建设提供稳定资金保障

THANKS 敬请指正 @ 林子雨

附录 : 林子雨简介 林子雨 单位 : 厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 个人网页 :http://www.cs.xmu.edu.cn/linziyu 数据库实验室网站 :http://dblab.xmu.edu.cn 中国高校首个 数字教师 的提出者和建设者中国高校首个大数据课程公共服务平台建设者 扫一扫访问个人主页 林子雨, 男,1978 年出生, 博士 ( 毕业于北京大学 ), 现为厦门大学计算机科学系助理教授 ( 讲师 ), 曾任厦门大学信息科学与技术学院院长助理 晋江市发展和改革局副局长 中国计算机学会数据库专委会委员, 中国计算机学会信息系统专委会委员 中国高校首个 数字教师 提出者和建设者, 厦门大学数据库实验室负责人, 厦门大学云计算与大数据研究中心主要建设者和骨干成员,2013 年度和 2017 年度厦门大学奖教金 ( 教学类 ) 获得者 主要研究方向为数据库 数据仓库 数据挖掘 大数据 云计算和物联网, 并以第一作者身份在 软件学报 计算机学报 和 计算机研究与发展 等国家重点期刊以及国际学术会议上发表多篇学术论文 作为项目负责人主持的科研项目包括 1 项国家自然科学青年基金项目 (No.61303004) 1 项福建省自然科学青年基金项目 (No.2013J05099) 和 1 项中央高校基本科研业务费项目 (No.2011121049); 主持的教学课题包括 1 项福建省教改课题和 1 项教育部产学合作育人项目课题 ; 同时, 作为课题负责人完成了国家发改委城市信息化重大课题 国家物联网重大应用示范工程区域试点泉州市工作方案 2015 泉州市互联网经济调研等课题 编著出版中国高校第一本系统介绍大数据知识的专业教材 大数据技术原理与应用 并成为畅销书籍 ; 建设了国内高校首个大数据课程公共服务平台, 成为国内高校大数据教学知名品牌, 平台每年访问量超过 100 万次 ; 建设了国内高校首个大数据课程教师培训交流基地, 已经累计为全国 100 余高校培养 100 多名大数据课程教师 ; 主讲厦门大学本科生课程 数据库系统原理 大数据技术原理与应用 和研究生课程 分布式数据库 大数据处理技术 Spark 具有丰富的政府和企业信息化培训经验, 厦门大学管理学院 EDP 中心 浙江大学管理学院 EDP 中心 厦门大学国际关系学院 中国人民大学等特邀培训讲师, 曾先后给中国移动通信集团公司 福州马尾区政府 温州市国资委 厦门市物流协会 福建龙岩卷烟厂 贵阳市政府等多家单位和企业开展信息化培训, 累计培训人数达 3000 人以上