美國政府推行 大數據的研究與發展計畫, 希望藉著提升從大型複雜的資料中提取知識的能力, 能加快科學和工程的開發並保障國家安全 資料科學與大數據 National Institute of Standards and Technology, NIST Jim Gray NI

Similar documents
培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

合集

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

Reducing Client Incidents through Big Data Predictive Analytics

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...

Azure_s

思 想, 还 是 思 想 才 使 我 们 与 众 不 同 编 辑 部 : 工 业 和 信 息 化 部 赛 迪 研 究 院 通 讯 地 址 : 北 京 市 海 淀 区 万 寿 路 27 号 电 子 大 厦 4 层 邮 政 编 码 : 联 系 人 : 刘 颖 董 凯 联 系 电 话 :010

財金資訊-84期.indd

PowerPoint 演示文稿

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

是 证 券 市 场 的 后 来 者, 但 在 前 景 广 阔 的 道 路 上 前 行, 终 将 成 为 这 个 市 场 的 领 先 者, 这 里 会 给 你 一 个 巨 大 的 舞 台, 这 里 有 你 需 要 的 机 会, 这 里 欢 迎 优 秀 的 你! 二 招 收 条 件 1. 遵 守 国 家

大数据分析技术 [13] 1.1 大数据 Big Data [2] IBM 5V Volume Velocity Variety Value Veracity Volume Velocity Variety Value Veracity 表 1 大数据特征表 Tab.1

国 家 图 书 馆 年 鉴 0 重 点 文 化 工 程 一 中 华 古 籍 保 护 计 划 0 年, 国 家 图 书 馆 ( 国 家 古 籍 保 护 中 心 ) 根 据 文 化 部 要 求, 围 绕 习 近 平 总 书 记 关 于 弘 扬 中 华 优 秀 传 统 文 化 系 列 讲 话 精 神, 对

目錄

应 用 为 先, 统 筹 规 划 摘 要 : 总 体 上 看, 我 国 的 云 计 算 还 没 有 进 入 良 性 发 展 的 轨 道 目 前 的 形 势 是 政 府 比 企 业 积 极, 企 业 比 用 户 积 极, 大 企 业 比 中 小 企 业 积 极, 建 设 数 据 中 心 比 推 广 应

温州市政府分散采购

云 计 算 集 群 架 构 师 高 居 服 务 器 / 系 统 / 运 维 / 架 构 职 业 方 向 的 塔 尖 在 最 活 跃 的 移 动 互 联 网 时 代, 云 端 架 构 师 年 薪 普 遍 超 过 25 万 九 年 三 万 多 名 高 端 学 员, 全 国 唯 一 的 自 主 高 端 成

PowerPoint 演示文稿

CHINA SCIENCE AND TECHNOLOGY DEVELOPMENT REPORT

2013_6_3.indd

新 三 板 市 场 TMT 行 业 216 年 下 半 年 投 资 策 略 目 录 投 资 聚 焦... 1 投 资 观 点... 1 创 新 之 处... 1 风 险 因 素... 1 市 场 回 顾 与 行 业 展 望... 2 市 场 回 顾 :TMT 继 续 成 为 新 三 板 最 为 活

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

一 公 司 简 介 993 年, 顺 丰 诞 生 于 广 东 顺 德 自 成 立 以 来, 顺 丰 始 终 专 注 于 服 务 质 量 的 提 升 持 续 加 强 基 础 建 设 积 极 研 发 和 引 进 具 有 高 科 技 含 量 的 信 息 技 术 与 设 备 以 提 升 作 业 自 动 化

改 善 動 機 很 多 人 在 使 用 學 校 網 站 時, 感 覺 到 有 諸 多 不 便, 像 是 雖 然 學 校 有 辦 活 動, 但 很 難 發 現 公 佈 在 網 站 上 的 活 動 資 訊, 還 有 雲 端 系 統 銷 曠 繁 複 等, 鑒 於 以 上 原 因, 我 們 決 定 改 善

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

基 于 大 数 据 的 智 慧 城 市 研 究 与 规 划 甄 峰 南 京 大 学 智 慧 城 市 研 究 院 南 京 大 学 建 筑 与 城 市 规 划 学 院 2014 年 6 月 21 日

Microsoft Word 電腦軟體設計.doc

摘 要 SAS 全 球 論 壇 會 議 (SAS GLOBAL FORUM) 係 由 非 營 利 組 織 SAS 軟 體 全 球 用 戶 社 群 (SAS GLOBAL USERS GROUP) 舉 辦 之 年 度 國 際 研 習 會, 主 要 探 討 SAS 在 金 融 醫 藥 衛 生 生 產 運

我 的 小 確 幸 四 : 在 第 二 份 打 工 時, 遇 到 一 位 對 我 非 常 好 的 同 事, 她 是 帶 我 的 人, 她 對 我 非 常 有 耐 性 的 教 導, 一 次 又 一 次 的 細 心 帶 領 在 這 次 的 期 中 考 前, 我 沒 上 班, 因 說 要 準 備 考 試,

最 佳 做 法 : 在 需 要 时 或 需 要 前 从 CDN 下 载 内 容, 并 使 它 们 与 Flash 代 码 和 文 件 分 离 存 盘 率 vs 响 应 速 度 当 用 户 玩 游 戏 时, 客 户 端 可 以 把 每 一 个 变 化 实 时 写 到 后 端 Web 服 务 器, 也

CHINA SCIENCE AND TECHNOLOGY DEVELOPMENT REPORT ()

文档 1

雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO

電機工程系認可證照清單 /7/1

「西醫基層總額支付委員會《第28次委員會議紀錄

第6章  数据库技术基础

新疆医科大学


1. 前 言 在 現 代 的 工 作 環 境 必 須 要 有 網 路, 網 路 環 境 無 所 不 在, 而 求 職 者 必 須 具 備 網 路 方 面 的 專 業, 才 能 在 未 來 的 職 場 上 保 持 高 度 的 競 爭 優 勢 Cisco 網 路 環 境 幾 乎 涵 蓋 了 全 球 主

201316

11 天 山 区 区 环 卫 清 运 队 机 械 工 程 师 4011 C 1 不 限 不 限 机 电 具 有 两 以 工 作 经 12 天 山 区 乌 鲁 木 齐 市 第 15 小 会 计 4012 C 1 不 限 不 限 会 计 财 会 财 电 算 化 临 床 医 预 防 医 公 共 卫 生 与

為民服務不定期考核項目及評分表...附表1

% % CHINA SCIENCE AND TECHNOLOGY DEVELOPMENT REPORT % % % % 28.6%

<4D F736F F D20BAECB1A6C0F6A3BAB7C7B9ABBFAAB7A2D0D0B9C9C6B1C4BCBCAFD7CABDF0CAB9D3C3B5C4BFC9D0D0D0D4B1A8B8E62E646F63>


PowerPoint 演示文稿

( 一 ) 口 腔 正 畸 行 业 国 内 市 场 竞 争 情 况, 以 及 海 骏 科 技 在 口 腔 正 畸 行 业 的 市 场 地 位 与 份 额 情 况 及 主 要 竞 争 对 手 情 况 1 口 腔 正 畸 行 业 国 内 市 场 的 竞 争 情 况 分 析 根 据 中 华 口 腔 医 学

加 值 型 及 非 加 值 型 營 業 稅 法 第 12 條 ( 公 布 ) 特 種 飲 食 業 之 營 業 稅 稅 率 如 下 : 一 夜 總 會 有 娛 樂 節 目 之 餐 飲 店 之 營 業 稅 稅 率 為 百 分 之 十 五 二 酒 家 及 有 陪 侍 服 務 之 茶 室

目 录 简 介.3 ` 体 系 结 构...4 数 据 层...5 数 据 连 接 器...6 Tableau Server 组 件...7 网 关 / 负 载 平 衡 器...8 客 户 端 :Web 浏 览 器 和 移 动 应 用 程 序...8 客 户 端 :Tableau Desktop..

马 为 名 的 教 会, 而 且 还 可 找 到 他 不 少 遗 迹 多 马 的 英 文 是 Thomas, 也 翻 译 成 托 马 斯, 许 多 西 方 人 给 子 女 取 名 叫 托 马 斯, 来 纪 念 这 位 伟 大 的 宣 教 士 接 下 来 我 们 思 想 另 一 个 人, 就 是 雅

Untitiled


Transcription:

一般報導 大數據與 巨量資料分析 曾龍 我們需要你 資料科學家 來幫助國民建立更好的數位服務 幫助我們揭開更新的創意 幫助我們改善這個國家和全世界 美國總統歐巴馬 在 2012 年 10 月發行的 哈佛商業評 論 中 戴 文 波 特 湯 姆 斯 Thomas H. Davenport 及 帕 蒂 爾 D.J. Patil 發 表 了 一篇文章 描述 21 世紀最性感的職業 資料科學家 Data Scientist: The Sexiest Job of the 21st Century 同年美國歐巴馬政 府更投資了近兩億美元推行 大數據的研 究 與 發 展 計 畫 The Big Data Research and Development Initiative 希 望 藉 著 提 升 從大型複雜的資料中提取知識的能力 能 加快科學和工程的開發並保障國家安全 2015 年 2 月 19 日 白宮正式任命帕蒂 爾為首位首席資料科學家 當天他在聖荷西 San Jose 的 Strata + Hadoop 2015 會議做 美國總統歐巴馬曾特地錄製短片 以懇切言辭表達 對資料科學家的敬意和期許 圖片來源 種子發 了一場主題演講 講題是 資料科學 我們 將 邁 向 何 方 Data Science: Where are We Going 美國總統歐巴馬還特地錄製短片祝賀大會順利舉行 影片中歐巴馬呼籲 我們需 要你 資料科學家 來幫助國民建立更好的數位服務 幫助我們揭開更新的創意 幫助我 們改善這個國家和全世界 66 科學發展 2016 年 8 月 524 期

美國政府推行 大數據的研究與發展計畫, 希望藉著提升從大型複雜的資料中提取知識的能力, 能加快科學和工程的開發並保障國家安全 資料科學與大數據 2015 4 National Institute of Standards and Technology, NIST 7 2007 Jim Gray NIST Big Data NIST 巨量資料的特徵 21 PB ZB IDC 2012 2011 1.8 ZB 2020 40 ZB 57 常用的資料計量單位 ZB Zettabyte 1 ZB 1,024 EB EB Exabyte 1 EB 1,024 PB PB Petabyte 1 PB 1,024 TB TB Terabyte 1 TB 1,024 GB GB Gigabyte SD 1 GB 1,024 MB MB Megabyte 3.5 1 MB 1,024 KB KB Kilobyte 1 KB 1,024 B B Byte 1 Byte 8 Bits Bits 2016 8 524 67

Google 24 PB 400 PB 5 10 6 50 TB GB TB PB EB Facebook Twitter Line IDC 2020 10 50 35ZB 11 11 1 68 2016 8 524 volume velocity variety 3V 挑戰性課題與解決方案 1970 E.F. Codd Postgresql MySQL Oracle IBM DB2 MSSQL NoSQL Not Only SQL NoSQL SQL 巨量資料通常有時效性, 一旦傳送到運算伺服器, 就要能即時取得分析結果才能發揮其最大價值

NoSQL SQL NoSQL NoSQL Hadoop Apache Spark Storm Hadoop Apache Hadoop 2003 GFS Doug Cutting HDFS Map Reduce Hadoop Hadoop Hadoop 2008 Apache 3 Hadoop Distributed File System HDFS MapReduce NoSQL 資料庫的主要類型 Key-Value TB PB XML JSON Dunamo, Bigtable Redis, Memcached HBase, Hypertable Neo4J DB, InfiniteGraph CouchDB, MongoDB 2016 8 524 69

Yet Another Resource Negotiator YARN HDFS Hadoop HDFS Hadoop MapReduce Map Reduce Hadoop Java Java MapReduce native mode Python R Hadoop Streaming Hadoop 2 Yarn Yarn 70 2016 8 524 Hadoop HBase Hadoop Column-Oriented Hive HDFS SQL Hadoop SQL Hadoop ZooKeeper Hadoop Hadoop Pig HDFS MapReduce Map Reduce Sqoop Hadoop Sqoop Hadoop HBase Hive Mahout Storm Twitter 2011 7 BackType Nathan Marz 9 17 Storm Hadoop Clojure Storm Lisp

Storm Spark 2009 Matei Zaharia AMP Lab 2010 Scala BSD 2013 Apache Apache2.0 2014 2 Cloudera Spark 2014 4 MapR Spark Apache Mahout MapReduce Spark 2014 11 Databricks Spark Spark Spark Apache Spark Spark Hadoop MapReduce 100 Spark 10 面對巨量資料時代的作為 McKinsey Global Institute 2013 2018 14 19 Linda Burtch 2014 SimplyHires.com Linkedin 24,000 36,000 Square 曾龍 2016 8 524 71