Natural Neural Networks

Similar documents
附件4

2014 年 11 月 总 第 251 期 主 办 单 位 : 中 国 科 学 院 自 动 化 研 究 所 CONTENTS 中 国 科 学 院 自 动 化 研 究 所 所 刊 卷 首 语 赠 人 一 片 云 1 科 研 动 态 与 学 术 交 流 自 动 化 所 人 脸 识 别 技 术 在 首 届

<4D F736F F D20C9CFBAA3BFC6BCBCB4F3D1A7D0C5CFA2D1A7D4BA C4EAC7EFBCBEC8EBD1A7B2A9CABFD7CAB8F1BFBCCAD4CAB5CAA9CFB8D4F22D C8B7B6A8B8E5>

Microsoft PowerPoint - Aqua-Sim.pptx

2/80 2

. OER Watson Watson Artificial Neural Networks ANN MP Rosenblatt BP IBM Deep Blue CNN RNN IBM Watson Thomas J. Watson Watson IBM 2014 CNN C

附3

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

CH01.indd

untitled

从零构建支持向量机(SVM)

acl2017_linguistically-regularized-lstm-MinlieHuang

RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG Convolutiona

PK IBM Warren McCulloch Walter Pits MP 1949 Hebb Hebb Hebb 145

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

第壹章

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3)

國立中山大學學位論文典藏.PDF

Microsoft Word 谢雯雯.doc

數據分析 Big Data Analytics) ( 資科系 / 融系學碩班 ) 上課 綱 2019 年秋季班 上課期間 :2019/09/ /01/09 學資 科學系 jong at g.nccu.edu.tw 2019 年 數據分析 (Big Data Analytics

USAA Robert Welborn2015 pattern recognition natural language processing image recognitionhypothesis generation Saffron 7,000 88% IDC Dave Schubmehl 10

第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

Value Chain ~ (E-Business RD / Pre-Sales / Consultant) APS, Advanc

Microsoft Word htm

. 1 4 Web PAD

泰迪杯全国数据挖掘挑战赛 OCR (CNN) OCR() CNN % 92.1% 15% 90%. Viterbi. OCR..,,,,,

2011年南臺灣教育論壇

Journal of Northwestern Polytechnical University Apr. Vol No. 2 ICM ICM ICM ICM ICM ICM TP A

PowerPoint 演示文稿

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

Microsoft Word - 附章.doc

Microsoft Word - 附章.doc

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公

講 綱 一 職 涯 規 劃 決 定 自 己 的 人 生 二 認 識 國 家 考 試 三 年 新 制 措 施 四 報 考 類 科 如 何 決 定 五 如 何 準 備 國 家 考 試 六 嶺 東 科 大 輝 煌 成 果 七 參 加 國 家 考 試 程 序 八 考 試 資 訊 如 何 取

1 背 景 介 紹 許 多 應 用 科 學 牽 涉 到 從 資 料 (data) 中 分 析 出 所 需 要 ( 含 ) 的 資 訊 (information) 希 望 從 已 知 的 資 料 中 瞭 解 問 題 的 本 質, 進 而 能 控 制 或 做 出 預 測 這 些 資 料 通 常 有 兩

ltu

Improved Preimage Attacks on AES-like Hash Functions: Applications to Whirlpool and Grøstl

1 引言

CMOS线性响应测试

Microsoft Word - KSAE06-S0262.doc

(Microsoft Word - 001\253\312\255\261.doc)

标题

關 鍵 報 告 KEY POINT REPORT 4.0 3D App Massive Open Oline CoursesMOOCs 716 Steve Jobs Stay hungry, stay foolish 2

目 录 一 概 述... 2 二 虚 拟 型 赛 题 公 共 场 所 快 速 智 能 充 电 桩 ( 博 彦 科 技 ) 可 穿 戴 新 风 装 置 ( 博 彦 科 技 ) 互 联 网 + 智 慧 家 庭 ( 东 软 睿 道 )

江苏省高等学校

TI 3 TI TABLE 4 RANDBIN Research of Modern Basic Education

[1] [4] Chetverikov Lerch[8,12] LeaVis CAD Limas-Serafim[6,7] (multi-resolution pyramids) 2 n 2 n 2 2 (texture) (calf leather) (veins)

針灸治療膝關節疼痛綜述

致 谢 本 人 自 2008 年 6 月 从 上 海 外 国 语 大 学 毕 业 之 后, 于 2010 年 3 月 再 次 进 入 上 外, 非 常 有 幸 成 为 汉 语 国 际 教 育 专 业 的 研 究 生 回 顾 三 年 以 来 的 学 习 和 生 活, 顿 时 感 觉 这 段 时 间 也

清 华 大 学

系統功能語言的理論及其在國小國語讀寫教學的應用

東莞工商總會劉百樂中學

Microsoft Word - chnInfoPaper6

基于矩阵分解和矩阵变换的多义词向量研究

填 表 说 明 1. 本 表 用 钢 笔 填 写, 也 可 直 接 打 印, 不 要 以 剪 贴 代 填 字 迹 要 求 清 楚 工 整 2. 本 表 所 填 内 容 必 须 真 实 可 靠, 如 发 现 虚 假 信 息, 将 取 消 所 在 学 院 参 评 资 格 3. 本 表 涉 及 的 项 目

<4D F736F F D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>

业 务 与 运 营 社 交 网 络 行 为 将 对 网 络 流 量 造 成 较 大 影 响 3) 即 时 通 信 类 业 务 包 括 微 信 QQ 等, 该 类 业 务 属 于 典 型 的 小 数 据 包 业 务, 有 可 能 带 来 较 大 的 信 令 开 呼 叫 建 立 的 时 延 销 即 时

2006產業管理創新研討會論文格式說明

Thesis for the Master degree in Engineering Research on Negative Pressure Wave Simulation and Signal Processing of Fluid-Conveying Pipeline Leak Candi

word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra

第一章


硕 士 学 位 论 文 论 文 题 目 : 北 岛 诗 歌 创 作 的 双 重 困 境 专 业 名 称 : 中 国 现 当 代 文 学 研 究 方 向 : 中 国 新 诗 研 究 论 文 作 者 : 奚 荣 荣 指 导 老 师 : 姜 玉 琴 2014 年 12 月

声 明 本 人 郑 重 声 明 : 此 处 所 提 交 的 硕 士 学 位 论 文 基 于 等 级 工 鉴 定 的 远 程 考 试 系 统 客 户 端 开 发 与 实 现, 是 本 人 在 中 国 科 学 技 术 大 学 攻 读 硕 士 学 位 期 间, 在 导 师 指 导 下 进 行 的 研 究

研 究 院 将 其 智 慧 之 光 注 入 微 软 的 产 品 中, 院 长 寄 语 Foreword 通 过 不 断 创 新, 为 整 个 人 类 构 建 一 个 更 美 好 的 未 来 微 软 亚 洲 研 究 院 2012 年 4 月 第 22 期 总 第 53 期 早 春 之 畅 想 乍 暖

untitled

untitled

Microsoft PowerPoint - ATF2015.ppt [相容模式]

春 雷 新 雨 看 潮 生 2015 年 计 算 机 系 大 众 创 业 万 众 创 新 校 友 论 坛 创 业 新 锐 奖 颁 奖 孙 茂 松 为 罗 建 北 老 师 颁 发 创 业 伯 乐 奖 杨 士 强 为 本 科 生 超 新 星 工 作 室 颁 发 未 来 创 新 之 星 奖 杨 士 强 为

致 謝 在 研 究 所 這 段 期 間 受 到 了 許 多 人 的 幫 助, 才 有 今 日 我 創 作 及 論 文 的 樣 貌 首 先 我 要 謝 謝 我 的 爸 媽, 知 道 我 自 小 就 喜 歡 塗 塗 畫 畫, 高 中 開 始 為 了 準 備 考 美 術 系 而 每 日 下 課 後 往 畫

Microsoft PowerPoint - STU_EC_Ch08.ppt

簡報技巧

93碩簡章

m m m ~ mm

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

第一章 緒論

、審計稽察之成果

Master Thesis_專門用來製作目錄.doc

. 3. MOOC 2006 MOOC Automated Text Marker 2014 e-rater Yigal et al MOOC Coursera Edx 97

Microsoft Word (du)(改2)

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

的 開 銷, 請 務 必 先 和 家 裡 討 論 後 再 做 決 定 二 研 修 學 校 簡 介 卡 內 基 美 隆 大 學 (Carnegie Mellon University), 位 於 賓 州 匹 茲 堡 會 選 擇 來 這 裡 交 換, 我 相 信 大 部 分 的 人 都 已 經 知 道

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

Microsoft Word - 06会计学( ).doc

Presentation Title

投影片 1

USPTO Academic research Corporate needs Global/International Inventors Libraries News Media/Publication Patent Attorney or Agent USPTO e (ebusiness Ce

Microsoft Word - scribe_1_.doc

经华名家讲堂

《医学英语》教学大纲

提案二:各類補助提請追認案

JOURNAL OF DISTANCE EDUCATION International View [1] ( ) ; (NITRD) (Basic R&D) (Cross-cutting R&D Foundations) ( ) ( 1) (1) ;(2) ;(3) ;(4) ;(5)

摘 要 本 校 多 媒 體 設 計 系 與 上 海 戲 劇 學 院 創 意 學 院 在 多 次 聯 繫 交 流 之 下, 已 簽 署 合 作 備 忘 錄, 積 極 尋 求 兩 校 合 作 教 學 與 共 同 創 作 之 機 會 藉 由 本 系 學 生 作 品 腦 殘 公 寓 入 圍 第 五 屆 中

<4D F736F F F696E74202D20C8EDBCFEBCDCB9B9CAA6D1D0D0DEBDB2D7F92E707074>

untitled

PROFIBUS3.doc

幻灯片 1

Microsoft Word - ws-chp06輸入輸出notes.doc

Transcription:

深度学习讨论班 黄雷 2016-11-29

内容大纲 1. 深度学习介绍 神经网络的历史 深度学习的应用 2. 多层感知机 (multi-layer perceptron machine) 前向神经网络 (feedforward neural network) 3. 卷积神经网络 (Convolution neural networks) 4. 递归神经网络 (Recursive neural networks) 5. 利用神经网络的针对具体问题建模 如何设计损失函数 是否采用端到端学习 6. 训练神经网络的实用技巧 如何有效地训练 如何提高模型的泛化能力 深度学习知识层面 深度学习应用实践层面

课程的目标 1. 在知识层面 基本的术语 三类经典的神经网络 2. 应用实践层面 会针对具体的问题, 利用深度学习建模 编程实践, 基于 torch 平台 ( 深度学习平台 )

相关资料 深度学习课程 牛津大学,Nando de Freitas, https://www.cs.ox.ac.uk/people/nando.defreitas/ machinelearning/ Coursera, Geoffrey Hinton, Neural Network for Machine Learning 斯坦福大学,Fei-Fei Li,CS231

相关资料 领域顶级会议 ICLR (International Conference on Learning Representation ) ICML CVPR, ACL, IJCAI, AAAI.

相关资料 实验室 ftp: fileserver.nlsde.buaa.edu.cn/public/study/dee plearning/

Deep learning introduction Presented by Lei Huang November 29, 2016

Basic Concept Machine learning Neural network Deep network Outline History of neural network Perceptron BackPropagation Deep learning Application

Machine learning dataset D={X, Y} Goal Input: X Output: Y Learning: Y=F(X) or P(Y X) Automatically detect patterns in data Use the uncovered patters to predict future data Fitting and Generalization Y=F(X) P(Y X)

Types: view of data Machine learning Supervised Learning( 监督学习 ) D={X, Y} Learning: Y=F(X) or P(X,Y) Unsupervised Learning( 非监督学习 ) dataset D={X, X} Learning: X=F(g(X)), use G(x) as representation Types: view of models Non-parametric model ( 非参模型 ) Y=F(X; x 1, x 2 x n ) Parametric model( 参数化模型 ) Y=F(X; θ)

Neural network Neural network Y=F(X)=f T (f T 1 ( f 1 (X))) f i x = g(wx + b) Nonlinear activation sigmod Relu

Deep neural network Why deep? Powerful representation capacity( 函数表达能力 )

Key properties of Deep learning End to End learning ( 端到端学习 ) no distinction between feature extractor and classifier Deep architectures: cascade of simpler non-linear modules

Basic Concept Machine learning Neural network Deep network Outline History of neural network Perceptron BackPropagation Deep learning Application

The Perceptron 1957, Frank Rosenblatt, Perceptron( 感知机 ) Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

The Perceptron Source: Intelligence artificielle Yann Le cun, 2015-2016

AI Winter 1969, Minsky, perceptron XOR Two layers, computation impossible.

Conclusion for first phase Training by iteration Inference, calculate f(x) Compare the difference between the f(x) and y Adjust the weights. (gradient based) Source: Intelligence artificielle Yann Le cun, 2015-2016

Second: Back Propagation 1986, Backpropagation( 反向传播 ) Calculate gradient efficiently O(d^2) Routine of training Forward Back-propagation Update weights based on gradients

Beaten by SVM 1990s, Vapnik, support vector machines.( 支持向量机 ) y=f(wx+b) Globally optimization High efficiency, just one layer Loss function Function + loss Kernel trick for nonlinear

Third: deep learning 2006, Geoffery Hinton Deep Belief network Pre-training Fine-tuning

2011, audio Third: deep learning The task Hours of training data Deep neural network Gaussian Mixture Model GMM with more data Switchboard (Microsoft Research) English broadcast news (IBM) 309 18.5% 27.4% 18.6% (2000 hrs) 50 17.5% 18.8% Google voice search (android 4.1) 5,870 12.3% (and falling) 16.0% (>>5,870 hrs)

2012,imageNet. Third: deep learning

2012,imageNet. Third: deep learning

Why deep learning grow so fast? Big Data More Powerful and cheaper machine Open Source Code: git-hub Paper: arxiv Source: 程序员的深度学习入门指南费良宏, 2016

Basic Concept Machine learning Neural network Deep network Outline History of neural network Perceptron BackPropagation Deep learning Application

Object Classification Application

Object detection Application

Scene Parsing Application

Application Automatic Image Caption Generation

Application Artistic style learning on images

Application Automatically Adding Sounds To Silent Movies

Application Automatic Handwriting Generation

Application Automatic Text Generation Shakespeare Wikipedia articles (including the markup) Algebraic Geometry (with LaTeX markup) Linux Source Code http://karpathy.github.io/2015/05/21/rnn -effectiveness/

Alpha Go Application

Q&A