PowerPoint 演示文稿

Similar documents
RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG Convolutiona

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

Vol.39 No. 8 August 2017 Hyeonwoo Noh [4] boundng box PASCALV VOC PASCAL VOC Ctyscapes bt 8 bt 1 14 bt

Natural Neural Networks

COCO18-DensePose-BUPT-PRIV

Presentation Title

泰迪杯全国数据挖掘挑战赛 OCR (CNN) OCR() CNN % 92.1% 15% 90%. Viterbi. OCR..,,,,,

幻灯片 1

mvc

PowerPoint 演示文稿

Cube20S small, speedy, safe Eextremely modular Up to 64 modules per bus node Quick reaction time: up to 20 µs Cube20S A new Member of the Cube Family

untitled

Improved Preimage Attacks on AES-like Hash Functions: Applications to Whirlpool and Grøstl

清华大学2013年毕业生就业质量报告

untitled

01政治.doc

因 這 將 成 為 你 一 生 中 最 珍 貴 也 最 難 得 的 資 產 在 本 系 徐 主 任 積 極 努 力 安 排 之 下, 東 海 大 學 國 貿 系 與 南 京 大 學 國 貿 系 簽 定 交 換 計 畫, 系 上 開 放 四 個 名 額 到 南 京 大 學 進 行 為 期 一 學 期

CH01.indd

<4D F736F F D20C9CFBAA3BFC6BCBCB4F3D1A7D0C5CFA2D1A7D4BA C4EAC7EFBCBEC8EBD1A7B2A9CABFD7CAB8F1BFBCCAD4CAB5CAA9CFB8D4F22D C8B7B6A8B8E5>

PowerPoint 演示文稿

2/80 2

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

目次 

Microsoft Word - MWRF_Components.doc

101 年 全 國 高 職 學 生 實 務 專 題 製 作 競 賽 暨 成 果 展 報 告 書 題 目 :Beat CNN`s Report, 驚 艷 外 國 人 的 嘴 - 皮 蛋 之 大 改 造 指 導 老 師 : 林 佩 怡 參 賽 學 生 : 胡 雅 吟 楊 椀 惇 張 毓 津 許 巧 文

CC213

业 务 与 运 营 社 交 网 络 行 为 将 对 网 络 流 量 造 成 较 大 影 响 3) 即 时 通 信 类 业 务 包 括 微 信 QQ 等, 该 类 业 务 属 于 典 型 的 小 数 据 包 业 务, 有 可 能 带 来 较 大 的 信 令 开 呼 叫 建 立 的 时 延 销 即 时

第一章

Gerolor Motors Series Dimensions A,B C T L L G1/2 M8 G1/ A 4 C H4 E

Gerotor Motors Series Dimensions A,B C T L L G1/2 M G1/ A 4 C H4 E

12 13 記得我 小文哭了 她在騎樓下哭得傷心 她胖胖的身體與黝黑的肌膚全因身體的顫動 不住地收縮著 好 像要把自己縮成到別人看不見的大小 就能夠不哭了 就能夠跑到沒有人知道的地方 她站在別人家公寓的門口 數個信箱口全塞上了廣告傳單 冬天的氣溫在清晨甫過後沒多久才漸漸 地回暖 還是有點冷 她的臉頰

(Microsoft Word - \244\345\266\260\244C_\247\363\267s_.doc)

CSO019 ( 問 題 編 號 : 2166) 綱 領 : (1) 效 率 促 進 組,,(3) 政 務 司 司 長 辦 公 室 - 行 政 署,(4) 禮 賓 處 管 制 人 員 : ( 蔡 潔 如 女 士 ) 請 以 表 列 方 式 告 知 本 會 有 關 以 下 項 目 年

Microsoft PowerPoint - Sens-Tech WCNDT [兼容模式]

y 1 = 槡 P 1 1h T 1 1f 1 s 1 + 槡 P 1 2g T 1 2 interference 2f 2 s y 2 = 槡 P 2 2h T 2 2f 2 s 2 + 槡 P 2 1g T 2 1 interference 1f 1 s + n n

audiogram3 Owners Manual

untitled

Microsoft PowerPoint Zhang Guohua.ppt [Compatibility Mode]

MATLAB 1

acl2017_linguistically-regularized-lstm-MinlieHuang

Epson

幻灯片 1

14 建筑环境设计模拟分析软件DeST--辅助商业建筑设计应用实例.doc

在 应 用 实 践 上 指 导 性 建 议 ( 黄 白,2008) 近 几 年 来, 国 家 政 府 在 教 育 方 面 高 度 重 视 教 育 信 息 化 工 作, 相 继 出 台 一 系 列 政 策 文 件 和 规 范 来 促 进 和 推 动 信 息 技 术 在 教 育 教 学 领 域 的 广

经济学基础 Essentials of Economics

中北大学常规事项财务报销操作指南

RAGE来咯!关于 ID TECH 5 MEGATEXTURE 的一些技术信息更新

C C C The Most Beautiful Language and Most Dangerous Language in the Programming World! C 2 C C C 4 C Project 30 C Project 3 60 Project 40

作 業 系 統 簡 介 光 有 電 腦 硬 體, 會 不 容 易 使 用 必 須 要 有 適 當 的 程 式, 才 方 便 操 作 硬 體 衍 生 作 業 系 統 需 求 : 提 供 方 便 使 用 者 執 行 程 式 平 台 有 效 使 用 各 種 電 腦 硬 體 資 源 Jingo C. Lia

Microsoft Word - 澎湖田調報告_璉謙組.doc

<4D F736F F F696E74202D20332D322E432B2BC3E6CFF2B6D4CFF3B3CCD0F2C9E8BCC6A1AAD6D8D4D8A1A2BCCCB3D0A1A2B6E0CCACBACDBEDBBACF2E707074>

热设计网

閱 讀 素 材 V.S 分 組 方 式 的 差 異 化 教 學 工 具 表 班 級 :( ) 閱 讀 素 材 V.S 分 組 方 式 獨 立 閱 讀 夥 伴 閱 讀 ( 同 質 性 ) 夥 伴 閱 讀 ( 異 質 性 ) 友 善 陪 伴 虛 心 受 教 國 語 日 報 新 聞 生 活 文 藝 兒 童

Microsoft Word - 1HF12序.doc

Microsoft Word - 讀報看科普─人體篇_橫_.doc

Microsoft Word - 2B802內文.doc

鍟嗗搧瑙傚療鈥㈤挗鏉

席 远 杨 一 人 了, 正 当 她 开 枪 时 却 发 现 子 弹 没 了 该 死, 只 能 赤 手 空 拳 了 洛 水 云 与 席 远 杨 交 起 手 来, 洛 水 云 出 手 招 招 致 命 想 那 席 远 杨 也 不 是 泛 泛 之 辈, 很 快 掌 握 了 洛 水 云 出 招 路 数 看

東區校園中法治教育種子師資教學研習營

Master Thesis_專門用來製作目錄.doc

接线端子--Connectors规格书.doc

汇集全球21位医生的经验和智慧,总结出最实用的专业建议,这些都是最值得你牢记的健康提醒

1 行 业 发 展 不 平 衡 我 国 房 地 产 中 介 服 务 业 起 步 较 晚, 专 业 分 工 程 度 和 国 外 发 达 国 家 相 比 还 有 很 大 差 距 房 地 产 中 介 服 务 行 业 的 发 展 水 平 与 房 地 产 开 发 行 业 的 市 场 化 水 平 密 切 相 关

1 C++ 2 Bjarne Stroustrup C++ (system programming) 6 (infrastructure) C++ 7 Herb Sutter 8 C++ (efficiency) (flexibility) 9 (abstraction) (productivity

enews174_2

McGraw-Hill School Education Group Physics : Principles and Problems G S 24

由社會發展趨勢探討國人睡眠品質

RF & MICROWAVE COMPONENTS

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

Microsoft PowerPoint - Performance Analysis of Video Streaming over LTE using.pptx

Microsoft Word - A _ doc

施叔青傳排版檔.indd

篇首语

计算机网络

【附件:社群─申請表】(社群層級) 【四-四-五-1】

Microsoft PowerPoint - L17_Inheritance_v4.pptx


Microsoft PowerPoint - Aqua-Sim.pptx

输电线路智能监测系统通信技术应用研究

PowerPoint Presentation

Microsoft Word - LD5515_5V1.5A-DB-01 Demo Board Manual

untitled

上海浦~1

(Pattern Recognition) 1 1. CCD

计 算 机 系 统 应 用 年 第 25 卷 第 4 期 线 程 的 复 用 [2,3]. 通 常 情 况 下, 服 务 器 端 程 序 在 启 动 时 创 建 若 干 数 量 的 线 程 对 象 并 缓 存 起 来, 此 时 它 们 处 于

Vol. 22 No. 2 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Apr ,,,,, Apriori,,,,,,,,

基于矩阵分解和矩阵变换的多义词向量研究

各 级 领 导 及 世 界 技 能 组 织 主 席 西 蒙 巴 特 利 参 观 深 圳 技 师 学 院 高 技 能 人 才 培 养 模 式 和 课 程 改 革 创 新 成 果 展 人 力 资 源 和 社 会 保 障 部 职 业 能 力 建 设 司 司 长 吴 道 槐 中 国 职 工 教 育 和 职

r_09hr_practical_guide_kor.pdf


IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

,, 2,,,,,,,,, S7-400 PLC, F M mm ;, AGC 6 mm ;,, 3 AGC AFC ( ) ( ), I/O ET 200M, PROFIBUS-DP S7 400 PLC 1 S7-400 PLC ( HMI) ET200M, PROFIBUS

Vol. 22 No. 4 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Aug GPS,,, : km, 2. 51, , ; ; ; ; DOI: 10.

Chapter 9: Objects and Classes

[1] Nielsen [2]. Richardson [3] Baldock [4] 0.22 mm 0.32 mm Richardson Zaki. [5-6] mm [7] 1 mm. [8] [9] 5 mm 50 mm [10] [11] [12] -- 40% 50%

QUESTION BANK UPDATED FOR STUDENT ONLY.xls

scope_d2d2.pdf

凱絡媒體週報 Carat Media Weekly Newsletter

凱絡媒體週報 Carat Media Weekly Newsletter

凱絡媒體週報 Carat Media Weekly Newsletter

Transcription:

深度学习在移动端的 优化实践 黄文波 ( 鬼谷 ) 美丽联合集团

集团简介 美丽联合集团是专注服务女性的时尚消费平台, 成立于 2016 年 6 月 15 日 美丽联合集团旗下包括 : 蘑菇街 美丽说 uni 锐鲨 MOGU STATION 等产品与服务 覆盖时尚消费的各个领域, 满足不同年龄层 消费力和审美品位的女性用户日常时尚资讯与时尚消费所需

整体数据 时尚红人 120,000+ 日活用户 10,000,000+ 女性用户占比 95%+ 注册用户数 200,000,000+ 成交规模 20,000,000,000+ 移动用户占比 95%+

主要内容 背景与现状模型压缩与设计移动端实践总结

01 背景及现状

深度学习 : 从云端到边缘计算

蘑菇街为什么做深度学习优化? 服务器 减少训练 预测的时间 节约 GPU 资源, 节约电 移动端 实时响应需求 本地化运行, 减少服务器压力 保护用户隐私

CNN 基础

CNN 基础

Challenge 深度学习 : 网络越来越深, 准确率越来越高 模型越来越大 越多的存储和 计算 耗费越多能量 移动设备 : 内存有限 计算性能有限 功耗有限

02 模型压缩与设计

Model Compression Pruning Quantization Huffman Encoding

Pruning Weight-Level Pruning for the sparse connections Han et al, Learning both weights and connections for efficient neural networks, NIPS 2015

Pruning Channel-Level Pruning and retraining iteratively Li et al, Pruning filter for efficient convnets, ICLR 2017

Pruning Channel-Level Pruning with L1 regularization Liu et al, Learning efficient convolutional networks through network slimming, ICCV 2017

Quantization Han et al, Deep Compression: Compressing deep neural networks with pruning, trained quantization and huffman coding,

Huffman Encoding Han et al, Deep Compression: Compressing deep neural networks with pruning, trained quantization and huffman coding,

Summary of model compression Pruning: less number of channels channel-level pruning and retraining iteratively channel-level pruning with L1 regularization

Smaller CNNs architecture design SqueezeNet MobileNet ShuffleNet

SqueezeNet Input 64 1x1 Conv Squeeze 16 1x1 Conv Expand 3x3 Conv Expand 64 64 Output Concat/Eltwis e 128 Iandola et al, SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and < 0.5MB model size, arxiv 2016

MobileNets Howard et al, MobileNets: Efficient convolutional neural networks for mobile vision applications, arxiv

ShuffleNet Zhang et al, ShuffleNet: An extremely efficient convolutional neural network for mobile devices, arxiv 2017

Our practice Overall Performance of Pruning ResNet50 on ImageNet Model strategy Top-1 Top-5 Model Size Original - 75% 92.27% 98M Pruned-50 Pruning 72.5% 90.9% 49M Pruned-Q-50 Pruning + Quantization 72.4% 90.6% 15M

Our practice Performance of Pruning ResNet-34 on Our Dataset Model Top-1 Top-5 Inference Time Model Size Original 48.92% 82.2% 96ms 86M Pruned-64 48.27% 81.5% 45ms 31M (2319 categories, 1200W samples)

Our practice ParseNet 18 类 ( 基础网络 :MobileNet) Model miou Pixel-Level- Accuracy Model Size ParseNet 56% 93.5% 13M

03 移动端工程实践

移动端服务端分工 Training Inference

DL frameworks Caffe Caffe2 MXNet Tensorflow Torch. NCNN MDL CoreML Tensorflow Lite

From training to inference Convolution BN Convolution Relu

优化卷积计算 25*9 9*1 Direct convolution im2col-based convolution

优化卷积计算 Cho et al, MEC: Memory-efficient convolution for deep neural network,

浮点运算定点化 Input(float) Min Max Quantize 8 Bit Min Max QuantizedRelu 8 Bit Min Max Dequantize Output(float)

卷积计算还能怎么进化? 再牛逼的优化算法, 都不如硬件实现来得直接 通用卷积 VS 特定卷积

Android 端深度学习框架 NCNN vs MDL FrameWork 单线程四线程内存 NCNN 370ms 200ms 25M MDL 360ms 190ms 30M MobileNet on HuaweiP9 Tensorflow Lite Quantize MobileNet 85ms Float Mobilenet 400ms

ios 上的 DL CoreM L 可扩展性不强, 不适合部署新算法 ; 需要 ios 11+

MPSCNN 充分利用 GPU 资源, 不用抢占 CPU 利用 Metal 开发新的层很方便 Tips: 半精度计算 ; 权重存储格式为 NHWC

MPSCNN Slice1 Slice2 Slice0 MPSImage The layout of a 9-channel CNN image with a width of 3 and a height of 2.

Metal Performance Shader kernel void eltwisesum_array( texture2d_array<half, access::sample> intexture1 [[texture(0)]], texture2d_array<half, access::sample> intexture2 [[texture(1)]], texture2d_array<half, access::write> outtexture [[texture(2)]], ushort3 gid [[thread_position_in_grid]]) { if (gid.x >= outtexture.get_width() gid.y >= outtexture.get_height() gid.z >= outtexture.get_array_size()) return; constexpr sampler s(coord::pixel, filter::nearest, address::clamp_to_zero); const ushort2 pos = gid.xy; const ushort slice = gid.z; half4 in[2]; in[0] = intexture1.sample(s, float2(pos.x, pos.y), slice); in[1] = intexture2.sample(s, float2(pos.x, pos.y), slice); float4 out = float4(0.0f); out =float4( in[0]+in[1]); outtexture.write(half4(out), gid.xy, gid.z); }

MPSCNN VS NCNN on iphone FrameWork Time NCNN 110ms MPSCNN 45ms Device: iphone 6s

How to create a new framework 优化 inference 网络结构 多线程 GPU 加速 指令集加速 内存布局优化 NCHW >NHWC 浮点运算定点化

Mogu Deep Learning Toolkit For professional Highly Flexible Mogu DL Toolkit High Cohesion & Low Coupling Easy to use

Mogu Deep Learning Toolkit Classification Detection Create layer Init layer Inferenc e Segmentation

Mogu DL Toolkit-Example class MobileNet{ public: Input input; Convolution fc7; MobileNet int Init(const char* modelpath); int infer(mat &input,mat &output); private: Convolution conv1_s2; ReLU relu1; ConvolutionDepthWise conv2_1_dw; ReLU relu2_1_dw; Convolution conv2_1_s1; ReLU relu2_1_s1; ConvolutionDepthWise conv2_2_dw;. }

Demo

Demo

总结 模型压缩的两类方式 移动端优化实践 Mogu DL Toolkit 深度学习优化在蘑菇街业务中的尝试

致谢 感谢蘑菇街图像算法部门深度学习优化小组全体成员的 共同努力!!

Thanks!

敬请关注 蘑菇街技术博客 公众号 敬请关注 美丽联合数据技术 公众号