MATLAB 机器学习和深度学习技术 卓金武 MathWorks 中国 steven.zhuo@mathworks.cn 2015 The MathWorks, Inc. 1
内容提要 机器学习 何为机器学习 机器学习的常见问题 MATLAB 机器学习技术 Example 1: 设备测试式维护的实现 Example 2: 量化投资 深度学习 深度学习 Vs. 机器学习 深度学习的技术实现 Example 3: 图像识别 总结 2
机器学习的应用领域 图像识别 语音识别 股票预测 医学诊断 数据分析 机器人 等等 [TBD] 3
何为机器学习 机器学习是用数据产生一个用于执行一个任务的程序 任务 : 人类行为探测 Standard Approach Machine Learning Approach Compute r Program Machine Learnin g Hand Written Program If X_acc > 0.5 then SITTING If Y_acc < 4 and Z_acc > 5 then STANDING Formula or Equation Y activity = β 1 X acc + β 2 Y acc + β 3 Z acc + model: Inputs Outputs model = < Machine Learning >(sensor_data, activity) Algorithm 4
机器学习流程 加速计算 选择模型 数据 训练模型 预测 导入数据探索数据准备数据 现有数据 已知结果 模型 l 模型 新数据 预测结果 模型评估 5
机器学习算法分类 学习类型 算法类别 无监督 聚类 机器学习 Group and interpret data based only on input data 分类 有监督 Develop predictive model based on both input and output data 回归 6
无监督学习 k-means, Fuzzy C-Means Hierarchical 聚类 Neural Networks Gaussian Mixture Hidden Markov Model 7
有监督学习 回归 Neural Networks Decision Trees Ensemble Methods Non-linear Reg. (GLM, Logistic) Linear Regression 分类 Support Vector Machines Discriminant Analysis Naive Bayes Nearest Neighbor 8
案例 : 涡轮发动机的预测性维护 数据 : 数据取自 100 个同种型号发动机多个传感器的数据 工程背景 : 执行计划式维护 依然有故障发生 已收集了故障记录以及这些故障发生前的传感器的数据 能预测出故障还有多久就会发生吗 Data provided by NASA PCoE http://ti.arc.nasa.gov/tech/dash/pcoe/prognostic-data-repository/ 9
Live Historical 数据是如何记录的 Initial Use/ Prior Maintenance Recording Starts Failure Maintenance Engine1 Engine2 Engine100??? Engine200?? Time (Flights) 10
部署模型到产品中 MATLAB Coder MATLAB Compiler MATLAB Compiler SDK.exe.lib.dll MATLAB Runtime 11
效果演示 12
预测式维护的意义 增加可用时间和安全性 更可靠 降低维护成本 更经济 优化供应链管理 更出名 13
基于交易数据的量化择股 层次聚类结果相关程度图 目标 : 训练股票聚类和分类模型 500 1000 1.8 1.6 数据 : 股票交易数据 方法 : 提取有效特征 训练模型 用测试数据进行测试 数据点 1500 2000 2500 3000 3500 4000 4500 500 1000 1500 2000 2500 3000 3500 4000 4500 数据点 1.4 1.2 1 0.8 0.6 0.4 0.2 0 距离矩阵 :spearman 14
技术关键与结果 CPCC: 0.5406 1 0.9 距离 0.8 0.7 0.6 0.5 21111015172425 21828 7 8 6132230 1192312141627 326 920 4 529 数据点 股票的聚类结果 层次聚类 股票的分类模型 决策树 15
MATLAB 在机器学习方面的优势和劣势 Steps Challenge Solution 获取 探索 分析数据 预处理数据 训练模型 评估模型 反复 数据的多样性 缺乏专业工具 周期长 多种问题 : 过度拟合速度 - 精度 - 复杂度 扩展数据支持 signal, images, financial, Textual, geospatial, and several others formats 高质量数据预处理函数库 Industry-standard algorithms for Finance, Statistics, Signal, Image processing 可交互的 APP 操作流程 Focus on machine learning, not programing 集成的最佳实践 Model validation tools built into app Rich documentation with step by step guidance 灵活的架构更适合定制化的流程 Complete machine learning platform 16
内容提要 机器学习 何为机器学习 机器学习的常见问题 MATLAB 机器学习技术 Example 1: 设备测试式维护的实现 Example 2: 量化投资 深度学习 深度学习 Vs. 机器学习 深度学习的技术实现 Example 3: 图像识别 总结 17
深度学习 本质 : 通过构建多隐层的模型和海量训练数据, 来学习更有用的特征, 从而最终提升分类或预测的准确性 深度模型 是手段, 特征学习 是目的 18
深度学习 vs. 神经网络 神经网络 : 深度学习 : 19
案例 : 基于深度学习的图像识别 目标 : 训练深度学习机 方法 : 提取有效特征 训练深度学习模型 用测试数据进行测试 20
技术关键与结果 21
内容提要 机器学习 何为机器学习 机器学习的常见问题 MATLAB 机器学习技术 Example 1: 设备测试式维护的实现 Example 2: 量化投资 深度学习 深度学习 Vs. 机器学习 深度学习的技术实现 Example 3: 图像识别 总结 22
总结 机器学习的适应场景 : 规则和方程太复杂时 脸谱 语音 模式识别. 规则和模型市场变化时 欺诈检测 数据的特征市场变化并且程序需要适应这种变化时 自动交易 能耗预测 供水预测 深度学习的适应场景 : 规则和方程不容易表达, 并且一般机器学习方法效果不好时 股票预测 经济预测. 对准确度要求较高的大样本数据问题 指纹 图像识别.. 23
更多学习资源 帮助文档 : mathworks.com/machine-learning 24
问题与讨论 公司网页 : www.mathworks.cn 公司电话 : 010-59827000 答疑方式 : Steven.Zhuo@mathworks.cn 25
2016 The MathWorks, Inc. MATLAB and Simulink are registered trademarks of The MathWorks, Inc. See www.mathworks.com/trademarks for a list of additional trademarks. Other product or brand names may be trademarks or registered trademarks of their respective holders. 2015 The MathWorks, Inc. 26