PowerPoint Presentation

Similar documents
PowerPoint 演示文稿

Seagate_Dashboard_UG.book

目 录 简 介.3 ` 体 系 结 构...4 数 据 层...5 数 据 连 接 器...6 Tableau Server 组 件...7 网 关 / 负 载 平 衡 器...8 客 户 端 :Web 浏 览 器 和 移 动 应 用 程 序...8 客 户 端 :Tableau Desktop..

2Office 365 Microsoft Office 365 Microsoft Office Microsoft Office Microsoft Office 365 Office (Office Web Apps) Office WindowsMAC OS Office 365 Offic

二 智 慧 財 產 權 宣 導 資 料 三 世 新 大 學 導 師 制 度 實 施 辦 法..37 四 導 生 ( 守 護 神 ) 系 統 使 用 面 說 明 世 新 大 學 推 動 紫 錐 花 運 動 宣 導 資 料. 41 世 新 大 學 無 菸 校 園 實 施 辦

水晶分析师

Cisco WebEx Meetings Server 2.6 版常见问题解答

PowerPoint 演示文稿

Wireless Plus.book


Avigilon Control Center 6 ACC High Definition Stream Management (HDSM) ACC 6 ( Avigilon Appearance Search ) Avigilon Appearance Search ACC NVR HD Vide

PowerPoint Presentation

Azure_s

二 智 慧 財 產 權 宣 導 資 料 三 世 新 大 學 導 師 制 度 實 施 辦 法..36 四 導 生 ( 守 護 神 ) 系 統 使 用 畫 面 說 明 世 新 大 學 紫 錐 花 運 動 宣 導 資 料. 42 世 新 大 學 無 菸 校 園 實 施 辦 法. 4

A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内

第 02 期 1 医 疗 信 息 现 状 20% EMR Electronic Medical Record HIS HIS [1-2] 张 肖 等 : 基 于 大 数 据 的 医 疗 健 康 创 新 应 用 2 大 数 据 环 境 下 医 疗 数 据 特 征 分 析 PC [3]

Reducing Client Incidents through Big Data Predictive Analytics

Microsoft Word - UCBrowser_User_Agent.docx

PowerPoint 演示文稿

宁夏专业技术人员服务平台

<%DOC NAME%> User Manual

epub83-1


产品手册

Wireless Plus.book

Contents Viewpoint Application Story 05 News & Events 06 Technology Forum Customer Partnership Cover Story Advisory Board Inside Advantech Beautiful L

IT Data-intensive application,iscsi Middl

合集

温州市政府分散采购

untitled

ebook204-2

看 数 据, 在 人 群 中 找 到 自 己 2015 年 有 749 万 本 科 毕 业 生 估 算 全 国 985 高 校 毕 业 生 人 数 : 约 17 万 占 毕 业 生 人 数 的 2.26%; 估 算 全 国 一 本 高 校 毕 业 生 人 数 : 约 万, 占 毕 业

<4D F736F F D203120BBA5C1AACDF8BBF9B4A1B1EAD7BC2E646F63>

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

RPC SOAP REST API API HTTP JSON XML PHP PHP PHP PHP PHP HTTP request/response cycle HTTP HTTP verbs headers Cookies JSON XML PHP RPC SOAP RESTful HTTP


epub 61-2

6-1 Table Column Data Type Row Record 1. DBMS 2. DBMS MySQL Microsoft Access SQL Server Oracle 3. ODBC SQL 1. Structured Query Language 2. IBM

目 录 目 录 平 台 概 述 技 术 架 构 技 术 特 点 基 于 统 一 平 台 的 多 产 品 线 支 撑 先 进 性 安 全 性 开 放 性 高 性 能 和

PowerPoint Presentation

GoFlex Home UG Book.book

ebook37-11

<4D F736F F D20312D3120D5D0B9C9CBB5C3F7CAE9A3A8C9CFBBE1B8E5A3A92E646F63>

Windows-10-volume-licensing-guide-tw.pdf

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

目錄

1 SQL Server 2005 SQL Server Microsoft Windows Server 2003NTFS NTFS SQL Server 2000 Randy Dyess DBA SQL Server SQL Server DBA SQL Server SQL Se

第一章.FIT)

大 綱 最 有 利 標 目 的 及 類 型 最 有 利 標 之 辦 理 方 式 準 用 最 有 利 標 取 最 有 利 標 精 神 最 有 利 標 之 類 型 及 其 相 關 規 定 適 用 最 有 利 標 準 用 最 有 利 標 及 取 最 有 利 標 精 神 作 業 程 序 及 實 務 分 析

通过userAgent判断手机浏览器类型

Microsoft Word - connect_pro_7_release_notes_v3_handoff_to_loc.doc

untitled

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的


PowerPoint Presentation

cosa Quick Start Manual

CH01.indd

F4

Microsoft Word - SPEC

(DMO) 1 1 Microsoft Windows SQL Server 2005 SQL Server Analysis ServicesNotification Services SQL Server 8 SQL Server IP SQL Server 2005 SQL Server 20

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

Value Chain ~ (E-Business RD / Pre-Sales / Consultant) APS, Advanc

软件概述

User Guide

Connected Intelligence:ビッグデータ技術を活用したIT運用

目录

<4D F736F F D20B5E7D7D3C9CCCEF1D7A8D2B5C5E0D1F8B7BDB0B8D0DEB6C1D6B8C4CFA3A BCB6A3A92E646F63>

TopTest_Adminstrator.doc

DocHdl2OnPPMtmpTarget

PowerPoint 簡報

PowerPoint Presentation

SiteView技术白皮书

北京光环新网科技股份有限公司2016年半年度报告全文

PowerPoint Presentation

PowerPoint Presentation

Microsoft Word SRS - 軟體需求規格.doc

1.1 OfficeScan OfficeScan V5.02 SOP OfficeScan HTTP-based Windows NT/Windows Intel Pentium II 233 MHz 64 MB 200 MB 640 x Wi

) ( ) ( ) ( ) 1. ( ) (1) ( ) End-to- End ( ) ( ) ( ) ( PayPass Paywave Jspeedy) (FISC II) (2) / NFC (Near Field Communication) ( ) NFC TS

untitled

final

untitled

秘密

E11701


<4D F736F F D D342DA57CA7DEA447B14D2DA475B57BBB50BADEB27AC3FEB14DA447B8D5C344>


第二部分 成果简介

untitled

HP 3PAR StoreServ 7000 Storage SmartStart 1.3 软件发行说明

The New Office Office 365 Office 2013 Project 2013 Visio 2013 Office 2013

PowerPoint Presentation

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

消 息 報 導 專 業 證 照 - 照 過 來 施 淑 寶 圖 書 館 為 執 行 本 校 企 業 夥 伴 型 大 學 願 景, 讓 畢 業 生 可 以 順 利 進 入 職 場, 圖 書 館 參 與 教 學 卓 越 計 畫 成 立 專 業 證 照 區, 提 供 學 生 專 業 證 照 教 材 題 庫

目 录 第 五 部 分 第 六 部 分 第 七 部 分 第 八 部 分 投 标 邀 请 投 标 人 须 知 附 表 评 标 方 法 和 评 分 细 则 项 目 需 求 和 技 术 方 案 要 求 1

Internet Explorer 10

ii Vue Bootstrap 4 ES 6 Vue Vue Bootstrap 4 ES 6 Vue 2 vue html vue html vue Vue HTML 5 CSS ES 6 HTML 5 CSS Visual Studio Code h

<4D F736F F F696E74202D20A46ABCC6BEDAA662AAABC170BAF4BB50BCC6A6ECBBC8A6E6A4A7C0B3A5CE5F763137>

UDP 8.2 TCP/IP OSI OSI 3 OSI TCP/IP IP TCP/IP TCP/IP Transport Control Protocol TCP User Datagram Protocol UDP TCP TCP/IP IP TCP TCP/IP TC


浙江师范大学2014年度毕业生就业质量报告

Transcription:

使用 Amazon Kinesis Firehose 和 Amazon Redshift 进行数据流分析 李君,AWS 高级技术讲师 Amy Li, Technical Trainer, Amazon Web Services

今日议程 AWS 上大数据应用体系介绍 Amazon Kinesis Firehose & Amazon Redshift 一起动手搭建日志分析流处理解决方案 Q & A Step 1: 建立 Redshift 集群和表 Step 2: 创建 Firehose Delivery Stream, 并且配置数据转换 Step 3: 发送数据给 Firehose Delivery Stream Step 4: 查询和分析 Redshift 中的数据 Step 5: 监控流数据处理

大数据的特点 Variety 多样 Value Velocity 高速 价值 Volume 海量

大数据管道 "Pipeline" 数据 收集 处理 分析 展现 洞见 存储 应答时间 ( 延迟 ) - 吞吐量和成本的平衡

AWS 大数据应用体系 收集 存储 处理 分析 展现 Near Real-time Amazon Kinesis Firehose Data Import Amazon Import/Export Snowball Message Queuing Amazon SQS Web/app Servers Amazon EC2 Object Storage Amazon S3 Amazon Glacier Near Real-time Amazon Kinesis Streams RDBMS Amazon RDS NoSQL DynamoDB Hadoop Ecosystem Amazon EMR Near Real-time AWS Lambda Amazon Kinesis Analytics Data Warehousing Amazon Redshift Machine Learning Amazon Machine Learning Business Intelligence and Data Visualization Amazon QuickSight Elastic Search Analytics Amazon Elasticsearch Service Search Amazon CloudSearch Elastic Search Analytics Amazon Elasticsearch Service Internet of Things (IoT) Amazon IoT Process and Move Data AWS Data Pipeline Ad Hoc Analytics Amazon Athena

数据处理面临哪些挑战?

大部分数据是持续产生的 [Wed Oct 11 14:32:52 2000] [error] [client 127.0.0.1] client denied by server configuration: /export/home/live/ap/ht docs/test 移动端应用网页点击流应用程序日志 测量记录 IoT 传感器智能建筑

数据价值递减曲线 最近的数据非常有价值 如果你及时采取行动 转瞬即逝的洞察力 (M. Gualtieri, Forrester) 旧的 + 最近的数据更有价值 如果你有办法将他们结合起来

数据处理速度是关键 批处理 流处理 每小时日志收集每周 每月的账单每日用户访问数据每日金融欺诈报告 应用系统实时指标此时此刻哪里出了问题? 实时消费预警 / 封顶防止大手大脚实时点击流分析现在能为用户做点啥? 实时监测屏蔽可能欺诈的使用

Amazon Kinesis 接收流数据 实时处理数据 每小时储存数 TB 的数据

Amazon Kinesis Streams

Amazon Kinesis Streams 易于管理 : 创建流 设置初始分片数量, 之后动态扩展或缩减分片数量以匹配你的数据吞吐量 构建实时应用程序 : 使用 Kinesis Client Library (KCL), Apache Spark/Storm, AWS Lambda,... 等构建数据使用者应用程序 费用低廉 : 任何规模的工作负载都具有成本效益

AWS Endpoint Amazon Kinesis 流处理基本架构 Data Sources Data Sources Availability Zone Availability Zone Availability Zone App.1 [Aggregate & De-Duplicate] App.2 Data Sources Shard 1 Shard 2 Shard N [Metric Extraction] Data Sources App.3 [Sliding Window Analysis] Data Sources App.4 [Machine Learning]

Amazon Kinesis Firehose

AWS endpoint Amazon Kinesis Firehose Data sources Data sources Amazon S3 Data sources No Partition Keys No Provisioning End-to-End Elastic Data sources Amazon Redshift Data sources Amazon Elasticsearch Service

Kinesis Firehose 主要概念 Delivery Stream:Kinesis Firehose 的基础实体 ; 通过创建 delivery stream 并向其发送数据来使用 Kinesis Firehose Record: 从 Producer 发送到 delivery stream 的数据 缓冲区大小和缓冲间隔 : Kinesis Firehose 先缓存特定大小或特定时长的传入数据, 然后将它们发送到目标 Buffer Size 的单位是 MB;Buffer Interval 的单位是秒记录最大可达 1000 KB

Firehose 数据流到 S3

Firehose 数据流到 Redshift

Firehose 数据流到 Elasticsearch

Kinesis Firehose: 数据输入 AWS SDK PutRecord() PutRecordBatch() Kinesis Agent 持续监控文件, 并将新数据发送到 Firehose delivery stream 处理文件轮换 检查点操作并在失败时重试 具备格式转换和日志分析等与数据预处理能力 发送 Amazon CloudWatch 指标, 以便监控流处理过程并排除故障

Kinesis Firehose: 数据变换 Kinesis Firehose AWS Lambda 异步调用 Lambda

Amazon Redshift PB 级数据仓库 MPP 架构 完全托管, 树分钟内完成预置 内置安全性

一起动手搭建日志分析流处理 解决方案

Step 1: 建立 Redshift 集群和表

连接到 Redshift 数据库

创建数据表

Step 2: 创建 Firehose Delivery Stream, 并配置数据转换

Step 3: 发送数据给 Firehose Delivery Stream

Sample Data 219.134.32.117 - - [16/Feb/2017:09:38:20-0800] "GET /wp-content HTTP/1.1" 200 4521 "-" "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/5.1;.NET CLR 3.8.23015.5)" 95.169.41.62 - - [16/Feb/2017:09:38:20-0800] "PUT /app/main/posts HTTP/1.1" 200 3883 "-" "Mozilla/5.0 (Windows NT 6.2; Trident/7.0; rv:11.0) like Gecko" 221.147.191.247 - - [16/Feb/2017:09:38:20-0800] "GET /explore HTTP/1.1" 200 6579 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1) AppleWebKit/538.0.1 (KHTML, like Gecko) Chrome/38.0.895.0 Safari/538.0.1" 179.96.123.130 - - [16/Feb/2017:09:38:20-0800] "GET /list HTTP/1.1" 200 560 "-" "Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:5.4) Gecko/20100101 Firefox/5.4.6" 132.119.12.76 - - [16/Feb/2017:09:38:20-0800] "PUT /explore HTTP/1.1" 200 3131 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_0 rv:5.0; AZ) AppleWebKit/535.1.0 (KHTML, like Gecko) Version/4.0.3 Safari/535.1.0" 74.113.56.92 - - [16/Feb/2017:09:38:20-0800] "DELETE /app/main/posts HTTP/1.1" 200 7069 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_9) AppleWebKit/532.1.0 (KHTML, like Gecko) Chrome/15.0.877.0 Safari/532.1.0"

After Data Transformation {"host":"26.56.11.130","ident":"-","authuser":"-","request":"get /wp-content HTTP/1.1","response":200,"bytes":4582,"verb":"GET","@timestamp":"2017-04- 04T11:32:29.000Z","timezone":"-0700","@timestamp_utc":"2017-04-04T18:32:29.000Z"} {"host":"180.153.215.216","ident":"-","authuser":"-","request":"put /search/tag/list HTTP/1.1","response":200,"bytes":1461,"verb":"PUT","@timestamp":"2017-04- 04T11:32:29.000Z","timezone":"-0700","@timestamp_utc":"2017-04-04T18:32:29.000Z"} {"host":"155.233.163.37","ident":"-","authuser":"-","request":"get /explore HTTP/1.1","response":500,"bytes":326,"verb":"GET","@timestamp":"2017-04- 04T11:32:29.000Z","timezone":"-0700","@timestamp_utc":"2017-04-04T18:32:29.000Z"} {"host":"189.176.106.5","ident":"-","authuser":"-","request":"post /search/tag/list HTTP/1.1","response":200,"bytes":3059,"verb":"POST","@timestamp":"2017-04- 04T11:32:29.000Z","timezone":"-0700","@timestamp_utc":"2017-04-04T18:32:29.000Z"}

Step 4: 查询和分析 Redshift 中的数据 Step 5: 监控流数据处理

课程总结 AWS 上大数据应用体系介绍大数据处理面临的挑战 Amazon Kinesis Firehose & Amazon Redshift 演示 : 快速构建 Apache 日志实时处理分析的解决方案然后呢?

AWS 培训与认证路径图

谢谢大家欢迎提问 aws.amazon.com/training aws.amazon.com/certification AWS 高级培训讲师 - 李君 amyli@amazon.com