PowerPoint Presentation

Similar documents
(Microsoft Word - 11\244T\246\342\277\337\260l\302\334.doc)


2001年博士、硕士研究生招生计划表

第一章 系统概述

xueshu004.doc

团 学 要 闻 我 校 召 开 共 青 团 五 届 九 次 全 委 ( 扩 大 ) 会 议 3 月 17 日, 我 校 共 青 团 五 届 九 次 全 委 ( 扩 大 ) 会 议 在 行 政 办 公 楼 五 楼 会 议 室 举 行, 校 团 委 委 员 各 院 ( 系 ) 团 委 书 记 校 学 生

田野實習-律師事務所實習報告

Review

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI


SPA Menu-CN

PowerPoint 演示文稿

5B_sasaki.pdf

USPTO Academic research Corporate needs Global/International Inventors Libraries News Media/Publication Patent Attorney or Agent USPTO e (ebusiness Ce

IBM SPSS Modeler 14.2 建模节点

( Version 0.4 ) 1

一、 本小組所擬工業合作計畫回饋金原則(草案)已送請工業局知服組核辦中

User ID 150 Password - User ID 150 Password Mon- Cam-- Invalid Terminal Mode No User Terminal Mode No User Mon- Cam-- 2

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的

Microsoft Word - social welfare in China.doc

「人名權威檔」資料庫欄位建置表

一 公 司 特 殊 问 题 问 题 1 关 于 公 司 的 业 务 及 持 续 经 营 能 力 2013 年 度 2014 年 度 2015 年 1-11 月, 公 司 的 营 业 收 入 分 别 为 1,630, 元 699, 元 73, 元 报 告 期 内,

PowerPoint Presentation

國家圖書館典藏電子全文

Process Data flow Data store External entity 6-10 Context diagram Level 0 diagram Level 1 diagram Level 2 diagram

:,,,,,,, ( CIP) /,. :, ISBN :. F CIP ( 2002) : : * : : : : 174 ( A ) : : ( 023)

<4D F736F F D20BBB3BBAFD1A7D4BA C4EAB1CFD2B5C9FABECDD2B5D6CAC1BFB1A8B8E62E646F63>

untitled

ESET Mobile Security for Android

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

目錄

PowerPoint Presentation

第一部分:前言

ChinaBI企业会员服务- BI企业

管理心理学(七)

池州学院文件

Bluemix 从概念到应用CN改

the southern city was higher than that in the northern city. In rural areas the proportion of the nuclear family in the northern region was higher tha

Microsoft Word - 議題三~1

从《动物福,本网站受美国法律保护 利法》看美国的动物保护——萧冰

<4D F736F F D20B9DDBFAFB5DACAAEC6DA5FB6A8B8E5B0E65F2E646F63>

JCR... 3 JCR... 3 ISI Web of Knowledge... 4 Cross Search... 5 Cross Search... 5 Cross Search ISI Web of Knowledge WOS... 8 Externa


<4D F736F F D20B9FABCD2BBFAB9D8B0ECB9ABBDA8D6FEBACDB4F3D0CDB9ABB9B2BDA8D6FEC4DCBAC4BCE0B2E2CFB5CDB3C8EDBCFEBFAAB7A2D6B8B5BCCBB5C3F7CAE92E646F63>

Preparing_Seminar

中国期刊刊名索引_修10.08_.doc

Microsoft Word - sp03_02.doc

呐喊

92_國教階段特教通報操作手冊

數位圖書館/博物館相關標準 2

斯 福 也 因 此 被 認 為 是 美 國 歷 史 上 最 偉 大 的 總 統 之 一 由 於 生 育 率 一 直 比 較 高 ( 美 國 到 1960 年 每 個 婦 女 生 育 孩 子 數 還 接 近 四 個 ), 而 當 時 人 口 壽 命 不 長 (1940 年, 美 國 人 口 的 平 均

移 动 社 会 计 算 : 跨 越 Web 2.0 近 年 来, 以 Wiki Facebook Twitter 为 代 表 的 社 会 计 算 (Social Computing) 应 用, 获 得 了 巨 大 成 功 例 如,Facebook 已 覆 盖 4 亿 用 户, 业 务 量 占 到 网

報名簡章核定版.doc

PowerPoint Presentation

ESET Mobile Security for Android

<%DOC NAME%> (User Manual)

(Microsoft Word - \251I\250D\245D\246W

wedding calendar

BizSpark 初 创 公 司 计 划 指 南 目 录 什 么 是 BizSpark?... 1 计 划 概 述... 1 计 划 结 构 和 角 色... 1 初 创 公 司 资 格... 3 使 用 BizSpark 的 产 品 和 联 机 服 务 的 示 例 :... 3 职 责... 5

國立中山大學學位論文典藏.PDF

工 程 应 用 陈 泾 生 等 继 电 保 护 检 验 标 准 化 作 业 专 家 系 统 的 研 发 和 应 用 实 践 统 硬 件 结 构 和 软 件 功 能 结 构 分 别 如 图 图 所 示 图 / 系 统 硬 件 架 构 0 1/!&%!!" "! 图 软 件 功 能 0 1 %! " 高

19 19

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

目 錄 壹 基 本 資 料... 1 貳 課 程 執 行 成 果... 1 一 課 程 目 標 :... 1 二 服 務 進 行 機 構 :... 2 ( 一 ) 機 構 簡 介... 2 ( 二 ) 合 作 模 式... 3 ( 三 ) 服 務 進 行 方 式... 4 ( 四 ) 內 容...

WebSphere Studio Application Developer IBM Portal Toolkit... 2/21 1. WebSphere Portal Portal WebSphere Application Server stopserver.bat -configfile..

2

Microsoft Word - 34月點題班-32...docx

C. 執 行 內 容 : 依 課 程 安 排 規 定 訂 定 (2) 申 請 案 經 本 局 審 查 同 意 後 始 得 執 行 ( 內 容 變 更 時 亦 同 ), 並 於 課 程 開 始 前 告 知 學 員 本 課 程 係 由 臺 中 市 政 府 勞 工 局 輔 導 105 年 度 就 業 安


打印

Microsoft Word - 正文部分.doc

final

indb

oracle-Ess-05.pdf

ch_code_infoaccess

- - - α α

第 02 期 1 医 疗 信 息 现 状 20% EMR Electronic Medical Record HIS HIS [1-2] 张 肖 等 : 基 于 大 数 据 的 医 疗 健 康 创 新 应 用 2 大 数 据 环 境 下 医 疗 数 据 特 征 分 析 PC [3]

432 NY.pdf

untitled

untitled

untitled

可 以 達 到 一 對 一 一 對 多 多 對 多 的 方 式, 可 以 做 到 同 時 性 的 溝 通 交 流 與 傳 播 訊 息 等 作 用 ( 二 ) 即 時 通 訊 的 歷 史 沿 革 1988 年 第 一 個 系 統 IM 系 統 - 網 際 網 路 中 繼 交 談 (IRC), 於 19

1 2 <CAHhX17dox1o7cv63SgXVrJRs

untitled

坐 公 車 好 處 多 得 獎 者 : 李 宥 萱 指 導 老 師 : 陳 淑 鈴 我 家 住 在 鄉 下, 離 市 區 有 段 距 離 每 個 禮 拜 三 和 禮 拜 六 我 都 要 到 市 區 補 習, 以 前 都 是 媽 媽 特 地 從 大 老 遠 的 地 方 開 車 回 來 載 我 這 實

目 录 简 介.3 ` 体 系 结 构...4 数 据 层...5 数 据 连 接 器...6 Tableau Server 组 件...7 网 关 / 负 载 平 衡 器...8 客 户 端 :Web 浏 览 器 和 移 动 应 用 程 序...8 客 户 端 :Tableau Desktop..

胃癌早诊早治技术方案.doc

A Time to Care - Vancouver Coastal Health

1


背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

非傳染病直擊2010年12月 - 汽水及兒童的健康

2012 年 4 月 至 6 月 活 動 一 覽 月 份 計 劃 / 項 目 活 動 4 月 竹 園 中 心 活 動 竹 園 中 心 開 放 日 暨 沒 有 巴 掌 日 嘉 年 華 :4 月 28 日 v 迎 新 會 :4 月 21 日 童 歡 部 落 v 義 工 服 務 :5 月 27 日 v 小

“档案管理”功能操作说明:

PowerPoint Presentation

Background 2006 年 2 月 我 国 新 企 业 会 计 准 则 的 颁 布, 标 志 着 与 国 际 惯 例 趋 同 的 中 国 新 会 计 准 则 体 系 的 建 立, 自 2007 年 1 月 1 日 起 首 先 在 境 内 上 市 的 公 司 施 行, 自 2008 年 1 月

2014 年 前 言 房 地 产 投 资 信 托 基 金 (Real Estate Investment Trusts,REITs) 在 海 外 早 已 发 展 成 熟, 而 香 港 政 府 去 年 也 进 一 步 准 备 放 宽 房 托 限 制, 相 比 之 下, 中 国 已 经 改 革 开 放

IBM 全 球 企 业 咨 询 服 务 部 中 国 五 矿 筑 起 人 力 资 源 信 息 大 厦 2 回 顾 篇 慎 选 巧 选 软 件 平 台 由 于 五 矿 集 团 下 属 的 很 多 公 司 是 最 近 几 年 才 加 盟 的 新 成 员 企 业, 这 些 公 司 所 应 用 的 人 力 资

CANVIO_AEROCAST_CS_EN.indd

Microsoft PowerPoint NAFSA一籌報告事項_小

Transcription:

基于 Amazon Comprehend 的文本 分析开发实践 奚文俊,AWS 技术客户经理 Wenjun Xi, Technical Account Manager, Amazon Web Services 2018 年 5 月 15 日 May 15, 2018

自然语言处理的趋势

自然语言处理的研究方向 语法语义 分析 对话系统 信息抽取 问答系统 自然语言处 理 文本挖掘 信息检索 机器翻译

自然语言处理场景无处不在 公众公开的内容 社交媒体 新闻 客户 Engagement 产品评论 产品支持 ( 电话 电子邮件 反馈 )

自然语言处理模型训练的挑战 数据标注 数据准备 清洗 转换 训练模型 评估调参 再训练 NLP 模型 部署模型

Amazon Comprehend

Amazon Comprehend: 自然语言处理 情感实体语言关键短语主题建模 基于深度学习

文本分析 N a m e d E n t i t i e s A m a z o n. c o m : O r g a n i z a t i o n S e a t t l e, W A : L o c a t i o n J u l y 5 t h, 1 9 9 4 : D a t e J e f f B e z o s : P e r s o n A m a z o n. c o m, I n c. i s l o c a t e d i n S e a t t l e, W A a n d w a s f o u n d e d J u l y 5 t h, 1 9 9 4 b y J e f f B e z o s. O u r c u s t o m e r s l o v e b u y i n g e v e r y t h i n g f r o m b o o k s t o b l e n d e r s at g r e a t p r i c e s K e y p h r a s e s O u r c u s t o m e r s b o o k s b l e n d e r s g r e a t p r i c e s S e n t i m e n t P o s i t i v e L a n g u a g e E n g l i s h

主题分类 主题关键词 Topic Term Weight 0 Washington.89 1 Silicon Valley.67 2 Roasting.91 文档按主题归类 Document Topic Proportion Doc.txt 0.89 Doc.txt 1.07 Doc.txt 2.04

常见使用场景 客户反馈分析 实时分析客户对于贵公司品牌 产品和服务的情绪 基于情感的搜索 让您的搜索功能更智能 : 基于关键短语 情感和主题 知识发现和管理 根据主题来管理文本 / 文档, 个性化内容推荐

如何使用 Amazon Comprehend

API 概览 Synchronous DetectDominantLanguage BatchDetectDominantLanguage DetectEntities Batch DetectEntities DetectKeyPhrases Batch DetectKeyPhrases DetectSentiment Batch DetectSentiment 检测语言, 可以检测 100 种语言 检测命名实体, 比如人名 地点 组织等 检测能表征文本内容特点的关键名词短语 检测文本所表示的情感 : 正面 负面 混合 ( 正面负面皆有 ) 中性 Asynchronous StartTopicDetection ListTopicDetection DescribeTopicDetection 开始主题分类任务 列举所有您提交的主题分类任务 获取主题分类任务的状态等信息

Comprehend 和 AWS 服务结合 Articles, Documents Amazon S3 Amazon ES Amazon Redshift Amazon Aurora 语意搜索 丰富的过滤 通过 Grouping 来分析趋势 通过 Joining 来关联查询 Social Media, Support Amazon Kinesis Amazon Comprehend Amazon EMR Clustering Graph, Search Amazon Transcribe

演示 : 近实时电影评论分析仪表盘

仪表盘概览

整体架构 Amazon Comprehend review-stream 用户评论 Amazon Kinesis Data Firehose AWS Lambda Amazon ES Kibana entity-stream Amazon S3 Amazon Kinesis Data Firehose

设计要点 为什么用到两个 Kinesis Firehose? 需求 : 点击 Dashboard 中的一个视图, 其他视图相应作过滤 Entity Type: PERSON

设计要点 设计一 : 使用 nested 类型 Kibana 目前不支持复合字段的聚合查询 https://www.elastic.co/guide/en/kibana/current/nested-objects.html

设计要点 设计二 : 命名实体文本和类型作为两个 List 缺陷 : 命名实体文本和类型之间的关联丢失 无法通过类型来过滤命名实体

设计要点 设计三 : 增加一个字段 doc_type 用来区分文档类型 : doc: 该文档包含 entity name 和 type 两个 List entity: 每个 entity 作为一个独立文档

设计要点 使用 Comprehend 批量 API 提升吞吐量, 一次分析 25 条文本

动手实践 Blog https://aws-blogs-prod.amazon.com/china/realizing-near-real-time-textsentiment-analysis-with-aws-comprehend/ 相关资源 代码 :https://github.com/gddezero/realtime-text-analysis 数据集 : http://ai.stanford.edu/~amaas/data/sentiment/aclimdb_v1.tar.gz

演示 : 文本主题分类

输入数据 One document per file One document per line

输出结果和 IAM role

查看任务运行状态和结果

查看任务运行状态和结果 Topic ID 占比 权重

免费试用 现已在如下区域可用 US East (N. Virginia) US East (Ohio) US West (Oregon) EU (Ireland) 免费试用额度 命名实体识别 情绪分析 关键短语抽取 语言检测 每月 50K 文本单位 (5M 字母 ) 主题模型 每月 5 个任务 ( 每个任务最多 1MB)

Thank You!