Flink快速上手(QuickStart)

Similar documents
Flink on YARN部署快速入门指南

Apache CarbonData集群模式使用指南

Hive:用Java代码通过JDBC连接Hiveserver

通过Hive将数据写入到ElasticSearch

使用MapReduce读取XML文件

Ubuntu和CentOS如何配置SSH使得无密码登陆

Spark读取Hbase中的数据

使用Cassandra和Spark 2.0实现Rest API服务

Guava学习之Resources

在Fedora上部署Hadoop2.2.0伪分布式平台

使用Spark SQL读取Hive上的数据

Hadoop&Spark解决二次排序问题(Hadoop篇)

韶关:神奇丹霞

标题

一、

使用Hive读取ElasticSearch中的数据

哼, 你 們 不 回 答 又 怎 麼 樣? 不 管 是 多 大 來 頭, 現 在 都 被 血 魔 吞 噬 無 蹤 了 你 們 幾 個 真 是 太 過 分, 我 不 犯 你 們, 你 們 卻 一 天 到 晚 來 挑 釁 我 教 尊 冷 笑 著 說 道 嗚, 大 人 土 地 大 姐 跪 下 來, 流 下

Flume-ng与Mysql整合开发

在Spring中使用Kafka:Producer篇

三种方法实现Hadoop(MapReduce)全局排序(1)

Flink快速上手之Scala API使用

伊春:醉人林都

校友会系统白皮书feb_08

使用Apache Beam读写HDFS上的文件

Hadoop元数据合并异常及解决方法

关林:武圣陵寝

泰山:五岳独尊

Kafka客户端是如何找到 leader 分区的

六种使用Linux命令发送带附件的邮件

国内26省市新能源汽车推广规划已出台

“百企入校——广西青年企业家协会高校

北戴河:海阔天空

30.00% 25.00% 25.00% 22.50% 20.00% 15.00% 12.50% 15.00% 12.50% 10.00% 7.50% 5.00% 2.50% 2.50% 0.00% 文 学 理 学 工 学 法 学 教 育 学 管 理 学 历 史 学 艺 术 学 ( 三 ) 学 生

如何在 Apache Hive 中解析 Json 数组

教学〔2016〕120号


西岭雪山滑雪场

Guava学习之CharSequenceReader

<443A5CBAEEC3F75CB9D2CDE2CDF8D0C5CFA25C D315CD3D0C9ABBDF0CAF4C6F3D2B5C4DCD4B4B9DCC0EDD6D0D0C4BDA8C9E8CAB5CAA9B7BDB0B82E646F63>

Spark作业代码(源码)IDE远程调试

柳州化工股份有限公司

据传-蚂蚁金服350亿美元开约A股IPO,马云身价又要暴涨

Ioncube Php Encoder 8 3 Crack 4. llamaba octobre traslado General Search colony

Hadoop 2.2.0安装和配置lzo

江门:中国第一侨乡

是 喔, 就 是 那 個 在 BBS 醫 療 版 跟 你 嗆 聲, 自 稱 有 三 十 多 年 推 拿 經 驗 的 大 叔 嗎? 一 個 看 來 頗 為 清 秀 的 女 生 問 道, 她 語 氣 中 略 感 訝 異 是 啊, 什 麼 推 拿 按 摩 有 多 好, 還 要 人 生 病 盡 量 不 要

教育扩张能改善收入分配差距吗?——来自CHNS2006年数据的证据

山水文化,市井人家——以湖州邱城小镇的概念性规划为例

中国科学院文件

PowerPoint Presentation

大连软~1

Microsoft Word - PKUCS计算机教育 doc

南京市人才服务中心

行 业 市 场 研 究 属 于 企 业 战 略 研 究 范 畴, 作 为 当 前 应 用 最 为 广 泛 的 咨 询 服 务, 其 研 究 报 告 形 式 呈 现, 通 常 包 含 以 下 内 容 : 一 份 专 业 的 行 业 研 究 报 告, 注 重 指 导 企 业 或 投 资 者 了 解 该

電機工程系認可證照清單 /7/1

考 試 日 期 :2016/04/24 教 室 名 稱 :602 電 腦 教 室 考 試 時 間 :09: 二 技 企 管 一 胡 宗 兒 中 文 輸 入 四 技 企 四 甲 林 姿 瑄 中 文 輸 入 二 技 企 管 一

untitled

秘密

E11701


<4D F736F F D20D0C5CFA2BBAFB7A2D5B9D6D8B5E3D7A8CFEEB9E6BBAE2E646F63>

? 這 全 都 是 市 政 府 提 供 給 我 的 資 料 低 底 盤 公 車 計 畫 96 年 預 算 新 台 幣 4,500 萬 元 97 年 預 算 新 台 幣 1 億 6,500 萬 元 98 年 預 算 新 台 幣 3 億 2,300 萬 元, 共 有 307 台 低 底 盤 公 車,99

关于建立境内违法互联网站黑名单管理制度的通知

SA-CPCB81TRA-CN (Panduit INdustrial Automation Solutions).indd

行 业 市 场 研 究 属 于 企 业 战 略 研 究 范 畴, 作 为 当 前 应 用 最 为 广 泛 的 咨 询 服 务, 其 研 究 报 告 形 式 呈 现, 通 常 包 含 以 下 内 容 : 一 份 专 业 的 行 业 研 究 报 告, 注 重 指 导 企 业 或 投 资 者 了 解 该

SparkR(R on Spark)编程指南

目 錄

菩提道次第廣論

路 上 沒 說 話, 車 子 被 爸 離 去 後 開 走 了, 沒 什 麼 變, 除 了 一 股 淡 淡 的 香 味, 我 不 太 習 慣, 像 空 氣 中 的 粉 塵, 左 飄 右 飄, 光 中 飛 舞 我 沒 提, 看 車 窗 外, 外 面 不 太 有 趣, 我 只 是 沒 事 幹, 我 們 本

繁 華 國 小 101 學 年 母 親 節 感 恩 惜 福 - 跳 蚤 市 場 暨 科 學 闖 關 遊 戲 親 子 活 動 實 施 計 畫 一 依 據 : 本 校 101 學 年 度 校 務 計 畫 及 行 事 曆 二 目 的 : 1. 培 養 學 生 感 恩 惜 物 知 福 惜 福 的 節 儉 觀

台 中 市 北 屯 區 東 山 里 橫 坑 9 林 志 明 巷 89-5 菜 豆 菜 大 漿 果 菜 豆 菜 大 漿 果 小 漿 果 核 果 柑 桔 無 陳 錦 生 新 竹 市 香 山 區


育儿小故事(四)

/ 149 / / / / / 500 1, / / / / / / / / 1,000 3, / / IT 157 / /

行 业 市 场 研 究 属 于 企 业 战 略 研 究 范 畴, 作 为 当 前 应 用 最 为 广 泛 的 咨 询 服 务, 其 研 究 报 告 形 式 呈 现, 通 常 包 含 以 下 内 容 : 一 份 专 业 的 行 业 研 究 报 告, 注 重 指 导 企 业 或 投 资 者 了 解 该

将 MySQL 的全量数据导入到 Apache Solr 中

经 济 高 速 增 长 和 其 后 又 比 其 他 发 达 资 本 主 义 国 家 更 为 顺 利 地 克 服 了 石 油 危 机 的 冲 击, 使 日 本 的 市 场 经 济 体 制 在 7 0 ~ 8 0 年 代 赢 得 了 国 际 社 会 的 广 泛 赞 誉 ( 其 间 虽 有 欧 美 国 家

2015 TB-1-06.indd

<4D F736F F D B8BDBCFE332D3120C8EDBCFEB9A4B3CCCBB6CABFC5E0D1F8B7BDB0B8>

Microsoft Word zw

附 件 : 2009 年 度 国 家 精 品 课 程 名 单 一 本 科 国 家 精 品 课 程 ( 以 学 科 为 序, 共 400 门 ) 序 号 一 级 学 科 二 级 学 科 课 程 名 称 学 校 名 称 负 责 人 1 哲 学 哲 学 类 马 克 思 主 义 伦 理 学 安 徽 师 范

93年各縣國中教師甄試最新考情.doc

自由軟體社群發展經驗與 Linux認證介紹

A9RF716.tmp

COP中文范本

冶金企业安全生产监督管理规定

<4D F736F F D20BAECB1A6C0F6A3BAB7C7B9ABBFAAB7A2D0D0B9C9C6B1C4BCBCAFD7CABDF0CAB9D3C3B5C4BFC9D0D0D0D4B1A8B8E62E646F63>


PowerPoint 演示文稿

Cisco WebEx Meetings Server 2.6 版常见问题解答

行 业 市 场 研 究 属 于 企 业 战 略 研 究 范 畴, 作 为 当 前 应 用 最 为 广 泛 的 咨 询 服 务, 其 研 究 报 告 形 式 呈 现, 通 常 包 含 以 下 内 容 : 一 份 专 业 的 行 业 研 究 报 告, 注 重 指 导 企 业 或 投 资 者 了 解 该

项目采购需求编写模板

行 业 市 场 研 究 属 于 企 业 战 略 研 究 范 畴, 作 为 当 前 应 用 最 为 广 泛 的 咨 询 服 务, 其 研 究 报 告 形 式 呈 现, 通 常 包 含 以 下 内 容 : 一 份 专 业 的 行 业 研 究 报 告, 注 重 指 导 企 业 或 投 资 者 了 解 该

.. 3 N

cyberghost vpn premium keygen torrent


奇虎360正式开源深度学习调度平台XLearning

行 业 市 场 研 究 属 于 企 业 战 略 研 究 范 畴, 作 为 当 前 应 用 最 为 广 泛 的 咨 询 服 务, 其 研 究 报 告 形 式 呈 现, 通 常 包 含 以 下 内 容 : 一 份 专 业 的 行 业 研 究 报 告, 注 重 指 导 企 业 或 投 资 者 了 解 该

华南理工大学广州学院


Transcription:

安装 : 下载并启动 Flink 可以在 Linux Mac OS X 以及 Windows 上运行 为了能够运行 Flink, 唯一的要求是必须安装 Java 7.x 或者更高版本 对于 Windows 用户来说, 请参考 Flink on Windows 文档, 里面介绍了如何在 Window 本地运行 Flink 下载 从下载页面 (http://flink.apache.org/downloads.html) 下载所需的二进制包 你可以选择任何与 Hadoop/Scala 结合的版本 比如 Flink for Hadoop 2 启动一个 local 模式的 Flink 集群 启动一个 local 模式的 Flink 集群非常地简单, 我们可以按照以下的步骤来操作 : 1 进入到下载的目录 ; 2 解压下载的文件 ; 3 启动 Flink 操作命令如下 : $ cd ~/Downloads # Go to download directory $ tar xzf flink-*.tgz # Unpack the downloaded archive $ cd flink-1.0.0 $ bin/start-local.sh # Start Flink 打开 https://www.iteblog.com:8081 检查 Jobmanager 和其他组件是否正常运行 Web 前端应该显示了只有一个可用的 TaskManager 1 / 6

运行例子 现在, 我们来运行 SocketTextStreamWordCount 例子, 它从 socket 中获取文本, 然后计算每个单词出现的次数 操作步骤如下 : 1 首先, 我们使用 netcat 来启动本地服务器 : $ nc -l -p 9000 2 然后我们就可以提交 Flink 程序了 : $ bin/flink run examples/streaming/sockettextstreamwordcount.jar \ --hostname localhost \ --port 9000 Printing result to stdout. Use --output to specify output path. 04/05/2016 16:03:36 Job execution switched to status RUNNING. 04/05/2016 16:03:36 Source: Socket Stream -> Flat Map(1/1) switched to SCHEDULED 04/05/2016 16:03:36 Source: Socket Stream -> Flat Map(1/1) switched to DEPLOYING 04/05/2016 16:03:36 Keyed Aggregation -> Sink: Unnamed(1/1) switched to SCHEDULED 2 / 6

04/05/2016 16:03:36 Keyed Aggregation -> Sink: Unnamed(1/1) switched to DEPLOYING 04/05/2016 16:03:36 Keyed Aggregation -> Sink: Unnamed(1/1) switched to RUNNING 04/05/2016 16:03:36 Source: Socket Stream -> Flat Map(1/1) switched to RUNNING 04/05/2016 17:00:43 Source: Socket Stream -> Flat Map(1/1) switched to FINISHED 04/05/2016 17:00:43 Keyed Aggregation -> Sink: Unnamed(1/1) switched to FINISHED 04/05/2016 17:00:43 Job execution switched to status FINISHED. 这个程序和 socket 进行了连接, 并等待输入 我们可以在 WEB UI 中检查 Job 是否正常运行 : 3 / 6

3 计数会打印到标准输出 stdout 监控 JobManager 的输出文件 (.out 文件 ), 并在 nc 中敲入一些单词 : $ nc -l -p 9000 lorem ipsum ipsum ipsum ipsum bye.out 文件会立即打印出单词的计数 : $ tail -f log/flink-*-jobmanager-*.out (lorem,1) (ipsum,1) (ipsum,2) (ipsum,3) (ipsum,4) (bye,1) 4 / 6

要停止 Flink, 只需要运行 : $ bin/stop-local.sh 集群模式安装 在集群上运行 Flink 是和在本地运行一样简单的 需要先配置好 SSH 免密码登录和保证所有节点的目录结构是一致的, 这是保证我们的脚本能正确控制任务启停的关键 然后我们就可以按照下面步骤来操作 : 1 在每台节点上, 复制解压出来的 flink 目录到同样的路径下 2 选择一个 master 节点 (JobManager) 然后在 conf/flink-conf.yaml 中设置 jobmanager.rpc.address 配置项为该节点的 IP 或者主机名 确保所有节点有有一样的 jobmanager.rpc.address 配置 3 将所有的 worker 节点 (TaskManager) 的 IP 或者主机名 ( 一行一个 ) 填入 conf/slaves 文件中 5 / 6

Powered by TCPDF (www.tcpdf.org) 现在, 你可以在 master 节点上启动集群 :bin/start-cluster.sh 下面的例子阐述了三个节点的集群部署 (IP 地址从 10.0.0.1 到 10.0.0.3, 主机名分别为 master, worker1, worker2) 并且展示了配置文件, 以及所有机器上一致的可访问的安装路径 访问 https://ci.apache.org/projects/flink/flink-docsrelease-1.0/setup/config.html 查看更多可用的配置项 为了使 Flink 更高效的运行, 还需要设置一些配置项 以下都是非常重要的配置项 : 1 TaskManager 总共能使用的内存大小 (taskmanager.heap.mb) 2 每一台机器上能使用的 CPU 个数 (taskmanager.numberoftaskslots) 3 集群中的总 CPU 个数 (parallelism.default) 4 临时目录 (taskmanager.tmp.dirs) Flink on YARN 你可以很方便地将 Flink 部署在现有的 YARN 集群上, 操作如下 : 1 下载 Flink Hadoop2 包 : Flink with Hadoop 2 2 确保你的 HADOOP_HOME ( 或 YARN_CONF_DIR 或 HADOOP_CONF_DIR) 环境变量 设置成你的 YARN 和 HDFS 配置 3 运行 YARN 客户端 :./bin/yarn-session.sh 你可以带参数运行客户端 -n 10 -tm 8192 表示分配 10 个 TaskManager, 每个拥有 8 GB 的内存 本博客文章除特别声明, 全部都是原创! 转载本文请加上 : 转载自过往记忆 (https://www.iteblog.com/) 本文链接 : () 6 / 6