构建高效的私有云平台V3

Similar documents
实践课堂成都站-0609.key

Azure_s

OpenResty在又拍云容器平台中的应用

Cloudy computing forEducation

A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内

A9RF716.tmp

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

Intruduction to the NGINX stream subsystem and OpenResty's support

1.【可以发布,不需去二维码】AS北京2017-张振华-美丽联合容器云平台建设的实战分享.key

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

幻灯片 1

IBM

《 年中國(含全球)IDC行業發展趨勢及投資前景分析報告》

北京光环新网科技股份有限公司2016年半年度报告全文

02 微服务设计原则与生态系统-final.key

京东容器平台与数据中心协同发展实践 鲍永成 京东商城 - 基础平台部 技术总监

1 IT IT IT IT Virtual Machine, VM VM VM VM Operating Systems, OS IT

<4D F736F F D20312D3120B9ABBFAAD7AAC8C3CBB5C3F7CAE95FB5DAB6FEB4CEB7B4C0A1B8FCD0C25F636C65616E5F76322E646F63>

DocHdl2OnPPMtmpTarget

光 环 新 网 研 究 报 告 一 公 司 简 介 北 京 光 环 新 网 科 技 股 份 有 限 公 司, 成 立 于 1999 年,2009 年 整 体 变 更 为 股 份 有 限 公 司,2014 年 1 月 在 创 业 板 上 市 公 司 主 营 业 务 为 向 客 户 提 供 宽 带 接

股份有限公司

入 大 立立 手 口 面 耳 鼻 耳 鼻 子 耳 鼻 生 生 耳 鼻 耳 鼻 耳 鼻 小 手 入 大 一 支 手 入 支 立立 手 入 支 手 入 石 口 口 支 手 支 手 手 支 入 入 入 人 人 人 人 人 田 手 入 耳 鼻 手 入 小 一 支 人 見見 赤 十 耳 鼻 金金 口 手 支

Tech Radar2015修改111

政府機關資訊通報第295期(5月)

BYOD IP+Optical (IP NGN) API 4. End-to-End (Service Aware) 5. IP NGN (IP Next Generation Network) ( ) Prime Carrier Management Access Edge Co

天津天狮学院关于修订2014级本科培养方案的指导意见

Hippy-VueConf

User Group SMTP

1吴正轩

目 錄 第 一 章 weberp 簡 介... 6 第 一 節 概 述... 6 第 二 節 安 全 性... 7 第 三 節 功 能... 7 一 銷 售 及 訂 單... 7 二 稅... 8 三 應 收 帳 款... 8 四 存 貨... 8 五 購 買... 9 六 應 付 帳 款... 9

Network Bandwidth Applications MATE Applications Applications On Demand Calendaring Load Balancer Live Archive Design Northbound Service,Netwo

应 用 为 先, 统 筹 规 划 摘 要 : 总 体 上 看, 我 国 的 云 计 算 还 没 有 进 入 良 性 发 展 的 轨 道 目 前 的 形 势 是 政 府 比 企 业 积 极, 企 业 比 用 户 积 极, 大 企 业 比 中 小 企 业 积 极, 建 设 数 据 中 心 比 推 广 应

吉林省科技发展计划项目申报书23005

幻灯片 1

652,031, ,687, ,679,340, ,191,926, ,031, ,687, ,679,340, ,191,926, ,090, ,9

根 据 我 们 9 月 份 对 22 个 上 市 公 司 的 调 研 和 行 业 总 体 增 速 判 断, 2014 年 多 数 计 算 机 公 司 增 速 将 在 20% 左 右, 目 前 公 布 的 公 司 基 本 在 20% 以 上 投 资 建 议 计 算 机 目 前 整 体 估 值 水 平

epub 61-2

10 IBM Louis V. Gerstner, Jr. 15 Moore's Law EPC PC 2-2

目 录 1 镜 像 环 境 及 使 用 说 明 镜 像 环 境 说 明 镜 像 安 装 说 明 服 务 器 安 全 狗 网 站 安 全 狗 安 全 狗 服 云 MYSQL 数 据 库 密 码 软 件

海通证券金融云思考与实践(数据技术嘉年华)的副本.key

<B1B1BEA9B9E2BBB7D0C2CDF8BFC6BCBCB9C9B7DDD3D0CFDEB9ABCBBEB4B43F3F12FB6CB293>

南威软件股份有限公司

ebook 132-2

Connected Intelligence:ビッグデータ技術を活用したIT運用

.. 3 N

untitled

See1

BYOD SDN IT L2 / L3 Channel VLAN ( ) Thin AP SDN L2/L3 QOS ( ) NSX NSX NSX VMware NSX VMware NSX SDN

工业经济第17期.FIT)


标题

6112 http / /mops.tse.com.tw http / /

摘 要 1. GSLB: 全 局 负 载 均 衡 2. SLB: 服 务 器 负 载 均 衡 四 层 交 换 LVS 七 层 交 换 Nginx 3. Heartbeat 实 现 HA 4. MySQL 数 据 库 集 群 5. 集 群 环 境 下 的 存 储 备 份 6. 集 群 的 监 控 及

AS北京2017-《知乎 Feed 流构架演进》-姚钢强.key

Marketing_WhitePaper.PDF

我们的社区 技术博客 知识总结 讲座直播 太阁x 技术讨论群 群直播 太阁官网 Bittiger.io 和社区 太阁x 项目小组 MOOC班 太阁x地区 刷题小组 线下聚会 华人技术社区 - 全球4个国家, 16个地区 - 分享技术, 学习技术 - 生长学习法 欢迎关注 - 网站: BitTiger

2005 3

PowerPoint 演示文稿

自由軟體教學平台

C3_ppt.PDF

XXXXXX股份有限公司股票发行方案

<4D F736F F D20312D3120D5D0B9C9CBB5C3F7CAE9A3A8C9EAB1A8B8E5A3A9>

基于Electron-vue的桌应用实战2

浙江师范大学2014年度毕业生就业质量报告

目 录 监 管 资 讯 2016 年 全 国 保 险 监 管 工 作 会 议 召 开...3 协 会 动 态 赤 峰 保 险 行 业 协 会 召 开 数 据 统 计 和 信 息 宣 传 总 结 表 彰 会 议...5 赤 峰 市 保 险 行 业 协 会 秘 书 处 召 开 2015 年 度 述 职

同 时, 采 取 提 供 新 闻 线 索 和 素 材 安 排 专 访 等 方 式 主 动 为 新 闻 媒 体 服 务, 为 采 访 报 道 活 动 创 造 便 利 条 件 建 设 网 络 信 息 发 布 平 台 2013 年 9 月 开 通 中 央 纪 委 监 察 部 网 站,2015 年 1 月

公務員服務法第13條相關解釋彙整表

大陸教育部等6個部門公佈「現代職業教育體系建設規劃 ( 年)」規劃到2015年初步形成現代職業教育體系框架,到2020年基本建成「中國」特色現代職業教育體系

资 讯 速 递 台 基 于 大 数 据 的 学 校 督 导 评 估 系 统 建 设 上 海 市 闵 行 区 人 民 政 府 教 育 督 导 室 ( 摘 要 ) 闵 行 教 育 在 深 化 教 育 改 革 探 索 管 办 评 分 离 的 背 景 下, 把 教 育 督 导 评 估 系 统 建 设 作 为

時間軸上的竹蓮記憶 學務主任 黃雅彙 我不是竹蓮國小的畢業校友 但對於身為新竹人的我來 說 仔細回想起來 似乎和竹蓮有著一種特別的緣分 對竹蓮國小最初的印象是在小學的時候 猶記得年幼的 我經過一段時日的啦啦隊舞蹈訓練後 老師便帶著我們從學 校步行到竹蓮國小來參加比賽 一踏入竹蓮校門 映入眼簾 的是黑

B1

Microsoft Word - 临政办发6.doc

B1

自由軟體教學平台

CloudNative应用实践V3

与 改 革 委 员 会 术 产 业 司 调 整, 推 进 相 关 调 控 目 标 制 定 和 政 策 手 段 运 用 机 制 化 ; 统 筹 推 进 战 略 性 新 兴 产 业 发 展, 拟 订 和 实 施 国 家 战 略 性 新 兴 产 业 发 展 规 划, 协 调 相 关 产 业 和 区 域 规

SiteView技术白皮书

新, 云 计 算 已 经 从 技 术 理 念 转 化 为 生 产 力 平 台 随 着 技 术 应 用 等 各 个 层 面 的 日 益 成 熟, 一 个 涵 盖 IT 基 础 架 构 应 用 商 业 服 务 的 云 产 业 已 经 初 步 形 成, 整 体 市 场 呈 现 出 如 下 特 征 : 客

02 责任编辑 张晋芬 2 16:06:31

自由軟體教學平台

Quantum Overview

PowerPoint 演示文稿

untitled

广西英腾教育科技股份有限公司

PowerPoint Presentation

PPP Intranet Chapter 3 Chapter IaaS PaaS SaaS

Airbnb Salesforce Uber (IoT) IT (crowdsourcing) (JetBlue) BMW

目 录 第 五 部 分 第 六 部 分 第 七 部 分 第 八 部 分 投 标 邀 请 投 标 人 须 知 附 表 评 标 方 法 和 评 分 细 则 项 目 需 求 和 技 术 方 案 要 求 1

温州市政府分散采购

WebSphere Studio Application Developer IBM Portal Toolkit... 2/21 1. WebSphere Portal Portal WebSphere Application Server stopserver.bat -configfile..

<4D F736F F D20A1B6D4C6BCC6CBE3D6DCB6C8B2CEBFBCA1B B5DA3138C6DA2E646F63>

Bluemix 从概念到应用CN改

8月31日 高松市震災対策総合訓練が古高松中学校において実施され,住民2000人が参加した

中国证券监督管理委员会公告

十三五封面.cdr

记 忆 155 期 北 京 大 学 文 革 专 辑 (9) 目 录 专 稿 章 铎 从 高 云 鹏 的 遭 遇, 看 迟 群 之 流 的 专 制 附 : 高 云 鹏 给 胡 宗 式 章 铎 的 信 (2015 年 11 月 19 日 ) 评 论 马 云 龙 王 复 兴 抢 救 记 忆 : 一 个 北

硕士论文正文


不 会 忘 记, 历 史 不 会 忘 记, 当 一 个 古 老 神 州 正 以 崭 新 的 姿 态 昂 首 屹 立 于 世 界 东 方 的 时 候, 当 世 界 把 延 伸 的 广 角 镜 瞄 准 这 片 神 奇 土 地 的 时 候, 中 国 人 民 已 深 深 感 到, 现 在 所 拥 有 的,

第一章

Transcription:

构建 高效私有云平台 今 日头条私有云平台架构设计夏绪宏

关于我 夏绪宏 @reeze 今 日头条研发架构负责 人 基础设施平台 PHP Committer\LAMP

大纲 01. 私有云 公有云在头条 02. 头条私有云平台架构设计 03. 遇到问题以及未来的规划

01. 私有云 公有云在头条

关于今 日头条 6 亿 用户 6600W DAU 76 分钟 日使 用时 长 7000w 5250w 3500w 1750w DAU 迭代部署 : 670+ 次 / 天 0w 2014-04 2015-04 2016-10

今 日头条 & 云 IaaS 公有云 : 应对突发和计算资源需求 推送场景, 峰值效应, 带宽占 用 大 国际化服务 SaaS 服务 服务质量量监控 : 云监控服务 第三 方统计服务 CDN 网络 etc

云计算设施 http://nordicapis.com/living-in-the-cloud-stack-understanding-saas-paas-and-iaas-apis/

公有云, 私有云 公司规模规模 小规模 大 公有云私有云公有云私有云 弹性好差好好 可控性弱强弱好 成本低 高 高低

02. 头条私有云平台架构设计

平台设计 目标 目标 : 高效的在线服务研发 PaaS 平台 思路路 : 松耦合, 支持不不同类型业务 理理解微服务 构建完善周边 SaaS 服务 足够的弹性, 混合云 支持

目前的进展 TCE: Toutiao Compute Engine 进展 : 2016-05 启动 2016-10 上线 120+ 服务迁移, 继续迁移中 扩容效率 :10 倍提升,< 1 分钟

总体架构 TCE WebUI API SaaS PaaS DevOps Services Manager Redis MC NSQ/ MySQL Resource Framework IaaS { Load Balancer (HTTP) Cron/script manager GoApp1 GoApp2 Python App Nodejs App Stateful app AppEngine Kubernetes vhost1 vhost2 container container container cluster1 container container cluster2 container IDC2

TCE 平台 技术 方案 技术选型 网络模型 服务发现 日志收集 容器器的使 用 弹性调度 etc... DevOps 研发基础设施 开发测试 部署上线 微服务的 支持

技术选型 PaaS 定制需求多 没有合适的开源 方案, 自研 IaaS Kubernetes Mesos

技术选型 Kubernetes Mesos 编排能 力力强 一般 集群规模千级别 massive 有状态服务不不太好 比较好 弹性好好 自愈能 力力 支持 支持

技术选型 IaaS 层设计 基础设施中 立 不不强绑定底层 IaaS 设施 通 用计算服务

Kubernetes

Kubernetes

Kubernetes 网络模型

Flannel

我们的 方案 使 用 Flannel 不不直接使 用虚拟 子 网 为每个实例例 expose 随机端 口

服务发现 Kubernetes Service: Cluster IP DNS 使 用Consul 自 己做服务发现 跨集群问题, 虚拟 网络和已有 网络的互通问题 性能问题 减少层次, 问题定位效率 我们 一直在 用Consul

服务发现 Container App PSM: toutiao.xx.api Port: 30000 Cluster: abc Env: prod Weight: 50 HTTP App Watcher Nginx LB App (server) Consul TCP App App Watcher

弹性调度 提升应对突发流量量的能 力力 资源利利 用率提升 基于 CPU metrics 后续根据业务指标扩容

容器器的使 用 方式 使 用init 进程守护 (systemd) 好处 : panic 之类的问题的可以更更快的重启 和物理理机的守护 方式 一致 支持容器器内应 用重启或临时更更新操作 坏处 : 服务 一直异常可能会影响服务 (LB 和 RPC 框架会屏蔽 )

容器器的使 用 方式 不不完全 自包含 基础服务在容器器外运 行行 : 各种 agent 日志持久化 公共 Library 共享 一种折衷和过渡

容器器的使 用 方式 Host metrics-server Container Shared Service /tmp /tmp Shared Python Library ss_lib mount /opt/tiger/ss_lib Platform tools tools /opt/tiger/tce_tools

日志收集 Host Consumer A Container Consumer B databus-collector App Log lib Stream processing Consumer C databus /tmp/databus_collector.sock /tmp/databus_collector.sock /opt/tiger/toutiao/log

监控

监控

02-1. DevOps 微服务

DevOps

平台眼 里里的服务 (App) 理理解服务化 全局唯 一标示 :P.S.M {$PRODUCT}.{$SUBSYS}.{$MODULE} 贯穿 自动化测试, 服务授权, 监控, 日志等 方 面 分集群 : 区别对待不不同的 用户, cluster,env, 框架 一起理理解 基本的元信息 依赖的程序 /lib 包信息

平台眼 里里的服务 (App) P.S.M IDC1 IDC2 1 2 3 Canary Prod Prod cluster1 cluster1 1 2 3 Canary Prod Prod cluster2 cluster2

平台眼 里里的服务 (App) Host Kubernetes Container Label: - cluster: default Env: - PSM: toutiao.xxx.api - Cluster: default - Env: canary mtest-subsys.mod

服务信息 toutiao.xx.xx cluster1 cluster2

服务信息 toutiao.xx.xx dev1 toutiao

开发镜像 (WIP) 按服务创建 快速创建 销毁环境 WebShell User Data Ceph Storage Dev Tools App modules App modules Base Image Base Image Production Image Dev Image

构建流程 & Deploy Info PSM: toutiao.xxsubsy.api Base Image: base Items: - module: toutiao/xxsub/api v1.0.1 - path: /opt/tiger/toutiao/app etc SCM& DockerHub Ceph

部署流程 1 2 3 API Diff Metrics 4

03. 遇到的问题以及未来的规划

遇到的问题 Kubernetes 集群规模问题 : 千级别的节点 IaaS 层封装, 底层分集群 多集群, 快速弹性调度只能在集群内

遇到的问题 网络相关问题 : 端 口分配问题 : 可能和临时端 口冲突, 修改 range systemd 守护的进程只能使 用 root 账号, 导致 日志权限为 root 环境变量量 无法从 docker 继承的问题

遇到的问题 小容器器资源变 小 Python 类服务多进程模型服务启动 CPU 过 高的问 题 开发框架适配 Docker 环境,worker 数的适配等

遇到的问题 数据库访问授权 容器器化后, 所在的物理理机 IP 会经常变动, 连接信 息隔离 利利 用应 用层 MySQL 新功能 或者在 SQL 层次带 上更更多的认证信息, 改造成本 大 重要服务物理理级别隔离

遇到的问题 : 历史包袱 脚本类服务的基础库统 一更更新问题 统 一更更新, 容易易出事故 不不统 一更更新, 基础库版本不不 一致 选择和微服务及容器器化 一致的理理念 : 自包含 版本发布进 行行标注, 强制应 用下次升级更更新解决 一致性问题

未来的规划 IaaS 层抽象和改造 调度器器的优化 : 不不同类型的业务, 提升利利 用率 支持有状态服务 多地域的 支持 : 国际化, 周边设施的完善 混合云 : 接 入IaaS 公有云提供更更好的伸缩能 力力 PaaS 服务和 SaaS 服务的深度整合

Thanks