频道栏目
首页 > 资讯 > 云计算 > 正文

GOOGLE分布式系统关键技术论文分析实例

19-02-19        来源:[db:作者]  
收藏   我要投稿

一、背景

大规模分布式系统设计是业界的技术难题,本文通过 GOOGLE 的分布式系统关键技术论文,从数据平面和控制平面两个纬度进行解读,从而帮助构建分布式系统设计基础。

二、关键论文

计算框架论文 简介 发表时间 主要作者
搜索引擎 Search Engine The Anatomy of a Large-Scale Hypertextual Web Search Engine 1998 Sergey Brin, Lawrence Page
数据挖掘 [Mining Causal Structures](Mining Causal Structures) Scalable Techniques for Mining Causal Structures 1998 Craig Silverstein, Sergey Brin, Rajeev Motwani, etc.
搜索引擎 Extracting Patterns Extracting Patterns and Relations from the World Wide Web 1998 Sergey Brin
搜索引擎 WEBSEARCH FOR A PLANET THE GOOGLE CLUSTER ARCHITECTURE 2003 Luiz André Barroso, Jeffrey Dean
分布式锁服务 Chubby The Chubby lock service for loosely-coupled distributed systems 2006 Mike Burrows
数据中心架构 The Datacenter as a Computer An Introduction to the Design of Warehouse-Scale Machines 2009 Luiz André Barroso, Urs H?lzle
数据中心统计画像 GOOGLE-WIDE PROFILING A CONTINUOUS PROFILING INFRASTRUCTURE FOR DATA CENTERS 2010 Gang Ren, Eric Tune, Tipp Moseley, etc.
系统追踪 Dapper A Large-Scale Distributed Systems Tracing Infrastructure 2010 Benjamin H. Sigelman, Luiz Andre Barroso, Mike Burrows, etc.
多租户弹性资源伸缩 CloudScale Elastic Resource Scaling for Multi-Tenant Cloud Systems 2011 Zhiming Shen, Sethuraman Subbiah, Xiaohui Gu
网络设计 B4 Experience with a Globally-Deployed Software Defined WAN 2013 Sushant Jain, Alok Kumar, Subhasree Mandal, etc.
低时延设计 The Tail at Scale Software techniques that tolerate latency variability are vital to building responsive large-scale Web services 2013 JEFFREY DEAN, LUIZ ANDRé BARROSO
集群调度 Omega Flexible, scalable schedulers for large compute clusters 2013 Malte Schwarzkopf, Andy Konwinski, Michael Abd-El-Malek, etc.
性能隔离 CPI2 CPU performance isolation for shared compute clusters 2013 Xiao Zhang, Eric Tune, Robert Hagmann
大规模集群管控 Borg Large-scale cluster management at Google with Borg 2015 Abhishek Verma, Luis Pedrosa, Madhukar Korupolu, etc.
自动分区 Slicer Auto-Sharding for Datacenter Applications 2016 Atul Adya, Daniel Myers, Jon Howell, etc.
容器调度 K8S Borg, Omega, and Kubernetes 2016 BRENDAN BURNS, BRIAN GRANT, DAVID OPPENHEIMER, etc.
图分区管理 Graph partitioning Distributed Balanced Partitioning via Linear Embedding 2016 Kevin Aydin, MohammadHossein Bateni, Vahab Mirrokni
数据排布的高效集群调度 Firmament Fast, Centralized Cluster Scheduling at Scale 2016 Ionel Gog, Malte Schwarzkopf, Adam Gleave, etc.

三、技术分析

GOOGLE 从搭建搜索引擎开始,分别从数据平面和管理平面构建大规模分布式系统,其中数据平面以 GFS、MR、BigTable 三篇经典 作为基础不断发展,同时管控平面也不断完善。

分布式系统的调度控制,从 Borg,Omega,再到当前风靡业界的 Kubernetes,支撑了分布式资源调度的发展。 分布式系统的锁服务 Chubby,提供了一致性的数据管理能力。 分布式系统的跟踪系统 Dapper,让构建分布式服务时能够跟踪模块间的执行,便于运维优化。 分布式系统的统计画像 GOOGLE-WIDE PROFILING,对分布式系统进行运行统计,从而支撑开发运维的优化。 分布式系统的资源隔离 CPI2,通过对资源的隔离控制,保证服务等级。 分布式系统的自动分区管理 Slicer 和 图分区管理 Graph partitioning | Distributed Balanced Partitioning via Linear Embedding,可以解决元数据分区热点问题。

四、总结

构建大规模分布式系统,其实和构建传统 ICT 类似,也需要从架构上设计好数据平面和控制平面,从而除了集中数据路径的设计优化,同样也需要设计好控制平面的集群控制、锁管理、日志跟踪、统计画像、资源隔离、热点均衡等技术,只是在大规模系统构建的需求下,需要进行架构的重新设计。

五、参考

GOOGLE Publication Database
相关TAG标签
上一篇:Istio流量治理功能原理与实战教学
下一篇:Varnish安装实例
相关文章
图文推荐

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站