运维达尔文:SRE 的自动化演进

作者/分享人:IT菜鸟
一个IT菜鸟

SRE 是 Site Reliability Engineer 的简称,它是源起于国外互联网企业的一个运维理念或者一个职业的定义。区别于传统运维模式,SRE 强调自动化,主张通过工程开发使用一些场景化的自动运维工具来应对规模性的扩张。本场Chat中我们将通过一些国外 SRE 实践的案例来介绍一下 SRE 自动化的演进。内容包括:

  1. 自动化对 SRE 的价值;
  2. 自动化演进的历程;
  3. 国外互联网企业 SRE 自动化应用案例;
  4. 国内运维领域自动化实践。

实录提要:

  • SRE 是否只适合有大规模 IT 系统的企业?
  • SRE 和 DevOps 有什么区别?
  • 如果从技术上转型,是否程序员比纯运维更容易适合 SRE 工作?
  • 自动化运维如何逐步开展起来?都有哪些事情要做?
  • 现在国外都有哪些公司有 SRE 岗位?
  • 关于自动化演进的 5 个阶段,能结合实例做一些更详细的介绍么?
  • SRE 是否定位为系统运行阶段?还是产品的全生命周期?
  • 初创或小型公司能否推行 SRE,人员配比是否有要求?
  • SRE 在设计、开发阶段有投入么?投入的内容是什么?

作者简介:肖德时,曾任Redhat Engineering Service 部门内部工具组 Team Leader,是国内第一代 Docker 代码贡献者。现负责数人云产品研发及架构设计工作,对容器等云计算相关技术有深入研究。

已有157人预订
预订达标
文章出炉
交流日期
     
17.01.16
17.02.01
17.02.08 20:30
查看文章评论/提问
谢工
这个话题非常重要,希望更多人参与继续探讨下去!
谢工: 正值GitLab数据库丢失事件,请老师讲讲一次事故引发的SRE思考话题。
李小彦
麻烦您说一下SRE和DevOps有什么区别?
林浩
国内企业稍微大点有运维研发岗,一般都是不太懂运维的开发工程师,很难找到懂运维还有开发能力的人
long
很多基础的东西都已经被最好了,是不是转向开发+数据分析更好呢?
upccup
想问一下肖总SRE是否只适合有大规模IT系统的企业?
General
在企业内部践行SRE体系,除了启用自助化和自动化工具,是否意味着要增加SRE岗位?
xqy
从技术上如果转型,是否程序员会比纯运维更容易适合SRE工作?
刘威波
看到是肖总的文章,果断就进来了。 开始的时候,国内外组件运维团队的出发点是不一样的。国外的出发点是sre用软件开发解决网站的问题,提升网站的可用性和效率;国内的运维是从研发手中接手一些重复性的工作,提高开发的工作效率。 相对国内其他厂商,小米公司的运维理念就相对比较先进一些,小米运维部在组件时是本着noops的观点出发的,希望通过软件开发来消灭重复性的工作,所以小米公司的sre都会开发一些基础组件来降低重复性的工作。
王新明
自动化运维如何逐步开展起来?都有哪些事情要做?这些事情之间的依赖关系如何?自动化运维未来的方向在哪里?
Hongxiu
现在国外都有哪些公司有SRE岗位?国内目前了解到的信息很少。
曹磊
肖总提到的关于用共享经济的来在国内推广SRE,能否结合实际的案例介绍一下如何在中小企业中进行实施,对于企业的IT基础平台过业务系统是否有一些要求?
曹磊
关于自动化演进的五个阶段,能结合实例做一些更为详细的介绍吗?谢谢!
followtimes
看评论有人提到,开发应该比运维更适合SRE岗位,和我想的,SRE的新人是往开发方向发展还是运维方向发展?若是开发方向那为何不直接先去开发岗位,然后再转为SRE?若是运维方向,那么从此开发能力就会很低了,早晚都得被SRE岗位淘汰?觉得很纠结啊
杨凯宁
SRE是否定位为系统运行阶段?还是产品的全生命周期?之前了解到谷歌的数据中心运维人员极少,是否和践行SRE有关?在国内的大环境下,一个中等规模的IT公司若要践行SRE,组织结构应当做和调整,绩效方面当如何评估?
ZzZzzz...
初创或小型公司能否推行SRE,人员配比是否有要求?如果推行,是否有需要比较特别注意的地方?
yoke
SRE在设计、开发阶段有投入吗?投入的内容是什么?
yoke
SRE对系统的第三方开发者,或者,自己的开发团队提供服务或工具的提供吗?
子弹的微波
用程序员的思路解决问题,厌恶重复劳动,不断把问题的解决代码化标准化自动化,是我一直推崇的,感谢作者给我们带来了业界的最佳实践实例,感谢!
路项浩
一个公司SRE的发展方向 跟公司的定位有很大的关系 也和团队leader的推动有关 在中国自下而上的变革一向很少 这跟中国人谦虚 内敛的传统有着莫大的关系
路项浩
肖总觉得国外的SRE比如Google的 是不是就是比较理想的状态,如果不是的话,还有哪些方面可以继续提升?国内的多数还是传统运维,那么肖总觉得国内各公司对SRE的认知都到什么阶段了?如何推动大家向国外的,更好的方向发展?
你可能还喜欢
Docker+K8S 集群环境搭建及分布式应用部署
李熠lynn
JVM 精华知识点汇总
胡玉洋
Docker 入门之个人博客搭建教程
一念成魔
前端游戏框架哪个好
cba
MySQL 数据同步双机互备
小闲丶
美团客户端响应式框架 EasyReact 开源
美团技术团队
微信扫描登录