保存成功
保存失败,请重试
提交成功

运维达尔文:SRE 的自动化演进

作者/分享人:IT菜鸟
一个IT菜鸟

SRE 是 Site Reliability Engineer 的简称,它是源起于国外互联网企业的一个运维理念或者一个职业的定义。区别于传统运维模式,SRE 强调自动化,主张通过工程开发使用一些场景化的自动运维工具来应对规模性的扩张。本场Chat中我们将通过一些国外 SRE 实践的案例来介绍一下 SRE 自动化的演进。内容包括:

  1. 自动化对 SRE 的价值;
  2. 自动化演进的历程;
  3. 国外互联网企业 SRE 自动化应用案例;
  4. 国内运维领域自动化实践。

实录提要:

  • SRE 是否只适合有大规模 IT 系统的企业?
  • SRE 和 DevOps 有什么区别?
  • 如果从技术上转型,是否程序员比纯运维更容易适合 SRE 工作?
  • 自动化运维如何逐步开展起来?都有哪些事情要做?
  • 现在国外都有哪些公司有 SRE 岗位?
  • 关于自动化演进的 5 个阶段,能结合实例做一些更详细的介绍么?
  • SRE 是否定位为系统运行阶段?还是产品的全生命周期?
  • 初创或小型公司能否推行 SRE,人员配比是否有要求?
  • SRE 在设计、开发阶段有投入么?投入的内容是什么?

作者简介:肖德时,曾任Redhat Engineering Service 部门内部工具组 Team Leader,是国内第一代 Docker 代码贡献者。现负责数人云产品研发及架构设计工作,对容器等云计算相关技术有深入研究。

已有164人预订
预订达标
文章出炉
交流日期
     
17.01.16
17.02.01
17.02.08 20:30
查看文章评论/提问
jacty3 年前
在企业内实施SRE,对基础平台和业务系统有要求吗?是否需要配合进行改造?
jacty3 年前
SRE所承担的研发工作内容 与传统的开发部门有何区别呢?
jacty3 年前
SRE是如何帮助客户打造强大的软件层基础架构的呢?
jacty3 年前
sre是不是要掌握大数据相关的技术?
jacty3 年前
如何协调SRE研发和运维的的时间?怎样才能保证SRE有足够的时间去研究系统架构,开发工具?在文章中有如下内容,时常会有处理琐事占据了几乎所有的工作时间的情况,那么有什么好的办法避免这种情况呢?或者说Google是如何保证SRE的那50%的时间的? “Google公开提出SRE要保证至少50%的时间在软件工程项目上,因为如果不加以控制,琐事会变得越来越多,并迅速占据SRE人员的大部分时间。”
你可能还喜欢
如何判断一家公司是否靠谱
张亮
程序员的数学修养
李烨
三年 Vue 前端开发的血与泪总结
程序员骚俊
Linux 系统必知必会
Peter
实战解决高并发数据入库 Redis 队列缓存+MySQL 批量入库(Spring Boot)
微服务实战生产
调用链监控:微服务时代每个程序员必须点亮的技能点
编码
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效