400-888-5228

课程概述

课程帮助学员理解:

  • SRE 如何支持组织 可持续、经济地扩展关键服务
  • 为什么引入 SRE 必须伴随组织结构调整与文化转型
  • SRE 的工程化方法如何帮助减少人为错误、提升自动化
  • SLO/SLI 如何成为可靠性管理的核心
  • 如何推动整个组织共同参与“可靠性目标”建设

本课程包含实际案例、企业经验和真实场景,确保学员能够将课程内容应用到工作中,并具备:

  • 制定 SLO
  • 衡量可靠性
  • 评估错误预算
  • 推动跨团队合作

的实战能力。

课程帮助学员顺利通过 SRE Foundation 国际认证考试

课程资料

学员将获得:

  • 16 小时官方授权讲师授课
  • 官方《学员手册》(可作为课后参考资料)
  • 课程练习与概念应用活动
  • 模板、工具、示例文档
  • SRE 社区与增值资源

 

课程对象

本课程适合希望提升服务可靠性或推动 SRE 落地的各类专业人士,包括:

  • 组织中推动可靠性提升的负责人
  • IT 领导者、业务管理者
  • DevOps 工程师、SRE 工程师
  • 产品负责人、Scrum Master
  • 软件工程师、系统集成人员
  • IT 经理、IT 总监、技术团队负责人
  • 变革推动者(Change Agents)
  • 工具平台提供商
  • 对可靠性工程有兴趣的从业者

课程目标

完成本课程后,学员将能系统理解:

  1. SRE 的起源与在 Google 的发展历程
  2. SRE 与 DevOps 及其他框架的关系
  3. SRE 的底层原则与关键实践
  4. 以用户为中心的服务等级目标(SLO)
  5. 服务等级指标(SLI)与现代监控体系
  6. 错误预算与错误预算政策
  7. Toil(重复劳动)的影响与消除方法
  8. 可观测性对服务健康度的意义
  9. SRE 工具链、自动化方法与安全要求
  10. 反脆弱性理念与从失败中学习的方法
  11. SRE 对组织文化与工作方式的影响

课程收益

通过本课程,学员可系统掌握 SRE 核心原则、实践方法及与 DevOps 等框架的协同逻辑,深入理解 SLO/SLI 设计、错误预算管理、Toil 消除等关键模块。具备制定可靠性目标、搭建现代监控体系、推进自动化落地的实战能力,能有效减少人为错误、提升服务稳定性。同时,将学会运用反脆弱性思维从失败中学习,推动跨团队协作与组织文化转型。课程助力学员顺利通过 SRE Foundation℠国际认证,为个人职业发展赋能;更能帮助组织可持续、经济地扩展关键服务,在创新与可靠性间找到平衡,夯实数字化转型核心竞争力。

课程时长2天

课程大纲

课程导入
课程目标
课程议程
模块 1:SRE 的原则与实践(SRE Principles & Practices)
什么是站点可靠性工程(SRE)
SRE 与 DevOps 的区别
SRE 的原则
SRE 的关键实践
模块 2:服务等级目标与错误预算(SLOs & Error Budgets)
什么是 SLO(服务等级目标)
什么是错误预算
错误预算政策如何影响发布与运营
模块 3:减少 Toil(重复性事务工作)
Toil 的定义
为什么 Toil 会拖垮组织生产力
消除 Toil 的实际步骤
模块 4:监控与服务等级指标(Monitoring & SLIs)
什么是 SLI(服务等级指标)
现代监控体系
可观测性(Observability)的核心要素
模块 5:SRE 工具与自动化(SRE Tools & Automation)
自动化的定义
自动化重点领域
自动化类型分层体系
安全自动化(Secure Automation)
主流自动化工具与实践
模块 6:反脆弱性与从失败中学习(Anti-Fragility & Learning from Failure)
为什么要从失败中学习
反脆弱性(Anti-Fragility)的价值
如何平衡风险、创新与可靠性
模块 7:SRE 的组织影响(Organizational Impact of SRE)
为什么企业开始引入 SRE
SRE 的组织采用模式
On-Call(值班制度)的必要性
Blameless Post-Mortems(无责复盘)
SRE 如何支持规模化扩展
模块 8:SRE 与其他框架、发展趋势(SRE, Other Frameworks & The Future)
SRE 与其他常见框架(ITIL、DevOps、Lean 等)的协同关系
SRE 的未来趋势
参考资料与扩展阅读

考试信息

  • 时长:60 分钟
  • 题型:40 道单选题
  • 通过标准:65%
  • 考试机构:DevOps Institute
  • 获得证书:SRE Foundation 国际认证

为什么选择艾威

艾威培训是PeopleCert与DevOps Institute官方授权的培训与认证中心,具备国际权威认证资质。自2003年成立以来,艾威专注于IT管理与技术人才培养,已深耕培训行业20余年,服务超过10,000家企业客户,涵盖金融、互联网、制造、政府等多个行业。

我们不仅具备强大的讲师团队和完善的课程体系,更注重实战导向与企业落地效果,始终坚持“高标准、强落地、重转化”的交付理念,助力企业在数字化转型中构建核心竞争力。

培训咨询
  • 2025-12-2 20:00
    【🔥年度平均观看时长TOP1】AI时代的安全挑战:攻心为上 | AI瞄准人性弱点:心理影响力武器升级
  • 2025-12-4 20:00
    【🔥年度单场观看人数TOP1】AI赋能数据管理:从数据孤岛到智能协同的突破
  • 2025-12-9 20:00
    【🔥单场点赞最高 年度互动之王】圆卓对话:聊聊BA这个职位那些被问及最多的“尖锐的问题
  • 2025-12-11 20:00
    【🔥年度爆款 项目管理课】项目经理不会用AI?那你真的落后了!
  • 2025-12-16 20:00
    【🔥年度爆款 企业架构课】AI赋能企业架构:TOGAF架构框架下的智能化转型
  • 2025-12-18 20:00
    【🔥年度爆款 流程管理课】从能力视角看流程:建立可视化预约直播的组织流程框架
  • 2025-12-23 20:00
    【🔥年度爆款 IT管理课】AI赋能ITIL4:打造未来服务管理的新标准
  • 2025-12-25 20:00
    【🔥2025年度新趋势之一】从传统审计到人工智能审计:AAIA引领审计数字化转型
  • 2025-12-30 20:00
    【🔥学员分享职场故事 最具价值AI实战课】Deepseek如何在工作中提效?
  • 更多直播讲座
    小艾老师还在安排中…
查看全部 >

扫码一键预约全部

查看更多 > 查看更多 >

数字化转型8大核心认证

  1. PMP项目管理认证

    艾威最近一期班: 针对2026年03月考试
  2. CBAP业务分析认证

    艾威最近一期班·开课时间:2026-01-31
  3. CBPP流程管理认证

    艾威最近一期班·开课时间:2025-12-13
  4. ITIL4 IT管理认证

    艾威最近一期班·开课时间:2025-12-27
  5. TOGAF企业架构认证

    艾威最近一期班·开课时间:2025-12-20
  6. CDMP数据管理认证

    艾威最近一期班·开课时间:2026-03-07
  7. CISA信息安全审计师认证

    艾威最近一期班·开课时间:2025-12-06
  8. CISSP信息安全专家认证

    艾威最近一期班·开课时间:2026-01-17