深入浅出可观测性，为系统可靠性保驾护航（理论+实战）-nigaeanigaea

你将获得什么？

可观测性痛点概念全析
热门规范与平台的深入解读
高效搭建可观测平台的方法论
可观测性文化全貌与技术前瞻

课程介绍

当下 BAT、美团、字节跳动、快手等一线大厂都在加速推进业务的容器化、云原生化。也正是因此，传统的技术架构面临着巨大的冲击，我们的监控对象也由传统的单体结构，变成了分布式的多个微服务。

在这样的背景之下，很多问题成了开发、测试、运维同学的家常便饭：

某个新版本发布上线之后，发现主机的 CPU 使用率持续飙高，但不知道根本原因在哪，只能根据过往的经验一一排查；
新版本上线之后，很难判断功能是不是完全正常，只能等着用户找客服投诉之后，才知道哪个模块出现了报错；
基础设施方面，通过监控搞了一大堆稀奇古怪的仪表盘，看着花花绿绿一大片，可是又不能反映出业务的真实情况，也不能跟随业务的变化而灵活调整。

局面混乱，效率又不高。可以说，监控，被架到了一个不得不革自己命的位置。而可观测性（Observability）就是解决这些问题的关键。

近几年，可观测性的概念逐渐明晰化，相关产品纷纷涌现，可观测性越来越成为云原生一个绕不开的话题。但是可观测性到底是什么？效果又是否真的能达到预期？

为了解答这些困惑，我们请到了观测云的产品技术总监翁一磊老师。他会结合自己在这一领域多年的经验和思考，带你直抵可观测性的内核，合理、高效地部署可观测平台。

课程设计

专栏主要分为四个部分。

概念篇：梳理计算机和互联网的发展，剖析监控在这一过程中的发展历程。详细解读可观测性相关的基本概念，辨析可观测性和传统监控的区别。借助这些内容，你可以了解可观测性以及相关的概念，为接下来的正式学习做好铺垫。

基础篇：介绍目前可观测领域非常成熟和热门的标准和规范：OpenTelemetry。在此基础上，带你了解如何实现和建立非某个供应商锁定的可观测性。辨析购买或自己搭建（例如基于开源软件再进行一些二次开发）可观测性的利弊。让你拥有全局观念，在有需求的时候理智下判断。

实战篇：这部分是专栏的重头戏，毕竟可观测性最重要的目标就是保障系统和应用的服务可靠性。这个模块会讲到团队协作、可观测驱动的开发、建立、跟踪 SLO 等话题。然后会选取微服务架构的系统，带你搭建起这个系统的可观测性，让你在动手操练的过程中更好地掌握可观测性，并能够通过可观测性来分析和解决问题。

总结与展望篇：为你讲述如何构建可观测性的文化和框架，让你了解在企业中推广可观测性需要优先考虑的关键能力。这一模块还会给你介绍可观测性未来的发展趋势。

课程目录

开篇词
可观测性，让开发和维护系统的你每晚都能睡个好觉!
概念篇
01 以史鉴今:监控是如何一步步发展而来的?
02 基本概念:指标+日志+链路追踪=可观测性?
03 相互对比:可观测性和传统监控有什么区别?
基础篇
04 opeNtelemetry: 如何利用OpenTelemetry采集可观测数据?
05 构建可观测平台:应该购买商业产品还是自己搭建?
实战篇
06 团队合作:不同团队如何高效共建可观测性?
07 软件开发:如何利用可观测性进行驱动?
08 建立SLO:如何为系统可靠性的量化提供依据?
09 跟踪SLO:如何基于错误预算采取行动?
10 实战1:从0到1建立系统应用的可观测性
11 实战2: 基于可观测性数据进行问题分析和根因定位
12 实战3:构建基于Kubernetes的系统可观测性
13 实战4:建立软件持续集成的可观测性
总结与展望篇
14 文化建设:如何构建可观测性的文化和框架?
15 展望未来:可观测性在未来的发展趋势是什么?
结束语
在实践中，用科学的方法分析和解决问题

讲师介绍

翁一磊，观测云产品技术总监，负责观测云售前技术和客户服务工作。曾就职于微软、HP、Dell EMC 等外企。负责过多云管理产品，在解决方案架构、售前以及交付大型项目方面有着多年经验，对于云计算、云原生、可观测性、以及企业级应用生命周期管理也有丰富的相关经验。

深入浅出可观测性，为系统可靠性保驾护航（理论+实战）

你将获得什么？

课程介绍

课程设计

课程目录

讲师介绍

相关推荐

发表回复