分布式链路追踪实战,20讲玩转微服务可观测性系统

lazy - 分布式链路追踪实战,20讲玩转微服务可观测性系统

背景介绍

随着微服务的落地,查找并解决系统问题的难度也在升级。如何从架构层面更好地了解分布式系统,多维度、快速定位并解决问题?这时候就需要引入分布式链路追踪,构建可观测的微服务系统。

无论你是开发、测试、还是运维,提高系统的可观测性,都会减少你的低效劳动,让你的工作更高效。

你会学到什么?

专栏分为 3 大模块,共 21 讲,内容包含可观测性的基本原理、关键步骤、实践应用,带你更加深入了解分布式系统,更具预警性地应对微服务开发中的各种问题。

①可观测性原理:数据追踪的基石是什么、系统日志为何是保障系统稳定的关键、了解系统的指标如何编写……
这一模块先带你了解可观测性中的关键概念和原理,包括数据观测、系统日志、监控指标、链路分析等内容;同时结合实践,告诉你如何更好地观测你的应用程序,以及如何处理真实的业务场景问题。

②告警体系与可观测性:如何从架构层面了解系统,感知业务隐藏问题,并且善用告警系统,快速解决问题?
这一模块主要带你了解如何将可观测性的理念与告警体系结合,形成一套可以落地的规范。

③可观测性的实践应用:ELK 如何收集日志、Prometheus 如何完美地显示指标体系、Zipkin 如何进行分布式追踪、SkyWalking 如何把观测和分析结合起来……
这一部分内容是可观测系统中的关键点,教你如何将第一模块的原理应用到实践中。

你会学到什么?

第一部分:可观测性原理
01 | 数据观测:数据追踪的基石从哪里来?
02 | 系统日志:何以成为保障稳定性的关键?
03 | 日志编写:怎样才能编写“可观测”的系统日志?
04 | 统计指标:“五个九”对系统稳定的真正意义
05 | 监控指标:如何通过分析数据快速定位系统隐患?(上)
06 | 监控指标:如何通过分析数据快速定位系统隐患?(下)
07 | 指标编写:如何编写出更加了解系统的指标?
08 | 链路监控:为什么对于系统而言必不可少?
09 | 性能剖析:如何补足分布式追踪短板?
10 | 链路分析:除了观测链路,还能做什么?
11 | 黑/白盒监控:系统功能与结构稳定的根基
第二部分:告警体系与可观测性
12 | 系统告警:快速感知业务隐藏问题
13 | 告警质量:如何更好地创建告警规则和质量?
14 | 告警处理:怎样才能更好地解决问题?
第三部分:可观测性的实践应用
15 | 日志收集:ELK 如何更高效地收集日志?
16 | 指标体系:Prometheus 如何更完美地显示指标体系?
17 | 链路追踪:Zipkin 如何进行分布式追踪?
18 | 观测分析:SkyWalking 如何把观测和分析结合起来?
19 | 云端观测:ARMS 如何进行云观测?
20 | 运维集成:内部的 OSS 系统如何与观测相结合?
结束语
结束语 | 未来的监控是什么样子?

讲师介绍

刘晗,拉勾技术专家,SkyWalking PMC
曾在多家大型公司负责基础组件、底层框架研发,擅长业务研发、基础架构研发、服务治理、服务观测等方向,对分布式系统观测、系统调优有着丰富的实战经验。目前在拉勾网负责基础组件研发和可观测平台的搭建。

发表评论

邮箱地址不会被公开。

联系我们

侵权投诉:nerds@nigaea.com

工作时间:周一至周五,9:30-18:00,节假日休息

QR code