网络排查案例,课案例+策略+技巧,全面提升网络排查能力

你将获得什么?

  • 40+ 真实网络排查案例解析
  • 20 个网络故障疑难点的排查思路
  • Wireshark、tcpdump 工具使用技巧
  • 18 年架构老兵的网络排障心法

课程介绍

网络排查可以说是每个开发、运维、测试的基本能力,尤其是对服务端工程师来说,一个功能上线后出了问题,能快速定位、排查、解决十分必要,这也是为什么面试时经常会考 HTTP、TCP 协议相关的内容,你总要弄清楚网络传输的底层逻辑。

当然,程序本身还好排查,主要是因为程序在自己这边,只要花时间总有希望搞定。而网络的难度,一方面是领域不同,很多专门写程序(特别是偏上层的应用)的工程师,对网络很不了解;一方面网络是双方的事,也就是客户端和服务端,还包括中间路径上的设备等,“变量”更多……

尤其是这几年,随着微服务和云计算的普及应用,越来越多的系统从本地的单体服务,变成跨网络的分布式的微服务。随之而来的,就是数不清的跟网络相关的问题。比如:

  • 为什么我的应用在单体应用的时候很正常,拆分成微服务以后却时常超时、报错呢?
  • 为什么我的带宽是足够的,但数据传输速度却很慢?
  • 为什么我的应用偶尔会卡住,但又不是每次都这样?
  • 为什么……

面对这么多问题,我们经常束手无策。当然也有一波优秀的 “SRE”(Server Restart Engineer),遇到问题先上“重启大法”,也许也能搞定不少问题。但是,根因依然是未知,即使问题暂时消失了,不知道什么时候,它又会再次到来,然后再次重启……

可见,我们的工程师,太需要网络排查方面的能力了。

但是,因为大部分同学并不是网络出身,对于跟网络相关的问题,经常无从下手,或者事倍功半。所以这次,我们邀请了 eBay 的资深运维专家杨胜辉,围绕案例这个核心,展开排查过程,并会聚焦到工具的使用,以及深入到关键技术点的分析上,让你能真正把问题根因搞清楚,把抓包分析技术掌握住。并通过对底层原理和实践经验的理解,达成融会贯通的目的,从而实现真正突破网络排查瓶颈的最终目标。

网络排查案例,课案例+策略+技巧,全面提升网络排查能力

课程模块设计

课程主要分为五大模块。

  • 预习篇

从网络分层模型出发,来带你了解、学习并掌握整个网络世界的大体层次,以及每层的相关工具。然后带你进入抓包分析这个技术殿堂,了解它的历史和现在,以及初步的使用方法。通过对分层模型和每层工具的理解,以及对抓包分析技术的认识,你就能打下网络排查的底层基础,为后续的学习铺平道路。

  • 实战一:TCP 真实案例揭秘篇

接下来,我们就要进入真正的实战了。这个部分会从各种跟 TCP 相关的实际案例出发,来带你了解、学习并掌握 TCP 这个精密仪器的核心技术,包括传输性能的关键点、TCP 重传的原因和对策、拥塞的优化策略、TCP 保活机制等。通过一个个真实的案例,帮助你达成对这些核心知识点的真正理解,最后能够融会贯通,再也不怵 TCP 相关的难题。

  • 实战二:应用层真实案例揭秘篇

在理解了 TCP 这部重要篇章之后,网络排查的核心知识,你就掌握了快一半了。不过,还有另外一个同等重量级的篇章等待你去学习,它就是应用层网络排查。所以,这个模块会从一个个典型的应用层网络排查案例出发,来带你了解、学习并掌握如何排查应用层的网络问题,让你通过对抓包分析这个核心技术在应用层的运用,搭建起应用和网络之间的“桥梁”。学完这个部分后,你在应对应用层的网络问题时就会成竹在胸了。

  • 实战三:不用抓包就能做的网络排查篇

掌握抓包分析相当于掌握了网络排查的主干,但还需要补充枝叶,这样你的网络排查技能树才足够完整。所以在这个模块里,依然是从实际案例出发,来带你了解、学习并掌握抓包分析之外的其他网络排查方法,包括工具的背后原理、使用场景、个人总结,让你能够通过对原理和实践经验的理解,达成融会贯通的目的。

  • 总结篇

最后,会带你整体沉淀升华一下,一起把前面学习过的网络知识、抓包分析技术、所有其他的网络工具的技巧复习一遍,把它们打碎后,再次拼接在一起,形成你自己的技术体系。这样,你不仅可以学习到老师的经验,还能够转化为你自己的理解,从而实现你真正突破网络排查瓶颈的这个最终的目标。

课程目录

开篇词|网络排查是工程师的必备能力
预习篇
01网络模型和工具:网络为什么要分层?
02抓包分析技术初探:你会用tcpdump和Wireshark吗?
实战一:TCP真实案例揭秘篇
握手与挥手
03握手:TCP连接都是用TCP协议沟通的吗?
04挥手:Nginx日志报connection reset by peer是怎么回事?
防火墙
05定位防火墙:传输层的对比分析
06定位防火墙:网络层的精确打击保活/心跳
07保活机制:心跳包异常导致应用重启?
分段
08分段:MTU引发的血案
传输效率
09窗口:TCPwindow full会影响传输效率吗?
10长肥管道:为何文件传输速度这么慢?
11拥塞:TCP是如何探测到拥塞的?
重传
12重传的认识:重传到底是怎么回事?
13重传的再认识:没有任何丢包却也一直重传?
DDOS
14用Wireshark把DDOS攻击照出原形
实战二:应用层真实案例揭秘篇
HTTP排查
15Nginx的499状态码是怎么回事?
16Nginx为什么回复HTTP400?
17为什么前端页面里多选一个城市就报错?
18偶发性问题如何排查?
TLS排查
19TLS的各种特性:TLS握手为什么会失败?
20TLS加解密:如何解密HTTPS流量?
系统排查
21为什么用了负载均衡更加不均衡?
22为什么压力测试TPS总是上不去?
实战三:不用抓包就能做的网络排查篇
23路径排查:没有网络设备权限要如何做排查?
24丢包:如何确定丢包的存在及其程度?
总结篇
25抓包分析的回顾、拾遗,和提高
结束语|珍惜握手,难说再见

讲师简介

杨胜辉,eBay 资深运维专家,流量系统负责人。主要负责 eBay 全球的流量管理业务,推动 Kubernetes 在 eBay 流量管理场景中的落地。

杨胜辉是一名经验丰富的运维专家。在公有云公司,他解决过很多网络相关的疑难杂症,是技术服务团队的中流砥柱。在 eBay,他作为 Team Leader,积极推动新技术的落地,包括 Envoy、eBPF 等。他对于网络排查这个领域也深感兴趣,在 18 年工作经验的基础上,不断打磨出了对网络排查这个宏大主题的认知和实践体系,尤其在抓包分析这个领域的能力颇为突出。

杨胜辉乐于分享,擅长把复杂的技术用简单的语言讲清楚。他坚信,在容器化的今天,网络通信已经取代本地通信,成为应用间进行沟通的主要媒介,网络排查是每个工程师都应该掌握的必备技能。

发表评论

登录后才能评论