etcd实战课,etcd 核心原理到大规模实践

你将获得什么?

  • etcd 系统学习路径
  • etcd 核心原理解析
  • 掌握实践中各类 etcd 问题的解决方案
  • 构建高可靠的 etcd 集群运维体系

课程简介

随着 Kubernetes 成为容器编排领域霸主,etcd 也越来越火热。目前,etcd 的 GitHub star 数已超过 34.2K,它的应用场景相当广泛,从服务发现到分布式锁,从配置存储到分布式协调等等。可以说,etcd 已经成为了云原生和分布式系统的存储基石。

另外,etcd 作为最热门的云原生存储之一,在腾讯、阿里、Google、AWS、美团、字节跳动、拼多多、Shopee 等公司都有大量的应用,覆盖的业务可不仅仅是 Kubernetes 相关的各类容器产品,更有视频、推荐、安全、游戏、存储、集群调度等核心业务。

但是很多同学在使用 Kubernetes、etcd 的过程中,或多或少都会遇到下面这些问题:

  • etcd Watch 机制能保证事件不丢吗? (原理类)
  • 哪些因素会导致你的集群 leader 发生切换呢? (稳定性类)
  • 为什么基于 Raft 实现的 etcd 还可能会出现数据不一致呢? (一致性类)
  • 当你在一个 namespace 下创建了数万个 Pod/CRD 资源时,同时频繁通过标签去查询指定 Pod/CRD 资源时,APIServer 和 etcd 为什么扛不住呢? (最佳实践类)

基于此,唐聪老师从自己万级 Kubernetes 集群和 etcd 集群规模的治理相关经验出发,把 etcd 的学习过程分为了大中小三个目标,让你由小及大,从掌握一个个知识点的小目标出发,做到了解、熟练使用 etcd 的中等目标,最终能够完美解决业务过程中的各类痛点。

模块设置

课程主体分为两大模块,分别是基础篇实践篇

基础篇

基础篇会帮助你建立起对 etcd 的整体认知,搞懂读写请求、各个核心特性背后的原理,为后面的实践篇打下基础。

另外,基础篇也是对一个中小型分布式存储系统从 0 到 1 的实现案例解读,学习它你收获的不仅仅是 etcd,更是如何构建分布式存储系统的理论知识。

实践篇

实践篇将带你从 0 到 1 亲手参与构建一个简易的分布式 KV 数据库,进一步提升你对分布式存储系统的认知。为你分析 etcd 在 Kubernetes 中的应用,让你对 Kubernetes 原理有更深层次的理解。

当然,顾名思义,实践篇还会为你解读 etcd 在实际使用过程中可能会出现的各类典型问题,帮助你提前避坑,遇到类似问题时能独立分析、解决。

课程目录

开篇词|为什么要学习etcd?
基础篇
01etcd的前世今生:为什么Kubernetes使用etcd?
02基础架构:etcd一个读请求是如何执行的?
03基础架构:etcd一个写请求是如何执行的?
04 Raft协议:etcd如何实现高可用的、数据强一致?
05鉴权:如何保护你的数据安全?
06租约:如何检测你的客户端存活?
07 MVCC:如何实现多版本并发控制?
08 Watch:如何高效获取数据变化通知?
09事务:如何安全地实现多key操作?
11boltdb:如何持久化存储KV数据?
12压缩:如何回收历史版本数据?
实践篇
13一致性:为什么基于Raft实现的etcd还可能会出现数据不一致?
14db大小:为什么etcd社区建议db大小不超过8G?
15延时:为什么你的etcd请求会出现超时?
16内存:为什么你的etcd内存占用那么高?
17性能及稳定性
(上):如何优化及扩展etcd性能?
18性能及稳定性(下):如何优化及扩展etcd性能?
19实战:如何基于Raft构建一个支持多存储引擎的简易分布式KV服务?
20 Kubernetes基础应用:创建一个Pod背后etcd发生了什么?
21 Kubernetes高级应用:如何优化业务场景使etcd能支撑上万节点集群?
22分布式锁:为什么基于etcd分布式锁比Redis更安全?
23配置及服务发现:解析etcd在APIGateway等开源项目中应用
24选型:etcd/ZooKeeper/Consul等我们该如何选择?
25运维:如何构建高可靠的etcd集群运维体系?
结束语|搞懂etcd,掌握通往分布式存储系统之门的钥匙

讲师介绍

唐聪,腾讯云资深工程师,etcd 活跃贡献者。

唐聪一直从事于内部公共组件建设,曾负责大规模排行榜、Redis 平台建设,目前负责腾讯云及内部公共 etcd 平台的建设与维护,是腾讯云 etcd 负责人。

他主导了腾讯 etcd 平台从 0 到 1 的建设,解决过众多大规模业务增长过程中遇到的存储稳定性、可扩展性等痛点,拥有万级 Kubernetes 和 etcd 集群规模的实战、治理经验。同时,他也是 2020 年 etcd 社区全球 Top3 的活跃贡献者,修复了 etcd 数据不一致、内存泄露、死锁、panic 等众多问题,提升了 etcd 在大规模数据场景下的启动、读性能等。

(0)
上一篇 2021年9月15日 上午7:36
下一篇 2021年9月15日 上午7:44

相关推荐

发表回复

登录后才能评论