有人建了一个 GitHub 仓库,专门汇总使用 Kubernetes 失败的案例。 项目创建者表示,Kubernetes 是一个相当复杂的系统,它带有许多活动部件,生态在不断发展,并且还在添加更多层,比如 Service Mesh。而在这样的情况下,似乎业内缺乏真实而引人注意的 Kubernetes 失败案例给大家相互借鉴。于是他创建了这么一个仓库,希望这些惨痛的经历可以给包括 SRE、Ops、平台与基础设施团队在内的 Kubernetes 操作人员一些学习的机会,减少在生产中运行 Kubernetes 的风险。 目前项目已经更新了 30 余篇文章,涉及内容包括配置改变、数据被清空、GKE 集群升级事故、模板线行为误解、集群中 DNS 掉线与应用迁移中断等,具体内容查看:https://k8s.af 你使用 Kubernetes 有没有过翻船经历,欢迎留言分享。 |