容器网络通,但业务网络不通,怎么办?

42次阅读

共计 837 个字符,预计需要花费 3 分钟才能阅读完成。

本着为大家分享有用的技能和知识的原则,专门出了一个解决 bug 的主题分享。具体的 bug 描述可以看下面(亲身经验传授给你们)
问题一描述:
某线上业务有 A,B 两个集群,集群之间存在横向访问,当 A 集群中的某个容器 (A.a) 重建 (发布更新) 之后发现,(A.a)可以 ping 通 B 集群中的 (B.b) 容器,而通过 curl 和 telnet 业务端口的时候是连接被拒绝;第一直觉是业务自身的问题,就在 B.b 容器里启动了 python 测试服务,在 A.a 容器里通过 curl 测试也没通,那到底是不是业务自身的问题?该如何排查此类呢?是不是 k8s 或 docker 的 bug 呢?
问题二描述:
大家都知道 etcd 作为 k8s 集群的核心数据存储系统,堪称是 k8s 的大脑,所以 etcd 的稳定级别要求不言而喻了,那么大家试想一下,如果 etcd 里的数据假如被误删了,后果会怎么样呢?该如何做 etcd 的故障演练呢?通过故障演练又会引发出哪个 k8s api-server 的 bug 呢?
如果你也有遇到类似的问题或者你想要知道面对这些问题时该如何下手解决?那就来听听我们明晚的分享课,为你揭晓详细的解决办法。
分享讲师:GY 老师 10 年一线软件开发经验,先后经历了传统安全公司,以及多家互联网公司;在安全开发方面,曾开发过 Linux 防火墙、web 应用防火墙、Linux 安全内核加固,基于大流量的 Web 安全威胁分析等项目;在互联网公司工作时,曾基于 DPDK 高性能网络开发框架开发过基于全流量的网络流量分析平台和基于 Sflow 网络流量分析平台,基于 Golang 开发 SmartDNS 等;开发语言也是从 C -> python -> golang 的转变过程?现从事基于 K8S 和 Docker 在私有云平台建设方面的研发工作;具备丰富的 Linux 系统开发经验、网络开发经验以及项目管理经验;目前开发工作 90+% 都在用 Golang,Golang 是一门简洁、高效、强大且灵活的编程语言。
添加 WeChat:17812796384 获取参与方式(倾听大佬给你普及 bug 的解决办法)

正文完
 0