乐趣区

每个人都必须遵循的九项Kubernetes安全最佳实践

作者:StackRox 产品经理 Connor Gilbert
上个月,Kubernetes(世界上最受欢迎的容器编排器)生态系统因发现 Kubernetes 的第一个主要安全漏洞而动摇。该漏洞(CVE-2018-1002105)使攻击者能够通过 Kubernetes API 服务器破坏集群,允许他们运行代码来安装恶意软件等恶意活动。
今年早些时候,Tesla 遭遇了复杂的加密货币挖掘恶意软件感染,由 Kubernetes 控制台错误配置引起。攻击者利用了特定 Kubernetes 控制台没有密码保护的事实,允许他们访问其中一个包含 Tesla 大型 AWS 环境访问凭据的 pod。
随着组织加速采用容器和容器编排器,他们需要采取必要措施来保护计算基础架构中的这一关键部分。为了帮助完成这项工作,请查看这九项根据客户意见的 Kubernetes 安全最佳实践,你应遵循以帮助保护你的基础架构。
1. 升级到最新版本
每个季度更新都会添加新的安全功能,而不仅仅是错误修复,为了充分利用它们,我们建议你运行最新的稳定版本。最好的办法是使用最新版本运行最新补丁,特别是考虑到 CVE-2018-1002105 的发现。越是落后升级和支持可能会越难,所以计划每季度至少升级一次。使用托管的 Kubernetes 供应商可以非常轻松地进行升级。
2. 启用基于角色的访问控制(RBAC)
基于角色的访问控制(RBAC)控制谁可以访问 Kubernetes API 以及他们的权限。默认情况下,RBAC 通常在 Kubernetes 1.6 及更高版本中启用(某些托管供应商稍迟),但如果你从那时起进行了升级并且未更改配置,则需要仔细检查你的设置。由于 Kubernetes 授权控制器的组合方式,你必须同时启用 RBAC,并禁用传统的基于属性的访问控制(ABAC)。
一旦实施了 RBAC,你仍然需要有效地使用它。通常应避免使用集群范围的权限,而使用特定于命名空间的权限。避免给予任何集群管理员权限,即使是为了调试,仅在需要的情况下,根据具体情况授予访问权限会更安全。
你可以使用 kubectl get clusterrolebinding 或 kubectl get rolebinding -all-namespaces 来探索集群角色和角色。快速检查谁被授予特殊的“cluster-admin”角色,在这个例子中,它只是“masters”群:

如果你的应用程序需要访问 Kubernetes API,请单独创建服务帐户,并为每个使用站点提供所需的最小权限集。这比为命名空间的默认帐户授予过宽的权限要好。
大多数应用程序根本不需要访问 API,对于这些可以将 automountServiceAccountToken 设置为“false”。
3. 使用命名空间建立安全边界
创建单独的命名空间是组件之间重要的第一级隔离。当不同类型的工作负载部署在不同的命名空间中时,我们发现应用安全控制(如网络策略)要容易得多。
你的团队是否有效地使用命名空间?通过检查任何非默认命名空间来立即查找:

4. 隔离敏感的工作负载
为了限制受损的潜在影响,最好在一组专用计算机上运行敏感的工作负载。此方法降低了通过共享容器运行时(runtime)或主机,安全性较低的应用程序访问敏感应用程序的风险。例如,受损节点的 kubelet 凭证,通常只有在机密内容安装到该节点上安排的 pod 中时,才能访问机密内容。如果重要机密被安排到整个集群中的许多节点上,则攻击者将有更多机会窃取它们。
你可以使用节点池(在云或本地)和 Kubernetes 命名空间、污点(taint)、容差和其他控件来实现隔离。

5. 保障云元数据访问安全
敏感元数据(例如 kubelet 管理员凭据)有时会被盗或被滥用以升级集群中的权限。例如,最近的 Shopify 错误赏金(bug bounty)披露,详细说明了用户如何通过混淆微服务,泄漏云供应商的元数据服务信息来升级权限。GKE 的元数据隐藏功能会更改集群部署机制以避免此暴露,我们建议使用它直到有永久解决方案。在其他环境中可能需要类似的对策。
6. 创建和定义集群网络策略
网络策略允许你控制进出容器化应用程序的网络访问。要使用它们,你需要确保拥有支持此资源的网络提供程序,对于一些托管的 Kubernetes 供应商,例如 Google Kubernetes Engine(GKE),你需要选择启用。(如果你的集群已经存在,在 GKE 中启用网络策略将需要进行简短的滚动升级。)一旦到位,请从一些基本默认网络策略开始,例如默认阻止来自其他命名空间的流量。
如果你在 Google 容器引擎中运行,可以检查集群是否在启用了策略支持的情况下运行:

7. 运行集群范围的 Pod 安全策略
Pod 安全策略设置在集群中允许运行工作负载的默认值。考虑定义策略,并启用 Pod 安全策略许可控制器,指令因云供应商或部署模型而异。首先,你可以要求部署删除 NET_RAW 功能,以抵御某些类型的网络欺骗攻击。
8. 加固节点安全
你可以按照以下三个步骤来改进节点上的安全状态:

确保主机安全且配置正确。其一方法是根据 CIS 基准检查你的配置。许多产品都有自动检查器,可以自动评估这些标准的符合性。

控制对敏感端口的网络访问。确保你的网络阻止访问 kubelet 使用的端口,包括 10250 和 10255。考虑除了可信网络以外限制对 Kubernetes API 服务器的访问。恶意用户滥用对这些端口的访问权限,在未配置为需要在 kubelet API 服务器上进行身份验证和授权的集群中运行加密货币挖掘。

限制对 Kubernetes 节点的管理访问。通常应限制对集群中节点的访问。调试和其他任务通常可以在不直接访问节点的情况下处理。

9. 启用审核日志记录
确保你已启用审核日志,并监视它们是否存在异常或不需要的 API 调用,尤其是任何授权失败,这些日志条目将显示状态消息“禁止(Forbidden)”。授权失败可能意味着攻击者试图滥用被盗的凭据。托管 Kubernetes 供应商(包括 GKE),在其云控制台中提供此数据,并允许你设置授权失败警报。
下一步
遵循这些建议以获得更安全的 Kubernetes 集群。请记住,即使你按照这些提示安全地配置 Kubernetes 集群,你仍然需要在容器配置的其他方面及其运行时操作中构建安全性。在提高技术堆栈的安全性时,寻找能够为容器部署提供中心治理点的工具,并为容器和云原生应用程序提供持续监控和保护。

2019 年 KubeCon + CloudNativeCon 中国论坛提案征集(CFP)现已开放
KubeCon + CloudNativeCon 论坛让用户、开发人员、从业人员汇聚一堂,面对面进行交流合作。与会人员有 Kubernetes、Prometheus 及其他云原生计算基金会 (CNCF) 主办项目的领导,和我们一同探讨云原生生态系统发展方向。
2019 年中国开源峰会提案征集(CFP)现已开放
在中国开源峰会上,与会者将共同合作及共享信息,了解最新和最有趣的开源技术,包括 Linux、容器、云技术、网络、微服务等;并获得如何在开源社区中导向和引领的信息。
大会日期:

提案征集截止日期:太平洋标准时间 2 月 15 日,星期五,晚上 11:59
提案征集通知日期:2019 年 4 月 1 日
会议日程通告日期:2019 年 4 月 3 日
幻灯片提交截止日期:6 月 17 日,星期一
会议活动举办日期:2019 年 6 月 24 至 26 日

退出移动版