关于运维:2022-年-DevOps-路线图|Medium

3次阅读

共计 2421 个字符,预计需要花费 7 分钟才能阅读完成。

【文章起源】https://faun.pub/devops-roadm…

DevOps 技能需求量很大,并且须要一直学习须要让本人与市场需求放弃同步。这篇文章是为了分享能够帮忙你的笔记。

从根本上弱小的网络技术
理解 HTTP/2、QUIC 或 HTTP3、第 4 层和第 7 层协定、mTLS、代理、DNS、BGP 等概念,负载平衡的工作原理、IP 表、Internet 的工作原理、IP 地址和计划,最初是网络设计。

把握操作系统基础知识,尤其是 Linux
因为大多数零碎(VM、容器等)都运行 Linux,因而从上到下理解这一点很重要。学习调度、systemd 接口、init 零碎、cgroups 和命名空间、性能调优,并把握命令行实用程序 — awk、sed、jq、yq、curl、ssh、openssl 等。

CI/CD
如果你依然喜爱詹金斯,那很好。然而,世界曾经转向云原生管道。从概念上讲,这个空间没有太大变动,但你能够看看 Github Actions、Tekton 等。如何更好地公布?理解各种部署策略,例如蓝绿和金丝雀。

容器化和虚拟化
除了风行的 Docker 运行时,尝试 containerd、podman 等并理解如何容器化应用程序、如何实现容器安全性、如何在 Kubernetes 中运行和编排 VM,请参阅 KubeVirt 我的项目。

容器编排
Kubernetes 当初是运行容器的事实上的规范。网上有很多学习 Kubernetes 的内容。专一于配置最佳实际、利用程序设计、安全性和调度。设置集群当初变得微不足道,但第二天的操作性问题,例如设置、监控、日志记录、CI/CD、如何扩大集群、老本优化和安全性是人们可能冀望你提出的一些问题。

大规模可观测性
大多数工程师都晓得 Prometheus Grafana 堆栈或相似堆栈。趋势表明,从性能和老本的角度来看,许多组织正在整合他们的 Kubernetes 集群和可观测性,这很有帮忙。理解 Prometheus 的高级配置和架构,以及如何扩大它们。钻研 Thanos、Cortex、VictoriaMetrics、Datadog 和 Loki 等技术。间断剖析工具,例如 Parca、潜望镜、超跟踪和具备凋谢遥测的分布式跟踪。诸如 Istio 之类的服务网格是云原生配方中的一种风行成分。

平台团队作为产品团队
平台团队的性能越来越像一个集中的产品团队,专一于他们外部的平台客户,如开发人员和测试人员。指标是改善工作形式并为团队带来一些秩序。尝试即兴解决开发人员和 QA 团队面临的问题。你是其余团队的推动者,而不是在一个核心团队中承当所有工作,而是领导开发团队承当典型的 DevOps 职责。这样你就能够扩充规模并且不会适度烧伤本人。

平安
在许多小型组织中,平安是二等公民。产品性能被赋予了更多的优先权。然而,因为越来越简单的攻打和各种严格的合规要求,公司正在适应左移安全策略。端到端加密、弱小的 RBAC、IAM 策略、治理和审计、NIST、CIS、ISO27001 等基准的施行很常见。容器平安、策略即代码、云治理和供应链平安是热门话题。

编程
DevOps 或 SRE 角色当初正在思考开发人员的跨畛域关注点,并创立有助于在执行规范的同时进步生产力的工具。制作高质量的平台组件须要良好的软件工程实际和技能。

我不能对此给予足够的压力。优良的组织正在寻找具备良好编程教训的平台工程师。这在站点可靠性工程中也很重要,您须要精通编程,可能浏览、了解和调试别人编写的代码,并在必要时对其进行修复。

Python 和 Golang 是最风行的。我的倡议是 Golang,因为它具备弱小的并发性、严格的类型查看、在各种组织中的采纳、工具链以及许多次要我的项目都是应用 Golang 构建的个性,因而通过 Python 学习是有意义的。

您能够尝试一些简略的事件:

用您的编程语言编写 CLI。

学习编写 REST API 并与数据库交互

并行性和并发性

基础设施即代码
Terraform 是我的项目中的规范。一旦你了解了这个概念,就很容易适应任何其余工具,因为它们中的大多数都是基于 DSL 的。


大多数云以雷同的形式工作。因而,如果您相熟一种云,您能够轻松地与其余云提供商单干。专一于如何以高度可用、弹性、平安且经济高效的形式应用云原生组件设计应用程序。

技术写作
您可能想晓得为什么我在探讨 DevOps 时要议论技术写作。很多人对此并没有给予足够的器重,但这对于你如何与其余团队进行沟通和单干十分重要。工作的将来是近程的,电子邮件、闲散 / 团队、聊天是与别人交谈和传播想法的次要渠道。

您可能会定期创立诸如运行手册、预先剖析、RFC、架构决策记录和软件设计文档等文档。一个清晰、易于了解的文档能够发明奇观。它能够帮忙您节俭您和读者的工夫并进步整体生产力。倡议你浏览这篇文章。

现场可靠性工程
DevOps 和 SRE 之间的界线越来越窄。在某些组织中,同一个人可能同时负责这两个角色。理解 SLI、SLO 和谬误估算以及 SRE 实际背地的概念。每个组织的做法都不一样,所以我不倡议将其他人的文化复制粘贴到您的团队中。参考 Google SRE 文化。

论断
就集体而言,我很快乐能在往年追随。这不是一个确定的列表,因为它会随着工夫而变动。

服务网格——Istio、Cilium Sidecarless 网格、Tetrate 和 Solo 的 Gloo 网格产品。

如何进步开发人员的生产力?它是文化、自动化和工具的混合体。

SRE 平台——蜂窝,Last9。

DevPortals——再次与进步生产力和弥合常识差距的动机相关联。

可观测性——诸如凋谢遥测、超跟踪、灭霸、VictoriaMetrics、Vector 等技术。

安全性——供应链平安、代码签名、增强云平安。

Golang——进步以后技能。

无服务器计算和事件驱动架构

Web3 — 理解与 DevOps 和基础设施相干的环境

放弃好奇心并一直学习。继续一口大小的学习很容易,您能够在全职工作的同时进行。如果您仍有任何疑难,请随时与我预约工夫。我很乐意提供帮忙。

正文完
 0