关于云原生:云原生吞噬世界OID-China-2021-云原生基础设施论坛为你解密

69次阅读

共计 10150 个字符,预计需要花费 26 分钟才能阅读完成。

这个图大家肯定相熟又生疏。

2011 年,Marc Andreessen 在其发表的出名文章中写到:“软件正在吞噬世界”;三年后 Jonathan Bryce 补充说:“世界的所有源于开源”;再之后,业内广泛认同“云计算已扭转了天空的色彩”;但当初云计算概念又被清晰细分 ——“云原生”才是那条最大的鱼。

随同着基础设施代码化、服务性能基础设施化,云原生的概念曾经逐渐深入人心。而容器,作为不可变基础设施的原子载体,也成为了云原生基础设施的基石。

到底为何云原生吞噬世界?云原生又会如何吞噬世界?站在容器角度,咱们会看到将来云原生基础设施的哪些技术趋势?

在 OpenInfra Days China 2021 云原生基础设施论坛上,来自 DatenLord、Flomesh、Intel、StreamNative、阿里云、战火通信、浪潮、灵雀云、绿盟科技、蚂蚁团体、青云等当先企业的技术专家,将围绕云原生技术的最新倒退动静和技术实际展开讨论。

议题简介

王志国:容器存储卷弹性扩容

演讲者信息:

王志国,高级容器云平台研发工程师,就任于济南浪潮数据科技有限公司。次要负责基于 CSI 的容器云平台存储解决方案的设计、开发和优化。

内容摘要:

随着云原生技术的一直倒退,Kubernetes 作为容器编排畛域事实标准曾经成为不争的事实,针对有状态类型的业务,容器编排层提供稳固高效的存储能力的需要日趋强烈。以 CSI 为根底的云原生存储解决方案一直成熟,针对长久化卷的创立、手动扩容、快照 / 备份、删除等惯例性能可能满足用户需要,因为用户业务对存储容量的不可预测性,仅依附运维人员手动扩容来解决长久化存储卷容量有余的问题,往往存在以下问题:

扩容不及时,导致长久化存储卷写满将会造成容器利用业务中断,即便局部业务扩容胜利,因为数据完整性等问题也无奈疾速复原;业务数据量无奈精确预测,扩容容量不明确,导致存储资源利用率低或频繁扩容;须要人工染指,保护老本高;

该议题通过收集容器存储理论应用过程发现中的重要问题,进行剖析、钻研并开发相干的解决方案,旨在加强存储的稳定性,进步存储资源利用率,欠缺异样解决机制,从而切实进步容器利用业务的高可用性,晋升云平台的价值。

刘梦馨:基于 Kube-OVN 的 OpenStack 和 Kubernetes 的网络互通

演讲者信息:

刘梦馨,灵雀云资深研发工程,Kube-OVN 我的项目维护者

内容摘要:

目前应用 OpenStack 治理虚拟化工作负载,Kubernetes 治理容器化工作负载的场景越来越风行,然而如何将两者之间的网络买通实现互访成为了越来越辣手的问题。在 Kube-OVN 中,咱们针对不同场景需要提出了两种买通网络的解决方案,一种可能通过 ovn-ic 买通独立部署的 OpenStack 和 Kubernetes 之间的网络,另一种可能通过交融部署的形式将 OpenStack 和 Kuberentes 基于同一个 OVN 进行网络管制并实现互联互通。目前两种计划都曾经开源,心愿能失去社区更多的反馈。

王君毅:Kubernetes 集群中基于 CRI-RM 实现 CPU 和 NUMA 绑定的 AI 训练减速实际

演讲者信息:

王君毅,在英特尔数据中心部门负责计划架构师, 负责英特尔精选开源云,HPC 上云,SmartNic/IPU, SPECVIRT, SPECLOUD, OpenStack 大规模部署,PMEM KVM 优化等我的项目。
王德奎,浪潮电子信息产业股份有限公司架构师
陈培,浪潮电子信息产业股份有限公司研发经理
林新宇,浪潮电子信息产业股份有限公司高级工程师

内容摘要:

目前基于 Kubernetes 的资源管理能力进行 AI 训练是一个次要趋势。在 Kubernetes 集群内应用 CRI-RM 组件进行节点内资源的调配,用于减速 AI 训练,其中 CRI-RM 组件是 Intel 开源的用于管制节点内资源分配的组件。AI 训练通常应用 GPU 资源,从而取得较高的性能,然而 GPU 资源低廉,须要购买独自的 GPU 服务器,对于 AI 初学者、资金无限的开发者,可能会尝试基于已有的服务器运行 AI 训练任务,也就是在传统的 CPU 服务器跑训练任务,通常这会比在 GPU 上运行训练任务性能差,然而能够满足一些初学者的需要,例如基于 MNIST 数据集做演示、脚本调试等。目前 Kubernetes 默认的 CPU 治理没有思考 CPU 绑定与 NUMA 亲和性,高版本的 Kubernetes 只会对 QOS 为 Guaranteed 的 Pod 失效。应用原生的 Kubernetes CPU 治理能力可能存在一些局限性。

演讲者联合泛滥 AI 开发者应用习惯以及产品相干个性,提出基于 CPU 并联合 CRI-RM 的 AI 训练减速计划,可能在进步 CPU 利用率的根底上晋升 CPU 场景下的训练性能,AI 计算性能晋升 50% 以上,本 topic 次要介绍 Kubernetes 集群中基于 CPU 并联合 CRI-RM 的 AI 训练减速实际,在 Kubernetes 集群中集成 cri-resource-manager 组件,能够在 Kubernetes 集群实现物理主机依照拓扑资源的最优调配,大幅晋升 AI 计算的性能。

万宏明:Kubernetes 的多集群与多租户治理

演讲者信息:

万宏明是来自青云的软件工程师,他是 KubeSphere 开源社区的外围贡献者、TOC 成员,专一于云原生多租户、平安畛域。

内容摘要:

软多租户是一种多租户模式,不同的用户、工作负载或应用程序之间没有严格的隔离。就 Kubernetes 而言,软多租户的实现通常是通过命名空间、RBAC 实现。当须要跨多个 Kubernetes 群集进行多租户治理时,会遇到诸多挑战,例如身份验证和受权、资源配额、网络策略、安全策略的治理等。在本次演讲中,KubeSphere 外围贡献者将分享他们在设计多租户体系结构方面的教训和最佳实际。

  1. 跨集群身份认证。
  2. 多集群环境下多租户之间的资源隔离。
  3. 跨集群资源配额治理。

刘茂扬:跨处理器架构容器集群中利用混合调度优化与实际

演讲者信息:

刘茂扬,就任于济南浪潮数据技术有限公司,目前职位云计算开发工程师,在云计算畛域有多年工作教训,目前致力于 K8s 我的项目在浪潮的落地并沉闷于 k8s 社区。

内容摘要:

随着 ARM、RISC- V 等技术的成熟与衰亡,处理器架构及计算力呈现了多元化倒退的趋势,对云平台的异构算力交融调度、跨架构平滑高效迁徙需要日益强烈。但用户在原生 K8S 异构集群上创立、更新、重启 Pod 时,因无奈保障 Pod 镜像架构调度到雷同处理器架构的计算节点上,经常出现 Pod 启动失败的问题。

社区目前有两种解决方案各有其缺点,咱们将分享的通过 Pod 异构集群主动调度算法,

1、开发者只需关注定义 Pod 间亲和调度策略,不必再关怀节点 CPU 架构抉择,能够减小因异构集群导致利用部署的复杂度。
2、只需更新 Pod 的镜像,即可实现 Pod 跨 CPU 架构迁徙,简化了利用迁徙操作流程。
3、基于该主动有向调度算法,进行 istio 异构集群服务治理的实际与利用,在不扭转原 istio-proxy 注入形式的前提下,实现代理的主动注入,实现了跨处理器架构的利用灰度公布、流量治理等微服务治理个性。

郭栋:应用 QAT 和 MultiBuffer 技术减速和优化 Envoy 中的 TLS

演讲者信息:

郭栋,英特尔亚太研发有限公司云计算研发工程师,具备多年的云计算研发和架构教训,目前次要专一于 ServiceMesh 畛域。

内容摘要:

随着网络安全技术的倒退,TLS 曾经成为网络通信的基石。在目前十分风行的 Service Mesh 我的项目 Istio 中,数据面便是通过 Envoy 来实现的。本议题次要介绍了 Intel 的 QAT 和 MultiBuffer 两种加解密减速技术,采纳这些技术后,能够减速 Envoy 中 TLS 的处理过程,进而减速整个数据立体的解决,达到进步资源使用率的成果。

葛长伟:Nydus – 面向下一代的容器镜像减速零碎

演讲者信息:

葛长伟,负责蚂蚁团体镜像减速基础设施的构建。蚂蚁和阿里云开源我的项目 nydus 外围开发者。

内容摘要:

  1. 蚂蚁为什么要去做镜像减速
  2. nydus 的整体架构和设计
  3. Rafs – 为镜像减速设计的容器镜像减速文件系统
  4. 锦上添花 – 与蜻蜓 (Dragonfly) 散发系统集成
  5. nydus 给用户带来了什么价值

李枫:Revisiting GraalVM-based unified runtime for eBPF and WebAssembly

演讲者信息:

李枫,先后就任于摩托罗拉, 三星等 IT 公司, 现为独立开发者。在挪动平台上积攒了十年以上的研发教训, 近几年次要专一于云计算 / 边缘计算基础设施畛域。

是《灰帽黑客 第 4 版:正义黑客的道德规范、浸透测试、攻打办法和破绽剖析技术》和《歹意网络环境下的 Linux 进攻之道》中文版的次要译者。

对技术创新具备浓重的趣味和实际能力,热心参加开源社区的各种流动,屡次加入各种 IT 会议并作技术分享

内容摘要:

eBPF is the next Linux superpower, many Cloud Native projects are using eBPF or have their own wrappers in user-space. Though works mainly in kernel-space, in fact, eBPF can also be apply to user-space with the concept and implementation like ubpf(user-space BPF). WebAssembly is sure to be the next big thing, it will not only change the Web, but also the Cloud Native, and even the whole IT infrastructure.

GraalVM is a great innovation as a universal virtual machine for running applications written in JavaScript, Python, etc, JVM-based languages like Java, Scala, Kotlin, and LLVM-based languages such as C and C++. Now it also implements GraalWasm, which is a WebAssembly engine in the GraalVM.

So how about a unified runtime for both eBPF and WebAssembly that base on GraalVM?

This topic comes with the following sub-topics:

1) Try to implement uBPF VM in the GraalVM;
2) Demystify GraalWasm and evaluate SubStratevm for WASM;
3) How useful is a unified eBPF and WebAssembly runtime for Cloud Native?

刘宇:Serverless 全生命周期的工具链建设:Serverless Devs

演讲者信息:

刘宇,国防科技大学电子信息业余博士,硕士毕业于浙江大学软件工程业余;阿里云 Serverless 产品经理,阿里云函数计算(FC)、Serverless 工作流(FNF)等产品体验侧负责人,开源我的项目 Serverless Devs 发起人、负责人;《Serverless 架构:从原理、设计到我的项目实战》、《Serverless 工程实际:从入门到进阶》等出版物作者。

内容摘要:

作为云原生畛域十分炽热的技术架构,Serverless 技术的倒退是迅速的。作为 Serverless 工具链层面的基础设施,Serverless Devs 起源于阿里巴巴,于 2020 年 10 月正式开源,外围目标是要通过工具链层面,让 Serverless 开发者能够更简略,更不便的应用 Serverless 架构,能够在 Serverless 利用全生命周期发挥作用。基于 Serverless Devs,开发者能够无厂商锁定的应用多云产品,能够通过凋谢的组件生态定制化本人所须要的能力,通过 Serverless Devs 提供的端云联调能力,CI/CD 解决方案,JAMStack 解决方案,传统框架迁徙解决方案等,疾速对 Serverless 架构进行体验,上手,开发,部署,运维等。Serverless Devs 从开源至今,始终和社区开发者们本着:做有情怀的产品,有格局的技术,打动开发者的工具,心愿能够在 Serverless 畛域,奉献一份基建力量。

杨勇:基于 cluster-api 和 OpenStack 平台的 k8s 集群服务实际

演讲者信息:

杨勇,资深云计算工程师,目前就任于 inspur,在高性能计算,大数据和云计算畛域领有十多年的设计开发教训,专一于调度,资源和集群治理畛域。领有 2019 Open Infrastructure Summit、OpenInfra Days China 2020 等演讲教训,也深度参加相干开源我的项目的开发和商业化,例如 hadoop,OpenStack,Kubernetes 等。

内容摘要:

在当今的数据中心,应用 openstack 来部署、运维和保护 k8s 平台是一个常见的场景,然而如何充分利用它们的能力,在 openstack 上提供 k8s 的最佳应用体验成为了一个挑战。

咱们通过了 kubespary、magnum 和第三方产品集成解决方案的摸索,总结了大量用户的反馈,最终造成了一个基于 cluster-api 的更加云原生、灵便和自主可控的 k8s 集群解决方案,使 k8s 集群服务在 openstack 平台上更加的麻利和强壮,为两大生态的共存共赢提供最佳实际。

核心技术:
1、实现了 cluster-api 对象和 openstack 资源的一致性审计框架,进步了资源状态治理和垃圾回收的性能;
2、通过集群代理实现 k8s 工作负载集群治理,缩小对浮动 ip 的依赖;
3、联合 k8s autoscaler 和 cluster-api 我的项目,提供基于 openstack 的残缺 autoscale 解决方案。

翟佳:云原生音讯流平台 Apache Pulsar 架构设计与原理

演讲者信息:

翟佳,StreamNative 联结创始人,Apache Pulsar PMC 成员与 Committer。之前任职于 EMC,负责北京 EMC 实时处理平台技术负责人。他次要从事实时计算和分布式存储系统的相干钻研工作,在开源我的项目 Apache BookKeeper, Apache Pulsar 等我的项目中继续奉献代码,是开源我的项目 Apache Pulsar 和 Apache BookKeeper 的 PMC 成员和 Committer。

内容摘要:

在云原生时代,开发者应该把更多精力放在应用程序和微服务上,而不是把工夫节约在保护简单的音讯和流数据基础设施上。作为下一代云原生分布式音讯流平台,Apache Pulsar 从诞生时就前瞻性地采纳了存储计算拆散、分层分片的云原生架构,极大加重用户在音讯零碎中遇到的扩大和运维艰难,是云原生时代解决实时音讯流数据传输、存储和计算的最佳解决方案。

在本次分享中,我将深刻介绍 Apache Pulsar 的云原生个性和架构劣势,以及在全面云原生时代 Pulsar 的最新技术停顿及演进。

听众收益:
理解 Apache Pulsar 架构设计与原理
理解 Apache Pulsar 的云原生性能个性
获取 Apache Pulsar 在存储、音讯和计算方向的最新打算与停顿

阮博男:Metarget:构建云原生基础设施靶场

演讲者信息:

阮博男,绿盟科技星云实验室平安研究员,次要钻研方向为云和虚拟化平安。

曾作为外围设计、开发人员参加 SOAR、容器平安、云原生入侵检测等我的项目。

在绿盟科技钻研通信、绿盟科技技术内刊、绿盟科技博客等平台撰写并公布多篇云原生平安文章,作为外围作者参加编写《2020 绿盟科技云原生平安技术报告》。

曾在 CIS2020 大会分享一种针对 Kubernetes 集群的后浸透控制技术 k0otkit。创立并保护云原生攻防靶场开源我的项目 Metarget,受到国内外平安研究者的踊跃反馈和好评。

热衷于摸索 Linux、云、虚拟化及前沿平安攻防技术。

内容摘要:

云原生时代,随着万物上云的步调一直放慢,咱们也必须一直加大对云原生基础设施安全性的器重。

咱们基于本身的云原生平安钻研教训,设计实现了一个云原生基础设施靶场的主动构建工具 Metarget,致力于底层基础设施的软弱场景自动化构建。相干我的项目曾经在 Github 上开源(https://github.com/brant-ruan…)。

本议题将向大家介绍 Metarget 的性能、设计、理念,并联合具体的简单靶场主动搭建及浸透实战 DEMO 来展现 Metarget 如何可能帮忙疾速构建云原生基础设施软弱环境,大幅提高云原生平安钻研效率,从而促成云原生平安的倒退。

破绽的实质是软件的安全性缺点。从破绽的引入,到发现及修复的过程可能被映射为特定的软件版本范畴区间。Metarget 通过自动化装置区间范畴内的云原生组件,从而实现繁多破绽的装置部署,通过组合不同档次的破绽组件,实现多层次简单破绽环境的一体化部署。本议题蕴含的简单靶场案例只须要 4 条 Metarget 命令即可实现搭建。

卢万龙:云原生下的 SRE 体系建设

演讲者信息:

卢万龙,现任易宝领取运维技术部总监,曾先后在易宝、华为和联想等公司任职云计算架构师,近十年始终专一于信息技术的变革与布道,包含容器、虚拟化、软件定义和自动化运维等基础设施架构方面。

参加并主导建设企业泛滥要害我的项目的可行性研究、设计、施行和运维工作,具备先进技术架构常识和丰盛的项目管理教训。编写的《OpenStack 从零开始学》书籍,从实践、架构和实操等方面全面全面论述开源云技术常识。同时,为驱动企业进行云原生转型,发表有《企业云化之路》、《企业云存储建设之路》、《确定性不在,混沌永生》等文章,均受到读者的宽泛好评。

内容摘要:

云原生基础设施提供了更多的能力类型和稳定性,赋予了业务更多的场景和交付速度。进而带来一个问题,那就是如何继续保护好云原生基础设施,让它为业务发光发热?无疑那肯定是 SRE 体系。SRE 是如何爱护云原生基础设施的?它的指导思想又是什么?怎么的组织构造能力适宜 SRE 体系的运行?运行长效机制又是什么?

张晓辉:应用 Flomesh 进行 Spring+Dubbo 混合环境服务治理

演讲者信息:

张晓辉,Flomesh 高级云原生架构师,资深工程师、云原生践行者,关注 Kubernetes、DevOps、微服务畛域

内容摘要:

很多用户都在应用基于 Spring Cloud 的微服务体系同时,也须要反对存量的 Dubbo RPC 服务体系,如何不革新或者最小化革新利用,同时实现服务网格相干性能,是一种常见需要。在本议题中,演讲者将为你介绍如何实现 —— 无论你的服务运行在虚拟机还是容器,无论服务应用哪种注册核心。

周亮:Enclave Attestation Architecture:云原生场景下通用的近程证实架构

演讲者信息:

周亮,目前在阿里云操作系统平安团队负责技术开发,次要钻研方向是秘密计算、秘密容器和近程证实计划的设计和开发。

2014 年退出 Intel SGX SDK 组,从事隔离环境里 SDK 开发,包含 SGX 特有的 pthread, Control Flow Guard 等库,也 SGX 化 tcmalloc, C++11, mkl-dnn, Openmp 和 libunwind 等开源库。

内容摘要:

在网络协议替换中,通信的一端晓得另一端是否处于预期的工作状态是很有用的。通过证实和验证处于良好状态的零碎能够改善总体零碎态势。相同,无奈证实和验证处于良好状态的零碎能够停止使用,或者以其余形式标记为进行修复。

本演讲介绍了提供了通过生成、传递和鉴定证据的近程证实过程的技术原理,并联合 Inclavare Containers 开源我的项目实现的 Enclave Attestation Architecture,介绍了云原生秘密容器场景下通用的近程证实架构。

Andrew Zhang,刘梦馨:Streamline OpenStack and Kubernetes

演讲者信息:

Andrew Zhang,Andrew is Chief Architect and Principal Engineer with Intel, covering China enterprise market. He has extensive background in hardware and software, spanning from IC/SOC design, firmware, OS and high level software stacks. Andrew was a founder for a fabless IC design start-up, developed software from scratch; as well as pushing technology envelope in established companies such as Microsoft and Intel. Andrew has extensive knowledge and experience in wireless communications, mobile phone, client devices, IoT, networking and cloud.

刘梦馨,灵雀云资深研发工程,Kube-OVN 我的项目维护者

内容摘要:

Most enterprises invested heavily in OpenStack and cannot abandon.

Current trend of cloud native and micro-services creates new opportunities for enterprises to tap into.

It costs much or even impossible to re-factor asserts from OpenStack to micro-services. Streamline OpenStack with cloud native (i.e., containers with Kubernetes) would provide tremendous opportunities.

Current solutions with Kubernetes on top of OpenStack would be more difficult for enterprises to move to cloud native in long term.
We propose an alternative architecture which might carry Open Infrastructure further into the future.

朱家振,基于 Prometheus 的对立监控告警组件

演讲者信息:

朱家振,毕业于西北工业大学,现负责战火通信云计算研发中零碎架构师,6 年云计算畛域研发教训。在 OpenStack 公有云建设、监控运维等畛域有深入研究。

内容摘要:

监控告警是云基础设施的必备能力,尽管 OpenStack 以 Ceilometer+Gnocchi+Aodh 构建了监控告警的能力,然而在中、大规模场景下存在比较严重的性能问题。Prometheus 以其高性能、灵便扩大和弱小的汇聚计算能力成为监控告警方面的开源新星,逐步成为该畛域的支流计划。战火自研的 FitMonitor 组件以 Prometheus 为根底,实现了 Prometheus 计划的商业化革新,成为 FitCloud 云产品系列的对立监控告警组件。

施继成:DatenLord 云原生高速存储计划

演讲者信息:

施继成,Datenlord 联结创始人,曾在 Google,微软,阿里巴巴等头部企业就任。专一于操作系统和分布式计算的钻研和开发。

内容摘要:

在云原生疾速倒退的明天,存储问题始终困扰着用户,现存的存储形式无奈满足用户的需要。DateLord 云原生存储计划提出了一种高速牢靠的解决方案,本议题就是介绍该解决方案。

赠票福利来啦!

往年的会议将以线上 + 线下的模式举办,在现场,能够见到国内最沉闷的开源社区贡献者和行业首领;在线上,你能够凝听行业技术专家聚焦 5G 新基建、云原生基础设施、开源治理、算网交融、云基础设施畛域的精彩分享。

DAY ONE(10.15)

会议内容:Keynote 演讲 | OpenStack 专题研讨会 | 网络云专题研讨会 | 浪潮专题研讨会 | Social Lounge Lunch
会议地点:北京 · 海航大厦万豪酒店

DAY TWO(10.16)

会议内容:分论坛演讲,聚焦 5G 新基建、云原生基础设施、开源治理、算网交融、云基础设施畛域
会议地点:线上直播

如果你对云原生基础设施感兴趣无妨在 10.16 准时蹲守直播间 ,也欢送你 10.15 来到北京和专家们线下面对面交换,咱们为参会者筹备了 丰盛的伴手礼和与专家大咖共进午餐、享受 Social Lounge Lunch 的宝贵机会!

随文送出 10 个限量收费门票(原价 888 元 / 张)
扫描二维码,输出优惠码“cloudnative”即可收费兑换
没抢到?
扫描专属二维码 5 折购票!

点击链接查看会议具体日程~
https://pages.segmentfault.co…

正文完
 0