fluid-layout 关于fluid-layout:KServe-Fluid-加速大模型推理 KServe 是 Kubernetes 上的规范模型推理平台,专为高度可扩大的场景而构建,反对古代 Serverless 推理工作负载,用于在任意框架上提供机器学习(ML)模型服务…