关于google:新知同享-AI-开发广泛应用高效构建

谷歌致力于通过高效、牢靠的办法
构建 AI 驱动的产品
现在曾经走过了七年 “AI 为先 ” 的旅程
一起来看 2023 Google 开发者大会上
AI 开发如何被广泛应用，简化开发
并将机器学习的弱小能力
引入到利用和工作流中
进步开发者工作效率

精彩大会现场一览

过来 3 年，Web 机器学习技术的应用和开发都呈指数级增长，许多热门 Google 产品都已采纳 Web 技术。谷歌的许多团队都在为 Web 机器学习的将来踊跃贡献力量。例如，Chrome 团队正致力于制订新的 Web 规范，使 TensorFlow.js 和 MediaPipe 等团队可能在这些堆栈的根底上构建各种产品和服务，并实现更杰出的性能。

MediaPipe 是一个开源的跨平台框架，用于在挪动设施、桌面设施和 Web 上构建机器学习解决方案。MediaPipe 提供可自定义的设施端解决方案，只需几行代码，即可将解决方案集成到 Web 利用中。此外，MediaPipe 也公布了新模型，例如人脸交融变形分类。开发者能够应用此模型来创立虚构头像，使其实时匹配用户的面部表情。

MediaPipe Studio 是一款基于 Web 的应用程序，用于评估和自定义应用程序的设施上 ML 模型和管道。MediaPipe Studio 可让开发者应用本人的数据和自定义的 ML 模型在浏览器中疾速测试 MediaPipe 解决方案，以及反对试验后果总数、报告后果的最小置信度阈值等模型设置。

谷歌对 WebGL 后端进行了重大优化，Web 机器学习模型的运行速度将比以往更快。单项运算级别中常见运算的性能最高可能收费晋升到原来的 5.8 倍，热门模型性能优化最高可至原来的 1.59 倍。
MediaPipe Studio 能够提供手势辨认等齐全在浏览器中运行的解决方案

TensorFlow.js 是谷歌新公布的模型可视化调试程序，帮忙开发者比拟模型在不同 TensorFlow.js 后端上执行时的输入，找出运算输入从何时开始呈现差别，以及差别有多大，以便发现在不同后端环境和设施上应用模型时可能呈现的 bug。

TensorFlow.js 模型可视化调试程序

谷歌对 WebGL 后端 进行了重大优化，Web 机器学习模型的运行速度将比以往更快。单项运算级别中常见运算的性能最高可能收费晋升到原来的 5.8 倍，热门模型性能优化最高可至原来的 1.59 倍。

谷歌在 Chrome 稳定版中增加了对 WebGPU 的反对，为 Web 注入了十亿个 GPU 的强悍性能，使编解码器、游戏和机器学习等计算密集型利用可能在浏览器中运行，并且可能实现前所未有的细节丰盛度和帧率。

语言模型旨在预测和生成正当的语言。倒退至今，古代大语言模型规模宏大，能够预测句子、段落甚至整个文档的概率。典型自然语言能够解决实体提取、分类、生成摘要、情感剖析、翻译等工作。谷歌新推出的大语言模型 (LLM) 工具 PaLM API 和 MakerSuite 能够帮忙开发者疾速开发原型。

大语言模型 (LLM)

MakerSuite 能够帮忙开发者间接在浏览器中疾速创立提醒并为其进行原型设计，无需机器学习专业知识或代码。借助 MakerSuite，开发者将可能迭代提醒、应用合成数据加强数据集，并轻松调整自定义模型。

MakerSuite

PaLM API 使开发者能够轻松、平安地试验谷歌的大型语言模型，即通过 PaLM API 间接拜访谷歌的先进大型语言模型，构建生成式 AI 利用。它将为开发人员提供针对多回合用例优化的模型（例如内容生成和聊天）以及针对摘要、分类等用例优化的通用模型。PaLM API 能够提供文本服务、聊天服务、嵌入服务。

开发者当初能够应用 Firebase 扩大拜访 PaLM API，即在带有 PaLM API 扩大程序的全新聊天机器人中增加用于间断对话、文本摘要等性能的聊天界面。

通过实例，一起来理解如何通过 AI 和机器学习构建利用。

用 Flutter & AI 构建 I/O Flip

I/O Flip 是一个应用 Flutter 和 AI 构建的虚构纸牌游戏，它展现了多项 Google 技术的交融。具体来说，开发者用 Muse 上的 DreamBooth 生成角色图像，用 PaLM API 生成形容，用 Flutter 创立游戏 UI 和动画，用 Dart 编写后端，并应用一套 Firebase 和 Google Cloud 工具进行托管和共享。通过 2023 Google 开发者大会现场的互动展示区，参会者理论体验了这款纸牌游戏，在晦涩的游戏体验中深切感触到应用 Flutter 和 AI 构建游戏的妙不可言。

参会者现场体验 I/O Flip 纸牌游戏

应用 OCR 获取 PDF
互联网上有靠近 12% 的 PDF 文件因为不准确的光学字符识别 (OCR)，无奈被有视力阻碍的用户通过辅助技术拜访到。通过在设施上运行 OCR，Chromebook 使用户能够应用这些 PDF 文件，高效转换，没有提早。
为实现让 AI 助力每一个人
谷歌将保持负责任地进行摸索
继续关注 2023 Google 开发者大会
更多精彩内容更新

专题演讲视频继续更新中
扫码中转官网
摸索大会更多精彩
关注“谷歌开发者”微信公众号，获取更多大会信息