关于人工智能:Hugging-News-0512-🤗-Transformers🧨-Diffusers-更新AI-游戏是下个新热点吗

每一周,咱们的共事都会向社区的成员们公布一些对于 Hugging Face 相干的更新,包含咱们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,咱们将其称之为「Hugging News」,本期 Hugging News 有哪些乏味的音讯,快来看看吧!

开源更新

Transformers 现已反对 Meta 的 SAM 宰割模型

你还能够应用主动遮罩生成管道预测给定图像的宰割掩码,并提供一组边界框或一组 2D 点,以预测感兴趣的对象的宰割掩码,只需调用 AutoModel.from_pretrained 即可。

查看 Notebook: 在 🤗transformers 中应用 Segment Anything Model:
<url>https://ipynb.cn/github/huggingface/notebooks/blob/main/examp…</url>

TPU YYDS: 做完一个小时的音频转录只须要 15 秒!

咱们的一位共事 Sanchit 为 OpenAI 的 Whisper 模型提供了 JAX 实现,代码兼容 CPU、GPU 和 TPU,能够部署为用于音频解决的推理端点,也能够批处理单个音频文件。

GitHub 地址:
<url>https://github.com/sanchit-gandhi/whisper-jax</url>

更轻松地微调 TTS 模型

🤗 transformers 曾经减少了在文本到语音中微调 SpeechT5 模型的性能。

你能够在这个 Colab 中查看具体操作步骤:
<url>https://colab.research.google.com/drive/1i7I5pzBcU3WDFarDnzwe…</url>

在 diffusers 上进行 Multi-concept 主题训练

当初你能够通过 Custom Diffusion 在 🧨diffusers 上进行 Multi-concept 主题训练,上图展现了联合木头和猫咪的图片。Custom Diffusion 只微调 UNet 的穿插注意力层,同时反对在消费者硬件上无缝学习的文本反演交融。因而,仅用 250 步,咱们就能够失去相当好的后果。

Custom Diffusion 文档: <url>https://hf.co/docs/diffusers/main/en/training/custom_diffusion</url>

产品更新

Gradio 新增 gradio_client

当初,你能够应用 gradio_client 库将任意一个 Gradio 利用以 API 形式调用。

Space 模版现已反对 AimStack

当初,你能够在新建 Space 利用的时候抉择 AimStack 这个 Docker 模版,Aim 是一个开源的、自托管的 AI 元数据跟踪工具,它为摸索和比拟元数据提供了一个性能弱小的用户界面,以及一个用于编程拜访的、非常适合自动化的 SDK。在 Space 利用上构建一个 Aim 利用,你能够随时与别人共享训练后果,用于摸索和比拟元数据,以及以编程形式拜访跟踪的元数据。

推理端点大更新

端点启动 / 创立工夫缩小了约 4-6 倍,你能够在 1 分钟内实现 BERT、10 分钟内实现 FLAN-T5-XXL (11B) 推理等。

轻松地在你的游戏里退出数万个开源模型

本周,咱们发了一篇文章,介绍如何 在 Space 利用中应用 Unity API,邀请你回顾这篇文章,敬请期待更多 AI 游戏的文章和产品公布。


以上就是本期 Hugging News,本周日是母亲节,请用任何形式通知敬爱的妈妈:我爱你!❤️

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理