每一周,咱们的共事都会向社区的成员们公布一些对于 Hugging Face 相干的更新,包含咱们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,咱们将其称之为「Hugging News」,本期 Hugging News 有哪些乏味的音讯,快来看看吧!
开源更新
Transformers 现已反对 Meta 的 SAM 宰割模型
你还能够应用主动遮罩生成管道预测给定图像的宰割掩码,并提供一组边界框或一组 2D 点,以预测感兴趣的对象的宰割掩码,只需调用 AutoModel.from_pretrained
即可。
查看 Notebook: 在 🤗transformers 中应用 Segment Anything Model:
<url>https://ipynb.cn/github/huggingface/notebooks/blob/main/examp…</url>
TPU YYDS: 做完一个小时的音频转录只须要 15 秒!
咱们的一位共事 Sanchit 为 OpenAI 的 Whisper 模型提供了 JAX 实现,代码兼容 CPU、GPU 和 TPU,能够部署为用于音频解决的推理端点,也能够批处理单个音频文件。
GitHub 地址:
<url>https://github.com/sanchit-gandhi/whisper-jax</url>
更轻松地微调 TTS 模型
🤗 transformers 曾经减少了在文本到语音中微调 SpeechT5 模型的性能。
你能够在这个 Colab 中查看具体操作步骤:
<url>https://colab.research.google.com/drive/1i7I5pzBcU3WDFarDnzwe…</url>
在 diffusers 上进行 Multi-concept 主题训练
当初你能够通过 Custom Diffusion 在 🧨diffusers 上进行 Multi-concept 主题训练,上图展现了联合木头和猫咪的图片。Custom Diffusion 只微调 UNet 的穿插注意力层,同时反对在消费者硬件上无缝学习的文本反演交融。因而,仅用 250 步,咱们就能够失去相当好的后果。
Custom Diffusion 文档: <url>https://hf.co/docs/diffusers/main/en/training/custom_diffusion</url>
产品更新
Gradio 新增 gradio_client
库
当初,你能够应用 gradio_client
库将任意一个 Gradio 利用以 API 形式调用。
Space 模版现已反对 AimStack
当初,你能够在新建 Space 利用的时候抉择 AimStack 这个 Docker 模版,Aim 是一个开源的、自托管的 AI 元数据跟踪工具,它为摸索和比拟元数据提供了一个性能弱小的用户界面,以及一个用于编程拜访的、非常适合自动化的 SDK。在 Space 利用上构建一个 Aim 利用,你能够随时与别人共享训练后果,用于摸索和比拟元数据,以及以编程形式拜访跟踪的元数据。
推理端点大更新
端点启动 / 创立工夫缩小了约 4-6 倍,你能够在 1 分钟内实现 BERT、10 分钟内实现 FLAN-T5-XXL (11B) 推理等。
轻松地在你的游戏里退出数万个开源模型
本周,咱们发了一篇文章,介绍如何 在 Space 利用中应用 Unity API,邀请你回顾这篇文章,敬请期待更多 AI 游戏的文章和产品公布。
以上就是本期 Hugging News,本周日是母亲节,请用任何形式通知敬爱的妈妈:我爱你!❤️
发表回复