共计 1717 个字符,预计需要花费 5 分钟才能阅读完成。
每一周,咱们的共事都会向社区的成员们公布一些对于 Hugging Face 相干的更新,包含咱们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,咱们将其称之为「Hugging News」,本期 Hugging News 有哪些乏味的音讯,快来看看吧!
重磅更新
Hugging Cast 播客 #1 公布
Hugging Cast 是由 Hugging Face 团队成员录制的、介绍最新人工智能新闻、利用以及开源动静的播客节目,第一期的 Hugging Cast 曾经公布,咱们聊了 Hugging Chat 以及 AI 的实际相干的话题。
来 B 站看看吧:
https://www.bilibili.com/video/BV1jM411G74u/
今晚 11 点 Hugging Cast 播客 #2 线上直播,欢送来这里报名加入:
https://streamyard.com/watch/GJkVxAWR76k2
💫StarCoder: 开源的 SOTA 代码大模型
StarCoder 是针对代码的大语言模型 (代码 LLM),模型应用了 GitHub 上被许可的数据训练而得,蕴含 80 多种编程语言、Git commits、Issues 等。与 LLaMA 相似,咱们基于 1 万亿个词元训练了一个约 15B 参数的模型。此外,咱们还针对一个 35B 词元的 Python 数据集对 StarCoderBase 模型进行了微调,从而取得了一个咱们称之为 StarCoder 的新模型。
详情请回顾文章: StarCoder: 最先进的代码大模型
每日论文精选页面上线
AK (@_akhaliq) 是一个在 Twitter 上领有 19 万粉丝的、专一于公布各种 AI 钻研论文的账号,在大概公布了 1.7 万条论文举荐信息之后,接下来 AK 将在 Hugging Face 上开启后续的更新,欢送拜访:
hf.co/papers
开源更新
应用 Token Merging (ToMe) 进步 Stable Diffusion 的推理速度
Token Merging 能够通过在 Transformer 网络的前向传递中逐渐合并冗余的 token/patch 来减速推理,通过在 A100 和 V100 GPU 设施上对应用 tomesd 和不应用的 StableDiffusionPipeline 进行了基准测试,发现应用 tomesd 能够显著进步推理速度,尤其是对于较大的图像分辨率。以及,应用 tomesd 不会明显降低图像生成的品质。
查看文档理解更多信息:
https://hf.co/docs/diffusers/main/en/optimization/tome
Datasets 库 2.12 版正式公布
🤗 Datasets 是一个数据集调用库,你能够轻松调用 Hub 上的以及多种公共数据集,并进行高效的数据预处理。Datasets 库的 2.12 正式版曾经正式公布,包含 Spark DataFrame 的反对、流式数据的反对、数据集分片等新性能,也蕴含了一些 bug 批改和文档改良等。此外,咱们欢送并感激五位新的贡献者对这个版本的奉献 (@QizhiPei、@bbbxyz、@csris、@eli-osherovich、@maddiedawson)
Accelerate 库迎来了 2 千万次下载!
本月初,🤗Accelerate 迎来了第 2 千万次下载,这见证了社区对这个库的青睐和信赖,快来试试看吧!
https://hf.co/docs/accelerate/
产品更新
发表与 Spawning.ai 进行单干
在构建商业模型时,应用受权的训练数据至关重要,Spawning.ai 提供了一个 API 来确保你的机器学习我的项目建设在批准的数据之上。局部符合条件的、在 Hugging Face 上开源托管的数据集也将由 Spawning.ai 提供的 API 来显示数据源的报告。
新的 Space 模版: 构建 Shiny 利用
Shiny 是一个高效且开发者敌对的 GUI 框架,你能够依据需要抉择应用 R 或 Python 模板。Posit 与 Hugging Face 单干,提供了 R 和 Python Shiny 包的 Space 利用模板,用户能够轻松地将 Shiny 应用程序部署到 Hugging Face 上,并不便地将 Hub 上的模型集成到本人的利用中。
以上就是本期的 Hugging News,祝大家领有一个欢快的周末!