关于visual-studio-code:5-Amazing-AI-Projects-Open-Source

过来一周，AI大模型的疾速演进依然在持续演出。明天持续介绍GitHub上的一些实用的大模型开源我的项目。

1. ChatGLM-6B：Open Source ChatGPT Alternative
ChatGLM-6B是一个基于GLM架构的开源对话语言模型，反对中英双语，有62亿参数。联合模型量化技术，能够在生产级显卡上本地部署，成果堪比ChatGPT。2023年3月开源，3周工夫曾经积攒超过100万次下载，目前寰球靠近300万次下载量。

2. CodeGeeX：Open Source Github Copilot Alternative
CodeGeeX是一个基于AI大模型的代码生成神器，领有130亿参数，反对23种编程语言。CodeGeeX能够依据自然语言或代码片段生成残缺的代码，“Ask CodeGeeX”性能能够在IDE中通过对话的形式间接操作代码，开发者普遍认为是Github Copilot的平替产品。CodeGeeX是开源收费的，反对VS Code和IDEAs平台，目前寰球装置应用的用户量超过100,000+。

3. Meta open source AI generative music model
这是Meta在GitHub上开源的名为Audiocraft的Python库，能够间接用人工智能生成音乐。其中次要应用了一个名为MusicGen的音乐生成模型。MusicGen是一个基于单阶自回归Transformer的预训练模型，应用32kHz EnCodec tokenizer，并以50Hz采样的形式生成了4个codebooks。

与现有的办法（如MusicLM）不同，MusicGen不须要自监督语义学习，而是一次性生成了所有4个codebooks。在文本生成和文生图之后，看看用文本生成音乐的成果如何。

4. Diffusers公布重要更新

Diffusers v0.17.0正式公布，改良了LoRA、Kandinsky 2.1、Torch编译减速等性能。Diffusers是一个在GitHub上的Diffusion Model预训练模型罕用库，广受欢迎，可用于生成图像、音频，甚至是分子的3D构造。

无论是寻找简略的推理解决方案还是训练本人的Diffusion Models，Diffusers作为一个模块化工具包提供反对。
库的设计更重视易用性和可定制性，次要提供以下三个外围组件：

先进的Diffusion pipeline，只需几行代码即可进行推理；
可调换的noise schedulers，用于不同的Diffusion速度和输入品质；
预训练模型可用作构建模块，并与schedulers联合应用，创立本人的端到端Diffusion Systems。

这个我的项目是由Hugging Face收费开源的，能够应用它来疾速训练ControlNet，进一步提高AI绘画的成果和品质。

5. Everything is identifiable

Meta之前在GitHub上开源了一个名为Segment Anything Model的图像宰割模型，能够主动实现图像宰割。然而，该模型在图像定位方面体现良好，但在图像识别方面的体现却个别。

为此，复旦大学与OPPO的钻研人员以及International School of Digital Economy,独特在GitHub上开源了一个根底图像标注模型：Recognize Anything Model (RAM)。采纳了一种新的图像标注范式，能够辨认各种常见类别。而且用来训练的数据，是通过大规模的图像主动生成文原本进行标注，取代了手动标注。

通过基准评估，RAM的标记能力体现优良，成果显著优于CLIP和BLIP。有用户认为RAM甚至超过了齐全监督的办法，与Google API相当。同时，我的项目中还蕴含一个名为Tag2Text的工具，能够批量间接为图像中的指定对象生成标签。如果与Meta的开源SAM模型联合应用，咱们能够批量删除图像中的指定对象，进一步提高图像处理效率。

关于visual-studio-code:5-Amazing-AI-Projects-Open-Source

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于visual-studio-code:5-Amazing-AI-Projects-Open-Source

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复