共计 2746 个字符,预计需要花费 7 分钟才能阅读完成。
前言
每天都要浏览大量 AI 相干新闻,是不是感到信息量爆炸,无效信息少?
这么多新产品和新工具,到底哪些是真正是有价值的,哪些只是塌实的一时热点?
想参加 AI 产品和工具的开发,从哪里可能取得大量的灵感和思路?
我会把 AI 相干的新趋势、新想法、新思路,和成熟 AI 产品、工具、模型等整顿在这里,帮忙大家去除信息乐音,更高效的理解 AI 前沿倒退。
次要围绕:
- AI 业界趋势、想法、思路
- AI 产品
- AI 开发者工具
- AI 模型
作为本期刊的第一期,咱们次要围绕 2023 年 4 月公布的相干产品和技术工具。
终端产品
AI 中国法律助手
https://github.com/lvwzhen/law-cn-ai
该我的项目把 中国法律文书 作为知识库,将知识库 embedding 后存入向量数据库,而后向用户提供了残缺界面,用户能够用自然语言发问,后盾应用 openAI 的 API,联合知识库的现有常识进行自然语言的答复。
次要技术:
- 预处理知识库
- 在 PostgreSQL 中应用 pgvector 存储嵌入向量。
- 执行向量相似性搜寻,查找与问题相干的内容。
- 将内容注入到 OpenAI GPT- 3 文本主动补全中,并将响应流式传输到客户端。
HuggingChat
https://huggingface.co/chat/
Hugging Face 公布了一个 ChatGPT 开源替代品名为 HuggingChat。Hugging Face 大家都懂的,能够了解成 AI 界的 Github,很多注明的开源模型都在下面首发。
底层模型目前有两种抉择:
金融 / 投资 GPT 助手
https://finchat.io/
FinChat.io 是由 ChatGPT 提供技术支持的工具。它利用人工智能生成对于公共公司和投资者的问题的答案。为了提供精确的答案,FinChat 会提供推理、起源和数据等反对。实测成果有点酷炫。
微软 AI 设计器
https://designer.microsoft.com/
输出文字,通过 AI 生成一个适合的设计图,且反对动态图。例如上面的文字描述 ” 为我的油管频道‘Science for Littles’设计一个动静的广告 ” 生成了右方的一些设计图,生成速度十分快,还可调节图片尺寸。
抉择了右方较为称心的设计后,能够持续在在线编辑器中批改你的设计,反对自在导出各种格局与下载。
AI Shell
https://github.com/builderio/ai-shell
将 chatGPT 整合到你的 shell 中,用 ai
命令进行操作
VLog
https://github.com/showlab/VLog
V 是大写,他能够将一段长视频转换成蕴含视觉和音频信息的文档。通过将此文档发送到 ChatGPT,咱们能够针对这个视频的内容进行自然语言聊天!当然,须要耗费你本人的 openAI API 额度。
开发者工具
音频能力工具集:AudioGPT
https://huggingface.co/spaces/AIGC-Audio/AudioGPT
这个工具集里蕴含了大量音频相干的解决能力工具,大部分工具应用时须要填写你本人的 GPT API key,耗费你的额度,我试了一下,文字转语音,一句 5 个词的句子,耗费了我 4000 个 token!(暴风哭泣!)
演讲:
- 文字转语音
- 格调迁徙
- 语音辨认
- 语音加强
- 语音拆散
- 语音翻译
- 单声道到双声道
- 文字转唱
唱歌:
- 文字转唱歌
音频解决:
- 文本到音频
- 音频修复
- 图像到音频
- 声音检测
- 指标声音检测
- 声音提取
![]()
大模型平安围栏:NeMo-Guardrails
https://github.com/NVIDIA/NeMo-Guardrails
NeMo Guardrails 是一个开源工具包,能够轻松地将可编程护栏增加到基于 LLM 的对话零碎中。Guardrails(或简称“rails”)是管制大型语言模型输入的特定形式,例如不议论政治、以特定形式响应特定用户申请、遵循预约义的对话门路、应用特定语言格调、提取结构化数据等。
次要劣势:
- 构建值得信赖、安全可靠的 LLM 对话零碎:应用 NeMo Guardrails 的外围价值是可能编写 rails 来领导对话。开发人员能够抉择定义他们的 LLM 驱动的机器人在某些主题上的行为,并让他们的创造力不受其他人的影响!
- 通过操作连贯模型、链、服务等:LLM 不须要解决所有挑战。NeMo Guardrails 提供了将您的代码库或服务无缝平安地连贯到聊天机器人的能力!
chatGLM 联合本地知识库:langchain-chatGLM
https://github.com/imClumsyPanda/langchain-ChatGLM
一种利用 ChatGLM-6B + langchain 实现的基于本地常识的 ChatGLM 利用。反对将 txt、markdown 等格局的文本文件上传后,进行发问。会给出自然语言的答复,并且在最初会标注出援用本地文本的出处。
本我的项目实现原理如下图所示,过程包含加载文件 -> 读取文本 -> 文本宰割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最类似的 top k 个 -> 匹配出的文本作为上下文和问题一起增加到 prompt 中 -> 提交给 LLM 生成答复。
反对的 LLM 模型:
- THUDM/chatglm-6b
- THUDM/chatglm-6b-int8
- THUDM/chatglm-6b-int4
- THUDM/chatglm-6b-int4-qe
- ClueAI/ChatYuan-large-v2
反对的 Embedding 模型:
- nghuyong/ernie-3.0-nano-zh
- nghuyong/ernie-3.0-base-zh
- shibing624/text2vec-base-chinese
- GanymedeNil/text2vec-large-chinese
在任意生产级终端部署大模型:MLC LLM
https://mlc.ai/mlc-llm/
MLC LLM 是一种通用解决方案,能够使任何语言模型在各种硬件后端和本地应用程序上本地化部署,同时为所有人提供一个高效的框架,以进一步优化模型性能,以适应其本身用例。
咱们的使命是使每个人都可能在其设施上本地开发、优化和部署 AI 模型。
这个方向的摸索如果呈现冲破,将大大减少模型部署和应用的门槛,让全世界的低算力设施也能退出 AI 算力营垒。
![]()
仿 openAI 格调 API 调用 chatGLM:chatglm-openai-api
https://github.com/ninehills/chatglm-openai-api
让开发者可能用调用 openAI API 的形式调用其余开源模型,节俭大量开发工作。
参考
Github Trending
https://github.com/trending
Meta360 翻新学院 -AGI 前夜
https://docs.meta360.vip