关于人工智能:AI新趋势期刊1GPT自动理解视频AI法律顾问大模型安全围栏

41次阅读

共计 2746 个字符,预计需要花费 7 分钟才能阅读完成。

前言

每天都要浏览大量 AI 相干新闻,是不是感到信息量爆炸,无效信息少?

这么多新产品和新工具,到底哪些是真正是有价值的,哪些只是塌实的一时热点?

想参加 AI 产品和工具的开发,从哪里可能取得大量的灵感和思路?

我会把 AI 相干的新趋势、新想法、新思路,和成熟 AI 产品、工具、模型等整顿在这里,帮忙大家去除信息乐音,更高效的理解 AI 前沿倒退。

次要围绕:

  • AI 业界趋势、想法、思路
  • AI 产品
  • AI 开发者工具
  • AI 模型

作为本期刊的第一期,咱们次要围绕 2023 年 4 月公布的相干产品和技术工具。

终端产品

AI 中国法律助手

https://github.com/lvwzhen/law-cn-ai

该我的项目把 中国法律文书 作为知识库,将知识库 embedding 后存入向量数据库,而后向用户提供了残缺界面,用户能够用自然语言发问,后盾应用 openAI 的 API,联合知识库的现有常识进行自然语言的答复。

次要技术:

  • 预处理知识库
  • 在 PostgreSQL 中应用 pgvector 存储嵌入向量。
  • 执行向量相似性搜寻,查找与问题相干的内容。
  • 将内容注入到 OpenAI GPT- 3 文本主动补全中,并将响应流式传输到客户端。

HuggingChat

https://huggingface.co/chat/

Hugging Face 公布了一个 ChatGPT 开源替代品名为 HuggingChat。Hugging Face 大家都懂的,能够了解成 AI 界的 Github,很多注明的开源模型都在下面首发。

底层模型目前有两种抉择:

金融 / 投资 GPT 助手

https://finchat.io/

FinChat.io 是由 ChatGPT 提供技术支持的工具。它利用人工智能生成对于公共公司和投资者的问题的答案。为了提供精确的答案,FinChat 会提供推理、起源和数据等反对。实测成果有点酷炫。

微软 AI 设计器

https://designer.microsoft.com/

输出文字,通过 AI 生成一个适合的设计图,且反对动态图。例如上面的文字描述 ” 为我的油管频道‘Science for Littles’设计一个动静的广告 ” 生成了右方的一些设计图,生成速度十分快,还可调节图片尺寸。

抉择了右方较为称心的设计后,能够持续在在线编辑器中批改你的设计,反对自在导出各种格局与下载。

AI Shell

https://github.com/builderio/ai-shell

将 chatGPT 整合到你的 shell 中,用 ai 命令进行操作

VLog

https://github.com/showlab/VLog

V 是大写,他能够将一段长视频转换成蕴含视觉和音频信息的文档。通过将此文档发送到 ChatGPT,咱们能够针对这个视频的内容进行自然语言聊天!当然,须要耗费你本人的 openAI API 额度。

开发者工具

音频能力工具集:AudioGPT

https://huggingface.co/spaces/AIGC-Audio/AudioGPT

这个工具集里蕴含了大量音频相干的解决能力工具,大部分工具应用时须要填写你本人的 GPT API key,耗费你的额度,我试了一下,文字转语音,一句 5 个词的句子,耗费了我 4000 个 token!(暴风哭泣!)

演讲:

  • 文字转语音
  • 格调迁徙
  • 语音辨认
  • 语音加强
  • 语音拆散
  • 语音翻译
  • 单声道到双声道
  • 文字转唱

唱歌:

  • 文字转唱歌

音频解决:

  • 文本到音频
  • 音频修复
  • 图像到音频
  • 声音检测
  • 指标声音检测
  • 声音提取

![]()

大模型平安围栏:NeMo-Guardrails

https://github.com/NVIDIA/NeMo-Guardrails

NeMo Guardrails 是一个开源工具包,能够轻松地将可编程护栏增加到基于 LLM 的对话零碎中。Guardrails(或简称“rails”)是管制大型语言模型输入的特定形式,例如不议论政治、以特定形式响应特定用户申请、遵循预约义的对话门路、应用特定语言格调、提取结构化数据等。

次要劣势:

  • 构建值得信赖、安全可靠的 LLM 对话零碎:应用 NeMo Guardrails 的外围价值是可能编写 rails 来领导对话。开发人员能够抉择定义他们的 LLM 驱动的机器人在某些主题上的行为,并让他们的创造力不受其他人的影响!
  • 通过操作连贯模型、链、服务等:LLM 不须要解决所有挑战。NeMo Guardrails 提供了将您的代码库或服务无缝平安地连贯到聊天机器人的能力!

chatGLM 联合本地知识库:langchain-chatGLM

https://github.com/imClumsyPanda/langchain-ChatGLM

一种利用 ChatGLM-6B + langchain 实现的基于本地常识的 ChatGLM 利用。反对将 txt、markdown 等格局的文本文件上传后,进行发问。会给出自然语言的答复,并且在最初会标注出援用本地文本的出处。

本我的项目实现原理如下图所示,过程包含加载文件 -> 读取文本 -> 文本宰割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最类似的 top k 个 -> 匹配出的文本作为上下文和问题一起增加到 prompt 中 -> 提交给 LLM 生成答复。

反对的 LLM 模型:

  • THUDM/chatglm-6b
  • THUDM/chatglm-6b-int8
  • THUDM/chatglm-6b-int4
  • THUDM/chatglm-6b-int4-qe
  • ClueAI/ChatYuan-large-v2

反对的 Embedding 模型:

  • nghuyong/ernie-3.0-nano-zh
  • nghuyong/ernie-3.0-base-zh
  • shibing624/text2vec-base-chinese
  • GanymedeNil/text2vec-large-chinese

在任意生产级终端部署大模型:MLC LLM

https://mlc.ai/mlc-llm/

MLC LLM 是一种通用解决方案,能够使任何语言模型在各种硬件后端和本地应用程序上本地化部署,同时为所有人提供一个高效的框架,以进一步优化模型性能,以适应其本身用例。

咱们的使命是使每个人都可能在其设施上本地开发、优化和部署 AI 模型。

这个方向的摸索如果呈现冲破,将大大减少模型部署和应用的门槛,让全世界的低算力设施也能退出 AI 算力营垒。

![]()

仿 openAI 格调 API 调用 chatGLM:chatglm-openai-api

https://github.com/ninehills/chatglm-openai-api

让开发者可能用调用 openAI API 的形式调用其余开源模型,节俭大量开发工作。

参考

Github Trending

https://github.com/trending

Meta360 翻新学院 -AGI 前夜

https://docs.meta360.vip

正文完
 0