即然接下来的工夫筹备投身 AI 行业应用层开发,那就隔三岔五分享一下近期学到的常识、在做的事件吧。(配图是明天用第一次用 SD 生成的图片,prompt:“a beautiful girl“。)
ChatGPT API 公布
明天(2023-03-02,美国工夫 03-01)OpenAI 正式公布了 ChatGPT API,即 基于 gpt-3.5-turbo 模型的。它的价格更便宜,$0.002/1k tokens,比之前 text-davince-003 便宜 10 倍。它能提供更好的对话品质,还提供了新的结构化数据接口,置信会给利用开发者带来更多的空间。
chatgpt 等 npm 包也相应更新,如果没有方法搞定绑卡操作,能够持续用这些社区接口白嫖。
不过国内的服务器曾经不能间接拜访 OpenAI API 了,国内的同学可能须要多花一些功夫,或者金钱。
尝试 Vercel Edge Function
之前开发 GPT-3 插件的时候,有同学介绍了 Building a GPT-3 app with Next.js and Vercel Edge Functions 一文,于是我尝试把 API 挪到 Vercel Edge Function 上,而后失败。
明天写本文的时候,又看了眼 TwitterBio 的例子,发现代码并没有写错。排查来排查去,原来是本人犯蠢,部署环节出了问题。现在曾经能够应用了。回头重构下插件,增加一些性能进去。
学习社区 ChatGPT API 仓库
ChatGPT 的开发商 OpenAI 提供两大块服务,API 和 ChatGPT 网页版。API 须要绑卡,有肯定门槛;网页版能够收费用,不过存在偶然连不上、响应慢等状况,据说买 plus 之后会有恶化。
于是社区就开发了网页版转 API 的工具,能够用来搭建本人的 ChatGPT API。然而须要应用反向代理服务器作为直达,开发者也不提供反向代理服务器的源码,存在一些危险,所以我看完就不打算应用了。
(当初我想想,所谓的代理服务器,是不是搞个 nginx 就能够了……
本地搭建 Stable Diffusion 环境
搭建过程其实很简略,难点次要在下载 pip 包和模型上,受限于墙内的网络环境,本来简略的下载变得异样艰苦。还好在换用国内 pip 源之后,我终于在本地搭建胜利 Stable Diffusion Web UI 环境。大体过程如下:
- 装置必须的软件环境,比方 cmake、python3.10 等
- clone AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
- 批改 pip 源
- 重复执行 ./webui 直至装置胜利
- 模型能够在 Civitai 下载
Whisper 模型
Whisper 模型是 OpenAI 释出的开源模型,能够用来做语音辨认,据说成果十分好。它不仅能够辨认语音内容,还能够依据声纹,辨别不同的发言人。所以用处也很广,比方视频会议之后,能够用它生成会议的文字记录。如果再联合 ChatGPT,就能够进行内容总结、会议摘要等工作,设想空间很大。
因为开源,所以能够本人搭建服务器,据说不须要很强的计算能力,庶民可用。OpenAI 这次也放出了 Whisper API,不便用户应用。
ChatGPT 新知
中文语料少的副作用
应用英文要求 ChatGPT 创作哈姆雷特的故事,它会回绝,因为它晓得哈姆雷特,新故事如果背景差别过大,它就会回绝。但如果用中文,因为语料有余,哈姆雷特对它来说也只是集体名,它就会很配合。
名人材料
GPT-3 会大量混同中国名人,比方郭德纲、岳云鹏;相对来说,ChatGPT 就好很多。
当初 AI 工具与 AI 基础设施层出不穷,突飞猛进应接不暇,学起来既有能源也有压力。下一步心愿能把所有工具的环境都搭建起来,先积攒感性认识再说。
本文参加了 SegmentFault 思否写作挑战赛,欢送正在浏览的你也退出。