共计 6066 个字符,预计需要花费 16 分钟才能阅读完成。
你好,我是徐文浩,一个开办过一家 AI 聊天机器人公司的工程师。
有人说,编译原理、操作系统和图形学是程序员的三大浪漫。不过在整个计算机科学畛域,还有一个超过这三者之外的存在,那就是人工智能。人工智能的诞生其实十分早,公认的起源是 1956 年的达特茅斯会议。从那个时候开始,“机器能够思维吗?”就是人工智能研究者想要答复的一个永恒的主题。
在 2016 年,我来到了飞速发展的拼多多,在年底开办了一家人工智能聊天机器人的公司 BotHub。那个时候,Transformer 这个以后最重要的根底模型还没有被提出来。在之后的研发过程外面,咱们尝试过各种机器学习模型、开源的软件包以及各种云平台提供的解决方案,也通过数据标注、模型的训练,为不少中国出海的企业提供了面向一般消费者的智能聊天机器人。
然而,在这个过程中,咱们始终没有解脱 “有多少人工就有多少智能” 这样一个咒骂。所有的“智能”都来自于大量的人工数据标注,甚至很多硬编码的业务规定。而即使这样,在很多非凡状况下,“人工智能”还是体现得像一个“人工智障”。也因为如此,整个智能聊天机器人的服务也显得很不经济。所以在 2019 年,咱们也断了持续研发人工智能的念想,之后的几年里转而专一于面向海内电商畛域的产品研发。
去年 12 月初,在 ChatGPT 刚刚公布没几天,出于职业习惯的好奇心,我第一工夫就去尝试体验了一下。说实话,刚开始我并没有对这个新的 AI 聊天机器人抱有太高的期待。毕竟,在过来十多年,我的教训通知我,“有多少人工就有多少智能”。即便是 Google、Facebook 之前推出的聊天机器人,用不了多久也会被大家玩儿坏,体现出本人“人工智障”的实质。
然而,在简略和 ChatGPT 聊了几句车轱辘话之后,我尝试让它给我写一些简略的 Bash 脚本和 SQL 代码,而这一次,我被彻底震住了。它不仅精确地了解了我用自然语言形容的需要,还完全正确地写出了一个须要简单窗口函数的 SQL 代码。
[reference_begin]注:对于简单的须要窗口函数的 SQL,ChatGPT 写得比我快多了。这个例子我分享在了 sharegpt 上,链接在这里。[reference_end]
在这之后的几周里,我沉迷于应用 ChatGPT 实现各种各样的工作,并且开始尝试用 OpenAI 提供的各种 API。同时,我也回头开始研读了过来几年 AI 大模型的论文和停顿。事实上,2023 年的整个春节里,我都没有停下来劳动过,而是始终对着 OpenAI 公布的 Cookbook 做各种各样的尝试。
在这个过程中,我有一个强烈的感觉,那就是“强人工智能”曾经来了。这一次人工智能畛域的停顿,齐全不同于 80 年代的学习实践,也远远超过了 2012 年的深度神经网络的意义,它会变成一场席卷全世界的风暴。AI 利用不仅仅是算法工程师和机器学习钻研人员的专利了,而是变成了每个工程师都能够疾速学习并参加开发的畛域。
于是,在 23 年的除夕之前,我被动找到了极客工夫,提出了要写这样一门课程。心愿可能把新一代的 AI 利用开发的办法和机会介绍给你。在那个时候,我还没有设想到仅仅在一个多月之后,ChatGPT 和 OpenAI 就迅速席卷了国内整个科技行业。我本人对整个畛域的暴发,还是预计得太激进了。
不过,这个疾速的暴发让我进一步置信,这门课程对所有软件开发行业的从业者都是很有价值的。无论是产品经理还是工程师,乃至于行业之外的业务人员,都值得去学一学看一看。理解新一代 AI 利用的能力是怎么的,怎么通过几行简略的代码就能把它使用在咱们日常工作和生存中。我认为,人人都应该拥抱新的 AI 浪潮,学习开发新一代的 AI 利用。
为什么人人都应该学习如何开发新一代 AI 利用?
AI 算法工程师原先是一个专门的工作。原来咱们的技术团队里,都会分工成产品经理、UI/UE 设计师、前端开发、后端开发、大数据团队和 AI 算法这样一系列的工种。大部分人对于 AI 也只是有个概念性的理解,其实绝对不足深刻的意识。我为什么说,人人都应该拥抱新的 AI 浪潮,要去理解怎么开发新的 AI 利用呢?次要有 3 个起因。
第一个起因,是这一轮的 AI 浪潮里,开发新的 AI 利用的门槛大大降低了。过来,AI 利用开发是一个门槛比拟高的畛域。你须要有不错的数学根底,相熟微积分、线性代数和概率论;而后把握大量的机器学习和深度学习的常识,理解各种根底模型,比方逻辑回归、SVM、CNN、LSTM 等等的原理和实现;接着,你还要学会应用各种机器学习的编程框架,比方 TensorFlow 或者 PyTorch,买上一块价格不菲的 GPU 尝试训练模型;最初,你还须要了解在理论利用里锻炼机器学习的各种实战技巧和模型,比方各种各样的特色工程形式、Dropout 等正则化办法、超参数调优等等。对于没有相干教训的人来说,不花上个一两年工夫,你可能很难说得上能用 AI 算法做出一些有价值的产品进去。
然而这一轮的 AI 浪潮齐全不必。随同着 GPT-3、Stable Diffusion 这样预训练好的大型根底模型的呈现,以及这些模型的能力通过凋谢 API 的模式提供进去,即便没有任何机器学习的理论知识,你只须要一两天工夫,就能做出一个能解决理论问题的 AI 利用。
比方,最近你在 GitHub 上就能看到很多工程师,花上 1 - 2 天工夫就做进去的图书翻译、人工智能语音对话的利用。任何一个稍有开发教训的工程师,都可能在几周甚至几天之内,学会应用这些根底模型以及相应的凋谢 API 开发出有应用价值的利用。
from langchain.llms import OpenAIChat
from langchain.text_splitter import SpacyTextSplitter
from llama_index import GPTListIndex, LLMPredictor, SimpleDirectoryReader
documents = SimpleDirectoryReader('./data/mr_fujino').load_data()
llm_predictor = LLMPredictor(llm=OpenAIChat(temperature=0, model_name="gpt-3.5-turbo", max_tokens=1024))
list_index = GPTListIndex(documents, llm_predictor=llm_predictor,
text_splitter=SpacyTextSplitter(pipeline="zh_core_web_sm", chunk_size = 2048))
response = list_index.query("上面鲁迅学生以第一人称‘我’写的内容,请你用中文总结一下:", response_mode="tree_summarize")
print(response)
[reference_begin]注:在第 11 讲里,我会教你如何通过简略的 10 行代码,实现对任意文本的小结。[reference_end]
第二个起因,是这一轮的 AI 浪潮里,对应技术可能利用的范畴十分宽泛,能够说是无所不包。AI 自身是计算机刚刚创造进去就有的学科,在历史的过程中也有过很屡次大的提高和倒退。比方 80 年代学习实践(Learning Theory)的倒退,就使得 SVM 在实践中被大量利用。2000 年之后随着互联网广告的高速倒退,海量参数的分布式机器学习就被宽泛使用在搜寻、举荐和广告的业务中。2012 年随着 AlexNet 的公布,深度学习和卷积神经网络(CNN)就带来了计算机视觉的暴发。然而,这些历史的倒退,往往只是某一个细分畛域上的提高。而且这个过程里,对于每一个具体问题咱们都要独自收集数据、训练独自的机器学习模型来解决外面某一个小问题。
从 2020 年的 GPT- 3 开始,领有海量参数的大模型登上了历史舞台,间接应用 GPT- 3 这样的预训练好的大语言模型,无需任何微调,就能解决情感剖析、命名实体辨认、机器翻译等一系列的自然语言解决问题。而对于很多 AI 没见过的问题,也只有通过自然语言给到 AI 几个例子,通过“小样本学习”(Few-Shot Learning),AI 就能给出正确的答复。
[reference_begin]注:零样本以及小样本学习的能力,使得一个大模型能够一次性解决不同类型的很多问题。[reference_end]
在计算机视觉上,像 2021 年 OpenAI 发表的 CLIP 这样的模型也有相似的成果。咱们对于图片的分类不再局限于事后的人工数据标注的类别,而是能够扩大到任何类别下来。在自然语言、语音、视觉,乃至这些畛域互相交融的多模态畛域里,AI 同时在减速倒退、在提高。
[reference_begin]注:通过 4 亿个(图片, 文本)对的训练,对于图片的分类能够任意扩大,而不须要事后标注。[reference_end]
这一轮的 AI 浪潮开始让咱们看见了“通用人工智能”(AGI)的雏形,AI 利用的笼罩畛域被大大扩大了,简直任何一个问题都有机会通过 AI 来解决优化。明天你所在的行业和畛域,都有机会通过简略的 AI 利用开发,晋升效率和产出。
第三个起因,是这个浪潮带来的变动会对咱们每一个人的工作带来微小的冲击。在过来短短的两三个月里,在集体生存里,我曾经习惯于让 AI 帮我写代码,翻译英文材料,批改我写过的文章,为文章配图。在工作上,也曾经让 AI 来优化商品文案、优化商品搜寻,并且进一步开始尝试让 AI 承接更多本来须要由人来进行的工作。
我不晓得 AI 会不会让你就业,然而善用 AI 的团队和公司接下来肯定会有更高的效率和产出。无论你是产品经理还是工程师,是产品经营还是美术设计,在这一轮 AI 浪潮下,你的工作性质都会产生根本性的扭转。AI 会像一个助手一样随时陪伴在咱们身边,随时帮咱们解决简略的知识性工作,甚至在很多时候给咱们创意性的启发。
[reference_begin]注:这是我让 Midjourney 画的 Sam Altman 和机器人开一个座谈会的图片,除了那个在地面沉没的话筒,其余的所有都如同真的一样。[reference_end]
英伟达的创始人黄仁勋学生说,ChatGPT 的公布堪称是人工智能产业倒退的“iPhone 时刻”。而要我说,整个 AI 基于根底大模型倒退进去的能力,堪比一次工业革命。诚然,这个扭转对很多人的职业生涯来说,也是一场危机。然而就像丘吉尔所说的,“不要节约一场危机”,尽早去拥抱这个变动,你就有机会像在 2008 年 App Store 公布的时候去学习挪动 App 开发一样,把握住将来的机会。
通过实际学习新一代 AI 利用开发
那么,这门课程将如何帮忙你学习新一代的 AI 利用开发呢?
首先,这门课程不是一个实践课程,而是一个实际课程。每一节课,咱们都会提出一个须要解决的理论问题。比方,用户对于商家评论的情感剖析,可能记住上下文的聊天机器人,如何通过用户输出的关键词搜寻图片等等。而随同着这个问题的,则是通过几行或者几十行代码解决问题的整个过程。
所有的这些代码,根本都能够通过在线的 Notebook 的形式运行,不须要你在本人的电脑上搭建开发环境。即便你是一个产品经理或者业务方,你也能够本人入手体验到新一代的 AI 利用,开发起来是如许的简略便当。
其次,这门课程不只是对 OpenAI 的 API 的解说,咱们既会去尝试一些开源模型,也会去笼罩语音、视觉的利用场景。我不只会给你一个打字聊天的机器人,也会带你体验语音辨认、语音合成、AI 作画等一系列利用开发的过程。咱们不仅会应用 OpenAI 的 API 这样便捷的形式,也在特定场景下会选用本地部署的开源模型,甚至是基于你领有的数据去微调这些模型。
第三,我不仅会通知你当初 AI 有什么能力,还会教你理论应用 AI 的套路。比方分类、搜寻、举荐、问答这些问题,应该如何用现有模型的能力来解决,有什么固定的模式能够解决这些问题。你能够立即把这些办法和套路放到你现有的业务零碎里,立即通过 AI 给你的利用晋升体验与效率。
最初,随着课程的推动,你会看到组合多个 API、开源模型和开源库去解决简单的实在问题的场景。如果你想实现一个电商客服,你不仅须要检索知识库和问答的能力,同样须要去连贯你现有的订单和物流信息的能力。如何在 AI 利用的开发过程中,将简单的业务流程串起来,不是简略地调用一下 API 就能做到的。然而在学习完这个课程之后,置信这些对你都不再是难事儿了。
那针对这四个指标,我把课程分成了 3 个模块。
- 第一个模块,是 基础知识篇。这里,我会带你探索大型语言模型的根本能力。通过提醒语(Prompt)和嵌入式示意(Embedding)这两个外围性能,看看大模型能帮咱们解决哪些常见的工作。通过这一部分,你会相熟 OpenAI 的 API,以及常见的分类、聚类、文本摘要、聊天机器人等性能,可能怎么实现。
- 第二个模块,是 实战进步篇。咱们会开始进入实在的利用场景。要让 AI 有用,不是它能简略和咱们闲聊几句就能够的。咱们心愿可能把本人零碎外面的信息,和 AI 零碎联合到一起去,以解决和优化理论的业务问题。比方优化传统的搜寻、举荐;或者进一步让 AI 辅助咱们读书读文章;乃至于让 AI 主动依据咱们的代码撰写单元测试;最初,咱们还可能让 AI 去决策利用调用什么样的内部零碎,来帮忙客户解决问题。
- 第三个模块,咱们来重点关注 语音与视觉。光有文本对话的能力是不够的,我会进一步让你体验语音辨认、语音合成,以及唇形可能配合语音内容的数字人。我还会教会你如何利用当初最风行的 Stable Diffusion 这样的开源模型,去生成你所须要的图片。并在最初,把聊天和画图联合到一起去,为你提供一个“美工助理”。
心愿这个课程,可能教会你高效利用新一代 AI 弱小的能力,去解决实在场景下的问题。如果你是一个工程师,你能够立即把学到的代码、办法和模型用到你的工作里去。如果你是一个产品经理或者业务人员,置信你也能从这个课程里,理解到 AI 可能做的事件,以及当初做起来能有多简略。
立即入手,拥抱新时代的“通用人工智能”
OpenAI 的创始人 Sam Altman 说,他感觉“通用人工智能”(AGI)曾经离咱们不远了。在投入了大量的工夫去体验、利用和学习 AI 最新的停顿之后,我也曾经服气了这个观点。
人工智能是在计算机的创造之后没多久就呈现的一个畛域。说实话,作为一个早早就接触和进入到这两个畛域的幸运儿,之前我素来没有想过在有生之年会看到“通用人工智能”有实现的可能性。
而当“通用人工智能”真的有可能呈现在咱们背后的时候,我是异样兴奋的,已经被浇灭过的激情从新焚烧了起来。过来的几个月,可能是我最近几年以来,写代码、读论文、看视频最多的一段时间。我也心愿能把这些让我时时刻刻都充满热情和浪漫设想的科学技术分享给你,和你一起去拥抱一个属于 AI 的新时代。
心愿这门课,不仅仅是让你理解到 AI 畛域利用开发的常识和办法,更能激发你们的创意和激情,去开发你们用得上的 AI 产品,对你们生存的每一天都做出扭转!最初欢送你的退出!
文章起源:极客工夫《AI 大模型之美》