关于人工智能:人工智能工程师的崛起

37次阅读

共计 3857 个字符,预计需要花费 10 分钟才能阅读完成。

感谢您在 HN 和 Twitter 上的许多评论和问题!咱们招集了一个疾速的 Twitter 空间来探讨它,>1000 名 AI 工程师收看了它。在这里播放!

咱们正在察看利用人工智能的一代人“右移”,这得益于根底模型的新兴性能和开源 /API 可用性。

过来须要 5 年和一个钻研团队能力在 2013 年实现的各种 AI 工作,当初只须要 API 文档和 2023 年的闲暇下午。

正如咱们在空间聊天中所探讨的,API 行是可渗透的 – AI 工程师能够向左调整 / 托管模型,钻研工程师也能够向右在 API 上构建!但他们的绝对劣势和“大本营”是明确的

然而,魔鬼在细节中 – 胜利评估、利用和产品化人工智能的挑战无穷无尽:

  • 模型:从评估最大的 GPT- 4 和 Claude 模型,到最小的开源 Huggingface,LLaMA 和其余模型
  • 工具:从最风行的链式链式、检索和矢量搜寻工具(如 LangChain、LlamaIndex 和 Pinecone)到新兴的自主代理畛域(此处是 Lilian Weng 的必读回顾)
  • 新闻:最重要的是,每天发表的论文、模型和技术的数量随着趣味和资金的减少呈指数级增长,以至于把握这所有简直是一项全职工作。

我认真地和字面地看待这一点。我认为这是一份全职工作。我认为软件工程将催生一个新的子学科,专门钻研人工智能的利用并无效地利用新兴的堆栈,就像“站点可靠性工程师”、“DevOps 工程师”、“数据工程师”和“剖析工程师”一样。

我所晓得的每家守业公司都有某种 #discuss-ai 松弛频道。这些频道将从非正式小组转变为正式团队,就像 Amplitude,Replit 和 Concept 所做的那样。成千上万的软件工程师致力于生产 AI API 和 OSS 模型,无论是在公司工夫还是在早晨和周末,在公司 Slack 或独立 Discords 中,都将专业化并汇聚在一个头衔上 – 人工智能工程师。这可能是十年来需要最高的工程工作。

人工智能工程师随处可见,从像 Microsoft 和谷歌这样的大公司,到像 Figma(通过 Diagram 收买),Vercel(例如 Hassan El Mghari 的病毒式 RoomGPT)和 Concept(例如 Ivan Zhao 和 Simon Last with Notion AI)这样的独立黑客,如 Simon Willison,Pieter Levels(Photo/InteriorAI)和 Riley Goodside(当初在 Scale AI)。他们在 Anthropic 做疾速工程赚了 30 万美元 / 年,在 OpenAI 做 90 万美元的修建软件。他们正在度过收费的周末,在 AGI House 上钻研想法,并在 /r/LocalLLaMA 上分享技巧。

. 他们之间的共同点是,他们正在利用人工智能的提高,并将其塑造成数百万人应用的实在产品,简直在一夜之间。

看不到一个博士。在运送人工智能产品时,您须要工程师,而不是钻研人员。

我呐喊人们留神这一趋势,而不是开始这一趋势。在 Indeed 上,ML 工程师的工作数量是 AI 工程师工作的 10 倍,但“AI”的更高增长率使我预测这一比例将在 5 年内反转。

每个 HN 招聘人员的每月工作趋势

所有职位都有缺点,但有些是有用的。咱们对对于 AI 和 ML 之间差别的无休止的语义答辩既警觉又厌倦,并且很分明惯例的“软件工程师”角色齐全有能力构建 AI 软件。然而,最近对于如何进入 AI 工程的 Ask HN 问题阐明了市场上依然存在的根本认识:

大多数人依然认为 AI 工程是机器学习或数据工程的一种模式,因而他们举荐雷同的先决条件。但我向你保障,我下面提到的高效 AI 工程师都没有做过 Andrew Ng Coursera 课程的等同工作,他们也不理解 PyTorch,也不晓得数据湖或数据仓库之间的区别。

在不久的未来,没有人会倡议通过浏览《注意力就是你所须要的所有》来开始人工智能工程,就像你不会通过浏览福特 T 型车的原理图来开始驾驶一样。当然,理解基础知识和历史总是有帮忙的,并且的确能够帮忙您找到尚未达成共识的想法和效率 / 能力增益。但有时你能够只是应用产品并通过教训来理解它们的品质。

我不心愿这种课程的“翻转”在一夜之间产生。想要填写简历,填写市场地图,并通过援用更深刻的话题来怀才不遇是人类的本能。换句话说,Prompt Engineering 和 AI 工程会在很长一段时间内感觉不如具备良好数据迷信 / ML 背景的人。然而,我认为纯正的需要和供给经济学将占上风。

  • 根底模型是“多数镜头学习者”,体现出上下文学习甚至零镜头转移能力,超出了模型训练师的初衷。换句话说,创立模型的人并不齐全晓得他们的能力。不是 LLM 钻研人员的人能够通过花更多的工夫在模型上来发现和利用能力,并将其利用于被钻研低估的畛域(例如,带有文案的 Jasper)。
  • Microsoft,谷歌,Meta 和大型根底模型实验室曾经垄断了稀缺的钻研人才,基本上提供了“人工智能钻研即服务”API。你不能雇用他们,但你能够租用他们——如果你在另一端有晓得如何与他们单干的软件工程师。世界上有~5000 名 LLM 钻研人员,但~50m 软件工程师。供给限度决定了“介于两者之间”的人工智能工程师阶层将崛起以满足需要。
  • 显卡囤积 . 当然 OpenAI / Microsoft 是第一个,但 Stability AI 通过强调他们的 GPU 军备竞赛拉开了启动 GPU 军备竞赛的尾声。

    4,000 个 GPU 群集。

还记得 2022 年 10 月吗?

从那时起,像 Inflection(1.3b 美元),Mistral(1.13 亿美元),Reka(5800 万美元),Poolside(2600 万美元)和 Concontext(2000 万美元)这样的新守业公司为了领有本人的硬件而筹集巨额种子轮融资曾经变得司空见惯。丹·格罗斯和纳特·弗里德曼

甚至发表了仙女座,他们的 1 亿美元,10 exaflop GPU 集群专门用于他们投资的初创公司。寰球芯片短缺正在反射性地造成更多的短缺。API 生产线另一端的 AI 工程师将有更多的能力应用模型,而不是训练它们。

  • 停火,筹备,瞄准。产品经理 / 软件工程师不须要要求数据科学家 /ML 工程师在训练单个畛域特定模型而后投入生产之前进行费劲的数据收集练习,而是能够提醒 LLM,并在取得特定数据进行微调之前构建 / 验证产品创意。

假如后者比前者多 100-1000 倍,提醒 LLM 原型的“停火、筹备、瞄准”工作流程可让您比传统 ML 快 10-100 倍。因而,人工智能工程师将可能验证人工智能产品,比方便宜 1000-10000 倍。这是瀑布与麻利,又是一遍。人工智能是麻利的。

  • Python → JavaScript . 数据 / 人工智能传统上十分以 Python 为核心,而像 LangChain,LlamaIndex 和 Guardrails 这样的第一个 AI 工程工具就来自同一个社区。然而,JavaScript 开发人员至多和 Python 开发人员一样多,所以当初工具越来越多地投合这个宽泛扩大的受众,从 LangChain.js 和 Transformers.js 到 Vercel 的新 AI SDK。TAM 的扩张和机会是戏剧性的。
  • 生成式人工智能与分类器机器学习 .“生成式人工智能”

    作为一个术语曾经得宠,让位于其余类比,如“推理引擎”,但依然有助于简洁地说明现有 MLOps 工具和 ML 从业者组之间的差别,以及一直回升的、截然不同的角色,最好应用 LLM 和文本到图像生成器。现有一代的 ML 可能专一于欺诈危险、举荐零碎、异样检测和特色存储,而 AI 工程师正在构建写作应用程序、个性化学习工具、自然语言电子表格和相似异星工厂的可视化编程语言。

每当呈现一个具备齐全不同的背景、说不同语言、生产一组齐全不同的产品并应用一组齐全不同的工具的子组时,他们最终就会决裂成本人的组。

6 年前,Andrej Karpathy 写了一篇十分有影响力的文章,形容了软件 2.0 – 比照了手工编码编程语言的“经典堆栈”,这些语言准确地对逻辑建模与近似逻辑的新“机器学习”神经网络堆栈,使软件可能解决比人类建模更多的问题。他往年接着指出,最热门的新编程语言是英语,最终填补了他图表中未标记的灰色区域。

更新:卡帕西回应!有些一致!

去年,Prompt Engineering 是对于随着人们开始将 GPT- 3 和稳固扩散投入工作时工作将如何变动的模因。人们讥笑 AI 初创公司是“OpenAI 包装器”,并放心 LLM 应用程序被证实容易受到提醒注入和反向提醒工程的影响。找不到护城河?

但 2023 年最大的主题之一是从新建设人类编写代码的角色,以编排和取代 LLM 的力量,从价值 2 亿美元的硕大无朋 Langchain > 到 Nvidia 反对的 Voyager,展现了代码生成和重用的明确重要性(我最近加入了 Harrison 的链与代理网络研讨会)。Prompt Engineering 既被夸张了,又将持续存在,但软件 1.0 范式在软件 3.0 利用中的从新呈现既是一个充斥大量机会 / 凌乱的畛域,又为一堆初创公司发明了空白:

如果你不营销地图,你甚至是一个 VC 吗?

当然,这不仅仅是人类编写的代码。我最近与 smol-developer,更大范畴的 gpt-engineer 以及其余代码生成代理(如 Codium AI,Codegen.ai 和 Morph / Rift)的冒险将越来越多地成为 AI 工程师工具包的一部分。随着人类工程师学会驾驭人工智能,人工智能也将越来越多地从事工程工作,直到边远的将来有一天咱们低头看,再也无奈分辨出其中的区别。

建筑商须要一个议论松节油的中央。这就是为什么,通过几个月的小型团聚,咱们当初发表第一个独立运行的、面向构建者的 AI 会议:AI 工程师峰会!

正文完
 0