关于机器学习:了解GPT的最快方法阅读这就是ChatGPT

4次阅读

共计 649 个字符,预计需要花费 2 分钟才能阅读完成。

在图灵编辑部公众号理解到沃尔弗拉姆写的这本《这就是 ChatGPT》后,果决下单,一是因为在读论文的时候理解过沃尔弗拉姆所创建的“计算等价原理”,是很有意思的实践,晓得他是位大牛,二是 ChatGPT 也曾经火了一段时间了,它的英文写作真的很高效,让我受害颇多。但因为我不是算法方向,没怎么去钻研大模型方向的论文,技术细节是齐全没有理解。个人感觉,这本书能让咱们这些做 Web 方向的,在学术上做一些疏导。

因为之前有些机器学习的根底,我始终到本书第 61 页开始,才看到 GPT 的不同凡响,基于获取的文本,生成嵌入向量来示意,所以严格来说,ChatGPT 并不像其余模型来解决词,而是间接解决“标记 token“,这是一种更加间接的办法,绕过语言语义的繁琐规定。这种嵌入会一直的衍生,从而达到新的嵌入。加上权重的从新加权,这样对单词的解决能力达到智能,我想这也是 ChatGPT 超过之前的会话机器人的关键所在。

这是一种涉及到人类大脑在生成语言时所做事件的实质的钻研,这种训练模式,再加上它们的网络规模和训练数据的规模,才可能做到及时反馈,及时切换权重。从第 90 页开始,本书用图表的模式,十分形象的意义空间和语义静止法则,我感觉十分无效,在没有 NLP 根底的状况下,也能了解其中的关联。

ChatGPT 的胜利,更加体现了人类大脑的精妙之处,“类人“兴许是一条更加清晰的路线,也会再未来带动更多的模型产出,嵌入再嵌入,最终咱们能够期待更加神奇的 AI,能够说 ChatGPT 是一抹亮色,揭开了黑夜的一角。而本书是理解它最快捷的形式。

正文完
 0