关于人工智能:ChatGLM26B模型上线wisemodel社区国内最具影响力的开源LM模型之一

ChatGLM2-6B 模型由智谱 AI 及清华 KEG 实验室独特研发，2023 年 6 月 25 日公布，上一代 ChatGLM-6B 模型于 2023 年 3 月 14 日公布，根本是国内最具影响力的开源 LLM 模型之一。该模型现曾经正式上线始智 AI-wisemodel 社区（https://wisemodel.cn/models/%E6%99%BA%E8%B0%B1AI/chatglm2-6b），欢送大家注册 wisemodel.cn 平台应用该模型，也欢送大家把基于 ChatGLM 的衍生模型等开源到 wisemodel.cn 平台。2023 年 7 月 14 日智谱 AI 及清华 KEG 试验决定，在 (https://open.bigmodel.cn/mla/form) 实现注销并取得受权后，ChatGLM2-6B 和 ChatGLM-6B 模型能够收费商用，欢送大家申请受权应用。

自 3 月 14 日公布以来，ChatGLM-6B 深受宽广开发者青睐，为了更进一步促成大模型开源社区的倒退，ChatGLM 团队再次降级 ChatGLM-6B，于 2023 年 6 月 25 日公布 ChatGLM2-6B。在次要评估 LLM 模型中文能力的 C-Eval 榜单中，截至 6 月 25 日 ChatGLM2 模型以 71.1 的分数位居 Rank 0，ChatGLM2-6B 模型以 51.7 的分数位居 Rank 6，是榜单上排名最高的开源模型。

CEval 榜单，ChatGLM2 临时位居 Rank 0，ChatGLM2-6B 位居 Rank 6 性能降级 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话晦涩、部署门槛较低等泛滥优良个性的根底之上，ChatGLM2-6B 引入了如下新个性：更弱小的性能：基于 ChatGLM 初代模型的开发教训，咱们全面降级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 应用了 GLM 的混合指标函数，通过了 1.4T 中英标识符的预训练与人类偏好对齐训练，评测结果显示，相比于初代模型，ChatGLM2-6B 在 MMLU（+23%）、CEval（+33%）、GSM8K（+571%）、BBH（+60%）等数据集上的性能获得了大幅度的晋升，在同尺寸开源模型中具备较强的竞争力。更长的上下文：基于 FlashAttention 技术，咱们将基座模型的上下文长度（Context Length）由 ChatGLM-6B 的 2K 扩大到了 32K，并在对话阶段应用 8K 的上下文长度训练，容许更多轮次的对话。但以后版本的 ChatGLM2-6B 对单轮超长文档的理解能力无限，咱们会在后续迭代降级中着重进行优化。更高效的推理：基于 Multi-Query Attention 技术，ChatGLM2-6B 有更高效的推理速度和更低的显存占用：在官网的模型实现下，推理速度相比初代晋升了 42%，INT4 量化下，6G 显存反对的对话长度由 1K 晋升到了 8K。更凋谢的协定：ChatGLM2-6B 权重对学术研究齐全凋谢，在取得官网的书面许可后，亦容许商业应用。如果您发现咱们的开源模型对您的业务有用，咱们欢迎您对下一代模型 ChatGLM3 研发的捐献。评测后果咱们选取了局部中英文典型数据集进行了评测，以下为 ChatGLM2-6B 模型在 MMLU (英文)、C-Eval（中文）、GSM8K（数学）、BBH（英文）上的测评后果。

推理性能 ChatGLM2-6B 应用了 Multi-Query Attention，进步了生成速度。生成 2000 个字符的平均速度比照如下

Multi-Query Attention 同时也升高了生成过程中 KV Cache 的显存占用，此外，ChatGLM2-6B 采纳 Causal Mask 进行对话训练，间断对话时可复用后面轮次的 KV Cache，进一步优化了显存占用。因而，应用 6GB 显存的显卡进行 INT4 量化的推理时，初代的 ChatGLM-6B 模型最多可能生成 1119 个字符就会提醒显存耗尽，而 ChatGLM2-6B 可能生成至多 8192 个字符。

咱们也测试了量化对模型性能的影响。结果表明，量化对模型性能的影响在可承受范畴内。

示例比照相比于初代模型，ChatGLM2-6B 多个维度的能力都获得了晋升，以下是一些比照示例。更多 ChatGLM2-6B 的可能，期待你来摸索发现！数理逻辑

常识推理

长文档了解

ChatGLM2-6B 的装置请参考官网：https://github.com/THUDM/ChatGLM2-6B

在中国做开源社区是件十分充斥挑战的事，也是一项须要长期保持和投入的工作，心愿大家多多反对，多点容纳和多点急躁！欢送扫码增加 wisemodel 助手(www_wisemodel_cn)，退出始智 AI-wisemodel 社区用户群，增加请注明“姓名 - 单位 - 职位”信息。