Llama

摘录对于 LLaMA 2 的全副资源，如何去测试、训练并部署它。LLaMA 2 是一个由 Meta 开发的大型语言模型，是 LLaMA 1 的继任者。LLaMA 2 可通过 AWS、Hugging Face 等提供商获取，并收费用于钻研和商业用途。LLaMA 2 预训练模型在 2 万亿个标记上进行训练，相比 LLaMA 1 的上下文长度减少了一倍。它的微调模型则在超过 100 万个人工标注数据下实现。这篇博客蕴含了所有的相干资源，以帮忙您疾速入门。包含以下跳转: LLaMA 2 是什么？在 LLaMA 游乐场试玩模型背地的钻研工作模型的性能有多好，基准测试如何正确地去提醒聊天模型如何应用 PEFT 训练模型如何部署模型进行推理和其余资源来自 Meta 官网的布告能够在这里找到: https://ai.meta.com/llama/ LLaMA 2 是什么？Meta 公布的 LLaMA 2，是新的 sota 开源大型语言模型 (LLM)。LLaMA 2 代表着 LLaMA 的下一代版本，并且具备商业许可证。LLaMA 2 有 3 种不同的大小——7B、13B 和 70B 个可训练参数。与原版 LLaMA 相比，新的改良包含: 在 2 万亿个标记的文本数据上进行训练容许商业应用默认应用 4096 个前后文本视线 (能够被扩大)70B 模型采纳了分组查问注意力 (GQA)可由此获取 Hugging Face Hub在 LLaMA 游乐场试玩有几个不同的游乐场供与 LLaMA 2 来测试聊天: ...