更新频率概览
- 从2024年4月到2024年12月,Llama 3系列在约8个月内发布了多个重要版本,呈现出“密集迭代、以小幅升级为主”的节奏:4月推出基础版,7月发布Llama 3.1(含405B),12月推出Llama 3.3(70B)。整体可概括为“约每3–4个月一次重要更新”。
关键版本与时间线
- 2024-04-18:发布Llama 3(8B、70B),采用仅解码式 Transformer、GQA 和128K词汇表,预训练数据超过15T tokens,初始上下文窗口为8K。
- 2024-07-23:发布Llama 3.1,引入多语言对话能力,并通过NTK-aware 插值将上下文窗口扩展至100万 tokens;新增405B参数规模版本。
- 2024-12-26:发布Llama 3.3(70B Instruct),采用在线偏好优化等后训练技术,在显著降低成本的同时达到接近Llama 3.1 405B的核心性能。
上述节点显示 Llama 3 在一年内完成了从基础发布到多模态/长上下文与指令优化等多次迭代。
后续节奏与提示
- 在2024年12月的发布沟通中,Meta 将Llama 3.3称为当年“最后一次大模型更新”,并预告次年推出Llama 4,这意味着 Llama 3 系列已进入维护与收尾阶段,后续更新节奏将转向新一代主线。