Llama 4：Meta押注开放权重与专家混合架构

概述

2025年4月5日——一个周六，不寻常的时机被广泛注意为刻意之举——Meta发布了Llama 4，推出了其首批采用**专家混合（MoE）**架构的模型。此次发布标志着相较于前几代Llama的重大架构转变，并确立了Meta作为专有前沿模型严肃竞争者的地位。

三款模型宣布发布：

全部以Meta的自定义开放权重许可证发布，允许商业使用。

MoE的转变是Llama 4决定性的技术选择：

在密集模型（所有前几代Llama）中，每个参数对每个输入词元都被激活。在MoE模型中，网络包含许多专门的"专家"子网络，但每个词元只激活其中一小部分——即激活参数。其余保持休眠。

实际效果：

这与GPT-4（据报道）、Gemini（部分）和DeepSeek-V3的架构选择相同。

Meta的公告包含了对Llama 4 Behemoth（仍在训练中）的争议性性能比较：

“Llama 4 Behemoth在STEM基准上优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro。”

该声明立即受到质疑，因为Behemoth无法公开获得进行独立验证——代表了2025年AI基准报告争议的样本之一。

Meta对开放权重AI的承诺，到2025年已经是马克·扎克伯格明确阐述的一种刻意战略和哲学立场：

Llama 4 Scout和Maverick可通过Meta自己的Llama API、AI Foundry（企业版）和自托管获得。