Meta发布Llama 4新模型：更小、更快、更强？

2025-04-07 Meta Llama 4 大语言模型 MoE架构

在AI领域，Meta的Llama系列开源模型一直备受关注。就在最近，他们突然发布了Llama 4家族的新成员，并且这次在技术架构上迈出了一大步。对于普通用户来说，这意味着我们可能很快就能在个人设备上体验到更强大的AI能力。

这次发布的核心：三款新模型

根据素材，Meta这次一共推出了三款模型，它们被形象地称为“中杯”、“大杯”和“超大杯”。其中两款已经发布，一款仍在训练中。

已经发布的两款模型分别是Llama 4 Scout和Llama 4 Maverick。它们有一个共同点：激活参数都是170亿（17B）。这里的“激活参数”可以粗略理解为模型在回答问题时实际动用的“脑细胞”数量，并非模型的总大小。这种设计旨在让模型在保持较小体积的同时，具备更强的能力。

而那个“超大杯”Llama 4 Behemoth，据称拥有2万亿参数，目前还在训练中，是前两个模型的“祖师爷”。

关键的技术革新：MoE架构

我的理解是，这次发布最值得注意的一点，是Llama 4系列成为了Meta“首个基于MoE（混合专家）架构”的模型系列。

简单来说，你可以把传统的AI模型想象成一个“全科医生”，什么问题都得自己解决。而MoE架构则像是一个“专家会诊团队”。当遇到一个问题时，系统会根据问题的类型，自动调用最擅长该领域的“专家”（即模型中的一个子网络）来处理。这样做的目的是用更少的计算资源，获得更专业、更高效的输出。

素材中提到，Llama 4 Scout拥有16位“专家”，而Llama 4 Maverick则拥有128位“专家”。这或许可以解释为何参数规模相同，但后者宣称性能更强。

宣称的性能与特点

根据原文的描述，这两款已发布的模型在性能上都有一些突出的宣称：

Llama 4 Scout：支持长达100万的上下文窗口（意味着能处理很长的对话或文档），并且“单个H100显卡即可运行”。原文称其性能超越了Gemma 3和Mistral 3.1等同类模型。
Llama 4 Maverick：原文的表述更为直接，称其“性能干掉GPT-4o和Gemini 2.0 Flash”，并且代码能力与参数规模更大的DeepSeek-V3相当。同样强调“单卡可跑，性价比爆表”。

对于仍在训练中的Llama 4 Behemoth，素材提到其“内测成绩超过GPT-4.5、Claude 3.7、Gemini 2.0 Pro”。这些对比和成绩均来自原文，具体表现还需等待更广泛的独立测试验证。

如何尝试与使用

对于想尝鲜的用户，素材提供了几种途径。模型可以从Llama官方或Hugging Face平台下载，进行本地部署。对于不想折腾本地环境的用户，也可以通过Hugging Face或Together AI提供的在线平台进行免费试用。

需要注意的是，素材特别指出，Hugging Face的在线试用版“暂不支持图片识别”，而Together AI的平台则支持，并且注册会赠送免费额度。这为测试模型的视觉能力提供了便利。

总结

Meta此次发布的Llama 4新模型，核心思路似乎是在控制模型实际运行规模（强调“单卡可跑”）的前提下，通过MoE架构来提升性能。如果其宣称的性能指标能在实际使用中得到验证，这将为开源大模型社区和普通开发者带来更高效、更易获取的工具。当然，模型的真实能力、应用场景和局限性，还需要在实际使用中进一步观察。