Meta发布Llama 4新模型:更小、更快、更强?
在AI领域,Meta的Llama系列开源模型一直备受关注。就在最近,他们突然发布了Llama 4家族的新成员,并且这次在技术架构上迈出了一大步。对于普通用户来说,这意味着我们可能很快就能在个人设备上体验到更强大的AI能力。
这次发布的核心:三款新模型
根据素材,Meta这次一共推出了三款模型,它们被形象地称为“中杯”、“大杯”和“超大杯”。其中两款已经发布,一款仍在训练中。
已经发布的两款模型分别是Llama 4 Scout和Llama 4 Maverick。它们有一个共同点:激活参数都是170亿(17B)。这里的“激活参数”可以粗略理解为模型在回答问题时实际动用的“脑细胞”数量,并非模型的总大小。这种设计旨在让模型在保持较小体积的同时,具备更强的能力。
而那个“超大杯”Llama 4 Behemoth,据称拥有2万亿参数,目前还在训练中,是前两个模型的“祖师爷”。
关键的技术革新:MoE架构
我的理解是,这次发布最值得注意的一点,是Llama 4系列成为了Meta“首个基于MoE(混合专家)架构”的模型系列。
简单来说,你可以把传统的AI模型想象成一个“全科医生”,什么问题都得自己解决。而MoE架构则像是一个“专家会诊团队”。当遇到一个问题时,系统会根据问题的类型,自动调用最擅长该领域的“专家”(即模型中的一个子网络)来处理。这样做的目的是用更少的计算资源,获得更专业、更高效的输出。
素材中提到,Llama 4 Scout拥有16位“专家”,而Llama 4 Maverick则拥有128位“专家”。这或许可以解释为何参数规模相同,但后者宣称性能更强。
宣称的性能与特点
根据原文的描述,这两款已发布的模型在性能上都有一些突出的宣称:
- Llama 4 Scout:支持长达100万的上下文窗口(意味着能处理很长的对话或文档),并且“单个H100显卡即可运行”。原文称其性能超越了Gemma 3和Mistral 3.1等同类模型。
- Llama 4 Maverick:原文的表述更为直接,称其“性能干掉GPT-4o和Gemini 2.0 Flash”,并且代码能力与参数规模更大的DeepSeek-V3相当。同样强调“单卡可跑,性价比爆表”。
对于仍在训练中的Llama 4 Behemoth,素材提到其“内测成绩超过GPT-4.5、Claude 3.7、Gemini 2.0 Pro”。这些对比和成绩均来自原文,具体表现还需等待更广泛的独立测试验证。
如何尝试与使用
对于想尝鲜的用户,素材提供了几种途径。模型可以从Llama官方或Hugging Face平台下载,进行本地部署。对于不想折腾本地环境的用户,也可以通过Hugging Face或Together AI提供的在线平台进行免费试用。
需要注意的是,素材特别指出,Hugging Face的在线试用版“暂不支持图片识别”,而Together AI的平台则支持,并且注册会赠送免费额度。这为测试模型的视觉能力提供了便利。
总结
Meta此次发布的Llama 4新模型,核心思路似乎是在控制模型实际运行规模(强调“单卡可跑”)的前提下,通过MoE架构来提升性能。如果其宣称的性能指标能在实际使用中得到验证,这将为开源大模型社区和普通开发者带来更高效、更易获取的工具。当然,模型的真实能力、应用场景和局限性,还需要在实际使用中进一步观察。