Meta发布了新一代旗舰级AI模型系列Llama 4

Meta正式推出了Llama 4系列——四款全新的人工智能模型——这标志着该公司在开源模型研发方面迈出了重要一步。有趣的是，此次发布选在了一个周六。新系列包含Llama 4 Scout、Llama 4 Maverick以及仍在开发中的Llama 4 Behemoth。

Meta称，这些模型是在大量未标注的文本、图像和视频数据集上进行训练的，目的是提升它们的整体视觉和上下文理解能力。据说，中国DeepSeek实验室推出的具有竞争力的开源模型加速了Llama系列的开发进程，这些模型的表现甚至超越了Meta的上一代产品。

据报道，Meta紧急召集了“作战室”，以分析DeepSeek是如何降低其R1和V3模型部署成本的。目前，用户可以通过Llama.com以及Hugging Face等平台获取Scout和Maverick。Behemoth仍在训练中，尚未发布。Meta已将Llama 4集成到Meta AI中，这是一款应用于WhatsApp、Messenger和Instagram等应用程序的助手工具，不过其多模态功能目前仅在美国支持英语。

值得注意的是，Llama 4的使用许可包含严格限制：欧盟的用户或企业不得使用或重新分发这些模型，这可能是对欧洲复杂的人工智能和隐私法律的一种妥协，Meta过去曾公开批评过这些法律。此外，月活跃用户超过7亿的组织需申请特殊许可，Meta有权决定是否授予。 “这些Llama 4模型标志着Llama生态系统新时代的开启，”Meta在一篇博客文章中写道，这暗示着后续还有更多进展值得期待。

Llama 4是该公司首次采用专家混合（MoE）架构的模型，这是一种旨在提高训练和推理效率的方法。这种架构允许将任务拆分，并由专门的子模型进行处理。例如，Maverick的总参数达4000亿个，但在128个专家模块中，每个任务仅激活170亿个参数。Scout有170亿个活跃参数、16个专家模块，总参数为1090亿个。

Meta的内部基准测试显示，在编码、推理和多语言任务等方面，Maverick的表现优于GPT - 4o和Gemini 2.0等前代模型，但与Gemini 2.5 Pro、Claude 3.7 Sonnet和OpenAI的GPT - 4.5等新的强大模型相比仍有差距。 Scout更适用于文档摘要以及对大型代码库进行推理。它还具备一个独特的1000万token上下文窗口，能够处理大量文本或多模态输入。Scout可以在单个英伟达H100 GPU上运行，而Maverick则需要更强大的基础设施支持。

Behemoth是该系列中最强大的模型，目前仍在训练中，需要更庞大的计算资源。它拥有2880亿个活跃参数，总参数近2万亿个。Meta宣称，在数学和其他STEM相关任务中，Behemoth的表现优于GPT - 4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro，但Gemini 2.5 Pro依旧处于领先地位。有趣的是，Llama 4系列的所有模型都不符合像OpenAI的o1或o3 - mini那样成熟的“推理”系统标准，后者旨在进行事实核查并确保输出结果的一致性和准确性，不过运行速度较慢。 Meta还对Llama 4进行了调整，使其对有争议或政治敏感的问题更加包容。

现在，这些模型会更频繁地回应此类话题，而早期的Llama版本通常会拒绝作答。Meta宣称，这些更新让模型更加平衡，无论政治倾向如何，都能提供更广泛的回应。一位公司发言人向TechCrunch表示，用户“可以信赖[Llama 4]提供有帮助且基于事实的回应，不带主观判断”，同时它也能更公平地处理多样化的观点。这些变化发生在政治圈的高度关注之下。

唐纳德·特朗普的盟友们，包括埃隆·马斯克和科技投资者大卫·萨克斯，指责各大人工智能平台倾向左翼，过滤保守观点。萨克斯特别指出，OpenAI的ChatGPT“过于觉醒”且存在偏见。但在人工智能领域实现真正的中立是一个技术难题。即便马斯克的xAI也难以打造出一个没有明显政治倾向的聊天机器人。无论如何，OpenAI和Meta等公司的目标很明确：让模型更智能、响应更灵敏，更愿意应对用户提出的复杂、棘手的问题。

Meta发布了新一代旗舰级AI模型系列Llama 4

相关推荐

回顶部