Meta发布了新一代旗舰级AI模型系列Llama 4

Meta发布了新一代旗舰级AI模型系列Llama 4

 

Meta正式推出了Llama 4系列——四款全新的人工智能模型——这标志着该公司在开源模型研发方面迈出了重要一步。有趣的是,此次发布选在了一个周六。 新系列包含Llama 4 Scout、Llama 4 Maverick以及仍在开发中的Llama 4 Behemoth。

Meta称,这些模型是在大量未标注的文本、图像和视频数据集上进行训练的,目的是提升它们的整体视觉和上下文理解能力。 据说,中国DeepSeek实验室推出的具有竞争力的开源模型加速了Llama系列的开发进程,这些模型的表现甚至超越了Meta的上一代产品。

据报道,Meta紧急召集了“作战室”,以分析DeepSeek是如何降低其R1和V3模型部署成本的。 目前,用户可以通过Llama.com以及Hugging Face等平台获取Scout和Maverick。Behemoth仍在训练中,尚未发布。Meta已将Llama 4集成到Meta AI中,这是一款应用于WhatsApp、Messenger和Instagram等应用程序的助手工具,不过其多模态功能目前仅在美国支持英语。

值得注意的是,Llama 4的使用许可包含严格限制:欧盟的用户或企业不得使用或重新分发这些模型,这可能是对欧洲复杂的人工智能和隐私法律的一种妥协,Meta过去曾公开批评过这些法律。此外,月活跃用户超过7亿的组织需申请特殊许可,Meta有权决定是否授予。 “这些Llama 4模型标志着Llama生态系统新时代的开启,”Meta在一篇博客文章中写道,这暗示着后续还有更多进展值得期待。

Llama 4是该公司首次采用专家混合(MoE)架构的模型,这是一种旨在提高训练和推理效率的方法。这种架构允许将任务拆分,并由专门的子模型进行处理。 例如,Maverick的总参数达4000亿个,但在128个专家模块中,每个任务仅激活170亿个参数。Scout有170亿个活跃参数、16个专家模块,总参数为1090亿个。

Meta的内部基准测试显示,在编码、推理和多语言任务等方面,Maverick的表现优于GPT - 4o和Gemini 2.0等前代模型,但与Gemini 2.5 Pro、Claude 3.7 Sonnet和OpenAI的GPT - 4.5等新的强大模型相比仍有差距。 Scout更适用于文档摘要以及对大型代码库进行推理。它还具备一个独特的1000万token上下文窗口,能够处理大量文本或多模态输入。Scout可以在单个英伟达H100 GPU上运行,而Maverick则需要更强大的基础设施支持。

Behemoth是该系列中最强大的模型,目前仍在训练中,需要更庞大的计算资源。它拥有2880亿个活跃参数,总参数近2万亿个。Meta宣称,在数学和其他STEM相关任务中,Behemoth的表现优于GPT - 4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但Gemini 2.5 Pro依旧处于领先地位。 有趣的是,Llama 4系列的所有模型都不符合像OpenAI的o1或o3 - mini那样成熟的“推理”系统标准,后者旨在进行事实核查并确保输出结果的一致性和准确性,不过运行速度较慢。 Meta还对Llama 4进行了调整,使其对有争议或政治敏感的问题更加包容。

现在,这些模型会更频繁地回应此类话题,而早期的Llama版本通常会拒绝作答。Meta宣称,这些更新让模型更加平衡,无论政治倾向如何,都能提供更广泛的回应。 一位公司发言人向TechCrunch表示,用户“可以信赖[Llama 4]提供有帮助且基于事实的回应,不带主观判断”,同时它也能更公平地处理多样化的观点。 这些变化发生在政治圈的高度关注之下。

唐纳德·特朗普的盟友们,包括埃隆·马斯克和科技投资者大卫·萨克斯,指责各大人工智能平台倾向左翼,过滤保守观点。萨克斯特别指出,OpenAI的ChatGPT“过于觉醒”且存在偏见。 但在人工智能领域实现真正的中立是一个技术难题。即便马斯克的xAI也难以打造出一个没有明显政治倾向的聊天机器人。 无论如何,OpenAI和Meta等公司的目标很明确:让模型更智能、响应更灵敏,更愿意应对用户提出的复杂、棘手的问题。

联系方式
回顶部