Meta 发布 Llama 4 系列 AI 模型,引入「混合专家架构」提升效率
2025-04-06 08:31:15
  • 0
  • 0
  • 0

Meta 现已发布旗下最新 Llama 4 系列 AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth,Meta 透露相应模型都经过了「大量未标注的文本、图像和视频数据」的训练,以使它们具备「广泛的视觉理解能力」。

目前,Meta 已将系列模型中的 Scout 和 Maverick 上架到 Hugging Face,而 Behemoth 模型则还在训练中。其中 Scout 可以在单个英伟达 H100 GPU 上运行,而 Maverick 则需要英伟达 H100 DGX AI 平台或「同等性能的设备」。

Meta 表示,Llama 4 系列模型是该公司旗下首批采用混合专家(MoE)架构的模型,这种架构在训练和回答用户查询时的效率更高,所谓「混合专家架构」基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的「专家」模型。(来源:IT 之家)

 
最新文章
相关阅读