DeepSeek 新模型「Model 1」曝光,疑似「高效推理模型」
2026-01-23 02:39:52
  • 0
  • 0
  • 0

1 月 21 日下午消息,DeepSeek 于官方 GitHub 仓库更新了一系列 FlashMLA 代码,在这些更新中,一个名为「Model 1」的模型引起了广泛关注。

据悉,目前这个还很神秘的 Model1 不仅出现在了代码与注释中,甚至还有与 DeepSeek-V3.2 并驾齐驱的文件。这也不禁引发广大网友猜测,认为 Model 1 很可能就是传闻中 DeepSeek 将于春节前后发布的新模型代号。

最新消息显示,Model1 是 DeepSeek FlashMLA 中支持的两个主要模型架构之一,另一个是 DeepSeek-V3.2。这很可能是一个高效推理模型,相比 V3.2 内存占用更低,适合边缘设备或成本敏感场景。此外,它也可能是一个长序列专家,针对 16K+序列优化,适合文档理解、代码分析等长上下文任务。(来源:新浪科技)

 
最新文章
相关阅读