DeepSeek 发布 V3 模型更新:编程能力大幅提升
3 月 24 日晚,DeepSeek 发布了 V3 模型更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。
根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。
除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。
还有一个普通用户「感知不强」,但让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。并且 MIT 开源许可一向以商业友好而著称,使用 MIT 许可的项目可以与商业和专有软件集成,这或许对于希望在商业项目中使用新版 V3 模型的开发者来讲,是本次更新最重要的改变了。(来源:极客公园)