最新全球模型榜单:阿里 Qwen2.5-Max 超 DeepSeek V3
2025-02-06 00:13:51
  • 10
  • 0
  • 0

2 月 4 日凌晨,三方基准测试平台 Chatbot Arena 公布了最新的大模型盲测榜单,刚刚发布的 Qwen2.5-Max 超越 DeepSeek V3、o1-mini 和 Claude-3.5-Sonnet 等模型,以 1332 分位列全球第七名,也是非推理类的中国大模型冠军。

同时,Qwen2.5-Max 在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。(来源:36Kr)