阿里云通义开源 Qwen2.5-VL，视觉理解能力全面超越 GPT-4o-人工智能的专栏

阿里云通义开源 Qwen2.5-VL，视觉理解能力全面超越 GPT-4o

2025-01-29 20:38:35栏目：默认栏目 IP属地：IP未知

0
0
0

1 月 28 日，阿里云通义千问开源全新的视觉模型 Qwen2.5-VL，夺得十余项权威评测中的视觉理解冠军，全面超越 GPT-4o 与 Claude3.5。

新的 Qwen2.5-VL 能够更准确地解析图像内容，突破性地支持超 1 小时的视频理解，无需微调就可变身为一个能操控手机和电脑的 AI 视觉智能体（Visual Agents），实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。（来源：36 氪）

相关阅读

© Copyright 2001 - 2025 blogchina.com, All Rights Reserved
京ICP备12023361号-1　京公网安备 11010802020321号
声明：文章内容纯属作者个人观点，不代表博客中国立场
违法和不良信息举报（涉未成年、网络暴力、历史虚无主义、有害信息举报）电话：15110263473
违法和不良信息举报（涉未成年、网络暴力、历史虚无主义、有害信息举报）邮箱：help@blogchina.com
客户服务热线：15110263473　客服邮箱：help@blogchina.com

5
0
0
0
0