长上

当前位置：首页 > 长上 >

长上

阿里发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型

时间：2025-05-27 14:06:00

IT之家 5 月 27 日消息，阿里通义千问 Qwen 团队昨日（5 月 26 日）发布 QwenLong-L1-32B 模型，是其首个通过强化学习训练的长文本情境推理模型（LRM）。在七个长文本 DocQA 基准测试中，表现超越 o3-mini 和 Qwen3-235B-A22B 等旗舰模型，与