3 月 27 日消息,3 月 4 日凌晨,阿里通义千问(Qwen)技术负责人林俊旸在 X 突然发文,向自己一手带大的开源模型项目告别。

3 月 4 日凌晨,阿里通义千问(Qwen)技术负责人林俊旸在 X 突然发文,向自己一手带大的开源模型项目告别。

在离开阿里近一个月后,林俊旸于社交平台发表长文指出,第一波以 OpenAI o1 和 DeepSeek-R1 为代表的推理模型验证了强化学习在后训练阶段的价值,但行业下一阶段的核心将转向「智能体式思考」,即模型通过与真实环境交互并在行动中持续修正策略。

此外,林俊旸罕见复盘了 Qwen3 早期尝试融合「思考」与「指令」双模式的局限性。

他坦言,由于追求高效执行的指令场景与深思熟虑的推理场景在底层数据需求上存在结构性矛盾,强行融合易导致模型表现妥协。

这也解释了 Qwen 在后续版本(如 2507 版本)中重新拆分 Instruct 与 Thinking 独立产品线,以满足商业客户对高吞吐和低成本需求的原因。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。