Qwen团队在X post中解释停止使用混合思维模式的原始帖子地址是:https://x.com/Alibaba_Qwen/status/1947344511988076547
这个X post发布在Alibaba_Qwen的官方账号上,其中团队解释了他们的决定:"在与社区交流并深思熟虑后,我们决定停止使用混合思维模式。相反,我们将分别训练Instruct和Thinking模型,以便获得最佳质量。我们相信提供更好的性能质量比目前的统一更重要。"
新模型,效果比之前好很多:
https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
为什么失败?:
训练目标冲突:模型需要同时优化两个相互矛盾的目标(快速响应 vs 深度思考)
模式干扰:两种模式的特征表示可能在参数空间中相互干扰
这种混合方法本质上违背了"让模型专注于做好一件事"的设计哲学。阿里巴巴的经验证明了:有时候简单的分离比复杂的统一更有效。
本文作者:Dong
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!