单机4卡训练 LLaMAFactory Megatron 速度如何?这篇做了测试。
https://arxiv.org/html/2512.22047v1
MAI-UI 是一个多尺寸的GUI智能体家族(2B、8B、32B、235B-A22B),专注于解决GUI智能体在实际部署中的四大挑战:
https://arxiv.org/pdf/2512.13607
https://huggingface.co/collections/nvidia/nemotron-cascade
本文提出了“级联分域强化学习”方法,通过分阶段、分领域的强化学习训练流程,解决了异构推理任务混合训练效率低下的难题,从而训出了在编程竞赛中达到国际银牌水平的14B通用推理模型。