玖捌肆贰
首页
留言本
AI资讯
Good Luck To You!
多模态大模型SFT竟成RL绊脚石
admin
2小时前
3
最新研究揭示:SFT阶段可能损害多模态大模型能力,导致RL强化学习效果受限。Qwen3-VL等模型实验显示SFT后性能下降,暴露训练范式深层问题,挑战业界对‘SFT+RL’路径的盲目信任。...
查看全文
控制面板
您好,欢迎到访网站!
登录后台
查看权限
网站分类
AI资讯
最新留言