大模型视觉盲区:代码驱动才是理科题正解

admin17小时前14
研究发现多模态大模型在STEM视觉推理中存在'描述性失语',自然语言难以精确表达几何结构。Qwen团队提出代码驱动的视觉感知新范式,用Python代码填补精确性鸿沟,显著提升理科解题能力。...