生数科技B轮融资20亿,通用世界模型加速落地
从视频生成到世界建模:生数科技的“通用智能”新范式
2026年5月,中国AI领域再迎重磅融资。成立仅三年的生数科技宣布完成近20亿元人民币B轮融资,由阿里云领投,中网投、九安海棠、好未来等多家战略资本入局,原有股东百度风投、星连资本等持续加注。这已是该公司在2026年获得的第二次大额融资,距离上一轮超6亿元的A+轮融资仅隔两个月。资本的密集涌入,不仅印证了市场对生数科技技术路线的认可,更揭示了一个正在加速成形的未来图景:通用世界模型正从理论走向现实。
Vidu:中国文生视频的全球突破
生数科技的崛起,始于2024年4月发布的视频大模型Vidu。作为中国首个全面对标OpenAI Sora的文生视频模型,Vidu一经推出便引发行业震动。2026年初,Vidu迭代至Q3版本,实现了最长16秒的声画同步输出,支持多镜头切换、运镜控制、BGM与音效生成,甚至可处理多语种对话。这一系列能力使其在国际权威AI评测机构Artificial Analysis的榜单中登顶全球第一。
Vidu的成功,不仅在于“生成一段像样的视频”,更在于其对物理世界的模拟精度。无论是光影变化、物体运动轨迹,还是角色动作的连贯性,Vidu都展现出接近真实世界的动态逻辑。这种“物理拟真”能力,正是通向通用世界模型的关键一步——因为世界模型的核心,是让AI理解并预测现实世界的运行规律。
Motus:打通数字与物理世界的桥梁
如果说Vidu是生数科技在“数字世界”的代表作,那么2025年12月开源的世界行动模型Motus,则标志着其向“物理世界”迈出的决定性一步。
Motus基于生数科技自研的UniDiffuser统一建模框架,首次实现了语言、视频与动作的统一表达与生成。更重要的是,它在全球范围内首次验证了具身基础模型的Scaling Law(规模定律),即在模型参数量与训练数据量持续增长时,其多任务泛化能力呈现可预测的指数级提升。
在具身智能长期面临数据稀缺、任务割裂、泛化能力弱等困境的背景下,Motus在多任务场景中的成功率较国际主流模型Pi0.5提升约40%。这意味着,AI不仅能“看懂”世界,还能“行动”于世界——从虚拟环境中的物体操控,到真实机器人对复杂指令的响应,Motus为通用世界模型提供了可落地的技术路径。
通用世界模型:AGI的下一站
在人工智能的发展图谱中,大语言模型解决了“理解与生成文本”的问题,而视频生成模型则开始捕捉“时空动态”。但真正的通用人工智能(AGI),需要的是对世界的统一建模能力——不仅能生成内容,还能预测变化、规划行动、适应环境。
生数科技正致力于构建这样一个完整的智能体系:以基座世界模型(Foundation World Model)为核心,向下支撑世界生成模型(WGM)用于数字内容创作,向上驱动世界行动模型(WAM)服务于机器人、自动驾驶等物理场景。这种“感知—生成—行动”的闭环架构,正是通向AGI的关键范式。
正如创始人朱军所言:“世界模型的核心,是让AI具备对现实世界的统一表征与预测能力。”视频作为记录现实的天然载体,蕴含时间、空间、因果与动作等关键信息,是训练世界模型的理想数据源。而生数科技通过统一的U-ViT架构,打通了从理解到行动的完整链路,使AI首次具备了同时作用于虚拟与物理世界的能力。
资本与战略的双重押注
本轮投资方阵容堪称豪华。阿里云的加入,不仅带来算力与生态支持,更释放出云计算巨头对世界模型战略价值的强烈看好;中网投作为国家级基金,其投资背后是国家对AI基础架构自主可控的深远布局;而好未来、九安海棠等产业资本,则预示着教育、医疗等垂直场景的加速落地。
光合创投合伙人蔡伟的评价颇具代表性:“这不仅是技术上的跨越,更是范式上的重构。”BV百度风投的持续加注,也体现了长期主义者对技术路线的坚定信念。
结语:通往AGI的“世界”之路
从Vidu到Motus,从数字生成到物理行动,生数科技用三年时间完成了一次技术跃迁。其背后,是中国AI团队在通用世界模型这一前沿赛道的集体觉醒。当越来越多的AI系统开始“理解世界如何运转”,我们距离真正的通用智能,或许已不再遥远。
标签: 通用世界模型 生数科技 Vidu Motus AGI