当AI开始「理解」这个世界:生数科技的AGI新赌局
你有没有想过一个问题:为什么现在的AI画图很惊艳、AI视频很逼真,但总觉得它们「懂」的东西还是太少?它们能生成内容,却好像不太理解这个世界运转的底层逻辑。
一个困扰行业很久的难题
很长一段时间里,AI世界存在一道隐形的墙:数字世界和物理世界仿佛两个平行宇宙。数字世界里,AI可以生成图片、视频、文字,看起来无所不能。但一到物理世界——让机器人真正去操控、去行动、去理解真实空间——AI就变得笨拙起来。
数据稀缺、链路割裂、泛化能力不足,这些问题像一道道枷锁,把具身智能困在实验室里。要让机器人完成一项新任务,往往需要从零开始训练。这种局限性,恰恰说明了当前AI缺乏一种「通用」的智能底座。
生数科技的破局思路
生数科技的团队很早就意识到这个问题的本质:AI需要的不是更多的垂直模型,而是一个能够统一理解数字与物理世界的「通用大脑」。
他们的解决方案是通用世界模型。简单来说,就是让AI通过视频这一天然包含时间、空间、动作与因果关系的载体,学会理解现实世界的运作规律。一旦掌握了这种理解能力,AI就能在数字世界高效生成内容,在物理世界精准执行任务。
Vidu模型解决了数字世界的内容生产问题——16秒声画同出、多镜头切换、参考生视频技术,让创作者终于有了真正可用的AI工具。而Motus模型则剑指物理世界——开源以来,它让机器人第一次具备了跨任务、跨场景的泛化能力,不再是只会执行固定程序的「工具人」。
为什么资本愿意押注
近20亿元B轮融资背后,是顶级机构对这个方向的长期看好。阿里云、中网投、百度风投……这些名字本身就代表着对技术趋势的敏锐嗅觉。
他们看到的不仅是Vidu在商业化上的潜力,更是Motus所代表的具身智能未来。当通用世界模型成为连接数字与物理世界的桥梁,当机器人能够像人类一样理解环境、预测后果、自主决策——这将重塑几乎所有行业的生产方式。
生数科技创始人朱军说得实在:希望通过统一的模型架构,打通从感知到行动的完整链路,使通用世界模型真正成为连接数字世界与物理世界的桥梁。这不是一句空话,Vidu和Motus正在把这句话变成现实。
对于我们普通人来说,这场变革或许比我们想象的更近。当AI开始真正「理解」这个世界,生活的方方面面都将被重新定义。而现在,正是这场变革的起点。



