智源研究院院长王仲远:大模型技术远没有发展到尽头
中经记者 曲忠芳 北京报道
当“百模大战”偃旗息鼓、“AI六小虎”渐行渐远,大模型的“大力出奇迹”和智能涌现是否已趋向枯竭?
6月6日至7日,在第七届智源大会上,智源研究院正式推出了“悟界”系列开源大模型,涵盖多模态世界模型、脑科学多模态模型、具身大脑与大小脑协作框架、全原子微观生命模型等。与此同时,现场设置的AI科研成果互动体验展区展示了悟界系列大模型在具身智能、脑科学、数字心脏等领域的应用场景。
在大会前,智源研究院院长王仲远在接受包括《中国经营报》在内的媒体记者采访时表示:“大模型技术还远没有发展到尽头,过往业界所说的百模大战,更多的是指大语言模型的竞争,而大语言模型囿于互联网数据使用的瓶颈,基础模型性能虽然仍在提升,但提升速度已明显放缓。”
在采访中,关于如何解决大语言模型性能提升瓶颈、当下的人形机器人热潮,以及AI Agent(智能体)的发展趋势等问题,王仲远一一作出了正面回应。
大模型性能提升瓶颈的不同“解法”
王仲远指出,针对大语言模型性能提升瓶颈的“解法”,能够看到当下业界的三种路径:一是通过强化学习提升后训练和推理能力的提升。例如OpenAI O4、DeepSeek R1等的推出,都是过去一年里大模型领域最明显的进展。二是数据合成,目前学术界仍在突破期。互联网数据是由人类创造的,假设AI合成数据、生成数据的质量能够媲美人类创造的数据质量,那意味着AI就有可能实现自我学习和进步。三是多模态数态。在全世界范围内,多模态数据是文字数据的成百上千倍、万倍甚至更多,但这些数据还并没有被有效地利用起来。
对此,智源研究院的“解法”是围绕原生多模态世界模型去做研究和布局。王仲远表示:“原生多模态世界模型本质上是为了让AI去感知和理解物理世界,进而实现与物理世界的交互。”
在智源研究院看来,当AI进入物理世界后,在宏观层面,大模型与硬件结合通过具身智能的发展解决实际生产生活问题;而在微观层面,生成式AI的应用能够进一步揭示微观世界的本质。由此所构成的世界模型是实现物理AGI(通用人工智能)的重要发展路径,智源研究院的工作布局则是围绕这一技术发展趋势而进行布局的。
在智源大会现场,记者了解到,“悟界”系列大模型主要包括:原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain2.0,以及全原子微观生命模型OpenComplex2。
其中,王仲远介绍,RoboOS 2.0与RoboBrain2.0能够适配各种形态的机器人,涵盖轮式单臂、轮式双臂、双足人足、四足机器人等。截至目前,智源研究院已与全球20多家具身智能企业建立了战略合作关系。
除此之外,关于AI Agent在今年密集涌现的现象,王仲远解释,当基础模型达到“可用”的水平——指既能理解自然语言,又具有一定的逻辑,大模型就会进入“好用”的阶段,促进产业的发展。Agnet是一个重要的产业落地形式,产业可以在基础模型之上开发出解决用户实际需求的Agent。当然,创业公司还要考虑ROI(投入产出比),模型需要在保证相同能力的情况下越小越好,慢思考能力或推理能力在保证推理效果的情况下越快越好。这个过程中遇到的瓶颈在未来会被逐步解决。
王仲远表示,智源研究院与香港投资管理有限公司建立战略合作框架,共建世界级跨区域合作的人工智能生态圈,推动加速人才、技术、资本的飞轮效应。
“2025年人形机器人刚学会跑”
不同于往届,今年智源大会首次将具身智能升级为全天的分论坛,并加入了人形机器人的主题,由此具身智能的火热程度可见一斑。会议期间,记者还在具身智能展区看到,各种构型的机器人展示了制作汉堡、倒饮料、抓娃娃、家居物品收纳等不同的技能。其中,智源与银河通用联合研发的具身大模型机器人Galbot,展示了商超场景下的落地应用能力。
当被问及如何看待近半年里人形机器人热潮时,王仲远表示,长期来看,人形机器人是具身智能领域非常重要的发展方向。不过,不同构型的机器人会是共存的状态。与其他构型的机器人比较来说,人形机器人的成熟周期要慢。“2024年,人形机器人刚刚会走,而2025年我们可以看到,人形机器人学会了跑,能否走得稳、跑得稳,产业界仍在努力中。”
王仲远提到,具身智能目前存在“循环悖论”,即具身能力不足,限制了真机数据的采集;数据的稀缺导致模型能力弱、落地难,无法进一步提升具身能力。
产业界中不同的参与力量在探索不同的解决办法。其一,硬件的成本越来越低,未来如果能够做到一台机器人卖几千元钱,那么消费者的购买意愿显然会比一台机器人一百万元、几十万元的可能性高;其二,许多企业在数据方面下功夫,在真实数据之外,通过仿真数据集成训练出有效的模型。智源研究院走的则是大模型的路线,依靠互联网数据帮助机器人学习智能。简单来说,学习海量的已有数据,再通过强化学习和真实世界的数据不断训练能力,突破具身智能的发展上限。
“不同的企业和研究团队都在用不同的方式进行探索,现阶段尚未达成共识。”王仲远表示,目前具身智能的本体硬件和具身模型都不成熟,这需要本体硬件和模型研发的共同努力。他提到,智源研究院在与机器人本体硬件公司交流时,本体公司普遍认为要展示硬件机器人的能力上限,同时也要降低成本。当售价足够“亲民”,那么数据采集量和模型提升速度就会大幅度提升。
(编辑:吴清 审核:李正豪 校对:颜京宁)