四家国产大模型明星公司罕见同台 通往AGI之路仍存分歧|大模界
2024-06-15

|

1475

◎月之暗面CEO杨植麟认为,AGI的定义是重要的,但它不一定需要在现在被非常精确地、量化地定义,它可能是一个定性的、感性的东西。

◎面壁智能CEO李大海看来,大模型一定是通往AGI方向上,当前所有技术里能走得最远的,它能不能够直接到达,现在还有很多未知的因素。

6月14日,“2024北京智源大会”在中关村展示中心启幕,在这次大会上,国内几家大模型明星公司的创始人们罕见同台。

圆桌活动中,在北京智源人工智能研究院院长王仲远的主持下,月之暗面CEO杨植麟、百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海共同展开了一场通往通用人工智能(AGI)之路的尖峰对话。

对话中,四位掌舵者对于通往“AGI”的未来之路尚未形成共识,而在分歧之下,四家明星公司不同的发展路径或也可窥见一斑。

图片来源:主办方供图

什么是AGI:不一定需要标准定义

在全球范围内,对于AGI的定义一直缺乏统一的共识,不同的人、不同的视角都会有不同的答案。

杨植麟认为,AGI的定义是重要的,但它不一定需要在现在被非常精确地、量化地定义,它可能是一个定性的、感性的东西。“它最重要的作用,是能让社会,或者说所有人,能够对于接下来要发生什么事情有个准备,因为也许这个技术的节奏会非常快。”

另一方面,杨植麟提出,AGI一定程度上在短期内可能需要一些量化,因为如果完全没有量化,可能无法衡量AGI的开发进度,所以从短期的角度而言,evaluation(评估)本身也会是一个很难的问题,而且可能也是个很大的挑战。

张鹏则认为,与其说AGI有很严格的规范、定义,他更愿意相信AGI是一种信念、符号,它的内涵、外延是在不断地变化的。“其实没有人能够把这些说清楚,反过头来讲是一件好事,这个事情还有很多未知的空间等待我们去探索。”

张鹏举例道,在早期如何确认一个系统是否为人工智能?答案是图灵测试。然而,随着技术的不断进步和对事物认知的深化,大家认为图灵测试已经过时。同样的,AGI三个字母所代表的含义实则在动态变化中。因此,如果将某一事物过于量化、明确化,“那这件事情也就那样了,估计天花板在哪儿大家都能看得到了”。

张鹏进一步表示,可以把AGI定义成一个目标,当前是以人为参照,让机器像人一样去思考是第一步。而机器的能力远不止人的水平,我们期待它能实现对人类能力的超越。下一步是能否产生超过人类智能水平的能力,行业则将不断对AGI的内涵和外延进行更新与迭代。

王小川倾向于用一个可以评测的指标来看——能造医生,就是AGI。他表示,过去在讨论AGI时,往往将其视为一种工具。然而,这次的第一个变化是,它开始具备思考、学习、沟通、共情的能力,甚至包括多模态图像处理的能力。从其学习范式的要求来看,我们反而是像看人一样看AGI。

从当前共识的评价指标和学习范式来看,人工智能就是在向人类学习,其数据来源于人类社会产生的数据,因此在评价过程中,我们将其与人类职业进行比较。在所有职业中,医生行业的智力密度是相对最高的,既需要具备多模态能力,还要减少幻觉、有效记忆、阅读70万字的病例,具备推理能力和查阅文献能力等。在将医生与AGI进行比较时,有人认为,医生所涉及的领域仅仅是垂直细分市场,相对较低层次,但试图制造医生的难度却极大,其中涉及诸多幻觉问题、推理能力问题。如果将医生视为低于AGI,那么连医生都无法制造,何谈AGI的实现。

李大海则表示,从经济学的角度去定义,如果执行任何一个任务,它的边际成本都为零,这就是理想中的AGI。“为什么我认为大模型能够走得最远?就是我相信大模型能够把这个边际成本一直往下降,可能会逼近于零。”然而,在此过程中,需要各行各业的数据产生“飞轮效应”,逐步使模型持续训练、持续学习,从而降低整体成本。实际上,去年在行业里大模型落地的过程中,许多场景仍需进行微调,边际成本较高。

如何通往AGI:大模型是基石

大模型的热潮让AGI的实现更加接近,但大模型是否是实现通用人工智能的“基石”?

杨植麟坚定相信大模型的第一性原理,即Scaling Law(规模定律),他认为,规模定律确实本质上是“压缩”,但也确实可以产生智能,然后随着不断地去规模化模型,不断地做更好地压缩,它能产生越来越多的智能。

与此同时,在过程中也一定会有很多挑战,杨植麟认为,最大的挑战或许在于某些领域数据的稀缺性。在数据量有限的领域解决数据稀缺的难题成为关键。或者如果要构建超越人类的AI,可能根本不存在相应的数据,因为目前的所有数据都由人类产生,因此解决不存在的数据难题成为关键。但是,规模定律或者大模型本身,没有太本质的问题。

王小川则认为,说大模型是通向AGI的“基石”是没有问题的,但是“它只是在逼近AGI,但是光靠Scaling Law我理解(认为)是不够的”。

王小川表示,在Scaling Law之外,还有一件事情被大家忽略,那就是将语言纳入大模型体系,使语言转化为数学。除了规模之外,符号与连接的融合,也是中间的一个环节。未来,还会有更多的东西,必须产生范式变革。例如,大模型是数据驱动的学习系统,而类似于AlphaGo这样的自我思考型系统,同样有作用。

张鹏则认为,大模型是基石,但是不是“之一”则是另一个问题,所以这个问题其实也涉及怎么来定义AGI,“能不能真的像我们每个人心中定义的AGI那个路径上帮我们推进一步?大模型到目前为止还是很有效地在推进这件事情”。

张鹏表示,目前,Scaling Law依旧有效,还在往前进,“但它是不是能帮助我们推到那个顶峰上去,我们现在也找不到很确切的答案,但至少我们相信它在这个阶段还是有效的,所以我认为它肯定是基石”。

而在李大海看来,大模型一定是通往AGI方向上,当前所有技术里能走得最远的,它能不能够直接到达,现在还有很多未知的因素。

他补充道,当前的大型模型主要作为知识压缩工具,处理人脑的系统1,即慢思考。而系统2,即快速推理,在搜索空间中进行搜索和组合,以完成任务的能力,未来大型模型可能需要通过Agent(智能代理)技术进行外部化,或将其内化为自身能力,这是行业内需要探索的方向。