具身智能领域的发展遭遇了诸多挑战,其中基础物理世界数据的不足尤为突出,仿佛一道难以逾越的高峰,阻碍了人形机器人技术的进步,引发了广泛的忧虑。
具身智能发展阶段类比
具身智能目前正经历一个类似于GPT-1至GPT-2的转型期。这一现象显示出它尚处于发展的初级阶段。在此阶段,物理世界的基本数据严重不足。与此同时,大型语言模型能够利用互联网上丰富的数据进行训练。目前,具身智能在基础数据方面存在短缺问题。这种数据短缺在很大程度上制约了其发展速度。例如,已有研究因缺乏物理世界数据而停滞,这暗示若数据问题未能解决,后续研发将受到不利影响。
机器人泛化能力难题
通用机器人的发展依托于具身大模型技术。实现数据驱动的强大模型,旨在赋予机器人广泛的适应性和跨领域的应用潜能。据国地中心的数据负责人指出,目前,行业内获取机器人泛化数据面临重大挑战。以特斯拉的Optimus为例,该机器人至今仍依赖远程人工操作来完成特定任务,尚未具备自主泛化能力。这一现象表明,若机器人无法获取充足的高质量数据以实现泛化,其在实际应用中将难以展现出灵活和高效的性能。
数据获取方式情况
目前,数据获取途径包括数种模式。首先,遥操作是一种方式,但这种方法在获取高质量数据方面目前较为稀缺。其次,仿真合成数据也是一种途径,这类数据是在虚拟3D仿真环境中生成的,主要依赖生成数据,与实际世界存在较大差异,并且涉及人类动作捕捉数据与机器人适配的难题。国地中心的数据负责人指出,尽管仿真合成数据的获取成本较低,但仍需缩小与真实世界的差距。以银河通用公司为例,尽管该公司致力于强化机器人大脑模型,但面临诸多挑战。
数据训练比例问题
泛化数据的收集成本高昂且不易获得,据国地中心数据负责人透露,目前行业内普遍采用1:9或1:10的比例,结合遥操作机器人数据与仿真合成数据来培养机器人。然而,这一比例尚未确定。各企业在机器人训练过程中,持续探索适宜的比例。部分小型企业受成本所限,更倾向于增加仿真合成数据的比重,但这种做法可能对机器人性能带来不利影响。
数据集定义标准欠缺
数据资源不足,同时行业内对于统一的数据集定义标准尚无共识。尽管Google等国际巨头已开放部分数据集,国内企业亦有所贡献,然而,各企业所提供的数据集在格式兼容性和数据质量的一致性上存在显著差异。比如,各企业依据自身需求设定标准,这导致数据交流时出现障碍,并可能对具身智能领域的数据整合与运用产生不利影响。
未来数据建设预测
徐良威预计,到2025年,各地将加速构建数据采集训练场。此举将促进机器人从理论走向实际应用,并使数据采集手段更加丰富。这一预测犹如黑暗中的一盏明灯,为解决具身智能领域的数据挑战带来一线曙光。未来几年,有望观察到数据质量的提升,进而推动人形机器人技术的进步。
在具身智能领域,数据挑战显著。关于如何突破这一难题,您认为哪个研究路径最具潜力?期待大家踊跃发表意见,点赞并广泛传播。