8月末,北京亦庄再次迎来一年一度的世界机器人大会(WRC)。今年的大会上,27款人形机器人成为了绝对的主角,也让今年的机器人大会成为史上最火爆的一届。它们能够跳舞、对诗、爬坡、搬运、翻跟头,甚至走进生产车间,试图替代人工来做一些繁琐的工作。
乘着具身智能的东风,人形机器人在今年得到了从未有过的关注度。具身智能是指,有物理身体的智能体通过与环境的互动而获得智能,这种智能不仅包括计算和数据处理,还包括感知、理解和行动的能力。
人形机器人被认为是具身智能的最佳载体,原因在于它们在形态上仿人,具有类似人类的下肢运动能力和上肢的灵巧操作能力。一时间,资本、人才和社会关注度都纷纷涌入人形机器人行业,业界期待着人形机器人早日迎来「ChatGPT」时刻,为生产和生活大幅提效。
然而,风头正盛的人形机器人在商用进展上仍处于初始化阶段。即便是商用化走在前列的公司,购买的群体也大多是科研院校,年出货量仅为数百台。当然,科研场景同样很重要,它能够为人形机器人公司在初期形成商业闭环。
不过相比起外界对人形机器人的吹捧,从业者们反而在思考一些更实在的事:如何让它做更实在的事,更快地实现创收。
人形机器人尚未实现大规模商用的原因在于,目前仍然缺乏适合人形机器人的通用模型。宇树科技创始人兼CEO王兴兴就在接受界面新闻采访时表示,ChatGPT这样的大语言模型仅仅能解决机器人交互的部分功能,但并不能让它真正「干活」。
一旦有了通用模型,甚至完全不需要和机器人交流,只要给他布置一个任务,看一张照片,或者敲一个数字,它就能够在工厂拧螺丝,或者在家洗衣做饭,为人类世界真正创造价值。
一旦通用模型的问题得到解决,量产就并不是那么遥远的事。星尘智能CEO来杰认为,供应链不一定是缺乏量产的能力,而是在没有形成完整市场链条的当下,他们并没有投入的动力。王兴兴也提到:“如果今天有人把AI机器人的通用模型做出来,找我们定制人形机器人,我可以保证年底之前就能完成,做10万个都行。”
但通用模型到底要怎么做?它是模仿学习、强化学习、多模态数据处理、模型架构、仿真环境、泛化能力等一系列方法与技术的集合。许多机器人从业者的共识是,光靠目前的虚拟数据投喂方式是远远不够的,机器人迫切地需要落地,与物理世界发生更多交互,做更多实物训练,才能够更理解人类世界的运作方式。
另一个需要解决、但甚少被提及的问题是安全性。一个最简单的例子,人形机器人会搬运重物,但却并不能100%保证它不会用重物伤害人,这需要更准确的环境识别能力和判断力。此外,目前业内也缺乏人形机器人安全风险把控的相关法规。
工业被认为是人形机器人有望最快大规模部署的场景,许多汽车与家电厂商也纷纷表示出了对人形机器人的购买兴趣。在大会现场,优必选展示了旗下Walker S系列人形机器人检测奥迪车辆的场景,优必选首席品牌官谭旻介绍,其检测范围可覆盖车身360°和0.5米以下的低矮区域,可以实现毫米级检测,准确率达99%。
但由于量产挑战和机器人能力限制,多数人形机器人目前还只能在工厂进行质检和搬运的工作实训,并未进入真正的生产环节。不过,谭旻说道,人形机器人商业化还没有走0走到1,而实训是从0走到0.1的过程,它完成了商业化的验证,也是当前最重要的一步。
现阶段当然也有不看好人形机器人的声音。零一万物创始人李开复就认为,具身智能是物理世界跟AI的结合,一旦大模型接入物理世界,就需要面临包括安全问题、机器问题、机械问题、故障问题在内的各种问题,难度会大很多倍。并且,在他看来,绝大多数应用场景并不需要人形机器人,因此他旗下的创新工场也并未投资过相关公司。
从业者们对人形机器人的难度当然也有认知。大部分从业者的共同看法是,只要能创造价值,现阶段机器人的形态并没有那么重要。它可以是双足、可以是移动轮盘、也可以是四足的机器狗。以宇树科技为例,目前公司出货量最大的产品仍是机器狗,它们同样能在电力巡检等场景发挥效用。
在本届大会上,更多商用进展快速的机器人都并非人形。例如京东的智能配送车、库卡的重载机器人、面向医院场景的擎朗消毒机器人和医疗配送机器人等。它们只需要解决特定场景的特定需求,也因为生产并不复杂,能够更快速地上岗工作。
这可能会是相当长的一段时间内,机器人企业的共同认知:赚钱才是最要紧的事。在人形机器人真正迎来商用爆发之前,他们最大的挑战仍然是活下来。
来源:界面新闻 作者:陆柯言