AI大模型与机器人结合的应用分析
按照常识在自然和生物环境下,许多认知特性是需要生物体的整体特性来塑造生物体的智能,但切换到软件信息化,很多问题的处理、解决等则是通过软件功能和算法实现,两者的通用状态其实是交互,准确说生物体与环境之间的交互,应用与服务之间的交互。客观说,具身智能没有想象中的那么晦涩,难以理解,而是相对于非具身智能而言的,像ChatGPT拥有的是没有身体的智能。但又不同于传统的控制范式,它不是基于感知,感知后的计划
虽然说长远来看,机器人一定会走进千家万户,未来机器人可能会在康复养老、个性化教育等领域带来巨大变化,但单纯的把大模型加入机器人能否产生具身智能?
个人理解具身智能的优势在于每个层次的知识都可以持续地更新和积累,而且层次之间能力可以解耦,能够更为清晰的对本体、环境和任务三层进行控制。客观说,具身智能没有想象中的那么晦涩,难以理解,而是相对于非具身智能而言的,像ChatGPT拥有的是没有身体的智能。或者说,具身智能体就是一个智能的机器人,至于这个智能是应该有身体还是没有身体的,然而对机器人的来讲肯定是希望有身体,拥有身体才能把智能发育得更好。
当然这个角度比较偏颇,智能是否需要具身的物理化还是存有不同意见的,但也不用过分纠结。我们把具身智能当作一种状态进行思考即可,不用从定义或概念的角度去评判和验证是否需要实体的具身。按照常识在自然和生物环境下,许多认知特性是需要生物体的整体特性来塑造生物体的智能,但切换到软件信息化,很多问题的处理、解决等则是通过软件功能和算法实现,两者的通用状态其实是交互,准确说生物体与环境之间的交互,应用与服务之间的交互。
在人人都喊的大模型环境下,也有人认为,直接将大模型与机器人进行匹配直接实现智能,但实际上很难。结合一个引用的比喻,如20岁大脑放在3岁的身体上,机器人虽然拥有一定的移动能力,但是操作能力非常弱。所以,真正的具身智能应该是能够自主学习和处理问题,对环境变化和不确定的时候能够自动调整和规划,这才是通往AGI或者是打造通用智能机器人非常重要的过程。
虽然不是很深刻,初步也能认识到具身智能是有物理载体在交互中,通过感知、控制和自主学习来积累知识和技能的一种能力能力。或者说是通过类人的感知方式来获取知识,并抽象成为一种表达语义来理解世界并作出行动的一种交互能力。
至少应该是具备感知能力、执行能力、学习能力和自我适应能力,在多个能力下通过控制范式进行实现。但又不同于传统的控制范式,它不是基于感知,感知后的计划,计划后的行动,行动后再来感知这样的闭环过程,如果按照这个方式的循环控制范式是不可能达到智能的。至少它的感知是不断延展,而执行又是不断的匹配变化或调整的计划,由此不断的渗透到各个应用模块,不断的结合场景进行深化学习,有点直觉感知加理性思考的味道。
总体而言,语言大模型与多模态感知大模型相互融合再结合机器人的发展思路,还是趋于具身智能系统的发展和实现。

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)