2024年8月10日,由中国计算机学会主办的CCF学科前沿讲习班《具身智能》在清华大学顺利召开。讲习班邀请10位来自著名高校与企业科研机构,活跃在具身智能前沿领域的专家学者,系统地讨论具身智能的内涵与外延,并结合形态智能、感知与学习等多视角探讨包括环境导航、机器人操作等典型具身行为的前沿智能方法。
大会上,元客视界CTO陈溥、宇树科技Unitree创始人/CEO/CTO王兴兴、达闼机器人有限公司产品副总裁王斌、五八智能科技(杭州)有限公司副总经理袁海辉、北京因时机器人科技有限公司CEO蔡颖鹏、三星电子中国通信研究院研究员阿勇、睿尔曼AI技术负责人吴波、美团无人机硬件研发负责人吴昊天共同参与了由北京邮电大学“拔尖人才”教授、讲习班学术主任方斌主持的【具身智能圆桌对话】,就具身智能的体系结构、前沿技术、主要挑战和应用场景进行更多维度的互动、探讨,共话具身智能发展新未来。
以下为学术主任方斌与元客视界CTO陈溥的对话内容实录。
方斌:现在具身智能的热潮,给工业圈、各位企业带来了什么样的机遇,还有什么样的挑战?
陈溥:正如大模型的出现对通用人工智能的意义一样,具身智能的出现对通用机器人也是划时代的。
专用机器人已经出现并发展应用了很多年,在工业领域,焊接机器人、检测机器人、装配机器人、堆垛机器人等等遍地开花;在家用领域,扫地机器人、送餐机器人等等也开始逐步商用化。但是当前的机器人仅仅在做人类某一项工作的替代、优化、分解和精准化,仍未实现通用化。
如果有一个机器人,它可以拧螺丝、炒菜和泡咖啡,无需编程,只要一个指令,他就能既快又好地把任务完成,这才是完美的机器人。那这种机器人应该是什么样的?
毫无疑问,人形最合适。
我们生活的物理世界中各种场景、设备、任务、工具,都是为人体形态量身打造的,只有机器人像人,具备类似的身体结构和能力,才能更好地融入人类的生活和工作环境,并且无需对机器人做任何改造。
人形机器人的出现给产业带来了很大的想象空间,但同时也带来了挑战。人在回路是当前人形机器人的任务学习训练的主要模式。人教机器学会拿杯子、洗碗,通过动作捕捉系统把人的动作传给机器。这需要把动作数据转换成机器能操作的动作指令。目前这部分工作都是定制化的、非通用的,降低了研发效率。
元客视界基于十多年在光学成像、视觉软件与算法、核心视觉部件等领域的技术积累,在具身智能领域,现已基于FZMotion运动捕捉系统打造出成熟领先的智能体科研解决方案,希望能和学界、产业界联合推动人形机器人数据传输和控制协议的标准化,缩短研发周期。
方斌:对于具身智能的未来前景和期望的思考
陈溥:润物细无声,很多时候变化悄无声息,回头看却已习惯。
黑天鹅事件往往是发生变化的重要推手。疫情前我们还没有习惯线上会议,疫情后却发现这已经成了我们沟通的一个主要方式。疫情也推动了各类机器人的应用。当时考虑到接触风险,已经在很多隔离酒店使用送餐机器人、送货机器人、检测机器人、消杀机器人。可惜由于产品还不成熟,习惯没有延续下来。所以我们只需要把产品做好、做稳定,可能就是万事俱备只欠东风。
人类对人形机器人的思考也不是近些年才开始的。3000年前《列子·汤问》就有《偃师造人》的故事,偃师制作了一个栩栩如生可以唱歌跳舞的人偶;达·芬奇也曾造出过一个机器骑士,可以完成包括张嘴、摇头、摆手、坐起等动作;二十多年前有一部日本动漫《人形电脑天使心》讲述了未来每个人都有一个人形电脑,TA是管家、是助手也是伴侣。
就像现在人手一个手机一样,也许不远的将来,每个人都会拥有一个人形机器人。
方斌:作为企业负责人,对于年轻学生尤其从事这个方向的研究生有什么建议和助力?
陈溥:元客视界是凌云光全资子公司,前身为凌云光立体视觉事业部,我们对于立体视觉、人工智能的研究可以追溯到2012年,当年参与清华戴院士团队立体视频重建与显示技术及装置项目,并荣获了国家技术发明一等奖。
我们有非常多和高校产学研合作的项目,也欢迎从事具身智能、机器视觉、人工智能等方向的学子参与,在横向合作项目中摸清产业化的方向,积累产业化的经验。