智元AGIBOT今日宣布,由香港大学、智元AGIBOT、复旦大学和上海创智学院组成的联合研究团队提出了WholeBodyVLA,这是一种面向真实世界的人形机器人全身Vision–Language–Action框架。该框架基于智元灵犀X2研究发布,将VLA扩展至双足人形机器人的全身控制,并在全身loco-manipulation任务中验证了其可行性。WholeBodyVLA通过从第一视角人类视频中学习移动与操作的潜在动作表示,解决了真机数据稀缺的问题,并提升了运动执行中的稳定性。
研究团队在智元灵犀X2人形机器人上进行了大量真机实验,发现WholeBodyVLA具备大范围、长程移动操作任务的能力,并且展现出距离泛化性、操作泛化性和地形泛化性。该框架能够从不同位置出发,完成目标物体处的操作任务,对不同场景、物体、位置表现出操作泛化性,并能在干扰地形上保持基本准确的移动方向和平衡。WholeBodyVLA为双足人形机器人自主全身控制提供了可行路径,使机器人能够在真实世界中稳定完成行走与操作交织的长时序任务。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。