机器人学习领域迎来一项突破性进展:加州大学伯克利分校的研究团队提出了一种名为LEGO的创新框架,通过模拟婴幼儿学习方式,让机器人仅用少量训练数据就能掌握抓取多样化物体的能力。这项发表于学术平台的研究成果,为解决机器人泛化能力差的难题提供了新思路。
传统机器人训练面临根本性困境——在特定物体上训练的模型难以处理新物体。例如,仅接触过红色立方体的机器人无法识别蓝色立方体,这种现象源于视觉系统对具体特征的过度依赖。更严峻的是,现有解决方案需要海量训练数据,某些先进模型甚至需要数百万次演示才能掌握基础技能,这与人类"举一反三"的学习能力形成鲜明对比。
研究团队从认知科学中获得灵感:婴幼儿通过掌握少数基础玩具的特性,就能将知识迁移到新物体。这种"原型学习"机制启发了"塞尚玩具"概念——将复杂物体分解为球体、立方体、圆柱体和圆环四种基本形状的随机组合。研究团队生成250个结构独特但具有代表性的玩具,这些物体既非现实物品的简单复刻,又包含可迁移的结构规律。
数据收集环节采用虚实结合策略。研究团队先在ManiSkill模拟器中收集2500个虚拟抓取演示,随后3D打印物理版本进行真实世界训练。通过远程操控Franka机械臂和Unitree人形机器人,共获取2000个高质量演示数据。这种设计确保机器人能学习到多样化的抓取方式,而非机械记忆特定动作。
核心创新在于检测池化(DetPool)机制。该技术模拟人类选择性注意力,首先用SAM 2模型定位目标物体并创建掩码,然后强制视觉编码器仅处理物体区域特征。这种设计使机器人学会关注物体本质属性,而非背景或颜色等表面特征。实验表明,DetPool相比传统注意力机制性能提升最高达48%。
完整学习系统整合多项先进技术:预训练的MVP视觉编码器提供基础特征提取能力,Transformer策略网络处理时序信息,行为克隆方法实现动作模仿。这种架构使系统能用16个历史状态预测未来动作,在参数规模(8600万)远小于对比模型(最高达70亿)的情况下,展现出更强的数据效率。
虚拟环境测试中,LEGO在65个YCB物体上达到80%成功率,显著优于π0-FAST和OpenVLA-OFT等基线模型。特别值得注意的是,当训练数据量增加时,LEGO性能持续提升,而对比模型出现性能下降,显示其优秀的泛化能力。真实机器人实验进一步验证方法有效性:Franka机械臂在64个物体上取得66.67%成功率,Unitree灵巧手在13个物体上达到50.77%成功率,均优于同类方法。
消融研究揭示关键设计选择:球体形状对性能贡献最大,由两个基础形状组成的玩具效果最佳,ViT-Base架构实现性能与效率的平衡。这些发现表明,物体识别的核心在于结构特性而非复杂外观,为机器人学习提供了新认知框架。
这项研究对机器人技术发展具有多重启示:首先,突破了"数据依赖"瓶颈,1500个演示即可实现有效训练;其次,为跨领域迁移学习提供新范式,检测池化机制可应用于其他视觉任务;最后,验证了认知科学指导人工智能设计的可行性,开辟了跨学科研究新路径。尽管当前方法主要针对刚体物体,且尚未解决多步骤操作难题,但其展现的潜力已引发行业广泛关注。
更多>同类资讯三星抢先发布2nm移动芯片:激进设计背后,是机遇还是挑战?12-23MiniMax闯关港股成功!全球化布局下海外收入超七成直面巨头竞争12-23魏牌全新蓝山智能进阶版上市,VLA+Hi4协同开启大六座插混SUV新体验12-23闫维新:人形机器人潜力无限,未来将拓展至六大关键领域12-23华为小艺管家全新升级:四大维度进化,让智能家居“听懂”你的生活可以看到,小艺管家“场景大师”的能力,真正将场景的自定义自主权还给了用户,而它,就像一位 24 小时在线的智能家居配置专家,让你无需接触 APP,仅凭语音就能完成场景的创建与修改。其在理解、创造、聆听、执行…12-23华为全新小艺管家升级亮相:语音交互更智能,设备操控更便捷新的小艺管家在语音交互能力上全方位升级,通过深度语义理解与语音场景创建能力,让交互体验进一步提升。 此外,全新小艺管家能够基于住宅的 3D 户型模型与设备布局信息,实现基于真实三维空间的方位识别与控制能力,准…12-23AI驱动刺绣革新:全球首台自主刺绣机器人亮相,赋能非遗数智传承在刺绣领域,它实现了从“人工主导”到“人机协同”的范式转变,让非遗传承人能将更多精力投入釉色调配、纹样创新等核心技艺的打磨,实现“匠人智慧”与“机器效率”的最优分工;在工业层面,其突破的柔性精细操控技术已成功…12-23宇树G1迎宾、具身天工2.0主持,大咖云集,第十二届蓝鲸记者年会北京圆满落幕本届年会,我们邀请到首都青年编辑记者协会会长孟雷,中国著名经济学家温元凯,财联社总经理胡刚,清华大学新闻与传播学院副院长张铮等嘉宾与会分享,蓝鲸新闻总编辑王道军做开幕致辞。 财联社总经理胡刚在题为《信息技术…12-23杭州西溪湿地迎科技新篇:全国首个5G-A×AI大上行示范区落地记者在位于西溪湿地内的浙江移动联合搭建的全国首个5G-AxAI大上行示范区体验到,在规模部署F/A SUL大上行网络后,单终端设备最高上行网速可达1Gbps,泛在上行达到20Mbps,可支撑西溪湿地各类智能…12-23数字赋能文旅升级 安徽移动绘就智慧旅游新画卷在安徽省文旅厅指挥中心,全省旅游市场大数据平台实时呈现着各地游客流量、来源地、消费偏好等多维数据。作为全省首个旅游市场大数据平台,该系统以中国移动大数据与云计算能力为底座,构建起覆盖全省的全域游客监测体系,…12-23后云时代:CIO转型“指挥家”,在智能网络中精准调度计算资源云厂商的战场也在发生战略性转移,真正的战役,已升维至如何在这片无边无际的计算生态体系中,进行精确的“导航”与价值捕获。 对CIO而言,这意味着计算战略的核心指标发生了转移:从追求“弹性”和“可扩展性”,转向追…12-23华为2025新品发布会来袭,nova 15系列领衔多品类新品齐登场2025年12月22日,华为举行nova 15系列及全场景新品发布会,发布全新nova 15系列手机,并带来新一代华为MatePad11.5、华为WATCH十周年款、华为WATCH GT 6以及华为鸿蒙智家…12-23华为nova 15系列领衔登场,全场景新品齐发共绘智慧生活新画卷2025年12月22日,华为举行nova 15系列及全场景新品发布会,发布全新nova 15系列手机,并带来新一代华为MatePad11.5、华为WATCH十周年款、华为WATCH GT 6以及华为鸿蒙智家…12-23
魏牌全新蓝山智能进阶版上市,搭载VLA大模型,限时价27.58万起12-23
魏牌全新蓝山智能进阶版上市 27.58万起 智能化与安全双升级引关注12-23点击查看更多 +全站最新
山东移动聊城分公司:科技加持河道安防 智慧管理筑牢安全防线
国标共鉴,安全具象化!红旗天工引领中国新能源汽车安全新范式
技术跃进与安全隐忧交织:中国汽车行业在高速路上如何平衡前行?
2025品牌建设服务商TOP5揭晓:首屏霸屏+权威背书成破局关键
L3级自动驾驶“开闸”:技术突破下责任、生态与城市形态的深度变革
年末购车季:广汽丰田雷凌L与全新日产轩逸,哪款更合你心意?热门内容
魏牌全新蓝山智能进阶版上市,搭载VLA大模型,限时价27.58万起
魏牌全新蓝山智能进阶版上市 27.58万起 智能化与安全双升级引关注
27.58万元起!魏牌全新蓝山智能进阶版上市,以安全科技守护家庭出行
福特智趣烈马:城市舒适与户外撒野兼得,开启多元生活新体验
20万级“豪华堆料王”铂智7,以越级实力领航2025广州马拉松
冬季纯电SUV怎么选?长安启源全新Q05与元UP对比,谁才是家用优选?
本文链接:http://www.28at.com/showinfo-45-28705-0.html从简单玩具到真实抓取:伯克利大学解锁机器人“类孩童”学习新路径
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。