智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即
2025-03-11 10:41:20 AI 46观看
摘要在机器人技术的前沿探索中,一款全新的通用具身基座模型——智元启元大模型Genie Operator-1(GO-1)于近日正式亮相,由智元机器人公司隆重发布。这款模型引入了一种创新的Vision-Language-Latent-Action(ViLLA)框架,融合了VLM(

在机器人技术的前沿探索中,一款全新的通用具身基座模型——智元启元大模型Genie Operator-1(GO-1)于近日正式亮相,由智元机器人公司隆重发布。这款模型引入了一种创新的Vision-Language-Latent-Action(ViLLA)框架,融合了VLM(多模态大模型)与MoE(混合专家)技术,展现了采训推一体化、小样本快速泛化、跨本体应用、持续进化以及人类视频学习等多重优势。Mjg28资讯网——每日最新资讯28at.com

GO-1的ViLLA框架是其核心所在,它巧妙地结合了VLM与MoE。VLM作为模型的主干网络,继承了开源多模态大模型5-2B的权重,并通过互联网上的大规模纯文本和图文数据,赋予了GO-1强大的场景感知和理解能力。而MoE则包含了隐动作专家模型和动作专家模型,前者利用互联网上的大规模人类操作和跨本体操作视频,使模型能够理解动作;后者则借助高质量的仿真数据和真机数据,确保模型能够精确执行动作。Mjg28资讯网——每日最新资讯28at.com

Mjg28资讯网——每日最新资讯28at.com

GO-1的五大特点尤为突出:采训推一体化设计,确保了数据采集、模型训练和模型推理的无缝衔接;小样本快速泛化能力,使得模型能够在极少数据甚至零样本的情况下,快速适应新场景和新任务;一脑多形功能,使GO-1成为一个通用机器人策略模型,能够轻松迁移至不同形态的机器人上;持续进化特性,借助智元的数据回流系统,模型能够不断从实际执行中遇到的问题数据中学习和进化;人类视频学习能力,则让模型能够结合互联网视频和真实人类示范进行学习,进一步增强了其对人类行为的理解。Mjg28资讯网——每日最新资讯28at.com

GO-1的构建基于具身领域的数字金字塔,底层是互联网的大规模纯文本与图文数据,为机器人提供通用知识和场景理解的基础。其上则是人类操作和跨本体视频数据,帮助机器人学习动作操作模式。再上一层是仿真数据,用于增强模型的泛化性,使其能够适应不同场景和物体。而金字塔的顶层,则是高质量的真机示教数据,用于训练精准的动作执行。Mjg28资讯网——每日最新资讯28at.com

ViLLA框架的引入,使得GO-1能够将输入的多相机视觉信号和人类语言指令直接转化为机器人的动作执行。与Vision-Language-Action(VLA)模型相比,ViLLA通过预测隐式动作标记(Latent Action Tokens),有效弥合了图像-文本输入与机器人执行动作之间的鸿沟。例如,当用户用日常语言向机器人发出“挂衣服”的指令时,GO-1能够迅速理解指令含义,并依据所学的人类操作视频和仿真数据,精准完成挂衣服的任务。Mjg28资讯网——每日最新资讯28at.com

Mjg28资讯网——每日最新资讯28at.com

GO-1的应用场景广泛,从家庭场景中的准备餐食、收拾桌面,到办公和商业场景中的接待访客、发放物品,再到工业等更多领域的操作任务,GO-1都能迅速适应并高效完成。在商务会议中,面对人类发出的各种语音指令,GO-1能够迅速响应,如“帮我拿一瓶饮料”或“帮我拿一个苹果”,展现了其强大的指令泛化能力。Mjg28资讯网——每日最新资讯28at.com

GO-1还具备持续进化的能力。例如,当机器人在制作咖啡时不小心将杯子放歪时,它能够从这次失败中学习到经验,并在后续任务中不断优化和调整,直至成功完成任务。这种从问题数据中不断学习和进化的能力,使得GO-1能够不断适应多变的真实世界。Mjg28资讯网——每日最新资讯28at.com

Mjg28资讯网——每日最新资讯28at.com

智元机器人的GO-1不仅为机器人技术带来了革命性的突破,更为机器人走向更多不同场景、适应多变的真实世界提供了强大的支持。随着技术的不断进步和应用的不断拓展,GO-1有望成为未来机器人领域的佼佼者,为人类的工作和生活带来更多便利和惊喜。Mjg28资讯网——每日最新资讯28at.com

Mjg28资讯网——每日最新资讯28at.com

Mjg28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
韦伯望远镜揭秘:两颗恒星间的百万年壮丽“战争”
韦伯望远镜揭秘:两颗恒星间的百万年壮丽“战争”
中国载人航天新突破:杨利伟透露登月航天员将从现役中选拔
中国载人航天新突破:杨利伟透露登月航天员将从现役中选拔
太空探险先锋猴,归来二十年后命运如何?
太空探险先锋猴,归来二十年后命运如何?
一汽解放2月销量大增,中重卡销量超2万,新能源车表现亮眼
一汽解放2月销量大增,中重卡销量超2万,新能源车表现亮眼
零跑B10预售开启,LEAP3.5技术加持,全民智能驾驶新时代来临!
零跑B10预售开启,LEAP3.5技术加持,全民智能驾驶新时代来临!
星纪元ES增程全球上市,以超长续航与高阶智驾引领豪华智能出行新时代!
星纪元ES增程全球上市,以超长续航与高阶智驾引领豪华智能出行新时代!
热门内容
  • 夸克AI搜索升级“深度思考”,纯净浏览器迎来智能新篇章!
  • 浙大发布“浙大先生”,深度融合智能体DeepSeek V3/R1全国高校共享!
  • 00后主播借AI工具DeepSeek,直播单日狂揽3.3亿销售额!
  • DeepSeek爆火!创始人梁文峰身家飙升,能否超越黄仁勋成亚洲新首富?
  • 夸克AI搜索升级“深度思考”,阿里自研模型加持,DeepSeek暂缺席
  • 微信生活服务添新成员,元宝App下载入口限时开放
  • 微信接入AI新模型,腾讯股价暴涨近3000亿!
  • 梁文锋参加巴黎AI峰会传闻不实,仍在国内引网友关切
  • 中国AI新突破!全球首款通用Agent产品Manus内测引热议
  • 华为发布DeepSeek超融合一体机,全面适配V3&R1及蒸馏模型,加速AI应用
  • 马斯克xAI发布Grok-3,杭州才子吴宇怀领衔创始团队亮相
  • 浙大AI团队开播DeepSeek系列公开课,每周五晚相约云端探秘
  • AI推荐彩票中奖5元,DeepSeek真的那么神吗?
  • AI眼镜圈“百镜大战”,谁能成为最终的全能型玩家?
  • 百度PC端DeepSeek入口上线,1小时破千万用户尝鲜AI搜索新体验!
本栏最新
智元机器人新成员灵犀X2:多模态交互,毫秒级响应,未来生活新助手?
智元机器人新成员灵犀X2:多模态交互,毫秒级响应,未来生活新助手?
智元机器人新推灵犀X2:运动交互作业全能,灵动机器人来了!
智元机器人新推灵犀X2:运动交互作业全能,灵动机器人来了!
小米人形机器人CyberOne量产计划真相如何?官方回应引猜测
小米人形机器人CyberOne量产计划真相如何?官方回应引猜测
索尼开发AI游戏角色原型:埃洛伊能与玩家实时对话互动
索尼开发AI游戏角色原型:埃洛伊能与玩家实时对话互动
智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即
智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即
OpenAI新招CoT监控:为大模型恶意行为戴上“紧箍咒”
OpenAI新招CoT监控:为大模型恶意行为戴上“紧箍咒”

本文链接:http://www.28at.com/showinfo-45-11384-0.html智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:高通收购Edge Impulse,加码AI与物联网布局,战略再升级!

下一篇:智元机器人新成员灵犀X2:多模态交互,毫秒级响应,未来生活新助手?

最新热点