设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI大模型上身机器人,原速演示炸场!

2024-03-17 20:22:16 来源: 量子位

网友紧急喊话波士顿动力YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型加持的机器人,深夜来袭!YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

名曰Figure 01,它能听会说,动作灵活。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

能和人类描述眼前看到的一切:YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

听到人类说“想吃东西”,就马上递过去苹果。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

而且对于自己做的事有清楚认知,给苹果是因为这是桌上唯一能吃的东西。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

还顺便把东西整理,能同时搞定两种任务YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

最关键的是,这些展示都没有加速,机器人本来的动作就这么迅速。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

(也没人在后面操纵)YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这下网友坐不住了,立马@波士顿动力:YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

也有网友看在OpenAI卷完大语言模型、文生视频之后,又狙击机器人后感慨道:YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

接下来,我们继续来看下Figure 01的细节。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI视觉语言大模型加持

根据创始人的介绍,Figure 01通过端到端神经网络,可以和人类自如对话。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

基于OpenAI提供的视觉理解和语言理解能力,它能完成快速、简单、灵巧的动作。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

模型只说是一个视觉语言大模型,是否为GPT-4V不得而知。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

它还能规划动作、有短期记忆能力、用语言解释它的推理过程。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

比如对话里说“你能把它们放在那里吗?”YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“它们”、“那里”这种模糊表述的理解,就体现了机器人的短期记忆能力。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

它使用了OpenAI训练的视觉语言模型,机器人摄像头会以10Hz拍下画面,然后神经网络将以200Hz输出24自由度动作(手腕+手指关节角度)。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

具体分工上,机器人的策略也很像人类。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

复杂动作交给AI大模型,预训练模型会对图像和文本进行常识推理,给出动作计划;YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

简单动作如抓起塑料袋(抓哪里都可以),机器人基于已学习的视觉-动作执行策略,可以做出一些“下意识”的快速反应行动。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

同时全身控制器会负责保持机身平衡、运动稳定。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

机器人的语音能力则基于一个文本-语音大模型微调而来。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

除了最先进的AI模型,Figure 01背后公司——Figure的创始人兼CEO还在推文中提到,Figure方面整合了机器人的所有关键组成。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

包括电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

据了解,这家机器人初创公司在2周前才正式宣布和OpenAI的合作,但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

由此,具身智能领域又有一颗新星走到了聚光灯下。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“将人形机器人带进生活”

说到Figure,这家公司创立于2022年,正如前文所言,再次引爆外界关注,就在十几天前——YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

官宣在新一轮融资中筹集6.75亿美元,估值冲到26亿美元,投资方几乎要集齐半个硅谷,包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

更重要的是,OpenAI同时公开了与Figure更进一步合作的计划:将多模态大模型的能力扩展到机器人的感知、推理和交互上,“开发能够取代人类进行体力劳动的人形机器人”。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

用现在最热的科技词汇来说,就是要一起搞具身智能YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

彼时,Figure 01的最新进展是酱婶的:YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

通过观看人类的示范视频,仅需10小时端到端训练,Figure 01就能学会用胶囊咖啡机泡咖啡。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

Figure与OpenAI的合作一公开,网友们就已经对未来的突破充满了期待。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

毕竟Brett Adcock,可是把“唯一的重点是以30年的视角建立Figure,以积极影响人类的未来”这样的话都写在个人主页上了。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

但可能没人能想得到,仅仅两周左右的时间,新进展就来了。YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

值得一提的是,与炸场demo同时发布的,还有Figure的招聘信息:YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI大模型上身机器人,原速演示炸场!

参考链接:
[1]https://twitter.com/figure_robot/status/1767913661253984474?s=46&t=HBob6gxh8cOfZTIbieKeSAYyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM
[2]https://twitter.com/adcock_brett/status/1767913955295744449YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM
[3]https://twitter.com/coreylynch/status/1767927194163331345YyN流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:OpenAI大模型上身机器人,原速演示炸场!http://www.llsum.com/show-2-3873-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 达摩院牵头成立“无剑联盟”,探索RISC-V产业合作新范式

下一篇: 仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜