设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

用Vision Pro实时训练机器狗,MIT博士生开源项目火了

2024-03-12 12:53:48 来源:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:鱼羊,授权转载发布。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Vision Pro又现火爆新玩法,这回还和具身智能联动了~alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

就像这样,MIT小哥利用Vision Pro的手部追踪功能,成功实现了对机器狗的实时控制。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不仅开门这样的动作能精准get:alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

也几乎没什么延时。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Demo一出,不仅网友们大赞鹅妹子嘤,各路具身智能研究人员也嗨了。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

比如这位准清华叉院博士生:alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

还有人大胆预测:这就是我们与下一代机器互动的方式。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

项目如何实现,作者小哥朴英孝(Younghyo Park)已经在GitHub上开源。相关App可以直接在Vision Pro的App Store上下载。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

用Vision Pro训练机器狗

具体来看看作者小哥开发的App——Tracking Steamer。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

顾名思义,这个应用程序旨在利用Vision Pro追踪人类动作,并将这些动作数据实时传输到同一WiFi下的其他机器人设备上。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

动作追踪的部分,主要依靠苹果的ARKit库来实现。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

其中头部追踪调用的是queryDeviceAnchor。用户可以通过长按数字表冠来重置头部框架到当前位置。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

手腕和手指追踪则通过HandTrackingProvider实现。它能够追踪左右手腕相对于地面框架的位置和方向,以及每只手25个手指关节相对于手腕框架的姿态。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

网络通信方面,这个App使用gRPC作为网络通信协议来流式传输数据。这使得数据能被更多设备订阅,包括Linux、Mac和Windows设备。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

另外,为了方便数据传输,作者小哥还准备了一个Python API,让开发者能够通过编程方式订阅和接收从Vision Pro流式传输的追踪数据。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

API返回的数据是字典形式,包含头部、手腕、手指的SE(三)姿态信息,即三维位置和方向。开发者可以直接在Python中处理这些数据,用于对机器人的进一步分析和控制。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

就像不少专业人士所指出的那样,别看机器狗的动作还是由人类控制,事实上,相比于“操控”本身,结合模仿学习算法,人类在这个过程中,更像是机器人的教练。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

而Vision Pro通过追踪用户的动作,提供了一种直观、简单的交互方式,使得非专业人员也能够为机器人提供精准的训练数据。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

作者本人也在论文中写道:alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在不久的将来,人们可能会像日常戴眼镜一样佩戴Vision Pro这样的设备,想象一下我们可以从这个过程中收集多少数据!alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这是一个充满前景的数据源,机器人可以从中学习到,人类是如何与现实世界交互的。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台Vision Pro之外,还需要准备:alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  • 苹果开发者账户alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  • Vision Pro开发者配件(Developer Strap,售价299美元)alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  • 安装了Xcode的Mac电脑alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

嗯,看样子还是得先让苹果赚一笔了(doge)。alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

项目链接:alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

https://github.com/Improbable-AI/VisionProTeleop?tab=readme-ov-filealw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

参考链接:alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

https://twitter.com/younghyo_park/status/1766274298422161830alw流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:用Vision Pro实时训练机器狗,MIT博士生开源项目火了http://www.llsum.com/show-3-12442-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: Omdia预测苹果今年广告收入可达70亿美元 消息称苹果正测试基于AI的广告平台

下一篇: 游戏 资本「游戏人入局、资本疯抢,谁会是下一个AI独角兽?」

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜