李飞飞团队将ViT用在机器人身上,规划推理最高提速512倍,还cue了何

2022-06-25 13:42:12 来源: IT之家 阅读量:17697   

人类的预测力+ViT会产生什么样的化学反应使机器人的动作规划能力快速准确

这是李菲菲团队的最新研究——mask vit,通过MVM和mask视觉建模对Transformer进行预训练,从而建立视频预测模型。

结果表明,MaskViT不仅可以生成256*256的视频,而且机器人动作规划的推理速度提高了512倍。

让我们看看这是什么样的研究。

从人类身上寻找灵感

神经科学领域的研究表明,人类的认知和感知能力是由一种预测机制支持的这个世界的预测模型可以用来模拟,评估和选择不同的可能行动对于人类来说,这个过程快速而准确

如果机器人能被赋予类似的预测能力然后,他们可以在复杂和动态的环境中快速计划和执行各种任务

比如通过可视化模型进行预测控制可能是一种方式,但也需要更高的计算能力和精度于是,团队想到了最近的ViT架构,以及以何MAE为代表的基于MVM和掩蔽视觉建模的自监督预训练表示

可是,实现它仍然有许多技术挑战。

一方面,全局注意机制的复杂度与输入序列长度的平方成正比,导致视频处理的成本很高另一方面,视频预测任务和自回归掩模视觉预训练之间存在不一致性在实践中,模型必须从开始就预测完整的未来帧序列,这导致了较差的视频预测质量

基于这一背景,李菲菲团队提出了MaskVit,即通过掩蔽视觉建模对变压器进行预训练,从而建立视频预测模型。

有两个具体的设计决策。

首先,为了提高记忆和训练的效率,使用了两种类型的窗口注意:空间注意和时空注意第二,在训练过程中,掩模的标记比率是可变的在推理阶段,通过迭代细化生成视频,其中根据掩模调度函数逐渐降低掩模率

实验结果

研究小组在三个不同的数据集和四个不同的指标中评估了MaskViT结果表明,与之前的先进方法相比,MaskViT表现出了更好的性能,可以生成分辨率为256 × 256的视频

烧蚀实验也在BAIR进行。

随后,团队还演示了真实机器人使用MaskViT进行实时规划的效果。

推理速度最高可提升512倍。

研究人员表示,这项工作表明,我们可以通过使用具有最少领域知识的面具视觉建模的通用框架,赋予智能主体强大的预测模型但同时,它也有一定的局限性比如每一帧量化时都会出现闪烁伪像,尤其是在背景静态的RoboNet视频中

如果要扩大视频预测的规模,还是很有挑战性的,尤其是在摄像机运动很多的场景下未来,他们将探索将这种视频预测方法集成到更复杂的规划算法中值得一提的是,今年5月,何明凯的团队提出了视频版的MAE,发现最佳掩蔽率高达90%

纸质链接:

项目链接:

他明凯的论文:

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

精选 导读

大摩:苹果产量或超预期增长,预计Q1业绩有“惊喜”

摩根士丹利分析师KatyHuberty指出,苹果本季度iPhone产量可能超预期增长,因为交货周期正在下降到“更正常的水平”。该分析师预计苹...

发布时间: 2021-12-23 17:04
行情   2021-12-23

中金:维持石四药集团跑赢行业评级目标价5.8港元

中金发布研究报告称,维持石四药集团“跑赢行业”评级,保持2021/22年归母净利润预测7.9/11.64亿元不变,目标价5.8港元。报告中称...

发布时间: 2021-12-23 17:03
行情   2021-12-23

实探中装建设元宇宙合作方鸿蒙时代:与华为无关已搬离注册地

12月22日,深交所对中装建设发布关注函,要求说明公司是否存在“楼宇智能大数据信息处理、AI可视化、元宇宙应用、智能建造系统、区块链等技术”...

发布时间: 2021-12-23 17:02
行情   2021-12-23

“疫”线女将:眼里有光心中有爱

“疫”线女将:眼里有光心中有爱题:“疫”线女将:眼里有光心中有爱曾灯光璀璨、游人如织的边陲小城因新冠疫情的再次暴发按下“暂停键”。内蒙古自治...

发布时间: 2021-12-23 16:48
要闻   2021-12-23

联通网络智能运维产品研发招标:华为、中软等11家企业入围

中国联通日前正式公布网络智能运维产品研发招标结果,华为、中软、软通动力、亚信科技等11家企业入围。传统网络故障的被动处理方式,从故障感知到信...

发布时间: 2021-12-23 16:35
酷玩   2021-12-23

热点 推荐

小米12Pro自研智能动态刷新率演示视频公布:支持新技能“滑动变速”,更

今日上午,小米手机官方表示,小米自研智能动态刷新率,是第二代低功耗2K屏幕的创新体验,第一次让小米12Pro拥有了滑动变速的新技能。小米表示...

发布时间: 2021-12-23 16:31
酷玩   2021-12-23

增速惊人!鸿蒙用户量半年突破2.2亿

C114讯12月23日下午消息在今日举办的华为动机旗舰新品发布会上,华为常务董事、消费者BGCEO、智能汽车解决方案BUCEO余承东公布了鸿...

发布时间: 2021-12-23 16:26
酷玩   2021-12-23

用户群聊从线上走到线下他趣成年轻群体社交困境破局者

伴随当下工作和生活节奏越来越紧凑,婚恋、交友等社交需求逐渐成为年轻人的刚性需求。为满足日益提升的社交需求,他趣用户从线上延伸到线下,通过组织...

发布时间: 2021-12-23 14:59
机器人   2021-12-23

京东会展云“云上服贸会”项目入选中国信通院“2021年数字孪生城市典型案

近日,2022中国信通院ICT+深度观察报告会隆重举办,京东会展云技术支持的中国国际服务贸易交易会数字平台项目入选“2021年数字孪生城市典...

发布时间: 2021-12-23 14:56
机器人   2021-12-23

华为Mate9手机推送鸿蒙HarmonyOS2.0.0.140:新增桌面

华为Mate9手机开始推送鸿蒙HarmonyOS2.0.0.140更新。更新包1优化了音量等基础体验,并新增了桌面图标放大功能。更新包2修复...

发布时间: 2021-12-23 14:41
机器人   2021-12-23
bd9