多乐游戏中心:
前期视频中,擎天柱周围有根缆绳,据特斯拉机器人团队解说,这是防备意外跌倒的安全措施,并非实践支撑。毕竟是初期效果,安稳功能,快速迭代是要害
后续更新的视频里,Optimus就没有缆绳了,动作是实时速度、无任何CGI特效,彻底是模仿练习后零样本搬迁到实际的成果
这次的中心亮点,是擎天柱机器人彻底经过强化学习(RL)在模仿环境中练习,并成功完成了到实在国际的“零样本搬迁”(Zero-shot transfer)
啥是“零样本搬迁”?简略说,就像机器人先在虚拟国际(比方一个高档视频游戏)里把一套杂乱动作,比方跳舞、行走,练得滚瓜烂熟,然后直接拉到实际国际,第一次就能成功复现,中心无需针对实际环境进行额定调整或练习。你能幻想成一个学生在模仿器上把车练好了,一上真车就能直接开上路(当然,实际驾考没这么简略哈)
大幅改进了模仿器中的机器人模型,运用了范畴随机化(domain randomization)等技能,增强模型对实际环境改变的适应性。这些优化不只为了“炫技”,更会直接应用于提高机器人行走稳健性、全身灵敏操控等有用场景,一起,团队也从硬件层面吸取了经历,并对电源装备进行了调优
模仿与实际的距离(sim-to-real gap)始终是难题。实际国际的光照改变、物体色彩差异、未曾遇见的地上原料等,都可能让在模仿器里“万能”的机器人到了实际就“不服水土”
上一篇:中成药-标签列表-米内网