具身智能主流方法：模仿学习，和强化学习

2023-12-28 10:43:15

1.区别

模仿学习：倾向于从优秀的个体展现出来的技能中快速学习，并获得泛化能力，但模仿学习目前学到的仅是相同技能的不用应用，比方说，“放苹果”泛化到“放梨”，“放牛奶”，都是“放”这个技能的不同应用，但模仿学习不能从技能“放”泛化到技能“拿”。

强化学习：强调在与现实世界交互过程中持续学习，这让强化学习具有不断重新学习新的技能的可能。

模仿学习：需要人为构造复杂数据集，数据利用率高，但数据难

强化学习：需要搭建高仿真环境，或者学习环境的模型，再用这个模型生成数据，数据利用率低，但数据相对易。

总结：类比于人，强化学习适合开疆拓土，不断在新的环境中学习新的技能，并不断学习，把这项技能学到最优，而模仿学习，适合复制强化学习最优的个体，以便大规模应用，或者说，强化学习是个将军，模仿学习是教官和士兵。

2.结合

? ? ? ? 在实际应用中，我们希望智能体不是从零开始学，所以先用模仿学习，学习基本技能，加快基础学习速度(类似于预训练模型)，但模仿学习学到的技能，从能力上难以超过学习的本体，所以要进行强化学习不断提升自己。在实际操作中，这样能大大减少强化学习的训练时间。因此，模仿学习和强化学习往往是一起使用的。好处是既能大大加快训练速度，又能得到超越人类的超高水准。

参考文献

1.模仿学习与强化学习的结合（原理讲解与ML-Agents实现）_ma-poca-CSDN博客

2.【强化学习】模仿学习：生成式对抗模仿学习_生成对抗模仿学习-CSDN博客?

3.强化学习和模仿学习的联系与区别&模仿学习和监督学习的区别？_模仿学习和强化学习的区别-CSDN博客?

文章来源:https://blog.csdn.net/weixin_48878618/article/details/135258335
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！