?DeepMind：开发出可以向人类学习的人工智能

2023-12-13 20:35:53

Nature发表了一篇Google DeepMind的研究成果：研究人员在3D模拟环境中使用神经网络和强化学习，展示了AI智能体如何在没有直接从人类那里获取数据的情况下，通过观察来学习和模仿人类的行为。

这项研究被视为向人工通用智能（AGI）迈进的一大步。

研究背景

智力包括有效的知识获取，通常依赖于文化传播——个体之间的知识转移。

人类智力在很大程度上依赖于这一过程，从而能够通过社会学习吸收文化知识。这种知识被称为文化，而从一个个体向另一个个体的知识传递被称为文化传播。

文化传播是一种社会学习形式，通过与其他智能体的接触来协助学习。

技术原理

这项技术，正是利用了这一现象，它使得AI智能体能够通过观察人类的行为来学习并模仿这些行为。这种学习方式被称为“文化传播”，它是一种社会学习形式，意味着智能体不是单独学习，而是通过与人类或其他智能体的互动来获取知识。

这种智能体能够在丰富的3D物理模拟环境中与人类共同玩耍。

该研究展示了AI智能体如何在没有先前人类数据的情况下模仿人类行为的能力。这项研究通过在3D模拟环境中使用神经网络和强化学习（RL），使AI智能体能够实时、高保真地获取和利用信息，类似于人类跨代积累和精炼知识的方式。

举例解释

假设有一个AI智能体，我们想让它学会如何玩乒乓球。在传统的学习方法中，我们可能需要编写详细的规则和指令来教会AI如何打乒乓球。但在这项研究中，AI智能体可以通过观察真人打乒乓球的视频来学习。它会注意到人类是如何握拍、如何挥拍、如何移动身体来接球和击球的。

技术细节

深度强化学习：这种学习方法让AI智能体通过反复尝试和错误来优化其行为。例如，AI可能一开始打球时总是失误，但随着学习的深入，它会逐渐学会如何更准确地击中球。

模仿学习：AI智能体通过观察人类的行为来学习。在乒乓球的例子中，AI会分析人类运动员的动作，然后尝试复制这些动作。

新的学习环境（GoalCycle3D）：研究人员为AI智能体提供了一个3D模拟环境，让它们可以在一个控制和安全的环境中练习和实践所学的技能。

GoalCycle3D框架为AI探索提供了一个复杂的范式，建立在先前的工作基础上，创造了一个更具沉浸感和真实性的环境。该框架通过将任务划分为不同的元素（世界、游戏和共玩者），为RL建立了多样化的环境。

文章来源:https://blog.csdn.net/specssss/article/details/134835521
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！