谷歌 DeepMind MuZero 人工智能可以不学规则掌握游戏

来源：互联网作者：王林更新时间：2020-12-24 17:51:09阅读：

正文谷歌 DeepMind MuZero 人工智能可以不学规则掌握游戏

2020年12月24日 17:54:50来源：

IT之家12月24日消息谷歌的 DeepMind 人工智能目前已经进化到第四代，名为 MuZero。最新的版本可以无需学习棋类等游戏规则便能掌握游戏。该技术能够应用于机器人技术、工业系统以及混乱的现实世界。

早在 2016 年，AlphaGo 先后击败围棋世界冠军李世石、柯洁，这仅仅是 DeepMind 人工智能的初代版本，需要事先输入大量人类对弈数据、规则数据进行训练，然后才可以进行实战。AlphaGo 是首个能够利用神经网络、树状搜索完全掌握围棋的人工智能。

此后于 2017 年推出的第二代 AlphaGo Zero，能够不借助人类对弈数据，仅仅事先输入规则便可自行训练，最终掌握围棋。

谷歌第三代的人工智能 AlphaZero，不仅可以自主学会围棋，也仅仅依靠事先了解规则，掌握了国际象棋、日本将棋。

根据谷歌发表在《自然》杂志的文章显示，第四代人工智能 MuZero 可以在未知规则的情况下学会上述四种棋类，规划制胜策略。此外，还能够掌握掌机游戏 Atari。

DeepMind 公司表示，多年来研究人员一直在寻找一种方法，既可以学习建立用于解释目前环境的模型，也能够利用这个模型来进行最好的决策。直到今天，大多数方法都难以在 Atari 这种游戏中进行有效规划。

MuZero 首先在 2019 年推出，通过只关注环境中最重要的一个方面，来学习建立一个模型，并解决问题。通过将这种方法与 AlphaZero 强大的搜索树技术相结合，MuZero 的能力实现了重大飞跃。此外，MuZero 还利用了前瞻搜索、基于模型的规划来解决问题。具体来说，MuZero 对环境中至关重要的三个问题来计划：

价值：现在所处的位置有多好？

策略：哪一种行动是最好的？

奖励：最后一步的动作结果有多好？

IT之家了解到，Atari 公司于 1976 年在美国推出了 Atari 2600 游戏机，这是史上第一部真正意义上的家用游戏主机，其整个生命周期持续到 1992 年，共售出三千万台。

标题：谷歌 DeepMind MuZero 人工智能可以不学规则掌握游戏

地址：http://ai.rw2015.com/edu/5368.html

免责声明：人工智能网为网民提供实时、严谨、专业的财经、产业新闻和信息资讯，更新的内容来自于网络，不为其真实性负责，只为传播网络信息为目的，非商业用途，如有异议请及时联系站长，本网站将立即予以删除！。

上一篇：2020中国人工智能高峰论坛在福建厦门举行

下一篇：女性隐私被1.6万人浏览！工程师性骚扰用户，脸书放弃AI数据？

人工智能网推荐浏览

人工智能：把根扎牢才能遍地开花

两会