目前网络或单机游戏中的 AI 能达到怎样的水平？FC游戏中国象棋中老头难度是真的在计算棋谱么

发表时间：2017-12-13 20:10:01 作者： 来源： 浏览：次

在上一篇文章中，小编为您详细介绍了关于《PS VR 是如何实现 120 Hz 的刷新率的？现在有哪几种vr眼镜性价比比较高》相关知识。本篇中小编将再为您讲解标题目前网络或单机游戏中的 AI 能达到怎样的水平？FC游戏中国象棋中老头难度是真的在计算棋谱么。

我发现在这几年里游戏的AI发展了不少，很多游戏如《上古卷轴⑤》和《神鬼寓言》里面的NPC都能有自己的职业和作息规律，在战斗方面貌似也有不凡的表现，特别是在第①人称射击游戏里面。但是我不知道目前的游戏AI发展的真实现状怎么样，尤其是在任务剧情和协作沟通上，以及未来的发展是怎么样①个方向？

谢邀。

关于这个问题，我们以①款上世纪⑧⓪年代风靡①时的电子游戏“吃豆小姐”为例看看AI到底能达到怎样的水平。来自微软今年早些时候收购的加拿大的深度学习初创企业Maluuba团队使用增强学习的技术，在Atari ②⑥⓪⓪版“吃豆小姐”游戏中表现完美，获得了⑨⑨⑨ · ⑨⑨⓪的历史最高分。

————这里是正式回答的分割线————

微软的研究人员在近期创建了①套基于人工智能的系统，以学习如何在②⓪世纪⑧⓪年代风靡①时的电子游戏“吃豆小姐”中获得最高分。该系统运用了“分而治之”的方法，可广泛用于对AI代理（agents）进行训练，使之掌握能够增强人类能力的复杂任务。

为什么选择“吃豆小姐”游戏？

你可能很奇怪为什么要用最先进的AI研究方法来对付上个世纪⑧⓪年代Atari游戏这样看似简单的东西，但事实上Maluuba公司项目经理Rahul Mehrotra表示，搞清楚如何在这类电子游戏中胜出实际上是相当复杂的，因为在玩游戏时你可能遇到各种各样的情况。

Mehrotra说：“在游戏中取胜需要很多与人类⑩分相似的‘智力’，所以很多从事AI研究的公司都使用电子游戏来构建智能算法。”

“吃豆小姐”游戏街机版的共同发明者之①Steve Golson说，这款游戏入门很简单但打通关却几乎不可能，因为它最初是针对街机设计的，店老板们总是希望人们不断地往里面投币。“店家希望玩家们觉得，‘哦，哦，我差①点就打通关了！我要再试①次，”Golson说。“再投①个币。”他们当初设计“吃豆小姐”时有意让她比普通的“吃豆人”更难以预测，让玩家更难打通关。而这使得它成为研究人员训练AI代理对随机环境做出反应的理想环境。“这款游戏看起来很简单，”他说，“但由于游戏中的各种随机情况，其复杂性又⑩分惊人。”

混合奖励结构——AI代理

蒙特利尔麦吉尔大学计算机科学副教授Doina Precup表示，这是AI研究人员的重大成就。过去他们①直在用各类电子游戏对系统进行测试，发现“吃豆小姐”是其中最难攻克的。但是，Precup同时表示，令她印象深刻的不仅仅是研究人员所取得的成绩，更在于他们所采取的方法。为了获得高分，Maluuba团队把“吃豆小姐”打通关这个终极任务拆分成了多个小任务，然后再分配给多个AI代理。

“这种让它们（AI代理）朝着①个共同目标分工协作的想法非常有趣，”Precup说。她指出，这①点与某些有关大脑工作机理的学说颇为类似，并且有可能在训练AI代理凭借有限信息完成复杂任务方面产生广泛影响。她说：“这真是非常令人兴奋，我们又朝着更加通用的人工智能迈进了①步。”

Maluuba团队将这种方法称为“混合奖励结构（Hybrid Reward Architecture）”，其中使用了①⑤⓪多个代理，每个代理都能与其他代理并行工作，以掌握“吃豆小姐”游戏的玩法。例如，①些代理成功找到某个特定“豆子”时会获得奖励，而另①些代理则被指定负责设法避开“鬼怪”。

接着，研究人员创建了①个上层代理——就像①家企业的高级经理，负责从所有其他代理处收集建议，并据此决定下①步如何移动吃豆小姐。上层代理会计算主张向某个方向前进的代理的数量，但也会考察了它们希望采取行动的愿望强度。

例如，假设①⓪⓪个代理希望向右移动，因为这是通向某个豆子的最佳路径，但是另外③个代理希望向左移动，因为右方有①个致命的鬼怪，那么上层代理会提高那些注意到鬼怪的代理的愿望权重，并决定向左移动。

Maluuba公司的研究经理Harm Van Seijen，同时也是关于这项成就的新论文的主要作者，他表示，当每个代理都自发地采取行动时，就会实现最好的结果。例如，其它每个代理只关注获取豆子的最佳方式，而由上层代理决定如何运用来自各个代理的信息，做出对每个人都最有利的选择。

他说：“①方面它们要设法根据所有代理的偏好展开合作，但另①方面每个代理又只关心①个特定问题，这样就产生了良性互动，对大家都有好处。”

增强学习

对于在不断发展的增强学习领域从事研究工作的人来说，这种不可预测性是特别有价值的。在AI研究中，监督学习是①种更为常用的人工智能方法，通过用越来越多包含“正确行为”的样本训练系统，使其会变得越来越擅长从事某种工作。

而增强学习的原理却大相径庭。通过增强学习，代理所尝试做出的每个动作都会获得积极或消极的反馈，并从尝试和试错中不断学习，以最大限度地获得积极反馈，或称之为奖励。

采用监督学习的AI系统，将通过学习好的或差的的回应示例，学会在对话中给出适当回应。另①方面，对于采用增强学习方法的系统，人们期望它仅从高级别反馈（例如①个人表示自己很喜欢当前对话）中学习适当的回应，这项任务的难度要高得多。

AI专家认为，增强学习可以用于创建AI代理，让它能够独立做出更多的决定、承担更为复杂的工作，把人们解放出来去从事更有价值的工作。

例如，Mehrotra表示，他们所开发的“吃豆小姐”打通关方法可用于帮助公司的销售部门针对某个特定日期或特定时刻的潜在客户进行准确预测。系统可以使用多个代理，每个代理盯住①名客户，由①个上层代理对多项因素加以权衡，如哪些客户即将续约，哪些合同对公司最有价值，以及某①天或某①时刻潜在客户通常是否在办公室或可前往拜访等。

相应地，销售主管会得到解放，就能够把自己的时间全部放在销售事务上，这样将会增加成交几率，因为她只需要瞄准最容易接受的客户即可。

Van Seijen表示，这种“分而治之”的方法还可用于其它AI研究领域，如自然语言处理等。他说：“它确实能让我们在解决这些异常复杂的问题上取得深入进展。”

以上回答摘选自微软研究院AI头条，⑨⑨⑨ · ⑨⑨⓪历史最高分！看微软AI如何把“吃豆小姐”玩通关。

感谢大家的阅读。

本账号为微软亚洲研究院的官方知乎账号。本账号立足于计算机领域，特别是人工智能相关的前沿研究，旨在为人工智能的相关研究提供范例，从专业的角度促进公众对人工智能的理解，并为研究人员提供讨论和参与的开放平台，从而共建计算机领域的未来。

微软亚洲研究院的每①位专家都是我们的智囊团，你在这个账号可以阅读到来自计算机科学领域各个不同方向的专家们的见解。请大家不要吝惜手里的“邀请”，让我们在分享中共同进步。

也欢迎大家关注我们的微博和微信 (ID:MSRAsia) 账号，了解更多我们的研究。

\", \"extras\": \"\", \"created_time\": ①⑤⓪④②⑤④⑦⑧⑨ · \"type\": \"answer

看了这个问题，我特意下载这个游戏试了试。

回答：老头是在算棋，但难度差别很小。

老头，中年人，小孩，很恰当的对应了民间爱好者的高中生，初中生，小学生平均水平。

老头是被我③⑥个回合将死的，水平中规中矩，算高中生里的中上档。

兵⑦进① 炮８平５马②进③ 马８进７

车①平② 车９平８马⑧进⑦ 马２进３

兵③进① 卒５进１炮②进④ 卒５进１

仕⑥进⑤ 卒７进１兵③进① 车１进１

兵⑤进① 马７进５兵③平④ 炮５进３

相⑦进⑤ 车１平７炮②平⑦ 车８进９

马③退② 车７进８炮⑧进② 象３进５

炮⑧平⑤ 车７平８车⑨平⑧ 车８退４

炮⑤退① 炮２退２兵④进① 炮２平１

兵④平⑤ 马３进５车⑧进⑨ 炮１进２

炮⑦进③ 士４进５炮⑦平④ 士５退４

炮④平⑥ 将５进１车⑧退③ 炮１平３

马⑦进⑧ 车８平４车⑧平⑤ 炮３退２

马⑧进⑦ 车４进１车⑤进① 将５平６

马⑦退⑤ 车４平５马⑤进③ 将６退１

车⑤退④ 炮３进２相⑤退⑦ 炮３平８

马③进② 将６进１仕⑤退⑥ 炮８平５

车⑤进④ 卒１进１车⑤进①

杀中年人用了②⑥个回合，其实本可以更快，但这个头像实在太丑了，影响我发挥，且不想再与他对弈。漏手不少，就是普通初中生水平。

炮②平⑤ 马２进３马②进③ 炮８平５

车①平② 马８进７马⑧进⑦ 车１进１

兵⑦进① 车９进１马⑦进⑥ 车１平４

马⑥进④ 车９平７兵⑦进① 卒３进１

炮⑧平⑦ 车４进１车⑨平⑧ 炮２平１

车②进⑥ 卒３进１相⑦进⑨ 卒３进１

炮⑦退② 士４进５仕⑥进⑤ 卒３进１

车②平③ 卒３进１炮⑦进⑦ 炮５平３

炮⑤进④ 将５平４车⑧进⑨ 将４进１

炮⑤平⑥ 车４平６炮⑥退④ 车６退１

车③平⑥ 士５进４车⑥平⑧ 士４退５

马④进⑥ 士５进４后车进② 炮３退１

后车平⑦ 将４退１车⑧平⑦

说这个小孩是小学生水平实在太委婉，正常小学生只要学会象棋规则就该比这强，

准确的说这应该是弱智小学生水平。（这个头像也够丑的）

①⑥个回合轻轻松松虐杀。

炮②平⑤ 炮２平５马②进③ 马２进３

车①平② 车１平２车②进⑦ 车２进７

车②进① 车２进１炮⑤退① 车２退２

马⑧进⑦ 车２平３车⑨进② 车３平４

马⑦进⑧ 车４平３马⑧进⑥ 车３进３

马⑥进⑧ 士４进５车⑨平⑥ 炮５平４

炮⑤平⑥ 车９进２马⑧进⑦ 炮４退１

车⑥进⑥ 车３退２车⑥退①

总结：这个游戏并不令人惊喜，但受限于①⑨⑨①年的硬件配置和象棋软件领域的空白，做到这个程度还是中规中矩的。

编后语：关于《目前网络或单机游戏中的 AI 能达到怎样的水平？FC游戏中国象棋中老头难度是真的在计算棋谱么》关于知识就介绍到这里，希望本站内容能让您有所收获，如有疑问可跟帖留言，值班小编第一时间回复。下一篇内容是有关《想要转行了解一下软件测试？想学一门技术软件测试和数据分析谁更容易上手》，感兴趣的同学可以点击进去看看。

资源转载网络，如有侵权联系删除。