谷歌的首映人工智能DeepMind在一场旨在测试16岁英国学生知识的数学考试中差点不及格。

在一项名为“分析神经模型的数学推理能力”的研究中,研究人员通过让DeepMind接触各种数学科目来测试它的分析技能。他们向人工智能输入了英国学校里常见的问题,比如代数、算术、测量和微积分。

尽管它前沿的学习方法在美国,DeepMind很难做出一个普通人类青少年通常可以轻松完成的计算。事实证明,谷歌的人工智能在英国的评分系统中只能得到E分。

DeepMind的神经网络

在实验中,研究人员对DeepMind进行了一项40道题的数学测试。虽然它的一些算法在测试中表现良好,但其他算法在理解问题时存在困难。当机器试图翻译数字、函数、符号和单词时,这一点就很明显了。

有一次,程序被要求给出“1+1+1+1+1+1+1”的和。机器给出的正确答案不是“7”,而是“6”。

最终,DeepMind在40个问题中只得到了14个。

谷歌的AI怎么了?

当数值比给出的前几个数字要高时,DeepMind就会努力相加,就像回答“1+1+1+1+1+1+1”这个问题一样。人工智能被要求解决1 + 1 +···+ 1,其中数字“1”出现了n次。

研究人员他们使用的神经网络模型能够正确地计算n≤6时的值,但当n = 7时却无法做到这一点。他们也给出了错误的答案n> 7。

然而,当给模型以更长的序列来求解更大的数字时,它们能够毫无问题地求解。

研究人员承认,他们仍然没有“对这种行为的良好解释”,但他们相信答案在于神经网络如何处理每个问题并计算出正确的值。

每当人工智能在一个问题中多次遇到相同的数字,它会认为输入是“伪装的”。这就是为什么它不能正确回答某些问题的原因。

当他们被要求找出长数字中的“位值”时,神经网络表现良好。它们还能够根据数字序列的大小以及整数小数进行排序。

研究人员希望他们的发现将有助于激励其他人为人工智能开发更多的神经网络架构。他们表示,他们已经开始的数据集可以很容易地扩展,这将使其他计算机科学家能够让人工智能接触到更高形式的数学,比如大学水平的数学。

视频游戏领域的深度思考

DeepMind目前可能还不具备数学导师的资格,但它有很多其他有用的应用。

研究人员已经使用该程序构建这款流行电子游戏的全功能人工智能星际争霸2.AlphaStar的技术足以在连续五场比赛中击败职业棋手Grzegorz“MaNa”Komincz而不输一场。

corber2万博体育登录首页022 TECHTIMES.com未经允许,请勿转载。