放进好词:GPU供电的填字游戏求解器使得最佳展示尚未对抗人类

经过 布莱恩·卡尔菲尔德

什么是“视频处理芯片”的三字母首字母缩写?当然是GPU。然而,谁知道,这些并行处理PowerShouses也可以用文字。

Following a long string of victories for computers in other games — chess in 1997, go in 2016 and Texas hold’em poker in 2019 — a GPU-powered AI has beaten some of the world’s most competitive word nerds at the crossword puzzles that are a staple of every Sunday paper.

Dr.Fill,由Matt Ginsberg创建的填字游戏拼图 - 一位串行企业家,开创性的AI研究人员和前研究教授 - 比美国填字游戏拼图锦标赛上个月得分高于任何人。

Dr.Fill对超过1,300名填字游乐爱好者的表现是在年度锦标赛中与人类一起玩的十年之后。

此类游戏竞争地播放,测试计算机如何思考和帮助研究人员更好地了解人们所做的方式,Ginsberg解释道。“游戏是一个惊人的环境,”他说。

Dr.Fill的边缘?A sophisticated neural network developed by UC Berkeley’s Natural Language Processing team — trained in just days on an NVIDIA DGX-1 system and deployed on a PC equipped with a pair of NVIDIA GeForce RTX 2080 Ti GPUs — that snapped right into the system Ginsberg had been refining for years.

一种用词的方式:一对NVIDIA RTX 2080 TIS支持由UC Berkeley的自然语言处理团队开发的复杂神经网络。

“填字游戏要求您使用语言制作这些创意多跳横向连接,”丹克莱因教授说,他领导自然语言处理团队。“我认为这将是一个很好的测试,看看我们在这个领域中创造的技术如何处理那种创造性的语言使用。”

鉴于非结构化的性质,计算机完全可以竞争,这是惊人的。为了确定,Dr.fill仍然不一定是最好的,这不仅是因为美国填字游戏锦标赛的官方冠军仅限于人类。

比赛的组织者,纽约时报拼图编辑器将Shitzz,指出Dr.fill最大的优势是速度:它可以在人类不得不键入的瞬间填写答案。然而,仅仅通过准确性判断,Dr.Fill仍然不是最好的,在比赛期间进行三次错误,比几个人类参赛者更糟糕。

尽管如此,博士的表现在挑战中,与诸如国际象棋等更多结构化的游戏,依赖于现实世界的知识和WordPlay是显着的,Shittz承认。

“这只是惊人的,他们已经编写了一台电脑来解决填字游戏 - 特别是一些棘手的硬,”Shittz说。

一种用词

持有博士学位的Ginsberg。在牛津大学的数学中,并拥有100个技术论文,14项专利和他的名字,这是他在45年前参加的大学以来的填字游戏。

但他的痴迷起飞了十多个十年前进入锦标赛并没有赢。

“”其他竞争对手比我好多了,这让我感到恼火,所以我想'好吧,我应该写一个节目,'所以我开始了Dr.fill,“Ginsberg说。

由Shittz组织,美国填字游戏锦标赛与围绕单词谈话的人打包。

Dr.Fill于2012年在比赛中首次亮相。尽管预期很高,但Dr.Fill只设法的600名参赛者中的141人。Dr.fill从未在今年到达前10名完成。

部分,这是因为填字游戏并没有吸引那种采取的丰富资金的努力 - 并最终击败 - 象棋的最佳人类和去。

这也是部分原因的,因为填字游戏是独一无二的。“在Go和Chess和Checkers中,规则非常清楚,”Ginsberg说。“填字游戏非常有趣。”

填字游戏通常依赖于需要深层文化知识和广泛的词汇的隐秘线索,以及找到最佳滑入每个拼图的重叠行和列的答案的能力。

“这是一个凌乱的事情,”Shittz说。“这不是纯粹的逻辑,如国际象棋甚至喜欢拼字......你有一个单词列表,每一个单词都值得这么多。”

填字游戏拼图通常依赖于需要深层文化知识和广泛词汇的隐秘线索。

一个胜利的组合

游戏更换者?来自自然语言处理团队的帮助。灵感来自他的努力,球队在比赛开始前一个月到了Ginsberg。

它被证明是一种胜利的组合。

伯克利团队专注于了解每个拼图的常量侏儒线索并找到潜在的答案。Klein的三位研究生和两名本科生队伍占据了超过600万个填字游戏线索的例子,答案是Ginsberg收集并将它们倒入复杂的神经网络中。

GINSBERG的软件多年来,然后处理排名所有纠结每个拼图电网的答案的任务,并将它们与其他答案的重叠字母合适 - 经典约束满足问题。

虽然他们的系统依赖于非常不同的技术,但它们都讲述了概率的共同语言。结果,它们几乎完美地绑在一起。

“我们很快意识到我们有非常互补的拼图,”克林说。

克莱因说,他们的模型平行了一些人的方式。人类通过记住过去的工作或使用模型来模拟将来有效的模型做出决定。

“当我看到两者的系统时,我很兴奋,”Klein说。

结合两种方法的结果:Dr.Fill几乎完美地播放。

锦标赛期间,AI在锦标赛中只做了三个错误。然而,它的最大优势是速度。它在一分钟内派出了大多数竞争对手的谜题。

ai至高无上但是放心

但由于,与国际象棋或GO不同,填字游戏难题是不断变化的,另一种这样的表现不保证。

“建设者很可能会扔一些曲线球,”Shittz说。

Ginsberg说他已经努力改善Dr.fill。“我们会看到谁取得更多进展。”

结果可能比以往任何时候都更加接合填字游戏。

“事实证明,将要陷入计算机的东西真的很有创意,”Klein说。