导航菜单

人类地位不保:谷歌计算机开始像人类一样推理!

考虑中的新家附近有多少公园?餐厅里最好的晚餐-什么是葡萄酒搭配?这些日常问题需要关系推理的高级思维的重要组成部分,人工智能很难掌握。 现在,谷歌深度思维的研究人员想出了一个简单的方法来处理这种推理,并在复杂的图像理解测试中击败人类。

人类通常擅长关系推理,使用逻辑连接和比较位置、序列和其他实体。 然而,两个主要的AI统计数据和符号在开发类似功能方面进展缓慢。 统计人工智能或机器学习擅长模式识别,但不擅长逻辑 另一方面,符号人工智能可以使用预先确定的规则来推理关系,但它不擅长学习

新的研究提出了一种缩小差距的方法:用于关系推理的人工神经网络 类似于大脑中神经元的连接方式,神经网络使用小程序来合作发现数据中的模式,并具有用于图像处理、语法分析或游戏学习的特定结构。 在这个应用程序中,新的“关系网络”分别比较场景中的每对目标 该论文的合着者、伦敦的深度思维计算科学家蒂莫西莉莉拉普说:“我们明确要求网络发现目标之间的关联 "

他和他的团队使用几项任务测试了网络。 第一个是回答单个图像中对象之间的关系,例如立方体、球形和圆柱形。 例如:“这个蓝色的东西前面有一个物体。它的形状和灰色金属球右边的青色小物体的形状一样吗?”对于这项任务,关系网络与另外两个神经网络相结合:一个是识别图像中的对象,另一个是翻译这个问题。 在previewer arXiv上周发表的一篇论文中,研究人员表示,通过对图像和问题的大量测试,发现其他机器学习方法的准确率约为42%至77%,而人类的准确率高达92% 然而,新网络的正确率是96%,这确实是一项超越人类的成就。

DeepMind团队还使用语言任务进行了测试。 在这项任务中,网络会收到一些声明,如“桑德拉拿起足球”和“桑德拉去办公室了” 然后会问一些问题,比如:“球在哪里?”(办公室) 网络在这些问题上的表现和在其他类型的问题上一样好,但是最突出的是所谓的推理问题:“莉莉是一只天鹅。” 莉莉是白色的。 格雷格是一只天鹅 格雷格是什么颜色的?在这些问题上,网络的准确率为98%,而竞争对手的准确率约为45% 最后,该方法分析了10个球跳跃的动画,其中一些球通过看不见的弹簧或棒连接。 仅使用运动模式,网络就可以识别90%以上的连接。 然后,相同的训练被用于识别仅由运动点表示的人类形态

凯特萨恩科(Kate Saenko),波士顿大学的计算科学家,没有参与新网络的设计,但最近合作开发了一种方法来回答关于图像的复杂问题。 他说:“他们方法的优点之一是概念非常简单 Lillicrap说,大部分进展可以用一个简单的等式来表示,这使得与其他网络的结合变得容易,就像上面的对象比较任务一样。 这篇论文称之为“即插即用模块”,它使系统的其他部分能够专注于他们擅长的东西。

加州帕洛阿尔托斯坦福大学的计算机科学家贾斯廷约翰逊参与了目标比较任务的设计,并提出了一种在任务中表现良好的方法。他说:“我对结果印象深刻。” 萨恩科补充说,关系网络可以帮助研究社交网络、分析监控视频或在未来的交通流中引导汽车。

约翰逊说,为了接近人形机器人的灵活性,网络需要学会回答更具挑战性的问题。 这可能不仅需要比较一对事物,还需要比较三、四或更多对事物 他说:“我对研究能够自己提出新策略的模型非常感兴趣。” DeepMind正在为特殊类型的推理建立模型,而不是追求更一般的关系推理。 但这仍然是朝着正确方向迈出的重要一步。 "