关于Ai论文_这个AI系统可轻松通过高三科学考试 但依然没高中生聪明

上周,美国艾伦人工智能研究所( alleninstituteforartificialintelligence )的研究人员发表了一篇新论文,他们设计的AI系统在二级科学测试的许多选项中可以得出90%以上的正确答案,即使是高三级科学测试也相当好,正确率是80%

Aristo这个AI系统参加了纽约摄政学院科学考试(纽约州学生标准会考试),可以享受到不需要回答关于看图表的问题等优待。 不过,研究人员在不同版本和不同年级的考试中测试了这个程序,其表现相当稳定,绝对可以和最好的学生进行比较。

Aristo展示了AI技术高速发展的历史。 这篇论文的作者指出,2016年,在AI领域还没有能够通过类似的第二次科学试验的AI系统。 但是自2016年以来,AI领域发生了很多事情,特别是在用于这项任务的自然语言处理方面。

研究人员开发了构建AI的新方法,更好地完成了自然语言处理的任务,使AI系统能够生成听起来更自然的人文,并能够写新闻故事和诗。 随着AI生成假面部和视频、强调真实图像以及识别对象和面部的能力变得更加复杂,计算机视觉得到了显着改善。

AI系统征服了在线多人战略游戏。 随着投资大量流入这一领域,今年引人注目的项目通常比几年前的项目成本高得多。 现在,进步的浪潮把我们带到了能够在科学考试中打败初二学生的AI系统。

AI技术的快速发展使许多专家难以预测这一领域的未来,有些人预测,相当于人类水平的AI的出现仅为10年或20年。 但是,随着AI系统越来越强大,会带来更多的挑战。 达到人类水平的能力后,如果错误地指定或设计程序,可能会产生毁灭性的风险。 但是,这样的结果令人兴奋,他们提醒我们在AI方面取得了惊人的成果,也许比我们制定AI政策来确保安全还要快。

这些项目中常见的批评,AI是反信息,不是真正的思考。 几年前,这似乎正确总结了AI系统能做的事情。 如果单词相互关联,那么记得,但是不能回答与更深层次的概念理解相关的问题。 这种情况一直在改变。 当今最先进的AI系统仍然犯有概念性错误,但已经不多了。

从纽约摄政学院科学考试的这些问题(艾伦研究所的论文)可以看出,要想在这次考试中取得好成绩,必须做很多概念推论这样的事情

1 )最适合分离铁屑和黑胡椒混合物的设备是哪一种?(1)磁铁(2)滤纸(3)三臂天平(4)伏特计。

2 )橡胶圈振动会产生什么样的形状的能量? (1)化学能(2)光能(3)电能(4)声能。

3 )由于铜是金属,因此,(1)在室温下为液态,(2)与其他物质不反应,(3)是不良导体,(4)是良好的热传导体。

4 )苹果树的哪个过程主要是细胞分裂的结果? (1)生长(2)光合作用(3)换气(4)去除废弃物。

这些当然不仅仅是语言的意思。 怀疑的人可以通过描述AI“铁屑”和“磁铁”、“振动”和“声音”,或者“金属”和“良好的热传导体”这两个词的关联,取得解决这些问题的可能性的立场。

但是,研究复杂系统的专家梅兰妮·米切尔解释道:“语言模型能够捕捉单词之间的统计关系,在没有真正理解的情况下回答问题。”

另一方面,这和我们学科学时做的真的不一样吗? 学习一个概念的大部分是理解这个概念和你以前学到的其它概念之间存在着某种关系。 目前,AI所做的和人类所做的根本不同是不明显的。 事实上,AI系统获得的能力越强,给出解释的可能性就越小。

AI取得这样的成果容易被低估,但容易被夸大。 很多媒体用过分夸张的话报道了艾伦研究所的论文,这些报道曲解了新的AI系统具备的能力。 “这个AI刚通过科学测试,可能比中学生聪明”“AI现在像中学生一样聪明”等标题远远不准确。 世界上还没有AI系统像2岁的孩子一样有解决问题的能力。 不用说能和中学生匹敌。

像Aristo这样的AI系统属于狭义的AI。 他们擅长自己的工作,要定义明确,解决具体问题。 除了完成多项选题的科学考试,Aristo不能解决其他问题。 在这方面,人类仍然在计算机面前保持绝对优势,我们可以从一个领域获取知识来解决其他领域的新问题。 但是,这种优势能维持多久还不清楚。

大家都在看

相关专题