人工智能的崛起:智商测试得分已经超过四岁儿童
2023-06-17 02:05:36 小编:newtype2001 我要评论
研究人员最近对一个名叫ConceptNet的人工智能系统进行了测评。在一项为检测儿童智商而设计的测中,ConceptNet的得分超过了一名智商正常的四岁儿童。该测试共包含五项与词语推理和词汇有关的测验,ConceptNet的总得分为69分,与之进行对比的学龄前儿童得分则为50分。并且专家认为,该系统的智能程度还会进一步加强。
在测试过程中,试题会通过语言处理工具转换成ConceptNet 4能够理解的语言,如“我们为什么要握手?”、“我们为什么要在夏天戴太阳镜?”和“为什么将刀子放入嘴中是不好的行为?”等等。
如果你本来就担心自己的工作有一天会被机器人取而代之,那么下面这则来自麻省理工学院的最新消息可能会让你更加惶恐。
研究人员最近对一个名叫ConceptNet的人工智能系统进行了测评。在一项为检测儿童智商而设计的测试中,ConceptNet的得分超过了一名智商正常的四岁儿童。
该测试共包含五项与词语推理和词汇有关的测验,ConceptNet的总得分为69分,与之进行对比的学龄前儿童得分则为50分。并且专家认为,该系统的智能程度还会进一步加强。
ConceptNet是一项由麻省理工学院常识计算计划团队(MIT Common Sense Computing Initiative)管理的开源项目。该团队研发的ConceptNet 4运用了所谓的“关系”这一概念。例如,当让该系统解释什么是“小鹿”时,它会明白“小鹿是一种鹿”,而不是”鹿是一种小鹿“。也就是说,它能够理解这种动物的概念,以及“小鹿”和“鹿”这两个词汇和概念之间的关系。同时,该系统还可以使用所谓的“对立标记”表示负相关关系,比如“企鹅不会飞”等。
研究人员让ConceptNet 4参与了“韦克斯勒学龄前儿童智力量表”测试(WPPSI-III),并将研究结果发表在论文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III测试包含14项测验项目,以及一份针对操作智商和言语智商的完整评估表。
在对单项测试计分时,研究人员先使用每道题目得分最高的答案计分,然后再使用每道题目得分最高的前五个答案中最好的答案计分。他们将前者称为“严格计分”,后者称为“放松计分”。图中左侧为ConceptNet得分,右侧为受测儿童得分。
操作智商测验通常会要求受测人完成绘画、解谜、记忆等任务。言语智商测验则会考察儿童的词语推理、词汇及理解能力。每种智商得分的平均分都为100分。本次研究则主要针对言语智商进行测试。
在测试过程中,试题会通过语言处理工具转换成ConceptNet 4能够理解的语言,如“我们为什么要握手?”、“我们为什么要在夏天戴太阳镜?”和“为什么将刀子放入嘴中是不好的行为?”等等。
该研究由芝加哥大学的斯特兰?奥尔森(Stellan Ohlsson)带领。在对单项测试计分时,研究人员先使用每道题目得分最高的答案计分,然后再使用每道题目得分最高的前五个答案中最好的答案计分。他们将前者称为“严格计分”,后者称为“放松计分”。
在“信息”测试中,ConceptNet得到了20分,而同时参加测试的四岁儿童通过转换后的得分为10分。这名儿童在词语推理和理解上得分更高,均为7分,而ConceptNet在这两项上的得分分别为2和3分。此外,ConceptNet表现出了更丰富的词汇量,词汇得分为20分,而儿童得分为13分。