书白读了!机器人挑战北京高考数学卷,考了105分
6月7日,成都高新造人工智能系统“准星数学高考机器人”AI-MATHS对2017高考数学科目发起了挑战,在22分钟的时间里,得分105分。整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开透明测试。
据介绍,AI-MATHS是成都高新区一家本土人工智能企业—一成都准星云学科技有限公司,依托清华大学大数据、人工智能、自然语言识别等前沿技术,研发的一款以自动解题技术为核心的人工智能系统。
图为机器人所做的答卷。
在成都高新区天府新谷10栋9层的一个封闭空间里,一位特殊“考生”准备挑战今年全国高考的数学。它就是成都高新区一家企业研制的高考机器人,名叫“AI-MATHS”。
图为封闭在房间里的准星数学高考机器人。
“AI-MATHS”考试的房间门外贴有“所有设备断网断库”的标识。所谓断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。这也是人工智能技术的核心——断网断库场景下的综合逻辑推理能力。
图为挑战现场。
从下午18时28分到19时29分,“AI-MATHS”分别挑战了北京卷文科数学以及全国二卷文科数学的考试,分别用时22分钟和10分钟,得分为105分和100分。尽管和之前预期的110分目标还有差距,但是作为“家长”——成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉介绍,“前几个月的书,这孩子没白读。”
两次考试具体得分如下:北京文科数学卷,选择题满分、填空题20分、解答题45分,全卷105分;全国卷二选择题55分、填空题20分,解答题25,全卷100分。在选择题和填空题上,“AI-MATHS”表现十分亮眼。丢分环节主要是解答题,有些题目甚至是0分。
图为录题区。
研发高考机器人最大的难点在于,要让系统准确理解人类语言。“AI-MATHS”之父林辉称:“直接用数学语言表述的应用题它可以轻松解答,但它最大的弱项是不能理解考题里场景式的描述语言,它会读不懂题目。”
图为机器人答题现场。
林辉打了个比方,如果题目是10-1=?人工智能系统可以轻松作答。但如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”面对这样的情况,人工智能系统就“傻”了,“它不理解小明是什么、小丽是什么、吃又是什么意思。”
图为机器人答题现场。
评阅试卷的老师分析,在评卷过程中,“AI-MATHS”所犯错误的题目都有一个共同点:语言文字太多。这表示,高考机器人在自然语言上的理解稍稍欠缺。相反,在理解数学语言上相对容易。
图为老师判卷现场。
教师祁祖海认为,一般学生的成绩大约在110分左右,而这次“AI-MATHS”取得的分数,大概处于本班学生的中等水平。但是他坦言,高考机器人的进步空间会很大。