预测:2018年世界杯何国夺冠?人工智能算法分析告诉你结果
这两天最受全世界关注的非世界杯莫属了。目前正在俄罗斯举办的2018年“世界杯”正在火热进行中,有的球迷为了看球赛通宵熬夜,这段时间也是全世界的足球迷,体育迷的视觉盛宴。大街小巷走到哪里都有人在谈论着世界杯的赛事。作为东道主的俄罗斯在第一场与沙特阿拉伯的比赛中以5比0完胜,有网友也调侃称:谁也不敢不给俄罗斯总统普京的面子啊!
目前,作为被列入俄罗斯第—批50所国际化大学及联合国教科文组织全球高校500强名单之列的大学——彼尔姆国立研究大学的物理系大四学生维克多•扎科派洛通过自己的研发,搭建一个可以预测2018年世界杯冠军的人工智能系统。维克多•扎科派洛通过大量的数据统计,收集整理出所有影响比赛结果的因素,并将数据信息上传网络进行大数据比对,通过概率分析:2018年世界杯的冠军队是德国,第二名是巴西,第三名是阿根廷。并且人工智能系统还分析出这次世界杯中俄罗斯都不能进入前10,预测结果显示俄罗斯排名20余名,这个预测结果对于俄罗斯和支持俄罗斯的球迷们恐怕很难接受这个结果。对于此套人工智能系统,维克多•扎科派洛说准确率可达80%以上。
我们都知道未来什么可能都会发生,而预测未来是一件很不可思议的事情,对于世界杯这种大型体育赛事,想通过人工智能进行预测也是很艰难的事情,所以维克多•扎科派洛为了让系统的预测结果更加准确,也考虑到了各种因素,从球员的身体健康状况乃至心情因素,到比赛时的天气状况和场地的各项因素。还将往年几届的世界杯赛事的各项数据整合到系统当中。想要知道这位俄罗斯大学生开发的人工智能系统的预测是否真正准确还要看接下来的世界杯赛事,让我们拭目以待!
除了来自俄罗斯彼尔姆国立研究大学的人工智能分析结果以外。来自肯尼亚的投资银行分析师G·M也通过机器学习开发了一套预测系统,而他预测的结果是巴西赢得了冠军,并且他的预测结果与美国微软公司的的人工智能和数据科学专家Peste的预测结果竟完全一致。难道作为“足球王国”的巴西在此次比赛中要成功逆袭?
接下来说说谁他们是如何进行比赛结果分析的。
G.M是采用了来自澳大利亚的一家机器学习平台Kaggle的数据集,作为机器学习竞赛、托管数据库、编写和分享代码的平台。它包含了从1872年到2017年国际足球比赛的结果,通过这些比赛结果的整合分析,然后通过一种逻辑回归分类器算法,使用逻辑函数预估概率。预测出总决赛是巴西vs德国,巴西获的冠军。
Peste预测过程和方法更加完整善,除了和G.M一样使用历年来世界杯的赛事结果情况,Peste还使用了奥运会、欧洲杯一些大型体育比赛的数据结果和比赛过程数据。在算法的选择上,Peste用的是随机森林的机器算法,在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而随机森林算法模型的构建取决于决策树,决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类。但是俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过单个大师的一种算法。随机森林的算法模型优点是:速度快,相当准确,可以对泛化误差进行无偏估计,因此不需要交叉验证。预测的结果是:巴西获胜,阿根廷排名第二。