机器学习免费跑分神器：集成各大数据集，连接GitHub就能用

lgblove

2019-10-12

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

搞机器学习的小伙伴们，免不了要在各种数据集上，给AI模型跑分。

现在，Papers with Code (那个以论文搜代码的神器) 团队，推出了自动跑分服务，名叫sotabench，以跑遍所有开源模型为己任。

有了它，不用上传代码，只要连接GitHub项目，就有云端GPU帮你跑分；每次提交了新的commit，系统又会自动更新跑分。还有世界排行榜，可以观察各路强手的成绩。

除了支持各大主流数据集，还支持用户上传自己的数据集。

也可以看看，别人的论文结果，到底靠谱不靠谱。

比如说，fork一下Facebook的FixRes这个项目，配置一下评估文件：

然后一键关联，让Sotabench的GPU跑一下ImageNet的图像分类测试。

就能得到这样的结果：

Top-1准确率，Top-5准确率，跟论文的结果有何差距（见注），运行速度，全球排名，全部一目了然。

注：ε-REPR，结果与论文结果差距在0.3%以内时打勾，差距≥0.3%且比论文结果差显示为红叉，比论文结果好显示为勾+

这个免费的跑分神器，发布一天，便受到热烈欢迎：推特点赞600+，Reddit热度270+。

网友纷纷表示：这对开发者社区来说太有用了！

那么，先来看一下sotabench的功能和用法吧。

用法简单，海纳百川

团队说，sotabench就是Papers with Code的双胞胎姐妹：

Papers with Code大家很熟悉了，它观察的是论文报告的跑分。可以用来寻找高分模型对应的代码，是个造福人类的工具。

与之互补，sotabench观察的是开源项目，代码实际运行的结果。可以测试自己的模型，也能验证别家的模型，是不是真有论文说的那么强。

它支持跟其他模型的对比，支持查看速度和准确率的取舍情况。

那么，sotabench怎么用？简单，只要两步。

第一步，先在本地评估一下模型：

在GitHub项目的根目录里，创建一个sotabench.py文件。里面可以包含：加载、处理数据集和从中得出预测所需的逻辑。每提交一个commit，这个文件都会运行。然后，用个开源的基准测试库来跑你的模型。这个库可以是sotabench-eval，这个库不问框架，里面有ImageNet等等数据集；也可以是torchbench，这是个PyTorch库，和PyTorch数据集加载器搭配食用更简单。

一旦成功跑起来，就可以进入下一步。

第二步，连接GitHub项目，sotabench会帮你跑：

点击这个按钮，连到你的GitHub账号，各种项目就显现了。选择你要测试的那个项目来连接。连好之后，系统会自动测试你的master，然后记录官方结果，一切都是跑在云端GPU上。测试环境是根据requirement.txt文件设置的，所以要把这个文件加进repo，让系统捕捉到你用的依赖项。

从此，每当你提交一次commit，系统都会帮你重新跑分，来确保分数是最新的，也确保更新的模型依然在工作。

这样一来，模型出了bug，也能及时知晓。

如果要跑别人家的模型，fork到自己那里就好啦。

目前，sotabench已经支持了一些主流数据集：

列表还在持续更新中，团队也在盛情邀请各路豪杰，一同充实benchmark大家庭。

既支持创建一个新的benchmark，也支持为现有benchmark添加新的实现。

你可以给sotabench-eval或torchbench项目提交PR，也可以直接创建新的Python包。

一旦准备就绪，就在sotabench官网的论坛上，发布新话题，团队会把你的benchmark加进去的：

好评如潮

这样的一项服务推出，网友们纷纷点赞，好评如潮，推特点赞600+。

有网友表示：

太棒了！对刚入门的新手来说，数据集获取、预处理和评估的自动化和标准化很有用。通过分析不同模型及其超参数结果，来评估这些模型，本身是挺困难的一件事，你得在各种论文中查阅大量的非结构化数据。有了这个，这件事就轻松多了。（部分意译）

许多网友对这个项目进行了友好的探讨及建议，而开发人员也在线积极回应。

比如这位网友建议：能在每次提交的时候报告模型的超参数吗？

作者很快回复说：英雄所见略同。下次更新就加上！

并且，他们还考虑在将来的更新中，让使用者把链接添加到生成模型的训练参数中。

传送门

sotabench官网：

https://sotabench.com/

基准测试库通用版：

https://github.com/paperswithcode/sotabench-eval

机器学习 python机器学习

lgblove

0 关注 0 粉丝 0 动态

相关推荐

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 5评论 2020-11-17

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

如果不能用Python执行机器学习，那该用什么呢？

长期学习数据科学的人一定知道如何用Python、R和Julia这些语言执行机器学习任务。然而，如果速度很关键，但硬件很有限，或者所在公司仅使用SQL进行预测分析，又该怎么办呢?答案就是——数据库内的机器学习。下面将使用Oracle机器学习在著名的Iris数

mori 2020-11-06

这里有你需要的5个机器学习必备技能

机器学习，听起来很酷。这名字不禁令人以为是一排机器人坐着学习知识的样子，但其实是让机器人拥有像人一样的学习能力的高端技术，这样就能高效快捷地从数据中找出有用的东西。云计算服务支持构建和部署AI及机器学习应用程序的种种功能。除了专业外，作为IT团队成员一定要

jaybeat 15评论 2020-11-02

在云端你需要的5个机器学习技能

机器学习和AI继续深入IT服务中，并补充软件工程师开发的应用程序。如果IT团队想跟上这种步伐，必须提高他们的机器学习技能。云计算服务支持构建和部署AI及机器学习应用程序的各种功能。在很多方面，AI系统的管理与IT专业人员在云端熟悉的其他软件非常相似。但是，

changyuanchn 14评论 2020-11-01

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 5评论 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 12评论 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 8评论 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 12评论 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 12评论 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 12评论 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 6评论 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 8评论 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 12评论 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 5评论 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 5评论 2020-11-11

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲，或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多，但我觉得它仍是数

jaybeat 8评论 2020-11-10

lgblove

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号