盘点 | 2018年最出色的30个机器学习项目
编者按:本文来自Mybridge,介绍了过去一年中(2017年)最为惊艳的30个机器学习项目。文章原标题 30 Amazing Machine Learning Projects for the Past Year (v.2018),发布于Medium。
在过去的一年里,我们比较了近8800个开源的机器学习项目,并从中评选出了前30名(0.3%的机会入选)。
这是一个极具竞争力的榜单,它仔细挑选了2017年1月到12月之间发布的最好的开源机器学习库、数据集和应用程序。Mybridge AI将项目的受欢迎程度、参与度和时效性等指标纳入评估标准来判断项目的质量。这些项目在Github上收藏量(获得的星数)的平均值是3558,这个数字足以让你对这些项目的质量有个大致了解。
开放源码项目对数据科学家很有用。而你也可以通过阅读源代码这一方式来学习,并在这些现有项目的基础上构建一些新的内容。给自己足够的时间去尝试一下这些去年你可能错过的激动人心的机器学习项目吧。
第1名:FastText
用于快速文本显示和分类的库,Github收藏量11786星。项目隶属于Facebook研究院。
第2名:Deep-photo-styletransfer
论文“深度照片风格转换”的代码和数据,Github收藏量9747星。项目隶属于Fujun Luan,康奈尔大学博士。
第3名:face_recognition
世界上最简单的用于Python和命令行的面部识别API,Github收藏量8672星。项目隶属于Adam Geitgey。
第4名:Magenta
利用机器智能进行音乐和艺术创作的项目,Github收藏量8113星。
第5名:Sonnet
基于Google TensorFlow 的神经网络库,Github收藏量5731星。项目隶属于来自Deepmind的Malcolm Reynolds。
第6名:deeplearn.js
用于网络的硬件加速机器智能库,Github收藏量5462星。项目隶属于来自Google Brain的Nikhil Thorat。
第7名:fast-style-transfer
基于TensorFlow的图片与视频风格转换工具,Github收藏量4843星。项目隶属于来自MIT的Logan Engstrom。
第8名:Pysc2
星际争霸2学习环境,Github收藏量3683星。项目隶属于来自Deepmind的Timo Ewalds。
第9名:AirSim
为微软AI研究部门的自动驾驶汽车提供的基于Unreal Engine的开源模拟器,Github收藏量3861星。项目隶属于来自微软的Shital Shah。
第10名:Facets
机器学习数据集的可视化项目,Github收藏量3371星。项目隶属于Google Brain。
第11名:Style2Paints
给图片上色的AI工具,Github收藏量3310星。
第12名:Tensor2Tensor
谷歌研究院一个通用序列到序列模型的库,Github收藏量3087星。项目隶属于来自Google Brain的Ryan Sepassi。
第13名:pytorch-CycleGAN-and-pix2pix
Pytorch中图像风格或者内容转换工具,如卫星地图转换为二维平面图、油画与照片风格转换等;Github收藏量2847星。项目隶属于来自伯克利大学的博士Jun-Yan Zhu。
第14名:Faiss
一个高效的相似搜索和密集向量聚类的库,Github收藏量2629星。隶属于Facebook研究院的项目。
第15名:Fashion-mnist
一个类似于mnist的时尚产品数据库,Github收藏量2780星。项目隶属于来自Zalando Tech的研究科学家Han Xiao。
第16名:ParlAI
在各种公开可用的对话数据集上训练和评估AI模型的框架,Github收藏量2578星。项目隶属于来自Facebook研究院的Alexander Miller。
第17名:Fairseq
Facebook AI研究序列到序列模型的工具包,Github收藏量2571星。
第18名:Pyro
用Python和PyTorch进行深度通用概率编程,Github收藏量2387星。项目隶属于Uber的AI实验室。
第19名:iGAN
由GAN驱动的动态图像生成,Github收藏量2369星。
第20名:Deep-image-prior
不借助机器学习而实现的神经网络图像恢复,Github收藏量2188星。项目隶属于俄罗斯Skolkovo科学技术大学博士Dmitry Ulyanov。
第21名:Face_classification
使用fer2013/imdb数据集与keras CNN模型和openCV进行的实时人脸检测和情感/性别分类,Github收藏量1967星。
第22名:Speech-to-Text-WaveNet
使用DeepMind的WaveNet和tensorflow技术进行精确到句子的端到端英语语音识别,Github收藏量1961星。项目隶属于Kakao Brain的Namju Kim。
第23名:StarGAN
多网络下图像到图像转换的统一生成框架,Github收藏量1954星。项目隶属于高丽大学的Yunjey Choi。
第24名:MI-angets
机器学习统一代理,Github收藏量1658星。项目隶属于Unity3D深度学习部门的Arthur Juliani。
第25名:DeepVideoAnalytics
一个分布式可视化搜索和可视化数据分析平台,Github收藏量1494星。项目隶属于康奈尔大学的博士Akshay Bhat。
第26名:OpenNMT
Torch环境下的开源神经网络机器翻译工具,Github收藏量1490星。
第27名:Pix2pixHD
利用受限的GANs合成和操作2048x1024图像的工具,Github收藏量1283星。项目隶属于Nvidia的AI研究院科学家Ming-Yu Liu。
第28名:Horovod
针对TensorFlow的分布式训练框架,Github收藏量1188星。项目隶属于Uber Engineering。
第29名:AI-Blocks
一个强大且直观的“所见即所得”人机界面,任何人都可以基于这一工具创建机器学习模型。Github收藏量899星。