2018最受欢迎的15个Python库都在这里了

2018最受欢迎的15个Python库都在这里了

图1:最好用的Python库(根据GitHub的Star值与Contributor值绘制而成,图标大小与commit值成正比)

以下是2018年排名前15的Python库(数据截止于2018年12月16日):

1.TensorFlow (Contributors – 1757, Commits – 25756, Stars – 116765)

2018最受欢迎的15个Python库都在这里了

TensorFlow是一款利用数据流图来进行数值计算的开源软件库。图形节点代表数学运算,图形的边代表在节点之间流动的多维数据数组(张量)。这种灵活的架构使用户无需重写代码便可在桌面、服务器或移动设备中的一个或多个CPU/GPU中进行计算。

2.pandas (Contributors – 1360, Commits – 18441, Stars – 17388)

Pandas是一款Python包,能够提供快速灵活且富有表现力的数据结构,使“关系”数据或“标记”数据的使用既简单又直观。Pandas旨在成为运用Python进行实际、真实的数据分析的基础性高级构建块(building block)。

3.scikit-learn (Contributors – 1218, Commits – 23509, Stars – 32326)

Scikit-learn是一款基于NumPy、SciPy与matplotlib的机器学习Python模块,能够为数据挖掘(data mining)与数据分析提供简单有效的工具。SKLearn面向所有人,并可在多种情况下重复使用。

4.PyTorch (Contributors – 861, Commits – 15362, Stars – 22763)

2018最受欢迎的15个Python库都在这里了

PyTorch是一款Python包,具有以下两种高级功能:

· 利用强大的GPU加速实现张量计算(类似NumPy)

· 深度神经网络(以基于磁带的autograd系统为基础)

你们还可以重复使用自己最喜欢的Python包,如NumPy、SciPy与Cython,以便在需要时扩展PyTorch。

5.Matplotlib (Contributors – 778, Commits – 28094, Stars – 8362)

Matplotlib是一款Python 2D绘图库,能够在跨平台交互式环境中,以多种硬拷贝的格式生成高质量图形。 Matplotlib可用于Python脚本,Python和IPython shell(如MATLAB或Mathematica),Web应用程序服务器和各种图形用户界面工具包。

6.Keras (Contributors – 856, Commits – 4936, Stars – 36450)

2018最受欢迎的15个Python库都在这里了

Keras 是一款用 Python 编写的高级神经网络 API,能够以 TensorFlow, CNTK, 或Theano 为后端运行。Keras 的开发重点是实现快速实验。做好研究的关键就是尽快将想法转换为结果。

7.NumPy (Contributors – 714, Commits – 19399, Stars – 9010)

NumPy是用Python实现科学计算所需的基础包,能够提供强大的N维数组对象、复杂的(广播)功能、集成C/C++和Fortran代码的工具以及实用的线性代数、傅里叶变换和随机数生成功能。

8.SciPy (Contributors – 676, Commits – 20180, Stars – 5188)

SciPy(发音为“Sigh Pie”)是数学、科学与工程方向的开源软件,包含了诸多模块:统计、优化、集成、线性代数、傅里叶变换、信号和图像处理、ODE求解器等。

9.Apache MXNet (Contributors – 653, Commits – 9060, Stars – 15812)

Apache MXNet(孵化)是一个深度学习框架,旨在提高效率与灵活度,能够混合符号和命令式编程以实现效率和生产率的最大化。MXNet的核心是一个动态的依赖调度程序,可以自动并行符号和命令操作。

10.Theano (Contributors – 333, Commits – 28060, Stars – 8614)

Theano这款Python库能让用户有效地定义、优化与评估涉及多维数组的数学表达式,并且可以使用GPU,实现有效的符号区分。

11.Bokeh (Contributors - 334, Commits - 17395, Stars - 8649)

Bokeh是一款交互式可视化Python库,能够在现代Web浏览器中实现美观且有意义的数据视觉呈现。有了Bokeh,你就可以轻松快速地创建交互式图表、仪表板与数据应用程序了。

12.XGBoost (Contributors – 335, Commits – 3557, Stars – 14389)

XGBoost 是一款优化的分布式梯度提升库(gradient boosting library),以高效、灵活与便携为目标。XGBoost在梯度提升框架下运行机器学习算法,为用户提供了梯度提升决策树(也被称为 GBDT、GBM),可以快速精准地解决许多数据科学的问题。 相同的代码可在主要的分布式环境中运行(Hadoop、SGE与MPI),还可解决数十亿案例之外的其他问题。

13.Gensim (Contributors - 301, Commits - 3687, Stars - 8295)

Gensim 是一款用于主题建模、文档索引与大型语料库相似性检索的 Python 库,其目标受众为自然语言处理(NLP)和信息检索(IR)领域的群体。

14.Scrapy (Contributors – 297, Commits – 6808, Stars – 30507)

Scrapy 是一个快速、高级的 Web 爬取和抓取框架,用于爬取网站并从其页面中提取结构化数据。Scrapy广泛应用于数据挖掘、监控与自动化测试等领域。

15.Caffe (Contributors – 270, Commits – 4152, Stars – 26531)

Caffe 是一个以表达、速度和模块化为基础的深度学习框架,由伯克利人工智能研究(BAIR)/ 伯克利视觉与学习中心(BVLC)和社区贡献者共同开发。

2018最受欢迎的15个Python库都在这里了

相关推荐