数据分析---大数据及机器学习

常用的库:Numpy、Pandas、Matplotlib、Scipy等;

编辑器:IPython和Jupyter notebook(Anaconda包含);

  1.Numpy:Numerical Python缩写,主要用于数值计算。

  2.Pandas:数据分析的主要工具。

  3.matplotlib:绘制数据图表

  4.scipy:科学计算领域针对不同标准问题的包的集合。强大的科学计算方法(矩阵分析、信号分析、数理分析等)

  一、Numpy

    安装方法:pip install numpy / conda install 一般自带;

    引导:import numpy as np  约定熟成;

    ndarray-多维数组对象:np.ndarray()实例化对象;

      常用属性:T(高维数组转置)、ndim维度、shape形状、size总长、dtype元素类型;

数据分析---大数据及机器学习

       创建方法:array()将列表转为数组、arange()等同range、linspace()、zeros()全0数组、ones()全1数组、empty()空数组、eye()单位矩阵;

      基本操作:索引arr[1][2];   切片arr[0:2], 倒序arr[::-1]和arr[,::-1];变形reshape{(48,)/(6,8)(-1,4)} ;级联concatenate(obj1,obj2,axis=0/1/2).

      聚合操作:求和Sum,最大/小Max/Min,平均Mean,平方Square,四舍五入Rint,正负号Isnan等等。

数据分析---大数据及机器学习数据分析---大数据及机器学习数据分析---大数据及机器学习数据分析---大数据及机器学习

       快速排序:np.sort()

  二、Pandas

    安装方法:pip install Pandas

   引导:import pandas as pd  约定熟成;

    Series(一维)和DataFrame

  三、Matplotlib

  四、Scipy

相关推荐