数据分析---大数据及机器学习
常用的库:Numpy、Pandas、Matplotlib、Scipy等;
编辑器:IPython和Jupyter notebook(Anaconda包含);
1.Numpy:Numerical Python缩写,主要用于数值计算。
2.Pandas:数据分析的主要工具。
3.matplotlib:绘制数据图表
4.scipy:科学计算领域针对不同标准问题的包的集合。强大的科学计算方法(矩阵分析、信号分析、数理分析等)
一、Numpy
安装方法:pip install numpy / conda install 一般自带;
引导:import numpy as np 约定熟成;
ndarray-多维数组对象:np.ndarray()实例化对象;
常用属性:T(高维数组转置)、ndim维度、shape形状、size总长、dtype元素类型;
创建方法:array()将列表转为数组、arange()等同range、linspace()、zeros()全0数组、ones()全1数组、empty()空数组、eye()单位矩阵;
基本操作:索引arr[1][2]; 切片arr[0:2], 倒序arr[::-1]和arr[,::-1];变形reshape{(48,)/(6,8)(-1,4)} ;级联concatenate(obj1,obj2,axis=0/1/2).
聚合操作:求和Sum,最大/小Max/Min,平均Mean,平方Square,四舍五入Rint,正负号Isnan等等。
快速排序:np.sort()
二、Pandas
安装方法:pip install Pandas
引导:import pandas as pd 约定熟成;
Series(一维)和DataFrame