numpy入门
numpy入门
一、numpy的定义
numpy实际上就是数组的运算,多维的数组对象,ndarray。
1,实际数据
2,元数据 描述信息
二、numpy的基本规范信息
# ndarray # 规范,推荐,复用 import numpy as np ar = np.array([1,2,3,4,5]) print(ar) print([1,2,3,4,5]) #打印列表 print(ar.ndim) #打印维度 print(ar.shape) #打印数组形状 print(ar.size) #打印数组个数的多少 print(ar.dtype) #打印数组的数据类型 print(ar.itemsize) #打印数组的内存大小
三、如何创建数组
3.1 创建数组:array()括号中可以包含函数,列表,元祖,数组,生成器,序列等类型
arr1 = np.array(range(10)) arr2 = np.array([1,2,3,4,5.5]) arr3 = np.array([[1,2,3,4],[5,6,7,8]]) print(arr3) print(arr3.ndim) print(arr3.shape)
3.2 使用arange()创建,类似于Python range()
np.arange(10) np.arange(10.) np.arange(1,10,0.1) np.arange(10000)
3.3 使用linspace()创建:返回在间隔[开始,停止]上num个均匀的样本
1 np.linspace(2.0,3.0, num=5) 2 np.linspace(2.0, 3.0, num=5, endpoint=False) #左闭右开,不包含3.0 3 np.linspace(2.0,3.0, num=5, retstep=True) #显示步长
3.4 使用zeros()/zeros_like()/ones()/ones_like()创建,numpy.zeros(shape,dtype=float,order=‘c‘):返回给定形状和新的数组,用零填充,ones同理。
np.zeros(5) np.zeros((2,3,2), dtype=np.int) arr1 = np.array([[1,2,3],[4,5,6]]) np.zeros_like(arr1) np.ones(6)
3.5 eye()创建数组,正方形的n*n的单位矩阵,对角线为1,其余为0。
1 np.eye(5)
3.6 nadaray的数据类型
四、numpy的通用函数及基本操作
4,1 数组形状 .T/.reshape()/.resize(),转置(2,5)--(5,2)
arr1 = np.arange(10) arr2 = np.ones((5,2)) arr3 = np.array([[1,2,3],[4,5,6]]) print(arr1,arr1.T) print(‘_______‘) print(arr2) print(arr2.T) print(‘______‘) print(arr3) print(arr3.T) # reshape只提供形状的改变,元素数量保持一致 arr4 = np.resize(arr2, (3,5)) print(arr4) print(np.arange(1,13).reshape(3,4)) np.resize(np.arange(1,13).reshape(3,4), (3,5)) # np.resize 改变形状,如果元素不够,重复填充
4.2 数组的复制
arr1 = np.arange(10) arr2 = arr1 print(arr1 is arr2) arr3 = arr1.copy() print(arr1 is arr3) # copy 复制一个副本 # .T, reshape,resize 返回一个新的数组
4.3 数组类型的转换 .astype() 默认返回一个新的数组
1 ar1 = np.arange(10, dtype=np.float) 2 ar1.astype(np.int32)
4.4 数组的堆叠
a1 = np.arange(5) a2 = np.arange(4) #print(a1.shape, a2.shape) # 水平堆叠 np.hstack((a1, a2)) # 水平堆叠时,行数要一致 ar1 = np.arange(12).reshape((3,4)) ar2 = np.arange(15).reshape((3,5)) print(np.hstack((ar1, ar2))) # 垂直堆叠 # np.vstack() # 垂直堆叠,列数要一致 # np.stack() 通过指定哪个维度,哪个轴 # help(np.stack) ar1 = np.arange(12).reshape((3,4)) ar2 = np.ones((3,4)) print(ar1) print(ar2) np.stack((ar1,ar2),axis=0).ndim
4.4 数组的拆分
ar = np.arange(16).reshape(4,4) print(ar) # 水平拆分 按列拆 ars = np.hsplit(ar,2) print(ars) print(ars[0]) print(ars[1]) # 垂直拆分,按行拆 ars = np.vsplit(ar,4) print(ars) print(ars[0]) print(ars[1])
4.5 数组的简单运算
# 矢量化 ar = np.arange(12).reshape(3,4) # 与标量的运算 print(ar) print(ar+1) print(ar*2) print(1/(ar+1)) print(ar**0.5) # 常用的统计函数 print(ar.mean()) # 求平均值 print(ar.max()) # 求最大值 print(ar.min()) # 求最小值 print(ar.std()) # 求标准差 print(ar.var()) # 求方差 # 可以在不同维度上进行操作 print(ar) np.sum(ar, axis=0) np.sum(ar, axis=1) np.sort(np.array([4,3,2,1]))
五、numpy的索引和切片
5.1 numpy的基本索引
ar = np.arange(20) print(ar) print(ar[4]) print(ar[:3]) # 一维的 ar = np.arange(16).reshape(4,4) print(ar) print(ar[0]) # 切出一行 切片为下一个维度的一个元素 print(ar[0][-1]) # 二次索引,得到一维中的一个值 print(ar[:3]) # 切出多行, print(ar[1,1]) # 类似于二次索引 print(ar[:2, 1:]) # 二维的
5.2 布尔型索引
ar = np.arange(12).reshape(3,4) i = np.array([True, False, True]) j = np.array([False, True, False, True]) print(ar) print(i) print(j) print(ar[i]) print(ar[i,:]) # 选行 print(ar[:, j]) # 选列 # 基本的布尔型索引 ai = ar > 5 print(ar) print(ai) print(ar[ar % 2 != 0]) # 选取所有的奇数 print(ar[i,j])
六、numpy随机数 numpy.random
6.1 生成标准正态分布的随机数
1 # 生成 2 samples = np.random.normal(size=(4,4)) # 符合标准正态分布的4*4样本值 3 print(samples)
6.2 numpy.random.rand():[0,1)之间的随机样本或N维浮点数组--均匀分布
import matplotlib.pyplot as plt a = np.random.rand() b = np.random.rand(4) c = np.random.rand(3,4) s1 = np.random.rand(1000) s2 = np.random.rand(1000) plt.scatter(s1, s2) plt.show()
6.3 numpy.random.randn():生成一个浮点数或者N维的浮点数组--正态分布
import matplotlib.pyplot as plt s1 = np.random.randn(1000) s2 = np.random.randn(1000) #print(s1) plt.scatter(s1, s2) plt.show() help(np.random.randn)
6.4 numpy.random.randint(low,high=None,sizej=None,dtype=‘1‘):生成一个整数或N维的整数数组。
若high不为None时,取[low,high)之间的随机整数,否则取值[0,low)之间的随机整数,且high必须大于low
dtype参数:只能是INT整数
1 np.random.randint(3) 2 np.random.randint(2, 6, size=5) 3 np.random.randint(1,100, size=[3,5])
七、numpy的输入输出,读写数组数据,文本数据
7.1 二进制文件的存数据和读数据
# 二进制文件 # 存数据 import numpy as np ar = np.random.rand(5,5) np.save(‘test.npy‘,ar) #读数据 np.load(‘test.npy‘)
7.2 文本数据的存和读
#文本数据 import numpy as np ar = np.random.rand(5,5) # 存 np.savetxt(‘test.txt‘, ar, delimiter=‘,‘) # 读取 np.loadtxt(‘test.txt‘, delimiter=‘,‘)