NumPy 数组使用大全
NumPy 是一个Python 库,用于 Python 编程中的科学计算。在本教程中,你将学习如何在 NumPy 数组上以多种方式添加、删除、排序和操作元素。
NumPy 提供了一个多维数组对象和其他派生数组,例如掩码数组和掩码多维数组。
为什么要用 NumPy
NumPy 提供了一个 ndarray 对象,可以使用它来对任何维度的数组进行操作。 ndarray 代表 N 维数组,其中 N 是任意数字。这意味着 NumPy 数组可以是任何维度的。
与 Python 的 List 相比,NumPy 具有许多优势。我们可以在 NumPy 阵列上执行高性能操作,例如:
- 对数组成员进行排序
- 数学和逻辑运算
- 输入/输出功能
- 统计和线性代数运算
安装 NumPy
要安装NumPy,你的电脑上要先有 Python 和 Pip。
在终端中运行以下命令:
pip install numpy
然后你就可以在脚本中导入 NumPy 了,如下所示:
import numpy
添加数组元素
可以用 NumPy 模块的 append() 方法向 NumPy 数组中添加元素。
append() 的语法如下:
numpy.append(array, value, axis)
value 会被追加到在数组的末尾,并返回一个包含所有元素的 ndarray。
参数 axis 是一个可选的整数,用于定义数组的显示方式。如果没有指定,则数组结构将展平,稍后会演示用法。
以下示例,其中首先声明数组,然后用 append 方法向数组添加更多的值:
import numpy a = numpy.array([1, 2, 3]) newArray = numpy.append (a, [10, 11, 12]) print(newArray) # 输出:[ 1 2 3 10 11 12]
添加一列
也可以用NumPy 的 append() 方法插入一列。
在下面的例子中,我们创建了一个二维数组并插入了两列:
import numpy a = numpy.array([[1, 2, 3], [4, 5, 6]]) b = numpy.array([[400], [800]]) newArray = numpy.append(a, b, axis = 1) print(newArray) """ 输出: [[ 1 2 3 400] [ 4 5 6 800]] """
如果没有使用 axis 参数,则会输出:
[ 1 2 3 4 5 6 400 800]
这就是数组结构的扁平化。
在 NumPy 中,还可以用 insert() 方法插入元素或列。 两者之间的区别在于 insert() 方法可以指定要在哪个索引处添加元素,但 append() 方法会在数组的末尾添加一个值。
Consider the example below:
考虑以下示例:
import numpy a = numpy.array([1, 2, 3]) newArray = numpy.insert(a, 1, 90) print(newArray) # 输出:[ 1 90 2 3]
这里 insert() 方法在索引1处添加元素。在Python中数组索引从0开始。
追加一行
也可以用 append() 方法向数组添加行,就像在数组中附加元素一样简单:
import numpy a = numpy.array([[1, 2, 3], [4, 5, 6]]) newArray = numpy.append(a, [[50, 60, 70]], axis = 0) print(newArray) """ 输出“ [[ 1 2 3] [ 4 5 6] [50 60 70]] """
删除元素
可以用 NumPy 模块的 delete() 方法删除 NumPy 数组元素:
import numpy a = numpy.array([1, 2, 3]) newArray = numpy.delete(a, 1, axis = 0) print(newArray) # 输出:[1 3]
在本例子中,我们有一个一维数组,用 delete() 方法从数组中删除了索引 1 处的元素。
删除一行
同样,你也可以用 delete() 方法删除行。
下面的例子中我们从二维数组中删除了一行:
import numpy a = numpy.array([[1, 2, 3], [4, 5, 6], [10, 20, 30]]) newArray = numpy.delete(a, 1, axis = 0) print(newArray) """ 输出: [[ 1 2 3] [10 20 30]] """
在 delete() 方法中,首先给出数组,然后给出要删除的元素的索引。在上例中,我们删除了索引为 1 的元素。
检查 NumPy 数组是否为空
可以用 size 方法返回数组中元素的总数。
在下面的例子中有一个 if 语句,通过 ndarray.size 检查数组中是否有元素,其中 ndarray 可以是任何给定的 NumPy 数组:
import numpy a = numpy.array([1, 2, 3]) if(a.size == 0): print("The given Array is empty") else: print("The array = ", a) # 输出:The array = [1 2 3]
在上面的代码中,数组中有三个元素,因此它不是空的,判断条件将返回false。如果数组中没有元素,则 if 条件会变为 true 并且将打印空消息。如果数组等于:
a = numpy.array([])
上述代码将会输出:
The given Array is empty
查找值的索引
要查找值对应的索引,可以用 NumPy 模块的 where() 方法,如下例所示:
import numpy a = numpy.array([1, 2, 3, 4, 5]) print("5 is found at index: ", numpy.where(a == 5)) # 输出:5 is found at index: (array([4]),)
如果你只想得到索引,可以这样写:
import numpy a = numpy.array([1, 2, 3, 4, 5]) index = numpy.where(a == 5) print("5 is found at index: ", index[0]) #输出: 5 is found at index: [4]
NumPy 数组切片
数组切片是从给定数组中提取子集的过程。你可以用冒号( : )运算符对数组进行切片,并指定数组索引的开始和结束位置,例如:
array[from:to]
下面的例子中提取从索引 2 到索引 5 的元素:
import numpy a = numpy.array([1, 2, 3, 4, 5, 6, 7, 8]) print("A subset of array a = ", a[2:5]) # 输出:A subset of array a = [3 4 5]
如果想要提取最后三个元素,可以通过用负切片来完成操作,如下所示:
import numpy a = numpy.array([1, 2, 3, 4, 5, 6, 7, 8]) print("A subset of array a = ", a[-3:]) # 输出:A subset of array a = [6 7 8]
将函数作用于所有数组元素
在下面的例子中,我们将创建一个 lambda 函数,并传入一个数组,以其应用于所有元素:
import numpy addition = lambda x: x + 2 a = numpy.array([1, 2, 3, 4, 5, 6]) print("Array after addition function: ", addition(a)) # 输出:Array after addition function: [3 4 5 6 7 8]
在此例中,创建了一个 lambda 函数,它使每个元素都递增 2。
NumPy 数组的长度
要得到 NumPy 数组的长度,可以用 size 属性,如下所示:
import numpy a = numpy.array([1, 2, 3, 4, 5, 6]) print("The size of array = ", a.size) # 输出:The size of array = 6
从 list 创建 NumPy 数组
假设你有一个列表:
l = [1, 2, 3, 4, 5]
现在要根据这个列表创建一个数组,可以用 NumPy 模块的 array() 方法:
import numpy l = [1, 2, 3, 4, 5] a = numpy.array(l) print("The NumPy array from Python list = ", a) # 输出:The NumPy array from Python list = [1 2 3 4 5]
同样,使用 array() 方法,也可以从元组创建 NumPy 数组。如下所示:
import numpy t = (1, 2, 3, 4, 5) a = numpy.array(t) print("The NumPy array from Python Tuple = ", a) # 输出:The NumPy array from Python Tuple = [1 2 3 4 5]
将 NumPy 数组转换为 list
要将数组转换为list,可以使用 NumPy 模块的 tolist()方法。
import numpy a = numpy.array([1, 2, 3, 4, 5]) print("Array to list = ", a.tolist()) # 输出:Array to list = [1, 2, 3, 4, 5]
在这段代码中,我们简单地调用了 tolist() 方法,该方法将数组转换为列表。然后将新创建的列表打印到输出屏幕。
把 NumPy 数组导出为 CSV
要将数组导出为 CSV 文件,可以用 NumPy 模块的 savetxt() 方法,如下所示:
import numpy a = numpy.array([1, 2, 3, 4, 5]) numpy.savetxt("myArray.csv", a)
此代码将在 Python 代码文件所在路径下生成 CSV 文件。当然你也可以指定路径。
该文件的内容如下:
1.000000000000000000e+00
2.000000000000000000e+00
3.000000000000000000e+00
4.000000000000000000e+00
5.000000000000000000e+00
你可以把额外填充的零删除,如下所示:
numpy.savetxt("myArray.csv", a,fmt='%.2f')
对 NumPy 数组排序
可以用 NumPy 模块的 sort() 方法对 NumPy 数组进行排序:
sort() 函数有一个可选参数 axis(整数),默认为 -1。axis 指定我们要对数组进行排序的轴。 -1 表示将根据最后一个轴对数组进行排序。
import numpy a = numpy.array([16, 3, 2, 6, 8, 10, 1]) print("Sorted array = ", numpy.sort(a)) # 输出:Sorted array = [ 1 2 3 6 8 10 16]
在这个例子中,我们在 print 语句中调用了 sort() 方法。数组 a 被传递给 sort 函数。
归一化数组
归一化数组是指将数组的值置于某个定义范围的过程。例如,我们想要在 -1 和 1 之间对数组进行归一化,依此类推。
归一化的公式如下:
x = (x C xmin) / (xmax C xmin)
现在把这个公式用于我们的数组。要查找数组中的最大和最小项,可以分别用 NumPy 的 max() 和 min() 方法。
import numpy x= numpy.array([400, 800, 200, 700, 1000, 2000, 300]) xmax = x.max() xmin = x.min() x = (x - xmin)/(xmax - xmin) print("After normalization array x = \n", x) """ 输出: After normalization array x = [0.11111111 0.33333333 0. 0.27777778 0.44444444 1. 0.05555556] """
数组索引
索引指向数组中的一个元素。在下面的例子中,分别用到了一维和二维数组中的索引:
import numpy a = numpy.array([20, 13, 42, 86, 81, 9, 11]) print("Element at index 3 = ", a[3]) # 输出:Element at index 3 = 86
下面是二维数组:
import numpy a = numpy.array([[20, 13, 42], [86, 81, 9]]) print("Element at index a[1][2] = ", a[1][2]) # 输出:Element at index a[1][2] = 9
索引 [1][2] 表示第二行和第三列(索引从 0 开始)。因此在屏幕上输出 9 。
将 NumPy 数组附加到另一个数组上
可以用 append() 方法将 NumPy 数组附加到另一个 NumPy 数组上。
import numpy a = numpy.array([1, 2, 3, 4, 5]) b = numpy.array([10, 20, 30, 40, 50]) newArray = numpy.append(a, b) print("The new array = ", newArray) # 输出:The new array = [ 1 2 3 4 5 10 20 30 40 50]
在此例中,创建两个 NumPy 数组 a, b 。然后把两个数组传给 append()。当数组 b 作为第二个参数传递时,将被添加到数组 a 的末尾。
总结
正如大家所见,NumPy 数组用起来非常简单。在使用很多机器学习库时,NumPy 数组非常重要。可以说NumPy 是人工智能的大门。