Python数据分析工具库-Numpy 数组支持库（二）

李燕西

2018-05-29

关注关注

1 shape变化及转置

a = np.floor(10*np.random.random((3,4)))

array([[ 2., 8., 0., 6.],

[ 4., 5., 1., 1.],

[ 8., 9., 3., 6.]])

a.shape

(3, 4)

a.ravel() # 转化为一维数组

array([ 2., 8., 0., 6., 4., 5., 1., 1., 8., 9., 3., 6.])

a.reshape(6,2) # 将数组a转化为指定shape的数组

array([[ 2., 8.],

[ 0., 6.],

[ 4., 5.],

[ 1., 1.],

[ 8., 9.],

[ 3., 6.]])

a.T # 数组的转置

array([[ 2., 4., 8.],

[ 8., 5., 9.],

[ 0., 1., 3.],

[ 6., 1., 6.]])

a.T.shape

(4, 3)

a.shape

(3, 4)

注意对数组进行reshape操作不会改变原有数组a，但resize会在原有数组a上进行改变：

a.resize((2,6))

array([[ 2., 8., 0., 6., 4., 5.],

[ 1., 1., 8., 9., 3., 6.]])

当reshape方法中有参数为-1，则表示numpy会自己计算-1位置的维数，这在很多深度学习模型中可以见到。

a.reshape(3,-1)

array([[ 2., 8., 0., 6.],

[ 4., 5., 1., 1.],

[ 8., 9., 3., 6.]])

2 数组的合并与拆分

concatenate连接

x = numpy.array([[1, 2, 3], [4, 5, 6]])

y = numpy.array([[7, 8, 9], [10, 11, 12]])

numpy.concatenate([x, y], axis = 0) # 竖直组合

[[ 1 2 3][ 4 5 6][ 7 8 9][10 11 12]]

numpy.concatenate([x, y], axis = 1) # 水平组合

[[ 1 2 3 7 8 9][ 4 5 6 10 11 12]]

横向合并，沿第一个轴进行堆叠，比如：vstack或row_stack

a = np.floor(10*np.random.random((2,2)))

array([[ 8., 8.],

[ 0., 0.]])

b = np.floor(10*np.random.random((2,2)))

array([[ 1., 8.],

[ 0., 4.]])

np.vstack((a,b))

array([[ 8., 8.],

[ 0., 0.],

[ 1., 8.],

[ 0., 4.]])

纵向合并，沿着第二个轴进行堆叠，比如hstack和column_stack，两者不一样，column_stack在对一维数组进行堆叠时会先将一维数组转化为二维数组，最终返回二维数组。

np.hstack((a,b)) #使用hstack对二维数组进行纵向合并

array([[ 8., 8., 1., 8.],

[ 0., 0., 0., 4.]])

np.column_stack((a,b)) #使用column_stack对二维数组进行纵向合并

array([[ 8., 8., 1., 8.],

[ 0., 0., 0., 4.]])

a = np.array([4.,2.])

b = np.array([3.,8.])

np.column_stack((a,b)) #使用column_stack对一维数组进行纵向合并，返回二维数组

array([[ 4., 3.],

[ 2., 8.]])

np.hstack((a,b)) #使用hstack对一维数组进行纵向合并，返回一维数组

array([ 4., 2., 3., 8.])

array_split ，numpy.array_split(ary, indices_or_sections, axis=0)，沿着第一个轴从左至右的顺序切分：

x = np.arange(8.0)

np.array_split(x, 3)

[array([ 0., 1., 2.]), array([ 3., 4., 5.]), array([ 6., 7.])]

x = np.arange(7.0)

np.array_split(x, 3)

[array([ 0., 1., 2.]), array([ 3., 4.]), array([ 5., 6.])]

vsplit，沿着第一个轴切分，相当于split方法中参数axis=0

x = np.arange(16.0).reshape(4, 4)

array([[ 0., 1., 2., 3.],

[ 4., 5., 6., 7.],

[ 8., 9., 10., 11.],

[ 12., 13., 14., 15.]])

np.vsplit(x, 2)

[array([[ 0., 1., 2., 3.],

[ 4., 5., 6., 7.]]),

array([[ 8., 9., 10., 11.],

[ 12., 13., 14., 15.]])]

hsplit，沿着第二个轴切分，相当于split方法中参数axis=1

x = np.arange(16.0).reshape(4, 4)

array([[ 0., 1., 2., 3.],

[ 4., 5., 6., 7.],

[ 8., 9., 10., 11.],

[ 12., 13., 14., 15.]])

np.hsplit(x, 2)

[array([[ 0., 1.],

[ 4., 5.],

[ 8., 9.],

[ 12., 13.]]),

array([[ 2., 3.],

[ 6., 7.],

[ 10., 11.],

[ 14., 15.]])]

3 数组的复制

完全不复制（No Copy at All）

a = np.arange(12)

b = a # no new object is created

b is a # a and b are two names for the same ndarray object

True

b.shape = 3,4 # changes the shape of a

a.shape

(3, 4)

这种方式的“复制”其实没有实际复制，只是将变量b在内存的索引指向了变量a所在的内存，这样变量a和变量b均指向同一块内存，这时候改变了b就相当于改变了a。

浅复制

使用view方法来创建一个新的数组对象，并把将被复制的数组a的视图（view）复制到新的数组对象c中，这时的c数据完全来自于a，和a保持完全一致，换句话说，c的数据完全由a保管，他们两个的数据变化是一致的：

c = a.view()

c is a

False

c.base is a # c只是a的视图

True

c.flags.owndata

False

c.shape = 2,6 # a的shape不会变化

a.shape

(3, 4)

c[0,4] = 1234 # a的值会相应的变化

array([[ 0, 1, 2, 3],

[1234, 5, 6, 7],

[ 8, 9, 10, 11]])

切片也是一种浅复制：

s = a[ : , 1:3] # 将a的第2列与第三列浅复制给s

s[:] = 10 # 将s的所有元素重新赋值为10，也会改变a相应位置的值

array([[ 0, 10, 10, 3],

[1234, 10, 10, 7],

[ 8, 10, 10, 11]])

深复制

使用copy方法，不仅将被复制数组的索引复制到新的数组中，也将被复制数组的元素复制到新的数组中。

d = a.copy() # 创建一个新的数组

d is a

False

d.base is a

False

d[0,0] = 9999

array([[ 0, 10, 10, 3],

[1234, 10, 10, 7],

[ 8, 10, 10, 11]])

4 Fancy indexing与布尔索引

Fancy indexing是指传递索引数组以便一次得到多个数组元素。使用Fancy indexing时返回数组的shape是索引数组的shape而不是被索引的原数组的shape。

一维数组的Fancy indexing

a = np.arange(12)**2

i = np.array( [ 1,1,3,8,5 ] ) # 索引数组

a[i]

array([ 1, 1, 9, 64, 25])

j = np.array( [ [ 3, 4], [ 9, 7 ] ] )

a[j]

array([[ 9, 16],

[81, 49]])

多维数组的Fancy indexing

a = np.arange(12).reshape(3,4)

array([[ 0, 1, 2, 3],

[ 4, 5, 6, 7],

[ 8, 9, 10, 11]])

i = np.array( [ [0,1], # 横向索引

... [1,2] ] )

j = np.array( [ [2,1], # 纵向索引

... [3,3] ] )

a[i,j]

array([[ 2, 5],

[ 7, 11]])

a[i,2]

array([[ 2, 6],

[ 6, 10]])

a[:,j]

array([[[ 2, 1],

[ 3, 3]],

[[ 6, 5],

[ 7, 7]],

[[10, 9],

[11, 11]]])

如果索引数组包含多个相同的索引，那么最后的索引会覆盖前面的索引。

a = np.arange(5)

a[[0,0,2]]=[1,2,3]

array([2, 1, 3, 3, 4])

但对于类似“+=”累加的操作却不会叠加两次：

a = np.arange(5)

a[[0,0,2]]+=1

array([1, 1, 3, 3, 4])

布尔索引

索引数组元素为布尔类型的值：

a = np.arange(12).reshape(3,4)

b = a 4

array([[False, False, False, False],

[False, True, True, True],

[ True, True, True, True]])

a[b]

array([ 5, 6, 7, 8, 9, 10, 11])

a[b] = 0

array([[0, 1, 2, 3],

[4, 0, 0, 0],

[0, 0, 0, 0]])

索引数组有多个

a = np.arange(12).reshape(3,4)

b1 = np.array([False,True,True])

b2 = np.array([True,False,True,False]) 、

a[b1,:]

array([[ 4, 5, 6, 7],

[ 8, 9, 10, 11]])

a[b1]

array([[ 4, 5, 6, 7],

[ 8, 9, 10, 11]])

a[:,b2]

array([[ 0, 2],

[ 4, 6],

[ 8, 10]])

5 Numpy的线性代数（Linear Algebra）

包含求逆、奇异值分解、生成对角矩阵、解线性方程组Ax=b、计算特征值与特征向量等

import numpy as np

a = np.array([[1.0, 2.0], [3.0, 4.0]])

print(a)

[[ 1. 2.]

[ 3. 4.]]

a.transpose() # 转置

array([[ 1., 3.],

[ 2., 4.]])

np.linalg.inv(a) # 求逆

array([[-2. , 1. ],

[ 1.5, -0.5]])

u = np.eye(2) # 生成对角矩阵

array([[ 1., 0.],

[ 0., 1.]])

j = np.array([[0.0, -1.0], [1.0, 0.0]])

np.dot (j, j) # 矩阵乘

array([[-1., 0.],

[ 0., -1.]])

np.trace(u) # 求对角线元素和

2.0

y = np.array([[5.], [7.]])

np.linalg.solve(a, y) # 解线性方程组Ax=b

array([[-3.],

[ 4.]])

np.linalg.eig(j) #计算特征值与特征向量

(array([ 0.+1.j, 0.-1.j]), array([[ 0.70710678+0.j , 0.70710678-0.j ],

[ 0.00000000-0.70710678j, 0.00000000+0.70710678j]]))

python数组操作矩阵数组 reshape

李燕西

0 关注 0 粉丝 0 动态

关注关注

Python NumPy用法介绍

NumPy是Python数值计算最重要的基础包，大多数提供科学计算的包都是用NumPy的数组作为构建基础。NumPy本身并没有提供多么高级的数据分析功能，理解NumPy数组以及面向数组的计算，将有助于你更加高效地使用诸如Pandas之类的工具。ndarra

huavhuahua 2020-11-05

在 Golang 中如何快速判断字符串是否在一个数组中

在使用 Python 的时候，如果要判断一个字符串是否在另一个包含字符串的列表中，可以使用in 关键词，例如：。如果是有序的整型数组，那么我们可以使用二分查找，把时间复杂度O降到对数时间复杂度。其中，sort.Strings是一个 in-place 的修改

Tristahong 2020-10-14

15年！NumPy论文终出炉，还登上了Nature

solarLan 2020-09-17

python - numpy基础（二）

.T 方法：转置，例如原来形状为（2，3）/转置为（3，2）/，一维数组转置后不变。a2 = np.ones.reshape #生成数组直接改变形状。两种方法输出的结果都为列表。[4, 5, 6, 7]]), array([[ 8, 9, 1

cenylon 2020-04-22

Numpy 改变数组维度的几种方法小结

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23]1.reshape 函数。[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

zluxingzhe 2018-08-02

我们最后需要返回完成之后数组的长度。

不过去重的条件是最多允许一个元素出现两次，也就是要将多余的元素去掉。并且题目还限制了需要我们在原数组进行操作，对于空间复杂度的要求是。由于我们去除了元素之后会带来数组长度的变化，所以我们最后需要返回完成之后数组的长度。

Winterto0 2020-06-26

python工具——NumPy

NumPy是Python中科学计算的基础包。它是一个Python库，提供多维数组对象，各种派生对象，以及用于数组快速操作的各种API，有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数，基本统计运算和随机模拟等等。NumPy的主

feishicheng 2020-06-09

Python 之 Numpy库以及Matplotlib库的学习

　　Matplotlib是Python中一个能够提供数据绘图功能的第三方库。其pyplot 子库主要用于实现各种数据展示图形的绘制，包括线性图、柱形图、饼图等基础而直观的图形，在平常的开发当中需要绘图时就非常有用了。#以下三行代码是为了正确显示中文字体，更

laohyx 2020-05-07

Python科学计算与可视化

numpy 是用于处理含有同种元素的多维数组运算的第三方库，支持N维数组运算、处理大型矩阵、成熟的广播函数库、矢量运算、线性代数、傅里叶变换、随机数生成，并可与C++/Fortran语言无缝结合。数组中所有元素的类型必须相同，数组中元素可以用整数索引，序号

举 2020-05-06

numpy

Numpy是高性能科学计算和数据分析的基础包。它也是pandas等其他数据分析的工具的基础，基本所有的数据分析的包都用过它。Numpy为python带来了真正的多维数组功能，并且提供了丰富的函数库处理这些数组。它将常用的数学函数都支持向量化运算，使得这些数

sschencn 2020-04-21

python刷LeetCode：27. 移除元素

给定一个数组 nums和一个值 val，你需要原地移除所有数值等于val的元素，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O 额外空间的条件下完成。元素的顺序可以改变。函数应该返回新的长度 2, 并且 nums 中的

yawei 2020-02-26

量化投资_Multicharts数组操作函数_append()追加函数(自定义)

因此要对数组进行元素“”追加“”的话，需要重新更改数组的索引，然后再最后一个位置添加value。

chaigang 2020-02-25

数组、函数

//在数组末尾添加一个元素,，允许添加多个数据，例如：the_array.push. //pop删除数组末尾的数据并返回，和PYTHON列表的POP类似。不同的是，这2个方法操作的数据数组头部的元素。//另外还有，Array.sort()排序，Array.

小方哥哥 2020-01-12

Python Numpy，学Python不得不削的矩形计算库

矩阵计算库numpy库的使用是sklearn库和opencv库的基础，主要用于矩阵的计算。Numpy 的主要用途是以数组的形式进行数据操作。机器学习中大多数操作都是数学操作，而 Numpy 使这些操作变得简单。包括 np.bool_ ，np.int32，n

千锋 2019-12-28

python数据分析入门

什么是数据分析?NumPy的前身Numeric 最早是由 Jim Hugunin 与其它协作者共同开发，2005 年，Travis Oliphant 在 Numeric 中结合了另一个同性质的程序库 Numarray 的特色，并加入了其它扩展而开发了 Nu

fgleeldq 2020-01-01

剑指offer-顺时针打印矩阵-数组-python

输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字，例如，如果输入如下4 X 4矩阵： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7

坚持是一种品质 2019-12-15

leetcode算法题121-123 --python版本

给定一个数组nums，编写一个函数将所有0移动到数组的末尾，同时保持非零元素的相对顺序。必须在原数组上操作，不能拷贝额外的数组。尽量减少操作次数。第一天买入，第二天卖出，收入为1，然后第二天再买入，第三天再卖出，收入为1，累计收入为2，。等同于第一天买入，

wklken的笔记 2019-12-03

Python中操作符“*”创建数组与循环创建数组的区别

发现该list里面的list果然都是同一个！使用"*"操作符是反馈 b个数的a，在同一个list中的所以list的引用都是一样了而使用[ [] for x in range ]则相当于使用循环：。自然bucket中的每个list都是不同

LczPtr 2019-11-19

我眼中的数组和冒泡排序

数组是一个定长的容器，可以放相同类型的数据。数组中的元素可以是任何数据类型，包括基本数据类型和引用数据类型。数组是一种线性表数据结构。它用一组连续的内存空间，来存储一组具有相同类型的数据。每个线性表上的数据最多只有前和后两个方向。dataType[] ar

duanlove技术路途 2019-11-09

面试官: 100万个成员的数组取第一个和最后一个有性能差距吗?

数组: 100万个成员的数组取第一个和最后一个有性能差距吗?希望大家带着以上的问题我们进行讨论.这里的性能并不是绝对意义上速度的快慢,因为不同的设备其硬件基础就会产生巨大的速度差异,这里的性能是我们在算法分析中的「复杂度」概念.这种高效的方法在数据量越大的

苏牧蕾的极客空间 2019-11-04

安科网

Python数据分析工具库-Numpy 数组支持库（二）

李燕西

李燕西

相关推荐

Python NumPy用法介绍

在 Golang 中如何快速判断字符串是否在一个数组中

15年！NumPy论文终出炉，还登上了Nature

python - numpy基础（二）

Numpy 改变数组维度的几种方法小结

我们最后需要返回完成之后数组的长度。

python工具——NumPy

Python 之 Numpy库以及Matplotlib库的学习

Python科学计算与可视化

numpy

python刷LeetCode：27. 移除元素

量化投资_Multicharts数组操作函数_append()追加函数(自定义)

数组、函数

Python Numpy，学Python不得不削的矩形计算库

python数据分析入门

剑指offer-顺时针打印矩阵-数组-python

leetcode算法题121-123 --python版本

Python中操作符“*”创建数组与循环创建数组的区别

我眼中的数组和冒泡排序

面试官: 100万个成员的数组取第一个和最后一个有性能差距吗?

李燕西