python pandas 对series和dataframe的重置索引reindex方法
reindex更多的不是修改pandas对象的索引,而只是修改索引的顺序,如果修改的索引不存在就会使用默认的None代替此行。且不会修改原数组,要修改需要使用赋值语句。
series.reindex()
import pandas as pd import numpy as np obj = pd.Series(range(4), index=['d', 'b', 'a', 'c']) print obj
d 0 b 1 a 2 c 3 dtype: int64
print obj.reindex(['a', 'b', 'c', 'd', 'e']) 1 a 2.0 b 1.0 c 3.0 d 0.0 e NaN dtype: float64
多出的索引‘e'会被赋值NaN
内插或填充method
obj1=pd.Series(range(3), index=['a', 'c', 'e']) print obj1.reindex(['a', 'b', 'c', 'd', 'e'],method='pad')
a 0 b 0 c 1 d 1 e 2 dtype: int64
ffill或pad: 前向(或进位)填充
bfill或backfill: 后向(或进位)填充
dataframe.reindex()
dataframe.reindex()可以改变(行)索引,列或两者。当只传入一个序列时,行被重新索引,一次可以对两个重新索引,可是插值只在行侧(0坐标轴)进行
frame = pd.DataFrame(np.arange(9).reshape((3, 3)), index=['a', 'c', 'd'], columns=['c1', 'c2', 'c3']) print frame
c1 c2 c3 a 0 1 2 c 3 4 5 d 6 7 8
states = ['c1', 'b2', 'c3'] frame.reindex(columns=states)
c1 | b2 | c3 | |
---|---|---|---|
a | 0 | NaN | 2 |
c | 3 | NaN | 5 |
d | 6 | NaN | 8 |
列名不一样的会被赋值nan
frame_na=frame.reindex(index=['a', 'b', 'c', 'd'], method='ffill', columns=states) print frame_na
c1 b2 c3 a 0 NaN 2 b 0 NaN 2 c 3 NaN 5 d 6 NaN 8
插值只在行侧(0坐标轴)进行,但是我们可以在其之后,对nan值进行填充
frame_na.fillna(method='ffill',axis=1)
c1 | b2 | c3 | |
---|---|---|---|
a | 0.0 | 0.0 | 2.0 |
b | 0.0 | 0.0 | 2.0 |
c | 3.0 | 3.0 | 5.0 |
d | 6.0 | 6.0 | 8.0 |
相关推荐
roamer 2020-10-29
三石 2020-08-23
QianYanDai 2020-08-16
mmmjyjy 2020-07-16
QianYanDai 2020-07-05
QianYanDai 2020-07-05
jiahaohappy 2020-06-21
QianYanDai 2020-06-16
zhangxiaojiakele 2020-05-25
jzlixiao 2020-05-15
jiahaohappy 2020-05-12
zhangxiaojiakele 2020-05-11
jzlixiao 2020-05-08
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引
jzlixiao 2020-05-09
jzlixiao 2020-08-18
QianYanDai 2020-07-04
三石 2020-10-30
三石 2020-10-29
wangquannuaa 2020-10-15