对Pandas DataFrame缺失值的查找与填充示例讲解
查看DataFrame中每一列是否存在空值:
temp = data.isnull().any() #列中是否存在空值 print(type(temp)) print(temp)
结果如下,返回结果类型是Series,列中不存在空值则对应值为False:
<class 'pandas.core.series.Series'> eventid False iyear False imonth False iday False approxdate True extended False resolution True ... Length: 135, dtype: bool
列数太多,可以将Series转化为DataFrame不存在空值的列:
colnull=pd.DataFrame(data={'colname': temp.index,'isnulls':temp.values}) #print(colnull.head()) #不存在空值的列名 print(colnull.loc[colnull.isnulls==False,'colname'])
结果如下:
0 eventid 1 iyear 2 imonth 3 iday ... Name: colname, dtype: object
如下取出某一列(nkill)存在空值的记录,返回一个DataFrame:
data[data.nkill.isnull()]
缺失值填充,inplace值为真代表直接在原DataFrame上进行操作:
data['doubtterr'].fillna(0, inplace=True) data['propvalue'].fillna(data['propvalue'].median(),inplace=True)
相关推荐
roamer 2020-10-29
三石 2020-08-23
QianYanDai 2020-08-16
mmmjyjy 2020-07-16
QianYanDai 2020-07-05
QianYanDai 2020-07-05
jiahaohappy 2020-06-21
QianYanDai 2020-06-16
zhangxiaojiakele 2020-05-25
jzlixiao 2020-05-15
jiahaohappy 2020-05-12
zhangxiaojiakele 2020-05-11
jzlixiao 2020-05-08
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引
jzlixiao 2020-05-09
81510295 2020-11-17
listep 2020-09-11
Tristahong 2020-08-24
Johnson0 2020-07-28
santiago00 2020-07-11