pandas基础操作(一)

Pandas基于两种数据类型: series 与 dataframe 

Series:是一个一维的数据类型

pandas基础操作(一)

 DataFrame:是一个二维的表结构

pandas基础操作(一)

选择/切片

df[‘code‘]    # 选取一列,生成一个Series 

df[[‘code‘]]   # 选取一列,生成一个DataFrame

df[[‘code‘, ‘unit‘]]   # 选取多列

df[1:3]        #第1行到第2行(不含第3行)  

loc,在知道列名字的情况下,df.loc[index,column] 选取指定行,列的数据

iloc完全用数字来定位 iloc[row_index, column_index]

pandas基础操作(一)

isin 过滤

df[df[‘unit‘].isin([‘1单元‘]) 

缺省项

# pandas 中使用np.nan作为缺省项的值

# 删除所有带有缺省项的行 :df.dropna(how = ‘any)

# 填充缺省项:df.fillna(value = 7)

# 获得缺省项的布尔掩码:pd.isnull(df)

观察操作

# 前几行数据

df.head()

# 显示索引

df.index

# 显示列

df.columns

# 转置

df.T

参考文档:http://www.data-master.net/80533003

相关推荐