pandas常用方法总结
In [49]: frame2 Out[49]: year state pop debt one 2000 Ohio 1.5 NaN two 2001 Ohio 1.7 NaN three 2002 Ohio 3.6 NaN four 2001 Nevada 2.4 NaN five 2002 Nevada 2.9 NaN six 2003 Nevada 3.2 NaN取一列的值可以frame2.state或者frame2[‘state‘]frame2[‘debt‘] = 16.5可以填充一列删除列用deldel frame2[‘debt‘]
In [73]: frame3 Out[73]: state Nevada Ohio year 2000 NaN 1.5 2001 2.4 1.7 2002 2.9 3.6
使用frame3.values可以得到一个二维ndarray
Out[74]: array([[ nan, 1.5], [ 2.4, 1.7], [ 2.9, 3.6]])索引对象是不可变的,不可以通过赋值修改可以判断某值是否在索引里
‘Ohio‘ in frame3.columns
Out[87]: True
2003 in frame3.index
Out[88]: False
重新索引
这玩意说白了可以取已有的索引名和增加索引名,而且这玩意在
取值多层索引的表有奇效
这种表想取到两种性别下得1910,1960,2010的数据,可以这样
删除列用del 那么删除行和列都可以用drop()
索引、选取和过滤
选取行以及通过布尔选数据
用loc和iloc进行选取
loc是根据索引取值
iloc是根据索引编号取值
这两个标签可以用于切片
生成矩阵的常用方法
np.arange(20.).reshape((4, 5)
使用元素级的函数处理数据
如果是Series的则使用map就行了
排序和排名
下面的这个机器学习用到过
相关推荐
jzlixiao 2020-08-18
QianYanDai 2020-07-04
三石 2020-10-30
roamer 2020-10-29
三石 2020-10-29
wangquannuaa 2020-10-15
wangquannuaa 2020-09-29
jzlixiao 2020-09-15
wangquannuaa 2020-08-30
三石 2020-08-23
逍遥友 2020-08-21
wangquannuaa 2020-08-17
QianYanDai 2020-08-16
cjsyrwt 2020-08-14
jzlixiao 2020-07-29
xirongxudlut 2020-07-20
mmmjyjy 2020-07-16
QianYanDai 2020-07-05
QianYanDai 2020-07-05