pandas常用的Series数据结构,以及对文件数据常用的增删改查操作
DataFrame是由行和列组成的,其中的一行或一列就管他叫Series结构,所以说DataFrame是由一系列的Series结构组成的,DataFrame是数据都取下来的矩阵,Series结构就是矩阵中的一行或者一列。
现在有一个csv文件,里面是国外电影的评分
我们接下来就是使用Series结构来分析这些数据,那么如何获取series结构呢?
通过这个可以看出直接DataFrame【列名】获取到了一列,而这一列就是Series结构,它可以通过切片的方式来获取到这列中的数据
print(film)输出film这一列
print(film.values)输出film这一列,只不过是以矩阵的形式ndarray
直接通过DataFrame【列名】方式获取到的series的索引是数字下标,我们可以自己生成一个series,使用电影的名字来生成
从结果可以看出生成了一个series,这个series的索引是电影的名称,我们可以通过电影的名称找到对应的电影评分
代码分析:
series_custom=Series(rt,index=film)rt是机构RottenTomatoes评分,film为电影的名字,这个意思就是建立一个series它以film的名字为索引的series,其值为机构RottenTomatoes评分,二者是一一对应的关系,之后就可以通过电影的名字来获取到对应的机构RottenTomatoes的评分
这个实例充分说明,string值也可以当作索引的
生成了一个series之后可以进行排序,按照键排序,或者按照值排序
两个相同维度的serise可以直接相加,使用add函数
可以看出其电影名字对应的值是原来两个值相加而成
和series一样DataFrame的索引也是数字下标,他也可以指定字符类型为索引,如下所示:
fandango的类型是DataFrame,它的默认索引是数字下标,
fandango.set_index('FILM',drop=False)这个意思就是设置DataFrame的索引为FILM,可以看出输出f.index为索引,结果是电影名字
有了电影名字为索引之后,就可以通过索引来获取到对应的值
不仅可以通过字符索引来获取值,还可以使用字符索引来切片,还可以使用loc通过索引定位到那里