Python大佬数据结构飞升之路初窥pandas数据结构

欢迎各位小哥哥小姐姐阅读本<小生>的文章,对大家学习有帮助,请点赞加关注哦!!!!!!!!!!!

您的点赞和关注将是我持续更新的动力呢.^v^

有不懂的问题可以私聊我哦!

Python大佬数据结构飞升之路初窥pandas数据结构

  • pandas数据结构
  • dataframe: 行索引index、列索引 coumns
  • index columns values T
  • head,tail
  • 索引操作:
  • 重设索引,将原来的索引删除 drop丢弃原来的索引 或者变成一列值,添加新的按照下表数字的索引 stock_dataframe.reset_index(drop=True)
  • 设置列为索引值或者设置多重索引: 可以设置多重索引, 具有多重索引的结构df = df.set_index(['year','month'])
  • series和Dataframe: series只有行索引没有列索引
  • DataFrame的索引、排序操作
  • 直接使用行列索引(先列后行)
  • 结合loc或者iloc使用索引
  • 通过loc和iloc获取数据
  • loc通过索引名字
  • iloc通过索引下标
  • 使用ix组合索引
  • 使用ix进行混合索引获取数据
  • 对内容进行修改:
  • data['open'] = 1
  • 进行排序:
  • 对索引排序sort_index()
  • 对内容进行排序 sort_values(by='p_change', ascending=False).head()
  • 对p_change涨跌幅进行排序
  • ascending 指定拍讯从小到大等
  • 统计分析
  • 单个值计算
  • 逻辑运算
  • 通过运算符,& | —> query更加方便去进行数据筛选
  • isin:判断值是否存在,选择保留
  • 算数运算:
  • 通过减法运算实现自己的每日价格变化值
  • .sub
  • 自定义函数预算
  • apply
  • 文件的读取和存储:
  • 指定usecols 来读取部分数据,其它不用到的就不需要读取了
  • stock_day = pd.read_csv("./data/stock_day/stock_day.csv", usecols=['open', 'close', 'high'])
  • index:存储不会讲索引值变成一列数据
  • mode:'a'追加方式
  • header:已追加方式时候,记住要把列名去除header=False
  • stock_day[:10].to_csv("./test.csv", columns=['open'], index=False, mode='a', header=False)

相关推荐