使用NumPy和pandas对CSV文件进行写操作的实例
数组存储成CSV之类的区隔型文件:
下面代码给随机数生成器指定种子,并生成一个3*4的NumPy数组
将一个数组元素的值设为NaN:
In [26]: import numpy as np In [27]: np.random.seed(42) In [28]: a = np.random.randn(3,4) In [29]: a[2][2] = np.nan In [30]: print(a) [[ 0.49671415 -0.1382643 0.64768854 1.52302986] [-0.23415337 -0.23413696 1.57921282 0.76743473] [-0.46947439 0.54256004 nan -0.46572975]]
NumPy的savetxt()函数是与loadtxt()相对应的一个函数,它能以诸如CSV之类的区隔型文件格式保存数组:
In [31]: np.savetxt('np.csv',a,fmt='%.2f',delimiter=',',header="#1,#2,#3,#4")
上面的函数调用中,我们规定了用以保存数组的文件的名称、数组、可选格式、间隔符和一个可选的标题
通过cat np.csv,可以查看刚才所建的np.csv文件的具体内容
利用随机数组来创建pandas DataFrame:
In [38]: df = pd.DataFrame(a) In [39]: df Out[39]: 0 1 2 3 0 0.496714 -0.138264 0.647689 1.523030 1 -0.234153 -0.234137 1.579213 0.767435 2 -0.469474 0.542560 NaN -0.465730
pandas会自动替我们给数据取好列名
利用pandas的to_csv()方法可以为CSV文件生成一个DataFrame:
In [40]: df.to_csv('pd.csv',float_format='%.2f',na_rep="NAN!")
对于这个方法,我们需要提供文件名、类似于NumPy的savetxt()函数的格式化参数的可选格式串和一个表示NaN的可选字符串
相关推荐
wangquannuaa 2020-10-15
jzlixiao 2020-05-15
QianYanDai 2020-05-07
roamer 2020-10-29
三石 2020-08-23
QianYanDai 2020-08-16
mmmjyjy 2020-07-16
QianYanDai 2020-07-05
QianYanDai 2020-07-05
jiahaohappy 2020-06-21
QianYanDai 2020-06-16
zhangxiaojiakele 2020-05-25
jiahaohappy 2020-05-12
zhangxiaojiakele 2020-05-11
jzlixiao 2020-05-08
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引
jzlixiao 2020-05-09
三石 2020-10-30
三石 2020-10-29
wangquannuaa 2020-09-29