Python对数据进行插值和下采样的方法
使用Python进行插值非常方便,可以直接使用scipy中的interpolate
import numpy as np x1 = np.linspace(1, 4096, 1024) x_new = np.linspace(1, 4096, 4096) from scipy import interpolate tck = interpolate.splrep(x1, data) y_bspline = interpolate.splev(x_new, tck)
其中y_bspline就是从1024插值得到的4096的数据
但是,scipy中好像并没有进行下采样的函数,嗯..难道是因为太过简单了么,不过好像用一个循环就可以完成,但如果把向量看成一个时间序列,使用pandas中的date_range模块也可以十分方便的以不同频率进行采样,并且,很多对文件的操作都是使用pandas操作的。
import pandas as pd index = pd.date_range('1/1/2000', periods=4096, freq='T') #这个起始时间任意指定,freq为其频率 data = pd.read_table(filename, names=['feat']) data.index = index data_obj = data.resample('4T', label='right') #第一个为抽样频率,label表示左右开闭区间 data_new = data_new.asfreq()[0:]
因为data.resample返回的是一个 pandas.tseries.resample.DatetimeIndexResampler对象
所以想要获取其中的值可以通过 data_new.asfreq()[0:]获取
更多方法详见 pandas.DataFrame.resample