Python使用pandas处理CSV文件的实例讲解

mmmjyjy

2018-06-22

Python中有许多方便的库可以用来进行数据处理，尤其是Numpy和Pandas,再搭配matplot画图专用模块，功能十分强大。

CSV（Comma-Separated Values）格式的文件是指以纯文本形式存储的表格数据，这意味着不能简单的使用Excel表格工具进行处理，而且Excel表格处理的数据量十分有限，而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据，硬件环境是在Linux平台上搭建的，当时数据是在运行脚本后直接输出在terminal里的，数据量十分庞大，为了保存获得的数据，在Linux下使用了数据流重定向，把数据全部保存到了文本文件中，形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始，标明每一级的文件夹直到csv文件，header=None表示头部为空，sep=' '表示数据间使用空格作为分隔符，如果分隔符是逗号，只需换成 ‘，'即可。
print df.head()
print df.tail()
#作为示例，输出CSV文件的前5行和最后5行，这是pandas默认的输出5行，可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行，最前面一列没有标号的是行号，数据一共有13列，标号从0到12，一行显示不完全，在第9列以后换了行，并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后，csv文件的列索引默认为从0开始的数字，重定义列索引的语句如下：

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下，列索引已经被重命名：

Python使用pandas处理CSV文件的实例讲解

pandas python csv

安科网

Python使用pandas处理CSV文件的实例讲解

mmmjyjy

mmmjyjy

相关推荐

不常见的Pandas小窍门：我打赌一定有你不知道的

使用pandas库对csv文件进行筛选和保存

Pandas写出数据

教你几招，Pandas轻松处理超大规模数据

秒懂！图解四个实用的Pandas函数！

Python 中利用Pandas处理复杂的Excel数据

在pandas中利用hdf5高效存储数据

别找了，这是Pandas最详细教程了

Pandas这样来设置，做数据分析舒适百倍

高效的10个Pandas函数，你都用过了吗？

10 个加速Python数据分析的简单的小技巧

Pandas

Pandas闪回咒！如何在Python中重写SQL查询？

高效的10个Pandas函数，你都用过吗？

推荐5个实用的Pandas技巧

pandas 一维台账数据与二维表格数据的转换

用于ETL的Python数据转换工具

pandas 的DataFrame.apply()

【Pandas】基本功能

【pandas】概述

mmmjyjy