python基础教程:文件读写
在Linux系统中,一切都是文件。但我们通常说的文件是保存在磁盘上的图片、文档、数据、程序等等。而在程序的IO操作中,很多时候就是从磁盘读写文件。本节我们讲解Python中的文件对象如何操作文件。
创建文件对象
通过Python内置函数open()
可以很容易的创建一个文件对象。open函数有很多参数,最常用的有两个,使用open函数最常用的方法是:open(filename, mode)
。
f = open('myfile', 'w')
第一个参数filename
是文件名的字符串,比如myfile
。第二个参数也是一个字符串,表示文件使用方式。mode
的可选项如下:
mode | 含义 |
---|---|
‘r’ | 以只读模式打开(默认) |
‘w’ | 以可写模式打开,并清楚文件内容(如果文件存在的话) |
‘x’ | 创建一个新文件并以可写模式打开 |
‘a’ | 以可写模式打开,从文件末尾开始写入(如果文件存在的话) |
‘b’ | 二进制模式 |
‘t’ | 文本模式(默认) |
’+’ | 打开一个已存在文件以便进行更新(读和写) |
其中的'b'
和't'
是指定文件内容是文本还是二进制,其它都说是关于读写方式的。
'b'
是二进制模式打开文件,读写的数据都是字节对象(bytes),这个模式可以读写一切文件,包括文本文件,但读写文本文件时要注意编码的问题。't'
是文本模式下读写文件。读取时,默认会把平台特定的行结束符 (Unix 上的\n
, Windows 上的 \r\n
)转换为\n
。写入是,默认会把出现的\n
转换回平台特定的结束符。这种默认的“幕后修改”对文本文件来说没有问题,但会破坏二进制数据(比如,JPEG或exe)文件中的数据。
在使用open
创建文件对象时,最好使用 with
关键字。其好处是,当字句体结束后文件会正确关闭,即使在某个时刻引发了异常。并且with
比等效的try-finally
代码块更简短:
In [102]: with open('myfile') as f: ...: data = f.read() ...: In [103]: f.closed Out[103]: True
如果没使用with
关键字,就要调用f.close()
来关闭文件并立即释放它使用的系统资源。如果没有显示的关闭文件,Python的垃圾回收器最终将销毁该对象并为你关闭打开的文件,但这个文件可能会保持打开状态一段时间。另外一个风险是不同的Python实现会在不同的时间进行清理。
通过 with 语句或者调用 f.close() 关闭文件对象后,尝试使用该文件对象将自动失败。
文件对象的方法
通过上面的方法创建文件对象f
后,,我们就可以通过其对应的方法读写数据了。
(1)写内容到文件:f.write(string)
把内容写入文件的方法是write()
方法,传递的对象必须是字符串(文本模式下)或字节对象(二进制模式下)。如果要写入其它类型的对象(比如,字典、列表等等),就要先把它们转换成字符串(文本模式下)或字节对象(二进制模式下)。
In [109]: f = open('myfile', 'w') In [110]: f.write('认真学Python,就是文件的全部内容。\n') Out[110]: 21 In [111]: f.close()
(2)读取文件内容:f.read(size)
它会读取文件里面的数据并将其返回为字符串(在文本模式下),或者字节对象(二进制模式)。参数size
是一个可选的整数参数,当size
被省略或为负的时候,读取文件的全部内容;如果文件的大小是机器内存的两倍或更大,那么可能出现错误。读取并返回的size大小的内容。如果已经读完全部内容(到达文件末尾),将返回一个空字符串。
In [112]: f = open('myfile') In [113]: f.read() Out[113]: '认真学Python,就是文件的全部内容。\n' In [114]: f.read() Out[114]: ''
f.readline()
从文件读取一行,换行符\n
留住字符串末尾;f.readlines()
读取文件所有行,返回一个字符串的列表;
In [118]: f.readline() Out[118]: '认真学Python,就是文件的全部内容。\n' In [119]: f.seek(0) Out[119]: 0 In [120]: f.readlines() Out[120]: ['认真学Python,就是文件的全部内容。\n']
遍历文件的所有行,也可以用遍历文件对象的方式,这是内存高效、快速并简单的方式:
In [122]: for line in f: ...: print(line) ...: 认真学Python,就是文件的全部内容。
(3)文件对象的位置
前面的例子中,我们已经读到文件的末尾,如果要再从头读的话就要调用f.seek(0)
来设置文件对象的位置到文件开头。这个方法有两个参数:f.seek(cookie, whence=0)
- cookie 是位置偏移量
whence 是相对位置,它有三种相对位置:
- 0 文件开头,偏移量是0或整数;
- 1 当前位置,偏移量可以是负数;
- 2 文件末尾,偏移量通常是负数;
如何查看当前位置呢?调用f.tell()
方法。