Python常用标准库之fileinput
Python常用标准库之fileinput
fileinput模块用于对标准输入或多个文件进行逐行遍历。这个模块的使用非常简单,相比open()方法批量处理文件,fileinput模块可以对文件、行号进行一定的控制。
典型的用法:
import fileinput for line in fileinput.input(): process(line)
如果代码中没有指定操作的文件对象,则默认是从stdin获得的sys.argv[1:]
中的参数。
基本方法
fileinput.input(files=None, inplace=False, backup=‘‘, bufsize=0, mode=‘r‘, openhook=None)
创建并返回一个FileInput类的实例。files
指定要处理的文件,可以是一个多元元组,表示按顺序批量处理元组内文件。inplace
参数最关键,可设置是否对源文件进行修改;backup
则用于指定对源文件进行备份的后缀名;mode
用于指定文件读写方式,和open()
方法的定义一样, 默认为只读‘r’。同样的,fileinput.input()
方法也可以作为一个上下文管理器使用,如下所示:
with fileinput.input(files=(‘spam.txt‘, ‘eggs.txt‘)) as f: for line in f: process(line)
这将保证input会在with语句结束之后被关闭,无论期间是否抛出过异常,确保文件安全。
主要属性
fileinput.filename()
返回当前正在处理的文件名(也就是包含了当前正在处理的文本行的文件)
fileinput.fileno()
返回当前文件的总行数。
fileinput.lineno()
返回当前的行数,这个行数是累计的。多个文件的行数会累加起来。
fileinput.filelineno()
返回当前正在处理的文件的当前行数。每次处理完一个文件并开始处理下一个文件时,该值会重置为1,重新开始计数。
fileinput.isfirstline()
当前行是当前文件的第一行时返回True,否则False.
fileinput.isstdin()
当前操作对象为sys.stdin时返回True否则False。
fileinput.nextfile()
关闭当前的文件,跳到下一个文件,跳过的行不计数。
fileinput.close()
关闭整个文件链,结束迭代。
示例
现在有一个1.txt文件,内容如下:
愿圣光与你同在! 为了部落! 兽人永不为奴! 你们这是自寻死路! 复活吧我的勇士! 为你而战我的女士!
然后为每一行添加“#行号”。
import fileinput with fileinput.input(files="d:\\1.txt") as f: for line in f: line = line.rstrip() num = fileinput.lineno() print("#%d\t%s" % (num, line)) #输出结果 #1 愿圣光与你同在! #2 #3 为了部落! #4 #5 兽人永不为奴! #6 #7 你们这是自寻死路! #8 #9 复活吧我的勇士! #10 #11 为你而战我的女士!
如果你想同步修改源文件,添加inplace=True
参数即可,但一定要小心,请确认自己的行为,防止误操作!
参考:
- 刘江的博客及教程
- The Python Standard Library