python实现文件读取以及字段统计

JackLang

2020-06-02

import re


def find_item(hero):
    # 读取文件
    with open(‘sanguo_utf8.txt‘, encoding=‘utf-8‘) as f1:
        # 去掉内容中的换行，将文本变为一行
        data = f1.read().replace(‘\n‘, ‘‘)
        # 使用正则表达式，返回传入参数的总出现情况。
        # 当使用len()方法时，则会返回该参数总的出现次数
        name_num = re.findall(hero, data)
        print(‘主角  %s  出现了  %s  次‘ % (hero, len(name_num)))
    return len(name_num)


name_dict = {}
# 读取姓名文件
with open(‘name.txt‘, encoding=‘utf-8‘) as f2:
    # 将姓名以‘|‘进行分割
    for line in f2:
        names = line.split(‘|‘)
        # 遍历所有姓名
        for n in names:
            # 将姓名作为参数传递给统计姓名出现次数的函数
            # 返回每个姓名出现的次数
            name_num = find_item(n)
            # 将每个姓名作为键，出现次数作为值。传给num_dict[]字典
            name_dict[n] = name_num

打印结果：

主角諸葛亮出现了 157 次
主角關羽出现了 9 次
主角劉備出现了 297 次
主角曹操出现了 940 次
主角孫權出现了 321 次
主角關羽出现了 9 次
主角張飛出现了 364 次
主角呂布出现了 342 次
主角周瑜出现了 240 次
主角趙雲出现了 313 次
主角龐統出现了 82 次
主角司馬懿出现了 287 次
主角黃忠出现了 189 次
主角馬超出现了 219 次

JackLang

0 关注 0 粉丝 0 动态

关注关注

安科网

python实现文件读取以及字段统计

JackLang

JackLang

JackLang