Python 统计英文词频

ITxiaobaibai

2020-01-02

# 笨方法，直接把需要替换掉的字符写到一个list中
si =[]

def fre(TargetName,desName):
    ‘‘‘打开 TargetName 文本，统计总单词数、独特的单词数、单词词频，并写入 desName 文件中‘‘‘
 
    dict = {} # 存放单词
    number = 0  # 统计累计文本总单词数
    uniqueNum = 0  # 统计不重复的单词的个数
    # 打开文本
    with open(TargetName,‘r‘,encoding=‘utf-8‘) as f:
        for line in f: # 逐行读取
            for s in si:  # 遍历 si 中的元素
                if s in line: # 如果这一行包含 列表si 中的任意一个元素，就用空格替换掉
                    line = line.replace(s,‘ ‘)
            word = line.split()  # 将句子分割成单词列表
            for w in word:       # 遍历单词列表
                number += 1      # 每遍历一个单词，总单词数就+1
                w = w.lower()  # 单词转换成全小写的形式
                if w not in dict:  # 如果单词不在dict里面，就把单词放进去，设置这个单词的词频为1，并且 duniqueNum+1
                    dict[w] = 1
                    uniqueNum += 1
                else:               # 如果单词已经存在，就将词频数+1
                    dict[w] = dict[w]+1
    #格式化打印
    print(f‘{"Total words": <20} {number}‘)
    print(f‘{"Unique words": <20} {uniqueNum}‘)
 
    # 将词频写入文件
    with open(desName, ‘w‘, encoding=‘utf8‘) as f:
        # 先写入总词数、不重复单词数的信息
        f.write(f‘{"Total words": <20} {number}\n‘)
        f.write(f‘{"Unique words": <20} {uniqueNum}\n‘)
        f.write(‘-----------------------------\n‘)
        for i in sorted(dict.items(), key=lambda x: x[1], reverse=True):  # 将字典降序排序，并遍历
            f.write(f‘{i[0]: <20} {i[1]}\n‘)
            print(f‘{i[0]: <20} {i[1]}‘)
 
if __name__=="__main__":
    name = ‘Gone Girl - Gillian Flynn.txt‘
    desName = ‘dict.txt‘
    fre(name,desName)

英语 python 单词英文单词

ITxiaobaibai

0 关注 3 粉丝 0 动态

相关推荐

人工智能时代的中文和英文，谁能成为AI的母语？

人工智能是当前很热门的技术，各国都在投入资金和人力进行研究。谁错过了人工智能，谁就丢掉了未来。语言文字在人工智能中占有非常重要的地位，它是人和人工智能交互的工具，人工智能只有准确理解语言文字才能做出准确应对，才能表现出高智商。今天就谈谈中文和英文是不是优秀

CSDN人工智能头条 2020-10-18

jmeter工具中的用英文切换

#Preferred GUI language. Comment out to use the JVM default locale‘s language.

Cherishyuu 2020-06-25

二本院校计算机专业考研上岸985

　　各位小伙伴好，当然也不知道哪些小伙伴能看到这篇文章。感觉自己好久没有写博客了，每次写博客都是一段时间会写，平时就没怎么更新了，说来惭愧，每次在简历上自我评价说自己平时喜欢写博客，哈哈哈哈，忽略。　　今天就先写到这了，祝能看到这的小伙伴考研都能考出个好成

ding0 2020-05-18

讯飞英语通值得入手吗 AI陪练口语专家讯飞英语通详细评测

讯飞英语通怎么样？下面小编带来AI陪练口语专家讯飞英语通详细评测，希望对大家有所帮助。利用自身在AI领域的优势，科大讯飞已经推出了多款AI产品，比如去年就有录音笔、阿尔法蛋等新品推出，展示了出色的AI语音转写、AI语音能力。而这一次，科大讯飞则将目光投向了

forrestyanyu 2020-05-06

Linux该如何学习新手入门遇到问题又该如何解决

　　本节旨在介绍对于初学者如何学习 Linux 的建议。如果你已经确定对 Linux 产生了兴趣，那么接下来我们介绍一下学习 Linux 的方法。　　学习大多类似庖丁解牛，对事物的认识一般都是由浅入深、由表及里的过程，循序才能渐进。学习 Linux 同样要

happywxp 2020-04-14

AutoHotkey+BUG小狼毫+BUG win10输入法设置的艰难摸索（未完待续）

AutoHotkey无法获取小狼毫当前是英文还是中文状态，这样在必须要英文的情景下，还需手工切换，不理想。还用到 imetool.exe小工具，从win7时一直在用的。英文有美国键盘和英国键盘之分，英文时是单个 EN图标。这时只有小狼毫输入法，用AutoH

81296031 2020-04-08

小白程序员怎么由量变到质变写出高质量代码

小白程序员怎么由量变到质变写出高质量代码？很多老程序员从事开发多年，有这样一种感觉，查看一些开源项目，如Spring、Apache Common等源码是一件赏心悦目的事情，究其原因，无外两点：。对于数组，列表等对象集合的命名，必须使用复数，而且最好按照英文

junzi 2020-02-11

Manjaro WPS Office 2019 For Linux 英文设置成中文

Manjaro WPS Office 2019 For Linux 英文设置中文点击右上角A图标标志，然后在窗口中选择中文，如果跟下图一样没有中文：就先下载wps中文语言包，sudo pacman -S wps-office-mui-zh-cn,安装中文语

wintelx 2020-02-03

Manjaro WPS Office 2019 For Linux 英文设置成中文

Manjaro WPS Office 2019 For Linux 英文设置中文点击右上角A图标标志，然后在窗口中选择中文，如果跟下图一样没有中文：就先下载wps中文语言包，sudo pacman -S wps-office-mui-zh-cn,安装中文语

LonelyTraveler 2020-02-03

趁着疫情在家学点什么？

首先向奋战在前线生死逆行的医护人员致敬。瘟疫属于天灾，个人在灾害面前显得很渺小。有人说2019是过去十年最差的一年，但却是未来十年最好的一年。虽然2019年很多企业经历了生存危机，很多企业裁员，2020年初又爆发肺炎疫情，但我依然觉得这种观点有点太过杞人忧

junzi 2020-01-31

利用css将英文转为大写或小写

项目需要在后台接收的字段值为小写，但在页面上显示大写英文，但操作页面之后，最终传给后台的依旧是小写，所以就需要使用css转化一下即可

zengni 2019-12-22

pandas行转列、列转行、以及一行生成多行

笔者曾经碰到过两种格式的数据，当时确实把我难住了，最后虽然解决了，但是方法不够优雅，而且效率也不高，如果想高效率，那么就必须使用pandas提供的方法。而pandas作为很强的一个库，一定可以优雅地解决。但是最近又碰到了当时的情况，于是决定要优雅地解决，最

SuperYPC 2019-12-01

为什么“中文”不能用来做编程，而英文却可以？听听程序员怎么说

但是不知道大家有没有注意到这么一个细节，如果有写到一些和编程相关的专业的人应该知道，编程的语言是英文，如果用中文下去编译的话，那么线程就会出现“bug”，不然就是会出现乱码。目前为止还没有程序是能够用中文开发出来的，为什么“中文”不能用来做编程，而英文却可

学海无边回头是岸 2019-07-18

eclipse查看英文源码时有道词典划词问题

由于英文水平不太好，所以使用eclipse查看英文源码时总是先把单词或句子复制下来然后贴到有道词典里边去查询，但是这样做的效率很低，需要不停复制粘贴，真的很累。有道词典其实也蛮强大的，基本上大部分软件都能进行划词翻译，但是就是不支持这个eclipse，猜想

SUDevops 2019-11-03

程序员：英语和数学不好的人是不是学不会编程？

“我英语和数学不好，是不是学不会编程？如果能学会，4个半月，够么?”很多 0 基础学习或者转型IT行业的都会有这样的疑问，其实刚开始学编程是不需要太高深的数学和英语基础，所以大家要放心。同时小编整理了这篇文章，希望能帮助到大家。显著的强心作用。私信“01”

码海拾遗 2019-08-21

Practical Scala DSLs.pdf 2017 英文原版免费下载

Practical Scala DSLs.pdf

lightyaoyuan 2017-12-17

Parsing with Perl 6 Regexes and Grammars.pdf 2017 英文原版免费下载

Parsing with Perl 6 Regexes and Grammars.pdf

糨糊 2017-12-17

Cross Over to HTML5 Game Development.pdf 2017 英文原版免费下载

Cross Over to HTML5 Game Development.pdf

VincentDrW 2017-12-17

css显示英文大小写

text-transform: capitalize;强制所有字符被转换为大写。text-transform: none;想到最开始的时候还一个个找那些单词首字母有没有的日子，突然一阵心酸，哈哈哈

zengni 2019-10-29

做到这三步，轻松搞定深国交入学考试

在老师看来，英语不拿A都不叫做“搞定”。所以，今天我们的题目不如叫做“做到这三步，深国交入学考试英语轻松拿A”。之前老师有学生，英语B数学也是B，结果都只是成了“候补”。而要知道，在大多数考生数学拿C的情况下，这位数学拿B的同学已经相当不错了。稳是稳了，但

算法与数学之美 2019-10-27

ITxiaobaibai

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号