Python练习题——第十题：从磁盘上读入一个英文文章，统计文章中每个单词出现的次数，并将频率最高的20个单词在屏幕上显示出来。_编写程序,统计文件“nixon.txt”中出现频率最高的20个单词,并

相关文章推荐

不敢表白的小摩托 · c#线程安全的有序集合 - CSDN文库· 5 月前 ·

温暖的消炎药 · sizeof与strlen()的用法与区别 ...· 5 月前 ·

成熟的匕首 · EXCEL如何用宏自动复制粘贴到下方空白行？ ...· 1 年前 ·

捣蛋的铁链 · “拾穗”系列（一）：带约束的加权最小二乘拟合 ...· 1 年前 ·

怕考试的鼠标 · SpreadsheetDocument 类 ...· 1 年前 ·

txt = txt . lower ( ) #将字母全部转化为小写 for ch in ',-.()' : #去掉特殊符号 txt = txt . replace ( ch , "" ) #将特殊符号替换为空格 return txt Txt = getText ( ) #读取文件 words = Txt . split ( ) #分隔开 counts = { } #创建字典 for word in words : counts [ word ] = counts . get ( word , 0 ) + 1 items = list ( counts . items ( ) ) items . sort ( key = lambda x : x [ 1 ] , reverse = True ) #从大到小排序 for i in range ( 20 ) : print ( items [ i ] ) txt = open('comment.text','r',encoding='utf-8').read() txt = txt .lower() for ch in '`~!@#$%^&*()_+-={}[];":,./<>?\|': txt = txt .replace(ch," ") return txt commentText = getText() words Python 综合程序设计实验名称： Python 综合程序设计：1.了解多种第三方库的使用方法, 掌握jieba库的基本使用；2.掌握文件的读写方法以及打开关闭等基本操作;3. 了解自顶向下的设计方法和自底向上的执行过程;4.了解计算生态和模块编程思想。1. PC机或笔记本电脑若干；及以上版本操作系统；3. Python 运行环境。 python 统计一个大文件中很多小文件里面的词频#!/usr/bin/env python 3.6fromcollectionsimportCounterfromfunctoolsimportreducefromoperatorimportaddfrompathlibimportPathps=Path().glob('*. txt ')c=reduce(add,[Cou... import jieba txt = open("西游记. txt ", "r", encoding='utf-8').read()words = jieba.lcut( txt ) # 使用精确模式对文本进行分词counts = {} # 通过键值对的形式存储词语及其出现的次数 for word in words:if len(word) == 1:continueelif word ==... counts = {} # 通过键值对的形式存储词语及其出现的次数 with open('./标题 . txt ','r',encoding='gbk') as f: con = f.readlines() for i in con: words = jieba.lcut(i) for word in words: if len(word) == 1: python 词频统计这篇博客用来记录一下自己学习用 python 做词频统计的过程 #一、英文词频统计，所用文本《THE CATCHER IN THE RYE 》(麦田里的守望者）涉及的第三方库及其在程序中的用途如下: import string #去除英文标点符号 from nltk.corpus import stopwords #去掉一些停用词这里说下停用词，所谓停用词，多是一些出现频繁但实际意义不大或是对文本分析帮助不大的词汇，如英文里的a,an,that 中文里的“的”、“是”等词，下面是 # 统计一个文件中单词出现的次数，并输出出现次数最多的前3个单词 def countword(file): fp = open(file, mode='r', encoding='utf-8') word_l = {} for line in fp: sword = line.strip().split() for word in sword: 好的，我可以帮你写一个统计文本单词频率的程序。首先，我们需要导入 Python 中的 collections 模块，这个模块提供了一个叫做 Counter 的类，可以用来统计单词频率。然后，我们可以打开一个文件，读入文本，将文本分割为单词列表。这可以通过使用 Python 中的 split() 函数来实现。接下来，我们可以使用 Counter 类来统计单词频率。我们可以使用 Counter ... end=$1 #S1是输出频率最高单词的个数 cat $2 | #是目标文本文件的名称 tr -cs "[a-z][A-Z]" "[\n*]" | #将文本文件以一行一个单词的形式显示 tr A-Z a-z | #将单词的大写字母转为小写字母 sort | #对单词排序 uniq -c | #对排序好的单词列表统计每一个单词出现的次数 sort -k1nr -k2 |