最近遇到一个特殊的难题,我想统计一下word文档中的关键词出现的次数,但我不想使用word软件中自带的检索功能,因为我想检索的关键词有点多,并且一个一个地统计太浪费人力了,于是想用#python#汇编语言,编写一个程序自动检索。
下面我们详细介绍一下如何使用python自动检索关键词出现次数,并依次输出。
首先,一般在针对word文档用python进行操作是有点难度的,于是将word文档中的内容复制到TXT文本文档中进行操作。这会容易一点点,我们将文档命名为,后缀就是txt。
word的内容,TXT的文档。进一步地,我们需要设置一个关键词列表,再依次检索列表中的内容就能自动更改关键词了。(以下是标准格式说明)
list=[第一个关键词,“第二个关键词”]
检索代码count={},是将count设置为字典变量,字典用{}标识。字典由索引(key)和它对应的值value组成。
file=open(.txt),txt=file.read(),意思是读入.txt文档。
foriinrange(len(list)):,构建一个循环,列表中的元素个数,就是循环的次数。
text=list[i],count_num=txt.count(text),count[list[i]]=count_num,list[i],这几行使用了count函数,可以统计变量text的值在txt文档中出现的次数,并将其输出给中间变量count_num,后将值传递给count[list[i]]。
file.close(),关闭对于.txt的读取。
运行这些代码后我们就得到了名为count的字典变量,并且索引是我们检索的关键词,值就是关键词在文档中的出现次数。
下一步的关键就是依次遍历count中的索引,并输出对应的值。
这里使用print(count),可以输出count变量中的值,但是输出的结果杂乱无章。
count变量输出结果我们使用foriincount.keys():print(i,count[i]),可以依次遍历count变量中的值,输出结果也很直观。
00:08后续也可以导入到excel中进行进一步地处理哦。
excel具体代码如下,以便copy(缺少list变量)
count={}
file=open(.txt)
txt=file.read()
foriinrange(len(list)):
text=list[i]
count_num=txt.count(text)
count[list[i]]=count_num
file.close()
foriincount.keys():
print(i,count[i])