如何用python自动检索文档中的关键词

最近遇到一个特殊的难题,我想统计一下word文档中的关键词出现的次数,但我不想使用word软件中自带的检索功能,因为我想检索的关键词有点多,并且一个一个地统计太浪费人力了,于是想用#python#汇编语言,编写一个程序自动检索。

下面我们详细介绍一下如何使用python自动检索关键词出现次数,并依次输出。

首先,一般在针对word文档用python进行操作是有点难度的,于是将word文档中的内容复制到TXT文本文档中进行操作。这会容易一点点,我们将文档命名为,后缀就是txt。

word的内容,TXT的文档。

进一步地,我们需要设置一个关键词列表,再依次检索列表中的内容就能自动更改关键词了。(以下是标准格式说明)

list=[第一个关键词,“第二个关键词”]

检索代码

count={},是将count设置为字典变量,字典用{}标识。字典由索引(key)和它对应的值value组成。

file=open(.txt),txt=file.read(),意思是读入.txt文档。

foriinrange(len(list)):,构建一个循环,列表中的元素个数,就是循环的次数。

text=list[i],count_num=txt.count(text),count[list[i]]=count_num,list[i],这几行使用了count函数,可以统计变量text的值在txt文档中出现的次数,并将其输出给中间变量count_num,后将值传递给count[list[i]]。

file.close(),关闭对于.txt的读取。

运行这些代码后我们就得到了名为count的字典变量,并且索引是我们检索的关键词,值就是关键词在文档中的出现次数。

下一步的关键就是依次遍历count中的索引,并输出对应的值。

这里使用print(count),可以输出count变量中的值,但是输出的结果杂乱无章。

count变量输出结果

我们使用foriincount.keys():print(i,count[i]),可以依次遍历count变量中的值,输出结果也很直观。

00:08

后续也可以导入到excel中进行进一步地处理哦。

excel

具体代码如下,以便copy(缺少list变量)

count={}

file=open(.txt)

txt=file.read()

foriinrange(len(list)):

text=list[i]

count_num=txt.count(text)

count[list[i]]=count_num

file.close()

foriincount.keys():

print(i,count[i])




转载请注明:http://www.aierlanlan.com/rzgz/1428.html

  • 上一篇文章:
  •   
  • 下一篇文章: