新技能get用Python高效背单

北京中科白癜风医院圆白癜风抗白梦 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/
背景

作为一个程序员,经常需要阅读英文论文、文档、书籍。对于一些基础不好的同学来说,最主要的拦路虎是英语单词。计算机类文档不同于小说,其语法、句式都比较简单,可以说只要词汇量有了,阅读就很简单。

如果能在平时提高词汇量,那是最好不过了。鸡汤警告!你必须暗自努力,然后惊艳所有人!这句话打在这里没毛病吧,老铁。但无所侧重地背普通英语字典,恐怕效率并不高。不提前学习单词,直接上手阅读,遇到生词再查,效率也提升不起来。

这里介绍一个针对专业文档背单词的方法:把当前文档的所有单词,建立一个专属字典,先背诵这个字典,再去看书,一定能一目十行。

思路

总体思路是文件分词统计,查找字典,生成新字典。

?首先,有一个需要阅读的英文文档,给它分词,按照单词频率排序;?找一个已掌握的英语词汇表(四六级或考研等),把上文中的单词和本词汇表重复的项删除;?再找一个词汇量大的字典,在其中查找对应解释;?把结果存储到一个字典文件中。

得到的字典,就是这本书的专属字典了。业余背这个字典,相当于掌握了计算机专业英语。这个方法也适用于机械、电子等等任何专业英语的地方。

实现

下面,以Python神作《FluentPython》为例,用Python自带的库实现分词、统计功能。首先看下它的内容梗概。

FluentPythonCLEAR,CONCISE,ANDEFFECTIVEPROGRAMMINGLucianoRamalho......分词

首先来分词。

fromcollectionsimportCounterimportrect2=Counter()patt=re.


转载请注明:http://www.aierlanlan.com/grrz/325.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了