斯坦福发布重磅NLP工具包Stanfor

新智元报道

来源:stanfordnlp.github.io

编辑:肖琴

斯坦福团队最新发布一个NLP任务的软件包StanfordNLP,通过Python接口为53种语言提供标记、依存句法分析等NLP任务的重要工具。

今天,斯坦福NLP团队发布一个重磅NLP工具包:StanfordNLP。

StanfordNLP是一个软件包组合,包括斯坦福团队在CoNLL的通用依存解析(UniversalDependencyParsing)共享任务上使用的软件包,以及斯坦福CoreNLP软件的官方Python接口。

StanfordNLP支持包括阿拉伯语、中文、英语等53种语言(全部语言列表见文末)。

除了从CoreNLP继承的功能外,StanfordNLP还包含将一串文本转换成句子和单词列表,生成这些单词的基本形式、它们的词类和形态学特征的工具,以及超过70种语言的句法结构。

这个软件包采用高准确性的神经网络组件构建,这些组件支持用户使用自己的注释数据进行高效的训练和评估。这些模块构建在PyTorch上。

StanfordNLP具有以下特征:

本地Python实现,只需最少的设置工作;用于稳健的文本分析的完整神经网络pipeline,包括tokenization、多词标记(MWT)扩展、外延化、词类(POS)和形态学特征标记,以及依存句法分析(dependencyparse);支持73个treebank中53种(人类)语言的预训练神经模型;稳定、官方维护的转到CoreNLP的Python接口。

获取


转载请注明:http://www.aierlanlan.com/rzdk/5014.html

  • 上一篇文章:
  •   
  • 下一篇文章: