本书介绍
spaCy是一个免费的开源库,用于Python中的自然语言处理(NLP),具有许多内置功能。在NLP中处理和分析数据变得越来越流行。非结构化文本数据持续大规模生成,因此处理非结构化数据并从中获取关键信息非常重要,比如实体识别、事件抽取等。为此,需要以计算机可以理解的格式表示数据。NLP可以帮助做到这一点。
文末附本书最新免费pdf下载地址。
在本教程中,将学习:
1.NLP中的基本术语和概念是什么
2.如何在spaCy中实现这些概念
3.如何在spaCy中自定义和扩展内置功能
4.如何对文本进行基本的统计分析
5.如何创建管道来处理非结构化文本
6.如何解析句子并从中提取有意义的见解
什么是NLP和spaCy?
NLP是人工智能的一个子领域,