spaCy是一个建立在Python和Cython高级自然语言处理(NLP)最新研究基础上的库。从一开始,它就被设计为用于真实世界的应用--用于构建真实的产品和收集真实的洞察力。spaCy是世界上最快的句法解析器,根据独立的基准测试,它的准确率在1%以内。它的速度快得惊人,易于安装,并带有一个简单而富有成效的API。
软件特色
非破坏性标记化
指定实体的确认
预训练的统计模型和单词向量
迅猛的速度
强大的、经过严格评估的精度
简单的深度学习集成
语音部分标签
标签化依赖性解析
方便的字符串到哈希值映射
句法驱动的句子分割
内置的语法和NER的可视化工具。
高效的二进制序列化
Numpy数据数组导出
简单的模型包装和部署
支持50多种语言