nlp4go:使用GoLang进行自然语言处理的基本库和实用程序
nlp4go
注意:此解决方案不再开发。 进一步的开发是在NDA下完成的,无法发布
nlp4go的想法是为研究人员和开发人员提供一种基于go-lang的快速nlp工具包,该工具包提供了NLTK和其他NPL工具包的最常用功能,但具有可用于生产的计算性能。 可以在并行模式下执行的事情(例如独立句子的POS标记)应在go-routines中并行处理,以有效利用CPU内核。
当前支持的语言
英语
俄语<已计划
实施总计划
令牌生成器
树库
正则表达式
分裂
研究替代方案
POS标记器
感知器
字符串抽象可改善unicode的性能
与正则表达式的兼容性
unicode字符串的O(1)len()操作
以字节和字符为单位
NER支持
解析中
我们需要一套完整的规则来进行语法分析
语法解析// ShiftReudce
依赖解析//汉尼拔港的Cython版本
WordNet界面
存储库结构在习惯上应类似