本文简绍了 HanLP 的使用方法,HanLP 是一系列模型与算法组成的 NLP 工具包,由大快搜索主导并完全开源,目前支持很多功能,项目主要是 Java 的,也支持 python,本文详细简绍 pyhanlp 的使用方法。
01
简介
HanLP 是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
HanLP 主要功能包括分词、词性标注、关键词提取、自动摘要、依存句法分析、命名实体识别、短语提取、拼音转换、简繁转换等等。
Github 地址:
官网:
02
实战
1. 安装
2. 分词和词性标注
3.依存句法分析
4.关键词提取
5.摘要提取
6. 感知机词法分析器
7. 中国人名识别
8. 音译人名识别
9. 短语提取
10. 拼音转换
11. 繁简转换
代码已上传: