本文简绍了 HanLP 的使用方法,HanLP 是一系列模型与算法组成的 NLP 工具包,由大快搜索主导并完全开源,目前支持很多功能,项目主要是 Java 的,也支持 python,本文详细简绍 pyhanlp 的使用方法。

01

简介

HanLP 是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

HanLP 主要功能包括分词、词性标注、关键词提取、自动摘要、依存句法分析、命名实体识别、短语提取、拼音转换、简繁转换等等。

Github 地址:

官网:

02

实战

1. 安装



2. 分词和词性标注



3.依存句法分析



4.关键词提取



5.摘要提取



6. 感知机词法分析器



7. 中国人名识别



8. 音译人名识别



9. 短语提取



10. 拼音转换



11. 繁简转换




代码已上传: