这个项目是一个基本包.封装了大多数nlp项目中常用工具
nlp-lang
这个项目是一个基本包.封装了大多数nlp项目中常用工具
Github星跟踪图
主要指标
- 概览
-
名称与所有者 NLPchina/nlp-lang 主编程语言 Java 编程语言 Java (语言数: 1) 平台 许可证 Apache License 2.0 - 所有者活动
-
创建于 2014-03-30 13:38:45 推送于 2024-04-18 02:16:29 最后一次提交 2024-04-18 10:16:29 发布数 2 最新版本名称 1.7.6 (发布于 ) 第一版名称 1.7.3 (发布于 ) - 用户参与
-
星数 1.5k 关注者数 148 派生数 497 提交数 189 已启用问题? 问题数 40 打开的问题数 14 拉请求数 10 打开的拉请求数 1 关闭的拉请求数 2 - 项目设置
-
已启用Wiki? 已存档? 是复刻? 已锁定? 是镜像? 是私有?
nlp-lang
文档地址:http://www.nlpcn.org/docs/7
部分演示:http://www.nlpcn.org/demo
##MAVEN
<dependencies>
<dependency>
<groupId>org.nlpcn</groupId>
<artifactId>nlp-lang</artifactId>
<version>1.7.6</version>
</dependency>
</dependencies>
这个项目是一个基本包.封装了大多数nlp项目中常用工具
工具
- √ 词语标准化
- √ tire树结构
- √ 双数组tire树
- √ 文本断句
- √ html标签清理
- √ Viterbi算法增加
组件
- √ 汉字转拼音
- √ 简繁体转换
- √ bloomfilter
- √ 指纹去重
- √ SimHash文章相似度计算
- √ 词共现统计
- √ 基于内存的搜索提示
- √ WordWeight词频统计,词idf统计,词类别相关度统计