nlp-lang

这个项目是一个基本包.封装了大多数nlp项目中常用工具

  • 所有者: NLPchina/nlp-lang
  • 平台:
  • 許可證: Apache License 2.0
  • 分類:
  • 主題:
  • 喜歡:
    0
      比較:

Github星跟蹤圖

这个项目是一个基本包.封装了大多数nlp项目中常用工具

主要指標

概覽
名稱與所有者NLPchina/nlp-lang
主編程語言Java
編程語言Java (語言數: 1)
平台
許可證Apache License 2.0
所有者活动
創建於2014-03-30 13:38:45
推送於2024-04-18 02:16:29
最后一次提交2024-04-18 10:16:29
發布數2
最新版本名稱1.7.6 (發布於 )
第一版名稱1.7.3 (發布於 )
用户参与
星數1.5k
關注者數148
派生數497
提交數189
已啟用問題?
問題數40
打開的問題數14
拉請求數10
打開的拉請求數1
關閉的拉請求數2
项目设置
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?

nlp-lang

1.X Build Status
sourcegraph

文档地址:http://www.nlpcn.org/docs/7
部分演示:http://www.nlpcn.org/demo

##MAVEN

<dependencies>
    <dependency>
        <groupId>org.nlpcn</groupId>
        <artifactId>nlp-lang</artifactId>
        <version>1.7.6</version>
    </dependency>
</dependencies>

这个项目是一个基本包.封装了大多数nlp项目中常用工具

工具

  • √ 词语标准化
  • √ tire树结构
  • √ 双数组tire树
  • √ 文本断句
  • √ html标签清理
  • √ Viterbi算法增加

组件

  • √ 汉字转拼音
  • √ 简繁体转换
  • √ bloomfilter
  • √ 指纹去重
  • √ SimHash文章相似度计算
  • √ 词共现统计
  • √ 基于内存的搜索提示
  • √ WordWeight词频统计,词idf统计,词类别相关度统计