nlp4han

中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】

Github stars Tracking Chart

nlp4han

中文自然语言处理工具集。更多信息参见Wiki

功能特性

  • 断句
    • 基于规则的中文断句器
  • 分词
    • 基于字的最大熵中文分词器
    • 组合中文分词和词性标注器
  • 词性标注
    • 基准中文词性标注器
    • 单步基于词的最大熵中文词性标注器
    • 单步基于字的最大熵中文词性标注器
    • 组合中文分词和词性标注器
    • 基于HMM的中文词性标注器
  • N元语言模型
  • HMM模型
  • 命名实体识别
    • 基于字的命名实体识别
    • 基于分词的命名实体识别
    • 基于分词和词性标注的命名实体识别
  • 组块/浅层句法分析
    • 基于词的最大熵中文基本组块标注
    • 基于词和词性的最大熵中文基本组块标注
    • 组合中文词性标注和基本组块标注
    • 基于SVM的中文组块标注
  • 依存句法分析
    • 基于最大生成树MST和最大熵的依存句法分析
    • 基于转换的依存句法分析
  • 短语结构(成分)句法分析
    • 基于最大熵的短语结构(成分)句法分析
    • 基于CKY的PCFG短语结构(成分)句法分析
    • 中心词驱动的短语结构句法分析
    • 基于隐藏标记的非词汇化短语结构句法分析
  • 语义角色标注
    • 基于最大熵的语义角色标注
  • 指代消解
    • 基于Hobbs算法的指代消解
  • 情感分析
    • 基于朴素贝叶斯的文档情感分析
    • 基于规则和短语结构树的句子情感分析
  • GUI工具
    • 基于nlp4han功能实现的短语结构树编辑工具

更新日志

  • 2018.12.16, 基于Hobbs算法的指代消解
  • 2018.12, 基于隐藏标记的非词汇化短语结构句法分析
  • 2018.11, 集成短语结构树编辑工具到nlp4han-tools,并使用nlp4han的中文分词、词性标注和句法分析功能。
  • 2018.10, 基于SVM的中文组块标注
  • 2018.9, 中心词驱动的短语结构句法分析
  • 2018.7, 基于CKY的PCFG短语结构(成分)句法分析
  • 2018.6, 基于转换的依存句法分析
  • 2018.5, 基于朴素贝叶斯的文档情感分析, 基于规则和短语结构树的句子情感分析
  • 2018.3, 基于最大熵的语义角色标注
  • 2018.2, 基于最大熵的短语结构(成分)句法分析, HMM模型
  • 2018.1, 基于最大生成树MST和最大熵的依存句法分析
  • 2017.12, 组合中文词性标注和基本组块标注, N元语言模型
  • 2017.11, 基于词和词性的最大熵中文基本组块标注, 基于词的最大熵中文基本组块标注
  • 2017.10, 基于分词和词性标注的命名实体识别
  • 2017.9, 基于分词的命名实体识别, 基于字的命名实体识别
  • 2017.8, 基于HMM的中文词性标注器
  • 2017.7, 组合中文分词和词性标注器
  • 2017.6, 单步基于字的最大熵中文词性标注器
  • 2017.5, 单步基于词的最大熵中文词性标注器
  • 2017.4, 基准中文词性标注器
  • 2017.3, 组合中文分词和词性标注器
  • 2017.2, 基于字的最大熵中文分词器
  • 2016.12, 基于规则的中文断句器

Main metrics

Overview
Name With Ownerkidden/nlp4han
Primary LanguageJava
Program languageJava (Language Count: 2)
Platform
License:
所有者活动
Created At2017-06-29 08:32:52
Pushed At2019-01-18 12:02:31
Last Commit At2019-01-18 19:55:13
Release Count0
用户参与
Stargazers Count205
Watchers Count19
Fork Count55
Commits Count1k
Has Issues Enabled
Issues Count35
Issue Open Count11
Pull Requests Count153
Pull Requests Open Count0
Pull Requests Close Count24
项目设置
Has Wiki Enabled
Is Archived
Is Fork
Is Locked
Is Mirror
Is Private