TextGrapher

Text Content Grapher based on keyinfo extraction by NLP method。输入一篇文档,将文档进行关键信息提取,进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。

  • 所有者: liuhuanyong/TextGrapher
  • 平台:
  • 许可证:
  • 分类:
  • 主题:
  • 喜欢:
    0
      比较:

Github星跟踪图

TextGrapher

Text Content Grapher based on keyinfo extraction by NLP method。输入一篇文档,将文档进行关键信息提取,进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。

项目介绍

如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。 本项目将对这一问题进行尝试,采用的方法为:输入一篇文档,将文档进行关键信息提取,并进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。  

使用方式

from text_grapher import *
content = '你要分析的文本'
handler = CrimeMining()
handler.main(content)

结果保存在graph.html文件当中。  

事件举例

1) 中兴事件 
image

  1. 魏则西事件 
    image

  2. 雷洋事件 
    image

  3. 同学杀人事件 
    image

总结

1)如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。
2)本项目采用了高频词,关键词,命名实体识别,主谓宾短语识别等抽取方式,并尝试将三类信息进行图谱组织表示,这种表示方式是一种尝试。
3)命名实体识别以及关键信息抽取受限于NLP的性能,在算法和方式上还存在多处不足。

Question?

send mail to lhy_in_blcu@126.com
If any question about the project or me ,see https://liuhuanyong.github.io/

主要指标

概览
名称与所有者liuhuanyong/TextGrapher
主编程语言Python
编程语言Python (语言数: 1)
平台
许可证
所有者活动
创建于2018-07-25 07:30:37
推送于2021-10-20 03:16:44
最后一次提交2018-10-06 21:29:53
发布数0
用户参与
星数1.4k
关注者数26
派生数362
提交数8
已启用问题?
问题数24
打开的问题数21
拉请求数0
打开的拉请求数1
关闭的拉请求数0
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?