TextGrapher

Text Content Grapher based on keyinfo extraction by NLP method。输入一篇文档,将文档进行关键信息提取,进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。

  • 所有者: liuhuanyong/TextGrapher
  • 平台:
  • 許可證:
  • 分類:
  • 主題:
  • 喜歡:
    0
      比較:

Github星跟蹤圖

TextGrapher

Text Content Grapher based on keyinfo extraction by NLP method。输入一篇文档,将文档进行关键信息提取,进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。

项目介绍

如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。 本项目将对这一问题进行尝试,采用的方法为:输入一篇文档,将文档进行关键信息提取,并进行结构化,并最终组织成图谱组织形式,形成对文章语义信息的图谱化展示。  

使用方式

from text_grapher import *
content = '你要分析的文本'
handler = CrimeMining()
handler.main(content)

结果保存在graph.html文件当中。  

事件举例

1) 中兴事件 
image

  1. 魏则西事件 
    image

  2. 雷洋事件 
    image

  3. 同学杀人事件 
    image

总结

1)如何用图谱和结构化的方式,即以简洁的方式对输入的文本内容进行最佳的语义表示是个难题。
2)本项目采用了高频词,关键词,命名实体识别,主谓宾短语识别等抽取方式,并尝试将三类信息进行图谱组织表示,这种表示方式是一种尝试。
3)命名实体识别以及关键信息抽取受限于NLP的性能,在算法和方式上还存在多处不足。

Question?

send mail to lhy_in_blcu@126.com
If any question about the project or me ,see https://liuhuanyong.github.io/

主要指標

概覽
名稱與所有者liuhuanyong/TextGrapher
主編程語言Python
編程語言Python (語言數: 1)
平台
許可證
所有者活动
創建於2018-07-25 07:30:37
推送於2021-10-20 03:16:44
最后一次提交2018-10-06 21:29:53
發布數0
用户参与
星數1.4k
關注者數26
派生數362
提交數8
已啟用問題?
問題數24
打開的問題數21
拉請求數0
打開的拉請求數1
關閉的拉請求數0
项目设置
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?