Baidu PaddleHub LAC API 的 Go 调用实现(unofficial)

Baidu PaddleHub LAC 能整体性地完成中文分词、词性标注、专名识别任务。分词效果好,是一个很不错的词法分析工具。目前官方只提供了 Python API 接口,在 Go 语言中进行调用则有点麻烦,在尝试了 go-python 等 CPython 扩展或 gopy 这类的 Python interprete 之后还是放弃了,就自己编写了一个小工具来实现,能使用,功能也有限。期待官方能发布正式的 Go API 接口。

原理很简单,通过 Go 的"os/exec"库实现对 LAC 的命令行调用、执行,对返回的结果进行解包处理,然后输出。代码repo:https://github.com/vulcangz/golac

需要注意的是,因为 LAC 是采用命令行执行方式,这样从 stdout 读取的时候需要考虑操作系统的语言编码,所以在 decode 这一部分需要根据自身情况进行处理。

参考(相关链接):

PaddleHub LAC(简介): https://www.paddlepaddle.org.cn/hubdetail?name=lac...

PaddleHub repo(代码): https://github.com/PaddlePaddle/PaddleHub

Like:
0
To the top