Latest posts

开源项目趋势周刊第224期(20241229)

"星"推荐:gImageReader 是 tesseract-ocr 的一个简单 Gtk/Qt 前端。特性:1)支持从磁盘、扫描设备、剪贴板和屏幕截图导入 PDF 文档和图像。2)一次性处理多个图像和文档。3)手动或自动识别区域定义。4)识别纯文本或 hOCR 文档。5)识别的文本直接显示在图像旁边。6)对识别的文本进行后处理,包括拼写检查。7)从 hOCR 文档生成 PDF 文档。8)支持国际语言: Weblate, Desktop entry。——出自《gImageReader》


Open Source Project Hot List Issue 86

星推荐:Goobi 允许你对可自由定义的生产流程进行建模、管理和监督,许多机构每天都在使用它来处理创建数字图书馆的所有步骤。这些步骤包括从图书馆目录中导入数据,扫描和基于内容的索引,以及以流行的标准化格式进行结果的数字展示和交付。—出自《Goobi workflow》


To the top