PaddleOCR

将任何 PDF 或图像文档转化为结构化数据,供您的 AI 使用。这款强大而轻量级的 OCR 工具包,架起了图像/PDF 与大型语言模型之间的桥梁。支持 100 多种语言。『Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.』

主要指标

概览

名称与所有者PaddlePaddle/PaddleOCR
主编程语言Python
编程语言Python (语言数: 13)
平台
许可证Apache License 2.0
发布数26
最新版本名称v3.3.1 (发布于 )
第一版名称v1.1.0 (发布于 )
创建于2020-05-08 18:38:16
推送于2025-11-03 21:50:18
最后一次提交
星数62457
关注者数495
派生数9220
提交数6753
已启用问题?
问题数10172
打开的问题数199
拉请求数3012
打开的拉请求数35
关闭的拉请求数698
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?
去到顶部