PaddleOCR

将任何 PDF 或图像文档转化为结构化数据，供您的 AI 使用。这款强大而轻量级的 OCR 工具包，架起了图像/PDF 与大型语言模型之间的桥梁。支持 100 多种语言。『Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.』

官方网站

Github 资源库

概览

主要指标

概览

名称与所有者	PaddlePaddle/PaddleOCR
主编程语言	Python
编程语言	Python (语言数: 13)
平台
许可证	Apache License 2.0
发布数	26
最新版本名称	v3.3.1 (发布于 )
第一版名称	v1.1.0 (发布于 )
创建于	2020-05-08 18:38:16
推送于	2025-11-03 21:50:18
最后一次提交
星数	62457
关注者数	495
派生数	9220
提交数	6753
已启用问题?
问题数	10172
打开的问题数	199
拉请求数	3012
打开的拉请求数	35
关闭的拉请求数	698
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?