PytorchOCR

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法。「OCR tool library based on Pytorch, supporting commonly used text detection and recognition algorithms」

Github stars Tracking Chart

PytorchOCR

简介

PytorchOCR旨在打造一套训练,推理,部署一体的OCR引擎库

添加微信z572459439或者nsnovio,然后进群讨论。备注ocr进群。

更新日志

  • 2022.02.24 更新:新增convnext作为backbone
  • 2022.01.28 更新:新增transformer作为backbone
  • 2022.01.07 更新:
  1. 检测模型新增backbone类型ghostnet
  2. 新增pse模型
  3. 新增dbnet的蒸馏版本
  4. 新增新版轻量化检测模型
  5. 修复一些bug
  • 2021.02.27 添加移动端识别模型文件、移动端DBNet模型文件
  • 2021.02.25 添加服务器端识别模型文件
  • 2021.02.09 添加DBNet模型,修改DBNet网络结构的fpn,inference时候的缩放及后处理
  • 2020.07.01 添加 添加新算法文档
  • 2020.06.29 添加检测的mb3和resnet50_vd预训练模型
  • 2020.06.25 检测模块的训练和预测ok
  • 2020.06.18 更新README
  • 2020.06.17 识别模块的训练和预测ok

todo list

  • crnn训练与python版预测
  • DB训练与python版预测
  • imagenet预训练模型
  • 服务器端识别模型文件
  • DB通用模型
  • 手机端部署
  • With Triton,推荐使用Savior

环境配置

需要的环境如下

  • pytorch 1.4+
  • torchvision 0.5+
  • gcc 4.9+ (pse,pan会用到)

快速安装环境

pip3 install -r requirements.txt

文档教程

文本检测算法

PytorchOCR开源的文本检测算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
预训练模型 ResNet50 服务器端 97.3M 3cmz
原始超轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M c9ko
新版 轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M 39ne
通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好 ResNet18 服务器端 47.2M r26k
预训练模型 swin_transformer 服务器端 240M se32
预训练模型 convnext 服务器端 113M 46is

文本识别算法

PytorchOCR开源的文本识别算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
原始超轻量模型,支持中英文、数字识别 MoblieNet 移动端 4.2M 7x9q
通用模型,支持中英文、数字识别 ResNet34 服务器端 106.4M sdnc

预训练模型下载地址

链接: https://pan.baidu.com/s/1uMWys5lQ5ZfhnaOCPBVqZw 密码: i9du

结果展示

检测

检测

贡献代码

我们非常欢迎你为PytorchOCR贡献代码,也十分感谢你的反馈。

相关仓库

Main metrics

Overview
Name With OwnerWenmuZhou/PytorchOCR
Primary LanguagePython
Program language (Language Count: 4)
Platform
License:
所有者活动
Created At2020-05-14 09:14:43
Pushed At2024-09-02 22:47:34
Last Commit At2022-06-28 15:54:50
Release Count0
用户参与
Stargazers Count1.4k
Watchers Count25
Fork Count311
Commits Count477
Has Issues Enabled
Issues Count186
Issue Open Count2
Pull Requests Count92
Pull Requests Open Count0
Pull Requests Close Count22
项目设置
Has Wiki Enabled
Is Archived
Is Fork
Is Locked
Is Mirror
Is Private