PytorchOCR

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法。「OCR tool library based on Pytorch, supporting commonly used text detection and recognition algorithms」

  • 所有者: WenmuZhou/PytorchOCR
  • 平台: Windows,Linux,Mac
  • 许可证:
  • 分类:
  • 主题:
  • 喜欢:
    0
      比较:

Github星跟踪图

PytorchOCR

简介

PytorchOCR旨在打造一套训练,推理,部署一体的OCR引擎库

添加微信z572459439或者nsnovio,然后进群讨论。备注ocr进群。

更新日志

  • 2022.02.24 更新:新增convnext作为backbone
  • 2022.01.28 更新:新增transformer作为backbone
  • 2022.01.07 更新:
  1. 检测模型新增backbone类型ghostnet
  2. 新增pse模型
  3. 新增dbnet的蒸馏版本
  4. 新增新版轻量化检测模型
  5. 修复一些bug
  • 2021.02.27 添加移动端识别模型文件、移动端DBNet模型文件
  • 2021.02.25 添加服务器端识别模型文件
  • 2021.02.09 添加DBNet模型,修改DBNet网络结构的fpn,inference时候的缩放及后处理
  • 2020.07.01 添加 添加新算法文档
  • 2020.06.29 添加检测的mb3和resnet50_vd预训练模型
  • 2020.06.25 检测模块的训练和预测ok
  • 2020.06.18 更新README
  • 2020.06.17 识别模块的训练和预测ok

todo list

  • crnn训练与python版预测
  • DB训练与python版预测
  • imagenet预训练模型
  • 服务器端识别模型文件
  • DB通用模型
  • 手机端部署
  • With Triton,推荐使用Savior

环境配置

需要的环境如下

  • pytorch 1.4+
  • torchvision 0.5+
  • gcc 4.9+ (pse,pan会用到)

快速安装环境

pip3 install -r requirements.txt

文档教程

文本检测算法

PytorchOCR开源的文本检测算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
预训练模型 ResNet50 服务器端 97.3M 3cmz
原始超轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M c9ko
新版 轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M 39ne
通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好 ResNet18 服务器端 47.2M r26k
预训练模型 swin_transformer 服务器端 240M se32
预训练模型 convnext 服务器端 113M 46is

文本识别算法

PytorchOCR开源的文本识别算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
原始超轻量模型,支持中英文、数字识别 MoblieNet 移动端 4.2M 7x9q
通用模型,支持中英文、数字识别 ResNet34 服务器端 106.4M sdnc

预训练模型下载地址

链接: https://pan.baidu.com/s/1uMWys5lQ5ZfhnaOCPBVqZw 密码: i9du

结果展示

检测

检测

贡献代码

我们非常欢迎你为PytorchOCR贡献代码,也十分感谢你的反馈。

相关仓库

主要指标

概览
名称与所有者WenmuZhou/PytorchOCR
主编程语言Python
编程语言 (语言数: 4)
平台
许可证
所有者活动
创建于2020-05-14 09:14:43
推送于2024-09-02 22:47:34
最后一次提交2022-06-28 15:54:50
发布数0
用户参与
星数1.4k
关注者数25
派生数311
提交数477
已启用问题?
问题数186
打开的问题数2
拉请求数92
打开的拉请求数0
关闭的拉请求数22
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?