Vision Transformer - Pytorch

在 Pytorch 中实现 Vision Transformer,这是一种在视觉分类中实现 SOTA 的简单方法,只需使用单个 transformer 编码器。「Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch.」

主要指标

概览

名称与所有者lucidrains/vit-pytorch
主编程语言Python
编程语言Python (语言数: 1)
平台Linux, Mac, Windows
许可证MIT License
发布数238
最新版本名称1.14.5 (发布于 )
第一版名称0.0.1 (发布于 )
创建于2020-10-03 22:47:24
推送于2025-10-24 21:00:44
最后一次提交
星数24259
关注者数158
派生数3417
提交数359
已启用问题?
问题数274
打开的问题数130
拉请求数38
打开的拉请求数12
关闭的拉请求数11
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?
去到顶部