Vision Transformer - Pytorch

在 Pytorch 中实现 Vision Transformer，这是一种在视觉分类中实现 SOTA 的简单方法，只需使用单个 transformer 编码器。「Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch.」

Github 资源库

概览

主要指标

概览

名称与所有者	lucidrains/vit-pytorch
主编程语言	Python
编程语言	Python (语言数: 1)
平台	Linux, Mac, Windows
许可证	MIT License
发布数	238
最新版本名称	1.14.5 (发布于 )
第一版名称	0.0.1 (发布于 )
创建于	2020-10-03 22:47:24
推送于	2025-10-24 21:00:44
最后一次提交
星数	24259
关注者数	158
派生数	3417
提交数	359
已启用问题?
问题数	274
打开的问题数	130
拉请求数	38
打开的拉请求数	12
关闭的拉请求数	11
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?