Vision Transformer - Pytorch

在 Pytorch 中实现 Vision Transformer，这是一种在视觉分类中实现 SOTA 的简单方法，只需使用单个 transformer 编码器。「Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch.」

Github 資源庫

概覽

主要指標

概覽

名稱與所有者	lucidrains/vit-pytorch
主編程語言	Python
編程語言	Python (語言數: 1)
平台	Linux, Mac, Windows
許可證	MIT License
發布數	238
最新版本名稱	1.14.5 (發布於 )
第一版名稱	0.0.1 (發布於 )
創建於	2020-10-03 22:47:24
推送於	2025-10-24 21:00:44
最后一次提交
星數	24259
關注者數	158
派生數	3417
提交數	359
已啟用問題?
問題數	274
打開的問題數	130
拉請求數	38
打開的拉請求數	12
關閉的拉請求數	11
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?