Vision Transformer - Pytorch

在 Pytorch 中实现 Vision Transformer,这是一种在视觉分类中实现 SOTA 的简单方法,只需使用单个 transformer 编码器。「Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch.」

主要指標

概覽

名稱與所有者lucidrains/vit-pytorch
主編程語言Python
編程語言Python (語言數: 1)
平台Linux, Mac, Windows
許可證MIT License
發布數238
最新版本名稱1.14.5 (發布於 )
第一版名稱0.0.1 (發布於 )
創建於2020-10-03 22:47:24
推送於2025-10-24 21:00:44
最后一次提交
星數24259
關注者數158
派生數3417
提交數359
已啟用問題?
問題數274
打開的問題數130
拉請求數38
打開的拉請求數12
關閉的拉請求數11
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?
去到頂部