Vision Transformer - Pytorch

在 Pytorch 中实现 Vision Transformer,这是一种在视觉分类中实现 SOTA 的简单方法,只需使用单个 transformer 编码器。「Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch.」

主要指标

概览

名称与所有者lucidrains/vit-pytorch
主编程语言Python
编程语言Python (语言数: 1)
平台Linux, Mac, Windows
许可证MIT License
发布数219
最新版本名称1.10.1 (发布于 )
第一版名称0.0.1 (发布于 )
创建于2020-10-03 22:47:24
推送于2025-03-05 18:50:39
最后一次提交
星数23085
关注者数159
派生数3313
提交数341
已启用问题?
问题数270
打开的问题数128
拉请求数36
打开的拉请求数11
关闭的拉请求数11
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?
去到顶部