DeBERTa

该资源库是 DeBERTa: 带有分散注意力机制的解码增强的 BERT 和 DeBERTa V3:使用 ELECTRA 式预训练和梯度分解嵌入共享改进 DeBERTa 的官方实现。「This repository is the official implementation of DeBERTa: Decoding-enhanced BERT with Disentangled Attention and DeBERTa V3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing」

主要指标

概览

名称与所有者microsoft/DeBERTa
主编程语言Python
编程语言Python (语言数: 3)
平台
许可证MIT License
发布数1
最新版本名称v0.1.8 (发布于 )
第一版名称v0.1.8 (发布于 )
创建于2020-06-08 15:57:14
推送于2023-09-29 11:14:26
最后一次提交2023-03-25 03:22:59
星数2100
关注者数41
派生数233
提交数55
已启用问题?
问题数126
打开的问题数67
拉请求数22
打开的拉请求数8
关闭的拉请求数2
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?
去到顶部