DeepSeek-V3

一个强大的 Mixture-of-Experts (MoE) 语言模型,共有 671B 个参数,每个标记有 37B 个激活参数。「A strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token.」

主要指标

概览

名称与所有者deepseek-ai/DeepSeek-V3
主编程语言Python
编程语言 (语言数: 1)
平台
许可证MIT License
发布数0
创建于2024-12-26 09:52:40
推送于2025-04-09 01:50:40
最后一次提交
星数96040
关注者数746
派生数15619
提交数66
已启用问题?
问题数515
打开的问题数79
拉请求数21
打开的拉请求数26
关闭的拉请求数97
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?
去到顶部