DeepSeek-V3

一个强大的 Mixture-of-Experts (MoE) 语言模型,共有 671B 个参数,每个标记有 37B 个激活参数。「A strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token.」

主要指標

概覽

名稱與所有者deepseek-ai/DeepSeek-V3
主編程語言Python
編程語言 (語言數: 1)
平台
許可證MIT License
發布數0
創建於2024-12-26 09:52:40
推送於2025-04-09 01:50:40
最后一次提交
星數96040
關注者數746
派生數15619
提交數66
已啟用問題?
問題數515
打開的問題數79
拉請求數21
打開的拉請求數26
關閉的拉請求數97
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?
去到頂部