DeepSeek-V3

一个强大的 Mixture-of-Experts (MoE) 语言模型,共有 671B 个参数,每个标记有 37B 个激活参数。「A strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token.」

主要指標

概覽

名稱與所有者deepseek-ai/DeepSeek-V3
主編程語言Python
編程語言 (語言數: 1)
平台
許可證MIT License
發布數1
最新版本名稱v1.0.0 (發布於 )
第一版名稱v1.0.0 (發布於 )
創建於2024-12-26 17:52:40
推送於2025-08-28 11:24:37
最后一次提交
星數100073
關注者數751
派生數16319
提交數73
已啟用問題?
問題數638
打開的問題數31
拉請求數25
打開的拉請求數43
關閉的拉請求數98
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?
去到頂部