DeepSeek-V3

一个强大的 Mixture-of-Experts (MoE) 语言模型,共有 671B 个参数,每个标记有 37B 个激活参数。「A strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token.」

主要指標

概覽

名稱與所有者deepseek-ai/DeepSeek-V3
主編程語言Python
編程語言 (語言數: 1)
平台
許可證MIT License
發布數1
最新版本名稱v1.0.0 (發布於 )
第一版名稱v1.0.0 (發布於 )
創建於2024-12-26 09:52:40
推送於2025-06-27 08:46:37
最后一次提交
星數98347
關注者數739
派生數16021
提交數68
已啟用問題?
問題數574
打開的問題數38
拉請求數21
打開的拉請求數34
關閉的拉請求數90
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?
去到頂部