Enterprise applications

企业级应用。「 Enterprise applications 」
  60.9k
大语言模型

vLLM

一种高吞吐量且内存高效的推理与服务引擎,专为大型语言模型(LLMs)设计。「A high-throughput and ...
Apache-2.0
Python
  5k
大语言模型

AutoGPTQ

基于 GPTQ 算法的易用型 LLM 量化工具包,配备用户友好型 API。「An easy-to-use LLMs qu...
去到顶部