12.6k
自然语言处理

CLIP-as-service

利用 CLIP 对图像和句子进行可扩展的嵌入、推理和排序。(🏄 Scalable embedding, reasonin...
  22.3k
自然语言处理

LLaVA

[NeurIPS'23 Oral] 视觉指令调整 (LLaVA) 建立了 GPT-4V 级及以上的能力。([NeurIP...