Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack šŸŽ‰ Learn more
LibreChat

Vultr Cloud Inference

Configure o Vultr Cloud Inference como um endpoint personalizado no LibreChat.

O Vultr Cloud Inference disponibiliza modelos abertos por meio de uma API compatĆ­vel com OpenAI.

Obtenha uma API key

Crie uma chave a partir do console do Vultr Cloud Inference. Adicione-a ao seu arquivo .env:

VULTRINFERENCE_TOKEN=your-api-key

Configuração

Adicione o endpoint em endpoints.custom no seu librechat.yaml:

    - name: 'Vultr Cloud Inference'
      apiKey: '${VULTRINFERENCE_TOKEN}'
      baseURL: 'https://api.vultrinference.com/v1/chat/completions'
      models:
        default: [
          "llama2-7b-chat-Q5_K_M.gguf",
          "llama2-13b-chat-Q5_K_M.gguf",
          "mistral-7b-Q5_K_M.gguf",
          "zephyr-7b-beta-Q5_K_M.gguf",
        ]
        fetch: true
      titleConvo: true
      titleModel: "llama2-7b-chat-Q5_K_M.gguf"
      modelDisplayLabel: "Vultr Cloud Inference"

Notas

  • O exemplo lista quatro modelos otimizados para chat, atualizados pela Ćŗltima vez em 28 de junho de 2024.
  • Apenas llama2-7b-chat-Q5_K_M.gguf suporta atualmente a geração de tĆ­tulos.

Como estĆ” este guia?