Skip to main content
LibreChat is joining ClickHouse to power the open-source Agentic Data Stack šŸŽ‰ Learn more
LibreChat

Apple MLX

Configure o Apple MLX como um endpoint personalizado no LibreChat.

O Apple MLX serve modelos localmente em Apple silicon através de uma OpenAI-compatible API, para que você possa apontar o LibreChat para sua própria mÔquina.

Configuração

O servidor local MLX não autentica solicitações, portanto, a API key é apenas um espaço reservado. Aponte a baseURL para o seu servidor em execução. Adicione o endpoint em endpoints.custom no seu librechat.yaml:

    - name: "MLX"
      apiKey: "mlx"
      baseURL: "http://localhost:8080/v1/" 
      models:
        default: [
          "Meta-Llama-3-8B-Instruct-4bit"
          ]
        fetch: false # fetching list of models is not supported
      titleConvo: true
      titleModel: "current_model"
      summarize: false
      summaryModel: "current_model"
      modelDisplayLabel: "Apple MLX"
      addParams:
            max_tokens: 2000
            "stop": [
              "<|eot_id|>"
            ]

Notas

  • O servidor MLX executa um modelo por vez. Para servir mais de um modelo, execute uma instĆ¢ncia separada em uma porta diferente e adicione outro endpoint com sua própria baseURL.
  • A API Ć© rigorosa quanto a parĆ¢metros nĆ£o reconhecidos, portanto, mantenha addParams limitado a valores que o servidor aceita, como max_tokens e stop.

Como estĆ” este guia?

Nesta pƔgina