Перейти к основному содержимому

LLM из Hugging Face

На платформе Caila вы можете развернуть любую языковую модель из Hugging Face — быстро и без необходимости писать код. Такую возможность предоставляет сервис-прототип vllm-prototype.

Как это работает:

  1. Выберите подходящий сервер с почасовой оплатой.
  2. Склонируйте сервис из прототипа и укажите модель в настройках.
  3. Запустите сервис.

Всё готово! Вы можете отправлять запросы к LLM через стандартные интерфейсы Caila: Predict API и OpenAI adapter.

Тестируйте, исследуйте и внедряйте языковые модели без лишних трудозатрат!