Перейти к основному содержимому

Контроль потребления VRAM и GPU, доступ к веб-приложениям

Ключевые обновления в этом релизе:

  • Контроль потребления VRAM и GPU: в настройках ML-сервиса теперь можно ограничить объем VRAM, количество и процент использования GPU на один инстанс. Если задан лимит VRAM, в разделе Диагностика можно посмотреть график потребления.
  • Авторизация через Caila: настройка приложения позволяет отключить обязательную авторизацию и открыть доступ к веб-интерфейсу для внешних пользователей.
  • Массовый перезапуск сервисов: на страницу образа добавлена кнопка для перезапуска всех сервисов на базе этого образа.
  • Отказоустойчивость openai-proxy: добавлены дополнительные маршруты и провайдеры, чтобы снизить вероятность сбоев.
  • Детализированный аудит: для операций редактирования теперь фиксируются не только измененные поля, но и их новые значения.
  • Мобильная версия Multi Сhat: сравнивать ответы моделей можно даже с телефона.