Контроль потребления VRAM и GPU, доступ к веб-приложениям
Ключевые обновления в этом релизе:
- Контроль потребления VRAM и GPU: в настройках ML-сервиса теперь можно ограничить объем VRAM, количество и процент использования GPU на один инстанс. Если задан лимит VRAM, в разделе Диагностика можно посмотреть график потребления.
- Авторизация через Caila: настройка приложения позволяет отключить обязательную авторизацию и открыть доступ к веб-интерфейсу для внешних пользователей.
- Массовый перезапуск сервисов: на страницу образа добавлена кнопка для перезапуска всех сервисов на базе этого образа.
- Отказоустойчивость openai-proxy: добавлены дополнительные маршруты и провайдеры, чтобы снизить вероятность сбоев.
- Детализированный аудит: для операций редактирования теперь фиксируются не только измененные поля, но и их новые значения.
- Мобильная версия Multi Сhat: сравнивать ответы моделей можно даже с телефона.