LLM (Large Language Model)

Сервер

Адрес: 85.29.137.199:5010/v1
Модель: gemma-3-12b-it-FP8-Dynamic
GPU: 2x RTX 3090
API: OpenAI-совместимый

Назначение

Суммаризация транскрипций звонков — краткое изложение разговора.

Конфигурация (backend .env)

LLM_API_URL=http://85.29.137.199:5010/v1
LLM_MODEL=gemma-3-12b-it-FP8-Dynamic

Сетевой доступ

LLM-сервис доступен с web-1/web-2 через lb. Прямого доступа с mon-1 и других внутренних серверов нет — исходящий трафик в интернет только через lb-1/lb-2.