Перейти к содержанию

LLM (Large Language Model)

Сервер

  • Адрес: 85.29.137.199:5010/v1
  • Модель: gemma-3-12b-it-FP8-Dynamic
  • GPU: 2x RTX 3090
  • API: OpenAI-совместимый

Назначение

Суммаризация транскрипций звонков — краткое изложение разговора.

Конфигурация (backend .env)

LLM_API_URL=http://85.29.137.199:5010/v1
LLM_MODEL=gemma-3-12b-it-FP8-Dynamic

Сетевой доступ

LLM-сервис доступен с web-1/web-2 через lb. Прямого доступа с mon-1 и других внутренних серверов нет — исходящий трафик в интернет только через lb-1/lb-2.