Перейти к содержанию

TTS (Text-to-Speech)

Сервер

  • Адрес: 195.245.99.185:7860 (Gradio API)
  • Модель: Fish-Speech
  • Чекпоинт PROD: kz-10k

Языки

  • Русский: базовая модель fish-speech-1.5
  • Казахский: файнтюн kz-10k

Интеграция с CallBox

  1. Пользователь вводит текст приветствия в UI
  2. Backend вызывает Gradio API: voice="female"
  3. WAV конвертируется: 8000 Hz, mono, PCM 16-bit (ffmpeg, loudnorm)
  4. Файл сохраняется в /var/lib/asterisk/sounds/callbox/
  5. Файл синхронизируется на voip-1 и voip-2 через SCP

Параметры генерации

temperature: 0.7
top_p: 0.7
repetition_penalty: 1.2
max_new_tokens: 1024

Ограничения: не использовать temperature меньше 0.7 (зацикливание). Всегда использовать reference_audio.

Конфигурация (backend .env)

TTS_API_URL=http://195.245.99.185:7860
TTS_API_USER=user
TTS_API_PASSWORD=medvoicegeneration328

Сетевой доступ

TTS-сервис доступен с web-1/web-2 через lb. Прямого доступа с mon-1 и других внутренних серверов нет.

Статус (проверено 2026-02-12): работает, используется CallBox.