TTS (Text-to-Speech)
Сервер
- Адрес: 195.245.99.185:7860 (Gradio API)
- Модель: Fish-Speech
- Чекпоинт PROD: kz-10k
Языки
- Русский: базовая модель fish-speech-1.5
- Казахский: файнтюн kz-10k
Интеграция с CallBox
- Пользователь вводит текст приветствия в UI
- Backend вызывает Gradio API: voice="female"
- WAV конвертируется: 8000 Hz, mono, PCM 16-bit (ffmpeg, loudnorm)
- Файл сохраняется в /var/lib/asterisk/sounds/callbox/
- Файл синхронизируется на voip-1 и voip-2 через SCP
Параметры генерации
temperature: 0.7
top_p: 0.7
repetition_penalty: 1.2
max_new_tokens: 1024
Ограничения: не использовать temperature меньше 0.7 (зацикливание). Всегда использовать reference_audio.
Конфигурация (backend .env)
TTS_API_URL=http://195.245.99.185:7860
TTS_API_USER=user
TTS_API_PASSWORD=medvoicegeneration328
Сетевой доступ
TTS-сервис доступен с web-1/web-2 через lb. Прямого доступа с mon-1 и других внутренних серверов нет.
Статус (проверено 2026-02-12): работает, используется CallBox.