Feedback

Custom TTS

本文主要介绍如何在接口中配置自定义 TTS。
通过实现 TRTC 自定义流式协议接入自有 TTS 引擎。这一选项让你完全掌控合成管线——可以使用自有模型、本地部署或任何未原生支持的第三方服务。如果你有特殊音色需求或需要集成内部 TTS 解决方案,请选择此方案。

使用方式

如需使用自定义 TTS 引擎,请在 StartAIConversation API 的 TTSConfig 字段中传入以下 JSON。你的 TTS 服务必须实现 TRTC 自定义 TTS 流式协议:
// json — TTSConfig
{
"TTSType": "custom",
"APIKey": "<your_api_key>",
"APIUrl": "http://0.0.0.0:8080/stream-audio",
"AudioFormat": "wav",
"SampleRate": 16000,
"AudioChannel": 1
}
完整 TTSConfig 参数参考,请参阅 Text-to-Speech Configuration

参数参考

字段
类型
必填
说明
TTSType
String
固定值:"custom"
APIKey
String
用于 TTS 服务认证的 API 密钥。
APIUrl
String
你的 TTS 服务端点 URL。
AudioFormat
String
输出音频格式。当前支持:pcmwav。默认值:wav
SampleRate
Integer
音频采样率。默认值:16000(16 kHz)。推荐:16000。
AudioChannel
Integer
音频通道数。1(单声道)或 2(立体声)。默认值:1。
说明:
自定义 TTS 协议规范请参阅 自定义 TTS 协议