文字转语音配置
使用 TRTC TTS 配置
{"TTSType": "flow", // 【必填】固定为此值"VoiceId": "v-female-R2s4N9qJ", // 【必填】精品音色 ID /克隆音色 ID, 可选择不同音色, ID 库参考下方音色列表"Model": "flow_01_turbo", // 【必填】当前默认的 TTS 模型版本 (对应 Flash 版本)"Speed": 1.0, //【可选】调节语速 范围 [0.5-2.0],默认 1.0; 取值越大,语速越快"Volume": 1.0, // 【可选】调节音量 [0, 10] 默认值 1.0; 取值越大,音量越高"Pitch": 0, // 【可选】调节语调 [-12,12],默认值为 0; 其中 0 为原音色输出。取值越高语调越高"Language": "zh" //【可选】建议填写,目前支持填写zh(中文)、en(英文)、yue(粤语方言); 参数格式参考:(ISO 639-1)}
说明:
精品音色库
TRTC 语音合成精品音色库 Voice ID 请参考下方列表,您可以根据需求偏好选择音色进行配置。
音色名称 | 音色ID | 支持语言 | 语言ID |
威严男霸总 | v-male-Bk7vD3xP | 中文 | zh |
温柔姐姐 | v-female-R2s4N9qJ | 中文 | zh |
傲娇学姐 | v-female-m1KpW7zE | 中文 | zh |
夹子女生 | v-female-U8aT2yLf | 中文 | zh |
闲聊男声 | v-male-s5NqE0rZ | 中文 | zh |
自然男声 | v-male-W1tH9jVc | 中文 | zh |
客服小美(女) | female-kefu-xiaomei | 中文 | zh |
客服小心(女) | female-kefu-xiaoxin | 中文 | zh |
客服小悦(女) | female-kefu-xiaoyue | 中文 | zh |
客服小徐(男) | male-kefu-xiaoxu | 中文 | zh |
清晰女旁白 | v-female-p9Xy7Q1L | 美式英语 | en |
理性女讲解 | v-female-Z3x9LmQ2 | 美式英语 | en |
严谨男讲师 | v-male-A4b9KqP2 | 美式英语 | en |
权威男解读 | v-male-r7K2pQ9L | 美式英语 | en |
沉着男评审 | v-male-Q6p8ZxL3 | 美式英语 | en |
静心女教练 | v-female-T3s8BqL9 | 美式英语 | en |
温和男顾问 | v-male-P6q7LzD8 | 美式英语 | en |
内敛女播音 | v-female-M7k2PxL9 | 美式英语 | en |
淡然女配音 | v-female-S5n9QxJ4 | 美式英语 | en |
沉稳女配音 | v-female-T8m4WxP7 | 美式英语 | en |
深沉男评析 | v-male-D6p3KxN8 | 美式英语 | en |
温情女主持 | v-female-A9b3KfL2 | 美式英语 | en |
真挚女创作 | v-female-A7h2MxQ5 | 美式英语 | en |
温和男创作 | v-male-G4n7RxM3 | 美式英语 | en |
暖心男顾问 | v-male-H3p9LxK7 | 美式英语 | en |
真诚男主播 | v-male-R6n2MxT9 | 美式英语 | en |
自信女演员 | v-female-C8k4NxL6 | 美式英语 | en |
阳光男演讲 | v-male-L7m5QxP4 | 美式英语 | en |
理性男评论 | v-male-N4k8TxR7 | 美式英语 | en |
理智女旁白 | v-female-B7k5WxN4 | 美式英语 | en |
雅致女解说 | v-female-k3P8sL0Q | 中文-粤语方言 | yue |
沉稳男解说 | v-male-L4s7PqZ9 | 中文-粤语方言 | yue |
自主接入 TTS
若您选择自主接入 TTS,则需要您自行准备相关 TTS 服务账号或 API Key,不同服务商的配置方式可参考下面章节。
Azure TTS
{"TTSType": "azure", // 必填:String TTS 类型"SubscriptionKey": "xxxxxxxx", // 必填:String 订阅的 Key"Region": "southeastasia", // 必填:String 订阅的地区"VoiceName": "en-US-AmandaMultilingualNeural", // 必填:String 音色名称"Language": "en-US", // 必填:String 合成的语言"Rate": 1 // 选填:float 语速 0.5~2 默认为 1}
Cartesia TTS
{"TTSType": "cartesia", // 必填:String TTS 类型,"Model": "sonic-multilingual", // 必填 模型类型"APIKey": "eyxxxx",// 必填:获取的api密钥"VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0" // 必填 声音id https://play.cartesia.ai/}
ElevenLabs TTS
{"TTSType": "elevenlabs", // String 必填,TTS 类型,"Model": "eleven_turbo_v2_5", //必填,模型类型"APIKey": "eyxxxx", // 必填,API Key"VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0" // 音色ID 参考 https://elevenlabs.io/docs/api-reference/get-voices}
Tencent TTS
{"TTSType": "tencent", // String TTS 类型"AppId": "您的应用ID", // String 必填"SecretId": "您的密钥ID", // String 必填"SecretKey": "您的密钥Key", // String 必填"VoiceType": 101001, // Integer 必填,音色 ID,包括标准音色与精品音色,精品音色拟真度更高,价格不同于标准音色,请参见语音合成计费概述。完整的音色 ID 列表请参见语音合成音色列表。"Speed": 1.25, // float 非必填,语速,范围:[-2,6],分别对应不同语速: -2: 代表0.6倍 -1: 代表0.8倍 0: 代表1.0倍(默认) 1: 代表1.2倍 2: 代表1.5倍 6: 代表2.5倍 如果需要更细化的语速,可以保留小数点后 2 位,例如0.5/1.25/2.81等。 参数值与实际语速转换,可参考 语速转换"Volume": 5, // Integer 非必填,音量大小,范围:[0,10],分别对应11个等级的音量,默认值为0,代表正常音量。"PrimaryLanguage": 1, // Integer 可选 主要语言 1-中文(默认) 2-英文 3-日文"FastVoiceType": "xxxx" // 可选参数, 快速声音复刻的参数}
MiniMax TTS
{"TTSType": "minimax", // String TTS 类型,"Model": "speech-01-turbo", // 必填,模型型号"APIUrl": "https://api.minimax.chat/v1/t2a_v2", // 必填,接口地址"APIKey": "eyxxxx", // String 必填"GroupId": "181000000000000", // 必填,对应用户的账号的 group_id"VoiceType":"female-tianmei", // String 必填,请求的音色编号,对应 voice_id"Speed": 1.2 // Float 非必填,生成声音的语速,范围[0.5,2],默认值为1.0}
接口名 | T2A v2(语音生成) | T2A Pro(语音生成) | T2A(语音生成) | T2A Stream(流式语音生成) | T2A Stream(流式语音生成) |
模型 | speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo | speech-01、speech-02 | speech-01、speech-02 | speech-01 | speech-01 |
客户类型\限制类型 | RPM | RPM | RPM | RPM | CONN(最大并行运行任务数) |
免费用户 | 3 | 3 | 3 | 3 | 1 |
充值用户 | 20 | 20 | 20 | 20 | 3 |
自定义 TTS
{"TTSType": "custom", // String 必填"APIKey": "ApiKey", // String 必填 用来鉴权"APIUrl": "http://0.0.0.0:8080/stream-audio", // String,必填,TTS API URL"AudioFormat": "wav", // String, 非必填,期望输出的音频格式,如mp3, ogg_opus,pcm,wav,默认为 wav,目前只支持pcm和wav,"SampleRate": 16000, // Integer,非必填,音频采样率,默认为16000(16k),推荐值为16000"AudioChannel": 1, // Integer,非必填,音频通道数,取值:1 或 2 默认为1}