Feedback

Cartesia

本文主要介绍如何在接口中配置 Cartesia。
Cartesia 专为实时语音 AI 打造,提供超低延迟流式 TTS,输出自然度高。其 Sonic 模型支持多语言合成和音色混合。当端到端延迟至关重要时——例如每个毫秒都影响体验的交互式语音智能体——Cartesia 是出色的选择。

使用方式

如需使用 Cartesia 作为 TTS 引擎,请在 StartAIConversation API 的 TTSConfig 字段中传入以下 JSON:
// json — TTSConfig
{
"TTSType": "cartesia",
"Model": "sonic-3-2026-01-12",
"APIKey": "<your_cartesia_api_key>",
"VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0"
}
完整 TTSConfig 参数参考,请参阅 Text-to-Speech Configuration

参数参考

字段
类型
必填
说明
TTSType
String
固定值:"cartesia"
Model
String
Cartesia 模型名称(如 sonic-3-2026-01-12)。请参阅 Cartesia 模型
APIKey
String
你的 Cartesia API 密钥。请从 Cartesia Console 获取。
VoiceId
String
Voice ID。请在 Cartesia 音色库 中浏览音色。
更多 Cartesia 的详细信息,请参阅 Cartesia 文档