Feedback

Soniox

本文主要介绍如何在接口中配置 Soniox。
Soniox 专注于高精度、低延迟的多语言语音识别。其多语言模型可以处理代码切换场景——即说话人在单次对话中混用多种语言,且无需预先指定语言。若你是全球化或多语言语音 AI 应用,Soniox 是很好的选择。

使用方式

如需使用 Soniox 作为 STT 引擎,请在 StartAIConversation API 的 STTConfig 字段中传入以下 JSON:
// json — STTConfig
{
"Language": "en",
"VadSilenceTime": 1000,
"CustomParam": "{\"STTType\":\"soniox\",\"ApiKey\":\"<your_soniox_api_key>\",\"Model\":\"stt-rt-v4\",\"LanguageHints\":[],\"Context\":{}}"
}
完整 STTConfig 参数参考,请参阅 STTConfig 配置指南

参数参考

STTConfig 字段

以下字段属于 STTConfig 的一部分。完整定义请参阅 STTConfig
字段
类型
必填
说明
Language
String
语言代码。请参阅 Soniox 语言支持
VadSilenceTime
Integer
VAD 静音持续时间(毫秒)。请参阅 STTConfig

CustomParam 字段

CustomParam 不属于标准 STTConfig 字段,仅在使用第三方 STT 引擎时需要,用于传递服务提供商的认证参数。
字段
类型
必填
说明
STTType
String
固定值:"soniox"
ApiKey
String
你的 Soniox API 密钥,请从 Soniox Console 获取。
Model
String
要使用的 Soniox 模型,如 "stt-rt-v4"。请参阅 Soniox 模型
LanguageHints
List
可选的语言代码列表,用于优先识别。如果省略或为空,Soniox 将自动检测语言。请参阅 支持的语言
Context
Object
可选的上下文对象,用于领域定制(术语、短语等)。请参阅 Soniox Context
更多 Soniox 详情,请参阅 Soniox 文档
下一步:配置 LLM 提供商