Feedback
Soniox

本文主要介绍如何在接口中配置 Soniox。
Soniox 专注于高精度、低延迟的多语言语音识别。其多语言模型可以处理代码切换场景——即说话人在单次对话中混用多种语言，且无需预先指定语言。若你是全球化或多语言语音 AI 应用，Soniox 是很好的选择。
使用方式
如需使用 Soniox 作为 STT 引擎，请在 StartAIConversation API 的 STTConfig 字段中传入以下 JSON：
// json — STTConfig
{
  "Language": "en",
  "VadSilenceTime": 1000,
  "CustomParam": "{\"STTType\":\"soniox\",\"ApiKey\":\"<your_soniox_api_key>\",\"Model\":\"stt-rt-v4\",\"LanguageHints\":[],\"Context\":{}}"
}
完整 STTConfig 参数参考，请参阅 STTConfig 配置指南。
参数参考
STTConfig 字段
以下字段属于 STTConfig 的一部分。完整定义请参阅 STTConfig。
字段
类型
必填
说明
Language
String
否
语言代码。请参阅 Soniox 语言支持。
VadSilenceTime
Integer
否
VAD 静音持续时间（毫秒）。请参阅 STTConfig。
CustomParam 字段
CustomParam 不属于标准 STTConfig 字段，仅在使用第三方 STT 引擎时需要，用于传递服务提供商的认证参数。
字段
类型
必填
说明
STTType
String
是
固定值："soniox"。
ApiKey
String
是
你的 Soniox API 密钥，请从 Soniox Console 获取。
Model
String
是
要使用的 Soniox 模型，如 "stt-rt-v4"。请参阅 Soniox 模型。
LanguageHints
List
否
可选的语言代码列表，用于优先识别。如果省略或为空，Soniox 将自动检测语言。请参阅 支持的语言。
Context
Object
否
可选的上下文对象，用于领域定制（术语、短语等）。请参阅 Soniox Context。
更多 Soniox 详情，请参阅 Soniox 文档。
下一步：配置 LLM 提供商﻿
字段	类型	必填	说明
`Language`	String	否	语言代码。请参阅 Soniox 语言支持。
`VadSilenceTime`	Integer	否	VAD 静音持续时间（毫秒）。请参阅 STTConfig。