Feedback

Azure

本文主要介绍如何在接口中配置 Azure STT。
Microsoft Azure Speech Services 提供企业级语音识别,支持 100+ 语言和变体。在可定制语音模型、关键词识别和合规部署方面表现突出。如果你已在 Azure 生态中,或需要广泛的多语言覆盖并要求企业级 SLA,Azure 是很好的选择。

使用方式

如需使用 Azure 作为 STT 引擎,请在 StartAIConversation API 的 STTConfig 字段中传入以下 JSON:
// json — STTConfig
{
"Language": "en",
"VadSilenceTime": 1000,
"CustomParam": "{\"STTType\":\"azure\",\"SubscriptionKey\":\"<your_azure_subscription_key>\",\"Region\":\"eastus\"}"
}
完整 STTConfig 参数参考,请参阅 STTConfig 配置指南

参数参考

STTConfig 字段

以下字段属于 STTConfig 的一部分。完整定义请参阅 STTConfig
字段
类型
必填
说明
Language
String
语言代码。请参阅 Azure STT 语言支持
VadSilenceTime
Integer
VAD 静音持续时间(毫秒)。请参阅 STTConfig

CustomParam 字段

CustomParam 不属于标准 STTConfig 字段,仅在使用第三方 STT 引擎时需要,用于传递服务提供商的认证参数。
字段
类型
必填
说明
STTType
String
固定值:"azure"
SubscriptionKey
String
你的 Azure Speech 资源订阅密钥。请从 Azure Portal 获取。
Region
String
Azure Speech 资源所在区域(如 eastuswesteurope)。请参阅 Azure Speech 区域
更多 Azure Speech Services 详情,请参阅 Azure Speech 文档
下一步:配置 LLM 提供商