Feedback

Deepgram

本文主要介绍如何在接口中配置 Deepgram。
Deepgram 基于端到端深度学习构建,提供市面上最快、最精准的实时转录服务之一。其 Nova-2 模型在词错误率上处于行业领先水平,同时成本显著低于传统提供商。非常适合以英文为主、对速度、准确率和成本效益有较高要求的使用场景。

使用方式

如需使用 Deepgram 作为 STT 引擎,请在 StartAIConversation API 的 STTConfig 字段中传入以下 JSON:
// json — STTConfig
{
"Language": "en",
"VadSilenceTime": 1000,
"CustomParam": "{\"STTType\":\"deepgram\",\"ApiKey\":\"<your_deepgram_api_key>\",\"Model\":\"nova-3\"}"
}
完整 STTConfig 参数参考,请参阅 STTConfig 配置指南

参数参考

STTConfig 字段

以下字段属于 STTConfig 的一部分。完整定义请参阅 STTConfig
字段
类型
必填
说明
Language
String
语言代码。请参阅 Deepgram 语言支持
VadSilenceTime
Integer
VAD 静音持续时间(毫秒)。请参阅 STTConfig

CustomParam 字段

CustomParam 不属于标准 STTConfig 字段,仅在使用第三方 STT 引擎时需要,用于传递服务提供商的认证参数。
字段
类型
必填
说明
STTType
String
固定值:"deepgram"
ApiKey
String
你的 Deepgram API 密钥。请从 Deepgram Console 获取。
Model
String
要使用的 STT 模型,如 "nova-3"。请参阅 Deepgram 模型与语言
更多 Deepgram 详情,请参阅 Deepgram 文档
下一步:配置 LLM 提供商