Billing of Speech-To-Text

AI 智能识别包括 语音转文字AI 实时翻译 两个能力。
语音转文字:通过 ASR(STT)把语音转录成文本,可实现实时字幕效果。
AI 实时翻译:将转换文本后的内容翻译成指定语言文本,可实现实时翻译效果。

计费说明

语音转文字费用

语音转文字服务支持识别 TRTC 房间内指定用户或所有用户的音频流,通过 ASR(STT)把语音转录成文本,可实现实时字幕效果。
若您的应用版本为 RTC-Engine 包月套餐的应用,可解锁语音转文字能力。其他版本无法解锁语音转换文本能力。
您的应用版本须为 RTC Engine 轻量版及以上版本,可在解锁后付费使用该能力。
在翻译场景下为了保证整体效果,您无法使用第三方的 STT。
计费方式:日结后付费计费。
计费周期:按日计费。详细计费和出账时间以实际 计费账单 为准。

AI 实时翻译费用

AI 实时翻译服务可以将转换文本后的内容翻译成指定语言文本,可实现翻译效果。
计费方式:日结后付费计费。
计费周期:按日计费。详细计费和出账时间以实际 计费账单 为准。

计费价格

语音转文字服务、AI 实时翻译服务的刊例价如下表所示:
计费类型
单价(美元/分钟)
支持语言
语音转文字
0.02
支持 22 种语言,包括:
中文、中文繁体、英语、越南语、日语、韩语、印度尼西亚语、泰语、葡萄牙语、土耳其语、阿拉伯语、西班牙语、印地语、法语、马来语、菲律宾语、德语、意大利语、俄语、瑞典语、丹麦语、挪威语。
AI 实时翻译
0.016
支持 15 种语言,包括:
中文、英语、越南语、日语、韩语、印度尼西亚语、泰语、葡萄牙语、阿拉伯语、西班牙语、法语、马来语、德语、意大利语、俄语。

用量统计

说明:
时长统计精度为秒,按 SDKAppID 维度,以每日累计秒数转换成分钟数后进行计费,不足一分钟按一分钟计。
当房间内发起语音转文字和实时翻译时,将会有机器人作为虚拟观众加入房间,订阅需要语音转文字的音视频流,产生 音视频时长 用量。

语音转文字

只有开始参与 AI 智能识别的音频时长才进行用量统计。
若主播多流输入,对每路流的使用时长进行相加统计收费。

AI 实时翻译

按照参与 AI 智能识别翻译能力的音频时长进行用量统计。
主播单路流入,若输出多种翻译语言,则按照输入的音频时长 * 输出的语种个数进行收费。

计费示例

您使用 AI 智能识别服务。用户 A 和 B 用中文通话,观众 C 需要看到英文字幕,观众 D 需要看到日文字幕,使用智能识别进行语音转文字,再使用 AI 实时翻译的功能,本次通话时长为 5 分钟。此示例中 AI 智能识别的费用如下:
计费类型
用户 A
用户 B
小计
语音转文字
5 分钟
5 分钟
10 分钟
AI 实时翻译
5 分钟 * 2
5 分钟 * 2
20 分钟
语音转文字费用:共产生 10 分钟用量,单价为 0.02 美元/分钟,则 0.02 × 10 = 0.2 美元;
AI 实时翻译费用:共产生 20 分钟用量,单价为 0.016 美元/分钟,则 0.016 × 20 = 0.32 美元 。
则在此场景中,您需要支付 AI 智能识别费用:0.52 美元。

接入指引

具体接入步骤请参见 语音转文字 接入说明。