• 서비스
  • 가격
  • 리소스
  • 기술지원
RTC Engine
Core SDK
Web
  • 개요
  • 개요
    • 개요
    • 제품 소개
      • 기본 개념
      • 제품 기능
      • 성능 데이터
    • 비용
      • 무료시간
      • RTC-Engine 월간 패키지
      • 구독 패키지 기간 과금 설명
      • 사용한 만큼 지불하세요
        • 오디오 및 비디오 기간 과금 설명
        • 클라우드 녹화 및 녹화 전달 과금 설명
        • 혼합 스트림 트랜스코딩 및 리트윗 우회에 대한 과금 설명
        • Billing of Conversational AI Services
        • Billing of Speech-To-Text
  • Demo 실행
  • 완성
  • 기본 기능
    • 화면 공유
    • 라이브 방송
    • 미디어 장치
    • 볼륨
    • 인코딩 구성 파일 설정
    • 네트워크 품질 검사
    • 검출 능력
  • 고급 기능
    • AI 노이즈 캔슬링 활성화
    • 오디오 믹싱 활성화
    • 워터마크 활성화
    • Enable Cross-Room Call
    • Enable Voice Changer Effect
    • 데이터 메시지
    • 사용자 정의 수집 및 렌더링
  • 인터페이스 목록
  • 일반적인 문제
    • 모든 플랫폼
      • 결제 관련
      • 사용자 서명 관련
      • 기능 관련
      • 방화벽 제한 사항 처리
      • 초보자 FAQ
      • 설치 패키지 크기 감소와 관련
      • TRTC통화 웹 관련
      • 오디오 및 비디오 품질 관련
      • 기타 질문
      • 마이그레이션 가이드
        • Agora to Tencent RTC
    • Web 관련 자주 받는 질문
      • 다중 사용자 비디오 통화 최적화
      • 자동 재생 제한 처리
      • 방화벽 제한 대응
      • 기타
    • 플랫폼 지원
    • 배포 설명
  • 기능 및 서버 인터페이스
    • 인터페이스 요청 보내기
      • 요청 구조
      • 범용 매개변수
      • 서명 방법 v3
      • 서명
      • 회신
    • 룸 관리 인터페이스
      • SetUserBlockedByStrRoomId
      • SetUserBlocked
      • RemoveUser
      • DismissRoom
      • RemoveUserByStrRoomId
      • DismissRoomByStrRoomId
    • 통화 품질 모티터링 인터페이스
      • DescribeRoomInfo
      • DescribeUserEvent
      • DescribeCallDetailInfo
      • DescribeUserInfo
      • DescribeScaleInfo
    • 푸시 풀링 관련 인터페이스
      • StartStreamIngest
      • StopStreamIngest
      • DescribeStreamIngest
      • UpdateStreamIngest
    • 클라우드 레코딩 인터페이스
      • CreateCloudRecording
      • DescribeCloudRecording
      • ModifyCloudRecording
      • DeleteCloudRecording
    • Web Record APIs
      • 혼합 스트림 릴레이 관련 인터페이스
        • UpdatePublishCdnStream
        • StartPublishCdnStream
        • StopPublishCdnStream
      • AI 실시간 대화 관련 인터페이스
        • StartAIConversation
        • UpdateAIConversation
        • ControlAIConversation
        • DescribeAIConversation
        • StopAIConversation
      • AI 전사 관련 인터페이스
        • StartAITranscription
        • DescribeAITranscription
        • StopAITranscription
      • 사용량 통계 관련 인터페이스
        • DescribeTrtcUsage
        • DescribeRecordingUsage
        • DescribeMixTranscodingUsage
        • DescribeRelayUsage
        • DescribeTrtcRoomUsage
      • 모니터링 대시보드 관련 인터페이스
        • DescribeTRTCRealTimeScaleData
        • DescribeTRTCRealTimeQualityData
        • DescribeTRTCMarketScaleData
        • DescribeTRTCMarketQualityData
      • 데이터 유형
      • 부록
        • 이벤트 ID 매핑표
      • 에러코드
    • 서버 기능
      • 클라우드 녹화
      • CDN으로 릴레이
      • AI 실시간 대화
        • 기능 소개
        • 대화형 AI 기능에 코드 없이 빠르게 액세스
        • 서비스 활성화
        • 데모 실행
          • Android
          • iOS
          • Web
        • 빠른 통합(UI 포함)
          • Android
          • iOS
        • 빠른 통합(UI 없음)
          • 빠른 실행
          • Speech-To-Text Configuration
          • 대형 모델 구성
          • 텍스트 음성 변환 구성
          • 스마트 중단
          • 컨텍스트 관리를 구현하는 방법
          • AI 대화 SDK 측 콜백
            • AI 대화 상태 콜백
            • AI 대화 자막 콜백
            • AI 대화 표시기 콜백
            • AI 대화 오류 콜백
          • AI 대화 서버 콜백
          • 맞춤 TTS 프로토콜
        • 업계 관행
          • 정서적 동반자
          • 지능형 고객 서비스
      • TRTC 룸에 미디어 스트림 입력
      • OBS WHIP을 사용하여 스트림을 TRTC 룸으로 푸시하는 방법
      • 음성을 텍스트로
      • 고급 권한 제어
      • RTMP 푸시 흐름을 방으로 보냅니다
    • 이벤트 콜백
      • 룸 및 미디어 콜백
      • 라이브 CDN 콜백에 오디오 및 비디오 스트림 게시
      • 클라우드 녹음 콜백
      • 온라인 미디어 스트리밍 콜백 입력
      • AI 실시간 대화 및 음성-텍스트 콜백
      • 서명 확인 예시
    • 콘솔 안내
      • 애플리케이션 관리
        • 개요
        • 애플리케이션 생성
        • 기능 구성
        • 콜백 구성
      • 패키지 관리
      • 사용량 통계
        • 인터랙티브 오디오/비디오
        • 클라우드 녹화
        • 온-클라우드 믹스 트랜스코딩
        • CDN로 전환
      • 모니터링 대시보드
        • 룸콜 설문조사
          • 통화 목록
          • 통화 내역
          • 엔드 투 엔드 상세정보
        • 실시간 모니터링
        • 데이터 대시보드
      • 개발 보조
        • UserSig 생성 및 인증
        • RTMP Address Generator
    • TRTC 정책
      • 개인정보 처리방침
      • 데이터 처리 및 보안 협약
    이 페이지는 현재 영어로만 제공되며 한국어 버전은 곧 제공될 예정입니다. 기다려 주셔서 감사드립니다.

    텍스트 음성 변환 구성

    This document describes how to configure the TTSConfig parameter of the StartAIConversation API.

    Supported TTSConfig Configurations

    Use your third-party account to configure TTS parameters.

    Azure TTS

    {
    "TTSType": "azure", // Required. TTS type in string format.
    "SubscriptionKey": "xxxxxxxx", // Required. Subscription key in string format.
    "Region": "southeastasia", // Required. Subscription region in string format.
    "VoiceName": "en-US-AmandaMultilingualNeural", // Required. Timbre name in string format.
    "Language": "en-US", // Required. Language for TTS in string format.
    "Rate": 1 // Optional. Speech speed in float format. Value range: 0.5–2. Default value: 1.
    }

    Cartesia TTS

    {
    "TTSType": "cartesia", // Required. TTS type in string format.
    "Model": "sonic-multilingual", // Required. Model.
    "APIKey": "eyxxxx", // Required. Obtained API key.
    "VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0" // Required. Timbre ID. Visit https://play.cartesia.ai/ for details.
    }

    ElevenLabs TTS

    {
    "TTSType": "elevenlabs", // Required. TTS type in string format.
    "Model": "eleven_turbo_v2_5", // Required. Model.
    "APIKey": "eyxxxx",
    "VoiceId": "eda5bbff-1ff1-4886-8ef1-4e69a77640a0" // Timbre ID. Visit https://elevenlabs.io/docs/api-reference/get-voices for details.
    }

    Tencent TTS

    {
    "TTSType": "tencent", // TTS type in string format. Valid values: "tencent" and "minixmax". Other vendors will be supported in future versions.
    "AppId": "Your application ID", // Required. The value is in string format.
    "SecretId": "Your key ID", // Required. The value is in string format.
    "SecretKey": "Your key", // Required. The value is in string format.
    "VoiceType": 101001, // Required. Timbre ID in integer format. Standard timbre and premium timbre are supported. The premium timbre is more real, and its price differs from that of the standard timbre. See the TTS billing overview for details. For the complete list of timbre IDs, see the TTS timbre list.
    "Speed": 1.25, // Optional. Speech speed in integer format. Value range: [-2, 6], corresponding to different speech speeds. -2: 0.6 times; -1: 0.8 times; 0: 1.0 times (default value); 1: 1.2 times; 2: 1.5 times; 6: 2.5 times. If you need a more fine-grained speech speed, the value can be accurate to 2 decimal places, such as 0.5, 1.25, and 2.81. For the conversion between the parameter value and actual speech speed, see Speech Speed Conversion.
    "Volume": 5, // Optional. Volume level in integer format. Value range: [0, 10], corresponding to 11 volume levels. The default value is 0, representing the normal volume.
    "PrimaryLanguage": 1, // Optional. Primary language in integer format. 1: Chinese (default value); 2: English; 3: Japanese.
    "FastVoiceType": "xxxx" // Optional. Parameter for fast voice cloning.
    }

    MiniMax TTS

    {
    "TTSType": "minimax", // TTS type in string format.
    "Model": "speech-01-turbo",
    "APIUrl": "https://api.minimax.chat/v1/t2a_v2",
    "APIKey": "eyxxxx",
    "GroupId": "181000000000000",
    "VoiceType":"female-tianmei",
    "Speed": 1.2
    }
    See MiniMax
    For rate limits, see MiniMax. Rate limits may cause response lag.
    API
    T2A V2 (Speech generation)
    T2A Pro (Speech generation)
    T2A (Speech generation)
    T2A Stream (Streaming speech generation)
    T2A Stream (Streaming speech generation)
    
    Model
    speech-01-turbo, speech-01-240228, speech-01-turbo-240228
    speech-01, speech-02
    speech-01, speech-02
    speech-01
    speech-01
    Customer type/Limit type
    RPM
    RPM
    RPM
    RPM
    CONN (maximum number of parallel tasks)
    Users using a free account
    3
    3
    3
    3
    1
    Users using a paid account
    20
    20
    20
    20
    3

    Custom TTS

    {
    "TTSType": "custom", // Required. The value is in string format.
    "APIKey": "ApiKey", // Required. API key in string format for authentication.
    "APIUrl": "http://0.0.0.0:8080/stream-audio" // Required. TTS API URL in string format.
    "AudioFormat": "wav", // Optional. Expected output audio format in string format. For example, mp3, ogg_opus, pcm, and wav. Default value: wav. Currently, only pcm and wav are supported.
    "SampleRate": 16000, // Optional. Audio sampling rate in integer format. Default value: 16000 (16 kHz). Recommended value: 16000.
    "AudioChannel": 1, // Optional. Number of audio channels in integer format. Valid values: 1 and 2. Default value: 1.
    }
    For specific protocol specifications, see Customize TTS protocol.