• 製品
  • 価格
  • リソース
  • サポート
  • SDK
  • サーバーサイドの機能とAPI
RTC Engine/
サーバーサイドの機能とAPI/
サーバー機能/
AIによるリアルタイム会話/
サーバーサイドの機能とAPI
  • サーバー機能
    • クラウドレコーディング
    • オーディオビデオストリームをライブストリーミングCDNに公開
    • AIによるリアルタイム会話
      • 機能紹介
      • コード不要で会話型 AI 機能に素早くアクセス
      • サービスをアクティブ化する
      • デモを実行する
        • Android
        • iOS
        • Web
      • 迅速な統合(UIを含む)
        • Android
        • iOS
      • 迅速な統合 (UI なし)
        • 素早い実行
        • 大規模なモデル構成
        • テキスト読み上げの構成
        • スマート中断
        • コンテキスト管理の実装方法
        • AI対話SDK側コールバック
          • AI対話ステータスコールバック
          • AI対話字幕コールバック
          • AI ダイアログ インジケーター コールバック
          • AI 対話エラー コールバック
        • AI対話サーバーコールバック
        • カスタム TTS プロトコル
      • 業界の慣行
        • 感情的な付き合い
        • インテリジェントな顧客サービス
    • TRTC ルームへのメディア ストリームの入力
    • OBS WHIP を使用してストリームを TRTC ルームにプッシュする方法
    • 音声をテキストに変換
    • 高度な権限制御
    • ルームへの RTMP プッシュ フロー
  • 機能とサーバーインターフェース
    • インターフェースリクエストの発行
      • リクエスト構造
      • 一般的なパラメータ
      • サイン方法 v3
      • サイン
      • 返信
    • ルーム管理インターフェース
      • SetUserBlockedByStrRoomId
      • SetUserBlocked
      • RemoveUser
      • DismissRoom
      • RemoveUserByStrRoomId
      • DismissRoomByStrRoomId
    • 通話品質モニタリングインターフェース
      • DescribeRoomInfo
      • DescribeUserEvent
      • DescribeCallDetailInfo
      • DescribeUserInfo
      • DescribeScaleInfo
    • プッシュ取得の関連インターフェース
      • StartStreamIngest
      • StopStreamIngest
      • DescribeStreamIngest
      • UpdateStreamIngest
    • クラウドレコーディングインターフェース
      • CreateCloudRecording
      • DescribeCloudRecording
      • ModifyCloudRecording
      • DeleteCloudRecording
    • ミクスストリーミング転送の関連インターフェース
      • UpdatePublishCdnStream
      • StartPublishCdnStream
      • StopPublishCdnStream
    • AIリアルタイム対話関連インターフェース
      • StartAIConversation
      • UpdateAIConversation
      • ControlAIConversation
      • DescribeAIConversation
      • StopAIConversation
    • AI文字起こし関連インターフェース
      • StartAITranscription
      • DescribeAITranscription
      • StopAITranscription
    • 使用量統計関連インターフェース
      • DescribeTrtcUsage
      • DescribeRecordingUsage
      • DescribeMixTranscodingUsage
      • DescribeRelayUsage
      • DescribeTrtcRoomUsage
    • ダッシュボード関連のインターフェースの監視
      • DescribeTRTCRealTimeScaleData
      • DescribeTRTCRealTimeQualityData
      • DescribeTRTCMarketScaleData
      • DescribeTRTCMarketQualityData
    • データタイプ
    • 付録
      • イベント ID マッピングテーブル
    • エラーコード
  • イベントコールバック
    • ルームとメディアのコールバック
    • オーディオおよびビデオ ストリームをライブ CDN コールバックにパブリッシュする
    • クラウド録音コールバック
    • オンライン メディア ストリーミング コールバックを入力してください
    • AI リアルタイム対話と音声からテキストへのコールバック
    • 署名検証の例
このページは現在英語版のみで提供されており、日本語版も近日中に提供される予定です。ご利用いただきありがとうございます。

機能紹介

Overview

The Tencent Real-Time Communication (TRTC) Conversational AI solution includes built-in Speech-to-Text (STT) and interruption handling, and provides channel services, such as allowing customers to flexibly access specified Large Language Model (LLM) and Text-to-Speech (TTS) model services to create natural and smooth conversational AI features that better fit business scenarios.



Application Scenario

Scenario
Description
Online education
In the online education scenario, real-time interaction and feedback are key to enhancing learning outcomes. By leveraging conversational AI, a platform can create a virtual teaching assistant that provides intelligent teaching assistance both in and out of class.
In class, students can ask questions to the virtual teaching assistant at any time during the teacher’s lecture to get additional explanations and better understand learning points.
Out of class, the virtual teaching assistant can provide personalized tutoring advice and learning resources based on different students' progress and needs. It can also provide responsive feedback on students' homework and questions, accompanying students in a more natural and friendly manner. Compared to lengthy textual explanations, conversational explanations can more effectively guide students and facilitate understanding.
Social entertainment
In the social entertainment scenario, conversational AI combined with real-time interaction capabilities can accurately understand users' intentions and engage in voice interactions with users, providing a more authentic and personalized social entertainment experience. A virtual companion provided by conversational AI can naturally communicate with users via voice, offering richer and more genuine emotional value compared to text. In interactive games such as Online Murder Mystery Party and Werewolf Game, conversational AI can also play the role of a host or non-player character (NPC) that engages in dynamic, real-time conversations with players and advances the storyline, allowing players to enjoy an immersive game experience.
Call center
In scenarios like online customer service, AI sales consultation, and intelligent outbound calling, conversational AI can provide a richer, real-time customer service experience. This not only effectively reduces operational costs but also significantly enhances service efficiency, offering faster service support to customers around the clock.
Highly efficient office
Through conversational AI, users can use voice to control applications, reducing manual input and making daily work easier and more efficient. Compared to text-based interactions, conversational interactions can expand the usage scenarios of various office assistants, enabling quick voice communication and task completion without being near terminal devices.
Medical assistance
By leveraging conversational AI, in scenarios such as remote diagnosis and medical consultation, patients can ask questions via voice and receive real-time personalized advice, bringing them closer to an authentic medical consultation experience. This can alleviate users' mistrust and significantly reduce their anxiety.
Note:
For details, refer to the industry practical tutorials: Emotional Companionship and Intelligent Customer Service.

Strengths

Advantage
Description
Ultra-low Latency
TRTC's ultra-low latency ensures global audio/video transmission under 300 ms and conversation latency under 1,000 ms, matching human response speed for a smooth, natural interaction and enhanced customer satisfaction.
Efficient Deployment
Tencent RTC supports a code-free Playground for quickly verifying solution in advance, and offers fast integration in 2-3 days with complete SDKs and APIs, reducing development time and costs for quickly launching intelligent applications.
Leading Audio Processing
TRTC Conversational AI solution offers customizable AI noise suppression and 3A echo cancellation, improving speech recognition and call quality for precise, high-definition AI dialogue across diverse scenarios.
Flexible Provider Stack
Compatible with global leading Large Language Models (LLM), Speech-to-Text (STT), and Text-to-Speech (TTS) models, users can effortlessly integrate by configuring their own keys, getting customized AI conversational support for businesses worldwide.
Human-like Natural Conversations
The Voice Activity Detection (VAD) enables intelligent interruption, ensuring AI communication with minimal lag or delay, allowing for conversation rhythm and response speed akin to human dialogue, closely mimicking human-like natural conversation.
Multi-modal AI Interaction
Tencent RTC's conversational AI solution provides advanced multimodal AI media processing and interaction capabilities, covering text, voice, video and digital people, capable of handling multimodal input and output.