1. 音声データ連携
General_API
  • 汎用APIドキュメント
    • API共通仕様
      • 一般API
        • エージェントリスト取得API
        • エージェント情報取得API
        • エージェントステータス変更API
        • スキルリスト取得API
        • 所属エージェントリスト取得API
        • 理由リスト取得API
        • 待呼取得API
        • 使用回線数取得API
      • 音声系API
        • 通話ステータス通知API
        • 音声認識結果一括取得API
        • 音声認識結果取得API
        • 音声認識結果一括送信API
        • 音声データ取得API
        • 通話履歴取得API
      • AutoCall
        • AutoCall要求API(順次発信方式)
        • AutoCall要求API(即時発信方式)
        • AutoCall結果取得API
        • AutoCall発信完了通知API
        • AutoCallキャンセルAPI
        • AutoCall架電止めAPI
        • AutoCallリクエスト履歴取得API
  • WebSocket(リアルタイム連携)
    • 音声データ連携
      • 音声データ連携ドキュメント
      • WebSocket切断方法
      • WebSocket 音声用API
      • WebSocket 制御用API
    • 音声認識結果連携
      • 音声認識結果連携ドキュメント
      • 音声認識メッセージ
      • 音声認識メッセージ形式
  • 変更履歴
  1. 音声データ連携

音声データ連携ドキュメント

概要#

CT-e1の通話音声をリアルタイムに連携します

API一覧#

API名エンドポイント(例)説明
WebSocket 音声用APIwss://{ドメイン}/audio_streaming/audio/wsstartRecord/disconnectを連携する
WebSocket 制御用APIwss://{ドメイン}/audio_streaming/call/wscallStart/callEndを連携する
※URL名は例です。サーバー側で設計して下さい。

API認証#

HTTP Header に「Authorization: SECRET_API_KEY」を指定する事により認証します
SECRET_API_KEY は、事前共有します
HTTP Header に Authorization が含まれていない場合や不正な場合は、レスポンスコード401-403のエラーを返却します
(例) Authorization:Bearer e0167b81201d415ab0d7ce9081849999

メッセージフォーマット#

メッセージ形式#

メッセージはJSON形式で送受信します
文字コード:UTF-8
 

音声形式#

WebSocketのバイナリ形式を使用して送信します
音声は1920サンプル毎(240msec)に送信します
音声は常にLがカスタマ、Rがオペレータになります
音声形式は、2chのμLaw-8kデータがLRLRLRで並んだ形です。wavヘッダーは有りません。
モノラルの場合は、1つの送信が1920バイトに、ステレオの場合は、3840バイトになります
最後に240msecに満たなかった場合は切り捨てられます

ステレオ音声データ形式#

音声形式:uRaw
サンプリング周波数:8000Hz
ビット長:8bit
チャンネル数:2チャンネル
※ 音声の並びは LRLRLRLR となる
※ L側がカスタマ側、R側がオペレーター側になる

シーケンス#

制御用WebSocketは常時接続です。制御用WebSocketは、テナント全体で1本接続されます。
通話開始された場合、音声用WebSocketを確立しStartRecordを送信します。また、制御用WebSocketにcallStartを送信します。
音声用WebSocketは、通話単位で複数接続可能です。
保留・転送操作が行われた場合、disconnectを送信して音声用WebSocketを切断します
保留解除・転送再開が行われた場合、再度StartRecordを送信し、音声用WebSocketの接続を行います
切電された場合、disconnectを送信して音声用WebSocketを切断します。また、制御用WebSocketにcallEndを送信します。
音声用WebSocketが維持されている期間は、音声データを送信します
通話開始時のcallStartとStartRecord、切電時のcallEndとdisconnectは、非同期処理となるため必ずしもシーケンス図通りの順序とならなず、送信順序が逆転する場合もあります
WebSocketサーバ(音声用)からのレスポンスが遅延した場合、最大10分間分の音声データをバッファリングします。
image.png
更新日時 2026-02-13 08:36:18
前へ
AutoCallリクエスト履歴取得API
次へ
WebSocket切断方法
Built with