本チュートリアルでは、ElevenLabsとSambaCloudの高速LLM推論エンジンを組み合わせて、低レイテンシな音声対話型AIエージェントを構築する手順を解説します。円滑な音声対話の実現にはレイテンシの最小化が重要であり、SambaNovaは、世界水準の推論性能を誇る専用ハードウェアとオープンソースモデルを活用することで、優れた応答速度を実現します。

前提条件

セットアップを開始する前に、以下のアカウントをご準備ください。

セットアップ手順

以下の手順に従って、AIエージェントの構築を行います。

ElevenLabsにてエージェントの設定

  1. ElevenLabsのエージェントのページ にアクセスします。
  2. 新規にエージェントを作成するか、既存のエージェントを選択して編集を行います。

LLMの設定

  1. エージェント設定画面で「LLM」セクションまでスクロールします。
  2. ドロップダウンから「Custom LLM」を選択します。

SambaNovaのエンドポイントとモデル名の取得

  1. SambaCloud の Playground にアクセスします。
  2. 画面右上の「View Code」ボタンをクリックし、モデルのエンドポイントURLおよびモデル名を確認します。

SambaNovaのAPIキーを発行

  1. SambaCloudのアカウントにログインします。
  2. 管理ポータルからAPIキーを発行します。

APIキーをElevenLabsに設定

  1. ElevenLabsのエージェント設定画面に戻ります。
  2. 「Workspace Secrets」セクションで、以下のようにキーと値を追加します。
  3. Name: SAMBANOVA_API_KEY
  4. Value: 先ほど取得したAPIキーを貼り付け
この設定により、ElevenLabsがSambaNovaのモデルにアクセスできるようになります。

トークン使用制限の設定

「Limit token usage」セクションにて、最大トークン数を 1024 に設定します。これは応答長を適切に制御し、会話の自然な流れを維持するための推奨値です。

設定の保存と動作確認

  1. 「Save」ボタンをクリックして設定内容を保存します。
  2. 「Test AI agent」→「Call AI agent」の順にクリックし、エージェントが正しく応答することを確認してください。
  3. 詳細は下記のビデオチュートリアルもご参照ください。

ビデオチュートリアル