メインコンテンツに移動

社内知識を活用した生成 AI チャットボットを構築したい

生成 AI の機能をもつチャットアプリケーションを AWS で実現する際の構成例とその概算料金をご紹介します

構成概要

この構成例のクラウドレベル:
基礎

入門編:該当するユースケースの知識が全くない方が対象
基礎編:該当するユースケースの入門知識がある方が対象
応用編:該当するユースケースにある程度精通している方が対象

この構成例で解決できる課題・困りごと:

  • 社内に蓄積された多くのデータの中から適切な情報へのアクセスが難しいと感じている

  • 社内のデータと生成 AI を掛け合わせたチャットアプリケーションで素早く適切な情報や支援を取得したい

  • 参考例1)営業職の方は生成 AI チャットアプリケーションに質問して、社内のデータに基づいた回答にたどり着けます

  • 参考例2)技術職でプログラムを開発する方は、既存のコーディングの解説、機能を追加する際のコード生成、効率的な SQL クエリーを組み立てるアドバイスなどの支援が得られます

この構成例の概算料金:
942.21 ドル (月額)

この構成例のメリット:

  • Amazon Bedrock で提供されている基盤モデルと、Amazon Kendra と連携させた、生成 AI の RAG チャットアプリケーションを素早く構築可能
    例えば、Amazon S3 に社内のデータを格納することで、Amazon Kendra にデータを取り込みができ、社内のデータに基づいた回答を生成できる
  • GitHub で公開されている Generative AI Use Cases JP を活用することで、素早く環境を構築出来る
  • Generative AI Use Cases JP の構築手順は GitHub 上に公開されており、こちらを参照してお手元の AWS アカウントにすぐに構築可能
  • Generative AI Use Cases JP は、RAG ユースケースだけではなく、文章生成、要約、文章校正、画像生成、音声認識、などよくあるユースケースを素早く試すことができる

構築方法を動画で見る

Missing alt text value

月額合計料金: 941.99 (USD)

この構成例で使用したサービスと概算料金内訳

サービス
項目
数量
単価
料金 (USD)
Amazon Bedrock

Claude 3 Sonnet 入力トークン

Claude 3 Sonnet 出力トークン

11,000,000 トークン

4,400,000 トークン

0.003 USD/1000 トークンあたり

0.015 USD/1000 トークンあたり

33

66

Amazon Kendra

Developer Edition 時間当たりの料金

Connector でスキャンしたドキュメント数

Connector でスキャンした時間

730 時間

5,000 ドキュメント

30 時間


1.125 USD/時間

0.000001 USD/ドキュメント

0.35 USD/時間

821.25

0.01

10.50

Amazon CloudFront

データ転送 (OUT)

HTTPS リクエスト

1 GB

30,000 リクエスト

0.114 USD/時間

0.012 USD/1万リクエスト

0.11

0.04

Amazon S3

ストレージ容量

GET、SELECT リクエスト数

0.01 GB

1,000 リクエスト

0.025 USD/GB

0.00037 USD/1000 リクエスト

0

0

Amazon API Gateway

REST API リクエスト数

15,000 リクエスト

4.25 USD/100 万リクエスト

0.06

Amazon Cognito

アクティブユーザー数

50 ユーザー

0.0055 USD/ユーザー

0.28

AWS Lambda

割り当てたメモリと実行時間

Lambda HTTP 応答ストリーム処理バイト

37,500 GB-秒

1 GB

0.000016667 USD/GB-秒あたり

0.008 USD/GB

0.63

0.01

Amazon DynamoDB

オンデマンド 書き込み要求単位 (WRU)

オンデマンド 読み出し要求単位 (RRU)

ストレージ容量

1,000,000 WRU

200,000 RRU

5 GB

1.4269 USD/100 万

0.285 USD/100 万

0.285 USD/GB

1.43

0.06

1.43

Amazon Transcribe

スタンダードバッチ文字起こし 分数

300 分

0.024 USD/分

7.20

  • この構成例で紹介するアプリケーションは、aws-samples で公開されている Generative AI Use Cases JP を使用しています。

  • Generative AI Use Cases JP は、複数の機能が存在しており、各機能ごとに有効 or 無効を指定できます。この試算例では、RAG チャットの機能を有効化している構成です。RAG 以外の セキュリティ設定 (AWS WAF)、ファイルアップロード、検索エージェント、Knowledge base エージェント、モニタリング用ダッシュボードは試算に含まれていません。

  • この試算は、東京リージョンの料金単価を基に計算しています。一部の例外として、Amazon Bedrock は北部バージニアリージョンの料金単価で計算しています。Claude 3 Sonnet は 2024 年 3 月 15 日現在、東京リージョンで提供されていないためです。

  • 1ヶ月を 730 時間として計算しています。

  • 試算に伴うトークンの消費量は以下のように計算をしています。環境や使い方に応じて変わってくるので、参考値としてご利用ください。

    • 利用ユーザー数 50 人、利用頻度 1 日 10 回質問、1 質問あたり 1000 入力トークン、1 回答あたり 400 出力トークン、1 カ月 22 日計算。

  • Amazon Kendra は料金面を考慮して、比較して安価な Developer Edition を前提に試算をしています。本番環境では Enterprise Edition の採用もご検討ください。Enterprise Edition と Developer Edition の違いはこちらを参照ください。Developer Edition は無償枠の利用や単価が比較して安価なメリットがある一方、可用性の観点では Single-AZ で構成されています。

  • AWS で提供しているサービスの一部で無料利用枠が提供されています。本試算では無料利用枠を考慮せずに試算を行っており、実際にはより安価にご利用頂ける場合があります。以下に該当する無料利用枠を一部抜粋します。

    • AWS リージョンからインターネット方向のデータ転送 (アウト) : 100 GB/月

    • AWS Lambda :
        - リクエスト回数 1,000,000 件/月
        - コンピューティング時間 400,000 GB-秒/月

    • Amazon CloudFront :
        - データ転送 (アウト) 1 TB /月
        - HTTP/S リクエスト回数 10,000,000 回/月

    • Amazon DynamoDB :
        - ストレージ容量 25 GB/月

    • Amazon Kendra : Developer Edition を初回利用するとき、30 日間で 750 時間の利用

    • Amazon Cognito : 50,000 アクティブユーザー/月

※ 2024 年 3 月 15 日時点での試算です。

この AWS サービスに関する参考情報

Missing alt text value