メインコンテンツに移動

社内知識を活用した生成 AI チャットボットを構築したい (Knowledge Bases 版)

生成 AI の機能をもつチャットアプリケーションを AWS で実現する際の構成例とその概算料金をご紹介します

構成概要

この構成例のクラウドレベル:

基礎編

入門編:該当するユースケースの知識が全くない方が対象
基礎編:該当するユースケースの入門知識がある方が対象
応用編:該当するユースケースにある程度精通している方が対象

この構成例で解決できる課題・困りごと:

  • 社内に蓄積された多くのデータの中から適切な情報へのアクセスが難しいと感じている

  • 社内のデータと生成 AI を掛け合わせたチャットアプリケーションで素早く適切な情報や支援を取得したい

  • 参考例1)営業職の方は生成 AI チャットアプリケーションに質問して、社内のデータに基づいた回答にたどり着けます

  • 参考例2)技術職でプログラムを開発する方は、既存のコーディングの解説、機能を追加する際のコード生成、効率的な SQL クエリーを組み立てるアドバイスなどの支援が得られます

この構成例の概算料金:

285.69 ドル (月額)

この構成例のメリット:

  • Amazon Bedrock で提供されている基盤モデルと、Bedrock Knowledge Bases を連携させた、生成 AI の RAG チャットアプリケーションを素早く構築可能です

  • Amazon S3 に社内のデータを格納することで、Bedrock Knowledge Bases にデータを取り込みができ、社内のデータに基づいた回答を生成できます

  • GitHub で公開されている Generative AI Use Cases JP を活用することで、素早く環境を構築できます

  • Generative AI Use Cases JP の構築手順は GitHub 上に公開されており、こちらを参照してお手元の AWS アカウントにすぐに構築可能です

  • Generative AI Use Cases JP は、RAG ユースケースだけではなく、文章生成、要約、文章校正、画像生成、音声認識、などよくあるユースケースを素早く試すことができます

A Japanese-labeled AWS architecture diagram showing user access flow through AWS WAF, Amazon CloudFront, S3, API Gateway, Cognito, Lambda, Bedrock, Amazon SageMaker, DynamoDB, Amazon Transcribe, and supporting services such as Amazon Kendra, OpenSearch Service, and S3. The diagram illustrates connections for web content delivery, file uploads, conversation transcription, and integration of retrieval-augmented generation (RAG) and knowledge base agents.

月額合計料金:285.69 (USD)

この構成例で使用したサービスと概算料金内訳

サービス
項目
数量
単価
料金 (USD)
Amazon Bedrock

Claude 3.5 Sonnet 入力トークン

Claude 3.5 Sonnet 出力トークン

11,000,000 トークン

4,400,000 トークン

0.003 USD/1,000 トークンあたり

0.015 USD/1,000 トークンあたり

33

66

OpenSearch Serverless (Knowledge Bases 用ベクトルデータストア)

OpenSearch Compute Unit : 書き込み用

OpenSearch Compute Unit : 読み取り用

Managed Storage

0.5 OCU

0.5 OCU

10 GB

0.24 USD/OCU-時間あたり

0.24 USD/OCU-時間あたり

0.024 USD/GB

87.6

87.6

0.24

Amazon CloudFront

データ転送 (OUT)

HTTPS リクエスト

1 GB

30,000 リクエスト

0.114 USD/時間

0.012 USD/1 万リクエスト

0.11

0.04

Amazon S3

ストレージ容量

GET、SELECT リクエスト数

0.01 GB

1,000 リクエスト

0.025 USD/GB

0.00037 USD/1,000 リクエスト

0

0

Amazon API Gateway

REST API リクエスト数

15,000 リクエスト

4.25 USD/100 万リクエスト

0.06

Amazon Cognito

アクティブユーザー数

50 ユーザー

0.0055 USD/ユーザー

0.28

AWS Lambda

割り当てたメモリと実行時間

Lambda HTTP 応答ストリーム処理バイト

37,500 GB-秒

1 GB

0.000016667 USD/GB-秒あたり

0.008 USD/GB

0.63

0.01

Amazon DynamoDB

オンデマンド 書き込み要求単位 (WRU)

オンデマンド 読み出し要求単位 (RRU)

ストレージ容量

1,000,000 WRU

200,000 RRU

5 GB

1.4269 USD/100 万

0.285 USD/100 万

0.285 USD/GB

1.43

0.06

1.43

Amazon Transcribe

スタンダードバッチ文字起こし 分数

300 分

0.024 USD/分

7.2

  • この構成例で紹介するアプリケーションは、aws-samples で公開されている Generative AI Use Cases JP を使用しています。

  • Generative AI Use Cases JP は、複数の機能が存在しており、各機能ごとに有効 or 無効を指定できます。この試算例では、RAG チャット (Knowledge Bases 版) の機能を有効化している構成です。RAG 以外の セキュリティ設定 (AWS WAF)、ファイルアップロード、検索エージェント、Amazon Kendra、モニタリング用ダッシュボードは試算に含まれていません。

  • この試算は、東京リージョンの料金単価を基に計算しています。一部の例外として、Amazon Bedrock は北部バージニアリージョンの料金単価で計算しています。

  • 1ヶ月を 730 時間として計算しています。

  • 試算に伴うトークンの消費量は以下のように計算をしています。環境や使い方に応じて変動するため、参考値としてご利用ください。

  • 利用ユーザー数 50 人、利用頻度 1 日 10 回質問、1 質問あたり 1000 入力トークン、1 回答あたり 400 出力トークン、1 カ月に 22 日利用する試算です。

  • Bedrock Knowledge Bases 自体には料金がかかりません。このサービスによって作成- 利用される Amazon OpenSearch Serverless や Bedrock が課金対象となります。

  • Amazon OpenSearch Serverless は クラスターのコンピュート層がデータ量や負荷に応じて自動的に伸縮します。本試算では最も小さい 0.5 OCU を前提としています。利用シーンによって OCU の値は変動する点にご注意ください。

  • AWS で提供しているサービスの一部で無料利用枠が提供されています。本試算では無料利用枠を考慮せずに試算を行っており、実際にはより安価にご利用頂ける場合があります。以下に該当する無料利用枠を一部抜粋します。

    • AWS リージョンからインターネット方向のデータ転送 (アウト) : 100 GB/月

    • AWS Lambda :

      • リクエスト回数 1,000,000 件/月

      • コンピューティング時間 400,000 GB-秒/月

    • Amazon CloudFront :

      • データ転送 (アウト) 1 TB /月

      • HTTP/S リクエスト回数 10,000,000 回/月

    • Amazon DynamoDB :

      • ストレージ容量 25 GB/月

    • Amazon Cognito : 50,000 アクティブユーザー/月

※ 2024 年 9 月 10 日時点での試算です

この AWS サービスに関する参考情報


[Kendra と Bedrock Knowledge Bases の違い]

Kendra はフルマネージドなエンタープライズ検索サービスです。データを投入するだけで、自然言語により検索が可能になります。
Bedrock Knowledge Bases は RAG 用のフルマネージドなベクトル検索サービスです。検索時やデータ格納時に利用する基盤モデルやチャンク戦略を細かく指定することができるだけでなく、ベクトルストアに Open Search を利用することでスケーラビリティの高い構成を利用可能です。
GenU では、ベクターストアに利用する OpenSearch に kuromoji を利用し、ハイブリッド検索をサポートするように構成されているため、日本語データでも不自由なくご利用いただけます。

RAGチャットの生成AIチャットアプリの画面例。ユーザーがチャット欄に質問を入力し、AIから回答を得て、関連ドキュメントを開く手順が日本語で説明されています。