Amazon Web Services ブログ

NTT データの AWS ジャパン生成 AI 実用化推進プログラム成果報告 : AI Agent によるクリエイティブ業務支援ソリューション開発

本ブログは、株式会社 NTT データ テクノロジーコンサルティング事業部 主任 鯨田 連也氏、アマゾン ウェブ サービス ジャパン合同会社 ソリューションアーキテクト 伊藤 が共同で執筆しました。

はじめに

株式会社 NTT データは、2024 年度の AWS ジャパン生成 AI 実用化推進プログラムに参画し、AI Agent によるクリエイティブ業務支援ソリューションを開発しました。本稿では、開発の背景となるビジネス的課題から、具体的なソリューションのアーキテクチャ、そして実際の導入による効果を包括的に紹介します。また、デザイン関連の企業様との協業を通じて得られた実践的な知見についても共有します。

背景と目的

広告作成やデザイン制作などのクリエイティブ業務において、作業の属人化やクリエイティブ制作に要するコストが課題となっています。例えば、スーパーやコンビニの店舗では、専門的なデザイナーがいないことが多く、非専門人材である店舗スタッフが広告(店内 POP)を作成することが一般的だと考えられます。その結果、広告作成業務が特定の人に偏り、品質のばらつきや、業務時間の増加などの作業負荷が発生します。また、広告デザイン制作を外注する場合、金銭的コストに加え、製作会社との打合せや修正依頼のやり取り、確認作業などの時間的なコストも発生します。

さらに、経験豊富なデザイナーのような専門人材においても、クリエイティブプロセスの効率化や質の向上が求められる場面は少なくありません。例えば、担当者によっては発想が似たようなものになり、デザインのバリエーション作成が困難になる課題や、自由な発想ができずデザインのアイデア出しに時間がかかってしまう課題があります。

これらの課題を解決するために、生成 AI や AI Agent を活用することで、デザイナーでない非専門人材でも一定水準のクリエイティブを短時間・低コストで作成できるソリューションの開発を目指しました。加えて、専門人材に対しても、アイデア創出のための壁打ち相手や、デザインのラフ案作成に活用できるようなソリューションを目指しました。

デザイン関連の企業様との協業

11 月に開催された AWS 生成 AI Frontier Meet Up にて登壇した際、同じくご参加されていたデザイン関連の企業様が弊社のソリューションに興味を持って下さり、協業の機会をいただきました。本企業様は、展示会やイベントの企画や運営、ブースのデザインを手掛けております。今回の協業では、NTT データのソリューションを実際に利用いただき、現場目線での多様なフィードバックをいただくことで、ソリューションの改善や機能追加へのヒントを得ることを目的としています。
協業でソリューションをご利用いただくに際し、業務の課題についてヒアリングを行うと、以下の課題を持たれていることが分かりました。

  • ① 情報収集の時間的コスト: 顧客や競合・トレンドの調査に時間を割く余裕が無い
  • ② アイデア創出の属人化: アイデア創出プロセスやクリエイティブの意図は、担当者の感覚に依存している
  • ③ アイデア具体化の非効率性: 顧客とのイメージの認識に乖離がある場合、大きな手戻りが発生し、制作のやり直しや再調整に多くの時間を要する

上述の課題を解決するために、①にはWeb 検索 Agent、②にはデザイン案生成 Agent、③には画像生成 Agent を開発しました。しかし、これらの Agent をどのように連携させ、適切に実行するかが課題でした。例えば、デザイン案生成 Agent が生成したデザイン案を基に、画像生成 Agent にデザインを生成させる際に、どのように Agent 間で情報を受け渡すか、また、Agent の実行タイミングをどのように制御するかなどの課題がありました。そのうえ、異なる職種の方が利用する前提のため、利用シーンに応じて実行すべき Agent や Agent の実行順序を動的に決定する必要がありました。

ソリューション

複数の Agent を統括する Supervisor Agent を利用した Multi Agent ソリューションを開発しました。Supervisor Agent は、ユーザーの要望に応じて実行すべき Agent を動的に決定し、各 Agent 間の実行結果を別の Agent に連携することができます。例えば、ユーザーが「”生成 AI” をテーマとした展示会のポスターデザインを作成したい」と要望した場合、まず、Supervisor Agent は デザイン案生成 Agent を実行した後に、画像生成 Agent を実行するように計画します。そして、実際にデザイン案生成 Agent を実行し、生成 AI から連想されるデザイン案を複数提示します。その後、ユーザーが選択したデザイン案を画像生成 Agent に連携し、デザインを複数生成します。なお、各 Agent の詳細については後述します。

図1. Supervisor 型の Multi Agent のイメージ

本ソリューションの特徴は、前述の Supervisor 型の Multi Agent である点に加え、Agent 思考過程が可視化されている点や、Human in the Loop による Agent の生成結果 (出力) の改善が可能である点です。特に、Agent の出力の根拠や意図を言語化することにより、デザイナー同士やデザイナーと顧客同士での議論が円滑になると考えられます。また、ユーザーが Agent の出力への再検討を依頼した場合、Supervisor Agent が自律的に改善点を検討します。これにより、生成 AI の利用方法に不慣れなユーザーでも、生成 AI 自身に改善点を考えさせることができるため、UX の向上が期待されます。

ソリューションの特徴

図2. ソリューションの特徴

Agent の開発フレームワークとして、LangGraph を採用しました。LangGraph は、Agent の処理や実行順序をノードとエッジで表現し、Agent の複雑な処理フローを高い自由度で実装することが可能です。LangGraph では、Multi Agent を実現するための様々な機能が提供されており、例えば、Agent の短期記憶機能である Checkpoints を利用することで、Agent 間の情報連携が容易になります。さらに、SubGraphhandoff (Command) という機能を利用することで、Supervisor Agent と別の Agent (Agentic Workflow) 間の実行制御を委譲できます。

Agent に利用している LLM には、Amazon Bedrock の Claude 3.7 Sonnet および Azure OpenAI の GPT-4o を採用しています。また、画像生成 AI には、Amazon Bedrock の Amazon Nova Canvas および Azure OpenAI の DALL·E 3 を利用しています。多様なモデルを利用できるようにすることで、利用シーンに応じて各モデルの持つ独自の処理能力や得意分野、表現力を活かしたコンテンツの生成を行うことを狙いとしています。

Web 検索 Agent

Web 検索 Agent は、ユーザーが指示した内容をWeb検索し、調査結果を要約する Agent です。通常の検索に加え、画像検索にも対応しています。例えば、「NTT データについて、企業理念を含めて調べて」と依頼すると、Supervisor Agent が検索クエリを生成し、Web 検索 Agent に検索クエリを連携します。そして、Web 検索 Agent は Web 検索を行い、検索結果を整理し回答します。回答には、Web 検索時の URL の引用情報も含まれています。

最終的な検索結果を踏まえて、後述のデザイン案生成 Agent や画像生成 Agent に依頼することも可能です。また、複数の検索結果を Supervisor Agent に要約させることも可能です。

result_web_search_agent
図3. Web 検索 Agent の実行結果例

デザイン案生成 Agent

デザイン案生成 Agent は、イベントコンセプトなどのキーワードから、複数のデザイン案を生成するAgent です。例えば、「(先程の検索結果の) サステナビリティというキーワードを基に、NTT データの生成 AI に関する展示会のポスターデザインを作成して」と依頼すると、Supervisor Agent は、「デザイン案生成 Agent を実行した後、画像生成 Agent を実行すべき」と考え、デザイン案生成 Agent を実行します。デザイン案生成 Agent は、ユーザーが提示したキーワードから連想される単語やテーマを思考し、より具体的なデザイン案とその根拠を複数提示します。なお、デザイン案生成 Agent は、以前の他の Agent の実行結果や、ユーザーの会話履歴を考慮してデザイン案を提案します。

最終的に生成されたデザイン案を選択すると、そのデザイン案を後述の画像生成 Agent に連携し、デザイン画像を生成することができます。また、デザイン案を再検討させたい場合、Agent 自身に改善点を考えさせることや、ユーザー自身が改善点を指摘することが可能です。

result_design_proposal_agent
図4. デザイン生成 Agent の実行結果例 (抜粋)

画像生成 Agent

画像生成 Agent は、デザイン案に基づいて画像生成を行う Agent です。例えば、「木のシルエットを基本形状とし、内部に青や緑の発光する回路パターンが流れるデザインの画像を作成して」と依頼すると、Supervisor Agent は画像生成 Agent にユーザーが提示したデザイン案を連携し、画像生成 Agent を実行します。画像生成 Agent は、デザイン案を基に画像生成 AI に適した英語のプロンプトを作成した後、画像生成を行います。

最終的に生成されたデザイン画像を基に、修正依頼を行うことや、別のタスクを実行するために別の Agent を呼び出すことも可能です。

result_image_generation_agent
図5. 画像生成 Agent の実行結果例 (抜粋)

アーキテクチャ

Amazon Bedrock を中心に AWS マネージドサービスを多く活用することで、約 2 ヶ月でソリューションを構築することができました。アプリケーションは Amazon ECS 上のコンテナで実行され、ALB を介して外部からアクセス可能です。アプリケーション上で Supervisor Agent に依頼を行うと、Amazon Bedrock の Claude 3.7 Sonnet または Azure OpenAI の GPT-4o が呼び出され、ユーザーの意図を理解し適切な Agent を選択・実行します。Agent との会話履歴や生成した画像は、高速アクセスと自動スケーリングに優れた Amazon DynamoDB や、コスト効率の高い堅牢なストレージである Amazon S3 に保存しております。また、LangGraph の Checkpoints のデータを保存する不揮発領域として、当時は PostgreSQL または SQLite のみ対応していたため Amazon RDS に保存しております。

本ソリューションは AWS CDK を利用して Infrastructure as Code 化しており、他のお客様の AWS 環境でも同様のサービスのデプロイが可能です。

architecture

図6. アーキテクチャ

導入効果

それぞれの Agent を業務でご利用いただいた際の評価をまとめます。

表1. 各 Agent の評価結果

Agent 評価 結果
Web検索Agent • 調査実務の75%効率化することができた
• 作業内容画像検索については、一般的なものもあった
デザイン生成Agent • Agentの思考過程がユーザーのアイデア出しの参考になった
• 新規なアイデアの生成には、改善の余地あり
画像生成Agent • 生成画像は、現場のグラフィックデザインとの乖離が大きい
• 個社のデータを活用し、企業独自のデザインを生成できるよう
なチューニングが必要

まとめ

AWS ジャパン生成 AI 実用化推進プログラムを通し、AI Agent によるクリエイティブ業務支援ソリューションを開発することができました。また、デザイン関連の企業様と協業し、実際にソリューションをご利用いただくことで、調査業務において約 75 %の効率化を実現し、デザイン案の生成においてもユーザーのアイデア創出をサポートするなどの成果を上げることができました。今後は、頂いたフィードバックを基にした機能改善や、幅広いお客様への業務への適用を目指します。

弊社の生成 AI を活用したクリエイティブ業務支援の取り組みや、本稿の技術的詳細については、以下のブログでも公開しております。是非ご覧下さい。

著者

鯨田 連也
株式会社 NTT データ テクノロジーコンサルティング事業本部 テクノロジーコンサルティング事業部 データサイエンティスト (主任)

伊藤 威
アマゾン ウェブ サービス ジャパン合同会社 ソリューションアーキテクト