メインコンテンツに移動

AWS Glue

AWS グルーの AI ヘルプ

AWS GlueでのAmazon Qデータ統合により、自然言語を使用してデータ統合パイプラインを構築することができます。チャットインターフェイスで意図を説明すると、AWS Glue によって完全なジョブが生成されます。1 回のクリックでジョブをテストし、本番環境に移行できます。AWS Glue には、Spark ジョブをモダナイズし、トラブルシューティングを迅速に行えるようにするための生成 AI 機能が追加されました。これにより、差別化につながらないタスクに費やす時間が短縮されます。Apache Spark や SQL の専門家である必要はなく、質問に答えてくれる専門家を待つ必要もありません。 

メリット

データをより迅速に統合

複数のソースにわたるデータの統合には、数日から数か月かかる場合があります。Amazon Q Developer データ統合機能を使用すると、データ統合の知識やコーディングの経験が最小限でデータ統合ジョブを構築できます。手動タスクを抽象化することで、日常的な作業に費やす時間を減らし、データ分析により多くの時間を費やすことができます。

Amazon Q 開発者に必要なものを英語で伝えると、完全なジョブが返されます。たとえば、データ統合機能を使用すると、Amazon Q 開発者に「S3 から JSON ファイルを読み取り、'accountid' に参加して DynamoDB に読み込む」ように依頼すると、そのアクションを実行できるエンドツーエンドのデータ統合ジョブが返されます。生成されたジョブを確認し、サンプルデータセットと照合してテストし、本番環境に移行できます。

デベロッパーの生産性を向上

データ統合の仕事を築くことは始まりに過ぎません。ジョブを作成して本番環境にデプロイしたら、そのジョブの保守とトラブルシューティングを行う必要があります。エラーは、接続、環境、構文、検証、または実行に関連する可能性があります。これらは、統合ジョブを作成、テスト、公開、または実行するときに発生する可能性があります。トラブルシューティングジョブでは、多くの場合、ログファイルを調べたり、監視ダッシュボードにログインしたりする必要があります。

AWS Glue は AI を活用した機能を提供して、Spark ジョブをモダナイズし、トラブルシューティングを迅速に行えるようになりました。新しい Spark バージョンに自動的にアップグレードし、問題が発生したときにインテリジェントな診断を受けることで、デバッグ時間を数日から数分に短縮できます。

専門家によるサポートをすぐに受ける

AWS Glue は、データ統合ライフサイクル全体を通じて AI を活用した支援を提供します。サポートは AWS Glue の深いドメイン知識に基づいて構築されており、データ統合に関連するあらゆることについて専門家レベルのガイダンスを提供します。

組織内の中小企業を待ったり、コンサルタントを雇ったりする代わりに、AWS Glue コンソール、AWS Glue Studio、または API を介していつでも Amazon Q Developer に連絡できます。Amazon Q Developer データ統合機能は、他の AWS サービスとの併用に最適化されています。Amazon DynamoDB、Amazon DocumentDB、Amazon Managed Streaming for Apache Kafka、Amazon Kinesis、Amazon Redshift、Amazon S3 に保存されているデータを抽出、変換、ロードするジョブを簡単に作成できます。

Sparkのアップグレードを簡単に実行

Apache Sparkアップグレードエージェントは、PySparkおよびScalaアプリケーションにおけるAPIの変更や動作の修正を自動的に識別します。エンジニアは、MCP(モデルコンテキストプロトコル)の互換性を利用して、SageMaker Unified Studio から直接、または選択した IDE からアップグレードを開始することができます。アップグレードの過程で、エージェントは既存のコードを分析し、具体的な変更を提案します。エンジニアは実装前にそれを確認して承認することができます。エージェントはデータ品質の検証を通じて機能の正確性を確認します。このエージェントは現在、Spark 2.4 から 3.5 へのアップグレードをサポートしており、アップグレードプロセス全体でデータ処理の精度を維持します。

ユースケース

データ統合のための AI

自分の要件を平易な英語で説明するだけで、本番対応のETLジョブを生成できます。データエンジニアやアナリストは、深いApache Sparkの専門知識がなくても、データ統合ワークフローを迅速に作成できます。データセットの結合、データの集計、さまざまなAWSサービスへのロードなど、一般的なシナリオ向けの完全な実行可能コードを入手できます。

Amazon Q のデータ統合の詳細をご覧ください。

機能を維持しながら、Sparkジョブを自動的に分析して新しいバージョンにアップグレードします。AWS Glueは、スクリプト、設定、依存関係の特定と更新の複雑さを処理し、アップグレードプロジェクトの期間を数ヶ月から数日に短縮します。これにより、手作業の労力をかけずに最新の Spark 機能やセキュリティ強化を活用できます。

Apache Spark の生成 AI アップグレードの詳細をご覧ください。

AI搭載のトラブルシューティングを使って、Sparkジョブの問題を素早く特定し、解決しましょう。AWS Glueは、ジョブのメタデータ、実行ログ、設定を分析して、即時の原因解析と実用的な推奨事項を提供します。これにより、デバッグ時間が数日から数分に短縮され、ドキュメントを詳しく調べたり、サポートを待ったりする必要がなくなります。

Apache Spark の生成 AI トラブルシューティングの詳細をご覧ください。

複雑なコードの解析と変換を行うインテリジェントな自動化エージェントにより、Amazon EMR や AWS Glue 上での Apache Spark のバージョンアップを、数か月単位から数週間単位に加速させます。直感的な会話型インターフェースを通じて、エンジニアはコードの変更を完全に制御しながら、アップグレードの要件を自然に表現でき、従来の手動によるAPI解析、競合解決、アプリケーション検証の負担をなくすことができます。

今日お探しの情報は見つかりましたか?

ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます