Amazon Web Services ブログ

Tag: AWS Glue

AWS Lambda と AWS Glue Iceberg REST エンドポイントを使用した PyIceberg による軽量な分析環境の実現

Apache Iceberg は、データレイクで人気の選択肢となっています。ACID (原子性、一貫性、独立性、永続性) トランザクション、スキーマ進化、タイムトラベル機能を提供します。Iceberg テーブルは、Apache Spark や Trino などの様々な分散データ処理フレームワークからアクセスできるため、多様なデータ処理のニーズに対して柔軟なソリューションとなります。そのような Iceberg を扱うためのツールの中で、PyIceberg は分散コンピューティングリソースを必要とせずに、Python スクリプト上でテーブルのアクセスと管理を可能にします。

この投稿では、AWS Glue Data Catalog と AWS Lambda と統合された PyIceberg が、直感的な Python インターフェースを通じて Iceberg の強力な機能を活用するための軽量なアプローチを提供する方法を示します。この統合により、チームはほとんどセットアップやインフラストラクチャの依存関係の設定を行わずとも Iceberg テーブルの操作や利用を開始できることを説明します。

Apache Iceberg on AWS Glue Data Catalog における同時書き込み競合の管理

この記事では、Iceberg テーブルで信頼性の高い同時書き込み処理メカニズムを実装する方法を示します。Iceberg の同時実行モデルを探り、一般的な競合シナリオを検討し、自動再試行メカニズムと、カスタムの競合解決ロジックが必要な状況の両方の実用的な実装パターンを提供して、レジリエントなデータパイプラインを構築します。また、AWS Glue Data Catalog テーブル最適化による自動コンパクションのパターンについても説明します。

J.フロント リテイリングにおけるデータアナリスト育成の取り組みについて

本稿では、J.フロント リテイリング株式会社が取り組んでいるデジタル人財育成の中で、 AWS 上に構築した統合データ基盤を活用したデータアナリスト育成の取り組みについて紹介します。

統合データ基盤構成図

J.フロント リテイリングにおける統合データ基盤を活用したカスタマー・データドリブン経営の取り組み

本稿では、J.フロント リテイリング株式会社(以後、JFR)が、 AWS 上に構築した「統合データ基盤」を活用したカスタマー・データドリブン経営の取り組みについて紹介します。

AWS Glue Studio ノートブックが Amazon CodeWhisperer と統合。AI コーディング支援を活用してデータ統合ジョブを迅速に構築

AWS は Amazon CodeWhisperer の一般提供を発表しました。Amazon CodeWhisperer は、内部で生成系 AI ・基盤モデルを使用して開発者の生産性を向上させる AI コーディング支援サービスです。これは、自然言語による開発者のコメントと、統合開発環境 (IDE) 内にすでに記述されたプログラムコードに基づいて、リアルタイムで AI がコードの候補を自動生成して提案します。