Amazon Web Services ブログ
Tag: Big Data
【イベント開催報告】[流通小売/消費財業界向け] 経営の未来を左右するデータ基盤 最新技術の潮流に乗るステップ
みなさんこんにちは。ソリューションアーキテクトの中島です。 本記事では 2025/04/17 に開催された「小売・消費財のお客様向けのデータ分析基盤イベント」の様子を皆様にお伝えさせていただきます。本イベントは「データ分析を始めたいが、まず何から始めたらいいのか分からない。」「データ分析業務を進めているが技術だけでなくさまざまな障壁があり苦労している。」というお客様の声にお応えすべく企画されました。本イベントは AWS ではなくお客様の事例登壇が主体であるという点もユニークです。このイベントでは前半にユーザー企業様の事例登壇をしていただき、後半それをインプットにダッシュボードを描いてみるという構成になっておりました。 それでは以降詳細をご共有いたします。
AWS Lambda と AWS Glue Iceberg REST エンドポイントを使用した PyIceberg による軽量な分析環境の実現
Apache Iceberg は、データレイクで人気の選択肢となっています。ACID (原子性、一貫性、独立性、永続性) トランザクション、スキーマ進化、タイムトラベル機能を提供します。Iceberg テーブルは、Apache Spark や Trino などの様々な分散データ処理フレームワークからアクセスできるため、多様なデータ処理のニーズに対して柔軟なソリューションとなります。そのような Iceberg を扱うためのツールの中で、PyIceberg は分散コンピューティングリソースを必要とせずに、Python スクリプト上でテーブルのアクセスと管理を可能にします。
この投稿では、AWS Glue Data Catalog と AWS Lambda と統合された PyIceberg が、直感的な Python インターフェースを通じて Iceberg の強力な機能を活用するための軽量なアプローチを提供する方法を示します。この統合により、チームはほとんどセットアップやインフラストラクチャの依存関係の設定を行わずとも Iceberg テーブルの操作や利用を開始できることを説明します。
Apache Iceberg on AWS Glue Data Catalog における同時書き込み競合の管理
この記事では、Iceberg テーブルで信頼性の高い同時書き込み処理メカニズムを実装する方法を示します。Iceberg の同時実行モデルを探り、一般的な競合シナリオを検討し、自動再試行メカニズムと、カスタムの競合解決ロジックが必要な状況の両方の実用的な実装パターンを提供して、レジリエントなデータパイプラインを構築します。また、AWS Glue Data Catalog テーブル最適化による自動コンパクションのパターンについても説明します。
Iberdrola が AWS の IoT/エッジサービスを活用して配電設備のインシデントを削減した方法
この記事は、「Iberdrola reduces incidents at power distributio […]
AWS IoT Core と AWS のアナリティクスサービスで TR-069 のバルクデータをインサイトに変える
この記事は Turning TR-069 bulk data into insights with AWS I […]
AWS でモダンなデータ分析ソリューションを構築する方法を学ぼう!
この記事は、2022 年 10 月 27 日に Rohan Patil によって投稿された Learn how […]
ケロッグが次世代のアナリティクスを加速する
ケロッグのグローバルデータ&アナリティクス担当の Garrett Byrne 氏は、「どんな課題にも、必ずチャ […]
AWS のインダストリアルデータプラットフォームを始める
この記事は Dennis Schmidt によって投稿された Getting Started with the […]
ジオテクノロジーズ株式会社の位置情報データレイクにおけるAWSの活用
こんにちは、ソリューションアーキテクトの齋藤です。本稿では、ジオテクノロジーズ株式会社 デジタル本部 ビッグデ […]
フードデリバリーの普及により、レストランのデータインサイトに対するニーズが高まっている
これはカスタムデータ、アナリティクス、クラウドソリューションを専門とするAWS Select Tier Con […]