Amazon Web Services ブログ
Category: AWS Big Data
AWS Lambda と AWS Glue Iceberg REST エンドポイントを使用した PyIceberg による軽量な分析環境の実現
Apache Iceberg は、データレイクで人気の選択肢となっています。ACID (原子性、一貫性、独立性、永続性) トランザクション、スキーマ進化、タイムトラベル機能を提供します。Iceberg テーブルは、Apache Spark や Trino などの様々な分散データ処理フレームワークからアクセスできるため、多様なデータ処理のニーズに対して柔軟なソリューションとなります。そのような Iceberg を扱うためのツールの中で、PyIceberg は分散コンピューティングリソースを必要とせずに、Python スクリプト上でテーブルのアクセスと管理を可能にします。
この投稿では、AWS Glue Data Catalog と AWS Lambda と統合された PyIceberg が、直感的な Python インターフェースを通じて Iceberg の強力な機能を活用するための軽量なアプローチを提供する方法を示します。この統合により、チームはほとんどセットアップやインフラストラクチャの依存関係の設定を行わずとも Iceberg テーブルの操作や利用を開始できることを説明します。
Apache Iceberg on AWS Glue Data Catalog における同時書き込み競合の管理
この記事では、Iceberg テーブルで信頼性の高い同時書き込み処理メカニズムを実装する方法を示します。Iceberg の同時実行モデルを探り、一般的な競合シナリオを検討し、自動再試行メカニズムと、カスタムの競合解決ロジックが必要な状況の両方の実用的な実装パターンを提供して、レジリエントなデータパイプラインを構築します。また、AWS Glue Data Catalog テーブル最適化による自動コンパクションのパターンについても説明します。
株式会社ディー・エヌ・エーが Amazon Redshift Serverless と dbt を活用して匿名化データの品質テストを最大100倍高速化を実現
本ブログは 2024 年 12 月 17 日に公開された「How DeNA Co., Ltd. acceler […]
Amazon Bedrockを使用し生成 AI メタデータで AWS Glue Data Catalog を強化する
本記事は、2024/11/15 に公開された Enrich your AWS Glue Data Catalo […]
Amazon Redshift Query profiler でクエリ性能診断を簡素化
本記事は、Simplify your query performance diagnostics in Ama […]
ANA グループ 4 万人に展開するデータマネジメント基盤の裏側
はじめに 本ブログは、全日本空輸株式会社と Amazon Web Services Japan が共同で執筆し […]
Amazon OpenSearch Serverless によるあらゆる規模における費用対効果の高い検索機能
Amazon OpenSearch Serverless の今までより安価な新しいエントリーコストを発表できることを喜ばしく思います。
インデクシングと検索のワークロードに対して 0.5 OpenSearch Compute Unit (OCU) がサポートされたことで、エントリーコストが半分になりました。
【開催報告】データガバナンス事例祭り 〜AWS で実現するモダンな取り組み〜
シニア GTM アナリティクススペシャリストソリューションアーキテクトの大薗です。 2024 年 11 月 7 […]
Amazon Athena のパフォーマンスチューニング Tips トップ 10
Amazon Athena は、オープンソースのフレームワークに基づいた対話型分析サービスで、標準の SQL を使って Amazon Simple Storage Service (Amazon S3) に格納されたオープンテーブルおよびファイル形式のデータを簡単に分析できます。この投稿では、クエリのパフォーマンスを向上させるためのヒントのトップ10を紹介します。Amazon S3 へのデータ保存とクエリ特有のチューニングに関連する側面に焦点を当てます。
データエンジニアリングプロフェッショナル認定資格: DeepLearning.AI と AWS による新しいハンズオン専門講座
データエンジニアは、現代のデータ主導の環境において重要な役割を果たし、データインジェストや処理から変換や提供に […]