Особенности архитектуры хранилища в озере данных

Темы страниц

Общие вопросы

Общие вопросы

Открыть все

Получайте гибкий доступ к данным и запрашивайте их по месту, используя любые инструменты и движки, совместимые с Apache Iceberg, по собственному выбору.

Выполняйте аналитику и рабочие нагрузки машинного обучения, включая задания Apache Spark, панели управления SQL, модели машинного обучения и приложения на основе генеративного искусственного интеллекта, в одной копии данных, сохраняя их в формате, наиболее подходящем для ваших рабочих нагрузок.

За счет совместимости с Apache Iceberg все данные полностью поддерживают стандарт ACID (атомарность, согласованность, изолированность, долговечность), что обеспечивает высокую производительность SQL-аналитики.

Выполняйте федеративные запросы к данным, которые хранятся в различных сторонних источниках, таких как Google BigQuery, SQL Server и Snowflake, чтобы получать к ним доступ и запрашивать их по необходимости.

Получите гибкость озера данных и производительность хранилища данных, не изменяя существующую архитектуру данных. Используйте максимально оптимизированное хранилище Amazon Redshift и вторичные структуры данных (например, материализованные представления) для ускорения SQL-аналитики в озерах данных.

Перенесите данные из оперативных баз данных, таких как Amazon DynamoDB, Amazon Aurora MySQL, Amazon Aurora PostgreSQL, Amazon RDS для MySQL, и приложений, в том числе Salesforce, ServiceNow и Zendesk, в хранилище в озере данных через интеграцию с нулевым использованием ETL для аналитики почти в режиме реального времени.

Установите подробные разрешения один раз, и они будут применяться ко всем вашим данным во всех аналитических инструментах и движках.