Возможности Amazon DocumentDB
Высокая производительность и масштабируемость
Открыть всеAmazon DocumentDB автоматически увеличивает размер тома хранилища при увеличении потребностей кластера в объеме хранилища. Объем тома хранилища может постепенно расширяться (с шагом 10 ГБ) до 4 ПиБ. Выделять избыточный объем хранилища на случай увеличения базы данных документов в будущем не требуется.
Масштабировать вычислительные ресурсы и ресурсы памяти в сторону увеличения или уменьшения можно путем создания новых инстансов реплик требуемого размера либо удаления существующих инстансов за несколько щелчков мышью в консоли управления AWS. Масштабирование вычислительных ресурсов, как правило, занимает лишь несколько минут.
Для обработки большого количества запросов со стороны приложений можно увеличить пропускную способность чтения путем создания реплик чтения базы данных. Таких реплик у каждой базы данных может быть до 15. Реплики Amazon DocumentDB используют то же самое хранилище, что и исходный инстанс. Это позволяет уменьшить затраты и избавляет от необходимости производить операции записи на узлах‑реплики. В результате высвобождается дополнительная вычислительная мощность для обслуживания запросов чтения, а интервал задержки реплики в миллисекундах снижается – часто до однозначных чисел. При этом Amazon DocumentDB предоставляет единый адрес для запросов чтения, благодаря чему приложения могут подключаться без необходимости отслеживать добавления и удаления реплик.
Amazon DocumentDB предлагает гибкую модель документов JSON, различные типы данных и эффективное индексирование. Масштабируемая архитектура сервиса с оптимизацией в оперативной памяти позволяет выполнять быструю оценку запросов к большим наборам документов.
Эластичные кластеры Amazon DocumentDB позволяют обрабатывать миллионы операций по записи и чтению в секунду, что дает клиентам возможность масштабировать свои базы данных документов за считаные минуты почти без простоев и снижения производительности. Также клиенты могут хранить петабайты данных и платить только за потребленные ресурсы без необходимости в управлении базовой инфраструктурой. Благодаря эластичным кластерам Amazon DocumentDB клиентам обеспечивается масштабирование практически любого приложения.
Высокая доступность и надежность
Открыть всеСостояние кластера Amazon DocumentDB и его инстансов постоянно отслеживается. При выходе из строя инстанса, лежащего в основе базы данных, происходит автоматический перезапуск этого инстанса и сопутствующих процессов. Восстановление Amazon DocumentDB не требует воспроизведения журналов повтора базы данных, которое может занимать довольно много времени. В результате перезапуск инстанса обычно занимает не более 30 секунд. Кроме того, кэш базы данных изолирован от ее процессов, благодаря чему он сохраняется при перезагрузке.
При выходе инстанса из строя Amazon DocumentDB автоматически осуществляет резервное переключение на одну из реплик, созданных в любой из трех зон доступности. Поддерживается создание до 15 реплик. При отсутствии реплик Amazon DocumentDB в случае сбоя сервис Amazon DocumentDB автоматически попытается создать новый инстанс.
Глобальные кластеры Amazon DocumentDB обеспечивают аварийное восстановление в результате сбоев в масштабе региона и чтение глобальных данных с низкой задержкой. Сервис Amazon DocumentDB Global Clusters реплицирует данные в кластеры, расположенные в 5 регионах AWS, почти не влияя на производительность, со стандартной задержкой длиной менее одной секунды. Подробнее о настройке глобальных кластеров см. в руководстве пользователя Amazon DocumentDB.
Каждый блок тома хранилища в 10 ГБ шестикратно реплицирован в трех зонах доступности. Отказоустойчивое хранилище Amazon DocumentDB автоматически обрабатывает потерю до двух копий данных без снижения доступности базы данных для операций записи и до трех копий – без снижения доступности для операций чтения. Кроме того, хранилище Amazon DocumentDB является самовосстанавливающимся: блоки данных и диски постоянно проверяются на наличие ошибок и автоматически заменяются.
Простая возможность резервного копирования базы данных в Amazon DocumentDB обеспечивает восстановление кластера на момент времени. Клиенты могут восстанавливать кластер по состоянию на любую секунду периода хранения до последних пяти минут использования. Настраиваемый период хранения автоматически созданных резервных копий может составлять до 35 дней. Автоматические резервные копии сохраняются в сервисе Amazon Simple Storage Service (Amazon S3), который обеспечивает надежность на уровне 99,999999999 %. Резервное копирование в Amazon DocumentDB выполняется автоматически, инкрементно и непрерывно, не отражаясь на производительности кластера.
Снимки состояния кластера – это инициированные пользователем резервные копии кластера, хранимые в Amazon S3 до момента их преднамеренного удаления. Они используют автоматизированные инкрементные снимки состояния для ускорения создания и уменьшения требований к хранилищу. При желании клиенты могут в любой момент создать новый кластер из снимка состояния кластера.
Высокий уровень безопасности
Открыть всеAmazon DocumentDB работает в виртуальном частном облаке Amazon (VPC), что позволяет изолировать кластер в собственной виртуальной сети и подключиться к локальной ИТ‑инфраструктуре с использованием виртуальных частных сетей (VPN) со стандартным шифрованием IPsec. Кроме того, конфигурация Amazon DocumentDB в VPC позволяет настроить параметры брандмауэра и управлять сетевым доступом к кластеру.
Amazon DocumentDB поддерживает шифрование баз данных с использованием ключей, создаваемых и управляемых пользователем с помощью Сервиса управления ключами AWS (KMS). В кластере Amazon DocumentDB с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. По умолчанию соединения между клиентом и Amazon DocumentDB шифруются при передаче данных с помощью TLS.
Сервис Amazon DocumentDB разработан в соответствии с самыми строгими стандартами безопасности, что позволяет клиентам проверить наш уровень безопасности и выполнить свои обязательства по соответствию нормативным требованиям. Проверка Amazon DocumentDB показала его соответствие стандартам PCI DSS, ISO 9001, 27001, 27017 и 27018, SOC 1, 2 и 3, а также сертификации Health Information Trust Alliance Common Security Framework (HITRUST CSF). Кроме того, этот сервис соответствует требованиям HIPAA.
Экономичность
Открыть всеПри использовании Amazon DocumentDB у вас нет никаких предварительных обязательств. Вы платите почасово за каждый запущенный инстанс, а когда закончите работу с инстансом Amazon DocumentDB, то можете удалить его или приостановить. Необходимости выделять избыточный объем хранилища нет, поэтому оплате подлежит только тот объем, который фактически используется. Более подробные сведения см. на странице цен на Amazon DocumentDB.
Amazon DocumentDB предлагает оптимизированную для ввода-вывода конфигурацию хранилища для тех, кто ищет предсказуемые цены. Конфигурация Amazon DocumentDB, оптимизированная для ввода-вывода база данных, которая обеспечивает снижение затрат на 40 % для приложений с интенсивным вводом-выводом, где плата за данные операции превышает 25 % от общих расходов на базу данных Amazon DocumentDB, оптимизированную для ввода-вывода. С помощью конфигурации Amazon DocumentDB, оптимизированной для ввода-вывода, вы можете эффективно устранить неопределенность переменных расходов на ввод-вывод в структуре выставления счетов. Вместо этого вы платите только за вычислительные ресурсы, хранение и резервное копирование, что обеспечивает предсказуемость и прозрачность цен.
Amazon DocumentDB позволяет выбирать между стандартной конфигурацией и конфигурацией хранилища, оптимизированной для ввода-вывода, для кластера баз данных. Гибкость позволяет максимизировать соотношение цены и качества, выбрав подходящую конфигурацию в соответствии с вашими потребностями. Если ваше приложение выполняет небольшое или умеренное количество операций ввода-вывода, следует выбрать стандартную конфигурацию. Если ваш пример использования требует рабочих нагрузок со множеством операций ввода-вывода, вы можете выбрать конфигурацию хранилища, оптимизированную для ввода-вывода.
Совместимость с MongoDB
Открыть всеСервис Amazon DocumentDB совместим с драйверами и инструментами MongoDB 3.6, 4.0 и 5.0. Большую часть приложений, драйверов и инструментов, которые клиенты применяют при работе с нереляционными базами данных MongoDB с открытым исходным кодом, можно использовать в Amazon DocumentDB. Amazon DocumentDB эмулирует ответы, ожидаемые клиентом от сервера MongoDB, с помощью интерфейса API MongoDB 3.6, 4.0 и 5.0 (предоставляемого с открытым исходным кодом по лицензии Apache 2.0) на специализированной распределенной отказоустойчивой системе хранилищ с возможностью самостоятельного восстановления. Такая система обеспечивает производительность, масштабируемость и доступность, необходимые при работе с критически важными рабочими нагрузками MongoDB при любом масштабе. Подробнее о поддерживаемых API MongoDB.
Благодаря возможностям геопространственных запросов клиентам Amazon DocumentDB доступно хранение и индексирование геопространственных данных, а также создание запросов к ним. Можно создавать индексы 2dsphere и использовать популярные геопространственные API MongoDB, такие как $nearSphere, $geoNear, $minDistance, $maxDistance, чтобы выполнять запросы к хранящимся в DocumentDB данным.
ACID (атомарность, непротиворечивость, изолированность, долговечность) – это набор параметров транзакций базы данных, которые обеспечивают достоверность данных вне зависимости от ошибок, сбоев питания и других неполадок. Благодаря реализации совместимости с MongoDB 4.0 Amazon DocumentDB теперь поддерживает возможность выполнять транзакции ACID для нескольких документов, выражений, коллекций и баз данных одновременно.
С помощью Сервиса миграции баз данных AWS (DMS) клиенты могут с минимальным временем простоя перенести свои базы данных MongoDB, размещенные как локально, так и в Amazon Elastic Compute Cloud (EC2), в сервис Amazon DocumentDB. DMS позволяет выполнить миграцию сегментированного кластера или набора реплик MongoDB в Amazon DocumentDB. Подробнее о переносе реляционных и нереляционных баз данных в Amazon DocumentDB см. в разделе Миграция в Amazon DocumentDB.
Полностью управляемый сервис
Открыть всеНачать работу с Amazon DocumentDB очень просто. Достаточно запустить новый кластер Amazon DocumentDB с помощью консоли управления AWS. Для инстансов Amazon DocumentDB предварительно настроен набор параметров и установок, соответствующих выбранному классу инстанса. Можно запустить кластер и подключить приложение. Процесс занимает несколько минут и не требует дополнительной настройки.
Amazon DocumentDB предоставляет метрики Amazon CloudWatch для инстансов облачных баз данных. В консоли управления AWS доступны для просмотра более 40 основных рабочих метрик кластера, включая использование вычислительных ресурсов, памяти и хранилища, пропускную способность запросов, счетчики операций MongoDB и активные соединения.
Amazon DocumentDB будет обновлять базу данных до последней версии ПО со всеми установленными исправлениями. Система управления версиями ядра базы данных позволяет указать в настройках, должны ли в кластере применяться исправления, и если да, то когда именно.
Генеративный искусственный интеллект
Открыть всеС помощью векторного поиска для Amazon DocumentDB можно хранить, индексировать и искать миллионы векторов с миллисекундным временем отклика. Вектор – это числовое представление, отражающее семантическое значение неструктурированных данных, таких как текст, изображения и видео. Можно хранить векторные изображения из Amazon Bedrock, Amazon SageMaker и других сторонних или фирменных моделей. Узнайте, с чего начать, изучив нашу документацию по векторному поиску Amazon DocumentDB.
Amazon DocumentDB интегрируется с Amazon SageMaker Canvas, что упрощает создание генеративных приложений с использованием данных, хранящихся в Amazon DocumentDB. Интеграция в консоль устраняет необходимость в подключении и доступе к Amazon DocumentDB, что позволяет ускорить разработку искусственного интеллекта и машинного обучения без необходимости писать код. В SageMaker Canvas вы можете создавать модели искусственного интеллекта и машинного обучения для классических сценариев использования, таких как регрессия и прогнозирование, или создавать решения посредством генеративного искусственного интеллекта, такие как производство контента, извлечение и суммирование текста. Ознакомьтесь с документацией Amazon DocumentDB по генеративному искусственному интеллекту, чтобы узнать больше.
Интеграция с нулевым использованием ETL между Amazon DocumentDB и сервисом Amazon OpenSearch дает новые возможности для поиска (например, нечеткий или семантический поиск) в документах Amazon DocumentDB через API OpenSearch. Благодаря этой интеграции вы также можете выполнять поиск уникальных значений во всех коллекциях и на языках, отличных от английского. Теперь всего за несколько щелчков мышью в Консоли AWS вы можете легко синхронизировать данные из Amazon DocumentDB в сервис Amazon OpenSearch, избавляясь от необходимости писать код для извлечения, преобразования и загрузки данных.
Интеграция с нулевым использованием ETL выполняется через сервис Amazon OpenSearch Ingestion, который перемещает данные документов из Amazon DocumentDB в сервис Amazon OpenSearch. Он автоматически определяет формат данных в коллекциях Amazon DocumentDB и сопоставляет эти данные с сервисом Amazon OpenSearch для наиболее эффективных результатов поиска. Интеграция с нулевым использованием ETL позволяет консолидировать несколько коллекций Amazon DocumentDB в бессерверную коллекцию или управляемый кластер Amazon OpenSearch. Вы можете ознакомиться с нашей документацией по работе с интеграцией с нулевым использованием ETL между Amazon DocumentDB и сервисом Amazon OpenSearch.