跳至主要内容

AWS 解决方案库

使用 AWS Clean Rooms 将 CDP 连接到数据湖的指南

概览

本指南展示了如何使用客户数据平台(CDP)让第一方营销数据与发布合作伙伴的第三方数据建立协作。通过使用 AWS Clean Rooms 协作,CDP 可以促进 AWS 上不同数据湖之间的连接。营销人员可以将他们的数据上传到 CDP 应用程序,然后使用该应用程序根据汇编的数据运行报告,帮助他们调动受众。

工作原理

此架构图显示了使用客户数据平台 (CDP) 的营销人员如何与出版合作伙伴建立 AWS Clean Rooms 合作,直接合并第一和第三方客户数据。

Well-Architected 支柱

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

Amazon CloudWatch 可以持续监控操作并允许访问日志文件,它是可配置的,因此您可以监控 AWS Clean Rooms 的可靠性、可用性和性能。AWS CloudTrail 会自动跟踪事件历史记录,使您能够访问有关谁向 AWS Clean Roo ms 提出了请求、发出请求的 IP 地址、何时提出请求以及其他详细信息的信息。您还可以配置事件跟踪,获取跟踪 API 请求的更多详细信息。

阅读“卓越运营”白皮书

本指南允许您使用范围缩小的 AWS 身份和访问管理 (IAM) 策略为特定的用户和角色提供访问权限。使用 IAM 时,您可以按最低权限原则来限制能在 AWS Clean Rooms 上访问和运行查询的用户。

阅读《安全性》白皮书

Amazon S3 跨可用区存储多个数据副本,为 S3 存储桶中存储的数据提供 99.999999999% 的持久性。此外,AWS G lue 和 AWS Clean Roo ms 是无服务器的,完全由 AWS 管理,因此整个基础设施具有弹性、高可用性和容错能力,具有内置的可靠性和灵活性。

阅读《可靠性》白皮书

AWS Glue 爬网程序支持快速扫描和定义数据模式,并将这些模式注册到 Data Catalog 中。这些爬网程序可配置为按计划运行或使用调用来搜寻源数据。AWS Glue 还可配置为在 AWS Glue 任务 worker 的指定范围内进行纵向扩展或缩减,以便 AWS Glue 只使用所需的计算容量。AWS Clean Rooms 支持快速、安全地共享数据子集,而且它只提供执行查询所需的容量。

阅读《性能效率》白皮书

Amazon S3 为构建数据湖和存储数据提供低成本存储。它还提供不同的存储层和生命周期策略来优化存储。例如,您可以使用 Amazon S3 Intelligent-Tiering 根据使用情况提供自动数据存档,或者实施生命周期策略在存储层之间移动数据,从而帮助您优化成本。此外,本指南使用即用即付服务,您只需为消耗量支付费用。

阅读《成本优化》白皮书

AWS Clean Rooms 使您能够只共享数据子集,从而减少跨多个平台复制数据的需求。本指南减少了 CDP 创建可能需要额外计算资源的自定义解决方案的需求。AWS GlueAWS Clean Rooms 都是无服务器服务,因此可以无缝扩展以满足计算需求,例如仅预置运行查询所需的计算资源。这可避免不必要的计算和资源浪费,从而最大限度地减少所需的碳排放量。

阅读《可持续性》白皮书

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

本指南中提及的第三方服务或组织并不意味着亚马逊或 AWS 与第三方之间的认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。