跳至主要内容

AWS 解决方案库

AWS 上电子商务产品相似度搜索指南

概览

本指南介绍如何通过将 AWS 和人工智能(AI)服务与 pgvector 扩展集成,创建具有相似度搜索功能的产品目录。作为 PostgreSQL 的开源扩展,pgvector 增加了在向量嵌入中存储和搜索点以及查找与这些点最相似或“最近邻”的功能。借助最近邻搜索功能,可在 PostgreSQL 数据库中使用语义来支持各种智能应用程序和数据分析。如下所示,通过将 pgvector 与 AWS 服务集成,可进行纯图像以及文本转图像的相似度搜索,从而让消费者的购物体验更加个性化、更具相关性以及更高效。

重要:本指南要求使用 AWS Cloud9,新客户不再可用。AWS Cloud9 的现有客户可以继续照常使用和部署本指南。

工作原理

此架构图显示了如何构建具有相似性搜索功能的产品目录。它使用人工智能(AI)、亚马逊 SageMaker、适用于 PostgreSQL 的亚马逊 RDS 和 pgvector 扩展。

开始使用

示例代码

使用示例代码在您的 AWS 账户中部署本指南
了解更多

Well-Architected 支柱

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

SageMaker 简化了机器学习模型生命周期管理,使您能够快速适应不断变化的数据和用户需求。带有 pgvector 扩展的 RDS for PostgreSQL 提供了强大的数据存储和高效的最近邻搜索功能,因此您可以向消费者提供准确、及时的搜索结果。这些服务共同简化了搜索体验的部署、监控和维护。

阅读卓越运营白皮书

RDS for PostgreSQL 使用行业标准加密协议保护您的数据,而 SageMaker 提供内置安全控件,以安全地管理模型训练和部署流程。

我们建议您使用 AWS 身份和访问管理 (IAM) 来控制对您的 AWS 资源的访问权限,并使用 A WS Secrets Manager 保护敏感证书。

阅读安全白皮书

RDS for PostgreSQL 提供高可用性和耐久性,通过自动备份、数据库快照和多可用区 (AZ) 部署来增强容错能力。此外,SageMaker 允许您跨可用区配置多个实例,以实现机器学习操作的高可用性并快速从故障中恢复。

阅读可靠性白皮书

SageMaker 支持近乎实时的推理和对用户查询的低延迟响应。 带有 pgvector 扩展的 RDS for PostgreSQL 可实现对向量嵌入的高效管理和查询,从而显著加快将用户查询与产品目录匹配所需的相似度搜索速度。

我们建议您使用 A mazon CloudWatch 和 AWS A uto Scaling 等 AWS 服务持续监控和优化系统性能,以便本指南中的组件保持响应速度和成本效益。

阅读性能效率白皮书

SageMaker 通过提供按使用量付费的托管服务,以及针对特定工作负载进行了优化的实例类型,从而帮助降低成本。此外,RDS for PostgreSQL 通过预留实例和扩展选项提供成本效益,这些选项可根据您的数据库工作负载调整资源,最大限度地减少不必要的开支。此外,您可以实施成本监控和优化策略,例如 AWS 预算和 AWS Cost Explorer ,以持续识别和解决潜在的成本效率低下问题。

阅读成本优化白皮书

SageMaker RDS for PostgreSQL 是 AWS 托管服务,通过高效处理工作负载来优化资源使用,通过最大限度地减少工作负载所需的计算资源来减少对环境的影响。通过在 AWS 云中部署本指南,您可以避免采购物理硬件,从而进一步增强系统的整体可持续性。此外,使用AWS CloudTrail和A WS Config 等AWS服务来监控和执行可持续实践,例如资源利用率和能源效率。

阅读可持续发展白皮书

相关内容

使用 Amazon SageMaker 和 pgvector 在 PostgreSQL 中构建人工智能驱动的搜索

本博文演示了如何通过将 Amazon SageMaker 与 Amazon Relational Database Service(Amazon RDS)for PostgreSQL(带 pgvector 扩展)集成来创建产品目录相似度搜索解决方案。

阅读博客

免责声明

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。