概览
本指南演示了如何使用 pgvector 和 Amazon Aurora PostgreSQL 进行情感分析,这是一项强大的自然语言处理 (NLP) 任务。该指南展示了如何将 Amazon Aurora PostgreSQL 兼容版与 Amazon Comprehend 情绪分析 API 集成,从而通过 SQL 命令实现情绪分析推理。通过使用带有 pgvector 扩展的 Amazon Aurora PostgreSQL 作为向量存储,您可以加快检索增强生成 (RAG) 的向量相似度搜索,使用 pgvector 的分层可导航小世界 (HNSW) 索引将查询的交付速度提高多达 20 倍。
重要:本指南要求使用 AWS Cloud9,新客户不再可用。AWS Cloud9 的现有客户可以继续照常使用和部署本指南。
工作原理
此架构图显示了如何使用启用了 pgvector 的 Amazon Aurora PostgreSQL 兼容版本作为矢量存储来生成情绪分析。它详细介绍了将亚马逊 Aurora 与亚马逊 Comprehend 情绪分析 API 集成以及使用 SQL 命令生成情绪分析推断的过程。
开始使用
Well-Architected 支柱
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
IAM 角色将 Aurora 与 Amazon Comprehend 集成,授予所需的最低权限。该角色与 Aurora 集群相关联,并且没有密码或访问密钥等凭证,从而增强了安全性。数据库用户凭证安全地存储在 AWS Secrets Manager 中,防止未经授权的访问和潜在的安全漏洞。
IAM 角色和策略提供从 Aurora 对 Amazon Comprehend 情绪分析 API 进行受控访问的权限,将权限限制在必要范围内。这种访问管理的最低权限方法原则增强了 Guidance 的安全状况。
带有 pgvector 的 Aurora 可以存储和搜索机器学习(ML)生成的嵌入,同时利用索引和查询等 PostgreSQL 功能。Aurora 通过在三个可用区中维护六个数据副本以及只读副本和全局数据库复制选项来提供高可用性和可靠性。
使用带有 pgvector 的 Aurora,因为向量存储提供向量功能以及数据可靠性和耐用性,无需在单独的向量存储之间移动数据。Aurora 的弹性功能和 pgvector 的功能使您可以将现有的关系数据库用作向量存储,并与 Amazon Comprehend 和 SageMaker 等人工智能(AI)和机器学习(ML)服务无缝集成。
带有 pgvector 的 Aurora PostgreSQL 在关系数据库中提供优化的存储、计算资源和向量索引功能,有助于确保高效的工作负载性能。Aurora 优化型读取功能可以将带有 pgvector 的工作负载的向量搜索性能提高多达九倍,超过常规实例内存。带有 pgvector 的 Aurora 不仅提供向量搜索、索引和情绪分析功能,还提供可实现绝佳查询性能的功能,将关系数据库的优势与向量功能相结合。
与同类 EC2 实例相比,AWS Graviton 实例上的 A@@ urora 集群消耗的能量最多可减少 60%,同时提供相同的性能和更好的性价比。本指南使用 AWS Cloud9 和 SageMaker Notebook 等临时资源来减少碳足迹。AWS Cloud9 是一个临时的集成式开发环境(IDE),它将 Aurora 与 Amazon Comprehend 集成,并通过 SQL 语句生成推理,进一步将环境影响降至最低。
相关内容
利用 pgvector 和 Amazon Aurora PostgreSQL 进行自然语言处理、聊天机器人和情感分析
免责声明
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量。