跳至主要内容

AWS 解决方案库

AWS 上的情绪分析指南

概览

本指南演示了如何使用 pgvector 和 Amazon Aurora PostgreSQL 进行情感分析,这是一项强大的自然语言处理 (NLP) 任务。该指南展示了如何将 Amazon Aurora PostgreSQL 兼容版与 Amazon Comprehend 情绪分析 API 集成,从而通过 SQL 命令实现情绪分析推理。通过使用带有 pgvector 扩展的 Amazon Aurora PostgreSQL 作为向量存储,您可以加快检索增强生成 (RAG) 的向量相似度搜索,使用 pgvector 的分层可导航小世界 (HNSW) 索引将查询的交付速度提高多达 20 倍。

重要:本指南要求使用 AWS Cloud9,新客户不再可用。AWS Cloud9 的现有客户可以继续照常使用和部署本指南。

工作原理

此架构图显示了如何使用启用了 pgvector 的 Amazon Aurora PostgreSQL 兼容版本作为矢量存储来生成情绪分析。它详细介绍了将亚马逊 Aurora 与亚马逊 Comprehend 情绪分析 API 集成以及使用 SQL 命令生成情绪分析推断的过程。

开始使用

部署本指南

使用示例代码在您的 AWS 账户中部署本指南
GitHub 上的开放示例代码

Well-Architected 支柱

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

提供的 CloudF ormation脚本可自动部署关键资源,包括A urora PostgreSQL 集群、 SageMaker 笔记本实例、 AWS Cloud9 实例、虚拟私有云 (VPC)、子网、安全组以及 AWS身份和访问管理 (IAM) 角色。这种自动化部署可简化操作、减轻手动工作量、减少配置错误,从而促进卓越运营。

阅读卓越运营白皮书

IAM 角色将 AuroraAmazon Comprehend 集成,授予所需的最低权限。该角色与 Aurora 集群相关联,并且没有密码或访问密钥等凭证,从而增强了安全性。数据库用户凭证安全地存储在 AWS Secrets Manager 中,防止未经授权的访问和潜在的安全漏洞。

IAM 角色和策略提供从 AuroraAmazon Comprehend 情绪分析 API 进行受控访问的权限,将权限限制在必要范围内。这种访问管理的最低权限方法原则增强了 Guidance 的安全状况。

阅读安全白皮书

带有 pgvector 的 Aurora 可以存储和搜索机器学习(ML)生成的嵌入,同时利用索引和查询等 PostgreSQL 功能。Aurora 通过在三个可用区中维护六个数据副本以及只读副本和全局数据库复制选项来提供高可用性和可靠性。

使用带有 pgvector 的 Aurora,因为向量存储提供向量功能以及数据可靠性和耐用性,无需在单独的向量存储之间移动数据。Aurora 的弹性功能和 pgvector 的功能使您可以将现有的关系数据库用作向量存储,并与 Amazon ComprehendSageMaker 等人工智能(AI)和机器学习(ML)服务无缝集成。

阅读可靠性白皮书

带有 pgvector 的 Aurora PostgreSQL 在关系数据库中提供优化的存储、计算资源和向量索引功能,有助于确保高效的工作负载性能。Aurora 优化型读取功能可以将带有 pgvector 的工作负载的向量搜索性能提高多达九倍,超过常规实例内存。带有 pgvector 的 Aurora 不仅提供向量搜索、索引和情绪分析功能,还提供可实现绝佳查询性能的功能,将关系数据库的优势与向量功能相结合。

阅读性能效率白皮书

SageMaker 提供储蓄计划,可将成本降低多达 64%,此外还为 Studio 笔记本电脑、笔记本电脑实例和推理提供灵活的按需定价。使用 AWS Cloud9 IDE 代替专用的亚马逊弹性计算云 (亚马逊 EC2) 实例可进一步降低成本。此外,Amazon Comprehend API 的按使用付费模式可优化费用。这些服务通过按需型实例和节省计划提供经济高效的选项,以帮助您与预算保持一致。

阅读成本优化白皮书

与同类 EC2 实例相比,AWS Graviton 实例上的 A@@ urora 集群消耗的能量最多可减少 60%,同时提供相同的性能和更好的性价比。本指南使用 AWS Cloud9SageMaker Notebook 等临时资源来减少碳足迹。AWS Cloud9 是一个临时的集成式开发环境(IDE),它将 Aurora 与 Amazon Comprehend 集成,并通过 SQL 语句生成推理,进一步将环境影响降至最低。

阅读可持续发展白皮书

相关内容

利用 pgvector 和 Amazon Aurora PostgreSQL 进行自然语言处理、聊天机器人和情感分析

这篇博文演示了如何使用 LangChain 和 Streamlit 构建用于问答的交互式聊天机器人应用程序,并利用 pgvector 及其与 Aurora Machine Learning 的原生集成进行情感分析。
阅读博客

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。