跳至主要内容

Amazon Bedrock AgentCore(预览版)常见问题

一般性问题

全部打开

AgentCore 使开发人员能够将人工智能代理快速推向生产阶段,同时具备规模性、可靠性和安全性,这些特性对于实际应用的部署至关重要。AgentCore 提供服务和工具,旨在使代理发挥更出色的作用并具备更强的能力,提供专为安全扩展代理而设计的基础设施,并提供控制机制以确保代理运行可靠。AgentCore 的服务和工具具有可组合性,能够与任何开源框架以及任何模型协同工作,因此您无需在开源灵活性与企业级安全性和可靠性之间做选择。

AgentCore 是为那些希望将基于开源或自定义代理框架构建的人工智能代理从概念验证阶段推进至实际应用的组织而设计的。它为那些需要强大基础设施以在运行时支持动态执行路径、需要监控行为的控制机制、需要强大工具来增强代理以及需要具备适应环境变化能力的开发人员和企业服务。

AgentCore 包含一系列服务和工具,它们具备独特的功能。其中包括:

Runtime:一种安全且无服务器的运行时系统,专为部署和扩展动态人工智能代理及工具而设计。

Memory:使得开发人员能够轻松地构建具备情境感知能力的人工智能代理,因为它消除了复杂的内存基础设施管理环节,同时还能让开发人员完全控制人工智能代理所记忆的内容。

Gateway:为开发人员提供了一种简便且安全的方式,使他们能够大规模地构建、部署、发现以及连接各类工具。

Browser 工具:提供一种快速、安全且基于云的浏览器运行时系统,使人工智能代理能够大规模地与网站进行交互。

Code Interpreter:使人工智能代理能够在沙盒环境中安全地编写和执行代码,从而提高其准确性,并增强其解决复杂的端到端任务的能力。

Identity:使人工智能代理能够通过强大的访问控制机制安全地访问工具和服务,同时简化代理开发流程并提升用户体验。

Observability:让开发人员能够全面了解代理的工作流程,从而能够跟踪、调试和监控人工智能代理在生产环境中的运行表现。

AgentCore 既可与自定义框架配合使用,也能与诸如 CrewAI、LangGraph、Strands Agents、LlamaIndex 等常见的开源框架以及自定义框架协同工作。

AgentCore 支持模型上下文协议(MCP),而代理 2 代理协议的支持功能也将很快推出。 尽管 MCP 在 OpenAI 和 Microsoft 的采用过程中已拥有一定的市场优势,它还提供了无状态、有状态和流式传输通信、Webhook 以及输出模式结构等功能。AgentCore 的目标是让 AWS 成为无论采用何种协议都能作为托管人工智能代理的首选平台。

AgentCore 设计时就考虑到了模型的通用性,能够与 Amazon Bedrock 内外的任何基础模型(包括 OpenAI、Google 的 Gemini、Anthropic 的 Claude、Amazon 的 Nova、Meta Llama 以及 Mistral 等模型)协同工作。

Strands Agents 使开发人员能够充分利用现代模型在规划、推理和工具使用方面的能力,同时通过一个简单的 SDK 与 AgentCore 服务实现无缝集成。开发人员只需几行代码即可连接到 AgentCore Gateway、配置内存存储并部署代理。

AgentCore 预览版目前已在美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(悉尼)和欧洲地区(法兰克福)推出。

AgentCore 能够加快开发过程,因为它能省去数月的无差别的基础设施工作。平均而言,只需几行代码,它就能与包括 LangChain、Strands Agents 和 CrewAI 在内的任何框架进行集成,并提供诸如 Browser 工具、Code Interpreter 和 Memory 等服务及工具。通过快速部署和自动化的基础设施预置,开发人员能够专注于创建,而无需过多关注运营工作。AgentCore 支持任何开源框架和基础模型,并能确保与开源协议的兼容性,从而将开发时间从数月缩短至数小时。

如果您现在正在使用 Amazon Bedrock Agents,您可以继续使用它。话虽如此,但 AgentCore 具备更强大的功能,其中包括对任何开源框架的支持,例如 Strands Agents、LangChain、LangGraph、LlamaIndex 和 CrewAI。它还提供了极大的灵活性,允许您使用任何您选择的模型,并且能够对身份、记忆和可观测性进行精细控制。

AgentCore 还提供了用于大规模运行代理的升级工具和基础设施,包括身份认证、可自定义的长期记忆、增强的代码解释器工具、内置的浏览器工具、可观测性、对模型上下文协议的原生支持(以便连接至数千个工具),以及具有业界领先执行时间、有效载荷大小和完整会话隔离的运行时系统。

VPC(虚拟私有云)连接能够为客户在私有网络环境中提供安全的资源访问权限。AgentCore 服务计划与 VPC 集成,以确保代理与内部资源之间的通信安全可靠。

Runtime

全部打开

AgentCore Runtime 是一种安全的、无服务器的运行时系统,专为使用任何开源框架(包括 CrewAI、LangGraph 和 Strands Agents)、任何协议和任何模型部署和扩展动态人工智能代理及工具而设计。开发人员能够安全且可靠地运行任何类型的代理,包括多模态、实时或长时间运行的代理。Runtime 具有高度的可靠性,具备检查点和恢复功能,能够确保在出现意外中断和故障时实现平稳恢复。它能够在数秒内纵向扩展至数千个代理会话,因此开发人员无需担心基础设施的管理问题,只需按实际用量付费即可。通过为每个用户交互提供专用的执行环境来实现完全的会话隔离,从而有效保护敏感数据。AgentCore Runtime 还能与 Amazon Cognito、Microsoft Entra ID 和 Okta 等领先的身份提供者,以及 Google 和 GitHub 等常见的 OAuth 提供商实现无缝集成。它还支持各种身份验证方式,包括 OAuth 令牌、API 密钥以及 IAM 角色等,因此开发人员无需构建自定义安全基础设施。

1/无服务器浏览器基础设施:使用您所首选的开源框架、模型和工具即可部署并托管任何人工智能代理或工具,无需管理任何基础设施,从而加快部署速度,并让开发人员能够专注于构建创新的代理。

2/从实时代理式工作负载无缝扩展到数小时代理式工作负载:AgentCore Runtime 既支持低延迟的交互式体验,也支持运行长达 8 小时的复杂异步工作负载,并且能够处理各种模式的有效载荷。AgentCore Runtime 能够自动实现从零到数百万并发会话的扩展,从而省去了容量规划和基础设施维护的工作。

3/通过企业级的隔离和身份控制措施来保障工作负载的安全性:通过全面的会话隔离来保护敏感数据,为每次用户交互提供专用的计算环境。AgentCore Runtime 还能与您现有的身份提供者(Amazon Cognito、Okta 和 Microsoft Entra ID)无缝集成,以限制哪些用户能够对您的代理进行身份验证,并管理诸如 Salesforce、Github 和 Stripe 等下游服务的凭证,从而提供安全保障而不增加开发成本。

Gateway

全部打开

人工智能代理需要各种工具来执行各种实际任务——从查询数据库到发送消息,再到分析文档。借助 Amazon Bedrock AgentCore Gateway,开发人员能够将 API、Lambda 函数以及现有的服务转换为与 MCP 兼容的工具,并通过网关端点以寥寥几行代码将其提供给代理使用。Gateway 支持 OpenAPI、Smithy 和 AWS Lambda 作为输入类型,并且是唯一一款能在完全托管的服务中同时提供全面的入口身份认证和出口身份认证的解决方案。Gateway 还提供与多个热门工具的一键式集成功能,例如 Salesforce、Slack、Jira、Asana 和 Zendesk。Gateway 能够省去数周的自定义代码开发、基础设施预置以及安全措施实施等繁琐流程,从而使开发人员能够专注于构建创新的代理应用程序。

1/简化工具开发和集成:只需几行代码,即可将现有的企业资源转换为适用于代理的工具。开发者无需花费数月时间编写自定义的集成代码并管理基础设施,而是可以专注于构建独特的代理功能,而 AgentCore Gateway 则负责处理企业规模下那些千篇一律且繁重的任务,如工具管理和安全事宜。

2/通过统一访问加速代理开发:使您的代理能够通过一个安全的单一端点来发现并使用各种工具。通过将多种工具源(从 API 到 Lambda 函数)整合到一个统一的界面中,开发人员能够更快地构建和扩展代理工作流程,而无需管理多个工具连接或重新实现集成。

3/借助智能工具发现功能,从容实现扩展:随着您工具集合的不断扩大,通过基于情境的搜索功能,帮助您的代理找到并使用合适的工具。内置的语义搜索功能有助于代理根据其任务情境有效地利用可用工具,从而提高代理的性能,并大规模降低开发的复杂性。

AgentCore Gateway 内置了语义搜索功能,有助于代理确定最适合其任务的工具,并支持基于元数据的筛选,以便根据诸如风险等级等标准管理工具访问权限,从而提高代理的工作效率和安全性。

AgentCore Gateway 使开发人员能够通过一个统一的界面引入各种各样的工具。其中包括 AWS 服务(S3、DynamoDB、Aurora、Redshift、Lambda)、第一方工具(Browser 工具、Code Interpreter)和第三方服务。开发人员还可以通过 API 规范、函数代码、MCP 服务器、OpenAPI、Smithy、Lambda 函数或基于 ECR 镜像的容器化解决方案等方式集成自定义工具。

AgentCore Gateway 提供多种身份验证方法,包括基于 IAM 的身份验证方法、OAuth 2.1 和 API 密钥。它在不同的身份提供者之间提供安全的凭证交换机制。通过与 AgentCore Observability 的集成,客户能够全面了解身份验证事件、工具调用以及访问模式等详细信息。Gateway 还支持 Web 应用程序防火墙功能,可通过可配置的 Web ACL 来过滤恶意请求。有关更多详细信息,请访问 AgentCore Gateway 文档的链接。

AgentCore Gateway 与 AgentCore Runtime 配合使用以实现安全的工具执行;与 AgentCore Identity 配合使用,以进行身份验证和授权;并与 AgentCore Observability 协同工作,以提供全面的指标和审计日志。Gateway 还支持与 AWS Marketplace 集成以进行部署。通过这些集成,开发人员能够通过一个统一的界面访问各种工具和服务,同时还能保持企业级的安全性和监控能力。

Memory

全部打开

AgentCore Memory 使开发人员能够轻松构建具有情境感知能力的代理。它使代理能够同时保留多轮对话的短期记忆以及跨会话持续存在的长期记忆,并且能够实现不同协作代理之间的记忆存储共享。该服务通过预先定义的内存管理器模板和内存创建规范提供独特的灵活性,使开发人员能够精确地确定应捕获和存储哪些信息。凭借能够处理向量嵌入和内存整合的托管型基础设施,以及诸如可观测性的企业功能,AgentCore Memory 省去了基础设施管理。

1/消除了基础设施管理:AgentCore Memory 使开发人员无需再管理复杂的内存基础设施。开发人员只需几行代码即可存储和检索内存,而 AgentCore 则会自动在后台处理向量嵌入、存储以及记忆整合等工作。

2/企业级:AgentCore Memory 为开发人员提供了企业级的功能,其中包括内置的可观测性功能,用于追踪内存操作,以及命名空间组织功能,用于在不同的应用情境中实现精确的内存隔离和共享。

3/深度自定义:AgentCore Memory 为开发人员提供了两种选择:一是使用预先定义的策略来保持用户偏好和会话历史信息在不同会话中的一致性;二是利用他们首选的 LLM 模型和提示创建自定义提取逻辑,以准确捕捉其应用场景中真正重要的内容。

Code Interpreter

全部打开

AgentCore Code Interpreter 工具使人工智能代理能够在沙盒环境中安全地编写和执行代码,从而提高其准确性,并增强其解决复杂的端到端任务的能力。Code Interpreter 配备了针对多种语言的预构建运行时系统以及一系列高级功能,包括大文件支持和互联网访问功能。开发人员可以自定义会话属性以满足安全要求。Code Interpreter 通过自动化的基础设施管理、预构建运行时系统以及集成的安全控制措施,减少了人工干预的需求,同时还能实现复杂的人工智能开发,且不会影响安全性或性能。

1/安全地执行代码:开发能够在一个独立的沙盒环境中执行复杂工作流程和数据分析的代理,同时能够访问内部数据来源,而不泄露敏感数据或破坏安全性。

2/大规模数据处理:在处理大型数据集时,开发人员能够轻松地引用存储在 Amazon S3 中的文件,从而能够高效地处理千兆字节规模的数据量,且不受 API 的限制。

3/易于使用:提供了一种完全托管的默认模式,其中包含预构建的执行运行时系统,这些运行时系统支持诸如 JavaScript、TypeScript 和 Python 等常用编程语言,并且还预先安装了常见的代码库。

Browser 工具

全部打开

AgentCore Browser 工具提供了一款快速、安全且基于云的浏览器,使人工智能代理能够大规模地与网站进行交互。它具备企业级的安全特性,其中包括虚拟机级别的隔离功能。该工具通过实时查看、CloudTrail 日志记录以及会话回放等功能提供内置的可观测性功能,从而能够轻松进行故障排查、保持质量以及支持合规性。通过自动扩缩功能,AgentCore Browser 工具能够消除基础设施方面的开销,同时还能帮助维持严格的安全和合规性标准。

1/无服务器浏览器基础设施:为人工智能代理提供一个快速且完全托管的浏览器,该浏览器能够自动扩展,无需基础设施方面的开销。

2/企业级安全性:
Browser 工具通过虚拟机级别的隔离沙盒以及强大的审计功能来提供全面的安全保障,并且还具备会话级别隔离之类的高级特征

3/企业可观测性
:能够轻松诊断问题、维持质量控制并确保合规性,同时具备实时监控功能,并能完整记录所有浏览器互动的全过程,无论是由代理还是人类执行的。

Identity

全部打开

AgentCore Identity 是一项安全且可扩展的代理身份与访问管理服务,它能够加快人工智能代理的开发进程,同时降低构建安全基础设施时通常所需的自定义开发工作量。您可以使用现有的身份提供者,例如 Amazon Cognito、Microsoft Entra ID 或 Okta,而无需迁移用户或重新构建身份验证流程。借助由 AgentCore Identity 支持的恰到好处的访问权限以及安全的权限分配功能,您可以让您的代理能够无缝且安全地访问 AWS 资源以及包括 GitHub、Google、Salesforce 和 Slack 在内的第三方工具及服务。您可以允许代理代表用户或在获得用户预先授权同意的情况下自行对 AWS 资源或第三方服务执行操作。此外,您可以通过安全的令牌保管库来最大程度地减少同意疲劳,并构建简化的人工智能代理体验。

1/为人工智能代理提供安全且授权的访问权限
Amazon Bedrock AgentCore Identity 使您的人工智能代理能够安全地访问 AWS 资源以及诸如 GitHub、Google、Salesforce 和 Slack 等第三方工具及服务,其通过提供强大的访问控制机制(仅提供恰好符合要求的权限并进行安全的权限委托)来实现这一目的。

2/加速人工智能代理开发
AgentCore Identity 减少了构建安全基础设施时通常所需的大量自定义开发工作,并简化了代理身份及访问管理流程。通过基于标准的身份验证,您可以使用现有的身份系统,如 Amazon Cognito、Microsoft Entra ID 或 Okta ,而无需迁移用户或重新构建身份认证流程,从而节省开发时间。

3/打造简化的人工智能代理体验
AgentCore Identity 减少了每次为不同代理授权同意时需要重复进行授权提示的需求,并通过一个安全的令牌保管库(用于存储用户的令牌并允许代理安全地获取这些令牌)来最大程度地减少授权疲劳现象。它简化了身份验证流程,为所有由代理驱动的交互提供了更简洁的用户体验,同时还能保持强大的访问控制机制。

AgentCore Identity 采用了一种安全的令牌保管库,用于存储用户的令牌,并允许代理安全地获取这些令牌。对于兼容 OAuth 2.0 的工具和服务,当用户首次同意让某个代理代表自己行事时,AgentCore Identity 会收集并存储该工具发放的用户令牌,并将令牌存入其保管库中,同时还会安全地存储该代理的 OAuth 客户端凭证。然后,代理以各自独特的身份运行,并在用户调用时能够根据需要获取这些令牌,从而减少了频繁征求用户同意的需求。当用户令牌过期时,AgentCore Identity 会向用户发出新的授权提示,以便代理获取更新后的用户令牌。对于使用 API 密钥的工具,AgentCore Identity 还会安全地存储这些密钥,并为代理提供有限的访问权限,以便在需要时获取这些密钥。这种安全存储方式简化了用户使用体验,同时保持了强大的访问控制功能,使代理能够在各种工具和服务中高效运作。

Observability

全部打开

AgentCore Observability 有助于开发人员在生产环境中跟踪、调试和监测代理的运行状况。它提供了代理工作流程中每个步骤的详细可视化展示,使开发人员能够查看代理的执行路径、审核中间输出,并调试性能瓶颈和故障。AgentCore Observability 使开发人员能够通过由 Amazon CloudWatch 提供支持的控制面板以及针对关键指标(如会话数量、延迟、持续时间、令牌使用情况和错误率)的遥测数据,实时了解代理的运行表现。丰富的元数据标记和筛选功能能够简化大规模问题排查和质量维护工作。它以标准化的 OpenTelemetry(OTEL)兼容格式发送遥测数据,使客户能够轻松将其与现有的监控和可观测性堆栈进行集成。

1/保持质量和信任:获取有关代理行为的全面、完整视图,包括详细的推理过程、输入内容、输出结果以及工具使用情况。通过全面掌握代理工作流程的情况,加快调试和质量审核的进程。

2/加快上市时间:
由 Amazon CloudWatch 提供支持的控制面板能够为开发人员节省大量时间,它能以单一界面的方式呈现各代理的运行状况,无需手动将来自多个来源的数据进行整合。这有助于团队迅速发现故障、评测绩效趋势,并及时采取纠正措施。

3/与您选择的可观测性工具集成:
AgentCore 以标准化的 OpenTelemetry(OTEL)兼容格式发送遥测数据,使客户能够轻松地将日志、指标和跟踪与他们现有的监控和可观测性工具(如 CloudWatch、Datadog、Arize Phoenix、LangSmith 和 Langfuse)集成在一起。

AgentCore SDK 使开发人员能够通过其代理框架或 IDE 来使用 AgentCore 服务。AgentCore SDK 由一个开发工具包组成,该工具包使开发人员能够利用各种工具来构建和管理人工智能代理,这些工具包括内存管理、工具服务器连接、安全配置以及可观测性功能。它可以通过 AWS 账户进行访问,并支持多种身份验证方式,包括基于 IAM 的身份验证方式、OAuth 2.1 的以及 API 密钥。

计费和支持

全部打开

AgentCore 提供灵活的按使用量计费模式,没有预先承诺或最低费用。每项服务,如 Runtime、工具(Browser、Code Interpreter)、Gateway、Identity、Memory 以及 Observability,都可以单独使用或组合使用,而且您仅需按实际用量付费。这种模块化的方法使您能够从较小的规模开始,并随着您的人工智能代理应用程序的增长而扩展。2025 年 9 月 16 日之前,您可以免费试用 AgentCore 的预览版服务。计费将于 2025 年 9 月 17 日开始,具体费用依据本页指定的定价详情而定。定价详情可能随时变动。

我们已经为预览版客户设置了 AgentCore Discord。您可以在此加入:https://discord.gg/bedrockagentcore-preview