跳至主要内容

Amazon Neptune

图形与人工智能

为什么要使用图形?

每个组织都希望从数据中获取价值,这需要他们查询数据中的关系。只要您执行过带 JOIN 操作的 SQL 查询,就相当于查询过关系,这种关系定义了系统某部分数据与另一部分数据之间的连接方式(例如客户 ID 与订单号)。关系可以是一对一、一对多和多对多。

随着数据互联程度加深,且互联数据的规模与复杂度不断增加,这些关系的存储和查询也会变得更加复杂。尝试使用 SQL 查询互联数据往往收效甚微,因为多重 JOIN 操作会导致性能下降。而图形是专门为查询互联数据而设计的。

若要构建和部署生成式人工智能或代理式人工智能,使用互联数据至关重要。对生成式人工智能而言,查询互联数据对提升人工智能准确性与可解释性具有关键作用。对于代理式人工智能而言,互联数据提供了不可或缺的上下文信息,便于代理式人工智能自主执行复杂的多步骤任务。

我们将深入探讨知识图形,知识图形是生成式人工智能和代理式人工智能的基础。随后,我们将审核其他图形类型,例如用于欺诈检测的欺诈图形、强化网络安全的安全图形以及实现客户 360 度全景视图的身份图形。在深入探讨之前,需要明确以下定义:

  • 节点是数据点,代表人员、产品、交易等实体。
  • 边缘是节点之间的连接,代表数据点之间的关系。
  • 属性是键值对,用于存储有关节点和边缘的附加信息。
Missing alt text value

为什么要使用图形数据库?

构建和存储图形的最有效方法是使用图形模型和图形数据库。图形数据库旨在存储和浏览互联数据。借助图形数据库,您可以更轻松地对高度互联的数据进行建模和管理,将关系视为“一等公民”,拥有灵活的模式,并为图形遍历查询提供更高的性能。

了解知识图形

什么是知识图形

知识图形通过图形数据模型捕获域数据(包括结构化和非结构化数据)的语义信息,将数据构建成由明确定义的关系互联实体所形成的网络。

Missing alt text value

为什么需要知识图形

对代理式人工智能而言,知识图形是构建数据语义层的核心技术,便于代理理解数据的上下文含义。知识图形通过让人与机器理解数据,实现更好的互操作性、数据发现和更深入的见解。如果您使用过 Google Search,搜索结果很可能就利用了知识图形。

对生成式人工智能应用程序而言,您需要使用 GraphRAG 来提升大语言模型的准确性。GraphRAG 的核心组件正是知识图形。若想获得完全托管的 GraphRAG 体验,Amazon Bedrock 知识库会自动执行整个工作流,并在其底层采用 Amazon Neptune 的知识图形技术。若希望自行构建 GraphRAG 体验,Neptune 可提供 GraphRAG 工具包,这是一个开源的 Python 库,有助于轻松构建 GraphRAG 工作流,以及按行业划分的其他架构模式(如 Customer 360)。

Missing alt text value

使用案例

  • 构建虚拟助理、聊天机器人或代理式人工智能。 构建具备上下文感知能力的系统,使其能够根据查询和庞大的知识库得出答案。例如,航空公司可以构建提供实时帮助的聊天机器人,帮助客户预订机票、查看航班状态、办理登机手续和追踪行李。
  • 综合分析非结构化和结构化数据。数据、文档和流程可能分散存储在不同团队和工具中。通过关联相关数据片段,可构建系统,从而为项目推荐合适人员、关联相关项目,或者集中访问数据以避免重复工作。您可以从电子邮件、Word 文档、PDF 和电子表格等文本内容中提取实体,或从视频、音频和照片中提取元数据,进而构建知识图形。您还可以使用来自 CRM 和 ERP 系统的结构化数据对知识图形进行扩充。 
  • 提高流程效率并分析依赖关系。在制造业,您可以使用知识图形跟踪产品制造和交付的不同阶段,从库存水平变化到门店发货。在生命科学领域,您可以利用知识图形记录实验过程、药物试验及特性。在金融服务领域,您可以为证券的控股公司、证券本身及实益持有构建知识图形。您还可以结合社交媒体、行业活动等信息来扩充图形,记录各种关系,从而深入了解公司之间的依赖关系。 
  • 通过机器学习获得见解。您可以将机器学习服务与知识图形结合使用,以便更好地做出决策和发现知识。您可以使用机器学习服务,根据文本、音频或视频等非结构化数据构建知识图形。您还可以将知识图形作为机器学习输入,借此构建能够实现欺诈检测或产品推荐的更智能系统。
A robotic hand types on a laptop displaying a digital interface with graphs and icons, symbolizing the integration of technology and data analytics in modern workspaces. Tessel

了解身份图形

什么是身份图形

身份图形根据客户和潜在客户在一组设备和标识符上与产品或网站的交互情况,提供客户和潜在客户的 360 度全景视图。它支持按时间顺序了解客户旅程(例如购买旅程),从而帮助您制定促成交易的推荐策略。身份图形可以存储个人资料数据,并轻松将新的消费者标识符关联至对应的个人资料。

A diagram visualizing relationships within a customer identity graph sample dataset, including entities such as transientId, persistentId, groupIdentity, IPLocation, websiteGroup, and their connections like has_identity, visited, links_to, uses, and member. The image also includes a legend describing the properties of each entity and relationship type.

为什么需要身份图形

若想进行实时个性化部署,为数百万用户构建带 360 度全景客户视图的广告定向,或基于专有业务规则构建客户数据平台(CDP)以实时响应客户信号并为工作流编排提供信息,则身份图形不可或缺。

Abstract glowing digital business interface backdrop. Future and communication concept. 3D Rendering

使用案例

  • 关联客户标识符。客户通过多种设备、浏览器、应用程序及电子邮件地址与产品和广告进行交互。身份图形可帮助您建立持久性标识符,关联所有相关的客户设备与标识符,从而创建统一的客户个人资料,用于精准定向与个性化服务。
  • 构建受众群体和细分。客户会查看数十亿个网页和应用程序,并跨设备生成数十亿个 Cookie,生成数十亿个数据关系,这些数据关系为客户行为提供了隐藏的见解。身份图形让您能够挖掘这些数据关系,根据相似的兴趣、偏好及购买行为创建受众群体。
  • 分析客户旅程。客户会生成大量意向信号,例如搜索查询、产品页面浏览量、广告点击量、购行为以及忠诚度计划注册。身份图形支持您分析端到端的客户行为,获得 360 度全景客户视图,从而深入了解购买模式并优化营销归因。
  • 在保护隐私的情况下利用客户数据。分别管理客户的个人身份信息(PII)和与非个人身份信息数据执行起来较为复杂,且某些法规要求将个人身份信息和非个人身份信息来源相结合,以支持信息请求(RFI)和删除请求。借助身份图形,您可以将个人身份信息和非个人身份信息数据进行集中存储与管理。
3d illustration connecting people on the internet, social network connection

了解安全图形

什么是安全图形

安全图形是呈现待保护资产及其与组织内角色间关系的图形。资产可包括计算机网络、电信网络、分发路由、支付系统及其他 IT 基础设施组成部分。安全图形可用于主动检测、被动调查,也可用作为提升 IT 安全态势而部署的纵深防御策略的一部分。

Hand of businessman drawing graphs monitoring network traffic cybersecurity threat detection firewall protection data encryption risk assessment incident response vulnerability scanning.

为什么需要安全图形

原因很简单。攻击者会通过图形来策划攻击方案,了解可以利用哪些基础设施组成部分通往要攻击的系统或数据,可以盗取哪些身份来访问该基础设施组成部分,以及必须绕过哪些遥测或监控技术。因此,为保护组织资源,您应使用图形,因为现代安全配置文件采用分层式方法,可在任何层出现故障时提供冗余保护。这些安全层通常采用松散耦合设计,实行单独管理。

通过将这些信息存储在图形中,可以对这些安全层之间的关系进行建模和分析,从而轻松识别薄弱环节,例如权限过度扩展导致的资源漏洞。进而实施针对性防护措施。如果资源遭到入侵,您可以查询图形来确定攻击面,以及找到可能危及安全性的后门或其他恶意软件安装的位置。例如,可以使用安全图形来查询使用公共 IP 地址公开集群的资源或路径,以进行安全性和合规性检查。

AI generated digital network with glowing padlocks data graph and warning icon symbolizing cybersecurity encryption protection risk management and secure digital connections

使用案例

  • 云安全态势管理(CSPM)。CSPM 是指持续监控云基础设施以发现安全漏洞、错误配置和合规风险并在存在此类不足的情况下执行相应策略的过程。借助图形数据库,您可以直观了解云基础设施和资源。这种全面的、情景化的云库存视图将有助您了解自己的云资产,进而做出规划,预测并缓解与基础设施相关的任何风险。
  • 防止数据流/数据泄露。数据泄露是一种恶意活动,涉及到超出您控制范围的敏感数据侵入、复制和传输。常见的攻击目标包括财务记录、客户数据和知识产权。攻击者通常可以远程发起攻击,并将其伪装成合法流量,使其很难被发现。您可以绘制从源头到目的地的数据流图形,这有助于捕获数据传输过程中出现的失控事件。例如,绘制数据从 Amazon S3 存储桶加载到 Amazon Neptune 的过程将有助于识别数据被复制到其他地方(如另一个 S3 存储桶)的情况。
  • 身份和访问管理。您可以使用图形数据库来监控和直观了解 IAM 策略,确保正确的用户和角色拥有对正确资源的适当访问权限。用图形表示 IAM 策略有权访问的资源将有助您发现一些细微之处,例如某个安全组资源遭到未经授权的访问。
  • 数字取证。在发生数据盗窃、泄露或未经授权的网络渗透时,组织需要各种数字取证工具来识别、保存、分析和提供数字证据。通过使用图形数据库关联用户与组织的网络资源及数据,可以为受影响的数据和资源建立证据保全链,清晰呈现访问模式并指出可能的漏洞区域。
Missing alt text value

了解欺诈图形

什么是欺诈图形

欺诈图形可存储交易、参与者及其他相关信息之间的关系,便于您发现数据中的常见模式并构建可检测欺诈活动的应用程序。通过欺诈图形,您可以识别相互关联的用户网络及其共用的电子邮件账户、地址和电话号码等要素。最终形成一个高度关联的复杂信息网络,可通过查询、直观了解与分析来检测欺诈行为。

Missing alt text value

为什么需要欺诈图形

企业需要欺诈图形来实现欺诈预防。全球每年都有组织因欺诈损失数百亿美元的资产。欺诈可能由单个不良行为者实施,也可能由使用多重身份相互串通的参与者网络协作完成。多人可能串通实施欺诈性交易并形成欺诈团伙,其成员规模可能达数百人,使得欺诈检测极具挑战。例如,信用卡交易等交易数据仅包含基本属性信息,缺乏人员关联、共用地址等关系数据,导致欺诈检测困难重重。

借助图形数据库,您可以执行快速图形查询,以检测贷款欺诈、信用卡欺诈、反洗钱和在线游戏欺诈等欺诈场景。您可以使用 Neptune 构建实时欺诈检测解决方案,并开始使用这些欺诈图形代码示例

Missing alt text value

使用案例

  • 检测交易欺诈团伙。借助欺诈图形,您可以通过欺诈检测应用程序发现可疑活动与隐藏模式,精准检测洗钱活动。 
  • 调查索赔欺诈行为。借助欺诈图形,您可以直观了解所有相关方之间的交互,进而快速推进欺诈调查,有效识别重复索赔、身份串通等欺诈行为。
  • 识别隐藏的账户接管。您可以快速识别绕过传统安全警报的网络攻击,在此类攻击中,欺诈者会对合法用户的账户进行未经授权的访问,获取控制权进而盗空金融账户。
  • 检测报价欺诈。借助欺诈图形,您可以有效揭露“幽灵经纪人”骗局,此类欺诈往往会通过伪造网站诱骗用户购买虚假保险或信用工具。 
Network and Connection technology concept with Bangkok Expressway top view in panorama at sunrise, Thailand.

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。