- AWS 解决方案库›
- AWS 上的数字互联实验室指南
AWS 上的数字互联实验室指南
概览
本指南可帮助您通过互联网或低延迟的直接连接将生命科学数据仪器和实验室系统文件连接到 AWS 云。您可以削减访问频率较低的数据的存储开支,或者将其用于基因组学、成像和其他密集工作负载的高性能计算,所有这些都在 AWS 上实现。
工作原理
此架构图可帮助您学习如何将基于文件的生命科学仪器和实验室系统连接到云端,以及如何使用亚马逊网络服务 (AWS) 提供可扩展的数据访问和计算。
Well-Architected 支柱
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
随着新的数据来源和合作伙伴的出现,可以使用各种数据传输服务来适应这些不断变化的访问模式。对于多站点环境,可以使用 S3 文件网关进行传输,同时为其他应用程序保留现场缓存。T@@ ransfer Family 允许像 CRO 这样的合作实体轻松上传研究结果。
出于数据保护的目的,我们建议您保护 AWS 账户凭证并使用 AWS 身份和访问管理 (IAM) 设置个人用户账户,这样每位用户只能获得履行其工作职责所需的权限。我们还建议您使用静态加密,建议服务默认使用动态加密。
DataSync 利用单个或多个 VPC 终端节点来确保在可用区不可用时,代理可以访问另一个终端节点。DataSync 是一项可扩展的服务,它利用代理组来移动数据。任务和代理可以根据需要迁移的数据量的需求进行扩展。
DataSync 将所有事件记录到亚马逊 CloudWatch。如果任务失败,可以采取措施来更好地了解问题以及任务失败的地方。任务完成后,可以启动后处理任务来完成管道流程的下一阶段。
Amazon S3 提供高度耐用的存储基础设施,专为任务关键型和主数据存储而设计。
FSx for Lustre 存储提供亚毫秒级的延迟、高达数百 GB/s 的吞吐量和数百万的 IOPS。
使用可按需扩展的无服务器技术,您只需为自己使用的资源付费。为了进一步优化成本,您可以在不使用 SageMaker 的笔记本电脑环境时将其停止。如果您不打算使用 Amazon QuickSight 可视化控制面板,则可以选择不部署它以节省成本。
数据传输费用主要包括两个方面:DataSync,按每 GB 传输费率收费;以及直接连接或 VPN 数据传输费。此外,如果使用 VPC 端点,则可能会收取跨可用区费用。
CloudWatch 指标允许用户根据警报和趋势做出数据驱动的决策。通过密集地使用托管服务和动态扩展,您可以最大限度地降低后台服务的环境影响。大多数组件都是自给自足的。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量。