亚马逊AWS官方博客

Category: Analytics

深度剖析 – 基于亚马逊云科技使用 Apache DolphinScheduler 进行数据任务调度

pache DolphinScheduler 是一个分布式、可扩展的开源工作流编排平台,拥有强大的 DAG 可视化界面。目前 DolphinScheduler 已经原生集成了亚马逊云科技的大部分数据服务,如 EMR、Redshift、DMS、DataSync、Athena、S3。本文将详细介绍 DolphinScheduler 的云原生容器化部署 Amazon EKS。详细解释如何结合亚马逊云科技的任务插件、数据源插件、存储插件的集成。帮助更高效地使用 DolphinScheduler 进行云服务调用。

基于开源工具构建 EMR 数据分析平台(五)EMR 最佳实践

本文系统的从版本选择、节点选择、自动扩缩机制、集群配置等各个角度介绍和总结了常用的 EMR 最佳实践,从性能、可靠性、成本多方面阐述了 EMR 的优化方案和原理,最后通过项目实践展示了应用最佳实践后的效果,进一步验证了基于 EMR 和开源组件构建的数据分析平台在性能、成本和可靠性上的优势。

在 AWS EC2 上快速部署 NebulaGraph:图数据分析实战

随着数据关联性的日益增强,传统关系型数据库在处理复杂关系和大规模连接查询时表现出瓶颈。图数据库以其强大的关系表达能力和高效的遍历性能,成为社交网络、推荐系统、知识图谱等领域的首选技术。NebulaGraph 作为一款开源分布式图数据库,具备高性能、可扩展的特点,适合处理海量图数据。 本文将带你一步步在 AWS EC2 上快速部署 NebulaGraph,并通过一个示例场景完成图数据的生成与分析,帮助你快速上手 NebulaGraph 图数据库的实战应用。

AWS Lake Formation 数据权限管控实践指南:从 EMR 集成到 BI 工具访问控制

本文详细介绍 AWS Lake Formation 数据湖权限管控实践,展示如何通过集中式权限模型实现从元数据到底层数据的精细化访问控制。重点阐述 Lake Formation 与 EMR 的无缝集成及 BI 工具通过 Athena 访问数据时的权限控制,提供完整配置步骤和实战案例,助力企业构建安全可控的数据湖方案。