为什么选择机器学习治理
SageMaker 机器学习治理的优势
与 Amazon DataZone 集成
设置控制和预置
IT 管理员可以在 Amazon DataZone 中定义特定于您的企业和使用案例的基础设施控制和权限。随后,只需单击几下鼠标即可创建适当的 SageMaker 环境,并在 SageMaker Studio 内启动开发流程。
搜索和发现资产
在 SageMaker Studio 中,您可以高效地搜索和发现组织业务目录中的数据和机器学习资产。您还可以通过订阅项目中可能需要使用的资产来请求访问这些资产。

消费资产
一旦您的订阅请求获得批准,您就可以使用这些订阅资产在 SageMaker Studio 中通过 JupyterLab 和 SageMaker Canvas 执行诸如数据准备、模型训练和特征工程等机器学习任务。
发布资产
完成机器学习任务后,您可以将数据、模型和特征组发布到业务目录中,以使其他用户能够进行治理和发现。

定义权限
简化机器学习活动的权限
SageMaker Role Manager 通过预构建的 AWS Identity and Access Management(IAM)策略目录为机器学习活动和角色提供一组基准权限。ML 活动可以包括数据准备和训练,角色可以包括 ML 工程师和数据科学家。您可以保留基准权限,也可以根据您的特定需求进一步自定义这些权限。

自动生成 IAM 策略
通过一些自助提示,您可以快速输入常见的治理构造,例如网络访问边界和加密密钥。然后,SageMaker Role Manager 将自动生成 IAM policy。您可以通过 AWS IAM 控制台发现生成的角色和关联的策略。
附加您的托管策略
要进一步针对您的使用案例来定制权限,请将您的托管式 IAM 策略附加到您使用 SageMaker Role Manager 创建的 IAM 角色。您还可以添加标签以帮助跨 AWS 服务识别和组织角色。

简化文档
捕获模型信息
SageMaker 模型卡片是 Amazon SageMaker 控制台中的模型信息存储库,帮助您集中和标准化模型文档,以使您能够负责任地实施机器学习。您可以自动填充训练细节,如输入数据集、训练环境和训练结果,以加速文件编制过程。您还可以添加详细信息,例如模型用途和性能目标。

可视化评估结果
您可以在您的模型卡片上附加模型评测结果,例如偏差和质量指标,并添加可视化效果,例如图表,以便获得对模型性能的关键洞察。

分享模型卡片
您可以将模型卡片导出为 PDF 格式,以便更轻松地与业务的利益相关方、内部团队或客户共享。
模型监控
跟踪模型行为
SageMaker Model Dashboard 为您提供已部署的模型和端点的全面概述,以使您能够在一个位置跟踪资源和模型行为违规。你可以从四个方面监测模型行为:数据质量、模型质量、偏差漂移和特征归因漂移。SageMaker Model Dashboard 通过与 Amazon SageMaker Model Monitor 和 Amazon SageMaker Clarify 的集成来监控行为。

自动提醒
SageMaker Model Dashboard 提供一种集成体验,可以针对缺失和无效的模型监控作业以及模型行为偏差设置和接收警报。

排查模型偏差的故障
您可以进一步检查各个模型并分析随时间推移影响模型性能的因素。然后,您可以跟进机器学习从业者以采取纠正措施。