使用 Amazon SageMaker AI 进行模型自定义
使用最广泛的技术,用您的数据自定义模型。完全无服务器,基于您信任的基础设施。
为什么使用 SageMaker AI 进行模型自定义
Amazon SageMaker AI 使 AI 开发者能够使用监督微调(SFT)、直接偏好优化(DPO)、基于可验证奖励的强化学习(RLVR)以及来自人工智能反馈的强化学习(RLAIF)来自定义 20 多种流行的开源权重模型和 Amazon Nova。
整个工作流是完全无服务器的,SageMaker 处理计算资源预置、扩缩容和优化。
将自定义模型部署到 Amazon Bedrock 进行无服务器推理,或部署到 SageMaker 端点进行托管推理。请参阅文档页面,了解最新支持的模型和技术列表
优势
以最高精度快速追踪模型自定义
在数天(而非数月)内完成从数据准备到部署的端到端工作流。从引导式 UI 或人工智能代理引导的工作流开始,然后使用 SageMaker Python SDK 实现自动化。完全无服务器 — 无需预置基础设施,无需管理容量。
通过无服务器体验,提供跨 20 多种开源权重模型的广泛自定义技术选择。开源权重模型意味着您拥有权重,将您的自定义模型部署到 Amazon Bedrock 进行无服务器推理、部署到 SageMaker 端点进行托管推理,或导出到您自己的基础设施。模型自定义技能在 GitHub 上开源,因此团队可以检查、派生和调整它们以适应其工作流。
训练指标和评估结果直接在 SageMaker AI 上的 MLflow 中进行跟踪和记录,因此您可以监控每次实验并以完全可见性比较模型性能。
模型自定义变得简单
用于在端到端工作流程中自定义模型的全面功能
数据准备
使用模型自定义技能,您的编码代理会生成代码,为您选择的模型和自定义技术格式化数据、验证数据质量并识别缺口。这将数周的手动数据整理工作减少到几小时。对于更广泛的数据准备需求,SageMaker AI 提供 Data Wrangler(用于可视化数据转换,包含 300 多种内置转换)、Ground Truth(用于大规模数据标注)和 Processing jobs(用于自定义数据处理工作流)。在真实数据有限、敏感或难以获取时,使用您自己的数据或生成合成数据(预览版)。SageMaker AI 可以生成特定任务的合成训练示例,以补充您现有的数据集,帮助您在不妨碍模型质量的情况下克服数据稀缺问题。
高级自定义技术
SageMaker AI 支持最新的模型自定义技术,包括监督微调(SFT)、直接偏好优化(DPO)以及来自人工智能反馈的强化学习(RLAIF)和可验证奖励(RLVR)。
当您需要改变模型行为时,SageMaker AI 支持监督微调(SFT)或直接偏好优化(DPO);当您需要针对特定奖励信号进行优化时,可进阶到强化学习(RLVR、RLAIF)。 对于持续预训练,请利用 SageMaker 训练作业或 SageMaker HyperPod 跨数千个加速器进行扩展。
端到端无服务器模型自定义
SageMaker AI 会根据模型和数据大小自动选择和预置适当的计算资源,无需您选择和管理实例。
推理
实现所需的准确性和性能目标之后,只需在 SageMaker AI 推理端点或 Amazon Bedrock(用于无服务器推理)中点击几下,即可将模型部署到生产环境中
LLMOps
您可以自动记录所有关键实验指标,无需预置跟踪服务器或修改代码。与 MLflow 的集成还会带来丰富的可视化效果,并可以进入 MLflow 用户界面执行进一步分析。
易于使用的界面
使用 SageMaker Studio 中的引导式 UI 选择模型、选择技术、配置数据集、启动无服务器训练、监控实时指标并进行部署 — 只需点击几下即可完成。无需代理或代码。
代理引导的开发
描述您的使用案例,人工智能编码代理将引导您完成数据转换、技术选择、超参数配置、评估和部署。专为特定目的构建的代理技能将微调技术、模型选择、SageMaker AI API 和评估方法方面的专业知识带给您的人工智能编码代理,帮助您自信地更快开发。代理技能是预先构建的、可自定义的指令集,适合您的现有工作流程和治理标准。在预装了 Kiro 和代理技能的 SageMaker Studio JupyterLab 中开始使用,或者将代理技能与您首选的 IDE 或编码代理(包括 Kiro IDE、Cursor、Claude Code 和 VS Code)一起使用。
SageMaker Python SDK
通过编程方式配置和启动自定义作业、定义评估标准并部署模型。对于偏好代码优先工作流的开发者,可完全控制每个参数。
客户
我们的客户为什么选择 Amazon SageMaker AI 进行模型自定义
Collinear AI
“在 Collinear,我们为前沿人工智能实验室和财富 500 强企业构建精选的数据集和仿真环境,以改进他们的模型。微调人工智能模型对于创建高保真仿真至关重要,而过去需要将不同的系统拼接在一起才能进行训练、评估和部署。现在,借助 Amazon SageMaker AI 新的无服务器模型自定义功能,我们便获得了一种统一的方式,可以将实验周期从几周缩短到几天。这款端到端的无服务器工具帮助我们专注于重要事项,那就是为客户构建更好的训练数据和仿真,而不是维护基础设施或兼顾不同的平台。”
Soumyadeep Bakshi,Collinear AI 联合创始人
Oleum
"在 Oleum,我们正在构建帮助组织理解和信任其数据的 AI 工具。Amazon SageMaker AI 全新的代理式人工智能体验正是我们需要的工具类型。它充当的是思想伙伴,而不仅仅是任务执行者:推荐技术、发现我们数据中的不匹配之处,并让我们构建任何我们想要的工作流,而不是强迫我们遵循僵化的流程。这些技能可以直接插入我们现有的代理式开发环境,这意味着我们可以在不同平台之间无需切换上下文即可尝试微调方法。并且借助直接内置于 SageMaker Studio 中 JupyterLab 的全新聊天体验,我们可以在一个地方完成从对话到可运行笔记本再到训练作业的全过程。它灵活、可自定义,并且是为现代机器学习团队的实际工作方式而构建的。”
Oleum — Alejandro Ballesteros 首席技术官
Wink
“在 Wink,我们正在构建捕捉真实人类个性细微差别的人工智能驱动数字孪生,帮助用户在面对面见面之前筛选真正的连接。我们的开发工作流已完全转向代理式、提示驱动的体验:我们行动迅速、交付迅速。Amazon SageMaker AI 全新基于技能的模型自定义方法完美契合了这种工作流。我们的团队无需与基础设施或僵化的界面搏斗,而是可以直接在我们已经使用的工具内部通过自然语言微调个性模型。对于一家速度和成本效率就是一切的初创企业来说,这是一个游戏规则的改变者,它让我们专注于为用户构建更好的体验,而不是管理机器学习管道。”
Wink — Ethan Fan 首席技术官
Robin AI
“在 Robin,我们正在重新定义法律在现代商业中的作用,并使用人工智能来推动更好的决策、更快的行动和可持续的增长。为了向客户提供更好的决策,我们的人工智能模型必须能够匹配律师撰写合同的方式,包括各个律师的具体格式、语气和偏好。以前,使用专有数据自定义模型的过程很繁琐,容易出错。现在,借助 Amazon SageMaker AI 新的无服务器模型自定义功能,我们可以在短短几天内快速尝试诸如强化学习和可验证奖励等高级技术。此外,我们很高兴能够尝试人工智能代理指导的工作流程,这样我们就可以比较和验证我们的假设,帮助全球律师更快地做出更好的决策。”
Diana Mincu,Robin AI 研究主任
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量