亚马逊AWS官方博客
Amazon Bedrock 助力 SolveX.AI 构建智能解题 Agent,打造头部教育科技应用
![]() |
关于 SolveX.AI
SolveX.AI 是一款由 PIGEON LIMITED 开发的教育类应用,在教育类 APP 中表现出色,位居前列,收获了众多用户的好评,评分高达 4.9 分,主打学习辅导,涵盖数学、科学、英语、历史等多学科,无论是应对学校课程,还是准备 SAT、ACT、AP、IGCSE 等考试,都能提供有效帮助。
![]() |
解题时,它会给出详细的步骤解析,帮助用户理解解题思路和原理,而非单纯给出答案。如果用户对解答还有疑问,还能进行追问,获取进一步的讲解。同时,针对同一问题,它会展示多种解法,方便用户找到最适合自己的解题方式。
场景与挑战
在打造教育行业智能 Agent 过程中,SloveX.AI 面临着一系列独特且复杂的场景挑战。
首先,复杂题目的解析成为技术瓶颈。像几何证明、物理力学等题型往往涉及多步推理、图文混合输入和隐含条件的识别,传统模型在步骤完整性和准确性方面表现有限,难以满足高质量解题的需求。
其次,系统需要在高并发场景下保持稳定性能和低成本运营。每逢用户高峰期,平台需承载 50W TPM 的并发请求,且响应延迟必须控制在 3 秒以内,这对后端推理引擎和弹性计算能力提出了极高要求。
此外,解体场景还对教学合规性和内容安全性有着严格标准,不仅要精准匹配不同教材版本的知识点,还要确保数据安全和生成内容的可控性。如何在保障规范的前提下,实现高效、低成本、可扩展的智能解题服务,是当前教育智能化升级的核心挑战
关于 Amazon Nova
亚马逊云科技在 2024 re:Invent 全球大会上推出新一代基础模型 Amazon Nova。该模型在 Amazon Bedrock 中提供,包括超快速文本生成模型 Amazon Nova Micro,以及能够处理文本、图像和视频并生成文本的多模态模型 Amazon Nova Lite、Amazon Nova Pro 和 Amazon Nova Premier。
此外,亚马逊还推出了两个全新模型——用于生成高质量图像的 Amazon Nova Canvas 和用于生成高质量视频的 Amazon Nova Reel。其中,Amazon Nova Micro、Lite 和 Pro 支持200多种语言。Amazon Nova Micro 支持 128K 输入 token 的上下文长度,而 Amazon Nova Lite 和 Pro 的上下文长度可达 300K token。
解决方案
SolveX.AI 拍照解题的流程
SolveX.AI 采用智能路由策略,根据题目类型和复杂度将问题路由至最适合的处理模型。系统首先通过多模态图像识别和对拍照上传的题目进行分类,随后根据难度级别将题目精准分配至三级处理模型:初级模型(C1)处理基础算术和简单代数等题型,中级模型(C2)负责几何和函数等中等难度问题,高级模型(C3)专攻微积分和线性代数等复杂问题。这种多模型协作机制不仅确保了解题效率,还能提供多种解题方法供学生选择。同时其他类型的题目将被路由到各自的模型处。
![]() |
- 题目输入
- 用户输入一张题目图片(可能是数学题/英语题的图片)
- 题型识别
- 系统首先进行题型分类判断
- 使用自研的图像识别和自然语言处理技术
- 区分数学题和英语题,以及题目的级别和水平
- 模型路由
- 题目分流到三级处理模型:
- 初级模型(C1):处理基础算术、代数等简单题型
- 中级模型(C2):处理几何、函数等中等难度问题
- 高级模型(C3):处理微积分、线性代数等复杂问题
- 题目分流到三级处理模型:
- 答案生成
- 各模型生成初步答案
- 包含解题步骤和最终结果
- 答案验证
- 通过多维度验证
- 验证不通过会触发重新路由机制
- 答案反馈
- 成功案例直接输出给用户
- 失败案例通过重新路由返回题型识别环节
通过这种精细化的模型匹配策略,SolveX.AI 实现了从拍照识别到答案生成的全流程优化,为用户提供快速准确的解题体验。
Prompt 示例:
结果展示:
架构图:
![]() |
Amazon Nova 具备多模态强理解、高性能推理、极致性价比和超长上下文等显著优势,不仅支持文本、图像、视频等多种输入,还能以远低于同类大模型的成本和更快的响应速度,满足教育等复杂场景对高并发、实时性和多语言的需求。
Amazon Bedrock 的跨区域推理功能进一步提升了系统的可靠性和性能,通过智能地将流量动态路由到多个区域,确保在需求高峰期获得更高的吞吐量和增强的弹性。有效降低延迟并提高响应速度,同时允许用户从预定义的区域集中进行选择,帮助遵守数据驻留要求和合规要求。为教育场景下的高并发应用提供了无缝的高可用性保障和更流畅的用户体验。
效果展示
SolveX.AI 对 Nova Pro 进行了解体效果评估,在自建的 C1 数据集合上取得了 95% 的成绩,满足了生产的使用要求。
评估维度(测试集 1000 条 C1) | Nova Pro |
答案准确率(人工评估) | 95% |
应用效果:
![]() |
成本效益:
在解题场景下,Amazon Nova Pro 相比 Claude 3.7 Sonnet 展现出显著的成本优势,具体优化对比如下:
成本类型 | Amazon Nova Pro | Claude 3.7 Sonnet | 成本比(Nova/Claude) |
输入 Token 成本 | $0.80/百万 | $3.00/百万 | 1/3.75 |
输出 Token 成本 | $3.20/百万 | $15.00/百万 | 1/4.69 |
综合成本 | $4.00/百万 | $18.00/百万 | 1/4.5 |
成本预测:
假设处理 1 万道题目(平均每题消耗 500 输入 Token + 200 输出 Token)
Nova Pro 总成本:$10.40
Claude 3.7 Sonnet 总成本:$45.00
Nova Pro 成本仅为 Claude 3.7 Sonnet 的 23.1%。
总结
SolveX.AI 与亚马逊云科技的合作,为教育行业的智能化应用树立了技术标杆。通过深度整合 Amazon Nova Pro 的多模态推理能力与 Amazon Bedrock,构建了教育领域支持毫秒级响应的智能解题 Agent。Amazon Nova Pro 作为一款功能强大的多模态模型,完美结合了准确性、速度和成本效益。该解决方案更通过弹性计算架构将高峰时段推理成本降低 70%,为平台提供稳定可靠的服务提供了可持续的技术基座。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。
参考链接
https://aws.amazon.com/cn/bedrock/