Amazon Web Services 한국 블로그
AWS, 대규모 프로덕션을 위한 AI 에이전트 기반을 제공합니다!
이 글은 AWS Artificial Intelligence 블로그의 Enabling customers to deliver production-ready AI agents at scale를 한국어로 번역 및 편집한 글입니다.
AI 에이전트는 우리 모두의 일과 생활 방식을 변화시킬 것입니다. AWS의 CEO인 Matt Garman은 인터넷의 출현과 같은 혁신적인 기술 변화에 비견한다는 의견을 공유했습니다. 저 역시 지능형 에이전트 시스템이 이미 복잡한 문제를 해결하고, 워크플로를 자동화하고, 산업 전반에 걸쳐 새로운 가능성을 창출하기 시작하는 방법을 직접 목격했기 때문에 이러한 비전에 동의하고 있습니다. AWS 고객인 아스트라제네카(AstraZeneca)는 에이전트 AI를 통해 헬스케어 통찰력을 가속화했고, 야후 파이낸스(Yahoo Finance)는 수백만 투자자를 위해 금융 연구를 혁신했으며, 신젠타(Syngenta)는 AI 기반 정밀 농업으로 농업에 혁명을 일으켰습니다.
이러한 초기 실험의 성공을 좀 더 광범위하게 확장하기 위해 기업은 에이전트 시스템의 고유한 복잡성을 해결하는 실용적인 접근 방식이 필요합니다. AWS는 전 세계에서 가장 유용한 AI 에이전트를 구축할 수 있는 최고의 장소가 되기 위해 최선을 다하고 있으며, 기업들이 안정적이고 안전한 에이전트를 대규모로 배포할 수 있도록 지원하고자 합니다.
우리는 신속한 혁신과 보안, 안정성 및 운영 우수성의 강력한 기반을 결합하여 모든 조직에서 에이전트 AI를 구현할 수 있도록 하는 데 중점을 두고 있습니다. 슈나이더 일렉트릭라는 고객은 새로운 가능성을 수용하는 동시에 입증된 원칙을 기반으로 하여 모델과 기능을 발전시키고, 비즈니스 전반에서 사용 사례가 확장됨에 따라 바로 적응할 수 있는 시스템을 만들고 싶어했습니다.
오늘 저는 대규모 에이전트 구축 및 배포의 근본적인 측면을 다루는 새로운 기능을 통해 이 비전을 실현하는 방법을 공유합니다. 이러한 혁신은 실험을 넘어 가장 중요한 비즈니스 프로세스를 신뢰할 수 있는 프로덕션 수준의 에이전트 AI 시스템으로 전환하는 데 도움이 될 것입니다.
에이전트 AI를 위해 기본 원칙
AWS의 에이전트 AI에 대한 접근 방식은 내부적으로 에이전트 시스템을 구축하고 수십만 명의 고객이 AI 여정을 가속화하도록 지원한 경험을 바탕으로 형성됩니다. 4가지 핵심 원칙 이 이 분야에서 우리가 하는 모든 일을 안내합니다.
원칙 1: 민첩성을 경쟁 우위로 수용
성장하는 조직은 미래를 완벽하게 예측하는 조직이 아니라 미래가 펼쳐짐에 따라 빠르게 적응하는 조직입니다. 민첩성을 유지하려면 경직된 프레임워크나 단일 모델보다는 유연성과 개방성을 수용하는 에이전트적 아키텍처가 필요합니다. 즉, 새로운 모델이 등장할 때 이를 통합하고, 독점 데이터 소스에 연결하고, 기존 도구와 원활하게 통합할 수 있는 시스템을 구축해야 합니다.
안정성과 적응성에 대한 두 가지 요구로 인해, 엔터프라이즈 규모에서 유능한 에이전트를 안전하게 배포하고 운영하기 위한 완전한 서비스 세트인 Amazon Bedrock AgentCore를 공개합니다. AgentCore는 (보안과 성능을 위해) 완전한 세션 격리와 현재 사용 가능한 가장 오래 실행되는 워크로드, 에이전트가 올바른 권한과 컨텍스트로 워크플로를 실행하는 데 도움이 되는 도구 및 기능, 신뢰할 수 있는 에이전트를 운영하기 위한 제어 기능을 갖춘 안전한 서버리스 런타임을 제공합니다. 이 기능은 기존의 CrewAI, LangGraph, LlamaIndex 및 Strands Agents와 같은 인기 있는 오픈 소스 프레임워크 및 Amazon Bedrock 등 내부 또는 외부의 모델을 포함한 모든 모델과 함께 또는 독립적으로 사용할 수 있어, 개발자는 기술 변화에 따라 민첩성을 유지할 수 있습니다. AgentCore는 획일적인 과중한 부담을 줄임으로써 조직이 실험을 넘어 가장 중요한 비즈니스 프로세스를 신뢰할 수 있는 프로덕션 준비 에이전트 시스템으로 이동할 수 있도록 지원합니다.
Itaú Unibanco, Innovaccer, Boomi, Box, Epsilon 같은 고객분들은 이미 Bedrock AgentCore를 실험하고 있으며 프로덕션에 에이전트를 더 빠르게 배포할 수 있는 방법에 대해 기대하고 있습니다. 이러한 얼리 어답터들은 AgentCore가 오픈 소스 유연성과 엔터프라이즈급 보안 및 안정성 간의 균형을 없애는 데 도움이 되며, 이를 통해 보안 및 운영 기반을 처음부터 구축하는 대신 비즈니스 가치를 창출하는 데 집중할 수 있다는 것을 알고 있습니다.
원칙 2: 에이전트 시대를 위한 기본 사항 진화
엔터프라이즈 기술의 핵심 원칙은 변하지 않았지만 이를 구현하는 방법은 에이전트 시대에 맞게 진화해야 합니다. 이러한 진화된 기본 사항은 프로덕션 레벨의 에이전트를 가능하게 하는 기반을 만듭니다.
- 보안 및 신뢰: 에이전트는 시스템 경계를 넘거나, 사용자를 대신하여 작업을 수행하거나, 사전 승인된 사용자 동의에 따라 스스로 행동할 때 새로운 보안 고려 사항을 도입합니다. 신뢰에는 투명성, 가드레일, 검증이 필요합니다. AgentCore Runtime 는 10년 동안 경험한 AWS Lambda 서버리스 보안 및 확장성 혁신을 기반으로 에이전트 간 데이터 유출을 방지하는 데 도움이 되는 세션당 전용 컴퓨팅 환경 및 메모리 격리를 통해 이러한 문제를 해결하는 데 도움이 됩니다.
- 신뢰성과 확장성: 소프트웨어 확장에 대한 기존의 접근 방식은 예측할 수 없는 실행 경로를 따르고 상호 작용 전반에 걸쳐 다양한 리소스 요구 사항을 가지고 있기 때문에 에이전트 시스템에는 적합하지 않습니다. AgentCore Runtime 은 체크포인트 및 복구 기능을 통해 매우 안정적이어서 예기치 않은 중단 및 장애 발생 시 정상적인 복구를 보장할 수 있으며, 0개에서 수천 개의 동시 세션으로 확장을 자동으로 처리할 수 있으므로 용량 계획 및 인프라 유지 관리가 필요하지 않습니다.
- 인증 및 권한: 에이전트가 사용자와 시스템을 대신하여 행동함에 따라 기존 아이덴티티 모델도 진화해야 합니다. 에이전트가 여러 시스템에 걸쳐 복잡한 워크플로를 탐색할 때 에이전트와 사용자 모두의 권한을 관리하는 것은 데이터 보안에 매우 중요합니다. AgentCore Identity는 세분화된 임시 권한 및 표준 기반 인증을 통해 AWS 서비스와 서드 파티 애플리케이션 및 도구 전반에 걸쳐 안전한 에이전트 액세스를 제공합니다. Amazon Cognito, Microsoft Entra ID 및 Okta와 같은 주요 자격 증명 공급자는 물론 GitHub, Google, Salesforce 및 Slack과 같은 인기 있는 OAuth 공급자와 함께 작동합니다.
- 관찰 가능성: 에이전트 결정을 이해하려면 모니터링에 대한 새로운 접근 방식이 필요합니다. 옵저버빌리티는 문제 해결뿐만 아니라 규정 준수 및 지속적인 개선을 위해 필수적이 되었으며, 이는 주기적인 감사에서 지속적인 감독으로의 전환을 나타냅니다. AgentCore Observability는 모니터링 스택과 통합되는 내장 대시보드 및 표준화된 텔레메트리를 통해 실시간 가시성을 제공합니다.
- 데이터: 독점 데이터는 그 어느 때보다 가치가 높아졌으며 상담원이 특정 컨텍스트를 이해할 수 있습니다. 이 데이터에 안전하게 액세스하고, 처리하고, 학습할 수 있는 능력은 상담원 성과와 관련성을 위한 중요한 차별화 요소가 됩니다. 예를 들어 AgentCore Gateway 를 사용하면 Amazon Bedrock 기술 자료를 포함한 데이터 소스를 에이전트 호환 도구로 변환하여 에이전트가 최신 및 관련 정보에 액세스할 수 있도록 할 수 있습니다.
- 원활한 통합: 에이전트는 시스템, 기타 클라우드, SaaS 애플리케이션 및 기타 에이전트 등 환경의 모든 것과 함께 작동해야 합니다. AgentCore Gateway를 사용하면 최소한의 코드로 API 및 서비스를 에이전트 호환 도구로 변환하여 수개월에 걸친 통합 작업을 없애는 동시에 에이전트가 시스템을 검색하고 상호 작용할 수 있습니다. 당사의 오픈 소스 Strands Agents SDK는 유연한 오케스트레이션 패턴과 MCP 및 A2A 지원으로 이를 보완하여 서로 다른 환경에서 여러 에이전트와 도구 간의 원활한 조정을 가능하게 합니다. AWS API MCP 서버는 에이전트에게 AWS 서비스에 대한 호출 가능한 인터페이스를 제공하여 기반 모델이 사용 가능한 작업을 검색하고, 입력 및 출력 요구 사항을 추론하고, AWS API를 호출하여 모델 교육 컷오프 이상의 실시간 AWS 기능을 통해 리소스를 탐색, 구성 또는 관리하는 계획을 생성할 수 있도록 합니다.
- 도구 및 기능: 에이전트는 복잡한 작업을 실행하고 상호 작용 전반에 걸쳐 컨텍스트를 유지하기 위해 특수 도구가 필요합니다. AgentCore Memory를 사용하면 복잡한 메모리 인프라 관리를 제거하는 동시에 AI 에이전트가 기억하는 내용을 완전히 제어할 수 있으므로 개발자가 컨텍스트 인식 에이전트를 쉽게 구축할 수 있습니다. 협업 에이전트 간에 메모리 저장소를 공유할 수 있는 기능과 함께 다중 턴 대화를 위한 단기 메모리와 세션 간에 유지되는 장기 메모리를 모두 지원함과 함께 업계 최고의 정확도를 제공합니다. 기본 제공 도구에는 웹 상호 작용을 위한 AgentCore Browser가 포함되어 있어 에이전트가 사용자를 대신하여 웹 사이트를 탐색하고 작업을 수행할 수 있으며 코드를 안전하게 실행하기 위한 AgentCore, Code Interpreter가 포함되어 에이전트가 데이터를 처리하고, 시각화를 생성하고, 프로그래밍 방식으로 복잡한 문제를 해결할 수 있습니다. 이러한 기능은 보안과 신뢰성을 유지하면서 에이전트가 수행할 수 있는 작업을 확장합니다.
이러한 진화된 기본 원칙은 조직이 프로덕션 환경에서 일관된 결과를 제공하는 안전하고 신뢰할 수 있으며 확장 가능한 에이전트 아키텍처를 구축하는 데 도움이 됩니다. AgentCore를 통해 고객이 인프라를 재창조하는 대신 가치 창출에 집중할 수 있도록 지원하고 있습니다.
원칙 3: 모델 선택 및 데이터로 우수한 결과 제공
모든 효과적인 에이전트 시스템의 중심에는 에이전트가 이해하고, 추론하고, 행동할 수 있는 능력을 강화하는 기본 모델이 있습니다. 상담원이 혁신적인 경험을 제공하려면 신중하게 선택되고 잠재적으로 맞춤화된 모델이 여러분을 대신하여 얼마나 효과적으로 결정을 내릴 수 있는지 결정하는 풍부한 상황별 지식과 상호 작용해야 합니다. 이러한 현실은 모든 AI 애플리케이션으로 확장되며, 이것이 바로 AWS가 고객에게 각 사용 사례에 대한 최적의 모델을 선택할 수 있는 자유와 고유한 데이터로 이러한 모델을 개선할 수 있는 도구를 제공하는 이유입니다. 이 접근 방식은 모든 AI 구현에 대해 우수한 결과와 최고의 가격 대비 성능을 제공합니다.
사실 모델에 대한 요구 사항은 매우 다양하며, 일부 애플리케이션은 정교한 추론을 요구하고, 다른 애플리케이션은 빠른 응답을 요구하며, 많은 애플리케이션은 규모에 따라 비용 효율성을 우선시합니다. 모든 차원에서 뛰어난 단일 모델은 없기 때문에, 저희는 2023년 Amazon Bedrock과 함께 다양한 모델 선택 옵션을 제공해 왔습니다. 그러나 진정한 차별화 요소는 모델을 조직의 내부 데이터와 결합하여 일반 AI를 심층적인 도메인 전문 지식을 갖춘 시스템으로 전환하는 방법입니다.
이러한 높은 수준의 전문 지식으로 모델을 생성하는 데 도움이 되도록 오늘 Amazon SageMaker AI기반 Amazon Nova 맞춤 기능을 출시하여 모델 사용자 지정 기능을 확장하고 있습니다. Nova 모델은 이제 고객에게 모델 개발 수명 주기 전반에 걸쳐 모델을 사용자 지정할 수 있는 유연성을 제공합니다. 여기에는 미세 조정 및 정렬을 포함한 사전 학습 및 사후 교육이 포함되며, PEFT(Parameter Efficient Fine Tuning) 및 전체 미세 조정에 대한 지원이 포함됩니다. 이를 통해 Nova는 이제 모든 독점 모델 제품군에서 사용할 수 있는 가장 포괄적인 모델 사용자 정의 기능 제품군을 제공합니다. SFT(Supervised Fine-Tuning), DPO(Direct Preference Optimization), PPO(Proximal Policy Optimization), CPT(Continued Pre-Training) 및 Knowledge Distillation을 사용한 인간 피드백의 강화 학습 등의 기술을 사용하여 고객은 사용 사례에 최적화된 Nova 모델을 생성할 수 있습니다. 사용자 지정이 완료되면 이러한 모델을 Amazon Bedrock에 직접 배포할 수 있으므로 사용자 지정 모델을 에이전트 시스템 및 기타 AI 애플리케이션에 원활하게 통합할 수 있습니다.
또한 특정 에이전트 사용 사례에 최적화된 자체 모델을 훈련하고 있습니다. Nova Act는 웹 브라우저 내에서 작업을 수행하도록 훈련된 AI 모델입니다. 고객은 Nova Act 모델을 기반으로 하는 신뢰할 수 있는 브라우저 에이전트를 활성화하기 위해 특별히 제작된 Nova Act SDK를 사용하여 자체 브라우저 자동화 에이전트 구축을 시작할 수 있습니다. 현재 연구 평가판에서 사용할 수 있는 Nova Act SDK는 확장 가능한 클라우드 기반 브라우저 실행을 위해 AgentCore Browser를 사용합니다.
올바른 모델이 있으면 조직의 내부 및 최신 데이터와 상호 작용할 수 있는지 확인해야 합니다. 벡터는 AI 모델이 데이터에 액세스할 수 있는 지배적이고 가장 빠른 방법으로 부상했습니다. 지금까지 이러한 인텔리전스를 가능하게 하는 핵심인 벡터 임베딩을 저장하는 비용으로 인해 조직은 AI 시스템을 최신 데이터로만 제한하여 잠재력을 제한했습니다. Amazon S3 Vectors는 벡터 데이터를 지원하는 최초의 클라우드 객체 저장소입니다. S3 Vectors는 1초 미만의 쿼리 성능을 유지하면서 벡터 스토리지 비용을 90% 절감함으로써 에이전트가 더 많이 기억하고, 더 깊이 추론하고, 모든 고객 상호 작용, 문서 및 비즈니스 통찰력에서 포괄적인 컨텍스트를 유지할 수 있도록 지원합니다. S3 Vectors는 비용 효율적인 RAG 애플리케이션을 위해 Amazon Bedrock Knowledge Bases와 직접 통합되며, 계층화된 벡터 전략을 위해 Amazon OpenSearch Service와 통합됩니다.
원칙 4: 경험을 혁신하는 솔루션 배포
생성형 AI 모델과 인프라스트럭처가 기업의 에이전트 구현 방식을 변화시키는 반면, 에이전트틱 솔루션은 비즈니스 운영 방식을 변화시킵니다. 에이전트형 AI의 진정한 힘은 전체 산업에서 워크플로와 인간 생산성을 재편하는 능력에 있습니다. 이러한 솔루션은 사람들을 일상적인 작업에서 해방시키고 복잡한 정보 흐름을 처리하여 팀이 창의적인 사고와 전략적 의사 결정에 집중할 수 있도록 합니다. 우리는 사전 구축된 에이전트 솔루션을 통해 더 많은 조직이 이러한 혁신에 액세스할 수 있도록 하고 있습니다. 기본 구성 요소와 사전 구축된 솔루션을 결합하면 실험을 넘어 실질적인 비즈니스 영향을 제공하는 포괄적인 AI 전략으로 이동할 수 있습니다.
오늘 AWS는 이제 AWS Marketplace에서 간소화된 조달 및 다양한 배포 옵션을 통해 AI 에이전트 및 도구를 구매할 수 있게 되었습니다. 오늘날의 파편화된 AI 환경에서 AWS Marketplace는 AWS 파트너가 큐레이팅한 에이전트, 도구 및 솔루션의 중앙 집중식 카탈로그를 제공합니다. AWS 파트너의 사전 구축된 에이전트를 통해 빠르게 자동화할 수 있습니다. 새로운 API 기반 배포 방법은 MCP 및 A2A를 지원하는 다른 에이전트 및 도구와의 통합을 간소화하는 데 도움이 됩니다. 또한 이러한 에이전트는 신뢰할 수 있는 AWS 서비스 또는 보안 및 액세스에 대한 제어를 유지하는 AWS 환경에서 실행할 수 있습니다. 사전 구축된 에이전트 및 도구를 선택하여 AgentCore에 배포할 수 있습니다.
또한, 이러한 혁신을 가능하게 하는 즉시 배포할 수 있는 에이전트 솔루션을 고객에게 계속 제공하고 있습니다. Kiro는 개발자가 스펙 기반 개발을 통해 개념에서 프로덕션까지 진행할 수 있도록 도와주는 AI IDE입니다. 간단한 작업부터 복잡한 작업까지, Kiro는 사용자와 함께 작업하여 프롬프트를 세부 사양으로 변환한 다음 작업 코드, 문서 및 테스트로 변환합니다. 따라서 구축한 내용은 정확히 원하는 것이며 팀과 공유할 준비가 된 것입니다. Kiro의 에이전트는 어려운 문제를 해결하고 문서 생성 및 단위 테스트와 같은 작업을 자동화하는 데 도움이 됩니다. Kiro를 사용하면 프로토타입 그 이상을 제작할 수 있습니다.
AWS Transform은 코드 분석, 리팩토링 및 종속성 매핑과 같은 복잡한 현대화 작업을 자동화하기 위해 특수 AI 에이전트를 배포하여 엔터프라이즈 워크로드 마이그레이션에 대한 프로젝트 일정을 크게 단축합니다. 각 솔루션은 유연성과 선택에 대한 슈나이더 일렉트릭의 약속을 보여주며, 이를 통해 더 빠르게 혁신하고 비즈니스 성과를 더 빨리 실현할 수 있습니다. 또한 Amazon Connect포괄적인 고객 경험 솔루션인 Amazon Connect를 통해 조직은 모든 채널의 모든 고객 상호 작용에서 무제한 AI를 통해 고객을 만족시킬 수 있습니다.
이 네 가지 원칙은 제품 전략의 지침이 되며, 오늘 발표하는 모든 혁신, 즉 민첩성 수용, 기본 사항 진화, 모델 선택과 독점 데이터 결합, 혁신적인 솔루션 배포에 포함되어 있습니다. 함께 조직에서 에이전트 AI를 성공적으로 구현하기 위한 포괄적인 프레임워크를 제공합니다.
앞으로 나아갈 길
AWS 고객과 다양한 비즈니스의 상당한 잠재력은 우리가 지구상에서 가장 신뢰할 수 있는 에이전트 AI 기능을 구축하는 데 집중하도록 영감을 주었습니다. 하지만 제가 드릴 수 있는 가장 중요한 조언은 간단합니다: 지금 시작해보세요!.
마치 모든 바다를 끓이려는 것처럼 시작도 하기 전에 모든 답을 기다리지 마세요. 중요한 특정 비즈니스 문제를 선택하고 지금 바로 구현 해 보세요. 가장 큰 성공을 거두는 조직은 가장 야심찬 계획을 가진 조직이 아니라 학습 주기를 시작하여 각 반복에 대한 정보를 제공하는 실제 피드백을 수집하는 조직입니다. 저희는 고객의 AI 여정을 지원하기 위해 AWS Generative AI Innovation Center를 통해 NFL, Yahoo Finance, BMW 및 AstraZeneca를 비롯한 산업 전반에 걸쳐 수천 명의 고객이 수백만 달러의 생산성 향상을 달성하고 고객 경험을 혁신하고 있습니다.
AWS는 클라우드 컴퓨팅의 보안, 안정성 및 데이터 보호에 대한 표준을 정립했으며, 이와 동일한 원칙을 에이전트 AI에 적용하고 있습니다. 사용 사례나 요구 사항이 무엇이든 AWS는 고객의 성공을 지원하는 올바른 기반을 제공합니다. 우리는 함께 에이전트틱 AI의 힘을 통해 비즈니스에 가능한 것을 재창조(reInvent)할 수 있습니다.
Swami Sivasubramanian 은 Amazon Web Services(AWS)의 에이전트 AI 부문 부사장입니다. AWS에서 Swami는 Amazon DynamoDB, Amazon SageMaker, Amazon Bedrock 및 Amazon Q와 같은 주요 AI 서비스의 개발 및 성장을 주도해 왔습니다.