AWS 기술 블로그

Category: Database

Amazon ElastiCache for Valkey의 CESC로 Interactive AI 스토리텔링 플랫폼 최적화하기

인공지능 기술의 발전은 텍스트 기반 게임의 지평을 넓히고 있습니다. 뷰컴즈(Viewcommz)가 운영하는 타닥(Tadak)은 단순한 텍스트 시뮬레이션을 넘어, 사용자가 직접 다양한 세계관을 창조하고 공유하는 ‘멀티버스 형 Interactive AI 스토리텔링 플랫폼’ 입니다. 현재 뷰컴즈는 사용자 경험을 극대화한 차세대 버전의 ‘타닥 v2’를 준비하고 있습니다. 타닥 v2 개발의 핵심 목표는 ‘끊김 없는 몰입(Seamless Immersion)’ 입니다. 타닥의 수많은 세계 안에서 상상력을 […]

Aurora PostgreSQL에서 한국어 하이브리드 검색 구현하기: pg_bigm + pgvector로 만드는 한국어 특화 RAG

한국어는 교착어 특성상 영어 기반 벡터 검색만으로는 정확한 결과를 얻기 어렵습니다. 이 블로그에서는 Amazon Aurora PostgreSQL에서 pg_bigm(바이그램 키워드 검색)과 pgvector(벡터 시맨틱 검색)를 RRF(Reciprocal Rank Fusion)로 결합한 하이브리드 검색을 구현하여, 한국어 RAG 애플리케이션의 검색 품질을 개선하는 방법을 소개합니다. 왜 한국어에는 하이브리드 검색이 필요한가? RAG(Retrieval-Augmented Generation) 애플리케이션에서 검색 품질은 최종 답변의 정확도를 결정합니다. 벡터 검색(pgvector)은 의미적으로 유사한 […]

GraphRAG Toolkit으로 지식 그래프 인덱싱하기

기존의 RAG(Retrieval-Augmented Generation) 방식은 주로 ‘벡터 유사성 검색’에 의존합니다. 하지만 이 방식은 단순히 질문과 언어적으로 유사한 정보만 찾기 때문에, 데이터 간의 복잡한 구조적 관계나 숨겨진 맥락을 놓칠 수 있다는 한계가 있습니다. 지식 그래프(Knowledge Graph)는 이러한 한계를 보완합니다. 데이터를 개체(Entity)와 관계(Relation) 중심으로 연결하여, 질문과 직접적인 단어 유사성이 낮더라도 답변에 꼭 필요한 연관 정보를 정확하게 찾아낼 수 […]

Amazon DocumentDB 인덱스 최적화로 미리캔버스의 쿼리 성능을 개선 사례

본 게시글은 미리디의 김민석, 이효성, 노정훈님과 함께 작성하였습니다. 미리디의 미리캔버스 소개 미리디의 미리캔버스는 “누구나 쉽게, 함께 만드는 디자인” 이라는 철학 아래, 프레젠테이션부터 SNS 카드뉴스, 유튜브 썸네일, 포스터까지 일상의 모든 시각 콘텐츠를 브라우저 하나로 만들 수 있는 실시간 협업 디자인 플랫폼입니다. 앞선 포스팅에서 소개한 MongoDB Atlas에서 Amazon DocumentDB로 전환 이후, 수백만 건의 디자인 데이터 위에서 수많은 […]

Amazon DocumentDB로 미리캔버스의 성능 50%와 비용 30%를 개선하다

본 게시글은 미리디의 김민석, 이효성, 노정훈님과 함께 작성하였습니다. 미리디의 미리캔버스 소개 ⇩ 미리디의 미리캔버스는 “누구나 쉽게, 함께 만드는 디자인” 이라는 철학 아래, 프레젠테이션부터 SNS 카드뉴스, 유튜브 썸네일, 포스터까지 일상의 모든 시각 콘텐츠를 브라우저 하나로 만들 수 있는 실시간 협업 디자인 플랫폼을 운영하고 있습니다. 기획자와 마케터가 같은 슬라이드를 동시에 수정하고, 팀원이 실시간으로 댓글을 달며 피드백을 주고받는 […]

Amazon Aurora PostgreSQL에서 pgvector 0.8.0을 통한 벡터 검색 성능 및 관련성 향상

이 글은 AWS Database Blog에 게시된 Supercharging vector search performance and relevance with pgvector 0.8.0 on Amazon Aurora PostgreSQL by Shayon Sanyal을 한국어 번역 및 편집하였습니다. 효율적인 벡터 유사성 검색은 시맨틱 검색, 추천 시스템, 그리고 검색 증강 생성(RAG) 구현에 있어 핵심 구성 요소가 되었습니다. Amazon Aurora PostgreSQL-Compatible Edition은 이제 pgvector 0.8.0을 지원하여 벡터 검색 기능에 […]

부트텐트의 생성형 AI 기반 교육과정 등록 자동화 시스템 구성하기

부트텐트는 부트캠프와 국비교육 등 SW∙AI 분야의 직무 교육 정보를 한곳에서 탐색할 수 있는 플랫폼입니다. 사용자는 현재 모집 중인 교육 과정을 확인하고, 분야·비용·일정 등 원하는 조건에 맞춰 교육을 비교할 수 있습니다. 부트텐트는 2022년부터 교육 정보를 빠르고 정확하게 제공하는 데 집중해왔으며, 그 과정에서 수강생과 교육기관을 연결하는 플랫폼으로서 영역을 확대해 왔습니다. 앞으로는 단순히 교육을 찾는 단계를 넘어, 개인의 […]

기존 개발 코드(Java)로 Amazon Neptune Analytics GraphRAG 구현하기

서론 수년간 운영해온 서비스에서 Knowledge Graph를 구성하려면 어디서부터 시작해야 할까요? 새 스키마를 처음부터 설계하는 방법도 있지만, ORM 엔티티나 데이터 모델 같은 개발 코드에는 도메인의 구조가, 비즈니스 로직에는 운영하면서 축적된 규칙과 제약조건이 이미 녹아있습니다.이 지식을 AI로 구조화하면 Knowledge Graph의 출발점을 훨씬 빠르게 만들 수 있습니다. 이 글에서는 기존 Java/Spring 코드에서 그래프 스키마 명세를 추출하고, Amazon Neptune […]

Neptune GraphRAG Toolkit을 활용하여 정교한 비정형 데이터 검색하기

본 게시글은 AWS Database Blog에 게시된 ‘Introducing the GraphRAG Toolkit by Ian Robinson and Abdellah Ghassel’을 한국어 번역 및 편집하였습니다. Amazon Neptune이 그래프 기반 검색 증강 생성(RAG, Retrieval-Augmented Generation) 워크플로를 누구나 더 쉽게 구축할 수 있도록, Neptune 기반의 오픈 소스 Python 라이브러리 GraphRAG Toolkit을 선보였습니다. 이 툴킷은 비정형 데이터에서 자동으로 벡터 임베딩이 포함된 그래프를 구축하고, […]

Amazon Aurora PostgreSQL에서 Amazon Bedrock으로 벡터 임베딩 생성 자동화

본 블로그는 Domenico di Salvia와 Andrea Filippo La Scola가 작성한 블로그인 Automating vector embedding generation in Amazon Aurora PostgreSQL with Amazon Bedrock를 번역, 편집하였습니다. 벡터 임베딩은 생성형 AI를 활용하여 애플리케이션에서 비정형 데이터를 다루는 방식을 근본적으로 변화시켰습니다. 임베딩은 텍스트, 이미지 및 기타 콘텐츠의 본질을 머신이 효율적으로 처리할 수 있는 형태로 변환하는 수학적 표현 방식으로, 시맨틱 검색, […]