Aprenda
Como a turbopuffer refatora a economia da busca.

Como a turbopuffer refatora a economia da busca.

Como estava esse conteúdo?

A pesquisa semântica desempenha um papel fundamental na criação de conexões entre empresas e clientes. Diferentemente da busca tradicional de texto completo, ela interpreta o contexto por trás de uma pesquisa para tornar as interações digitais mais intuitivas, relevantes e personalizadas. Enquanto uma busca tradicional por “vestido vermelho”, por exemplo, restringiria os resultados às palavras exatas utilizadas, a pesquisa semântica pode retornar produtos e conteúdos significativos além dos limites das palavras-chave. Isso inclui itens relacionados e relevantes para a consulta, como produtos descritos como “vestido bordô” ou “vestido de gala vermelho”.

Até recentemente, o alto custo de armazenar e pesquisar os volumes de dados necessários para uma pesquisa semântica bem-sucedida impediu muitos de aproveitar plenamente seus benefícios nos casos de uso mais importantes. Esse desafio é agravado pela explosão do uso de grandes modelos de linguagem (LLM) e pela demanda por pesquisa iniciada por agentes, com alta recuperação e baixa latência, em documentos, bases de código e websites. Ao vivenciar esse problema em primeira mão em seu antigo cargo como engenheiro chefe na Shopify e como consultor ajudando empresas a escalar sua infraestrutura, Simon Hørup Eskildsen passou a se dedicar obsessivamente a descoberta de uma solução. Sua intuição — e alguns cálculos rápidos — sugeriam que uma mudança fundamental na arquitetura poderia transformar drasticamente a economia da busca.

Desde então, Eskildsen e Justine Li cofundaram a turbopuffer para tornar a pesquisa semântica de alta recuperação e baixa latência acessível, ajudando clientes a pesquisar mais dados, melhorar a qualidade da busca e economizar milhões. Ao construir o banco de dados sobre armazenamento de objetos no Amazon S3 e aproveitar serviços da AWS como Amazon EKS e Amazon EC2, a startup mudou fundamentalmente a forma como empresas como Cursor, Notion e Linear implementam busca em escala.

Tornar dados pesquisáveis em escala

Enquanto soluções anteriores utilizavam indexação em memória ou hierarquização de armazenamento, o mecanismo de pesquisa semântica da turbopuffer reduz custos em 10 vezes ou mais ao aproveitar plenamente uma arquitetura nativa de armazenamento de objetos. O repositório de objetos atua como a fonte de verdade, enquanto dados quentes podem ser armazenados em cache na memória. Assim como um baiacu pode inflar e desinflar sob demanda, a empresa recebeu esse nome por sua capacidade de inflar (ou escalar) uma camada de cache — com “turbo” enfatizando a velocidade e a eficiência do algoritmo.

Antes dessa nova abordagem, as organizações precisavam escolher quais dados pesquisar, limitando suas ambições de produto devido ao alto custo do armazenamento de vetores e ao limitado retorno sobre o investimento. Roko Kruze, engenheiro de soluções da turbopuffer, explica que sua missão é “reduzir o custo geral de armazenamento e pesquisa de dados, para que as pessoas não precisem fazer essa troca”. Muitos clientes da turbopuffer veem melhorias de mais de 20% na qualidade da pesquisa. O impacto é significativo: melhores experiências do usuário, maior satisfação e maior fidelidade do usuário.

O objetivo da turbopuffer é tornar cada byte pesquisável. Ao separar computação e armazenamento e usar armazenamento de objetos, ela consegue alcançar um nível de escalabilidade que, de outra forma, seria proibitivo em termos de custo com soluções tradicionais de bancos de dados de vetores. “Estamos permitindo que as pessoas consultem mais de 100 bilhões de vetores, o que basicamente equivale a indexar toda a World Wide Web”, explica Kruze. Embora trabalhe com empresas como a Notion, que têm milhões de clientes e mais de 10 bilhões de vetores em produção, a turbopuffer consegue particionar todos esses dados por cliente. “Isso é algo que praticamente conseguimos fazer de graça por causa da forma como somos construídos sobre o Amazon S3”, afirma Kruze.

Trabalhar lado a lado com a IA

Além de aumentar a escalabilidade e a qualidade da busca, a turbopuffer está se mostrando uma ferramenta poderosa para fluxos de trabalho de IA. A startup tem visto grande sucesso nessa área porque LLMs estão sendo cada vez mais usados para realizar pesquisa semântica em bases de código, documentos e websites, gerando respostas melhores. Essa escala de workloads de busca orientada por IA é ordens de magnitude maior do que no passado, e a turbopuffer foi construída de forma única para resolver esse desafio.

Muitos clientes estão aproveitando a turbopuffer para fluxos de trabalho de IA agêntica, ajudando a garantir que as informações fornecidas aos LLM sejam específicas, relevantes e de alta qualidade. “Algumas pessoas tentam colocar o máximo de dados possível na janela de contexto e torcer pelo melhor”, explica Kruze. “A turbopuffer melhora o desempenho geral dos LLM porque há menos dados para serem processados, e tornamos esses dados muito facilmente acessíveis para sistemas agênticos”, acrescenta.

Atendendo atualmente mais de 500 clientes, a turbopuffer oferece suporte tanto a pequenas organizações quanto a grandes empresas, incluindo Cursor e Grammarly. A startup também elimina a complexidade da busca ao oferecer seu produto como um serviço gerenciado. Sem a necessidade de lidar com operações subjacentes, os clientes podem se concentrar na construção de suas aplicações.

Uma parceria que impulsiona crescimento e eficiência

A colaboração próxima com a AWS ajudou a turbopuffer tanto a construir um banco de dados mais rápido e confiável quanto a se conectar com mais clientes. Kruze observa que “você vai até onde seus clientes estão, e muitos estão na AWS”. A empresa participou do Programa de Aceleração da Migração (MAP) para migrar sua infraestrutura principal em apenas algumas semanas, beneficiando-se de créditos da AWS e do suporte de especialistas na otimização do software para implantação na AWS. Como afirma Kruze, “o AWS MAP impulsionou nossa oferta na AWS, que hoje é usada por mais de 200 clientes”. Operar na AWS significa que a empresa pode oferecer seu produto de forma confiável em todo o mundo, graças à ampla presença das regioes da AWS.

O acesso a especialistas e a serviços de armazenamento de objetos também se mostrou particularmente valioso. Ao trabalhar em conjunto com especialistas do Amazon S3, a turbopuffer teve a oportunidade de influenciar grandes decisões de design e implementá-las desde cedo para aprimorar sua solução. Por exemplo, o recurso de comparação e troca do Amazon S3 permite que a turbopuffer ofereça semântica de consistência forte — um requisito básico para qualquer banco de dados sério — sem adicionar dependência de outro serviço. Historicamente, a consistência forte exigia uma dependência adicional de um banco de dados transacional, como Amazon RDS ou Amazon DynamoDB, o que adiciona uma quantidade significativa de sobrecarga operacional. Como afirma Eskildsen, “a equipe do S3 tem sido uma grande parceira ao fornecer acesso a recursos em beta e coletar feedback de API para ajudar a tornar a turbopuffer o primeiro banco de dados em escala a operar exclusivamente sobre armazenamento de objetos”.

Como uma empresa pequena, com menos de 20 pessoas, equilibrar eficiência de custos sem comprometer o desempenho é fundamental. Para isso, a turbopuffer também utiliza o Amazon EC2 para computação segura e redimensionável e o Amazon EKS para criar, executar e escalar aplicações Kubernetes em conjunto com o Karpenter. Comentando os benefícios, Kruze afirma: “O uso do EKS e do Karpenter nos deu a flexibilidade de otimizar nossos custos de computação em várias classes de instâncias com pouco esforço. Isso nos poupou incontáveis horas de configuração e nos permite oferecer o melhor desempenho possível aos nossos clientes pelo melhor custo”.

Buscar ovos caminhos para excelência em pesquisa

Para construir confiança junto a uma base ampla de clientes, a turbopuffer comprovou sua capacidade de atender a rigorosas políticas corporativas de segurança e privacidade de dados. Kruze comenta que chaves de criptografia gerenciadas pelo cliente (CMEK), em conjunto com conectividade privada por meio do AWS PrivateLink, foram “uma grande vitória”. Ele acrescenta que esses recursos de segurança permitem que a turbopuffer “integrar clientes que simplesmente não seriam possíveis de outra forma”.

Olhando para o futuro, a turbopuffer planeja avançar para ainda mais — e maiores — workloads de pesquisa. Como afirma Kruze, “o próximo passo é abrir mais oportunidades no cenário corporativo, e esperamos que a AWS nos ajude ao longo dessa viagem”. A turbopuffer está em processo de entrada no AWS Marketplace para ampliar o alcance e simplificar a aquisição de seus produtos. Enquanto isso, continua aumentando sua visibilidade ao participar de eventos de destaque, como o AWS re:Invent.

Como parte de seus objetivos de expansão, a startup também está ampliando sua reputação para além das capacidades de pesquisa vetorial. “Estamos vendo cada vez mais pessoas se interessarem pela nossa solução de busca de texto completo, e queremos realmente nos tornar a plataforma de pesquisa padrão para todos”, afirma Kruze. Atualmente hospedando mais de um trilhão de documentos e atendendo a mais de dez mil consultas por segundo, a turbopuffer está pronta para assumir mais workloads e se tornar o mecanismo de pesquisa mais escalável e confiável do mundo.

Muitas startups têm ambições igualmente ousadas, e estão no caminho para alcançá-las com o apoio da AWS. Mais de 350.000 startups em todo o mundo já se juntaram ao AWS Activate desde sua criação em 2013, acessando recursos, orientação personalizada, assistência técnica, créditos da AWS e muito mais. Criado para fundadores e voltado ao crescimento, o AWS Activate ajuda startups a criar, lançar e escalar na AWS. Saiba mais e participe hoje mesmo.

Como estava esse conteúdo?