Pular para o conteúdo principal

Amazon Polly | Gerador de voz com IA

Implante vozes humanas de alta qualidade e com sonoridade natural em dezenas de idiomas

O que é o Amazon Polly?

O Amazon Polly é um serviço totalmente gerenciado que gera voz sob demanda, convertendo qualquer texto em uma transmissão de áudio. Uso de tecnologias de aprendizado profundo para converte artigos, páginas da web, documentos em PDF e outros textos em fala por meio da conversão de texto em fala (TTS, na sigla em inglês). O Polly fornece dezenas de vozes realistas em um amplo conjunto de idiomas para você desenvolver aplicações ativadas por fala que gerem engajamento e conversão. Atenda às diversas necessidades linguísticas, de acessibilidade e aprendizado dos usuários em todas as regiões e mercados. Redes neurais avançadas e mecanismos de voz generativos funcionam em segundo plano, sintetizando a fala para você. Integre a API do Amazon Polly às suas aplicações existentes para torná-las compatíveis com voz de forma rápida. 

  

Casos de uso

Adicione recursos de voz em aplicações voltadas para audiências globais, incluindo feeds RSS, páginas da web e conteúdos em vídeo. Prepare suas aplicações de dispositivos móveis e de IoT para o futuro com tecnologia compatível com voz.

Saiba mais informações sobre a geração de fala.

Armazene e reproduza a saída de voz do Amazon Polly para alertar os autores de chamadas por meio de sistemas de resposta de voz interativos ou automatizados. Use as funcionalidades de IA para gerar vozes que se conectem emocionalmente com seus clientes.

Saiba mais informações sobre os mecanismos de voz

Crie dublagens para animações, jogos e outras mídias diretamente de seus scripts. Use SSML, uma linguagem de marcação padrão baseada em XML do W3C, para ajustar a escolha de palavras, a ênfase e a entonação de acordo com a cena. Ajuste automaticamente a duração da fala para facilitar a dublagem em diversas línguas.

Saiba mais informações sobre o SSML

Funcionalidades

O Amazon Polly tem uma variedade de funcionalidades, incluindo as que estão listadas abaixo

Vozes realistas

Ofereça interações conversacionais com o usuário mantendo tempos de resposta consistentemente ágeis

Ao solicitar a saída do Amazon Polly, você pode escolher entre dezenas de vozes realistas em vários idiomas. Cada voz é criada usando falantes nativos, com variações de voz para voz, até dentro do mesmo idioma. A maioria dos idiomas inclui uma ou mais vozes masculinas e femininas, então você pode escolher a mais adequada para seu caso de uso.

A woman wearing a yellow jacket stands outside, smiling while using a pink smartphone near a metal railing and modern structure.

Saída personalizável

Personalize e controle a saída de fala conforme necessário

O Amazon Polly permite que você crie uma saída personalizada de conversão de texto em fala para engajar e prender a atenção do seu público. Use léxicos personalizados para modificar a pronúncia de acrônimos, nomes de empresas, terminologia interna ou qualquer outra palavra que você escolher. As etiquetas Speech Synthesis Markup Languages (SSML) do Amazon Polly também permitem ajustar a ênfase, a entonação, a escolha de palavras e o estilo. Gere a saída de IA de voz que melhor se adapte à sua empresa.

Missing alt text value

Potência da IA generativa

Acesse funcionalidades integradas de IA generativa por uma fração do custo

O Amazon Polly oferece suporte a vários mecanismos de voz que você pode escolher para converter texto em fala. O mecanismo implanta um transformador de bilhões de parâmetros para gerar vozes de forma incremental e transmissível. Esse gerador de voz de IA cria uma fala sintética que é assertiva, emocionalmente envolvente e altamente coloquial, semelhante a uma voz humana real.

People collaborating at a wooden table with laptops, smartphone, potted plant, and a lightbulb lamp, suggesting teamwork and brainstorming in a modern workspace.

Controle e segurança

Armazene e redistribua arquivos de fala nos formatos padrão de forma segura

Armazene sua saída de conversão de texto em fala em arquivos de áudio padrão, como MP3 e OGG, para redistribuição, análise, arquivamento ou qualquer outro caso de uso, sem nenhum custo adicional. Armazene seus arquivos em cache para uma recuperação mais rápida, se necessário. A segurança, a confiança e a privacidade do seu conteúdo são as maiores prioridades da AWS. O Amazon Polly não retém o conteúdo de seus envios de texto.

Missing alt text value

Perguntas frequentes

Sim. O Amazon Polly disponibiliza serviços gratuitos de IA de conversão de texto em fala por um ano após a inscrição, até atingir o limite mínimo de uso estipulado. O limite varia de 100 mil caracteres a 5 milhões de caracteres, dependendo do mecanismo de voz escolhido. Para obter mais detalhes, consulte os preços do Amazon Polly.
O Amazon Polly oferece mais de 100 vozes masculinas e femininas em mais de 40 idiomas e variantes linguísticas. A AWS está constantemente atualizando e adicionando funcionalidades aos recursos de voz.
O Amazon Polly produz MP3, OGG e outros formatos de arquivo de áudio padrão com amostragem de 8.000 Hz, 16.000 Hz e 22.050 Hz.
A resposta é: sim. Atualmente, a Alexa usa a tecnologia do Polly para potencializar a solução de geração de texto em fala. No entanto, as vozes da Alexa foram desenvolvidas exclusivamente para a Alexa e não estão disponíveis externamente.
Não. O Amazon Polly é um serviço de IA em nuvem totalmente gerenciado. Você se comunica com ele usando APIs em seu código. Não é possível realizar o download nem implantar o código-fonte do Amazon Polly em seu ambiente. No entanto, é possível usar o Amazon Polly gratuitamente por até 12 meses a partir do início, respeitando um limite de uso previamente definido. Para obter mais detalhes, consulte os preços do Amazon Polly.