A gigante da tecnologia lançou recentemente uma atualização que aumentará as habilidades atuais de Alexa: A nova tradução ao vivo para Amazon Alexa.
Alexa agora pode traduzir entre português brasileiro, italiano, hindi, francês, alemão, espanhol e inglês em tempo real. Que grande inovação!
A atualização da tradução ajuda os usuários a pedir a Alexa para traduzir um idioma, e uma exibição da transcrição também é exibida nos dispositivos Echo.
Além disso, Alexa agora pode identificar pausas naturais e quebras de frase na conversa com mais precisão.
A tradução nunca foi tão fácil. Esta tecnologia de voz será uma virada de jogo total para as pequenas empresas nos próximos anos.
Você pode considerar expandir seu alcance para diferentes mercados.
Seus clientes agora podem facilmente solicitar informações sem se preocupar com a interferência do idioma.
Vejamos como funciona a tradução ao vivo para o Amazon Alexa.
Tradução ao vivo para Amazon Alexa
Esta tradução ao vivo permite que pessoas que falam em duas línguas diferentes conversem entre si.
Alexa atua como intérprete e traduzir os dois lados da conversa.
Para começar, o recurso funcionará com seis pares de idiomas - inglês e espanhol, francês, alemão, italiano, português do Brasil ou hindi - em dispositivos Echo com local definido como inglês dos EUA.
Os clientes podem pedir a Alexa para iniciar uma sessão de tradução para um par de idiomas.
Após o início da sessão, os clientes podem falar frases ou sentenças em qualquer um dos idiomas. Alexa identifica automaticamente um idioma e traduz cada lado da conversa.
O recurso Live Translation aproveita vários sistemas existentes da Amazon, incluindo o reconhecimento automático de voz do Alexa (ASR), Amazon Translate e Alexa's Texto-a-fala sistema.
ID do idioma
Alexa corre dois ASR modelos em paralelo, junto com um modelo separado para identificação de idioma durante uma sessão de tradução. Seja qual for o idioma que você fale, os dois modelos ASR serão usados ao mesmo tempo.
No entanto, apenas uma saída do modelo ASR é enviada ao mecanismo de tradução.
Para manter a latência da solicitação de tradução aceitável, essa implementação paralela é necessária, pois esperar para começar o reconhecimento de fala até que o modelo de ID de idioma retorne um resultado atrasaria a reprodução do áudio traduzido.
A saída ASR associada é pós-processada e enviada ao Amazon Translate assim que o sistema de ID de idioma seleciona um idioma.
A tradução é passada ao sistema de conversão de texto em fala de Alexa para reprodução.
Além disso, a Amazon descobriu que o modelo de identificação de idioma funciona melhor quando baseia sua decisão nas informações acústicas sobre o sinal de voz e nas saídas de ambos os modelos ASR.
No caso de falantes não nativos de um idioma, cuja fala geralmente tem propriedades acústicas consistentes, independentemente do idioma que está sendo falado, os dados ASR são de grande ajuda.
Reconhecimento de Voz
O modelo acústico converte o áudio na menor unidade de fala chamada fonema.
O modelo de linguagem codifica as probabilidades de cadeias de palavras específicas, o que ajuda o sistema ASR a decidir entre traduções ou interpretações alternativas da mesma sequência de fonemas.
Como a maioria dos sistemas ASR existentes, os usados para a tradução ao vivo do Alexa incluem um modelo acústico e um modelo de idioma também.
Os sistemas ASR usados para tradução ao vivo, como os modelos ASR existentes de Alexa, têm dois tipos de modelos de linguagem, a saber, o modelo de linguagem tradicional e o modelo de linguagem neural.
Um modelo de linguagem tradicional, codifica probabilidades para sequências de palavras relativamente curtas (normalmente cerca de quatro), e um modelo de linguagem neural, que pode ser responsável por dependências de longo alcance.
Os modelos de idioma da Live Translation foram treinados para lidar com um discurso mais coloquial, cobrindo uma ampla gama de tópicos do que os modelos ASR existentes de Alexa.
A Amazon usou a classificação temporal conexionista (CTC) para treinar os modelos acústicos.
Para tornar o modelo acústico mais potente, a empresa também misturou ruído no conjunto de treinamento, permitindo que o modelo se concentrasse nas características do sinal de entrada que variam menos sob diferentes condições acústicas.
Trabalho de Detalhe
Há uma modificação de Alexa ponteiro final.
Isso indica que o cliente parou de falar e que Alexa precisa fazer um acompanhamento. Isso também é necessário na adaptação à fala coloquial.
O ponteiro final pode distinguir entre uma pausa no final de uma frase e uma pausa no meio da frase, o que significa que o falante pode continuar um pouco mais.
Para a tradução ao vivo, o ponteiro final é modificado para tolerar pausas mais longas no final de cada frase, já que os falantes envolvidos em longas conversas geralmente levam algum tempo entre as frases para formular seus pensamentos.
Por último, o sistema de tradução ao vivo se ajusta a disfluências comuns. Também ajuda na formatação da saída ASR.
O sistema de tradução automática neural do Amazon Translate foi projetado para funcionar com entrada textual.
Atualmente, a Amazon está explorando várias abordagens para melhorar ainda mais o recurso de tradução ao vivo.
Um deles é o aprendizado semissupervisionado, no qual os modelos existentes de Alexa anotam dados não rotulados.
A Amazon usa as saídas de maior confiança como exemplos de treinamento adicional para ASR específicos de tradução da Amazon e modelos de ID de idioma.
A Amazon também está trabalhando para adaptar o mecanismo de tradução automática neural aos dados de fala conversacional.
Ele gera traduções que incorporam contextos relevantes, como tom de voz ou traduções formais versus traduções informais.
Isso é feito para melhorar a fluência da tradução e sua robustez para entrada de linguagem falada.
A Amazon busca maneiras e está continuamente trabalhando para melhorar a qualidade das traduções em geral e das expressões coloquiais e idiomáticas em particular.
Usando tradução ao vivo
A tecnologia por trás do Live Translate parece impressionante, e você pode leia mais sobre isso na postagem de anúncio da Amazon.
O Live Translate é um recurso alimentado por IA que pode reconhecer vários idiomas à medida que são falados e traduzir para ambos os falantes.
Também é semelhante ao funções de tradução disponíveis em outros assistentes digitais
O Live Translate é fácil de usar, mas há algumas restrições a serem observadas.
Observe que o recurso está disponível apenas em dispositivos Echo nos EUA. Tudo o que eles precisam fazer é definir a localização do dispositivo Echo e o idioma do sistema como “Inglês EUA” para usar o Live Translate.
Os usuários podem mudar facilmente ambos no aplicativo móvel Alexa se necessário, mas isso não é em todos os países, e isso muda o sotaque falado de Alexa, junto com o horário, o clima e os alertas locais que você recebe.
O Live Translate também funciona em todos os dispositivos Echo.
Os usuários do Echo Show obtêm um recurso extra: a exibição da tela do Echo Show.
É uma tradução ao vivo para ambos os falantes de cada idioma, para que você possa ler as frases faladas mais recentemente.
Os alto-falantes eco são atualmente os únicos dispositivos Alexa que oferecem suporte ao Live Translate.
Etapas para usar a tradução ao vivo para Amazon Alexa em um dispositivo Echo
Essas etapas são tão rápidas e você pode ter sua tradução facilmente. Tudo que você precisa fazer é o seguinte:
1. Quando estiver pronto para usar o Live Translate, diga: “Alexa, por favor, traduza do inglês para [segundo idioma].” Outras variações da frase devem funcionar; apenas certifique-se de dizer a Alexa quais idiomas traduzir.
2. Mantenha sua conversa normalmente. Alexa ouvirá e traduzirá conforme necessário. Para que o alto-falante Echo ouça e interprete claramente os dois alto-falantes, você precisa estar próximo.
3. Quando a conversa terminar, diga “Alexa, pare” para desligar a tradução ao vivo.
Considerações Finais
Tradução ao vivo para Amazon Alexa é um novo recurso que permite ao usuário entender outros idiomas facilmente.
Se você está viajando para um país remoto ou conversando com parentes estrangeiros, traduzindo de um idioma para outro nunca foi tão fácil!
Você simplesmente pede a Alexa para iniciar uma sessão de tradução para dois idiomas - inglês e espanhol, por exemplo - e você está pronto para ir.
Você pode começar a conversar, dizer uma frase em qualquer dialeto, e Alexa identificará automaticamente o idioma e traduzirá suas palavras.
Este programa atualmente funciona com seis pares de idiomas - inglês e espanhol, francês, alemão, italiano, português brasileiro ou hindi - e requer um Dispositivo de eco com a localidade definida como inglês dos EUA.
Esperançosamente, o Live Translate trará à luz outros dispositivos com Alexa e também em outros países no futuro, mas, por enquanto, pode tornar a visita de convidados internacionais mais fácil.