logo-centro-topo-CIDAC.png

Notícias Recentes

Google Assistente vai reconhecer sua voz e entender seu modo de falar

O Google pretende implementar um recurso de reconhecimento de fala personalizado para o aplicativo do Assistente. O objetivo é aprimorar a compreensão do algoritmo sobre modo como você pronuncia palavras e nomes recorrentes.

Conforme trechos do código da versão mais recente do aplicativo para o Android, uma opção de identificação individualizada de falas aparecerá como um recurso selecionável. Segundo o site 9to5Google, que identificou a mudança, será possível armazenar as gravações de áudio no dispositivo para ajudar o Assistente a reconhecer melhor o que você diz.

O reconhecimento personalizado de fala pode permitir que você treine o Google Assistente para se adaptar à sua voz (Imagem: Reprodução/9to5Google)

A funcionalidade vai manter o áudio apenas no celular, tablet ou demais dispositivos e será excluído quando o reconhecimento de fala personalizado for desativado. Além de explicar isso na opção, o Google apresentará um link para uma página em um “Saiba mais”, que provavelmente ainda não está no ar, mas terá detalhes sobre a novidade.

Uma das estratégias da gigante das buscas é refinar modelos de detecção para substituir o velho “Ok, Google” ou comandos pré-determinados. Ao reconhecer o modo como você quer interagir com o assistente, o algoritmo poderia ser acionado mesmo se você não disser as palavras-chave programadas.

Inicialmente, é provável que seja necessário criar vários modelos para os robôs mapearem dados da voz e conseguirem identificar tudo. A partir do seu aprendizado, seria enviado um resumo das alterações aos servidores do Google para aprimorar o sistema.

Refinamento do que você mais fala

O mais importante no começo é identificar os comandos relacionados a nomes e palavras faladas com frequência. Em nomes incomuns, pode ser complicado para um robô entender o significado. Mas ao gravar vários áudios com entonações e modos distintos de se falar, o Google Assistente aprenderia a distinguir com mais facilidade.

Em dispositivos como o Nest Hub, o Google já usa um chip de hardware que aprimora o aprendizado de máquina e processa localmente as consultas mais comuns para apresentar resultados rapidamente. Agora, esse conceito pode ser expandido para todos os dispositivos com Android.

Para os que não se sentem seguros em ter algo gravando sua voz, a empresa deve introduzir a função como algo opcional e desligável. Haverá uma mensagem que avisa ao usuário o resultado da desativação: menor precisão ao reconhecer os termos comuns e a exclusão dos áudios.

Não está claro quando o recurso será lançado nem se já está pronto para testes. No Google I/O 2021 e 2022, foi possível ver o quanto os desenvolvedores do Assistente estão empenhados em tornar as conversas mais naturais. É provável que este seja uma das funcionalidades que ajudarão a chegar neste patamar de excelência desejado.

 

Fonte: Canaltech

Compartilhe:

Manual do Servidor