Meio Bit » Arquivo » Demais assuntos » Reconhecimento de voz no Google é quase Siri, mas em português ainda é Songa.

Reconhecimento de voz no Google é quase Siri, mas em português ainda é Songa.

11 anos atrás

Songa

O Google está aos poucos entendendo que quando fazemos uma busca não queremos uma lista de sites, mas uma resposta. Não me interessa se 500 sites publicaram tratados sobre o tema, se eu preciso descobrir rapidamente como remover mancha de muco vaginal de ornitorrincos em gravatas de seda, eu quero apenas a informação. No caso, esfregar um kiwi amassado, duas gotas de tabasco e cinco minutos no Sol, coberto por um pano roxo.

Siri trazia isso, a calculadora do Google trazia isso. Várias buscas já traziam resultados diretos, e agora o sistema de voz também trás. O comportamento é muito semelhante ao da Siri, mas isso é inevitável. Você faz uma pergunta, recebe uma resposta. Qual a qualidade? Excelente, é busca do Google.

 

A boa surpresa é que o serviço também funciona em português. E muito bem. Mais ou menos. Eu explico: a parte de reconhecimento é assustadoramente precisa. Sem treinamento, sem nada. Funciona bem melhor que a Siri.

No vídeo abaixo fiz alguns testes aleatórios. O reconhecimento é em tempo real, com um apoio contextual muito forte, como nosso cérebro costuma fazer, aliás. Ele (o reconhecimento, não o cérebro) funciona com imagem, texto, mapas, notícias. O pacote básico do Google. Ah, também dá para acessar informações diretas, tipo calculadora. Nesse caso a ferramenta é bem menos flexível que a Siri.

Pedir “Quanto é 25 dólares em reais” não dá o mesmo resultado que “25 dólares em reais”.

A parte ruim é que comparando com a versão gringa, essa é primitiva. A gringa te dá respostas, não resultados de busca, veja o comercial:

Claro, estou reclamando de barriga MUITO cheia. Dez anos atrás testei o IBM Via Voice, até então o máximo em tecnologia. Precisei ler três capítulos de um livro para que ele criasse um modelo de minha voz. Passou horas processando e só então pensou em funcionar. Capenga, o reconhecimento era de no máximo 70% e se eu inserisse qualquer termo em inglês, ele não reconhecia.

Hoje um tablet (mas roda no celular também) reconhece mais de 98% do texto falado, sem treinamento, em condições péssimas, ventilador ligado em cima do microfone, cachorro latindo…

A ferramenta mesmo não respondendo com voz, mesmo “só” trazendo páginas como resultado já é excelente. Lembre-se, você pode falar, não precisa digitar em celular.

É muito divertido viver no futuro, tenho muita pena de quem não viveu para experimentá-lo.

relacionados


Comentários