Meio Bit » Arquivo » Robótica e IA » Rede neural do Google torna o “ENHANCE!” realidade (ou quase isso)

Rede neural do Google torna o “ENHANCE!” realidade (ou quase isso)

Pesquisadores do Google Brain Team desenvolvem algoritmo capaz de inserir informações em imagens de baixa resolução, transformando quadrados gigantes em rostos identificáveis.

7 anos atrás

Duncan Robson – Let's Enhance (HD)

Uma das tropes mais populares do cinema e TV é a do “Zoom and Enhance”, que sempre aparece quando há câmeras de segurança envolvidas. Os profissionais extremamente competentes e seus softwares anielígenas sempre pegam as imagens mais toscas do universo e com uma série de aproximações, viradas e filtros mágicos conseguem identificar até as bolhas no refrigerante do meliante.

A realidade não funciona assim. É impossível extrair informações que uma imagem ou vídeo não possuem por conta da limitação de resolução. Você pode ter a melhor câmera do mundo, uma teleobjetiva monstruosa mas se tentar capturar um elemento longe demais ou pequeno demais, na hora de dar zoom só vai ver pixels gigantes.

É aí que entram em cena os ninjas do Google Brain Team, que estão se tornando craques em sistemas especialistas. Como não dá para extrair informações inexistentes os pesquisadores desenvolveram um algoritmo criado pela combinação de duas redes neurais, que tenta contornar essa limitação através de comparação com outras fontes. Funciona assim: o software foi alimentado com toneladas de imagens e treinado a identificar o conteúdo em outras com péssima resolução.

A primeira parte consiste em mapear a fonte e compara-la com outras, cuja resolução é derrubada de modo a encontrar uma equivalência. A segunda etapa é uma aplicação do PixelCNN, ao tentar inserir pixels reais na foto original com péssima resolução. O algoritmo sabe quais pixels adicionar e em quais lugares da foto expandida, baseado em seu extenso banco de dados. Assim, uma vez que identifique um rosto ele sabe onde estão os olhos, o cabelo, o nariz e por aí vai.

Na imagem acima temos, da esquerda para a direita: a fonte com 64 pixels, as conseguidas pelo algoritmo e as originais, nesses dois casos com 1.024 pixels. Ainda que os resultados não sejam perfeitos é uma grande aproximação, e com o tempo o software do Google Brain vai ficar ainda mais refinado.

Hoje isso não é mais do que uma curiosidade, até porque tais informações não existem na fonte. No entanto, num futuro próximo seria possível se o algoritmo evoluir o bastante vermos imagens antes estouradas demais receberem um tratamento de “Zoom and Enhance” para identificar elementos perdidos. Mas nada como no cinema ou TV, e muito provavelmente a polícia e/ou órgãos de segurança não vão usar um software que inventa dados.

Portanto desencane, você não verá nada assim nem num futuro próximo:

https://www.youtube.com/watch?v=xbCWYm7B_B4

Enhance, Enhance, Enhance | NTSF:SD:SUV | Adult Swim

Você pode apreciar o artigo aqui (cuidado, PDF).

Fonte: Ars Technica.

relacionados


Comentários