Google apresenta algoritmo otimizador de JPEGs direto de Hogwarts

bzzzzzzzzzzzzzzzzzz

Nos primórdios da computação não existiam imagens compactadas, até por questão de velocidade: os bitmaps eram tratados de forma contínua, o que é ótimo pois gera arquivos sem perda de qualidade, mas péssimo pois gera arquivos monstruosos. Sem compressão não existiria vídeo na internet, ou mesmo em DVDs. E nossas imagens seriam gigantescas.

Esse JPEG da Mione por exemplo tem 25,5 kB, descompactado no Photoshop ocupa 641,7 kB.

Há dezenas, centenas de algoritmos de compressão diferentes, e não vou ter a pretensão de fingir que entendo a matemática por trás da maioria deles, mas em essência o que todos os algoritmos com perda fazem é eliminar informação desnecessária, apostando na incapacidade humana de identificar detalhes.

Vamos a um exemplo: esta foto abaixo escolhida ao acaso aleatoriamente por um algoritmo de busca cega, descompactada, 1,67 MB. Compactada, 125 kB:

random1

Recomprimindo em JPEG com a qualidade no mínimo, passa a ocupar 68,7 kB:

random2

Em um celular, são idênticas. Se você ampliar e estudar a diferença, ela é brutal, a imagem foi simplificada, bastante informação foi perdida.

random

Como de longe não percebemos? Simples, nossos olhos são uma bela porcaria, uma gambiarra evolutiva que se os criacionistas estão certos Deus quando os criou deu o serviço pro estagiário, que na época era Castiel o Anjo-faz-merdinha de Supernatural. Quer um exemplo? Rola um bacalhau via software pra compensar o CENTRO do olho ser cego, é onde entra o nervo óptico e os vasos sanguíneos.

As técnicas de compressão aproveitam nossas limitações para remover elementos que não farão diferença. E aí entra o Guetzli, um algoritmo desenvolvido pelo Google que faz uma otimização muito mais eficiente do modelo psicovisual da imagem. Com isso ele trabalha melhor as cores e por meio de altas macumbarias, entrega pro algoritmo final de compressão dados bem mais limpos, produzindo arquivos menores que um JPEG normal, mas com muito menos perda.

A beleza do Guetzli é que ele não mexe no FORMATO do JPEG, então ele é transparente para todos os programas que abrem esses arquivos.

PARA SABER MAIS

Artigo no blog da Google Research detalhando o algoritmo.

Diz o Google que o algoritmo consegue até 35% de compressão extra, sem afetar a qualidade visual. Quando você lida com centenas de quiloquads de imagens, 35% é um número mágico. Mas… será que é mesmo?

Como o algoritmo é Open Source, baixei para experimentar. Usando meu algoritmo proprietário de busca de imagens aleatórias, cheguei a esta, 1.181 × 1.181 pixels, 293 kB de tamanho.

lv2

Otimizada ela rendeu um arquivo de… 258 kB. Humm. De 293 para 258? Não muito promissor. Será que talvez uma imagem maior, paradoxalmente produza uma compressão melhor?

Vamos testar com outra imagem randômica, das grandes.

lvsmall

No original essa imagem tem 2.731 × 4.096 pixels, 7,9 MB de tamanho. O fundo é todo um degradê, o Nêmesis dos JPEGs. Quanto será que o algoritmo conseguirá reduzir, sem perda perceptível de qualidade?

2,76 MB. Isso mesmo, o algoritmo mágico do Google reduziu um JPEG gigante de quase 8 MB para menos de 3 MB, e ele continua abrindo em qualquer programa compatível com o formato.

PORÉM NEM TUDO SÃO FLORES

Sempre tem um porém. O software em si não está otimizado, então o processamento demora. Em meu Phenom™ II X4 965 Processor, 3.400 MHz, 4 núcleo(s), 4 processador(es) lógico(s), 16 GB de RAM e SSD, o primeiro arquivo levou 3 minutos para ser processado. O segundo, 45 minutos. Isso mesmo. Dava tempo de a Alemanha fazer 5 gols no Brasil.

fotos

Portanto, não saia todo feliz pensando em comprimir seu acervo de fotos. Espere até que programadores cascudos estudem o algoritmo e o otimizem. Por enquanto ele não passa de grafeno digital. Só funciona em laboratório.

Fonte: Engadget.

Relacionados: , ,

Autor: Carlos Cardoso

Entusiasta de tecnologia, tiete de Sagan e Clarke, micreiro, hobbysta de eletrônica pré-pic, analista de sistemas e contínuo high-tech. Cardoso escreve sobre informática desde antes da Internet, tendo publicado mais de 10 livros cobrindo de PDAs e Flash até Linux. Divide seu tempo entre escrever para o MeioBIt e promover seus últimos best-sellers O Buraco da Beatriz e Calcinhas no Espaço.

Compartilhar
  • Diego

    Em edição de imagens, aposto que sei menos do que a média do público do MeioBit, mas já percebi que a compressão JPG sofre muito mais com descontinuidades do que com o degradê. Por isso acho que a foto “guia da noiva” não tenha tido uma redução bacana no tamanho do arquivo. Todas aquelas letras “duras” impedem a compressão sem a geração de artifacts no resultado final.
    Já a foto de grande formato é apenas* uma foto natural (sem elementos adicionados em editor) então imagino que aí o algoritmo teve bem mais facilidade para a compressão.
    (*Espero não tomar block por me referir a uma foto da Vendramini com o advérbio “apenas”).

    • Didi Moco Sonrisal Colesterol

      Calma que o Cardoso não bloquearia alguém por uma foto escolhida aleatoriamente!!!!

      • Claudio Roberto Cussuol

        Emma Watson e Luciana Vendramini no mesmo post?
        O algoritmo de aleatoriedade do Cardoso tá bem afinado…..
        …. para os padrões do Cardoso, é claro.

        • DumbSloth87

          Fotos escolhidas aleatoriamente entre milhares de outras fotos da Emma Watson e da Vendramini.

        • gfg

          Então o algoritmo esta com algum bug, pois faltou alguma japinha em um dos exemplos.

          • Claudio Roberto Cussuol

            Especialista em japinha é o Gogoni

    • A mão do block chegou a tremer…

  • Kimzark

    “… esta foto abaixo escolhida ao acaso aleatoriamente por um algoritmo de busca cega …”, HAHAHAHAHAHAHA

    • Rolando

      E quem pode condenar esse algorítimo? O meu além da Luciana Vendramini, tende a escolher a Jennifer Aniston (porra Brad Pitt) e a Mila Kunis.

  • Unfear

    Fiquei mais interessado no algoritmo de busca aleatória cega kkkkkkk

  • Mateus Silva

    Cardoso como anda o projeto de fazer um clone da Vendramini ?

    • Theuer

      Putamerda, assisti HOJE “Hole in my Soul” do Aerosmith em uma fitona VHS com o eterno “Top 10 MTV” lá de 97~99.
      Aquilo sim era uma máquina de clones!

      • Maximus_Gambiarra

        Caramba… VHS, Aerosmith e MTV! Acho que posso, oficialmente, falar que “no meu tempo as coisas eram diferentes”

  • Rolando

    “Dava tempo de a Alemanha fazer 5 gols no Brasil.” kkkkkkkkkkk E das menininhas, digo, jogadores da seleção brasileira, chorarem até cansar.

  • Carlos Ferreira

    Ontem me enviaram uns .jpg’s interessantes de hogwarths, com uma certa bruxinha muito popular na internet como assunto.

    Por pura aleatoriedade ela apareceu nesse post.

    • doorspaulo

      Tinha uns mp4 também bem legais, que o CSI internetz confirmou que era a Mione mesmo.

  • Abraão Caldas

    Também né, com esse phenom II cansado… demora mesmo.

    • DSCLP

      • Lucas Linki

        DSCLPD :>

    • 640k is enough

      O processador ainda dá um caldo, mas o TDP de 140W é complicado.

      • Rafael Rodrigues

        Cardoso deve ser cliente Vip na White Martins…

      • Abraão Caldas

        Será?, perde para um i3 de terceira geração :/

        • 640k is enough

          Sim, ele é equivalente ao i3 de segunda geração… mas ainda assim vale pra quem está sem $$ pra investir em máquinas recentes, mas isso vai ser cobrado de volta em sociedade com a companhia de energia… 😀

  • PP CarvalhoF

    lv.jpg e lv2.jpg… Esse algoritmo é fodão mesmo! Faz até um rename refinado! 😂😂😂

  • Ivan

    Essa do grafeno entendi a referencia.

  • Lucas Timm

    A Luciana Vendramini tava sumida

    • Gaius Baltar

      Sumida para ti, herege! Todo dia ela aparece na minha timeline e dá bom dia. É na do Cardoso também, claro.

  • tuts

    Só funciona em laboratório e no servidor do Google Photos, só mandar tudo pra lá que a google faz o trabalho difícil de compactar pra você com um supercomputador.

  • Gaius Baltar

    Esse seu algoritmo tem um bom gosto danado. Provavelmente ele foi adolescente nos anos 80 e tinha um posterzão da modelo randomica com seus 17 anos.
    Ah, sobre o artigo: é legal essa compressão. 🙃

  • Othermind

    A uns anos atras estava complicado armazenar os arquivos RAW.. dai pensei em transformar tudo em JPG.. mas ao mesmo tempo os meios de armazenamento deram um salto e preço o baixou (nem tanto, ok).. HD´s de 1 tera se tornando o “basicao”… Dai meio que larguei mao.. mais facil comprar um novo HD de 1tera (ou mais) do que converter tudo e perder a qualidade das fotos…

  • Paulo NH

    “nossos olhos são uma bela porcaria”. Tá insatisfeito com o seu? Faça uma doação de córnea para aqueles que precisam e se livre da sua “porcaria”.

    • Super Suporte

      volta! volta pro g1

      • Paulo NH

        porquê?

    • doorspaulo

      Aqui, caros leitores, temos um exemplar de Homo Sapiens desprovido de senso de humor levemente acima da média.

      Indivíduos desta subespécie tendem a se divertir apenas com um humor óbvio e ululante, não percebendo coisas mais sutis que um rinoceronte em disparada.

      • Jacqueed

        Quem são? Onde vivem? Do que se alimentam? Sexta-feira no Globo Repórter!!!!

  • Cássio Amaral

    Incrível como essa running gag do Cardoso selecionando imagens “aleatórias” da Luciana Vendramini para ilustrar um post nunca perde a graça kkkkk.

    Falando sério agora, esse Phenom II já deu o que tinha que dar. Cardoso pegasse um Ryzen 7 ou um core i7 hexacore ia terminar muito mais rápido a compressão de imagens, que geralmente são bem programados para usar vários núcleos de uma CPU.

  • Dandalo Gabrielli

    Preciso reler o texto. O resultado das compressões não foram algo de novo a ser considerado. Cair de 8 para 3 MB já é o padrão em jpg. Obviamente dependendo do nível de depreciação. Usando 60-70 de qualidade, perdendo “30% de dados”…

    • Careca Voador

      Sim, você precisa reler o texto. O ponto e fazer um JPEG compactado de 8MB para 3MB sem perda significativa de qualidade.

      • Dandalo Gabrielli

        Sim, tem razão

  • “Rola um bacalhau via software pra compensar o CENTRO do olho ser cego….” kkkkkkkkkkkkkkkkkkk

    Descreveu de maneira bem simples o que acontece com o olho…

  • Dio

    Quanto tempo até utilizarem o open source e criarem um “formato novo” que pode ser explorado pela sistema capitalista?

  • “Só funciona em laboratório.”

    Seria, se você tivesse que rodar o algoritmo toda vez que abre a imagem. Como está, se você dispor de tempo dá pra comprimir de maneira excelente imagens gigantes (escolhidas aleatoriamente ou não) que você queira, por exemplo, hospedar no seu servidor, reduzindo horrores o tráfego de ida e vinda.

    E agora estou curioso pra ver qual o grau de compactação (e quanto tempo demora) usando aquelas imagens supimpas dos telescópios da NASA…

  • Ruan

    Bacana, sempre usei o Caesium e obtive resultados excelentes e rápidos. Mas, de quaqluer forma, toda melhora é bem vinda 🙂

  • Fabiano Novaes Ferreira

    às vezes tento lembrar porque gosto deste site.

    aí temos posts como estes, com imagens aleatórias escolhidas por algoritmos de busca cegas e eu me lembro exatamente por quê!

    o problema é que o algoritmo cego entrega a idade hehehe

Aproveite nossos cupons de desconto:

Cupom de desconto Locaweb, Cupom de desconto HP, Cupom de desconto Descomplica, Cupom de desconto Nuuvem, Cupom de desconto CVC, Cupom de desconto Asus, Cupom de desconto World Tennis