Veja a IA do Google vencer o melhor jogador de Go do mundo [UPDATE: máquina 4 × 1 humano]

go

Como já dissemos antes, ensinar pensamento lógico a um computador é fácil. Redes neurais desenvolvidas com esse intuito só precisam analisar um conjunto de ações para a resolução de um problema e escolher a alternativa mais satisfatória e menos prejudicial, tendo como base seu próprio conjunto de regras.

É assim por exemplo que se ensina uma máquina a jogar xadrez. Já heurística é muito, mas muito mais complicado. Analisar todas as possíveis soluções em uma situação, suas implicações, pesar todas as consequências e resultados e escolher a solução que pode até não ser a melhor no momento, mas a que dará melhores resultados posteriormente (o que pode ser logo ou muito tempo depois), mesmo que isso implique em prejuízo imediato era até pouco tempo atrás um processo considerado exclusivamente humano.

O milenar Go é o melhor exemplo de um jogo de heurística aplicada. Por causa de sua magnitude e características se convencionou dizer que desenvolver uma IA capaz de dominá-lo seria a conquista de um novo patamar, pois teríamos uma rede neural capaz de encadear pensamentos e tomar decisões de forma muito similar ao humanos, ao não se valer só da lógica (ou ignorá-la completamente). Em suma, pensamento heurístico é o Santo Graal da Inteligência Artificial.

E ao que tudo indica, os Cavaleiros da Távola do Google estão prestes a botar a mão nele.

lee-sedol-vs-deepmind

Lee Sedol (dir.), o melhor jogador de Go do mundo é encurralado pelo AlphaGo

Nós já noticiamos que o DeepMind, o laboratório britânico de pesquisa especializado em inteligência artificial de Mountain View desenvolveu um novo software chamado AlphaGo. Ele é dividido em camadas de pensamento, enquanto uma rede neural analisa o tabuleiro e tenta realizar a próxima jogada, outra busca prever quem será o vencedor. Ambas se baseiam no Monte Carlo Tree Search (MCTS), um algoritmo de busca heurística que baseia as tomadas de decisão do AlphaGo em aprendizado de máquina, ficando o tempo inteiro analisando jogadas e partidas passadas (suas e de outros jogadores) em seu banco de dados.

Assim ele pondera todos os seus movimentos possíveis e do oponente, filtra as inúmeras possibilidades de movimento sem considerar lógica (que levaria o software a fazer o melhor movimento naquele momento, o que no Go é um convite ao desastre completo), baseando-se em alternativas que levem ao objetivo final mesmo que elas não sejam as melhores para aquele momento, mas que seja mais facilmente executáveis imediatamente e que apresentem resultados vários movimentos à frente.

O software foi testado contra 494 máquinas diferentes e venceu todas. Então veio seu batismo de fogo, quando o Google desafiou o campeão europeu de Go Fan Hui. O AlphaGo deu uma lavada de 5 a 0 em seu primeiro adversário humano. Então chegou a hora de aumentar as apostas.

O Google anunciou na ocasião que o AlphaGo enfrentaria o sul-coreano Lee Sedol, considerado o melhor jogador de Go da atualidade (o que dada a magnitude do jogo, prova que o cara é fera). Pois bem, ontem rolou a primeira das cinco partidas, e…

Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo

Bom, deu AlphaGo. Ainda teremos mais partidas até a próxima semana, quando saberemos quem levará a coroa para casa.

O sonho do AlphaGo não é uma conquista apenas do Google pois muito do mérito pertence a Demis Hassabis, hoje VP de Engenharia e IA do Google DeepMind. Ele começou sua carreira aos 16 anos como level designer da Bullfrog Productions, tendo trabalhado no primeiro Syndicate. Aos 17 ele já era programador-chefe em Theme Park, um dos games mais lembrados dos bons tempos de Peter Molyneux. Hassabis passou para a Lionhead Studios e entre outros projetos foi o líder de IA do clássico Black & White. Foi então que ele, já formado em Ciência da Computação por Cambridge se cansou do mercado de videogames, e passou a se dedicar a outros tipos de jogos. Era 2005.

Hassabis voltou para a universidade, concluindo em 2009 seu doutorado em Neurociência Cognitiva; a partir daí ele passou a emprestar seus conhecimentos a diversas instituições como Harvard e MIT. Em 2010 ele fundou junto com o pesquisador especializado em aprendizado de máquina Shane Legg e o empreendedor Mustafa Suleyman a então DeepMind Technologies, servindo como seu primeiro CEO. Ela recebeu diversos investimentos para tocar suas pesquisas de IA, inclusive de Elon Musk, e obviamente começou a chamar a atenção.

Demis Hassabis (esq.), fundador e VP de Engenharia e IA do Google DeepMind aperta a mão de Lee Sedol, o melhor jogador de Go do mundo

Demis Hassabis (esq.), fundador e VP de Engenharia e IA do Google DeepMind aperta a mão de Lee Sedol

Foi então que o Google a comprou por US$ 400 milhões no início de 2014, e Hassabis passou para o setor de engenharia (seu CEO hoje é obviamente Larry Page, executivo-chefe da Alphabet Inc.). Um de seus projetos mais adiantados na época, que embora não tenha tido o dedo da gigante das buscas mas foi apresentado sob sua asa foi a IA capaz de jogar e vencer diversos games do Atari 2600.

Porém, com a grana do Google foi possível ir mais alto. Hassabis sabe que um programa capaz de entender, jogar e vencer uma partida de Go contra um oponente humano é um passo importantíssimo para o avanço das inteligências artificiais. Máquinas poderão não se basear só em lógica, mas utilizarão pensamento heurístico para planejar, ponderar e medir as opções, concatenando resultados e consequências muitos passos à frente. Coisa que até então pensava-se que apenas um humano era capaz de fazer.

cylons

Ainda é um sonho distante, mas uma IA que pensa como um humano pode não ser algo tão impossível assim

Claro que há limitações e muito desse campo continua inexplorado. Continuamos tateando no escuro, sequer sabemos se uma máquina será capaz de em um dado momento adquirir consciência, porque não sabemos como ela se forma. Não compreendemos o cérebro totalmente, esse grande órgão que levou milhões de anos para evoluir mas é cheio de remendos e gambiarras, sem mencionar o fato de que ele tem a péssima mania de nos pregar peças. Ainda assim, ver um computador entender heurística é uma conquista e tanto.

Aos interessados em acompanhar as próximas partidas: elas serão realizadas na quinta, sábado, domingo e na próxima terça-feira, sempre às 00:30. Você poderá acompanhar as transmissões através do canal do DeepMind.

UPDATE 10/03: AlphaGo 2, Lee Sedol 0.

UPDATE 12/03:  a história sendo escrita: o AlphaGo ganhou a terceira batalha contra Sedol, e mesmo que ele perca as restantes já se provou superior a um humano. Claro que devemos considerar o fato que um algoritmo não se cansa, mas ainda assim ver o programa do Google DeepMind conquistar o campo da heurística é sensacional.

UPDATE 13/03: Sedol enfim conquistou sua primeira vitória. O campeão reuniu todas as suas forças e jogou de forma espetacular, acabando por confundir o AlphaGo por volta do 87º movimento, que não teve como sair da armadilha.

UPDATE FINAL 15/03: não teve conversa, o AlphaGo ganhou a última partida contra Sedol, fechando a contenda em 4 a 1 a favor do algoritmo. O campeão se disse frustrado, pois acredita que o programa do DeepMind ainda não é perfeito o bastante e poderia ser derrotado, apontando a conquista do Google mais como uma falha sua. Claro Sedol, claro…

Relacionados: , , , , , , , , , ,

Autor: Ronaldo Gogoni

Um cara normal até segunda ordem. Além do MeioBit dou meus pitacos eventuais como podcaster do #Scicast, no Portal Deviante.

Compartilhar

Aproveite nossos cupons de desconto:

Cupom de desconto Locaweb, Cupom de desconto HP, Cupom de desconto Descomplica, Cupom de desconto Nuuvem, Cupom de desconto CVC, Cupom de desconto Asus, Cupom de desconto World Tennis