IBM não quer que o Watson vire o Bender

bender

A IBM é uma empresa interessante. Ela vive muito menos no mundo pop de Apple e Samsung do que no mundo corporativo de uma SAP ou Oracle, mas consegue ser conhecida fora do nicho. Mais ainda/ IBM É sinônimo de computação.

Um campo muito forte da empresa é a pesquisa, e de vez em quando se saem com projetos impressionantes, como o Deep Blue, computador que venceu o melhor enxadrista do mundo, e mais recentemente o Watson, máquina que ganhou o Jeopardy!, um programa de TV de trívia que é quase uma religião nos EUA.

Claro, a IBM não queria vencer por vencer, o objetivo era demonstrar a capacidade de reconhecimento de linguagem natural e interpretação de texto do Watson, que foi alimentado com toneladas de informações vidas de enciclopédias, sites e livros.

Aqui começa o problema: Em uma entrevista para a Fortune Eric Brown, chefe do projeto do Watson explicou que uma grande dificuldade foi fazer o computador entender o conceito de gírias, siglas e termos com sentidos mais obscuros.

A solução? Alimentar o Watson com o conteúdo do Urban Dictionary, site excelente para se descobrir o significado de gírias, mas com uma tendência a ser uma coleção de termos sexuais exóticos, como Cleveland Steamer, Lemon Party, Glass Bottom Boat e Shaving The Zebra (não clique).

Watson realmente ficou mais esperto, mas acabou desbocado, pois computadores não têm semancol, não distinguem entre linguagem aceitável e baixo calão. Em um dos testes ele chegou a incorporar a Siri num dia ruim e respondeu “bullshit” a um dos pesquisadores da IBM.

Aí não teve jeito. Watson sobreu uma lobotomia. O Urban Dictionary foi removido de sua base de aprendizado e filtros foram criados para evitar que ele baixaria vinda de outras fontes. Sim, a Wikipedia também tem sua cota de bocasujice.

Ainda bem, aliás, que fizeram isso. Watson está sendo treinado para funcionar como um especialista em diagnóstico diferencial, e se fosse continuar impaciente, desbocado, obcecado com sacanagem e irritantemente correto em suas respostas, teria que mudar de nome para Gregory.

Autor: Carlos Cardoso

Entusiasta de tecnologia, tiete de Sagan e Clarke, micreiro, hobbysta de eletrônica pré-pic, analista de sistemas e contínuo high-tech. Cardoso escreve sobre informática desde antes da Internet, tendo publicado mais de 10 livros cobrindo de PDAs e Flash até Linux. Divide seu tempo entre escrever para o MeioBIt e promover seus últimos best-sellers O Buraco da Beatriz e Calcinhas no Espaço.

Compartilhar
  • Guest

    Ia ser lindo ouvir o Watson soltando um “You can bit my shiny metal ass”

  • Disgramado você com esse “não cliquem”, ele merecia um artigo próprio.

  • francisco gamarra

    Para mim foi um erro cometido pela IBM. O correto (na minha opinião) seria classificar os termos de baixo escalão e “ensinar” o programa que não se deve utiliza-los. Com isso, a base de conhecimento da máquina aumentaria circunstancialmente e a faria compreender muito melhor a linguagem humana.

    • não imagino o quão dificil, ou não, seria criar essa “inteligencia”…

      talvez tenha sido uma decisão técnica, e não religiosa =P

    • Concordo, afinal a ideia deve ser fazer com que ele “pense” como um humano. E essa analise “do que falar” “e quando falar”, faz parte do nosso dia á dia. E ai chegaríamos mais perto do software que iria dar vida a skynet.

    • Calma…. baby steps.

    • Luiz Felipe

      Ou então diminuir o nivel de hipocrisia, afinal são só palavras ditas por uma maquina sem sentimentos.

  • Edmilson_Junior

    Cardoso e seu conhecimento por termos obscuros.

  • Caramba, esta da zebra me deixou estupefato.

  • Ufa, por enquanto os robôs nao vão saber o tanto que somos idiotas.

  • Luiz Felipe

    O urban dictionary foi lobotomizado. E nesse dia um supercomputador ficou mais hipocrita que os humanos, pois os humanos ao menos tem os palavrões no cerebro, mas só usam na hora certa, se é que existe isso.