Microsoft libera para a comunidade de IA banco de dados com 100 mil perguntas

cw1o2x7usaaz2rh

Existe toda uma discussão filosófica sobre livre-arbítrio, quanto de nosso comportamento é determinado por nossos genes, nossas convenções sociais e nós mesmos, se é que isso existe. Entre pesquisadores de Inteligência Artificial há discussão semelhante. Uma IA que trabalhe por árvore de decisões é realmente inteligente? E uma híbrida como os replicantes de Westworld, que usam árvores de decisão mas são capazes de improvisar?

Treinar uma IA, mesmo os modelos “cérebro de comentarista de portal” que temos hoje exige esse tipo de escolha. A maioria prefere trabalhar com árvores de decisão criadas através de análises de bases de conversações, é uma forma via deep learning de produzir uma IA mais flexível.

Para isso é preciso… massa de dados. Existem vários repositórios de perguntas e respostas disponíveis, mas de longe o maior deles é o MARCO — Microsoft Machine Reading Comprehension, da Microsoft (d’oh). São cem mil perguntas e respostas, todas elas feitas e respondidas por humanos. A origem das perguntas são serviços como Cortana e Bing.

As perguntas são das mais variadas, de definições de palavras a coisas como “cabelo humano repele esquilos?” e são organizadas de forma estruturada, separadas por tipo gramatical (quem, o quê, onde) e outros conceitos semânticos. Neste paper (cuidado, PDF) aqui o pessoal da Microsoft Research detalha a base de dados, os formatos e a utilização. É bem legal e entendi várias das palavras que usaram.

Para baixar o Dataset (100 MB, comprimido) é só visitar o site oficial.

Fonte: Venture Beat.

Relacionados: , , , , , , , , ,

Autor: Carlos Cardoso

Entusiasta de tecnologia, tiete de Sagan e Clarke, micreiro, hobbysta de eletrônica pré-pic, analista de sistemas e contínuo high-tech. Cardoso escreve sobre informática desde antes da Internet, tendo publicado mais de 10 livros cobrindo de PDAs e Flash até Linux. Divide seu tempo entre escrever para o MeioBIt e promover seus últimos best-sellers O Buraco da Beatriz, Calcinhas no Espaço e Do Tempo Em Que A Pipa do Vovô Subia.

Compartilhar
  • Marcos Paulo Betinardi

    Inevitável,10-20 anos… Como a fusão, nanomaquinas, computação quântica, etc.

    • Jose X.

      com certeza existe muito hype em torno da IA, e no início existia muita ilusão (estou falando do final dos anos 50, Allen Newell, Herbert Simon, etc)

      mas…

      1) saltos disruptivos às vezes acontecem…clonagem, planetas extra-solares, rede mundial de comunicação e computação, tradução automática (mesmo que meia boca), entendimento de fala (siri, google now, etc)…tudo isso aconteceu num espaço de tempo relativamente curto, e, mais surpreendente ainda, aconteceu de modo simultâneo (ou talvez nem tão surpreendente, talvez a ideia de singularidade do Vinge seja ao menos parcialmente algo real)

      2) certas técnicas de IA não são realmente revolucionárias, são simplesmente a aplicação de computação maciça em grande quantidade de dados…então coisas como por exemplo, estatística, algoritmos genéticas, redes neurais, etc, acabam produzindo resultados úteis, e dando a ilusão da existência de IA

      resumindo, apesar de todo o hype e marketing que se faz, acho que muitas coisas interessantes (em matéria de tecnologia) vão acontecer em nossas vidas ainda

      • Marcos Paulo Betinardi

        Todas as grandes empresas estão investindo pesado. Se a natureza cinseguiu usando a lenta seleção natural, elementos naturais e nanotecnologia (RNA), em algum momento também vamos conseguir. Não é só hype, acompanhe em futurism . Com artigos desse mês mostrando como estao andando as coisas.

      • Luiz

        Na verdade o que faltava é poder computacional, quero dizer, ainda falta, tudo isto que tu descreveu e apenas chegamos em 0.1% do potencial computacional do cerebro humano, give it a break, o que são mais 10 anos numa escala exponencial?
        Parece que nada ocorreu em 20 anos, e então, nos ultimos 10 anos tudo o que funciona em AI ocorreu, nos proximos 5 anos vai ser muito mais ainda, é a classica curva exponencial, quando tu notar, já vai ser tarde demais.

        • poeiradasestrelass

          Eu acho que a evolução tecnológica não pode ser sempre exponencial. Existem limitações.

    • Luiz

      Voce não conhece o inverno da AI, conhece? já fazem 40 anos, agora que esta começando a dar certo.
      Ah, a fusão tambem, ao menos já atingiram o ponto onde se gasta o mesmo que produz em calor, porem não conseguimos manter a reação ainda por muito tempo, só se passou 50 anos.

      • Marcos Paulo Betinardi

        Vá ao site futurism . com ,,, lá tem artigos desse mes mostrando como estão andando as coisas… abçs

  • Theuer

    “colaborativo”, mal posso ver seus movimentos!

    • Jaedson

      Já imagino as putarias que a Cortana vai falar.

  • Haja maquina para aprender um dataset de 100mb comprimidos em casa. Mas obrigado!

  • “Existe toda uma discussão filosófica sobre livre-arbítrio, quanto de nosso comportamento é determinado por nossos genes, nossas convenções sociais e nós mesmos, se é que isso existe”

    Não. Não estamos falando de vocês, senhores SJWs.

  • Marcos Paulo Betinardi

    Grosseiramente. As ações humanas são combinações, praticamente aleatórias, de memória, processos cognitivos, percepção, genética, meio, etc. Nesse processo até a incerteza quântica está envolvida nos átomos e moléculas neuronais. A “eletricidade” “flui” de forma imprevisível também… Portanto, ao que tudo indica, (feita todas ressalvas possíveis), (Também é a posição de praticamente todos tops que investigam isso), NÃO TEMOS LIVRE ARBÍTRIO, temos apenas uma ilusão de controle. Apesar dessa lógica teórica, é ainda um assunto em aberto.

    • gbitte

      Tá confundindo liberdade com autonomia. O fato de você funciona com as mesma regras do mundo não que dizer que o mundo manda em você mas que você faz parte do mundo, ou seja não é autônomo a ele.

      • Marcos Paulo Betinardi

        Desculpe, não entendi.

        • gbitte

          Sim existe restrições no pensamento humano mas se você for analisar todas as restrições que você citou são na realidade oque permite você a pensar. Ter limitações naturais a sua existência não lhe faz menos livre lhe faz menos capaz. Para mim essa falta de liberdade que citou é a mesma coisa da galinha solta reclamar que não tem liberdade para voar, ela tem liberdade para voar ela não tem é capacidade.

          • Marcos Paulo Betinardi

            O que estou dizendo é que não temos controle algum, qualquer ação nossa é produto de incontáveis variáveis, e levamos o ônus e o bônus disso. Mas temos a ilusão que escolhemos conscientemente algo;

    • Luiz

      “Any sufficiently advanced network acting on information, when honed by evolutionary forces, is indistinguishable from intelligence.” Nicholas Perry

  • Banco de dados da Microsoft com 100mil perguntas e respostas feitas no Bing e Cortana?

    Se pegar as feitas no Google e no “Yahoo Respostas” pra fazer a A.I. entender sarcasmo estamos fodidos… =X

  • Essa cena da imagem foi muito foda!

Aproveite nossos cupons de desconto:

Cupom de desconto Locaweb, Cupom de desconto HP, Cupom de desconto Descomplica, Cupom de desconto Nuuvem, Cupom de desconto CVC, Cupom de desconto Asus, Cupom de desconto World Tennis