Meio Bit » Indústria » Microsoft planeja integrar IA GPT-3 ao Bing!

Microsoft planeja integrar IA GPT-3 ao Bing!

GPT-3, o modelo de Inteligência Artificial capaz de resumir, criar e entender textos será integrado no Bing!

1 ano atrás

GPT-3 é a ferramenta mais famosa da OpenAI, empresa que também criou o DALL-E, aquele sistema de Inteligência Artificial que o povo usou para gerar imagens, por um tempo. Ele está disponível na aplicação ChatGPT, e já impressiona.

"OpenAI, microsoft bing, cortana, AI" (Crédito: ou culpa: Stable Diffusion)

Quem é a OpenAI, criadora do GPT-3?

No longínquo ano de 2015, Elon Musk ainda nem havia conseguido pousar um foguete (só teria sucesso em 21/12 do mesmo ano), e dedicava seu tempo livre para pensar bobagem, acreditando fielmente que a Inteligência Artificial dominaria o mundo e destruiria a Humanidade.

Com legítimo medo disso, ele percebeu que a melhor forma de combater a IA, seria criar a IA do Bem, com controle sobre a Inteligência Artificial, Elon Musk, que nunca viu um filme de ficção na vida, evitaria o Apocalipse Robótico.

Achando um grupo de engenheiros e cientistas com as mesmas idéias, Musk e outros investidores colocaram US$1 bilhão para fundar a OpenAI, uma empresa sem fins lucrativos que focaria em desenvolver sistemas de Inteligência Artificial, liberando patentes e colaborando com instituições de pesquisa.

Em 2018 Musk abdicou de sua posição no board da empresa, para evitar conflito de interesse com a TeslaAI, que fazia suas próprias pesquisas. Um ano depois, vendo que seus sistemas tinham muitas po$$ibildade$, a OpenAI alterou o status da empresa para uma sociedade de lucros limitados, onde poderia gerar em lucros até 100x o capital investido.

Isso permitiu que outras empresas investissem, e em 2019 a Microsoft entrou como nada menos de US$1 bilhão, a maioria em créditos Azure, para investir na OpenAI.

Atualmente a OpenAI, com 120 funcionários, tem receita anual de US$80 milhões. Suas despesas operacionais são estimadas entre US$450 e US$1 bilhão por ano. A projeção é que em 2023 eles faturem US$200 milhões.

Colocando no papel é uma roubada fenomenal, certo? Bem, a OpenAI está se preparando para abrir uma rodada de investimentos e a avaliação do valor de mercado da empresa está em US$29 bilhões. A expectativa é que a Microsoft corra para comprar a OpenAI antes que outro o faça.

Qual o motivo desse hype?

A resposta é simples: Sistemas como o GPT-3 são revolucionários, e são apenas o começo.

Se você pensar bem, o Google é um negócio arcaico. Todo mundo já respondeu meio na patada mandando alguém “procurar no Google”, mas ao menos que seja uma questão muito simples, o resultado será uma lista de páginas. Você tem que então pesquisar manualmente, determinar a credibilidade da fonte, e principalmente identificar se a página sequer tem o conteúdo que você quer.

Imagine se cada vez que Spock fizesse uma consulta ao computador, em Jornada nas Estrelas, recebesse uma lista de documentos. Ou se uma conversa com o Tenente-Comandante Data tivesse que passar por uma série de menus, como um callcentre automatizado.

Spock é usuário como a gente!

O conceito de “futuro” que todo mundo espera envolve linguagem natural e acima de tudo, CONTEXTO. O GPT-3 tem capacidade de saber quem você é, lembrar informações e usá-las durante suas conversas. Assim você pode pedir uma lista de sugestões de temas de artigos, esperar ele listar, e pedir “liste mais 5, por favor”.  Ele saberá do que você está falando.

Um exemplo rápido via GPT-3: Todo mundo conhece sites de receitas, inclusive alguns onde você lista os ingredientes que tem disponíveis, mas isso é chato, demorado e cada um tem uma interface. Se você pesquisar no Google com “eu tenho batata, farinha, frango, cebola, queijo ralado e alho, o que dá para fazer pro jantar?” receberá uma lista de páginas e vídeos, a maioria com mais ingredientes do que os listados.

Já se usar o GPT-3, ele contorna isso tudo e responde com uma receita.

O Tamanho do GPT-3

O GPT-3 foi treinado com bilhões de documentos obtidos da Internet, resultando em uma rede neural com 175 bilhões de parâmetros, ocupando 800GB de armazenamento. Por pura magia negra estatística, ela consegue deduzir a seqüência provável de palavras associadas com o texto que você usou de entrada.

Essa aplicação de pura matemática dá a ilusão de inteligência e compreensão. Ou talvez nossos cérebros sejam pura aplicação de matemática e o próprio conceito de consciência surja da complexidade de uma rede neural.

Ele consome muita GPU e RAM, e treinamento de novas versões chega na casa de milhões de dólares, fora os custos fixos. Custos esses que a Microsoft absorveria alegremente, se comprasse a OpenAI.

Bing com GPT-3?

Segundo reportado no Search Engine Journal, a Microsoft pretende lançar em março a integração do Bing com o ChatGPT da OpenAI, o que pode ser o momento mais disruptivo na história dos serviços de busca, e talvez da Internet.

O GPT-3 tem capacidade de aprendizado, pode ser constantemente atualizado com novas informações, e consegue fazer buscas na Internet, sumarizando e processando o conteúdo. Essa funcionalidade está desativada no ChatGPT. No Bing, obviamente não estará.

As respostas do GPT-3 são muito superiores às do Google, se o Bing 2.0 cair no gosto popular, será um caminho sem volta. Lembrando que você tem muito mais que uma interface de buscas, você tem uma IA capaz de criar conteúdo.

A Microsoft licenciou o GPT-3 com exclusividade. Mesmo sendo, nas palavras de Sam Altman, um dos fundadores da OpenAI “Extremamente limitado”, o ChatGPT já é disruptivo. Integrado a um site de buscas, com uma interface textual, temos uma killer app.

Agora os rumores: O GPT-4, que será lançado no 2º trimestre de 2023, é “10x melhor” que o GPT-3, passando nos testes de Turing e alcançando o nível de AGI – Inteligência Artificial Geral, uma forma de inteligência artificial que é capaz de realizar qualquer tarefa intelectual que um ser humano é capaz de realizar. Isso inclui coisas como entender o mundo, resolver problemas, tomar decisões e aprender coisas novas. A AGI difere da inteligência artificial especializada, projetada para realizar uma tarefa específica, como reconhecimento de voz ou jogo de xadrez. A AGI é uma forma de inteligência artificial que é capaz de realizar qualquer tarefa intelectual que um ser humano é capaz de realizar.

E se o GPT-3 já é bom o bastante pra escrever a parte italizada do parágrafo anterior  pra mim...

A melhor interface para o GPT-3

A Microsoft tem a melhor interface para o GPT-3, mas ironicamente, fez questão de matá-la: Sim, a boa e velha Cortana, que funcionava mais ou menos no Windows Phone, e nunca funcionou no PC, por cometer o maior pecado de uma Inteligência Artificiar: Ser burra. Cortana era isolada do computador, não tinha acesso a processos, não conseguia manipular dados ou programas, exceto em situações específicas como criar eventos no calendário.

Uma busca com a Cortana retornava... uma página do Bing. É como se você falasse pra Caprica 6 que estava com vontade de coelhar, e ela respondesse te dando um tablet aberto no XVideos.

Cortana, segundo a visão do Stable Diffusion (Crédito: Stable Diffusion)

Se a Microsoft tiver o insight de ressuscitar a Cortana, atrelando seu visual futurista ao GPT-3, integrando-a a cada dispositivo e usuário, com contexto persistente, teremos algo revolucionário, muito mais disruptivo do que a invenção da interface gráfica.

Claro, as conseqüências podem não ser agradáveis para quem produz conteúdo. Os sites de busca vivem enfrentando brigas com serviços de notícias, pois ao agregar as informações, mesmo linkando, a maioria dos usuários não passa do título, que muitas vezes traz tudo que precisam, como resultados de partidas esportivas.

No momento em que o GPT-3 não só é capaz de entender, mas de resumir um texto, a necessidade de linkar pro original desaparece. E não, isso não é uma preocupação só de blogueiros.

Esta aplicação aqui, YTSummary, recebe um link do YouTube, acessa o vídeo, pega a transcrição (automática ou manual) do áudio, e a roda no Davinci-003, o antecessor do GPT-3.

Ele então faz um resumo do que foi falado no texto, listando pessoas, objetos e lugares mencionados. Eu rodei um teste com um vídeo escolhido aleatoriamente no Youtube:

Uma entrevista de 15 minutos. Quando rodei o YTSummary, após criar uma conta na OpenAI pra pegar a chave da API e alterar um pouco o código pra ele puxar a transcrição em português, em segundos veio o resultado:

Resumo totalmente automático feito via IA. (Crédito: Carlos Cardoso)

Agora imagine isso multiplicado milhões de vezes, com a capacidade do GPT-3 em entender IMAGENS e SONS. Será possível fazer buscas no Bing descrevendo a cena do filme ou o local da reportagem.

Estamos muito perto do ponto em que a IA se tornará parte de nossa vida diária, e será irrelevante se é IA “de verdade” ou não, o importante é que ela funcione e facilite nossas vidas.

De resto, que ela tenha a última palavra, apesar dessa resposta do ChatGPT soar extremamente chapa-branca:

Você acha que é uma boa idéia utilizar uma IA como você, como interface para um sistema de buscas como o Microsoft Bing?

Eu acho que uma interface de busca baseada em IA pode ser uma ótima opção para muitos usuários. Ela pode ajudar a tornar a busca mais intuitiva e pode fornecer respostas mais precisas e detalhadas, pois pode entender o contexto da pergunta e fornecer informações relevantes. Além disso, uma interface de busca baseada em IA pode aprender com o tempo e melhorar a qualidade de suas respostas, tornando a experiência de busca ainda mais útil para os usuários. No entanto, é importante levar em consideração as questões éticas e de privacidade envolvidas em qualquer uso de IA, e garantir que os usuários estejam cientes e confortáveis com o uso da tecnologia.

Fontes:

Leia mais sobre: , , , , .

relacionados


Comentários