Talvez não seja óbvio, mas ser capaz de prever a próxima palavra, pode ir muito além de identificar correlações estatísticas superficiais: imaginem um romance policial em que após centenas de páginas com detalhes intrincados sobre todas as personagens, o detetive diz “o culpado é …”.
O ChatGPT, criado pela OpenAI, é baseado numa grande rede neuronal artificial treinada exatamente para a tarefa de prever a próxima palavra de um texto. Mas para um volume de dados muito superior ao que um humano conseguiria ler durante uma vida! Imaginem: todos os artigos da Wikipédia em todas as línguas, milhares de livros, milhões de páginas web e programas de computador nas mais variadas linguagens de programação. Esta fase de treino força o modelo a comprimir muitíssima informação num número limitado de neurónios artificiais, dando origem a representações numéricas muito boas do significado de palavras e frases. Ao ponto de aprender relações de proximidade visual entre as diferentes cores (ex: framboesa é mais parecido com vermelho do que com verde), sem nunca ver imagens! Aprende até a prever o próximo movimento num jogo de xadrez, pois na internet há muitas listagens de jogos completos. O ChatGPT é depois refinado num regime de aprendizagem por reforço, para dialogar com humanos e dar respostas que sejam consideradas úteis respeitando certas normas sociais.
Até muito recentemente, os sistemas de Inteligência Artificial (IA), eram criticados por serem pouco genéricos. Só funcionavam para a tarefa específica para a qual tinham sido desenvolvidos, por exemplo: jogar xadrez, ou detectar caras em fotografias. O ChatGPT, e outros sistemas semelhantes como o Bard, Pi, Claude ou Perplexity, são talvez os primeiros exemplos de sistemas de IA muito gerais, capazes de falar sobre uma variedade enorme de assuntos: desde história, filosofia, medicina, matemática, programação, etc e fazê-lo de modo adaptativo em função de perguntas das pessoas, por vezes formuladas de modo vago e ambíguo. Por essa razão, estes sistemas podem já ser considerados um protótipo inicial do que se chama “Artificial General Intelligence” (AGI). Com o rapidíssimo progresso a que temos assistido, que mesmo os investigadores de IA têm dificuldade de acompanhar, é de esperar que as próximas versões sejam ainda mais impressionantes. Na verdade as versões mais recentes são já treinadas em regime multimodal, que inclui não só textos, mas também imagens, vídeos e sons. Há também integrações com outras aplicações e podem aceder a informação atualizada da internet. O que virá a seguir?
Será que a ficção científica se está a tornar realidade? Ou estamos numa fase de ‘hype’, com uma mistura de entusiasmo e medo exagerados?
A minha opinião é que após 70 a 80 anos de investigação, as promessas da Inteligência Artificial se estão realmente a materializar. Estamos a chegar a uma fase, em que as capacidades humanas de percepção, linguística e raciocínio lógico, estão a ser replicadas por computadores. Estes já começam mesmo a ir para além do que qualquer humano consegue, por exemplo, comunicar em dezenas de línguas diferentes. De certo modo, o mais surpreendente foi que nenhuma ideia muito nova foi necessária, pois os algoritmos fundamentais para treinar redes neuronais artificiais e os algoritmos de aprendizagem por reforço, já foram desenvolvidos há 30 ou 40 anos. Não foi preciso nenhum “Einstein” inventar algo radicalmente diferente e brilhante, nem nenhuma mudança de paradigma. Houve uma série de melhorias incrementais no tipo de arquitecturas de redes neuronais e nos algoritmos de otimização usados, mas sobretudo, foi tudo uma questão de escala! Muito mais dados, muito mais poder de computação, modelos muito maiores, bibliotecas de software especializadas melhores e mais fáceis de usar, maior comunidade científica e de engenharia partilhando código aberto: e iterar, iterar, iterar… Num processo de tentativa-erro à escala global, para desenhar sistemas inteligentes ligeiramente melhores, passo a passo, como no processo de evolução e seleção natural.
A nossa missão passa agora por assegurar que a Humanidade usa estes sistemas inteligentes para ajudar a resolver problemas globais realmente complexos: energia limpa, alterações climáticas, combate a doenças, erradicação da pobreza. Será que vamos ser capazes? “Com a ajuda de todos, talvez sim” — completa o ChatGPT.