A Google tem um novo modelo de Inteligência Artificial: chama-se PaLM 2 (acrónimo de Pathways Language Model ou modelo linguístico baseado em caminhos) e segundo a empresa é o seu mais poderoso modelo de IA até à data. O PaLM 2 já está inclusive a ser usado no Bard, o sistema de conversação por linguagem natural que a Google lançou para rivalizar com o ChatGPT.
Apesar de ser um grande modelo linguístico (LLM na sigla em inglês) como o GPT-4 da OpenAI, ou seja, é capaz de analisar e gerar texto com uma qualidade próxima à dos humanos, o PaLM 2 usa uma nova arquitetura para funcionar, os chamados “caminhos” (pathways no original em inglês). Esta arquitetura permite que um único modelo de IA possa ser treinado em “milhões” de temas diferentes, segundo a Google, tem capacidades multimodais, no sentido em que percebe texto, imagens e sons em vários idiomas, e tem um grande foco na eficiência, usando apenas os componentes necessários para concretizar uma tarefa específica, em vez de usar todo o modelo para concretizar essa tarefa. De certa forma, é um modelo que aprende de forma mais semelhante ao cérebro humano.
É por isso que a Google diz que uma das novidades do PaLM 2 são “as capacidades avançadas de raciocínio”. Num exemplo mostrado pela tecnológica num evento antecipado de apresentação à imprensa, no qual a Exame Informática participou, o sistema foi capaz de resolver um quebra-cabeças sobre a ordem correta de quatro carros. Ao modelo só foi dada informação indireta sobre a posição dos carros (o verde está duas posições ao lado do amarelo, por exemplo) e nunca informação direta.
Mas o PaLM 2 traz mais novidades relativamente ao antecessor (o PaLM) e também sobre o LaMDA, o modelo de IA que tem estado na base de muitas funcionalidades da Google relacionadas com geração de texto e automatização de tarefas. O novo sistema é capaz de programar, gerando código em 20 linguagens de programação diferentes. Além disso, suporta mais de 100 idiomas, permitindo ao modelo interpretar informações de diferentes fontes, de diferentes línguas, para responder no idioma no qual o pedido de informação foi apresentado.
“Estes modelos não são 100% perfeitos, mas aceleram a forma como os humanos interagem com os sistemas. Não estamos a substituir as pessoas, estamos a dar-lhes uma forma de trabalharem mais rápido”, sublinhou Slav Petrov, um dos principais cientistas da recém criada Google Deepmind.
E graças à arquitetura de ‘caminhos’, a Google diz que apesar de este ser um modelo de Inteligência Artificial abrangente, também é compatível com afinações específicas (domain specific fine tuning, no original em inglês). Ou seja, se o modelo for treinado em dados de áreas específicas, mostra capacidades superiores nesses domínios. A Google está já a trabalhar em duas categorias distintas, o Med-PaLM 2 e o Sec-PaLM 2, que, respetivamente, estão orientados para a área da medicina e da segurança informática.
A Google diz que vai integrar o PaLM 2 em mais de 25 serviços da empresa, incluindo o Bard, o chatbot da tecnológica.
“Vamos disponibilizar estes modelos de forma abrangente, queremos ver o que as pessoas vão fazer com eles e acreditamos que há muitas oportunidades para explorar”, concluiu Slav Petrov.