A xAI está a trabalhar para dar mais inteligência ao chatbot Grok, para que seja capaz de receber comandos multimodais. O objetivo é que o utilizador possa carregar fotografias e imagens e receber respostas escritas. A informação desta intenção surge em documentos públicos destinados a programadores.
No mês passado a empresa de Elon Musk já tinha feito referência a esta possibilidade, prometendo “modelos multimodais em vários domínios” na versão 1.5 do Grok. O The Verge avança que há scripts relativamente simples em Python que demonstram como os programadores podem usar a biblioteca de desenvolvimento para gerar respostas baseadas em texto e em imagens.
O chatbot Grok foi lançado em novembro de 2023 e está disponível para os subcritores Premium Plus da rede social X. A mais recente versão chegou em março e traz algumas funcionalidades melhoradas, com o modelo de IA que o ‘alimenta’ a ser treinado com base em dados textuais vindos de fontes online publicamente disponíveis até ao terceiro trimestre de 2023, indica a rede social numa publicação do seu blog oficial. De acordo com a empresa, os dados foram analisados e revistos por colaboradores humanos.
Mesmo com este lançamento, a xAI continua relativamente atrás de rivais como a OpenAI no que toca ao desenvolvimento de soluções baseadas em IA.