A OpenAI anunciou o Operator, um agente com Inteligência Artificial e que é capaz de “ir à web realizar tarefas por si”, explica a empresa. Este agente só está disponível, para já, nos EUA e para utilizadores do ChatGPT Pro, uma modalidade que custa 200 dólares por mês.
“O Operator consegue ‘ver’ (através de capturas de ecrã) e ‘interagir’ (usando ações do rato e do teclado) com um navegador, permitindo-lhe realizar ações na web, sem necessitar de integrações personalizadas de API”, detalha a OpenAI. O agente é um modelo que combina a capacidade de visão do GPT-4o com um modelo de reforço de aprendizagem e é capaz de interagir com outras interfaces gráficas, noticia o The Verge.
O agente é ainda capaz de se autocorrigir e, se ficar ‘preso’, devolve o controlo ao utilizador, o mesmo acontecendo se a página web estiver a pedir dados sensíveis, como credenciais. Depois, pede ainda autorização para ações como enviar um e-mail e está configurado para “recusar pedidos nocivos e bloquear conteúdo não autorizado”.
Nesta fase, a OpenAI está a colaborar com empresas como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack ou Uber para o Operator poder ajudar em tarefas e cenários pedidos, ao mesmo tempo que cumpre as normas.
A OpenAI pretende disponibilizar mais tarde o Operator aos utilizadores de outras modalidades do ChatGPT e chegar a outros países, eventualmente integrando-o no ChatGPT.