ChatGPT melhor no diagnóstico de problemas oculares do que alguns médicos

Stanislav Kogiku/SOPA Images/LightRocket

O quarto modelo da série GPT obteve melhores resultados na avaliação de problemas oftalmológicos e no aconselhamento de tratamento do que os médicos não especialistas, mas foi derrotado pelos mais experientes

Uma nova investigação, conduzida por investigadores da Universidade de Cambridge, na Inglaterra, revelou que o GPT-4, modelo de linguagem de grande dimensão (LLM) desenvolvido pela OpenAI, e o quarto da série GPT, mostrou um desempenho quase tão bom como o de oftalmologistas num teste escrito de escolha múltipla.

As perguntas realizadas aos voluntários e a esse modelo foram retiradas de um manual de teste a oftalmologistas em formação e incluíam temas relacionados com problemas oculares, como por exemplo falha de visão ou sensibilidade à luz.

A competir com o modelo de Inteligência Artificial (IA) estavam médicos de diferentes idades e experiências, desde estudantes ainda em formação até aos mais experientes, e a todos foi pedido que realizassem o diagnóstico ou informassem acerca do tratamento mais adequado tendo em conta o problema ocular do doente, podendo escolher uma de quatro opções. A cada um dos voluntários foram apresentadas dezenas de cenários diferentes.

Os resultados mostraram que o GPT-4 obteve resultados bastante superiores aos dos médicos ainda em formação e pontuações semelhantes às dos oftalmologistas estagiários, mas foi derrotado pelos especialistas com melhor desempenho.

Estudo também testou outros modelos de IA

Os investigadores também testaram o GPT-3.5, uma versão anterior do modelo da OpenAI, o PaLM2 da Google e o LLaMA da Meta, realizando o mesmo teste, tendo concluído que o GPT-4 deu respostas mais exatas do que qualquer um dos outros modelos.

O manual em que as perguntas foram baseadas não está aberto ao público, por isso a equipa acredita ser improvável que o modelo tenha sido treinado com base no seu conteúdo.

Apesar dos resultados do estudo, os investigadores dizem que são necessários “ensaios para garantir que o modelo é seguro e eficaz” e que, “se for, pode ser revolucionário na forma como os cuidados são prestados”. Contudo, defendem que estes modelos, que geram textos com base numa grande quantidade de dados, não vão substituir os médicos.

Podem, pelo contrário, ser úteis no sentido de ajudarem os médicos a cuidarem dos doentes de forma mais rápida. “Se dispuséssemos de modelos que pudessem prestar cuidados de qualidade semelhante aos prestados por seres humanos, poderíamos ultrapassar os problemas das listas de espera” dos sistemas de saúde, diz Arun Thirunavukarasu, principal autor do estudo, citado pela Sky News.

Palavras-chave:

ChatGPT Estudo

Mais na Visão

Sociedade

Ministro da Defesa diz que viveu "24 horas de realidade paralela" devido a "falsidade" sobre o recrutamento de jovens delinquentes

Política

Mais Notícias

Grafologia: o que a sua letra diz sobre si

TIN Brand Studio

CTT promove debate no feminino e reitera compromisso com diversidade e equidade

Parceria TIN/Público

A Trust in News e o Público estabeleceram uma parceria para partilha de conteúdos informativos nos respetivos sites

Actividade física provoca inúmeras alterações celulares e moleculares que ajudam na saúde

Sociedade

ChatGPT melhor no diagnóstico de problemas oculares do que alguns médicos

Sociedade