Exame Informática | Pioneiros das técnicas de aprendizagem por reforço ganham prémio Turing, o ‘Nobel da computação’

Pioneiros das técnicas de aprendizagem por reforço ganham prémio Turing, o ‘Nobel da computação’

A dupla Andrew Barto e Rich Sutton propôs, na década de 1980, que as máquinas deviam aprender por experiência, tal como os humanos e os animais. Esse trabalho vale-lhes agora o Prémio Turing

Exame Informática

Andrew Barto e Rich Sutton, professores universitários, venceram o mais prestigiado galardão da área da Informática, o Prémio Turing, graças ao desenvolvimento de técnicas de aprendizagem por reforço, nas quais os algoritmos executam tarefas e aprendem com a experiência, mediante o feedback negativo ou positivo. A técnica pioneira ajuda os sistemas modernos de Inteligência Artificial, como o ChatGPT, a aprenderem e tornou-se popular em 2016 quando a DeepMind usou a aprendizagem por reforço para construir o AlpahGo, um programa capaz de jogar um complexo e subtil jogo de tabuleiro.

Desde então, este trabalho foi usado em diversos setores de atividade, desde o design de centros de dados, passando pelas finanças e pelo desenho de chips. Também na robótica trouxe sucesso, com as máquinas a aprenderem a executar tarefas através de tentativa e erro. Mais recentemente, as soluções são aplicadas ao treino de grandes modelos de linguagem (LLM) e trazem grandes resultados aos programas de chatbot, tornando-os capazes de ‘raciocinar’.

Sutton, no entanto, salienta que os métodos atuais têm humanos a orientar os LLM e a definir metas, em vez de ser o algoritmo a aprender puramente com a sua exploração: “A grande divisão é se [a IA] está a aprender com as pessoas ou se está a aprender com a sua própria experiência”, cita a Wired. No entanto, avanços mais recentes, como aqueles que foram feitos pela DeepSeek, têm por base apenas a aprendizagem por reforço.

Jeff Dean, vice-presidente da Google e que pertence à Association for Computing Machinery, responsável pelos Prémios Turing, afirma que o trabalho da dupla “foi essencial para o progresso da IA nas últimas décadas. As ferramentas que desenvolveram permanecem como pilar central do crescimento da IA e permitiram grandes avanços”.

Parte da inspiração para o trabalho de Sutton e Barto vem da biologia e da psicologia, nomeadamente de estudos que mostravam que o comportamento animal é formatado pelos estímulos. A dupla procurou aplicar as mesmas linhas orientadoras para a computação, incluindo ajudas para tornar o reforço de aprendizagem mais prático, métodos de graduação de políticas, uma forma nuclear para o algoritmo se comportar e diferenças temporais de aprendizagem que permitem a um modelo aprender continuadamente.

Palavras-chave:

Mercados

Pioneiros das técnicas de aprendizagem por reforço ganham prémio Turing, o ‘Nobel da computação’

Mercados

Palavras-chave:

CAPA DA EDIÇÃO

Exame Informática nº 356: Ascensão das máquinas

Mais na Visão

Titubeando entre o rufar dos tambores...

Mais uma cúpula!

WhatsApp na Europa não vai ter publicidade até 2026

Corpos

Comunicado dos trabalhadores da Trust in News

E se o que dizem sobre nós for mais importante do que quem somos?

A agressividade e a indiferença são estratégias de indivíduos e sociedades em crise

Amplificadores vs. próteses auditivas: porque ouvir bem não pode ser uma solução rápida

Esta é a história de como se começa a perder a democracia: eu vi, ninguém me contou

Rússia alerta que ataque à fábrica iraniana de Bushehr pode conduzir a "catástrofe comparável à de Chernobyl"

Mecanismo Europeu de Estabilidade alerta para riscos da sustentabilidade da dívida de Portugal

Pelo menos oito habitantes de Gaza morreram quando esperavam alimentos

TIN Brand Studio

Documentário celebra o legado do slogan mais famoso do mundo: “Porque eu mereço”

Renovar em vez de Substituir: Trocar a Bateria Prolonga a Vida do Telemóvel por Anos!

Fraldas grátis? É possível, e, com a Dodot, mais fácil do que se imagina

Pioneiros das técnicas de aprendizagem por reforço ganham prémio Turing, o ‘Nobel da computação’

Exame Informática Diária

Palavras-chave:

Relacionados

Teste em vídeo à imponente BMW i5 Turing

Avi Wigderson ganha prémio Turing, o 'Nobel da computação'

Reportagem da VISÃO SAÚDE vence Prémio de Jornalismo na área da Ortopedia e Traumatologia

CAPA DA EDIÇÃO

Exame Informática nº 356: Ascensão das máquinas

Mais na Visão

Titubeando entre o rufar dos tambores...

Mais uma cúpula!

WhatsApp na Europa não vai ter publicidade até 2026

Corpos

Comunicado dos trabalhadores da Trust in News

E se o que dizem sobre nós for mais importante do que quem somos?

A agressividade e a indiferença são estratégias de indivíduos e sociedades em crise

Amplificadores vs. próteses auditivas: porque ouvir bem não pode ser uma solução rápida

Esta é a história de como se começa a perder a democracia: eu vi, ninguém me contou

Rússia alerta que ataque à fábrica iraniana de Bushehr pode conduzir a "catástrofe comparável à de Chernobyl"

Mecanismo Europeu de Estabilidade alerta para riscos da sustentabilidade da dívida de Portugal

Pelo menos oito habitantes de Gaza morreram quando esperavam alimentos

Mais Notícias

Salgueiro Maia, o herói a contragosto

Festival 5L de olhos postos no futuro

Um viva aos curiosos! David Fonseca na capa da PRIMA

As crianças devem ser obrigadas a comer tudo o que não gostam? O açúcar deixa-as agitadas? 16 pontos em modo "mito ou realidade?"

Sede da PIDE, o último bastião do Estado Novo

Tudo isto é cinema

CARAS Decoração: a obra de Calatrava numa edição de arte limitada

Os 40 atores negros mais famosos de Hollywood

Antecipar o futuro: a visão da WTW sobre os riscos emergentes

A Nike está em dificuldades, mas Elliott Hill saiu da reforma para lhe restituir o domínio perdido

"Blossoms Shanghai": Série de Wong Kar-wai é um tributo à sua cidade

Vai casar? Inspire-se nestes 20 vestidos de noiva

A elegância da princesa Kate no Trooping the Colour

Do Liberation Day ao Acordo de Genebra – O que se segue?

Vídeo: A festa final de 'Miúdos a Votos'

Os mistérios da anestesia

O "look" de Kate no Dia da Ordem da Jarreteira

A VISÃO Se7e desta semana – edição 1684

BYD Dolphin Surf: o 100% elétrico com preço de gasolina

Minissérie sobre a vida de Marco Paulo estreia a 1 de janeiro na SIC

A VISÃO Se7e desta semana – edição 1685

25 peças para receber a primavera em casa

Cosentino inaugura o Cosentino City Porto e reforça a sua presença em Portugal

Ralis de regularidade: das apps gratuitas às sondas, conheça a tecnologia que pode usar para ser competitivo

E se o que dizem sobre nós for mais importante do que quem somos?

Energia: Quais são os partidos mais amigos da transição verde?

Um século de propaganda na VISÃO História

Um novo estúdio em Lisboa para jantares, showcookings, apresentações de marcas, todo decorado em português

Reis Frederico X e Mary da Dinamarca visitam as Ilhas Faroé na companhia da filha Josephine

Guerra aberta!

Em "A Promessa" Laura é raptada

Keep the coins, I want change: um mapa para a sustentabilidade empresarial em 2025

Unhas: estas cores vão fazer sobressair o seu bronzeado

Técnico e Vinci Energies Portugal apresentam novo Formula Student para 2025/2026

Figuras públicas desfilam looks festivaleiros no primeiro dia de NOS Alive

Caras conhecidas reúnem-se para apresentação de coleção inspirada nos festivais de verão

CARAS Decoração: 10 ideias para transformar o velho em novo

Matilde Breyner fotografada pelo marido, Tiago Felizardo, mostra as peças da coleção da Latitid

Caras conhecidas reúnem-se para apresentação de coleção inspirada nos festivais de verão

Parabéns, bicharada!

Chiara Ferragni surpreende com "look" em casamento

Porto, Matosinhos e Vila Nova de Gaia recebm a 9ª edição do Festival DDD - Dias da Dança

Portugal 2050: desafios e oportunidades na transição verde

Dores musculares: fisioterapia ou osteopatia?

Repórter Júnior: Entrevista a Luísa Ducla Soares

TIN Brand Studio

Documentário celebra o legado do slogan mais famoso do mundo: “Porque eu mereço”

Renovar em vez de Substituir: Trocar a Bateria Prolonga a Vida do Telemóvel por Anos!

Fraldas grátis? É possível, e, com a Dodot, mais fácil do que se imagina