As máquinas com inteligência artificial têm de ser ensinadas a ler e, para isso, os cientistas precisam de bases de dados cuidadosamente preparadas para o efeito. A dificuldade atual é que não existe este tipo de base de dados em quantidade suficiente para ensinar as máquinas. Karl Moritz Hermann, da Google DeepMind, explica que a alternativa pode passar por “alimentar” estes computadores com notícias escritas pelo Daily Mail e pela CNN.
Os dois maiores desafios relacionados com a deep learning por parte das máquinas estão relacionados com a estrutura das redes e com as bases de conhecimentos. Do lado das estruturas, investigadores criaram novas técnicas para desenvolver redes com várias camadas que podem ser preparadas para estarem logo “prontas a aprender”.
Do lado das bases de dados, é necessário que sejam bastante ricas em conteúdos e muito pormenorizadas. Por exemplo, para o reconhecimento facial, é necessário que as fotos dos diferentes rostos sejam captadas de diferentes ângulos, com diferentes anotações, para que a máquina possa perceber que a cara é a mesma, apesar dos vários pontos de vista. Em termos de conteúdos escritos, o trabalho torna-se mais difícil e não existem bases de dados com volumes suficientes para que a máquina possa aprender a ler e interpretar, explica o Technology Review. A maior dificuldade é fazer com que a máquina perceba o sentido do texto, através das notas, mas que essas notas não estejam repetidas no próprio texto.
A forma como os sites como o Daily Mail ou a CNN online escrevem e publicam os seus conteúdos, com os principais tópicos a serem apresentados de forma independente no topo da história, faz com que estas páginas sejam bons repositórios para ensinar as máquinas.
Com estes ensinamentos, vai ser possível ajudar as máquinas a aprenderem a ler, a interpretarem o conteúdo e a responderem a questões sobre a matéria que leram.