Não só os computadores são hoje capazes de traduzir com maior qualidade e eficiência do que alguma vez o fizeram, como também se atingiu um patamar histórico impressionante, em que os sistemas de tradução automática são capazes de interagir com os seres humanos e com outras tecnologias, aprendendo (melhorando o seu desempenho) com esta interação. Este desenvolvimento veio democratizar o acesso a produtos e a serviços, na medida em que qualquer pessoa pode ter acesso à informação de que precisa e comunicar com outras pessoas em qualquer parte do mundo, independentemente da língua que fala.
É importante conhecer o percurso da tradução automática desde o final dos anos 80 até ao estado atual para melhor compreender o seu potencial para transformar o futuro.
No final dos anos 80 e início dos anos 90, já tínhamos assistido a um avanço importante com a tradução automática estatística, que veio substituir a geração de sistemas anteriores baseados em regras. Este método funciona através da análise estatística de textos paralelos escritos em línguas diferentes (como uma pedra de Roseta em grande escala) e do reconhecimento de padrões simples nesses textos paralelos. Apesar de muitas melhorias ao longo de várias décadas, trazidas por um maior poder de computação, mais dados e modelos mais sofisticados, esta tecnologia acabou por estagnar por se basear em padrões lexicais muito simples e ter dificuldade em capturar representações semânticas e generalizar para exemplos novos: por exemplo, em línguas onde a ordem das palavras é flexível, como o português, os sistemas de tradução automática estatística têm dificuldade em produzir boas traduções. Isso fez com que as principais empresas de tradução automática se focassem em desenvolver uma nova geração de sistemas mais avançados, baseados em redes neuronais artificiais.
Em 2014, investigadores de várias instituições desenvolveram sistemas de tradução ponta-a-ponta concluindo que as redes neuronais seriam a chave para elevar a tradução automática a um novo patamar. Pouco depois, as grandes empresas tecnológicas começaram a trabalhar nestes sistemas de nova geração.
Os sistemas neuronais de tradução automática conseguem aprender de ponta a ponta através de dados criados por humanos, melhorando, progressivamente, a qualidade das traduções que produzem à medida que a quantidade de dados aumenta. Assim, ao invés de um número de componentes complexos concebidos individualmente, os sistemas neuronais de tradução automática consistem numa grande rede, capaz de analisar e produzir internamente representações semânticas do texto, gerando traduções com uma fluência impressionante. Comparativamente a outros sistemas, estas redes têm uma maior capacidade para lidar com fenómenos linguísticos de longo alcance, reordenar palavras e “compreender” a semelhança e relação entre as várias palavras.
Nos últimos anos, temos assistido a uma colaboração forte entre a comunidade científica e várias empresas do setor, encontrando-se publicamente disponíveis vários modelos e ferramentas em código aberto, tornando possível a outros investigadores de inteligência artificial desenvolverem o seu trabalho e avançarem o estado da arte, devolvendo assim a ajuda e acrescentando novas contribuições à comunidade científica.
Durante os últimos anos, tenho vindo a estudar e desenvolver novas ferramentas para medir a qualidade da tradução (como os projetos em código aberto OpenKiwi e COMET), uma área crucial não só para a melhoria das tecnologias de tradução automática, mas também para a experiência das pessoas e para a sua compreensão das capacidades atuais da inteligência artificial. Os avanços atuais nos modelos de medição da qualidade da tradução automática permitem não só determinar a confiança nas traduções produzidas por estes sistemas, como também encontrar a forma mais eficiente de configurar a colaboração entre humanos e sistemas de inteligência artificial, reforçando a ideia de que sistemas human-in-the-loop são a chave para a melhoria constante.
Num futuro próximo, é expectável que estas tecnologias neuronais de tradução automática possam ajudar as empresas a expandir os seus negócios internacionalmente, ultrapassando a barreira da língua. Fazer parte da geração de colegas investigadores que estão a transformar a história da tradução automática é por isso motivo de grande satisfação. Estar envolvido nesta indústria em tão rápido crescimento numa altura tão revolucionária permite-me acreditar que o futuro da tradução automática é brilhante; mal posso esperar para ver o que está para vir.