A Meta anunciou a chegada de dois novos modelos de Inteligência Artificial, os Llama 4 que alimentam o assistente Meta AI na web e no WhatsApp, Instagram e Messenger. Os dois novos modelos, que podem ser descarregados do site da Meta ou da plataforma Hugging Face, são o Llama 4 Scout, um pequeno modelo que “cabe numa única GPU Nvidia H100”, e o Llama 4 Maverick, equiparado ao GPT-4o e ao Gemini 2.0 Flash. A empresa confirma estar a treinar o Llama 4 Behemoth, anunciado como o “modelo com melhor desempenho do mundo”.
O Llama 4 Scout tem uma janela de contexto de 10 milhões de tokens e consegue bater o Gemma 3 e o Gemini 2.0 Flash-Lite da Google e o Mistral 3.1 em “vários benchmarks”, segundo a Meta, enquanto pode ser executado com uma única GPU Nvidia H100. Já o Maverick também bate a concorrência dos GPT-4o da OpenAI e Gemini 2.0 Flash, obtendo resultados comparáveis aos do DeepSeek -V3, noticia o The Verge.
O outro modelo desta família que está a ser treinado, o Behemoth, tem 288 mil milhões de parâmetros ativos, com um total de dois biliões de parâmetros e é capaz de bater os rivais GPT-4.5 e Claude Sonnet 3.7 em “vários benchmark STEM”.
A nova arquitetura MoE (de mixture of experts) permite conservar recursos, utilizando apenas partes do modelo que são necessárias para cada tarefa. A 29 de abril, a Meta vai explicar melhor os modelos e os planos para o futuro na conferência LlamaCon.