
Novo modelo de AI pequeno da Ai2 supera modelos de tamanho semelhante do Google, Meta
‘Tis the week for small AI models, it seems. On Thursday, Ai2, the nonprofit AI research institute, released Olmo 2 1B, a 1-billion-parameter model that Ai2 claims beats similarly-sized models from Google, Meta, and Alibaba on several benchmarks. Parameters, sometimes referred to as weights, are the internal components of a model that guide its behavior.
Ai2 lançou um novo modelo de IA que supera concorrentes de peso
A Ai2, instituto de pesquisa de IA sem fins lucrativos, surpreendeu a todos essa semana ao lançar o Olmo 2 1B, um modelo com 1 bilhão de parâmetros que supera modelos de empresas como Google, Meta e Alibaba em diversos benchmarks. Os parâmetros, também conhecidos como pesos, são os componentes internos de um modelo que guiam o seu comportamento.
O Olmo 2 1B está disponÃvel sob a licença permissiva Apache 2.0 na plataforma de desenvolvimento de IA Hugging Face. Diferentemente da maioria dos modelos, o Olmo 2 1B pode ser replicado do zero, com a Ai2 fornecendo o código e os conjuntos de dados utilizados para desenvolvê-lo.
Modelos menores, como o Olmo 2 1B, podem não ser tão poderosos quanto os grandes, porém não exigem hardware robusto para rodar, tornando-os mais acessÃveis para desenvolvedores e entusiastas que lidam com máquinas de menor capacidade.
Além disso, o Olmo 2 1B foi treinado em um conjunto de dados de 4 trilhões de tokens de fontes publicamente disponÃveis, geradas por IA e criadas manualmente. Em testes de raciocÃnio aritmético, o modelo superou concorrentes como o Gemma 3 1B da Google, o Llama 3.2 1B da Meta e o Qwen 2.5 1.5B da Alibaba.
A Ai2 alerta, no entanto, que o Olmo 2 1B apresenta riscos, como a produção de conteúdo problemático, sensÃvel e factos incorretos, recomendando que não seja implantado em ambientes comerciais.
Empresa Ai2
A Ai2 é um instituto de pesquisa de inteligência artificial sem fins lucrativos que se destaca por desenvolver modelos de IA avançados e contribuir significativamente para o avanço da área.