Menu

Sistema modular de IA de código aberto supera gigantes a um décimo do custo

Ilustração editorial sobre Sistema modular de IA de código aberto supera gigantes a um décimo do custo. Pesquisadores internacionais apresentaram no repositório científico arXiv um novo sistema de raciocínio simbólico chamado MAVEN. O projeto foi desenvolvido para aprimorar a capacidade de modelos de linguagem em tarefas complexas de raciocínio e uso de ferramentas. Segundo o […]

sem comentários
Apoie o Cafezinho
Siga-nos no Siga-nos no Google News
Ilustração editorial sobre Sistema modular de IA de código aberto supera gigantes a um décimo do custo. (Ilustração: Cafezinho / Wan 2.6)

Pesquisadores internacionais apresentaram no repositório científico arXiv um novo sistema de raciocínio simbólico chamado MAVEN. O projeto foi desenvolvido para aprimorar a capacidade de modelos de linguagem em tarefas complexas de raciocínio e uso de ferramentas.

Segundo o artigo submetido em 29 de maio e disponível no arXiv, o MAVEN funciona como uma camada de decomposição modular, orquestração adaptativa de ferramentas e verificação intermediária. O sistema não exige treinamento adicional do modelo de base e foi testado em benchmarks como BFCL v3 e TauBench.

O verdadeiro potencial do MAVEN foi revelado no MAVEN-Bench, ambiente de estresse criado pelos autores para avaliar raciocínio matemático e físico em múltiplas etapas. Nesse cenário, o sistema elevou a precisão do modelo de código aberto GPT-OSS-120b de 48% para 71% de acertos.

O desempenho superou sistemas proprietários de ponta, mantendo custo operacional estimado em cerca de um décimo dos concorrentes fechados. O modelo base utilizado é de pesos abertos, permitindo que desenvolvedores inspecionem, adaptem ou executem em infraestrutura própria.

A arquitetura do MAVEN preserva estados intermediários e coordena múltiplas ferramentas, atacando uma das principais deficiências dos grandes modelos atuais. A abordagem simbólica demonstra que engenharia inteligente de verificação pode entregar saltos de desempenho com modelos abertos.

O artigo destaca que o MAVEN-Bench expôs a lacuna entre raciocínio parcial e sucesso completo da tarefa. Avaliações de agentes devem considerar o processo, não apenas o resultado final, aspecto ignorado por muitos benchmarks comerciais.

O sistema fortalece a pesquisa em IA soberana, permitindo que países e instituições desenvolvam assistentes de raciocínio complexo sem depender de licenças exorbitantes. A tecnologia reduz a dependência tecnológica de potências estrangeiras e democratiza o acesso à inteligência artificial avançada.


Leia também: Novo sistema de IA gera léxicos artificiais com realismo tipológico inédito


? Inscreva-se na Newsletter de O Cafezinho

Receba nossas análises e as principais notícias diárias do Brasil e do Sul Global.

Com informações de https://arxiv.org/.

Apoie o Cafezinho
Siga-nos no Siga-nos no Google News

Comentários

Os comentários aqui postados são de responsabilidade exclusiva de seus autores e não representam a opinião do site O CAFEZINHO. Todos as mensagens são moderadas. Não serão aceitos comentários com ofensas, com links externos ao site, e em letras maiúsculas. Em casos de ofensas pessoais, preconceituosas, ou que incitem o ódio e a violência, denuncie.

Escrever comentário

Escreva seu comentário

Nenhum comentário ainda, seja o primeiro!


Leia mais

Recentes

Recentes