Apresentando Aqui-v4.6

Nas últimas semanas, lançamos os modelos Aqui-v4.5 e Aqui-v4.5 Fast, além do sistema de agentes Aqui-v4.5 Heavy e dos modelos de geração de imagem Aqui-v4.5 Image e Aqui-v4.5 Image Thinking. Na época, eram os modelos state-of-the-art em todas as dimensões. Hoje, apresentamos um grande upgrade em todos os frontes com os modelos Aqui-v4.6, Aqui-v4.6 Image e Aqui-v4.6 Pro.

Aqui-v4.6 & v4.6 Fast

Aqui-v4.6

Os modelos Aqui-v4.6 e Aqui-v4.6 Fast são sucessores diretos dos Aqui-v4.5 e Aqui-v4.5 Fast, com arquiteturas mais robustas que os tornam até 30% mais rápidos; o Aqui-v4.6 agora suporta Extended Thinking, uma versão mais longa do regular Thinking, e traz upgrades na versão non-thinking.

Benchmark Aqui-v4.6 Extended Aqui-v4.6 Thinking GPT-5.2 high Gemini 3 Pro Claude Opus 4.5 Aqui-v4.5
GPQA Diamond92.9%89.7%92.4%91.9%87.0%90.9%
MathArena Apex10.94%5.62%5.21%23.44%1.56%5.62%
TerminalBench 2.057.9%54.2%54.0%54.2%59.3%54.2%
Humanity's Last Exam37.6%30.7%34.5%37.5%28.8%28.5%
ARC-AGI 233.8%26.5%43.5%31.1%37.6%24.3%

Aqui-v4.6 Fast

O Aqui-v4.6 Fast é duas vezes mais barato, 50% mais rápido e agora possui um modo non-thinking. Ao contrário de seu irmão maior, Aqui-v4.6, não apresenta um modo Extended.

Benchmark Aqui-v4.6 Fast GPT-5 mini high Grok 4.1 Fast DeepSeek-V3.2 Aqui-v4.5 Fast
GPQA Diamond85.4%82.8%85.3%82.0%80.7%
BrowseComp58.9%42.8%44.9%51.4%47.6%
SWE-Bench Verified76.5%70.2%66.5%73.1%73.8%
HLE + python + web41.9%24.8%25.7%40.8%34.7%

Eficiência de tokens

Em termos de uso de tokens, para rodar a nossa suíte de testes de problemas ao nível de PhD em matemática, física e química, ambos Aqui-v4.6 Thinking e Aqui-v4.6 Extended usaram menos tokens que Aqui-v4.5.

Modelo Score Tokens Matemática Química Física
Aqui-v4.6 Extended9.80%3.2M10.90%9.20%9.30%
Gemini 3 Pro8.70%2.5M8.20%9.40%8.50%
GPT-5.2 xhigh8.50%3.0M8.80%8.30%8.40%
Claude Opus 4.56.50%920K6.80%6.20%6.50%
Aqui-v4.6 Thinking6.50%1.8M5.90%7.00%6.60%
Aqui-v4.6 Fast4.20%2.3M4.80%4.60%3.20%
DeepSeek-V3.23.90%2.5M4.10%3.60%4.00%
Kimi K2 Thinking3.60%3.8M3.20%4.20%3.40%
Aqui-v4.53.50%4.0M3.80%3.20%3.50%
Aqui-v4.5 Fast2.70%3.1M2.90%2.50%2.70%

Aqui-v4.6 Image

Os modelos Aqui-v4.6 Image são o maior upgrade aos nossos modelos de geração de imagens desde o Aqui-IMG-1.5, lançado há 6 meses. Agora, ao invés de um só modelo, é uma linha completa de modelos state-of-the-art com reasoning.

Aqui-v4.6 Image Nano

O menor modelo da série Aqui-v4.6 Image. Um dos modelos mais fotorrealistas do mercado, leva apenas 5 segundos para gerar uma imagem com qualidade comparável ao Nano Banana e ao Aqui-v4.5 Image.

Modelo ELO
Aqui-v4.6 Image Nano1169
Z-Image Turbo1152
GPT-5 Image1148
Flux.2 Dev1146
Lucid Origin Ultra1125

Aqui-v4.6 Image Mini

Um modelo que já ultrapassa o Aqui-v4.5 Image em termos de performance enquanto sendo duas vezes mais barato e 30% mais rápido.

Modelo ELO
Aqui-v4.6 Image Mini1187
Flux.2 Flex1184
Seedream 4.01170
Nano Banana1164
ImagineArt 1.51156
Lucid Origin Ultra1125

Aqui-v4.6 Image & v4.6 Image Pro

  • Aqui-v4.6 Image: É o sucessor do Aqui-v4.5 Image Thinking, páreo ao Nano Banana Pro e ao Flux.2 Max.
  • Aqui-v4.6 Image Pro: O mais pesado e com maior qualidade modelo Aqui Image já lançado. É o primeiro modelo de geração de imagens da Aqui com inteligência própria, podendo pesquisar na web e adquirir contexto antes de gerar uma imagem, dando a ele conhecimento de mundo melhor que qualquer outro.
Modelo ELO
GPT-5.2 Image1272
Aqui-v4.6 Image Pro1247
Nano Banana Pro1223
Aqui-v4.6 Image1218
Flux.2 Max1211
Flux.2 Pro1196
Seedream 4.51192
Aqui-v4.5 Image Thinking1192
Aqui-v4.5 Image1170

Aqui-v4.6 Image Pro e Raciocínio Fundamentado

O novo Aqui-v4.6 Image Pro é o primeiro modelo de geração de imagens com reasoning capaz de pesquisar na web para gerar imagens fundamentadas em situações atuais. Ele pode pesquisar imagens para usar como referência e gerar conteúdo factual.

Workflow do Aqui-v4.6 Image Pro mostrando raciocínio fundamentado

Aqui-v4.6 Pro

Como um upgrade ao Aqui-v4.5 Heavy, o Aqui-v4.6 Pro é um sistema multi-agente guiado pelo AutoSummon. Para tarefas simples, o agente pode escolher não chamar subagentes; porém, para tarefas complexas, ele pode receber ajuda de até 7 instâncias de si mesmo, anteriormente 5.

A cadeia de raciocínio do Aqui-v4.6 Pro agora herda elementos do Aqui-v4.6 Extended, que garantem um salto impressionante em termos de performance enquanto mantendo eficiência. O Aqui-v4.6 é ainda melhor em escolher quando chamar subagentes; percebemos que, para a maioria das tarefas de Humanity's Last Exam, Aqui-v4.6 Pro chamou apenas dois agentes extras, enquanto v4.5 Heavy chamou 4 o tempo todo.

Benchmark Aqui-v4.6 Pro Aqui-v4.5 Heavy GPT-5.2 Pro Gemini 3 Deep Think
GPQA Diamond95.2%93.2%93.2%93.8%
Humanity's Last Exam43.7%39.7%36.6%41%
ARC-AGI 241.1%32.7%54.2%45.1%

Disponibilidade

Os novos modelos Aqui-v4.6 estão disponíveis no AquiGPT a partir da semana que vem. Estamos trabalhando em manter limites generosos no plano base de R$ 39,90 por mês, e lançar um plano "Pro" com limites maiores ao Aqui-v4.6 Pro e ao Aqui-v4.6 Image Pro.