Apresentando Aqui-v4.6
Nas últimas semanas, lançamos os modelos Aqui-v4.5 e Aqui-v4.5 Fast, além do sistema de agentes Aqui-v4.5 Heavy e dos modelos de geração de imagem Aqui-v4.5 Image e Aqui-v4.5 Image Thinking. Na época, eram os modelos state-of-the-art em todas as dimensões. Hoje, apresentamos um grande upgrade em todos os frontes com os modelos Aqui-v4.6, Aqui-v4.6 Image e Aqui-v4.6 Pro.
Aqui-v4.6 & v4.6 Fast
Aqui-v4.6
Os modelos Aqui-v4.6 e Aqui-v4.6 Fast são sucessores diretos dos Aqui-v4.5 e Aqui-v4.5 Fast, com arquiteturas mais robustas que os tornam até 30% mais rápidos; o Aqui-v4.6 agora suporta Extended Thinking, uma versão mais longa do regular Thinking, e traz upgrades na versão non-thinking.
| Benchmark | Aqui-v4.6 Extended | Aqui-v4.6 Thinking | GPT-5.2 high | Gemini 3 Pro | Claude Opus 4.5 | Aqui-v4.5 |
|---|---|---|---|---|---|---|
| GPQA Diamond | 92.9% | 89.7% | 92.4% | 91.9% | 87.0% | 90.9% |
| MathArena Apex | 10.94% | 5.62% | 5.21% | 23.44% | 1.56% | 5.62% |
| TerminalBench 2.0 | 57.9% | 54.2% | 54.0% | 54.2% | 59.3% | 54.2% |
| Humanity's Last Exam | 37.6% | 30.7% | 34.5% | 37.5% | 28.8% | 28.5% |
| ARC-AGI 2 | 33.8% | 26.5% | 43.5% | 31.1% | 37.6% | 24.3% |
Aqui-v4.6 Fast
O Aqui-v4.6 Fast é duas vezes mais barato, 50% mais rápido e agora possui um modo non-thinking. Ao contrário de seu irmão maior, Aqui-v4.6, não apresenta um modo Extended.
| Benchmark | Aqui-v4.6 Fast | GPT-5 mini high | Grok 4.1 Fast | DeepSeek-V3.2 | Aqui-v4.5 Fast |
|---|---|---|---|---|---|
| GPQA Diamond | 85.4% | 82.8% | 85.3% | 82.0% | 80.7% |
| BrowseComp | 58.9% | 42.8% | 44.9% | 51.4% | 47.6% |
| SWE-Bench Verified | 76.5% | 70.2% | 66.5% | 73.1% | 73.8% |
| HLE + python + web | 41.9% | 24.8% | 25.7% | 40.8% | 34.7% |
Eficiência de tokens
Em termos de uso de tokens, para rodar a nossa suíte de testes de problemas ao nível de PhD em matemática, física e química, ambos Aqui-v4.6 Thinking e Aqui-v4.6 Extended usaram menos tokens que Aqui-v4.5.
| Modelo | Score | Tokens | Matemática | Química | Física |
|---|---|---|---|---|---|
| Aqui-v4.6 Extended | 9.80% | 3.2M | 10.90% | 9.20% | 9.30% |
| Gemini 3 Pro | 8.70% | 2.5M | 8.20% | 9.40% | 8.50% |
| GPT-5.2 xhigh | 8.50% | 3.0M | 8.80% | 8.30% | 8.40% |
| Claude Opus 4.5 | 6.50% | 920K | 6.80% | 6.20% | 6.50% |
| Aqui-v4.6 Thinking | 6.50% | 1.8M | 5.90% | 7.00% | 6.60% |
| Aqui-v4.6 Fast | 4.20% | 2.3M | 4.80% | 4.60% | 3.20% |
| DeepSeek-V3.2 | 3.90% | 2.5M | 4.10% | 3.60% | 4.00% |
| Kimi K2 Thinking | 3.60% | 3.8M | 3.20% | 4.20% | 3.40% |
| Aqui-v4.5 | 3.50% | 4.0M | 3.80% | 3.20% | 3.50% |
| Aqui-v4.5 Fast | 2.70% | 3.1M | 2.90% | 2.50% | 2.70% |
Aqui-v4.6 Image
Os modelos Aqui-v4.6 Image são o maior upgrade aos nossos modelos de geração de imagens desde o Aqui-IMG-1.5, lançado há 6 meses. Agora, ao invés de um só modelo, é uma linha completa de modelos state-of-the-art com reasoning.
Aqui-v4.6 Image Nano
O menor modelo da série Aqui-v4.6 Image. Um dos modelos mais fotorrealistas do mercado, leva apenas 5 segundos para gerar uma imagem com qualidade comparável ao Nano Banana e ao Aqui-v4.5 Image.
| Modelo | ELO |
|---|---|
| Aqui-v4.6 Image Nano | 1169 |
| Z-Image Turbo | 1152 |
| GPT-5 Image | 1148 |
| Flux.2 Dev | 1146 |
| Lucid Origin Ultra | 1125 |
Aqui-v4.6 Image Mini
Um modelo que já ultrapassa o Aqui-v4.5 Image em termos de performance enquanto sendo duas vezes mais barato e 30% mais rápido.
| Modelo | ELO |
|---|---|
| Aqui-v4.6 Image Mini | 1187 |
| Flux.2 Flex | 1184 |
| Seedream 4.0 | 1170 |
| Nano Banana | 1164 |
| ImagineArt 1.5 | 1156 |
| Lucid Origin Ultra | 1125 |
Aqui-v4.6 Image & v4.6 Image Pro
- Aqui-v4.6 Image: É o sucessor do Aqui-v4.5 Image Thinking, páreo ao Nano Banana Pro e ao Flux.2 Max.
- Aqui-v4.6 Image Pro: O mais pesado e com maior qualidade modelo Aqui Image já lançado. É o primeiro modelo de geração de imagens da Aqui com inteligência própria, podendo pesquisar na web e adquirir contexto antes de gerar uma imagem, dando a ele conhecimento de mundo melhor que qualquer outro.
| Modelo | ELO |
|---|---|
| GPT-5.2 Image | 1272 |
| Aqui-v4.6 Image Pro | 1247 |
| Nano Banana Pro | 1223 |
| Aqui-v4.6 Image | 1218 |
| Flux.2 Max | 1211 |
| Flux.2 Pro | 1196 |
| Seedream 4.5 | 1192 |
| Aqui-v4.5 Image Thinking | 1192 |
| Aqui-v4.5 Image | 1170 |
Aqui-v4.6 Image Pro e Raciocínio Fundamentado
O novo Aqui-v4.6 Image Pro é o primeiro modelo de geração de imagens com reasoning capaz de pesquisar na web para gerar imagens fundamentadas em situações atuais. Ele pode pesquisar imagens para usar como referência e gerar conteúdo factual.
Aqui-v4.6 Pro
Como um upgrade ao Aqui-v4.5 Heavy, o Aqui-v4.6 Pro é um sistema multi-agente guiado pelo AutoSummon. Para tarefas simples, o agente pode escolher não chamar subagentes; porém, para tarefas complexas, ele pode receber ajuda de até 7 instâncias de si mesmo, anteriormente 5.
A cadeia de raciocínio do Aqui-v4.6 Pro agora herda elementos do Aqui-v4.6 Extended, que garantem um salto impressionante em termos de performance enquanto mantendo eficiência. O Aqui-v4.6 é ainda melhor em escolher quando chamar subagentes; percebemos que, para a maioria das tarefas de Humanity's Last Exam, Aqui-v4.6 Pro chamou apenas dois agentes extras, enquanto v4.5 Heavy chamou 4 o tempo todo.
| Benchmark | Aqui-v4.6 Pro | Aqui-v4.5 Heavy | GPT-5.2 Pro | Gemini 3 Deep Think |
|---|---|---|---|---|
| GPQA Diamond | 95.2% | 93.2% | 93.2% | 93.8% |
| Humanity's Last Exam | 43.7% | 39.7% | 36.6% | 41% |
| ARC-AGI 2 | 41.1% | 32.7% | 54.2% | 45.1% |
Disponibilidade
Os novos modelos Aqui-v4.6 estão disponíveis no AquiGPT a partir da semana que vem. Estamos trabalhando em manter limites generosos no plano base de R$ 39,90 por mês, e lançar um plano "Pro" com limites maiores ao Aqui-v4.6 Pro e ao Aqui-v4.6 Image Pro.