CPJ Scraper
Modelos LLM
LiteLLM
Gastos consolidados
Gasto totalUS$ 0,0000
Chamadas0
Tokens0
Sem custo0
$ por save real—0 salvas (
apply.status=concluido)$ por resolução—0 resolvidas (save + skipped + failed)
Runs00 checkpoints
Dia atual
Carregando custos...
Catálogo
Preço por 1M tokens
50 modelos
| Modelo | Provider | Tier | Input $/M | Cached $/M | Output $/M | Blend 80/20 ↑ | Janela |
|---|---|---|---|---|---|---|---|
OpenAI GPT-4.1 Nanoopenai/gpt-4.1-nano | OpenAI | Econômico | $0.10 | $0.025 | $0.40 | $0.16 | 1 mi |
Gemini 2.5 Flash Litegemini/gemini-2.5-flash-lite | Econômico | $0.10 | $0.01 | $0.40 | $0.16 | 1 mi | |
Azure AI Phi-4 (14B)azure_ai/Phi-4Microsoft Foundry. Context 16k não cabe no contexto canônico (49k chars) — bench 2026-05-10 falhou 3/3 com ContextWindowExceeded. | Azure Foundry | Econômicoestimado | $0.125 | — | $0.50 | $0.20 | 16,4 mil |
Azure AI Phi-4 Reasoning (14B)azure_ai/Phi-4-reasoningMicrosoft Foundry reasoning 14B. Sem json_schema strict no Foundry → bench 2026-05-10 inventou schema próprio em 2/3 SHAs e timeout em 1/3. | Azure Foundry | Econômicoestimado | $0.125 | — | $0.50 | $0.20 | 32,8 mil |
OpenAI GPT-4o Miniopenai/gpt-4o-mini | OpenAI | Econômico | $0.15 | $0.075 | $0.60 | $0.24 | 128 mil |
Azure AI Grok 4.1 Fast Reasoningazure_ai/grok-4-1-fast-reasoningFamília Grok 4.1 — fast reasoning barato; sem cached SKU no retail. | Azure Foundry | Econômico | $0.20 | — | $0.50 | $0.26 | 256 mil |
Azure AI Llama 4 Maverick 17Bazure_ai/Llama-4-Maverick-17B-128E-Instruct-FP8 | Azure Foundry | Econômico | $0.25 | — | $1.00 | $0.40 | 128 mil |
Azure GPT-5.4 Nanoazure/gpt-5.4-nanoMais barato dos 5.x. Capacidade 2500 (a maior do tenant) — robusto pra batch. | Azure OpenAI | Econômico | $0.20 | $0.02 | $1.25 | $0.41 | 400 mil |
OpenAI GPT-5.4 Nanoopenai/gpt-5.4-nano | OpenAI | Econômico | $0.20 | $0.02 | $1.25 | $0.41 | 400 mil |
Gemini 3.1 Flash Lite Previewgemini/gemini-3.1-flash-lite-preview | Econômicoestimado | $0.25 | $0.025 | $1.50 | $0.50 | 1 mi | |
OpenAI GPT-5 Miniopenai/gpt-5-mini | OpenAI | Econômico | $0.25 | $0.025 | $2.00 | $0.60 | 400 mil |
Azure GPT-4.1 Miniazure/gpt-4.1-miniMais barato dos OpenAI usados — papel de vision/gate. | Azure OpenAI | Econômico | $0.40 | $0.10 | $1.60 | $0.64 | 1 mi |
OpenAI GPT-4.1 Miniopenai/gpt-4.1-mini | OpenAI | Econômico | $0.40 | $0.10 | $1.60 | $0.64 | 1 mi |
Azure AI Mistral Large 3azure_ai/Mistral-Large-3 | Azure Foundry | Econômico | $0.50 | — | $1.50 | $0.70 | 128 mil |
Gemini 2.5 Flashgemini/gemini-2.5-flash | Econômico | $0.30 | $0.03 | $2.50 | $0.74 | 1 mi | |
Azure AI DeepSeek V3.2azure_ai/DeepSeek-V3.2Microsoft-managed Global SKU. DataZone seria $0.64/$1.85. Sem cached SKU publicado. | Azure Foundry | Econômico | $0.58 | — | $1.68 | $0.80 | 128 mil |
Gemini 3 Flash Previewgemini/gemini-3-flash-preview | Balanceado | $0.50 | $0.05 | $3.00 | $1.00 | 1 mi | |
Azure AI Kimi K2.5 Thinkingazure_ai/Kimi-K2.5Microsoft Foundry Global ('K2.5 Thinking Global'). Sem cached SKU publicado. | Azure Foundry | Econômico | $0.60 | — | $3.00 | $1.08 | 256 mil |
Azure GPT-5.4 Miniazure/gpt-5.4-miniSweet spot entre 4.1-mini ($0.40/$1.60) e 5.4 ($2.50/$15). 500 TPM contratado. | Azure OpenAI | Econômico | $0.75 | $0.075 | $4.50 | $1.50 | 400 mil |
OpenAI GPT-5.4 Miniopenai/gpt-5.4-mini | OpenAI | Econômico | $0.75 | $0.075 | $4.50 | $1.50 | 400 mil |
Azure AI Kimi K2.6 (Moonshot)azure_ai/Kimi-K2.6Pricing oficial Microsoft Foundry blog. Qualidade 0.79 no leaderboard. Sem cached SKU publicado. | Azure Foundry | Balanceado | $0.95 | — | $4.00 | $1.56 | 256 mil |
Azure AI DeepSeek V4 Flashazure_ai/DeepSeek-V4-FlashPricing oficial Microsoft Foundry blog (2026). Sem cached SKU publicado. | Azure Foundry | Econômico | $1.03 | — | $4.12 | $1.648 | 128 mil |
Azure o4-miniazure/o4-miniReasoning curto. Cuidado com content-policy em texto jurídico. | Azure OpenAI | Econômico | $1.10 | $0.275 | $4.40 | $1.76 | 200 mil |
Claude Haiku 4.5anthropic/claude-haiku-4-5Mais barato + rápido. Default pra smoke/benchmark. | Anthropic | Econômico | $1.00 | $0.10 | $5.00 | $1.80 | 200 mil |
Azure AI DeepSeek R1 (0528)azure_ai/DeepSeek-R1-0528Reasoning model. Microsoft-managed Global. DataZone/Regional = $1.485/$5.94. Mesmo pricing do MAI-DS-R1. | Azure Foundry | Balanceado | $1.35 | — | $5.40 | $2.16 | 128 mil |
Azure AI Grok 4.20 Reasoningazure_ai/grok-4-20-reasoning | Azure Foundry | Balanceado | $2.00 | — | $6.00 | $2.80 | 256 mil |
Azure AI Grok 4.20 Non-Reasoningazure_ai/grok-4-20-non-reasoningMesmo pricing do Grok 4.20 reasoning. Use quando reasoning não ajuda. | Azure Foundry | Balanceado | $2.00 | — | $6.00 | $2.80 | 256 mil |
Azure GPT-5.1 Codexazure/gpt-5.1-codexEspecialista em código. Mesmo preço do 'codex-max'. | Azure OpenAI | Balanceado | $1.25 | $0.125 | $10.00 | $3.00 | 400 mil |
Gemini 2.5 Pro (≤200k)gemini/gemini-2.5-proAcima de 200k tokens: input $2.50 / output $15.00 / cached $0.625. | Balanceado | $1.25 | $0.31 | $10.00 | $3.00 | 1 mi | |
Azure GPT-4.1azure/gpt-4.1 | Azure OpenAI | Balanceado | $2.00 | $0.50 | $8.00 | $3.20 | 1 mi |
OpenAI GPT-4.1openai/gpt-4.1 | OpenAI | Balanceado | $2.00 | $0.50 | $8.00 | $3.20 | 1 mi |
Azure GPT-4oazure/gpt-4o | Azure OpenAI | Balanceado | $2.50 | $1.25 | $10.00 | $4.00 | 128 mil |
OpenAI GPT-4oopenai/gpt-4o | OpenAI | Balanceado | $2.50 | $1.25 | $10.00 | $4.00 | 128 mil |
Gemini 3.1 Pro Previewgemini/gemini-3.1-pro-preview | Premiumestimado | $2.00 | $0.50 | $12.00 | $4.00 | 1 mi | |
Gemini 3 Pro Previewgemini/gemini-3-pro-preview | Premiumestimado | $2.00 | $0.50 | $12.00 | $4.00 | 1 mi | |
Azure GPT-5.3 Chatazure/gpt-5.3-chat | Azure OpenAI | Balanceado | $1.75 | $0.175 | $14.00 | $4.20 | 272 mil |
Azure GPT-5.2azure/gpt-5.2 | Azure OpenAI | Balanceado | $1.75 | $0.175 | $14.00 | $4.20 | 272 mil |
OpenAI GPT-5.2openai/gpt-5.2 | OpenAI | Balanceado | $1.75 | $0.175 | $14.00 | $4.20 | 400 mil |
Azure GPT-5.4azure/gpt-5.4Modelo canônico do projeto (classify primário). Cache hit reduz input 10×. | Azure OpenAI | Balanceado | $2.50 | $0.25 | $15.00 | $5.00 | 400 mil |
OpenAI GPT-5.4openai/gpt-5.4 | OpenAI | Balanceado | $2.50 | $0.25 | $15.00 | $5.00 | 400 mil |
Claude Sonnet 4.6anthropic/claude-sonnet-4-6 | Anthropic | Balanceado | $3.00 | $0.30 | $15.00 | $5.40 | 200 mil |
Claude Sonnet 4.5anthropic/claude-sonnet-4-5 | Anthropic | Balanceado | $3.00 | $0.30 | $15.00 | $5.40 | 200 mil |
OpenAI GPT-5.1openai/gpt-5.1 | OpenAI | Balanceadoestimado | $3.00 | $0.30 | $24.00 | $7.20 | 400 mil |
OpenAI GPT-5openai/gpt-5 | OpenAI | Premiumestimado | $5.00 | $0.50 | $40.00 | $12.00 | 400 mil |
Claude Opus 4.1anthropic/claude-opus-4-1Geração anterior ao 4.7. Mantido pra fallback/comparação. | Anthropic | Premium | $15.00 | $1.50 | $75.00 | $27.00 | 200 mil |
Claude Opus 4.7anthropic/claude-opus-4-71M-context flagship. Cache write 1h = 2× input. | Anthropic | Premium | $20.00 | $2.00 | $100.00 | $36.00 | 200 mil |
Claude Opus 4.7.2anthropic/claude-opus-4-7-2 | Anthropic | Premium | $20.00 | $2.00 | $100.00 | $36.00 | 200 mil |
Azure GPT-5.4 Proazure/gpt-5.4-proReasoning máximo. Usar só em SHA crítico (replano audiência, retry final). | Azure OpenAI | Premium | $30.00 | $3.00 | $180.00 | $60.00 | 400 mil |
OpenAI GPT-5.4 Proopenai/gpt-5.4-pro | OpenAI | Premium | $30.00 | $3.00 | $180.00 | $60.00 | 400 mil |
OpenAI GPT-5 Proopenai/gpt-5-proReasoning máximo — preço estimado. | OpenAI | Premiumestimado | $50.00 | $5.00 | $400.00 | $120.00 | 400 mil |
Simulador
Se este período rodasse em outro modelo
Sem dados de tokens no período selecionado.
Leaderboard
Qualidade × Segurança × Throughput × Custo
33 modelos
Qualidade ↑ maior melhorSegurança ↓ menor melhor (taxa de bloqueio)Throughput ↑ maior melhor (tokens/s)Custo ↓ menor melhor (suite Foundry)
| Modelo | Provider | Qualidade ↑ | Segurança ↓ | tok/s ↑ | Custo $ ↓ ↑ |
|---|---|---|---|---|---|
| grok-4-fast-non-reasoning | xAI | 0,61 | 36,11% | 127 | $7,36 |
| DeepSeek-V4-Flashna carteira | DeepSeek | 0,72 | 31,50% | 91 | $7,51 |
| gpt-5.4-nano | OpenAI | 0,64 | 0,61% | 177 | $8,78 |
| grok-4-fast-reasoning | xAI | 0,73 | 24,72% | 58 | $13,57 |
| grok-code-fast-1 | xAI | 0,68 | 23,04% | 157 | $23,42 |
| gpt-5-nano | OpenAI | 0,53 | 1,67% | 224 | $25,08 |
| deepseek-v3.1 | DeepSeek | 0,65 | 40,50% | 91 | $25,49 |
| gpt-5.1-codex-mini | OpenAI | 0,68 | 0,33% | 43 | $31,39 |
| gpt-4.1-minina carteira | OpenAI | 0,59 | 17,50% | 125 | $32,59 |
| deepseek-v3-0324 | DeepSeek | 0,58 | 41,83% | 60 | $40,88 |
| gpt-5.4-minina carteira | OpenAI | 0,67 | 0,00% | 142 | $45,81 |
| cohere-command-a | Cohere | 0,51 | 38,98% | 33 | $66,46 |
| gpt-4.1na carteira | OpenAI | 0,64 | 9,83% | 95 | $75,09 |
| grok-4 | xAI | 0,59 | 23,59% | 55 | $82,02 |
| gpt-5.3-codex | OpenAI | 0,68 | 2,04% | 23 | $88,88 |
| o4-minina carteira | OpenAI | 0,69 | 2,33% | 52 | $90,40 |
| claude-sonnet-4-6 | Anthropic | 0,74 | 5,84% | 46 | $95,63 |
| o3-mini | OpenAI | 0,61 | 4,83% | 131 | $98,67 |
| gpt-5.1-codexna carteira | OpenAI | 0,74 | 0,33% | 33 | $101,43 |
| Kimi-K2.5na carteira | Moonshot AI | 0,76 | 12,17% | 75 | $110,79 |
| gpt-4ona carteira | OpenAI | 0,55 | 7,33% | 65 | $114,75 |
| o3 | OpenAI | 0,74 | 2,50% | 62 | $138,05 |
| gpt-5.2-codex | OpenAI | 0,75 | 0,18% | 32 | $145,71 |
| gpt-5.1-codex-max | OpenAI | 0,64 | 0,69% | 86 | $153,18 |
| gpt-5.1-chat | OpenAI | 0,68 | 0,34% | 76 | $159,03 |
| gpt-5.4na carteira | OpenAI | 0,81 | 1,02% | 21 | $164,92 |
| gpt-5 | OpenAI | 0,74 | 1,09% | 69 | $215,93 |
| Kimi-K2.6na carteira | Moonshot AI | 0,79 | 19,42% | 135 | $234,91 |
| gpt-5.2na carteira | OpenAI | 0,78 | 1,87% | 60 | $252,88 |
| claude-opus-4-6 | Anthropic | 0,82 | 2,41% | 43 | $269,14 |
| gpt-5.1 | OpenAI | 0,75 | 0,34% | 76 | $269,59 |
| gpt-5.5 | OpenAI | 0,82 | 0,00% | 50 | $543,79 |
| claude-opus-4-5 | Anthropic | 0,81 | 1,47% | 42 | $610,30 |
Dados copiados do quadro Comparar modelos do Azure AI Foundry. Custoé o "parâmetro de comparação" do Foundry — custo médio agregado da suite de benchmark, não é o preço por 1M tokens. Para preço real veja o catálogo acima ou o simulador.
TaskIQ / NATS
Workers de produção
worker-1
gemini/gemini-flash-latestworker-2
gemini/gemini-flash-latestworker-3
gemini/gemini-flash-latestworker-4
openai/gpt-5.4-miniworker-5
openai/gpt-5.4-miniworker-6
openai/gpt-5.4-miniFallback legado
Rotas Vision / Classificação / Audiência
Visionscreenshots e grid
Classificaçãotexto da publicação
Audiênciarota audiencia.py + plano