CPJ Scraper

Modelos LLM

LiteLLM

Gastos consolidados

Gasto totalUS$ 0,0000
Chamadas0
Tokens0
Sem custo0
$ por save real0 salvas (apply.status=concluido)
$ por resolução0 resolvidas (save + skipped + failed)
Runs00 checkpoints
Dia atual

Carregando custos...

Catálogo

Preço por 1M tokens

50 modelos
ModeloProviderTierInput $/MCached $/MOutput $/MBlend 80/20Janela
OpenAI GPT-4.1 Nanoopenai/gpt-4.1-nanoOpenAIEconômico$0.10$0.025$0.40$0.161 mi
Gemini 2.5 Flash Litegemini/gemini-2.5-flash-liteGoogleEconômico$0.10$0.01$0.40$0.161 mi
Azure AI Phi-4 (14B)azure_ai/Phi-4Microsoft Foundry. Context 16k não cabe no contexto canônico (49k chars) — bench 2026-05-10 falhou 3/3 com ContextWindowExceeded.Azure FoundryEconômicoestimado$0.125$0.50$0.2016,4 mil
Azure AI Phi-4 Reasoning (14B)azure_ai/Phi-4-reasoningMicrosoft Foundry reasoning 14B. Sem json_schema strict no Foundry → bench 2026-05-10 inventou schema próprio em 2/3 SHAs e timeout em 1/3.Azure FoundryEconômicoestimado$0.125$0.50$0.2032,8 mil
OpenAI GPT-4o Miniopenai/gpt-4o-miniOpenAIEconômico$0.15$0.075$0.60$0.24128 mil
Azure AI Grok 4.1 Fast Reasoningazure_ai/grok-4-1-fast-reasoningFamília Grok 4.1 — fast reasoning barato; sem cached SKU no retail.Azure FoundryEconômico$0.20$0.50$0.26256 mil
Azure AI Llama 4 Maverick 17Bazure_ai/Llama-4-Maverick-17B-128E-Instruct-FP8Azure FoundryEconômico$0.25$1.00$0.40128 mil
Azure GPT-5.4 Nanoazure/gpt-5.4-nanoMais barato dos 5.x. Capacidade 2500 (a maior do tenant) — robusto pra batch.Azure OpenAIEconômico$0.20$0.02$1.25$0.41400 mil
OpenAI GPT-5.4 Nanoopenai/gpt-5.4-nanoOpenAIEconômico$0.20$0.02$1.25$0.41400 mil
Gemini 3.1 Flash Lite Previewgemini/gemini-3.1-flash-lite-previewGoogleEconômicoestimado$0.25$0.025$1.50$0.501 mi
OpenAI GPT-5 Miniopenai/gpt-5-miniOpenAIEconômico$0.25$0.025$2.00$0.60400 mil
Azure GPT-4.1 Miniazure/gpt-4.1-miniMais barato dos OpenAI usados — papel de vision/gate.Azure OpenAIEconômico$0.40$0.10$1.60$0.641 mi
OpenAI GPT-4.1 Miniopenai/gpt-4.1-miniOpenAIEconômico$0.40$0.10$1.60$0.641 mi
Azure AI Mistral Large 3azure_ai/Mistral-Large-3Azure FoundryEconômico$0.50$1.50$0.70128 mil
Gemini 2.5 Flashgemini/gemini-2.5-flashGoogleEconômico$0.30$0.03$2.50$0.741 mi
Azure AI DeepSeek V3.2azure_ai/DeepSeek-V3.2Microsoft-managed Global SKU. DataZone seria $0.64/$1.85. Sem cached SKU publicado.Azure FoundryEconômico$0.58$1.68$0.80128 mil
Gemini 3 Flash Previewgemini/gemini-3-flash-previewGoogleBalanceado$0.50$0.05$3.00$1.001 mi
Azure AI Kimi K2.5 Thinkingazure_ai/Kimi-K2.5Microsoft Foundry Global ('K2.5 Thinking Global'). Sem cached SKU publicado.Azure FoundryEconômico$0.60$3.00$1.08256 mil
Azure GPT-5.4 Miniazure/gpt-5.4-miniSweet spot entre 4.1-mini ($0.40/$1.60) e 5.4 ($2.50/$15). 500 TPM contratado.Azure OpenAIEconômico$0.75$0.075$4.50$1.50400 mil
OpenAI GPT-5.4 Miniopenai/gpt-5.4-miniOpenAIEconômico$0.75$0.075$4.50$1.50400 mil
Azure AI Kimi K2.6 (Moonshot)azure_ai/Kimi-K2.6Pricing oficial Microsoft Foundry blog. Qualidade 0.79 no leaderboard. Sem cached SKU publicado.Azure FoundryBalanceado$0.95$4.00$1.56256 mil
Azure AI DeepSeek V4 Flashazure_ai/DeepSeek-V4-FlashPricing oficial Microsoft Foundry blog (2026). Sem cached SKU publicado.Azure FoundryEconômico$1.03$4.12$1.648128 mil
Azure o4-miniazure/o4-miniReasoning curto. Cuidado com content-policy em texto jurídico.Azure OpenAIEconômico$1.10$0.275$4.40$1.76200 mil
Claude Haiku 4.5anthropic/claude-haiku-4-5Mais barato + rápido. Default pra smoke/benchmark.AnthropicEconômico$1.00$0.10$5.00$1.80200 mil
Azure AI DeepSeek R1 (0528)azure_ai/DeepSeek-R1-0528Reasoning model. Microsoft-managed Global. DataZone/Regional = $1.485/$5.94. Mesmo pricing do MAI-DS-R1.Azure FoundryBalanceado$1.35$5.40$2.16128 mil
Azure AI Grok 4.20 Reasoningazure_ai/grok-4-20-reasoningAzure FoundryBalanceado$2.00$6.00$2.80256 mil
Azure AI Grok 4.20 Non-Reasoningazure_ai/grok-4-20-non-reasoningMesmo pricing do Grok 4.20 reasoning. Use quando reasoning não ajuda.Azure FoundryBalanceado$2.00$6.00$2.80256 mil
Azure GPT-5.1 Codexazure/gpt-5.1-codexEspecialista em código. Mesmo preço do 'codex-max'.Azure OpenAIBalanceado$1.25$0.125$10.00$3.00400 mil
Gemini 2.5 Pro (≤200k)gemini/gemini-2.5-proAcima de 200k tokens: input $2.50 / output $15.00 / cached $0.625.GoogleBalanceado$1.25$0.31$10.00$3.001 mi
Azure GPT-4.1azure/gpt-4.1Azure OpenAIBalanceado$2.00$0.50$8.00$3.201 mi
OpenAI GPT-4.1openai/gpt-4.1OpenAIBalanceado$2.00$0.50$8.00$3.201 mi
Azure GPT-4oazure/gpt-4oAzure OpenAIBalanceado$2.50$1.25$10.00$4.00128 mil
OpenAI GPT-4oopenai/gpt-4oOpenAIBalanceado$2.50$1.25$10.00$4.00128 mil
Gemini 3.1 Pro Previewgemini/gemini-3.1-pro-previewGooglePremiumestimado$2.00$0.50$12.00$4.001 mi
Gemini 3 Pro Previewgemini/gemini-3-pro-previewGooglePremiumestimado$2.00$0.50$12.00$4.001 mi
Azure GPT-5.3 Chatazure/gpt-5.3-chatAzure OpenAIBalanceado$1.75$0.175$14.00$4.20272 mil
Azure GPT-5.2azure/gpt-5.2Azure OpenAIBalanceado$1.75$0.175$14.00$4.20272 mil
OpenAI GPT-5.2openai/gpt-5.2OpenAIBalanceado$1.75$0.175$14.00$4.20400 mil
Azure GPT-5.4azure/gpt-5.4Modelo canônico do projeto (classify primário). Cache hit reduz input 10×.Azure OpenAIBalanceado$2.50$0.25$15.00$5.00400 mil
OpenAI GPT-5.4openai/gpt-5.4OpenAIBalanceado$2.50$0.25$15.00$5.00400 mil
Claude Sonnet 4.6anthropic/claude-sonnet-4-6AnthropicBalanceado$3.00$0.30$15.00$5.40200 mil
Claude Sonnet 4.5anthropic/claude-sonnet-4-5AnthropicBalanceado$3.00$0.30$15.00$5.40200 mil
OpenAI GPT-5.1openai/gpt-5.1OpenAIBalanceadoestimado$3.00$0.30$24.00$7.20400 mil
OpenAI GPT-5openai/gpt-5OpenAIPremiumestimado$5.00$0.50$40.00$12.00400 mil
Claude Opus 4.1anthropic/claude-opus-4-1Geração anterior ao 4.7. Mantido pra fallback/comparação.AnthropicPremium$15.00$1.50$75.00$27.00200 mil
Claude Opus 4.7anthropic/claude-opus-4-71M-context flagship. Cache write 1h = 2× input.AnthropicPremium$20.00$2.00$100.00$36.00200 mil
Claude Opus 4.7.2anthropic/claude-opus-4-7-2AnthropicPremium$20.00$2.00$100.00$36.00200 mil
Azure GPT-5.4 Proazure/gpt-5.4-proReasoning máximo. Usar só em SHA crítico (replano audiência, retry final).Azure OpenAIPremium$30.00$3.00$180.00$60.00400 mil
OpenAI GPT-5.4 Proopenai/gpt-5.4-proOpenAIPremium$30.00$3.00$180.00$60.00400 mil
OpenAI GPT-5 Proopenai/gpt-5-proReasoning máximo — preço estimado.OpenAIPremiumestimado$50.00$5.00$400.00$120.00400 mil

Simulador

Se este período rodasse em outro modelo

Sem dados de tokens no período selecionado.

Leaderboard

Qualidade × Segurança × Throughput × Custo

33 modelos
Qualidade ↑ maior melhorSegurança ↓ menor melhor (taxa de bloqueio)Throughput ↑ maior melhor (tokens/s)Custo ↓ menor melhor (suite Foundry)
ModeloProviderQualidade ↑Segurança ↓tok/s ↑Custo $ ↓
grok-4-fast-non-reasoningxAI0,6136,11%127$7,36
DeepSeek-V4-Flashna carteiraDeepSeek0,7231,50%91$7,51
gpt-5.4-nanoOpenAI0,640,61%177$8,78
grok-4-fast-reasoningxAI0,7324,72%58$13,57
grok-code-fast-1xAI0,6823,04%157$23,42
gpt-5-nanoOpenAI0,531,67%224$25,08
deepseek-v3.1DeepSeek0,6540,50%91$25,49
gpt-5.1-codex-miniOpenAI0,680,33%43$31,39
gpt-4.1-minina carteiraOpenAI0,5917,50%125$32,59
deepseek-v3-0324DeepSeek0,5841,83%60$40,88
gpt-5.4-minina carteiraOpenAI0,670,00%142$45,81
cohere-command-aCohere0,5138,98%33$66,46
gpt-4.1na carteiraOpenAI0,649,83%95$75,09
grok-4xAI0,5923,59%55$82,02
gpt-5.3-codexOpenAI0,682,04%23$88,88
o4-minina carteiraOpenAI0,692,33%52$90,40
claude-sonnet-4-6Anthropic0,745,84%46$95,63
o3-miniOpenAI0,614,83%131$98,67
gpt-5.1-codexna carteiraOpenAI0,740,33%33$101,43
Kimi-K2.5na carteiraMoonshot AI0,7612,17%75$110,79
gpt-4ona carteiraOpenAI0,557,33%65$114,75
o3OpenAI0,742,50%62$138,05
gpt-5.2-codexOpenAI0,750,18%32$145,71
gpt-5.1-codex-maxOpenAI0,640,69%86$153,18
gpt-5.1-chatOpenAI0,680,34%76$159,03
gpt-5.4na carteiraOpenAI0,811,02%21$164,92
gpt-5OpenAI0,741,09%69$215,93
Kimi-K2.6na carteiraMoonshot AI0,7919,42%135$234,91
gpt-5.2na carteiraOpenAI0,781,87%60$252,88
claude-opus-4-6Anthropic0,822,41%43$269,14
gpt-5.1OpenAI0,750,34%76$269,59
gpt-5.5OpenAI0,820,00%50$543,79
claude-opus-4-5Anthropic0,811,47%42$610,30

Dados copiados do quadro Comparar modelos do Azure AI Foundry. Custoé o "parâmetro de comparação" do Foundry — custo médio agregado da suite de benchmark, não é o preço por 1M tokens. Para preço real veja o catálogo acima ou o simulador.

TaskIQ / NATS

Workers de produção

classification runner: 1 execução por worker
worker-1gemini/gemini-flash-latest
worker-2gemini/gemini-flash-latest
worker-3gemini/gemini-flash-latest
worker-4openai/gpt-5.4-mini
worker-5openai/gpt-5.4-mini
worker-6openai/gpt-5.4-mini

Fallback legado

Rotas Vision / Classificação / Audiência

usado quando profiles de worker estiverem vazios ou para rotas fora do runner produtivo
Visionscreenshots e grid
Classificaçãotexto da publicação
Audiênciarota audiencia.py + plano
loading