Preços do DeepSeek

Esta página fornece uma visão geral da estrutura oficial de preços da API DeepSeek. O site DeepSeek-Português é independente e não é afiliado à DeepSeek; os dados a seguir baseiam-se na documentação oficial. Lembre-se de que os preços podem mudar conforme a documentação oficial e devem ser verificados periodicamente.

Como funciona a cobrança por tokens no DeepSeek

A cobrança do DeepSeek é feita por tokens consumidos, em um sistema pay-as-you-go (pagamento conforme uso). Um token é a menor unidade de texto que o modelo reconhece – pode ser uma palavra, um número ou até mesmo um sinal de pontuação. Tanto os tokens de entrada (no prompt enviado ao modelo) quanto os tokens de saída (gerados na resposta do modelo) são contabilizados para fins de faturamento. Em outras palavras, você paga pelos tokens que enviar e pelos tokens que receber de volta.

O preço é normalmente expresso em dólares por milhão de tokens processados (US$/1M tokens). A DeepSeek adota uma lógica transparente: o custo de uso = (número de tokens de entrada × preço por token de entrada) + (número de tokens de saída × preço por token de saída). Não há mensalidades fixas ou planos de assinatura; você só paga pelos tokens que usar, deduzindo os gastos do crédito pré-pago na conta (com possíveis créditos iniciais grátis, conforme discutido adiante).

Entrada vs. saída e cache: A DeepSeek distingue tokens de entrada em duas categorias de cobrança: cache hit (acerto de cache) e cache miss (falta de cache). Isso se deve ao mecanismo de Context Caching da plataforma: se partes do prompt já tiverem sido processadas recentemente e puderem ser servidas do cache, esses tokens de entrada têm um custo significativamente menor. Já tokens de entrada inéditos (não em cache) custam o valor padrão completo. Os tokens de saída (gerados pelo modelo) sempre seguem uma tarifa separada fixa. Em resumo, tokens de entrada repetidos saem mais baratos (via cache), enquanto tokens de entrada novos e tokens de saída são cobrados nas respectivas taxas normais. Essa estrutura incentiva reutilizar contextos quando possível para economizar.

Preços por modelo

A DeepSeek oferece principalmente dois modelos na API, com preços específicos por token para cada um:

DeepSeek V3.2: modelo de uso geral (conversacional) de última geração, com suporte a contexto extenso (até 128 mil tokens de janela de contexto).
DeepSeek R1: modelo orientado a raciocínio (reasoning), introduzido anteriormente, focado em cadeias de pensamento e tarefas complexas.

A seguir, detalhamos o preço oficial da API por token para cada modelo, de acordo com a documentação:

DeepSeek V3.2 (modelo conversacional atual)

O DeepSeek V3.2 é o modelo padrão usado no chat e API atualmente, combinando alta eficiência e capacidade de raciocínio. Ele suporta janelas de contexto muito amplas (até 128k tokens) e modos de operação normal e pensante (thinking) integrados. Os custos por token para a API do V3.2 são os seguintes:

Tipo de token (V3.2)	Preço por 1M tokens
Entrada – cache hit (acerto)	US$ 0,028 por 1M tokens
Entrada – cache miss (não em cache)	US$ 0,28 por 1M tokens
Saída (tokens gerados)	US$ 0,42 por 1M tokens

Observação: Um cache hit ocorre quando o modelo reconhece que partes idênticas do prompt já foram calculadas recentemente, aplicando tarifa bem reduzida (US$0,028/M) nesses tokens de entrada repetidos. Para tokens de entrada novos (cache miss), aplica-se a tarifa padrão de US$0,28 por milhão. Os tokens de saída gerados pelo DeepSeek V3.2 custam US$0,42 por milhão, independentemente de cache. Esses valores posicionam o DeepSeek V3.2 como uma das opções mais acessíveis entre APIs de modelos de linguagem de última geração.

DeepSeek R1 (modelo de raciocínio)

O DeepSeek R1, também chamado de deepseek-reasoner nas configurações de API, é um modelo especializado em raciocínio aprofundado e cadeias de pensamento. Ele foi lançado antes da série V3 e possui um limite de contexto menor (tipicamente até 64k tokens). Por ser voltado a tarefas complexas, originalmente o R1 tinha custos um pouco diferentes. Segundo a documentação oficial de lançamento, os preços da API para o DeepSeek R1 são:

Tipo de token (R1)	Preço por 1M tokens
Entrada – cache hit (acerto)	US$ 0,14 por 1M tokens
Entrada – cache miss (não em cache)	US$ 0,55 por 1M tokens
Saída (tokens gerados)	US$ 2,19 por 1M tokens

Como mostra a tabela, no modelo R1 os tokens de entrada em cache custavam US$0,14/M e os novos US$0,55/M, enquanto os tokens de saída tinham um custo mais alto (US$2,19 por milhão). Esses valores refletiam o fato de o R1 executar raciocínios intensivos com cadeias de pensamento internas, tornando a geração de saída mais custosa.

Importante: A estrutura de preços da DeepSeek pode ser atualizada ao longo do tempo, especialmente quando novos modelos ou versões são introduzidos. O DeepSeek V3.2 passou a ser o modelo principal recomendado na documentação oficial, refletindo a política de preços vigente publicada na seção “Models & Pricing” da API. Os valores apresentados nesta página correspondem às tarifas oficiais documentadas no momento da última verificação. Caso ocorram revisões, reduções ou ajustes futuros, eles serão refletidos exclusivamente na documentação oficial da DeepSeek. Para obter números atualizados e definitivos, recomenda-se sempre consultar diretamente a página oficial de preços da API DeepSeek antes de tomar decisões financeiras ou técnicas.

Exemplos práticos de custo

Para entender melhor como a cobrança por tokens se traduz em gastos, veja três cenários hipotéticos de uso da API do DeepSeek e seus custos aproximados:

Exemplo com 1 milhão de tokens (DeepSeek V3.2):
Considerando as tarifas oficiais publicadas na documentação da API, o custo é calculado separadamente para tokens de entrada e tokens de saída.

Se um processamento utilizar 800.000 tokens de entrada (cache miss) e 200.000 tokens de saída, o cálculo seria:

• Entrada: 0,8 × US$0,28 = US$0,224
• Saída: 0,2 × US$0,42 = US$0,084

Custo total aproximado: US$0,308

Em um cenário com 1.000.000 de tokens de entrada (cache miss) e 1.000.000 de tokens de saída, o cálculo seria:

• Entrada: 1 × US$0,28 = US$0,28
• Saída: 1 × US$0,42 = US$0,42

Custo total aproximado: US$0,70 para 2 milhões de tokens processados.

Esses valores refletem exclusivamente as tarifas oficiais do modelo DeepSeek V3.2 publicadas na seção “Models & Pricing” da documentação da API. O custo real pode variar conforme a proporção de cache hit, cache miss e volume de saída gerado.

Pequena aplicação SaaS: Considere um pequeno aplicativo SaaS que integra o DeepSeek para responder perguntas dos usuários. Suponha que ele realize cerca de 1.000 consultas por dia, e que cada consulta envolva ~2.000 tokens (entre prompt e resposta). Isso totaliza ~2 milhões de tokens diários, ou aproximadamente 60 milhões de tokens por mês. Utilizando o modelo V3.2 sem cache significativo. Esse cálculo presume ~30 milhões de tokens de entrada e ~30 milhões de saída no mês (custos: 30 × $0,28 + 30 × $0,42 ≈ $8,4 + $12,6). Custo mensal estimado: aproximadamente US$21.

Chatbot corporativo: Agora imagine um chatbot de suporte interno em uma grande empresa, atendendo muitos funcionários ou clientes. Suponha um volume de 10.000 interações por dia, com cada conversa gastando em média 1.000 tokens (entre contexto e resposta detalhada). Isso equivale a ~10 milhões de tokens diários, ou cerca de 300 milhões de tokens por mês. Novamente com o DeepSeek V3.2, esse uso intenso resultaria em um Custo mensal estimado: aproximadamente US$105, considerando distribuição equilibrada entre tokens de entrada e saída (150M/150M).

Observação: Os exemplos acima são simplificações para ilustrar a ordem de grandeza dos custos. Na prática, o custo real dependerá do seu padrão de uso – proporção exata de tokens de entrada/saída, reutilização de contexto (cache), e modelo escolhido.

DeepSeek é gratuito?

A pergunta comum é: o DeepSeek pode ser usado de graça? A resposta depende da forma de uso:

Interface web e aplicativo: A DeepSeek disponibiliza uma interface pública de chat acessível por navegador e aplicativos móveis. De acordo com as informações publicamente divulgadas pela plataforma, o uso da interface de chat não exige assinatura paga para acesso básico. O modelo disponível na interface pode variar conforme atualizações internas da plataforma. O acesso é fornecido diretamente pela DeepSeek, sujeito aos termos de uso e eventuais limites operacionais definidos pela própria empresa (como controle de volume, estabilidade do serviço ou restrições temporárias em caso de alta demanda). Para informações detalhadas sobre funcionalidades, limites de uso ou mudanças no modelo disponibilizado na interface, recomenda-se consultar diretamente os canais oficiais da DeepSeek.
API para desenvolvedores: O acesso à API não é totalmente gratuito, mas a DeepSeek oferece um modelo generoso e sem mensalidade fixa. Desenvolvedores e empresas pagam apenas pelos tokens usados na API, conforme os preços por modelo já explicados. Não há cobrança de assinatura: o esquema é pay-as-you-go. Entretanto, para facilitar testes, novas contas de API recebem créditos gratuitos iniciais – a DeepSeek pode oferecer créditos promocionais iniciais para novas contas, conforme informado na documentação oficial vigente no momento do cadastro. Durante esse período de teste, também são liberados limites mais altos de requisições para você experimentar todos os recursos. Após consumir os créditos ou expirar o período trial, o uso da API passa a ser cobrado conforme as tarifas de token, descontando do saldo pago que você adicionar. Em resumo: o acesso público à interface de chat não exige assinatura paga no momento da última verificação, mas para integrar a IA em seus próprios sistemas via API, haverá custo por token (com direito a um trial inicial sem custo e a possibilidade de hospedar o modelo você mesmo, já que é open-source).
Código aberto e self-hosting: Um ponto a destacar é que os modelos DeepSeek (incluindo V3 e R1) são de código aberto e gratuitos para download. Isso significa que, em teoria, você pode rodar a IA por conta própria sem pagar pela API – porém, assumindo os custos de infraestrutura (servidores, GPUs, etc.) por sua conta. Essa opção é vantajosa para quem precisa de controle total e tem recursos computacionais, mas para a maioria dos usuários o caminho mais simples é usar o API hospedada pela DeepSeek, que cobra pelos tokens conforme vimos.

A execução local de modelos grandes como V3 ou R1 normalmente exige hardware especializado (GPUs com alta memória), o que pode representar custo significativo de infraestrutura.

Em suma, não existe um plano pago mensal tradicional para usuários finais do DeepSeek (ao contrário de ferramentas como ChatGPT Plus). O uso pessoal na interface pública não exige assinatura paga, estando sujeito aos termos de uso e eventuais limites operacionais definidos pela plataforma, enquanto a monetização da DeepSeek ocorre via cobrança de API a desenvolvedores e empresas, de forma transparente e bastante econômica por token.

Onde consultar os preços oficiais atualizados

Os detalhes de preços podem evoluir com novas versões de modelo e políticas da DeepSeek. Para verificar as informações mais atualizadas e oficiais sobre preços da API, recomenda-se consultar diretamente a documentação oficial:

Acesse a página de preços da API DeepSeek no site oficial (em inglês) para ver a tabela vigente de tarifas por modelo e tokens.
Consulte também a nossa seção de documentação da API (em português) para um resumo e links relevantes.

Mantemos este guia atualizado, mas confira sempre as fontes oficiais antes de tomar decisões, pois a DeepSeek pode ajustar os preços ou introduzir novos modelos a qualquer momento. Transparência é prioridade: qualquer alteração de preço é geralmente comunicada nas notas oficiais e refletida na documentação.