DeepSeek V3.1: modelo híbrido, recursos e status

Resposta direta: o DeepSeek V3.1 foi lançado em 21 de agosto de 2025 como um modelo híbrido capaz de operar em Thinking e Non-Thinking. O checkpoint publicado tem 671 bilhões de parâmetros totais, 37 bilhões ativados por token e contexto documentado de 128K. O modelo ganhou uma revisão chamada DeepSeek-V3.1-Terminus em 22 de setembro de 2025.

O V3.1 fez parte da API oficial quando foi lançado, mas não é um identificador disponível na API hospedada da DeepSeek na verificação de 19 de julho de 2026. Para uma nova integração oficial, os IDs documentados são deepseek-v4-flash e deepseek-v4-pro. Os pesos do V3.1 continuam publicados para pesquisa e implantação própria.

Status verificado do DeepSeek V3.1

Lançamento: 21 de agosto de 2025.
Revisão posterior: DeepSeek-V3.1-Terminus, anunciada em 22 de setembro de 2025.
API no lançamento: os aliases deepseek-chat e deepseek-reasoner entregavam, respectivamente, os modos sem raciocínio e com raciocínio do V3.1.
API oficial em 19 de julho de 2026: V3.1 e V3.1-Terminus não aparecem como IDs hospedados. Os IDs listados são deepseek-v4-flash e deepseek-v4-pro.
Pesos publicados: DeepSeek-V3.1, DeepSeek-V3.1-Base e DeepSeek-V3.1-Terminus permanecem disponíveis nos repositórios oficiais, sob licença MIT.

Este é um guia independente em português. Ele não é uma página oficial da DeepSeek nem oferece suporte para contas, cobranças ou chaves de API.

O que é o DeepSeek V3.1?

DeepSeek-V3.1 é um modelo de linguagem Mixture-of-Experts da linhagem DeepSeek V3. Ele foi pós-treinado sobre o DeepSeek-V3.1-Base e reuniu dois comportamentos no mesmo conjunto de pesos: um modo que inicia a geração com raciocínio e outro que produz a resposta sem essa etapa.

A proposta híbrida é o ponto que diferencia o V3.1 de lançamentos anteriores que separavam com mais nitidez o modelo de chat do modelo voltado a raciocínio. A alternância não ocorre pela troca de checkpoint: na distribuição aberta, ela depende do chat template usado para formatar a conversa.

Item	Especificação oficial	Como interpretar
Nome do checkpoint	`deepseek-ai/DeepSeek-V3.1`	Nome usado no repositório oficial de pesos.
Arquitetura	Mixture-of-Experts da família V3	Nem todos os parâmetros são ativados para cada token.
Parâmetros totais	671B	Dimensão total declarada para o modelo.
Parâmetros ativados por token	37B	Parcela ativada durante o processamento de cada token.
Contexto documentado	128K	Limites reais de entrada e saída ainda dependem do runtime ou provedor.
Modos	Thinking e Non-Thinking	A distribuição aberta alterna os modos por meio do chat template.
Distribuições	Base, pós-treinada e Terminus	Cada checkpoint tem finalidade e comportamento próprios.
Licença	MIT para o repositório e os pesos	Não significa que o chat, a API e todos os ativos da DeepSeek tenham a mesma licença.

Como funcionam Thinking e Non-Thinking?

O V3.1 é híbrido porque um único checkpoint aceita dois templates de conversa. No template oficial, o modo Thinking inicia a nova resposta com o marcador <think>. O modo Non-Thinking usa </think> antes do conteúdo da resposta, indicando que a geração deve seguir sem o bloco de raciocínio.

Em conversas com várias rodadas, o template oficial descarta o conteúdo de raciocínio das respostas anteriores e mantém a resposta final no histórico. Isso é diferente de armazenar ou reenviar indiscriminadamente todos os passos internos. Quem executa os pesos precisa seguir o tokenizer e o template fornecidos com o checkpoint, porque um formato incompatível pode mudar o comportamento do modelo.

Modo	Uso prático	O que validar
Non-Thinking	Respostas diretas, classificação, extração, transformação de texto e tarefas simples.	Precisão, aderência ao formato, latência e consistência.
Thinking	Problemas de várias etapas, matemática, código, planejamento e tarefas com ferramentas.	Qualidade final, consumo de tokens, tempo de resposta e verificabilidade.

Essas indicações não garantem que um modo vencerá o outro em todo prompt. O correto é construir um conjunto de testes do próprio produto e comparar a resposta final, não apenas o tamanho do raciocínio produzido.

V3.1-Base, V3.1 e V3.1-Terminus

Os três nomes representam checkpoints relacionados, mas não intercambiáveis.

Checkpoint	Papel	Indicação
DeepSeek-V3.1-Base	Checkpoint base construído sobre o V3, com treinamento adicional para contexto longo.	Pesquisa, avaliação de arquitetura e pós-treinamento próprio.
DeepSeek-V3.1	Versão pós-treinada com os modos Thinking e Non-Thinking, uso de ferramentas e comportamento conversacional.	Avaliação aplicada, chat e experimentos com agentes.
DeepSeek-V3.1-Terminus	Revisão posterior do V3.1 que tratou relatos de mistura entre chinês e inglês, caracteres anormais e desempenho de agentes.	Reprodução da etapa final da família V3.1 e comparação com o V3.2-Exp.

O cartão oficial do V3.1 informa que o checkpoint Base foi construído por extensão de contexto em duas fases. A fase de 32K foi ampliada para 630 bilhões de tokens e a fase de 128K para 209 bilhões. O V3.1 pós-treinado foi criado sobre essa base, adicionando o comportamento de conversa, raciocínio e uso de ferramentas.

Ferramentas e agentes

A DeepSeek apresentou o V3.1 com melhorias de pós-treinamento para chamadas de ferramentas e tarefas de agentes em várias etapas. Isso descreve a capacidade do modelo de decidir quando produzir uma chamada estruturada e continuar o fluxo depois que a aplicação retorna o resultado.

O modelo não executa ferramentas sozinho. A aplicação continua responsável por declarar funções, validar argumentos, aplicar permissões, executar o código e devolver o resultado ao modelo. Para ações com efeito externo — como enviar mensagens, alterar dados ou fazer compras — adote aprovação humana, registros e limites explícitos.

O que os benchmarks oficiais mostram?

Os resultados publicados pela DeepSeek indicam diferenças importantes entre os dois modos. A seleção abaixo usa os números do cartão oficial do modelo.

Benchmark	V3.1 Non-Thinking	V3.1 Thinking	R1-0528
MMLU-Pro (EM)	83,7	84,8	85,0
GPQA-Diamond (Pass@1)	74,9	80,1	81,0
LiveCodeBench (Pass@1)	56,4	74,8	73,3
AIME 2025 (Pass@1)	49,8	88,4	87,5
Aider-Polyglot	68,4	76,3	71,6

Esses são testes divulgados pelo próprio desenvolvedor, não uma auditoria independente deste site. Os resultados de agentes também dependem de ferramentas, prompts e frameworks de avaliação. Portanto, não use a tabela como promessa de qualidade em português, custo ou desempenho em produção.

O DeepSeek V3.1 ainda está na API oficial?

Não como ID hospedado na data de verificação. Em agosto de 2025, a DeepSeek associou deepseek-chat ao modo Non-Thinking do V3.1 e deepseek-reasoner ao modo Thinking. Esses aliases descreviam o serviço daquele lançamento, não IDs fixos que garantiam o V3.1 para sempre.

Na documentação verificada em 19 de julho de 2026, os modelos hospedados são deepseek-v4-flash e deepseek-v4-pro. Os aliases antigos encaminham temporariamente para os modos Non-Thinking e Thinking do V4 Flash e têm encerramento programado para 24 de julho de 2026 às 15:59 UTC.

Se o objetivo é iniciar uma aplicação na API oficial, consulte o guia da API DeepSeek e use um ID listado na documentação do serviço. Não envie DeepSeek-V3.1 como valor de model esperando que a API oficial aceite o nome do checkpoint.

Pesos publicados e implantação própria

O checkpoint do V3.1 continua útil para equipes que precisam reproduzir resultados, estudar os templates híbridos ou operar o modelo em infraestrutura própria. A página oficial disponibiliza os pesos e descreve execução com runtimes compatíveis.

Leia o cartão do modelo e confirme o checkpoint exato: Base, V3.1 pós-treinado ou Terminus.
Use o tokenizer e o chat template do mesmo checkpoint; não copie um template de outra versão.
Planeje paralelismo, memória, armazenamento, observabilidade e capacidade de recuperação antes do download.
Teste os dois modos com prompts reais e registre a versão do runtime, a configuração e o commit usado.
Valide licença, segurança, dados processados e obrigações do ambiente de implantação.

Embora apenas 37B parâmetros sejam ativados por token, o conjunto completo de 671B ainda precisa ser armazenado e servido. “Ativos por token” não equivale a “modelo de 37B” nem torna a execução adequada a um computador comum.

O V3.1 é open source?

A formulação mais precisa é: a DeepSeek publicou o repositório e os pesos do DeepSeek-V3.1 sob licença MIT. Por isso, o modelo pode ser descrito como uma versão de pesos publicados ou open-weight. A licença do checkpoint não transforma automaticamente a API hospedada, o aplicativo, o site, os dados de treinamento, nomes ou marcas em componentes de código aberto.

Quem redistribui, modifica ou oferece o modelo deve ler o arquivo de licença do checkpoint e também as regras aplicáveis ao produto, aos dados e ao local de operação. Este guia não substitui análise jurídica.

Como avaliar o DeepSeek V3.1 em português

As fontes oficiais não publicam uma garantia específica de qualidade para português do Brasil ou português de Portugal. A decisão deve se apoiar em testes próprios que representem o público e a tarefa.

Variedade linguística: teste PT-BR e PT-PT separadamente, com vocabulário, tratamento e ortografia esperados.
Fidelidade: use perguntas com resposta conhecida e marque erros factuais, omissões e invenções.
Instruções: meça se o modelo respeita formato, tamanho, tom e restrições.
Documentos longos: distribua evidências em diferentes posições e confirme se a resposta cita o trecho correto.
Modos: compare Thinking e Non-Thinking com os mesmos casos, sem escolher apenas os exemplos favoráveis.

Quando o DeepSeek V3.1 ainda faz sentido?

Objetivo	Escolha indicada	Motivo
Nova integração com a API oficial	Modelos hospedados V4	São os IDs documentados para o serviço na data de verificação.
Estudar a origem do modo híbrido	DeepSeek-V3.1	O checkpoint documenta a alternância Thinking/Non-Thinking por template.
Reproduzir a revisão final da linha V3.1	V3.1-Terminus	Inclui os ajustes posteriores de consistência e agentes.
Pesquisar atenção esparsa em contexto longo	DeepSeek V3.2-Exp	Foi a etapa que introduziu o DSA sobre o Terminus.
Implantação própria	Checkpoint compatível com sua infraestrutura	Exige avaliação de hardware, runtime, licença e qualidade.

Limitações e cuidados

O V3.1 pode produzir informações incorretas; verifique fatos, cálculos, referências e código antes do uso.
Contexto de 128K não garante que todos os detalhes serão recuperados com a mesma precisão.
Resultados de benchmark não estimam automaticamente desempenho no seu idioma ou domínio.
Tool calling exige um executor externo com validação, permissões e tratamento de falhas.
Não envie segredos, credenciais ou dados pessoais a um serviço sem entender sua política e sua arquitetura de armazenamento.
Uma oferta de terceiros com o nome V3.1 pode ter quantização, contexto, template, preço e política diferentes do checkpoint oficial.

Perguntas frequentes

DeepSeek V3.1 é um modelo atual da API oficial?

Não como ID hospedado na verificação de 19 de julho de 2026. Os IDs oficiais listados são deepseek-v4-flash e deepseek-v4-pro.

O V3.1 teve API quando foi lançado?

Sim. No lançamento, deepseek-chat entregava o modo Non-Thinking e deepseek-reasoner o modo Thinking do V3.1. Esses aliases mudaram de versão depois.

Qual é a diferença entre V3.1 e V3.1-Terminus?

Terminus é uma revisão posterior que preservou a proposta do V3.1 e tratou consistência de idioma, caracteres anormais e desempenho de Code Agent e Search Agent.

Qual é a janela de contexto do V3.1?

O cartão oficial documenta 128K para DeepSeek-V3.1 e DeepSeek-V3.1-Base. Um provedor pode aplicar limites próprios.

Posso executar o V3.1 localmente?

Os pesos e orientações de execução estão publicados, mas o modelo é de grande porte e exige infraestrutura especializada. Quantizações de terceiros não são equivalentes garantidas ao checkpoint oficial.

A licença MIT cobre a API da DeepSeek?

Não. A licença MIT indicada no cartão cobre o repositório e os pesos publicados. O uso da API hospedada segue os termos e políticas do serviço.

Conclusão

O DeepSeek V3.1 é relevante por ter reunido Thinking e Non-Thinking em um único checkpoint de 671B parâmetros totais, com 37B ativados por token e contexto documentado de 128K. O V3.1-Terminus refinou essa etapa antes da introdução do DSA no V3.2-Exp.

Para pesquisa e implantação própria, os pesos MIT continuam sendo o recurso central. Para uma integração nova na API oficial, use os IDs V4 documentados e consulte a visão geral de modelos DeepSeek antes de escolher.

DeepSeek V3.1: modelo híbrido, recursos e status da API