Como implementar DeepSeek na análise de dados com SQL, Power BI e Tableau

Q: Qual modelo DeepSeek usar em BI: V4 Flash ou V4 Pro?

Use deepseek-v4-flash como ponto de partida para tarefas previsíveis e de maior volume, como classificação, extração, explicações curtas e text-to-SQL bem delimitado. Use deepseek-v4-pro quando a tarefa exigir mais raciocínio, análise ambígua, agentes, validação de hipóteses ou reconciliação de regras complexas.

Q: Ainda devo usar deepseek-chat e deepseek-reasoner?

Para código novo, não. A documentação oficial informa que deepseek-chat e deepseek-reasoner são aliases temporários de compatibilidade para deepseek-v4-flash e serão descontinuados em 24/07/2026. Em novas integrações, use diretamente deepseek-v4-flash ou deepseek-v4-pro.

Implementar DeepSeek na análise de dados não significa ligar um modelo diretamente ao seu banco e torcer pelo melhor. Em um desenho tecnicamente crível, o modelo entra como camada de linguagem natural, classificação, síntese, geração assistida de consultas e raciocínio sobre uma stack que continua dependendo de SQL, camada semântica, regras de negócio, governança, BI e validação.

Este guia existe para quem já passou da fase “onde isso agrega valor?” e precisa responder outra pergunta: como colocar DeepSeek em um fluxo real com SQL, Power BI e Tableau sem transformar a arquitetura em uma demo frágil?

Também vale uma distinção importante logo no começo. Quando falamos em DeepSeek neste guia, estamos nos referindo aos serviços oficiais da DeepSeek, especialmente à camada de API. O deepseek-portugues.chat é um projeto independente, e o chat do site não deve ser confundido com a experiência oficial de web, app ou API. Se a sua necessidade ainda é entender cenários de negócio, passe antes pela página de casos de uso na análise de dados empresarial.

Resumo rápido

O padrão mais seguro é manter o modelo atrás de backend, middleware ou serviço interno, nunca como substituto da camada analítica principal.
Em SQL, o desenho mais robusto para text-to-SQL passa por catálogo de métricas, validação, execução read-only e pós-validação de resultado.
No Power BI, o encaixe mais útil costuma aparecer em dois lugares diferentes: enriquecimento em refresh com Power Query/dataflows e experiências interativas fora do refresh, via UX complementar ou embedded analytics.
No Tableau, os padrões mais práticos tendem a ser Dashboard Extensions, sidecars web e pipelines que gravam saídas estruturadas para consumo do próprio Tableau.
A API oficial da DeepSeek usa formato compatível com OpenAI/Anthropic, mantém o base_url principal em https://api.deepseek.com e, no ciclo DeepSeek‑V4 Preview, trabalha com deepseek-v4-flash e deepseek-v4-pro.
Os modelos V4 documentados têm contexto de 1M tokens, saída máxima documentada de 384K, suporte a JSON Output e Tool Calls, além de Thinking Mode controlável por parâmetro.
Em produção, custo, sigilo de credenciais, minimização de dados, revisão humana e observabilidade importam tanto quanto o prompt.

O que o DeepSeek realmente faz na análise de dados

Em projetos de analytics, o DeepSeek costuma cumprir quatro papéis técnicos principais. O primeiro é traduzir pergunta de negócio em um formato que o resto da stack consegue usar. O segundo é estruturar saída, por exemplo em resumos, classificações, justificativas curtas ou JSON pronto para outro sistema. O terceiro é explicar resultado, ajudando a transformar consulta e tabela em uma resposta compreensível. O quarto é operar como interface conversacional sobre contexto recuperado de documentos, métricas e dados já governados.

Esse enquadramento combina com a própria documentação oficial da API. A DeepSeek descreve uma API compatível com formatos OpenAI/Anthropic e orientada a integração em software; os termos da Open Platform tratam a plataforma como tecnologia de base para sistemas downstream; e a documentação separa a camada de API da experiência app/web. Para times de dados, isso é um bom sinal: o papel do modelo é ser componente da solução, não a solução inteira.

O que o DeepSeek não substitui

Ele não substitui o banco, o warehouse, a camada semântica, as políticas de acesso, o BI, o ETL, o versionamento de regras, nem a revisão analítica. Também não substitui o trabalho de explicitar métricas oficiais, chaves de negócio, relacionamentos e limites de uso.

Esse ponto parece básico, mas é exatamente onde muitos projetos derrapam. Quando o modelo recebe liberdade demais e contexto de menos, o resultado tende a ser uma interface elegante com pouca confiabilidade operacional. Em analytics, a boa prática continua sendo esta: o dado oficial fica na camada certa; o modelo ajuda a consultar, classificar, resumir, explicar e orquestrar.

Arquitetura real: onde o DeepSeek entra na stack

O desenho mais sólido é um fluxo em camadas. O usuário faz a pergunta. Um backend ou middleware identifica o tipo de tarefa. Em seguida, o sistema recupera contexto relevante: esquema, catálogo de métricas, regras de negócio, documentação, ou dados já preparados. Só então o DeepSeek recebe um prompt delimitado. A saída é validada e, se necessário, executada por uma camada controlada antes de voltar ao usuário final.

Esse padrão evita o erro clássico de transformar o modelo no orquestrador cego do ambiente inteiro. Também facilita logs, auditoria, masking, cache, controle de custo e revisão de prompts.

Objetivo	Padrão recomendado	Por que funciona	Risco se pular etapa
Responder sobre métricas	RAG sobre glossário, documentação e camada semântica	Reduz ambiguidade e melhora consistência	Resposta bonita, mas desalinhada da definição oficial
Gerar SQL	Text-to-SQL com catálogo, validação e execução read-only	Controla risco operacional	Consulta incorreta, cara ou perigosa
Enriquecer dados no Power BI	Power Query/dataflows ou pipeline externo	Cria processo repetível e refreshável	Segredo exposto ou uso inconsistente
Criar copiloto no relatório	UX web complementar, embedded ou extensão	Separa refresh de interação	Experiência confusa e difícil de governar
Leitura no Tableau	Dashboard Extension, sidecar ou tabela enriquecida	Adapta o padrão ao produto e ao consumo	Integração frágil e pouco reutilizável

DeepSeek com SQL: text-to-SQL, explicação de consultas e leitura de resultados

SQL é, quase sempre, o primeiro lugar onde times tentam usar LLMs em analytics. Faz sentido: muita pergunta de negócio já nasce perto de uma consulta. O problema é que “gerar SQL” parece simples até o momento em que a consulta precisa respeitar métricas oficiais, tabelas permitidas, janelas temporais, joins válidos, filtros obrigatórios e limites de custo.

Por isso, o padrão mais confiável para text-to-SQL não é “usuário pergunta, modelo executa”. O padrão mais confiável é “usuário pergunta, sistema recupera contexto, modelo propõe, uma camada valida, outra executa em modo read-only e o sistema devolve resultado + explicação”.

Pergunta do usuário → catálogo de métricas / esquema → SQL proposto → validação → execução read-only → resposta explicada

Na prática, isso costuma envolver pelo menos cinco guarda-corpos:

Catálogo de métricas e tabelas autorizadas. O modelo não deveria “adivinhar” nomes de colunas sensíveis ou regras comerciais.
Execução read-only. Mesmo quando o SQL é simples, o agente de execução não deve ter permissão de escrita.
Validação sintática e semântica. Verifique joins, agregações, filtros de data, granularidade e limites de linha.
Fallback humano ou bloqueio. Quando a ambiguidade for alta, é melhor pedir esclarecimento do que executar algo errado.
Explicação pós-consulta. Depois de obter o resultado, o modelo pode traduzir a saída em linguagem clara, mas a interpretação final deve respeitar a definição oficial das métricas.

Esse padrão também abre espaço para um uso muito útil e menos arriscado do que text-to-SQL pleno: explicação de consultas. Em vez de deixar o modelo gerar e executar tudo, você pode usá-lo para explicar SQL existente, documentar lógica, apontar ambiguidades e transformar resultado tabular em leitura executiva.

DeepSeek com Power BI

No Power BI, o erro mais comum é tentar resolver refresh, UX interativa, autenticação e copiloto no mesmo lugar. O resultado costuma ser um desenho difícil de manter. O caminho mais limpo é separar cenários.

Enriquecimento em refresh com Power Query e dataflows

Segundo a documentação da Microsoft sobre Power Query, essa é a camada usada para conexão, transformação e preparação de dados, e a lógica construída ali pode ser repetida e atualizada por refresh. Isso faz dela um bom encaixe para tarefas como rotulagem de texto, classificação de feedback, resumo curto de comentários, padronização de atributos e geração de campos estruturados que depois entram no modelo analítico.

O ponto técnico importante é que o Power Query favorece processos repetíveis, não experiências de chat. Em outras palavras: ele é ótimo para “enriquecer dados no refresh”, mas não é o melhor lugar para tentar construir um copiloto de sessão completo.

Web.Contents: quando serve e onde começam os limites

A função Web.Contents existe para buscar conteúdo da web e aceita opções como cabeçalhos e conteúdo de requisição. Isso significa que, em casos controlados, é tecnicamente possível chamar um endpoint HTTP dentro do fluxo.

Mas “é possível” não significa “é o padrão ideal”. Para produção, o desenho costuma ficar melhor quando a chamada não sai diretamente para a API final com segredos de longa duração espalhados no M. Se o caso crescer, o melhor desenho tende a ser um proxy interno, uma função server-side ou um serviço intermediário responsável por autenticação, logs, política de uso e masking.

Quando um custom connector faz mais sentido

A própria Microsoft descreve o Power Query SDK como um conjunto de ferramentas para criar conectores, também chamados de custom connectors ou extensões do Power Query. Isso faz sentido quando você precisa padronizar autenticação, centralizar comportamento, reutilizar a integração em múltiplos relatórios ou dataflows e reduzir a gambiarra de chamadas ad hoc.

Em times de dados maiores, um custom connector costuma ser mais sustentável do que repetir Web.Contents e lógica de autenticação em vários artefatos.

Experiências interativas com custom visual ou camada web complementar

Quando o objetivo é oferecer uma caixa de pergunta, explicar visualizações, sugerir filtros, resumir a página atual ou criar uma experiência conversacional, o padrão geralmente muda. Em vez de usar o refresh para simular interatividade, faz mais sentido uma camada web complementar ou um componente próprio falando com backend, com o Power BI entrando como superfície de visualização e contexto.

Experiências externas com embedded analytics

Se o produto precisa combinar relatórios, perguntas em linguagem natural, contexto do usuário, permissões e jornada própria, vale considerar Power BI Embedded. A documentação da Microsoft descreve esse padrão como forma de incorporar relatórios, dashboards e tiles em aplicações web e sites. Nesse desenho, você pode manter o relatório como relatório e colocar o copiloto ao redor dele, no app que você controla.

Esse padrão costuma ser mais flexível para produtos internos e externos do que tentar encaixar toda a inteligência dentro do relatório em si.

DeepSeek com Tableau

No Tableau, a pergunta não é “como fazer tudo dentro do dashboard?”, mas “qual parte do fluxo deve morar no dashboard e qual parte deve viver fora dele?”. A resposta muda conforme o caso.

Dashboard Extension

A documentação do Tableau sobre Dashboard Extensions mostra que é possível adicionar uma extensão diretamente ao dashboard e que uma extensão pode solicitar acesso a dados visíveis ou, em alguns casos, acesso mais amplo aos dados da pasta de trabalho. Isso faz das extensões um ponto natural para experiências contextuais, botões de ação, componentes de explicação e integrações leves de UX.

Há, porém, uma nuance operacional relevante na distribuição de conteúdo. A partir do Tableau Cloud 2026.1, exportações de imagem no Tableau Cloud passaram a suportar Viz Extensions, Dashboard Extensions e objetos Pulse em cenários como download de imagem, subscriptions e exportação via REST API. Entretanto, exportações em PDF e PowerPoint ainda não suportam esses objetos e podem aparecer em branco. Para quem distribui dashboards por assinatura, exportação ou snapshot estático, é importante validar o formato de saída antes de prometer que a experiência interativa será preservada integralmente.

App embarcado ou sidecar

Quando a experiência precisa de mais estado, conversação, autenticação própria, histórico, controle fino de permissões ou orquestração com outros sistemas, um sidecar web costuma ser mais simples de operar. Nesse desenho, o Tableau continua excelente para visualização; a conversa com o modelo acontece ao lado, em um app controlado por você.

Pipeline que grava saídas estruturadas para consumo do Tableau

Nem todo uso com Tableau precisa ser conversacional. Em muitos casos, o caminho mais eficiente é enriquecer dados antes: classificar comentários, gerar rótulos, criar resumos de texto, produzir sinais categóricos ou indicadores auxiliares. Depois, o Tableau consome essas saídas como qualquer outra tabela. É um padrão menos chamativo do que um chat, mas muitas vezes mais útil e mais barato.

Modelo, API e recursos que importam para BI

Hoje, a DeepSeek descreve a API oficial como compatível com formatos OpenAI/Anthropic. O base_url em formato OpenAI permanece https://api.deepseek.com, e os modelos atuais documentados para novas integrações são deepseek-v4-flash e deepseek-v4-pro. A DeepSeek também informa que os nomes legados deepseek-chat e deepseek-reasoner serão descontinuados em 24/07/2026 e, enquanto funcionam, apontam respectivamente para os modos non-thinking e thinking do deepseek-v4-flash.

Na prática, isso quer dizer que não é uma boa ideia iniciar projeto novo usando deepseek-chat ou deepseek-reasoner como recomendação principal. Use os nomes V4 diretamente e trate aliases antigos apenas como compatibilidade temporária.

Modelo atual	Quando costuma funcionar melhor em BI	Cuidados
`deepseek-v4-flash`	Classificação, extração, resumo curto, rotulagem, explicação objetiva de métricas, text-to-SQL bem delimitado e workloads de maior volume	Delimitar bem o contexto, validar saídas e usar Thinking Mode apenas quando o caso justificar
`deepseek-v4-pro`	Perguntas ambíguas, reconciliação de regras, análises mais longas, agentes, reasoning, validação de hipóteses e fluxos com maior exigência cognitiva	Controlar latência, custo, escopo da tarefa e necessidade de revisão humana

Para BI, três recursos oficiais merecem atenção:

JSON Output: útil quando o pipeline precisa de campos estruturados, parse previsível e validação antes de gravar a resposta.
Tool Calls: útil quando o modelo precisa solicitar a execução de funções controladas pelo backend, como consulta autorizada, busca em catálogo ou cálculo de métrica.
Thinking Mode: útil para tarefas mais ambíguas ou de raciocínio. No formato OpenAI, ele é controlado com extra_body={"thinking":{"type":"enabled"}}, e o esforço pode ser ajustado com reasoning_effort. Em Thinking Mode, parâmetros como temperature, top_p, presence_penalty e frequency_penalty não têm efeito.

Exemplo simplificado para uma tarefa estruturada de analytics usando o nome atual do modelo:

from openai import OpenAI
import os, json

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {
            "role": "system",
            "content": "Responda em json. Classifique o comentário em sentimento, tema e prioridade."
        },
        {
            "role": "user",
            "content": "Cliente reclamou que o relatório de vendas demora para carregar."
        }
    ],
    response_format={"type": "json_object"},
    extra_body={"thinking": {"type": "disabled"}}
)

dados = json.loads(response.choices[0].message.content)

Para uma visão editorial em português sobre modelos e nomenclatura, use também a página de modelos DeepSeek, a nossa documentação da API e a página de preços.

Custo e segurança em workloads analíticos

Custo em analytics raramente depende só do preço por token. Ele depende do desenho inteiro: quantidade de contexto recuperado, frequência de uso, tamanho médio de prompt, volume de saída, taxa de cache, necessidade de reprocessamento e número de usuários. Ainda assim, a tabela oficial de preços ajuda a calibrar a conta: a cobrança é por 1 milhão de tokens e varia por modelo, cache hit, cache miss e saída.

Modelo	Input cache hit	Input cache miss	Output	Observação
`deepseek-v4-flash`	US$ 0.0028 / 1M tokens	US$ 0.14 / 1M tokens	US$ 0.28 / 1M tokens	Opção econômica para alto volume
`deepseek-v4-pro`	US$ 0.003625 / 1M tokens	US$ 0.435 / 1M tokens	US$ 0.87 / 1M tokens	Preço com desconto oficial de 75% vigente até 31/05/2026 15:59 UTC

Esses valores foram verificados em 2 de maio de 2026, mas a própria DeepSeek informa que preços podem variar e recomenda consultar regularmente a página oficial. Em projeto real, estime custo por cenário: classificação de comentários, sumarização de tickets, text-to-SQL, explicação de dashboard, agente com ferramentas e análise de documentos longos têm perfis de token muito diferentes.

Outro ponto importante para BI é o Context Caching. A documentação oficial informa que o cache é habilitado por padrão e que requests com prefixos sobrepostos podem gerar cache hit. Em analytics, isso pode ajudar quando vários usuários ou jobs reutilizam o mesmo glossário, catálogo de métricas, documentação ou trecho longo de contexto. Ainda assim, o cache é best-effort e não deve ser tratado como garantia absoluta de economia.

Segurança segue a mesma lógica pragmática. Os termos da Open Platform dizem para manter a API key segura e não expô-la em browser ou outro código client-side. Já a política oficial de privacidade informa que a DeepSeek pode coletar inputs, arquivos enviados, feedback e histórico de chat, e que dados pessoais podem ser processados e armazenados na República Popular da China para prestação dos serviços. Em aplicações downstream, o próprio desenvolvedor precisa divulgar suas regras de tratamento aos usuários finais.

Em analytics, isso se traduz em escolhas objetivas: minimizar payload, preferir visões curadas, mascarar dados quando possível, registrar chamadas críticas, separar ambientes, classificar o que pode sair da empresa e não usar o modelo como atalho para burlar governança. Se o seu projeto encosta em dados mais sensíveis, vale complementar a leitura com a página de Segurança.

Boas práticas para produção

Comece pelo caso de uso, não pelo modelo. Defina primeiro a tarefa: classificar, resumir, explicar, responder, gerar SQL, enriquecer texto.
Use os nomes atuais da API. Para código novo, prefira deepseek-v4-flash ou deepseek-v4-pro. Não trate deepseek-chat e deepseek-reasoner como base de implementação nova.
Centralize credenciais no backend. O modelo deve ser chamado por um serviço controlado sempre que o caso exigir segurança, logs ou política de uso.
Trabalhe com dados mínimos. Envie o menor contexto possível para cumprir a tarefa.
Use saídas estruturadas quando fizer sentido. JSON bem definido facilita validação, persistência e consumo por BI.
Separe exploração de produção. O que funciona no notebook ou no relatório de teste nem sempre deve chegar do mesmo jeito ao ambiente produtivo.
Monitore erro e deriva. Classificações, clusters e respostas sobre métricas precisam de revisão periódica.
Desenhe fallback. Quando o sistema não tiver contexto suficiente, ele deve pedir clarificação, bloquear ou encaminhar para revisão.

Erros comuns em projetos de BI com LLM

O primeiro erro é pular a camada semântica. Sem definição oficial de métrica, o text-to-SQL vira loteria elegante.

O segundo erro é colocar segredo onde não deveria ficar. Quando a integração espalha credenciais por artefatos de front ou scripts frágeis, o projeto nasce com dívida operacional.

O terceiro erro é misturar refresh e UX. Power Query é excelente para enrichment repetível; não é, por definição, a melhor casa de um copiloto completo de sessão.

O quarto erro é insistir em “tudo dentro do dashboard” quando um sidecar ou app embarcado resolveria melhor autenticação, histórico e contexto.

O quinto erro é achar que modelo melhor substitui guarda-corpo. Em analytics, boas restrições quase sempre valem mais do que liberdade irrestrita.

O sexto erro, agora muito importante, é manter exemplos antigos com deepseek-chat, deepseek-reasoner, V3.2 ou contexto de 128K como se fossem o estado atual da API. Para conteúdo, documentação e código novo, atualize para DeepSeek‑V4 Preview e explique os aliases antigos apenas como compatibilidade temporária.

Conclusão

Implementar DeepSeek do jeito certo em SQL, Power BI e Tableau depende menos de entusiasmo com o modelo e mais de arquitetura. Quando a empresa separa bem dado oficial, recuperação de contexto, execução controlada, UX e segurança, o modelo deixa de ser uma promessa vaga e vira componente útil de analytics.

Em 2026, a recomendação prática é simples: use deepseek-v4-flash para volume, velocidade e tarefas bem delimitadas; use deepseek-v4-pro quando a análise exigir mais raciocínio, agentes ou validação complexa; e mantenha os aliases antigos apenas como nota de migração.

Se você ainda está no momento de mapear aplicações por área, volte para a página de casos de uso. Se a decisão já é de adoção, combine este guia com a leitura de Soluções com DeepSeek, da documentação da API, da página de preços e da FAQ.

Perguntas frequentes

Posso conectar o DeepSeek diretamente ao meu banco de dados?

O padrão mais seguro não é conexão direta e irrestrita. Em geral, o melhor desenho usa backend ou middleware para recuperar contexto, validar a tarefa e executar consultas em modo read-only, com escopo e permissões controlados.

Como implementar text-to-SQL com segurança?

Comece com catálogo de métricas e tabelas permitidas, recupere esse contexto antes do prompt, valide a consulta proposta, execute apenas em leitura e registre a operação. Quando a ambiguidade for alta, o sistema deve pedir esclarecimento ou bloquear a execução.

Posso chamar a API do DeepSeek direto do Power Query?

Em casos controlados, o Power Query consegue chamar endpoints HTTP com Web.Contents. Mas, para produção, costuma ser melhor usar um proxy interno, função server-side ou conector dedicado, para não espalhar credenciais e regras de uso em vários artefatos.

Quando um custom connector faz mais sentido?

Quando você precisa padronizar autenticação, reutilizar a integração em vários relatórios ou dataflows, centralizar comportamento e reduzir manutenção. É o caminho mais sustentável quando a integração deixa de ser pontual.

Qual padrão funciona melhor no Tableau?

Depende do objetivo. Dashboard Extensions funcionam bem para experiências contextuais dentro do dashboard. Sidecars web funcionam melhor quando a experiência precisa de histórico, autenticação própria ou mais estado. Para muitos casos, enriquecer dados antes e deixar o Tableau consumir a saída estruturada é o desenho mais eficiente.

Qual modelo DeepSeek usar em BI: V4 Flash ou V4 Pro?

Use deepseek-v4-flash como ponto de partida para tarefas previsíveis e de maior volume, como classificação, extração, explicações curtas e text-to-SQL bem delimitado. Use deepseek-v4-pro quando a tarefa exigir mais raciocínio, análise ambígua, agentes, validação de hipóteses ou reconciliação de regras complexas.

Ainda devo usar deepseek-chat e deepseek-reasoner?

Para código novo, não. A documentação oficial informa que deepseek-chat e deepseek-reasoner são aliases temporários de compatibilidade para deepseek-v4-flash e serão descontinuados em 24/07/2026. Em novas integrações, use diretamente deepseek-v4-flash ou deepseek-v4-pro.