4 · DAGs causais e o cálculo do do(·)
A aritmética da causalidade — por que P(Y|X) não é o mesmo que P(Y|do(X)), e como o Agente DET usa grafos acíclicos dirigidos para separar correlação espúria de efeito causal identificável.
4.0 · A causalidade como problema de identificação, não de medida
Antes de Pearl (e antes da revolução de credibilidade dos anos 1990 — Angrist & Pischke, 2009), parte da econometria tratava causalidade como subproduto de regressão bem-especificada: "controle pelo que importa, e o coeficiente torna-se causal". A virada conceitual foi reconhecer que controlar pelo conjunto errado de variáveis é pior do que não controlar — pode introduzir collider bias, fechar caminhos backdoor genuínos ou abrir caminhos espúrios. Causalidade, portanto, não é problema de mais dados ou mais precisão: é problema de identificação, ou seja, de saber quais variáveis ajustar antes de calcular qualquer coisa.
Esta é a contribuição estrutural dos DAGs (Directed Acyclic Graphs) de Pearl (1995, 2009): tornar visíveis os pressupostos causais sob a forma de arestas direcionadas, de modo que o conjunto de ajuste correto possa ser derivado do grafo (via critério backdoor ou do-calculus) em vez de adivinhado. Para uma fundação que decide alocar capital, isto não é detalhe técnico: é a diferença entre dizer "investimos onde havia mais OSCs e o Gini caiu" (correlação) e "investimos em municípios análogos e o Gini cairia 0,03 a mais" (efeito causal estimado).
“Data are profoundly dumb about causal questions. We need a model — a story about the world — to interpret them; otherwise, regressions are just pattern matching.”
4.1 · O salto epistêmico de Judea Pearl
Antes da revolução causal, a estatística aplicada vivia sob o teorema implícito de que "correlação é tudo que podemos medir; causa é metafísica". Pearl (2009) inverteu o jogo ao formalizar uma álgebra para intervenções: o operador do(·) distingue observação passiva de ação deliberada.
“A diferença entre ver e fazer é a diferença entre prever o que vai acontecer e prescrever o que deve ser feito. Modelos preditivos respondem à primeira pergunta; só modelos causais respondem à segunda.”
4.2 · DAG como linguagem de pressupostos
Um DAG (Directed Acyclic Graph) é, ao mesmo tempo, um modelo gráfico e um contrato epistêmico. Cada aresta X → Y declara: "a equipe acredita que existe um mecanismo pelo qual X afeta Y". A ausência de uma aresta é igualmente informativa — equivale a dizer "não há efeito direto".
4.3 · Backdoor, frontdoor e o critério de identificabilidade
Pearl provou que identificar um efeito causal a partir de dados observacionais depende da estrutura do DAG, não do tamanho da amostra. Os dois critérios canônicos são:
- Backdoor — bloqueia caminhos de confundimento condicionando num conjunto Z que (i) não contém descendentes de X e (ii) bloqueia todo caminho não-causal entre X e Y.
- Frontdoor — quando o backdoor é inviável (confundidores não medidos), procura-se um mediador M totalmente determinado por X que afete Y exclusivamente via o caminho X → M → Y.
4.4 · Implementação no motor causal
A tela /causal materializa estas ideias em três botões: Propor aresta, Rodar Granger e Validar identificabilidade. O último executa o algoritmo do-calculus em background; se o efeito for identificável, exibe a fórmula de ajuste. Caso contrário, devolve "ND" (não identificável) e bloqueia a inclusão do mecanismo no Score até que o Conselho aprove uma instrumental válida.
4.5 · Limites honestos
DAGs não substituem teoria — eles a tornam explícita e refutável. Um DAG mal especificado é apenas uma opinião desenhada. O ciclo de calibração trimestral existe justamente para que o Conselho revise pressupostos à luz de novas evidências.
Para aprofundar
- Causal Diagrams for Empirical Research — Judea Pearl (Biometrika, 1995) ↗Pearl · 1995
“The primary aim of this paper is to show how graphical models can be used as a mathematical language for integrating statistical and subject-matter information.”
Artigo seminal que introduz a notação do(·). PDF aberto. - Complete Identification Methods for the Causal Hierarchy ↗Shpitser & Pearl (JMLR) · 2008Algoritmo completo de identificabilidade. Implementação de referência usada no motor causal do agente.
- A General Identification Condition for Causal Effects ↗Tian & Pearl (AAAI) · 2002Condição geral antes do algoritmo completo de Shpitser. Útil para casos em que do-calculus parece travar.
- Causal Inference (NIPS Workshop) — Judea Pearl ↗Pearl · 2010Síntese acessível unificando potential outcomes, SCMs e diagramas.
- Causal Inference: What If — Hernán & Robins (Harvard, livro aberto) ↗Hernán & Robins · 2024Tratado de 600 páginas, gratuito, com aplicações epidemiológicas. Complemento brasileiro recomendado: capítulos 7–9.
- DAGitty — ferramenta web para desenhar e validar DAGs ↗Textor et al.Implementação JavaScript do algoritmo de identificabilidade. Útil para validar arestas antes de propor no agente.
- The Book of Why — Pearl & Mackenzie ↗Pearl & Mackenzie · 2018Versão acessível para conselheiros. Capítulos 1, 4 e 7 cobrem o essencial sem matemática.
- Microsoft DoWhy + EconML — toolkit de inferência causal ↗Microsoft ResearchPacotes Python open-source. Alternativa para auditores externos que queiram replicar análises do agente.