Anatomia do Agente em 9 Fases
Cada fase tem um output canônico, um responsável e um gate. As nove juntas formam o pipeline que distingue uma execução do agente de uma análise convencional.
3.0 · Por que nove fases (e não quatro, nem dezesseis)
A escolha por nove fases agrupadas em três blocos não é cosmética. Ela materializa um princípio metodológico explícito: separar o que entra (curadoria), como se infere causalidade(motor) e o que sai como decisão (saída executiva). Esta tripartição é a forma operacional do que Lasswell (1956) chamou de "policy sciences": toda decisão pública defensável deve ter cadeia visível de entrada → método → recomendação, com fronteiras nítidas entre as três. Quando essas fronteiras se borram — quando o método é ajustado para produzir uma recomendação desejada, ou quando a curadoria é manipulada para gerar um método favorável — a decisão deixa de ser pública e passa a ser preferência disfarçada.
Cada uma das nove fases produz um output canônico e atravessa um gate antes da próxima. Essa granularidade tem três funções simultâneas: (i) auditabilidade — um auditor externo pode parar em qualquer ponto e revisar; (ii) paralelização — fases independentes podem ser tocadas por equipes distintas; (iii) recuperabilidade — quando um erro é identificado, basta reverter à fase anterior, não ao início. Pipelines de menos fases (3 ou 4) economizam diagrama mas perdem rastreabilidade; pipelines de mais fases (15+) ganham granularidade e perdem legibilidade. Nove é o ponto onde, na nossa experiência operando o agente, o trade-off se equilibra.
“Decision processes can be analyzed as a sequence of distinct functional phases — intelligence, promotion, prescription, invocation, application, termination, appraisal — each requiring its own evidentiary standard.”
3.1 · Bloco curatorial (F1–F3)
O bloco curatorial estabelece o que entra no agente. Sua disciplina determina o teto de qualidade do que sai.
F1 · Atores
Curadoria assinada do conjunto de instituições, autores e fontes considerados legítimos para alimentar o agente. O Comitê Acadêmico revisa anualmente. Gate: ≥ 80% dos links DOI verificáveis.
F2 · Dados
Ingestão de oito bases oficiais (IBGE, CAGED, RAIS, INEP, DataSUS, SNIS, BCB SGS, PNAD). Cada série tem checksum, data de coleta e proprietário. Gate: cobertura ≥ 90% dos municípios brasileiros e zero registros em quarentena no fluxo final.
F3 · Curadoria
Aplicação de regras de qualidade: imputação documentada, normalização min-max no decil de topo, deduplicação por IBGE. Tudo o que é descartado fica registrado com motivo. Gate: auditor independente valida a tabela de exclusões.
3.2 · Bloco do motor causal (F4–F6)
F4 · DAG
Construção do grafo causal. Cada aresta é uma hipótese explícita sobre como uma variável influencia outra. Variáveis exógenas (SELIC, IPCA) → camada institucional (OSCs, Pobreza) → drivers do Score (Sev, Via, Esc, Pro) → saída (Score).
F5 · Estimação
Para cada aresta proposta, o operador roda Granger-causalidade com defasagem k apropriada, registra F-statistic e p-value, e atribui um e-value de sensibilidade (VanderWeele). O motor causal vive emsrc/lib/causal.ts.
F6 · Score
Cálculo da função canônica sobre o universo de 5.570 municípios.
Gate F6: hash de execução gerado e armazenado, variância do Top 10 entre cenários ≤ 0,15.
3.3 · Bloco da decisão (F7–F9)
F7 · Cenários
Banda Monte Carlo determinística sobre cada município do Top 50. σ adaptativo: σ = 0,18 + (1 − Pro) × 0,18 — quanto menor a prontidão, maior a incerteza. Gate: Monte Carlo n ≥ 10.000, trajetórias coerentes em validação cruzada.
F8 · Decisão
Aplicação dos gates §6.5 e classificação ICMA. Cada município do Top 10 recebe (a) classe sugerida — SBP, SLBP, GBP, CBP, Misto, Coalizão ou Endowment — e (b) recomendação executiva tipificada (piloto, programa, âncora).
F9 · Mapa
Apresentação executiva: Top 10 com banda P5–P95, classe ICMA, recomendação textual, racional curto, hash de execução embutido no PDF. Pronto para apresentação ao Conselho ou ao second-party opinion provider.
3.4 · A tabela canônica das 9 fases
3.5 · Aprofundamento didático · por que 9 fases (e não 5 ou 15)?
A escolha por nove fases não é arbitrária. Ela reflete três princípios herdados de literatura consolidada de engenharia de dados e de teoria de decisão sob restrição:
- Granularidade auditável (Kleppmann, 2017) — cada fase tem um output canônico que pode ser inspecionado por um auditor externo sem precisar entender o código. Menos fases ocultam decisões; mais fases criam sobrecarga cerimonial.
- Separação de preocupações (Raymond, 1999) — curadoria, motor causal e decisão são domínios cognitivos distintos. Misturá-los num mesmo passo é a principal fonte de "modelos que parecem funcionar mas ninguém entende por quê".
- Gates como contratos (dbt / Great Expectations) — cada transição entre fases carrega um teste explícito. Sem o gate, o pipeline ainda roda — mas o erro só aparece três passos depois, em forma de sintoma irreconhecível.
3.6 · O que vem nas próximas Partes
Os capítulos a seguir aprofundam, em ordem:
- Parte II — as quatro tradições teóricas que sustentam o motor (Pearl, Granger, North/Acemoglu/Ostrom, geografia ativa).
- Parte III — o motor metodológico em detalhe: função canônica, gates, banda, drift e calibração.
- Parte IV — mercado de capitais (ICMA, CVM, instrumentos jurídicos brasileiros).
- Parte V — manual operacional do app, tela por tela, com screenshots reais.
- Parte VI — governança, hash, auditoria externa.
Para aprofundar
- The Cathedral and the Bazaar — Eric Raymond ↗Raymond, ESR · 1999Clássico sobre arquitetura modular. Inspira a separação por fases com outputs canônicos.
- Data Pipelines Pocket Reference — O'Reilly ↗James Densmore · 2021Padrões canônicos de pipelines: ingestão, validação, transformação, materialização. Aplicáveis ao Agente DET fase a fase.
- Designing Data-Intensive Applications — Martin Kleppmann ↗Kleppmann · 2017Capítulos 10 (batch) e 11 (streaming) fundamentam a escolha de pipelines determinísticos com snapshot.
- Hidden Technical Debt in Machine Learning Systems (NeurIPS) ↗Sculley et al. (Google) · 2015Paper canônico sobre por que sistemas de ML/decisão exigem disciplina de engenharia, não só algoritmo. Justifica gates entre fases.
- FAIR Data Principles ↗GO FAIR InitiativeFindable, Accessible, Interoperable, Reusable. Pipeline do agente respeita os 15 sub-princípios.
- Apache Airflow — Documentação de DAGs ↗Apache FoundationImplementação de referência de DAGs operacionais. O agente reproduz a lógica em escala menor, sem dependência externa.
- dbt — Data Build Tool ↗dbt LabsPadrão moderno de transformação com testes (gates) entre etapas. Análogo aos gates §6.5 do agente.
- Great Expectations — Data Quality Framework ↗GX LabsPadrão para implementar gates de qualidade declarativos em pipelines de dados.