Metodologia de Validação de Claims

Esta nota descreve o método comum usado para sustentar os documentos canónicos de:

25-rastreabilidade
achievable-maturity
50-ameacas-mitigadas

O objetivo não é substituir o juízo técnico dos autores, mas tornar explícito e auditável como as claims destes documentos foram revistas, validadas, limitadas quando necessário e corrigidas.

1. Baseline empírica dos autores

O ponto de partida do manual é uma baseline empírica e construída pelos autores.

Isto significa que:

a estrutura dos capítulos foi construída pelos autores com base em prática real de AppSec, DevSecOps, governance e operações
os controlos, exemplos, addons e fluxos de aplicação não foram gerados automaticamente a partir de frameworks externos
a semântica base do manual precede e orienta o mapeamento externo, e não o contrário

Por isso, os documentos canónicos não devem ser lidos como mera conversão mecânica de frameworks para texto editorial.

2. Validação por chunking semântico e backtrace ontológico

Depois da baseline empírica, as claims foram revistas com apoio do knowledge-graph V2.

A validação usa, entre outros, estes artefactos:

ontology_discovery_units.jsonl
canonical_chunks.jsonl
índices semânticos derivados do manual completo
runtime e overlay publicados no knowledge-graph

Na prática, isto permite:

localizar unidades normativas relevantes por capítulo
verificar se uma claim editorial tem backtrace para headings, addons, lifecycle stories ou catálogos concretos
distinguir entre presença explícita, presença semântica, presença parcial e ausência real

3. Comparação com fontes externas mapeadas

As claims do manual foram ainda confrontadas com pilotos e artefactos do repositório external-sources-inventory.

Dependendo do tipo de documento, foram usados outputs como:

appsec_core_normalization.json
manual_gap_analysis.json
published_manual_traceability_cluster_comparison.*
comparações publicadas de surface de ameaças
overlays regulatórios publicados (DORA, NIS2, CRA, RGPD)

Este passo não serve para "fazer o manual igual às fontes", mas para:

validar se a claim editorial é materialmente suportada
identificar claim gaps
identificar cross-reference gaps
separar content gap real de scope boundary

4. Regra de leitura por tipo de documento

`25-rastreabilidade`

Aqui a pergunta principal é:

que frameworks ou fontes externas este capítulo suporta
e com que tipo de cobertura

As claims devem ser classificadas explicitamente, por exemplo como:

Explícito
Semântico
Parcial
Reparação
Gap
Scope boundary, quando aplicável

`achievable-maturity`

Aqui a pergunta principal é:

se este capítulo for implementado como escrito, que postura de maturidade é credível atingir

A leitura deve ser limitada e explícita. Em particular:

SAMM e DSOMM são fontes primárias
SLSA só deve ser usado onde fizer sentido como progressão de build/integridade
alinhamento regulatório não deve ser tratado como score de maturidade

`50-ameacas-mitigadas`

Aqui a pergunta principal é:

que famílias de ameaça ou attack pattern este capítulo mitiga
e se a mitigação é forte, parcial ou dependente de outros capítulos

A leitura deve ser feita sobretudo com base em:

superfícies de ameaça do próprio manual
CAPEC
CWE apenas como suporte limitado, não como substituto de taxonomia de threat

5. O que o método evita

Este método existe precisamente para evitar quatro erros editoriais frequentes:

promover presença semântica fraca a cobertura completa
confundir alinhamento regulatório com maturidade
confundir frameworks de prática com catálogos de ameaça
apagar a baseline empírica dos autores em favor de uma reconstrução puramente framework-driven

6. Fórmula editorial resumida

A regra usada deve ser lida assim:

baseline empírica dos autores
revisão por chunking semântico e ontology backtrace
confronto com pilotos e fontes externas mapeadas
exposição explícita de claims limitadas, parciais ou em reparação

7. Regra curta para usar nos documentos canónicos

Sempre que um documento 25-rastreabilidade, achievable-maturity ou 50-ameacas-mitigadas fizer uma claim material, a leitura correta deve ser:

existe uma baseline empírica no manual
a claim foi confrontada com os índices semânticos do knowledge-graph
a claim foi revista face às fontes externas relevantes para esse tipo de documento
a claim é exposta como explícita, semântica, parcial, em reparação ou fora de âmbito

8. Conclusão

Os documentos 25-rastreabilidade, achievable-maturity e 50-ameacas-mitigadas devem ser lidos como artefactos editoriais validados, não como tabelas geradas automaticamente.

O método combina:

autoria empírica do manual
validação factual por índices semânticos
comparação estruturada com fontes externas
disciplina explícita de boundary e de claim calibration

1. Baseline empírica dos autores​

2. Validação por chunking semântico e backtrace ontológico​

3. Comparação com fontes externas mapeadas​

4. Regra de leitura por tipo de documento​

25-rastreabilidade​

achievable-maturity​

50-ameacas-mitigadas​

5. O que o método evita​

6. Fórmula editorial resumida​

7. Regra curta para usar nos documentos canónicos​

8. Conclusão​

1. Baseline empírica dos autores

2. Validação por chunking semântico e backtrace ontológico

3. Comparação com fontes externas mapeadas

4. Regra de leitura por tipo de documento

`25-rastreabilidade`

`achievable-maturity`

`50-ameacas-mitigadas`

5. O que o método evita

6. Fórmula editorial resumida

7. Regra curta para usar nos documentos canónicos

8. Conclusão