Anexo Técnico — Especificação do Motor de Classificação PF/PJ

Detalhamento operacional da lógica de decisão e origens de dados.


De onde vêm os dados?

Cada sinal do motor tem uma origem específica. A tabela abaixo descreve a fonte de cada um e quem é responsável por supri-lo:

SinalQuem supre
DocumentalSEFAZ via integração do banco
Identidade do FavorecidoOpen Finance com consentimento do usuário
Categoria FiscalO próprio banco — taxonomia interna construída e mantida pela engenharia
AfinidadeReceita Federal via API, ou onboarding do usuário informando CNAE
RecorrênciaO próprio banco — histórico nativo de transações do cliente
Contexto de GastoBandeira do cartão ou infraestrutura de pagamento — MCC atribuído na transação
HorárioMetadado nativo da própria transação

Três sinais são completamente nativos — Recorrência, Contexto de Gasto e Horário.
O banco já tem acesso sem depender de nenhuma integração externa.
Dois dependem de integração externa — Documental e Identidade do Favorecido.
Um depende de dado do usuário ou consulta externa — Afinidade.
Um é construído internamente uma vez e opera de forma permanente — Categoria Fiscal.


O que o usuário pode personalizar?

O usuário opera na camada de override — ele pode sobrepor qualquer decisão do sistema, mas não edita a lógica base. A tabela abaixo descreve o que pode ser personalizado e os limites de cada ação:

PersonalizaçãoComo funcionaLimite
Regras por favorecido"Posto Shell → sempre PJ"Soberana — sobrepõe todos os sinais
Regras por valor"Acima de R$ 500 → sugerir PJ"Sobrepõe sinais do sistema
Regras por recorrência"Todo pagamento mensal para esse CNPJ → PJ"Sobrepõe sinais do sistema
Reclassificação manualAlterar qualquer transação já classificadaCorrige pontualmente, não cria regra
Confirmação ou rejeiçãoAceitar ou recusar classificação de média confiançaAlimenta aprendizado do sistema
Criação de regra a partir de padrãoAceitar sugestão do sistema de transformar hábito em regraAutomatiza comportamento validado

O que o usuário não pode personalizar diretamente: a taxonomia da Categoria Fiscal, a hierarquia de sinais e os critérios de convergência. Esses elementos são camada de sistema — editáveis pelo banco, não pelo usuário. Se o usuário discordar de uma classificação, o caminho é o override ou a reclassificação manual, não a edição da lógica base.


Como o sistema decide?
Definição operacional dos níveis de confiança

O nível de confiança de uma classificação não é calculado por score numérico. É determinado pela consistência estrutural entre os sinais disponíveis no momento da avaliação.

O sistema avalia dois fatores para cada transação: quantos sinais independentes estão presentes e se esses sinais apontam para a mesma direção ou se contradizem.


Alta confiança — classificação silenciosa

Condição: dois ou mais sinais independentes de peso alto ou médio convergem para a mesma classificação, sem contradição entre si.

Exemplos de combinações que atingem alta confiança:

Comportamento do sistema: classifica silenciosamente, sem notificar o usuário. A classificação é registrada no histórico auditável e pode ser revertida a qualquer momento.


Média confiança — sugestão agrupada

Condição: um sinal forte presente sem corroboração de outros sinais independentes. Ou sinal forte inédito — favorecido novo com CNPJ mas sem histórico de recorrência ou Categoria Fiscal definida.

Comportamento do sistema: gera sugestão agrupada para revisão periódica. Não cria urgência — o usuário revisa em momento conveniente, não em tempo real.


Baixa confiança — decisão direta do usuário

Condição: sinais ausentes, insuficientes ou contraditórios entre si. O sistema não tem hipótese defensável.

Comportamento do sistema: solicita decisão direta do usuário. Não classifica automaticamente. A resposta do usuário alimenta o aprendizado e pode gerar sugestão de regra personalizada se o padrão se repetir.


O que acontece quando há conflito entre sinais?

Quando sinais de pesos diferentes contradizem, o sinal de maior confiabilidade na hierarquia prevalece para definir a sugestão — mas o nível de confiança cai para médio ou baixo dependendo da intensidade da contradição. O sistema nunca eleva o nível de confiança na presença de contradição, independentemente do número de sinais disponíveis.


Como rastreio uma decisão?

Para cada transação classificada, o sistema registra: quais sinais estavam presentes; se convergiam ou contradiziam; qual nível de confiança resultou; qual ação foi executada.

Isso permite que engenharia e suporte rastreiem a lógica de qualquer classificação sem ambiguidade, reduzindo o custo de manutenção e eliminando a dependência de modelos opacos para depuração.


Como o sistema evolui ao longo do tempo?

Ao detectar repetição de padrão validado pelo usuário — mesmo favorecido classificado da mesma forma em múltiplas ocasiões — o sistema identifica o comportamento como candidato a automação e sugere a criação de uma regra personalizada explícita.

O critério de sugestão é observável e auditável: repetição de override ou confirmação manual para o mesmo favorecido, categoria ou valor em ocasiões distintas. Não há inferência probabilística — o sistema detecta repetição de comportamento validado, não padrões latentes.

Quando o usuário aceita a sugestão, o padrão sobe para a camada de Regras Personalizadas e passa a operar como override soberano, eliminando futuras notificações para aquele caso. O comportamento passado se transforma em automação futura de forma transparente e controlada.