Nó de equilíbrio

Você pode usar os nós Balance para corrigir desequilíbrios em conjuntos de dados para que eles estejam em conformidade com os critérios de teste especificados.

Por exemplo, suponha que um dataset tenha apenas dois valores --low ou high-- e que 90% dos casos sejam low enquanto que apenas 10% dos casos são high. Muitas técnicas de modelagem têm problemas com esses dados tendenciosos porque tendem a aprender apenas o resultado baixo e ignorar o alto, já que ele é mais raro. Se os dados estão bem equilibrados com aproximadamente números iguais de resultados low e high , os modelos terão mais chances de encontrar padrões que distinguem os dois grupos. Nesse caso, um nó Balance é útil para criar uma diretriz de balanceamento que reduz os casos com resultados baixos.

O balanceamento é realizado duplicando e descartando registros com base nas condições especificadas. Os registros para os quais nenhuma condição é válida são sempre transmitidos. Como esse processo funciona duplicando e/ou descartando registros, a sequência original dos seus dados é perdida nas operações posteriores. Certifique-se de derivar quaisquer valores relacionados à sequência antes de adicionar um nó Balance ao fluxo de dados.