O parâmetro múltiplo afirma que o espaço de entrada de dimensão superior compreende várias variedades dimensionais inferiores nas quais todos os pontos de dados se encontram, e que os pontos de dados na mesma variedade compartilham o mesmo rótulo.
Para um exemplo intuitivo, considere um pedaço de papel amassado até assumir a forma de uma bola. A localização de quaisquer pontos na superfície esférica só pode ser mapeada com coordenadas x,y,z tridimensionais. No entanto, se essa bola amassada for agora aberta até virar uma folha de papel, esses mesmos pontos poderão ser mapeados com coordenadas bidimensionais x,y. Isso é chamado de redução de dimensionalidade e pode ser obtido matematicamente usando métodos como autocodificadores ou convoluções.
No aprendizado de máquina, as dimensões não correspondem às dimensões físicas conhecidas, mas a cada atributo ou recurso dos dados. Por exemplo, no aprendizado de máquina, uma pequena imagem RGB medindo 32x32 pixels tem 3.072 dimensões: 1.024 pixels, cada um dos quais com três valores (para vermelho, verde e azul). Comparar pontos de dados com tantas dimensões é desafiador, tanto devido à complexidade e recursos computacionais necessários quanto porque a maior parte desse espaço de alta dimensão não contém informações significativas para a tarefa em questão.
O parâmetro múltiplo sustenta que quando um modelo aprende a função de redução de dimensionalidade adequada para descartar informações irrelevantes, pontos de dados díspares convergem para uma representação mais significativa para a qual os outros parâmetros SSL são mais confiáveis.