Comparación DISTANCE

Calcula la distancia entre dos puntos y prorratea el peso en función de la distancia entre los puntos. Puede utilizar esta comparación para hacer coincidir coordenadas geográficas, donde cuanto más alejados estén los puntos entre sí, menor será el peso que se aplique.

Nota: La distancia se calcula como una distancia pitagórica, que es la raíz cuadrada de la suma de los cuadrados de las coordenadas.

La información sobre la frecuencia no se tiene en cuenta cuando se utiliza esta comparación de coincidencias, pero una coincidencia de dos fuentes requiere cuatro flujos de entrada. Si utiliza esta comparación de coincidencias con un trabajo de Two-source Match stage, cree dos entradas de archivo ficticias en lugar de archivos que contengan información de frecuencia.

Columnas necesarias

Se requieren las siguientes columnas de origen de datos y origen de referencia:

  • datos. La coordenada X de la fuente de datos.
  • datos. La coordenada Y de la fuente de datos.
  • Referencia. La coordenada X de la fuente de referencia.
  • Referencia. La coordenada Y de la fuente de referencia.
Nota: Las coordenadas deben ser números enteros positivos o negativos; no se permiten decimales.

Parámetro necesario

Se requiere el siguiente parámetro:

Param 1. La distancia máxima que se puede tolerar.

Ejemplo

La distancia se expresa en las unidades de las coordenadas. Por ejemplo, si las coordenadas están en milésimas de grado, una distancia máxima de 100 tolera una distancia de 0.1 grados.

Si la distancia entre los puntos es 0, se asigna el peso de acuerdo. Si la distancia es de un grado e 0.05, se asigna el punto medio entre el peso de acuerdo y el peso de desacuerdo. Si la distancia es superior a un grado de 0.1, se asigna el peso de desacuerdo.