Coeficiente de correlación lineal
El coeficiente de correlación lineal es un tipo de medida de regresión que se emplea para conocer el grado de variación entre dos variables determinadas. Por lo tanto, se trata de una magnitud estadística que permite cuantificar la dependencia entre dos variables y, en este caso en particular, establecer una correlación lineal entre ellas.
Definición
El coeficiente de correlación lineal (CCL) es una medida que fue desarrollada por el matemático inglés Karl Pearson, uno de los padres fundadores de la estadística matemática. En el presente caso, se trata de una de las medidas de regresión más utilizadas para determinar la relación de índole lineal que se produce entre dos variables.
Las variables en cuestión son cuantitativas y el CCL permite representarlas en un diagrama de dispersión de manera tal que las dependencias entre los valores de las variables en conjunto se aproximen a una función lineal (el coeficiente puede determinar la dispersión y, por lo tanto, el rendimiento de los puntos para ser representados gráficamente como una línea recta).
El CCL entonces permite que se establezca una relación cuantitativa de sentido lineal entre dos variables. La intensidad y dirección de esta relación suele constatarse gráficamente. Supone un procedimiento estadístico que se emplea en muchas áreas del conocimiento, para realizar análisis y reconocer tendencias y hacer proyecciones.
Características de empleo
El CCL constituye una medida que cuantifica el valor de su intensidad en función de la relación lineal entre ambas variables, por lo que su determinación depende de que las variables se encuentren fijadas por valores de variables independientes. Su valor, por lo tanto, es condicional y se modifica si una variable independiente es modificada. En el análisis de correlación lineal, este valor se representa con la letra r.
El empleo del CCL se emplea como un índice que indica la intensidad de esta relación siempre que las variables sean cuantitativas y continuas; la fórmula empleada en este análisis coteja la distancia puntual entre los distintos valores en relación con la media de la variable independiente. De esta manera, se puede establecer cuánto se alejan los valores de la formación de un vector imaginario de referencia.
Al tratarse de una unidad de medida, el CCL presenta una correlación limitada que aporta información referente a la relación entre pares de atributos que se miden de manera simultánea y que busca determinar relaciones fehacientes entre ellos, pero no puede hacer lo mismo con variables cuya relación no sea lineal, continua o cuantitativa. No puede, por lo tanto, percibir valores fuera de lo normal ni relaciones curvas o parábolas.
Notación y formulación matemática del CCL
La notación correspondiente al coeficiente de correlación lineal es r, un valor que no dispone de unidades entre 1 y -1. La importancia estadística de este valor se representa mediante la notación p.
Con base en estas notaciones, se pueden realizar las siguientes afirmaciones sobre la relación ente variables:
- La notación r del CCL se compone de valores positivos, esto indica una menor dispersión y una mayor correlación positiva (se puede trazar una línea más definida entre los valores).
- Si r presenta valores negativos para una determinada variable, la dispersión es mayor y por lo tanto los valores de una variable tienden a aumentar mientras que los de otra tienden a disminuir.
- En el caso de que r se aproxime a cero, el grado de dispersión será mayor y más débil la relación lineal que se pueda establecer entre las variables y sus respectivos valores.
- Los valores 1 y -1 establecen correlaciones perfectas que cambian de manera análoga a una tasa fija. En estos casos, tienen una relación lineal evidente que puede ser representada gráficamente en una misma recta.
- El valor p permite verificar si el coeficiente de correlación lineal es diferente de cero. Por lo tanto, es fundamental para determinar si los valores de la muestra cumplen con cierto grado de linealidad.
Las distintas consideraciones realizadas sobre el CCL son empleadas para establecer las condiciones de análisis necesarias para definir el comportamiento de los valores correspondientes a los datos recolectados. Las variables utilizadas para calcular el coeficiente tienen dos instancias de observación que pueden traducirse en valores reales y cuantificar el procedimiento.
Por ejemplo, las variables a considerar pueden ser la temperatura global y el ritmo al que se derriten los glaciares para establecer distintos valores en el tiempo. El grado de dispersión indicará el comportamiento de los valores de las distintas variables, mientras que el CCL permite saber si la distancia entre estos valores es más o menos correlativa con un valor medio para su respectiva variable.
El coeficiente de correlación lineal es una medida de regresión que sirve para establecer una relación lineal entre dos variables. De esta manera, su cálculo permite conocer con exactitud el grado de dispersión de los valores de una variable en relación con una media para dicha variable.
En TeamSystem | Software DELSOL llevamos ya más de 30 años creando todas las herramientas que necesitas para escalar tu negocio sin complicaciones.