viernes, 25 de julio de 2008

CORRELACION

Correlación.

Recordemos que para el caso de una variable, la varianza era un parámetro que nos mostraba cuanta variación existía entre la media un conjunto de datos. En el mismo tenor, estamos en determinar la dependencia entre dos variables por lo que una primera propuesta es construir una medida que nos permita en forma análoga tratar la “variación”.

Se define la covarianza como la variación que existe entre los datos de dos variables, expresada como:


donde son las variables para n datos que intervienen en el estudio.
En realidad la correlación es una medida sobre el grado de relación entre dos variables, sin importar cual es la causa y cual es el efecto. La dependencia de la que se habla en este sentido es la dependencia entre la varianza de las variables.

Como hemos visto el manejo de unidades adimensionales nos permiten tener un coeficiente sobre el que de forma cómoda se pueda trabajar, por lo que podemos dividir entre el producto de las desviaciones de las variables, es decir:

los valores para este coeficiente están comprendidos entre -1 y 1.

Se tiene los siguientes criterios para r


entre mas se aproxima a los valores 1 y -1 la aproximación a una correlación se considera buena. Cuando mas se aleja de 1 o de -1 y se acerca a cero se tiene menos confianza en la dependencia lineal por lo que una aproximación lineal será lo menos apropiado, sin embargo no significa que no existe dependencia, lo único que podemos decir es que la dependencia no es lineal. Un valor positivo para r indica que a medida que una variable crece la otra también lo hace, por el contrario si su valor es negativo, lo que podemos decir es que a medida que una variable crece la otra decrece.
Datos influyentes
Ejemplos de correlación

Una vez que se determina que existe dependencia lineal un aspecto sumamente relevante es el investigar las características del modelo matemático que relaciona una variable con otra, así de esta forma podemos decir, una variable puede clasificarse como
determinístico y probabilistico. El modelo determinístico, que no será abordado en este curso, esta ligado a la ecuación que regula de forma determinante el comportamiento de un fenómeno, así por ejemplo podemos determinar a partir de la obtención de una ecuación sobre el potencial de frenado en un material, que ante cambios de la longitud de onda la relación es lineal no permitirá predecir cuales serán sus valores. Ecuaciones que permiten ver como es la oposición a la corriente eléctrica, o resistencia eléctrica, al aumentar la temperatura de un metal, entre otros, es un claro indicio de una ecuación que es determinística, en ella se podrá describir como cambiara la resistencia eléctrica del material en cuestión ante el aumento de una temperatura en el material. Por otro lado, los fenómenos probabilísticos están sujetos a la modelos que aunque puedan ser descritos por una ecuación no implica que todos los valores que intervienen en el estudio puedan ser localizados en el gráfico que los representan, y por supuesto un dato mas no es garantía que sea localizado en la ecuación.

A continuación será presentado un método para localizar en un fenómeno probabilístico la mejor línea recta que describa un fenómeno. Aunque el método de mínimos cuadrados permite encontrar la mejor ecuación para un conjunto de datos obtenidos de una muestra que puede ser aleatoria el método también permite obtener la ecuación para un fenómeno determinístico, y que por supuesto, en último caso el conjunto de puntos se ubicaran sobre la ecuación.
Línea de Regresión
Método de Mínimos Cuadrados

No hay comentarios: