Introduccion
El método de los mínimos cuadrados
El método de mínimos cuadrados se aplica para ajustar rectas a una serie de datos presentados como punto en el plano.
Suponagamos que se tienen los siguientes datos para las variables
Esta situación se puede presentar en estudios experimentales, donde se estudia la variación de cierta magnitud x en función de otra magnitud y. Teóricamente es de esperarse que la relación entre estas variables sea lineal, del tipo
El método de mínimos cuadrados nos proporciona un criterio con el cual podremos obtener la mejor recta que representa a los puntos dados. Se desearía tener
para todos los puntos
se pide que la suma de los cuadrados de las diferencias (las desviaciones)
sea la menor posible.
Se requiere
sea lo más pequeña posible. Los valores de m y b que cumplan con esta propiedad, determinan la recta
que mejor representa el comportamiento lineal de los puntos
Consideremos entonces la función f de las variables m y b dada por
donde los puntos críticos de esta función se obtienen al resolver el sistema
De la segunda ecuación obtenemos
de donde
Llamemos
que son las medias aritméticas de los valores
sustituyendo en la ecuación
nos queda
de donde se obtiene
En resumen, la función
tiene un único punto crítico para
Ahora vamos a verificar que en dicho punto crítico se alcanza un mínimo local, para lo cual recurrimos a nuestro criterio de la segunda derivada, en este caso
Tenemos que
Por otro lado
esta desigualdad es equivalente a
La cual no es mas que la desigualdad de Cauchy-Schwarz aplicada a los vectores
Ejemplo. Se obtuvieron experimentalmente los siguientes valores de las variables x, y, los cuales se sabe que guardan entre sí una relación lineal
Vamos a encontrar la recta que mejor se ajusta a estos datos, según el método de mínimos cuadrados se tiene
Aplicando la fórmula obtenida para m y b obtenemos
por lo que la recta que mejor ajusta los datos proporcionados
La suma de las diferencias de la recta y real con la y predicha por la ecuación obtenida es
Es decir nuestra recta efectivamente compensa los puntos que quedaron por encima con puntos que quedaron por debajo. Gráficamente esto se ve.
La mejor recta que ajusta los datos del ejemplo.