En la entrada anterior buscábamos optimizar un campo escalar . Retomaremos este problema, pero ahora agregando restricciones al dominio de . Para ello hablaremos del método de los multiplicadores de Lagrange, el cual nos permitirá dar una solución bajo ciertas condiciones de diferenciabilidad.
Esto en general es lo mejor que podremos hacer. En realidad, los problemas de este estilo son muy difíciles y no tienen una solución absoluta. Si no tenemos las condiciones del teorema de Lagrange, es posible que se tengan que hacer cosas mucho más compliadas para obtener óptimos exactos, o bien que se tengan que hacer aproximaciones numéricas.
En la demostración del teorema de los multiplicadores de Lagrange usaremos el teorema de la función implícita, lo cual es evidencia adicional de lo importante y versátil que es este resultado.
Un ejemplo para motivar la teoría
Imagina que tenemos la función y queremos encontrar su mínimo. Esto es muy fácil. El mínimo se da cuando , pues en cualquier otro valor tenemos un número positivo. Pero, ¿Qué pasaría si además queremos que los pares que usamos satisfagan también otra condición?, por ejemplo, que cumplan
En este caso, la respuesta ya no es obvia. Podríamos intentar encontrar el mínimo por inspección, pero suena que será difícil. Podríamos intentar usar la teoría de la entrada anterior, pero esa teoría no nos dice nada de qué hacer con nuestra condición.
La teoría que desarrollaremos a continuación nos permitirá respondernos preguntas de este estilo. En este ejemplo en concreto, puedes pensar que la solución se obtendrá de la siguiente manera: La ecuación nos dibuja una elipse en el plano, como se ve en la figura 1 imagen 3. Las curvas de nivel de la superficie dibujada por la gráfica de la función corresponden a circunferencias concéntricas, cuyo centro es el origen. Al ir tomando circunferencias cada vez mas grandes en el plano comenzando con el punto nos quedaremos con la primera que toque a la elipse, de hecho la tocará en dos puntos, digamos y , donde sería el mínimo buscado, es decir el mínimo que sobre la superficie cumple con la ecuación .
Figura 1; Imagen 1-Superior izquierda. Tenemos la gráfica de la ecuación . Imagen 2- Inferior izquierda. Planos que intersecan a la superficie , nos dan las curvas de niver que son circunferencias concéntricas. Imagen 3- Derecha. En azul la elipse dibujada por la ecuación , y las curvas de nivel que se acercan a ella conforme cortamos mas arriba.
Pero como ahí se da una tangencia, entonces suena que justo en ese punto hay una recta simultáneamente tangente a la curva de nivel y a la elipse. Esto nos da una relación entre gradientes. El teorema de multiplicadores de Lagrange detecta y enuncia esta relación entre gradientes con precisión y formalidad, incluso cuando tenemos más de una condición. A estas condiciones también las llamamos restricciones, y están dadas por ecuaciones.
Enunciado del teorema de multiplicadores de Lagrange
A continuación enunciamos el teorema.
Teorema (multiplicadores de Lagrange). Sea es un campo escalar de clase . Para , tomamos campos escalares de clase en . Consideremos el conjunto donde todos los se anulan, es decir:
Tomemos un en para el cual
tiene un extremo local en para los puntos de y
son linealmente independientes.
Entonces existen , a los que llamamos multiplicadores de Lagrange tales que:
Si lo meditas un poco, al tomar obtenemos una situación como la del ejemplo motivador. En este caso, la conclusión es que , que justo nos dice que en , las gráficas de los campos escalares y tienen una tangente en común.
Demostración del teorema de multiplicadores de Lagrange
Demostración. La demostración del teorema de multiplicadores de Lagrange usa varios argumentos de álgebra lineal. Esto tiene sentido, pues a final de cuentas, lo que queremos hacer es poner un gradiente () como combinación lineal de otros gradientes (). A grandes rasgos, lo que haremos es:
Definir un espacio .
Mostrar que generan al espacio ortogonal .
Mostrar que es ortogonal a todo vector de , por lo cual estará en y así por el inciso anterior será combinación lineal de .
Para construir el espacio del que hablamos, usaremos el teorema de la función implícita y la regla de la cadena. Empecemos este argumento. Consideremos la siguiente matriz:
Dado que los vectores son linealmente independientes, el rango por renglones de esta matriz es , de modo que su rango por columnas también es (tarea moral). Sin perder generalidad (quizás tras hacer una permutación de columnas, que permuta las entradas), tenemos que las primeras columnas son linealmente independientes. Así, la matriz
es invertible. Hagamos y reetiquetemos las variables coordenadas como , y las variables coordenadas como . Escribiremos para referirnos al punto al que hacen referencia las hipótesis. Esto nos permite pensar y nos deja en el contexto del teorema de la función implícita. Como la matriz anterior es invertible, existen y para los cuales , y hay una única función de clase tal que para y se cumple que si y sólo si .
Definamos ahora la función como , la cual es de clase en .
Por cómo construimos , sucede que para toda . Por definición, esto quiere decir que para toda tenemos que para toda . Esto quiere decir que es una función constante y por lo tanto su derivada en es la transformación . Pero otra forma de obtener la derivada es mediante la regla de la cadena como sigue:
En términos matriciales, tenemos entonces que el siguiente producto matricial es igual al vector de entradas (evitamos poner para simplificar la notación):
para cada . Nos gustaría escribir esta conclusión de manera un poco más sencilla, para lo cual introducimos los siguientes vectores para cada :
Cada uno de estos lo pensamos como vector en . Además, son vectores linealmente independientes, pues sus entradas son linealmente independientes. El espacio vectorial que generan es entonces un subespacio de , con .
De la ecuación tenemos que para todo , y . Se sigue que , donde es el complemento ortogonal de en . Pero además, por propiedades de espacios ortogonales tenemos que
Así , además el conjunto es linealmente independiente con elementos, por tanto este conjunto es una base para . Nuestra demostración estará terminada si logramos demostrar que también está en , es decir, que es ortogonal a todo elemento de .
Pensemos qué pasa al componer con en el punto . Afirmamos que es un extremo local de . En efecto, . Si, por ejemplo diera un máximo, entonces los valores para dentro de cierta bola serían menores a . Pero entonces los valores cercanos a cumplen , con en y por lo tanto menor a (para mínimos es análogo).
Resumiendo lo anterior, es extremo local de . Aplicando lo que aprendimos en la entrada anterior, la derivada de debe anularse en . Pero por regla de la cadena, dicha derivada es
Viéndolo como multiplicación de matrices, el siguiente producto es el vector de entradas:
De donde concluimos para cada . Esto precisamente nos dice que . Esto es justo lo que queríamos, pues habíamos demostrado que es una base de . Por ello podemos expresar a como combinación lineal de esta base, es decir, existen escalares tales que:
¡Qué bonita demostración! Usamos el teorema de la función implícita, la regla de la cadena (dos veces), nuestros resultados para valores extremos de la entrada anterior, y un análisis cuidadoso de ciertos espacios vectoriales.
Ejemplos del método de multiplicadores de Lagrange
Veamos algunos problemas que podemos resolver con esta nueva herramienta.
Ejemplo. Determinaremos los puntos extremos de bajo la condición . Para poner todo en términos de nuestro teorema, definimos . Por el teorema de multiplicadores de Lagrange, en los puntos extremos debe existir una tal que . Calculando las parciales correspondientes, debemos tener entonces
Adicionalmente, recordemos que se debe satisfaces . Llegamos entonces al sistema de ecuaciones
Al despejar y en ambas ecuaciones tenemos:
Poniendo los valores de y en la tercera ecuación, llegamos a , de donde al resolver tenemos las soluciones y .
Al sustituir en las ecuaciones de nuestro sistema, obtenemos como puntos críticos a y .
Si intentamos calcular el hessiano de , esto no nos dirá nada (no tendremos eigenvalores sólo positivos, ni sólo negativos). Pero esto ignora las restricciones que nos dieron. Podemos hacer una figura para entender si estos puntos son máximos o mínimos. En la Figura tenemos la gráfica de , intersectada con la superfice dada por . Nos damos cuenta que hay un punto máximo y uno mínimo. Al evaluar, obtenemos y . Esto nos dice que el máximo en la superficie se alcanza en y el mínimo en .
Figura 2: Ilustración del Ejemplo 1 la función esta dibujada en azul esta impone restricción a la función que dibuja un plano en el espacio.
Ejemplo. Veamos cómo minimizar la expresión sujetos a la condición . Una vez más, proponemos para tener la situación del teorema de multiplicadores de Lagrange. Debe pasar que . El gradiente de es de puros ceros unos, así que tenemos el sistema de ecuaciones:
De las primeras tres ecuaciones tenemos de donde . Sustituyendo en la tercera ecuación, , es decir . Ya que sólo tenemos una solución, ésta es el mínimo del conjunto de soluciones. En la figura 3 tenemos la ilustración de la solución de este problema, la esfera centrada en el origen de radio toca al plano en el punto
Figura 3: En azul claro el plano , inflamos esferas centradas en el origen; desde la de radio cero vamos aumentando el radio hasta tener el radio correspondiente para el cual la esfera toque tangentemente al plano.
Más adelante…
Con esta entrada cerramos el curso de Cálculo Diferencial e Integral III. ¡¡Felicidades!! Esperamos que todas estas notas te hayan sido de ayuda para estudiar, repasar o impartir la materia. Quedamos al pendiente de cualquier duda, observación o sugerencia en la sección de comentarios de las entradas.
Tarea moral
Determina los extremos de la función bajo la restricción
El plano interseca al paraboloide en una elipse . Determina el punto de la elipse con el valor mayor en el eje , y el punto con el valor mínimo en el mismo eje. Sugerencia:, y
Determinar el máximo valor de bajo la restricción
Determinar los puntos extremos de la función bajo la restricción
Demuestra que en una matriz su rango por columnas es igual a su rango por renglones. Sugerencia. Usa el teorema de reducción gaussiana. También, puedes revisar la entrada que tenemos sobre rango de matrices.