En la entrada anterior empezamos a hablar del teorema de la función inversa. Dimos su enunciado y probamos varias herramientas que nos ayudarán ahora con su demostración.
Recordemos que lo que queremos demostrar es lo siguiente.
Teorema (de la función inversa). Sea de clase en el abierto . Si es invertible, entonces, existe tal que:
y es inyectiva en .
es continua en .
es un conjunto abierto.
es de clase en y además, si , entonces, .
La herramienta más importante que probamos en la entrada anterior nos dice que si una función es de clase , y es invertible, entonces existe una tal que y es invertible para todo . Veremos cómo esta herramienta y otras que desarrollaremos en el transcurso de esta entrada nos permiten demostrar el teorema.
La función es inyectiva en una vecindad de
Vamos a enfocarnos en el punto del teorema. Veremos que existe la que hace que la función restringida a la bola de radio centrada en es inyectiva. En esta parte de la prueba es conveniente que recuerdes que la norma infinito de un vector es á
Además, cumple para todo que
Veamos que bajo las hipótesis del problema se puede acotar en términos de dentro de cierta bola.
Proposición. Sea de clase en el conjunto abierto , y . Si es invertible, entonces existe y tal que y para cualesquiera .
Demostración. Por la diferenciabilidad de en , tenemos
para cada y cada .
Como es invertible, por los resultados de la entrada anterior existe un tal que
para todo .
También por resultados de la entrada anterior, para existe tal que si entonces
para todo .
Usaremos en un momento estas desigualdades, pero por ahora fijemos nuestra atención en lo siguiente. Dados , tomemos el tal que
Para dicho , tenemos
¿Cómo podemos seguir con nuestras desigualdades? Necesitamos usar el teorema del valor medio. Bastará el que demostramos para campos escalares. Aplicándolo a en los puntos cuyo segmento se queda en la bola convexa , podemos concluir que existe un vector en el segmento que cumple
Sabemos que para cualquier vector el valor absoluto de cualquiera de sus coordenadas es en valor menor o igual que la norma del vector. Además, demostramos inicialmente unas desigualdades anteriores. Juntando esto, obtenemos la siguiente cadena de desigualdades:
La gran conclusión de esta cadena de desigualdades es que que es lo que buscábamos.
¡Esto es justo lo que nos pide el primer punto! Hemos encontrado una bola alrededor de dentro de la cual si , entonces , de modo que . ¡La función restringida en esta bola es invertible! En términos geométricos el último teorema nos dice lo siguiente: Si es diferenciable en un abierto , y es invertible, entonces hay una vecindad alrededor de en donde «no se pega», es decir es inyectiva.
Figura 1: Si la función no es inyectiva, lo que tenemos es que proyecta el rectángulo en una superficie que pega los puntos y . Arriba una función inyectiva y abajo una que no lo es.
Ya vimos cómo encontrar una bola dentro de la cual es inyectiva. Si pensamos que el contradominio es exactamente , entonces la función también es suprayectiva. Esto hace que sea biyectiva y por tanto que tenga inversa .
La función inversa es continua
Veamos ahora que la función inversa es continua. De hecho, mostraremos algo un poco más fuerte.
Teorema. Sea de clase en el abierto , y . Si es invertible, entonces existe tal que , es inyectiva en y además es uniformemente continua en su dominio.
Demostración. La primera parte y la existencia de se debe a la discusión de la sección anterior. De hecho, lo que mostramos es que existe y tal que para todo .
Supongamos que nos dan un . Tomemos . Tomemos en tales que . Como y están en dicha bola, podemos escribirlos como , con . Notemos entonces que
Tenemos entonces que es uniformemente continua en .
Esto demuestra el punto de nuestro teorema. La prueba de que el conjunto es abierto no es para nada sencilla como parecería ser. Una demostración muy instructiva, al nivel de este curso, se puede encontrar en el libro Cálculo diferencial de varias variables del Dr. Javier Páez Cárdenas editado por la Facultad de Ciencias de la Universidad Nacional Autónoma de México (UNAM) en las páginas 474-476.
La función inversa es diferenciable
Resta hacer la demostración de . En esta sección veremos que la inversa es derivable y que la derivada es precisamente lo que propone el teorema. En la siguiente sección veremos que la inversa es .
Tomemos un punto . Mostraremos que, en efecto, es la derivada de en , lo cual haremos por definición verificando que
Para ello, introducimos la siguiente función auxiliar dada por:
Esta función está bien definida, pues es inyectiva en la bola . La composición también está bien definida en el abierto y
para todo . Esto nos permite poner el límite buscado como el límite de una composición de la siguiente forma:
Como es continua en , basta demostrar que es continua en . Esto equivale a probar que
Hay que demostrar este último límite. Reescribimos la expresión
como
y luego multiplicamos y dividimos por y reorganizamos para obtener
Como es continua (por ser lineal) y es diferenciable en , se tiene que
El factor que nos falta entender es . Pero por la primera proposición de esta entrada, sabemos que existe una que acota este factor superiormente por . De esta manera,
Esto nos dice entonces que es continua en y por lo tanto:
Por lo tanto es diferenciable en mediante la derivada que propusimos, es decir,
para todo .
La función inversa es de clase
Resta verificar que es de clase en . Lo haremos con la caracterización de la entrada anterior. Tomemos una . Nos gustaría ver que si y están suficientemente cerca, entonces
para toda .
Recordemos que por la entrada anterior hay una tal que para todo en se cumple
También notemos que, si son matrices invertibles en , tenemos:
Tomando y , aplicando la igualdad anterior en un punto en , sacando normas y usando la desigualdad , obtenemos:
Como es de clase , por la entrada anterior podemos construir una tal que y para la cual si está en , entonces:
Para todo .
Finalmente, como es continua en , si y están suficientemente cerca, digamos , entonces
Usamos todo lo anterior para establecer la siguiente cadena de desigualdades cuando :
Esto implica que es de clase . Como tarea moral, revisa los detalles y di explícitamente qué resultado de la entrada anterior estamos usando.
Ejemplo del teorema de la función inversa
Ejemplo. Consideremos dada por . Se tiene que es diferenciable en todo su dominio pues cada una de sus derivadas parciales es continua. Esta es la función de cambio de coordenadas de esféricas a rectangulares o cartesianas. La matriz jacobiana está dada como sigue.
Luego entonces es invertible cuando y , . Su inversa es:
El teorema de la función inversa nos garantiza la existencia local de una función . En este caso, sería la función de cambio de coordenadas rectangulares a esféricas. Si es una función dada en coordenadas esféricas; podemos asumir que es la misma función pero en términos de coordenadas rectangulares.
Más adelante…
¡Lo logramos! Hemos demostrado el teorema de la función inversa, uno de los resultados cruciales de nuestro curso. El siguiente tema es el teorema de la función implícita, que será otro de nuestros resultados principales. Uno podría pensar que nuevamente tendremos que hacer una demostración larga y detallada. Pero afortunadamente la demostración del teorema de la función implícita se apoya fuertemente en el teorema de la función inversa que ya demostramos. En la siguiente entrada enunciaremos y demostraremos nuestro nuevo resultado y una entrada más adelante veremos varios ejemplos para profundizar en su entendimiento.
Tarea moral
En el ejemplo que dimos, verifica que el determinante en efecto es . Verifica también que la inversa es la matriz dada.
Repasa cada una de las demostraciones de esta entrada y asegúrate de entender por qué se siguen cada una de las desigualdades. Explica en qué momentos estamos usando resultados de la entrada anterior.
Da la función inversa de la transformación de cambio de coordenadas polares a rectangulares .
Estamos a punto de entrar a discutir dos de los resultados principales de nuestro curso: el teorema de la función inversa y el teorema de la función implícita. Repasemos un poco qué hemos hecho hasta ahora. En las dos entradas anteriores introdujimos la noción de diferenciabilidad, la cual cuando sucede para una función , nos dice que se parece mucho a una función lineal en un punto dado. Vimos que esta noción implica continuidad y que tiene una regla de la cadena relacionada con el producto de matrices. También, hemos discutido cómo esta noción se relaciona con la existencia de espacios tangentes a gráficas multidimensionales.
Ahora queremos entender todavía mejor a las funciones diferenciables. Hay dos teoremas que nos permiten hacer eso. Uno es el teorema de la función inversa y el otro es el teorema de la función implícita. En esta entrada hablaremos del primero, y en un par de entradas más introduciremos el segundo resultado. El propósito del teorema de la función inversa es dar una condición bajo la cual una función es invertible, por lo menos localmente. De hecho, la mayoría de las veces sólo se puede garantizar la invertibilidad localmente, pues las funciones usualmente no son inyectivas y esto da comportamientos globales más difíciles de manejar.
Enunciar el teorema y entenderlo requiere de cierto esfuerzo. Y demostrarlo todavía más. Por esta razón, en esta entrada nos enfocaremos sólo en dar el teorema y presentar herramientas preliminares que necesitaremos para hacer su demostración.
Enunciado del teorema de la función inversa
Supongamos que tenemos y que es diferenciable en el punto . Entonces, se parece mucho a una función lineal en , más o menos . Así, si es invertible, suena a que «cerquita de » la función debe de ser invertible. El teorema de la función inversa pone estas ideas de manera formal.
Teorema (de la función inversa). Sea de clase en el abierto . Si la matriz es invertible, entonces, existe tal que:
y es inyectiva en .
es continua en .
es un conjunto abierto.
es de clase en y además, si , entonces, .
Veamos qué nos dice de manera intuitiva cada una de las conclusiones del teorema.
Tendremos una bola dentro de la cual será inyectiva, y por lo tanto será biyectiva hacia su imagen. Así, restringida a esta bola será invertible. Es importante que sea una bola abierta, porque entonces sí tenemos toda una región «gordita» en donde pasa la invertibilidad (piensa que si fuera un cerrado, a lo mejor sólo es el punto y esto no tiene chiste).
La inversa que existirá para será continua. Esto es lo mínimo que podríamos esperar, aunque de hecho el punto garantiza algo mucho mejor.
La imagen de en la bola será un conjunto abierto.
Más aún, se tendrá que será de clase y se podrá dar de manera explícita a su derivada en términos de la derivada de con una regla muy sencilla: simplemente la matriz que funciona para derivar le sacamos su inversa como matriz y esa funciona al evaluarla en el punto apropiado.
El teorema de la función inversa es profundo pues tanto su enunciado como su demostración combina ideas de topología, álgebra y cálculo. Por esta razón, para su demostración necesitaremos recopilar varias de las herramientas de álgebra lineal que hemos repasado en la Unidad 2 y la Unidad 5. Así mismo, necesitaremos ideas topológicas de las que hemos visto en la Unidad 3. Con ellas desarrollaremos algunos resultados auxiliares que en la siguiente entrada nos permitirán concluir la demostración.
Un criterio para campos vectoriales
El teorema de la función inversa es para funciones de clase . Nos conviene entender esta noción mejor. Cuando una función es de clase , entonces es diferenciable. Pero el regreso no es cierto y hay contraejemplos. ¿Qué le falta a una función diferenciable para ser de clase ? A grandes rasgos, que las funciones derivadas y hagan casi lo mismo cuando y son cercanos. En términos de matrices, necesitaremos que la expresión sea pequeña cuando y son cercanos entre sí.
El siguiente teorema será importante en nuestro camino hacia el teorema de la función inversa. Intuitivamente, para lo que lo usaremos es para aproximar una función localmente, con «cuadritos» que corresponden a los planos tangentes, porque «muy cerquita» estos planos varían muy poco si pedimos que sea de clase . Es decir si y son dos puntos en el dominio de una función diferenciable, y estos están muy cerca uno del otro, sus planos tangentes serán casi el mismo. Esto nos invita a cambiar localmente a una superficie por cuadritos como más adelante se explicará con detalle.
Figura 1. En azul y en rojo dos planos que corresponden a las derivadas y . Este cambio calculado es distintos puntos cercanos es «suave», esto se expresará con la ecuación ya con las diferenciales para todo .
El teorema concreto que nos interesa demostrar es la siguiente equivalencia para que una función sea de clase .
Teorema. Sea una función diferenciable en . Se tiene que es de clase en si y sólo si para todo y para cada existe tal que , y si se tiene para todo .
Demostración. Supongamos que es de clase en , es decir, todas sus funciones componentes tienen derivadas parciales en y son continuas. Sea . Veremos que se puede encontrar una como en el enunciado.
Tomemos y en . Expresamos a como
o equivalentemente como
De tal manera que por Cauchy-Schwarz:
En este punto se ve la importancia de que las parciales sean continuas. Podemos encontrar una que nos garantice que y que si , entonces En esta situación, podemos seguir acotando como sigue:
Al sacar raiz cuadrada, obtenemos la desigualdad buscada.
Supongamos ahora que para cada existe una como en el enunciado del teorema. Debemos ver que todas las derivadas parciales de todas las componentes son continuas. Podemos aplicar la desigualdad tomando como cada vector de la base canónica. Esto nos dice que
Por nuestro desarrollo anterior, para cada tenemos
Elevando al cuadrado,
Como todos los términos son no negativos, cada uno es menor a . Así, para cada tenemos
Esto es precisamente lo que estábamos buscando: si está lo suficientemente cerca de , cada derivada parcial en está cerca de su correspondiente en .
Invertibilidad de en todo un abierto
En esta sección demostraremos lo siguiente. Si es un campo vectorial diferenciable en y es invertible, entonces será invertible para cualquier alrededor de cierta bola abierta alrededor de . Los argumentos en esta ocasión están un poco más relacionados con el álgebra lineal.
Será útil que recuerdes que una transformación lineal es invertible si el único tal que es . El siguiente criterio es otra caracterización de invertibilidad en términos de lo que le hace a la norma de los vectores.
Teorema. Sea una transformación lineal. La transformación es invertible si y sólo si existe tal que para todo .
Demostración. Como es invertible, para todo sucede que . En particular, esto sucede para todos los vectores en (recuerda que es la esfera de radio y dimensión centrada en ). Esta esfera es compacta y consiste exactamente de los de norma .
Sabemos que las transformaciones lineales y la función norma son continuas. Por la compacidad de , la expresión tiene un mínimo digamos , que alcanza en . Por el argumento del párrafo anterior, .
Tomemos ahora cualquier vector . Si , entonces Si , el vector está en , de modo que Usando linealidad para sacar el factor y despejando obtenemos como estábamos buscando.
Este lado es más sencillo. Si existe dicha , entonces sucede que para en , con tenemos Por lo tanto, y así es invertible.
Obtengamos una consecuencia del teorema de clasificación de la sección anterior que está muy relacionada con este resultado que acabamos de demostrar.
Teorema. Sea de clase en el conjunto abierto y . Si es invertible, entonces existen y tales que y , para todo y para todo .
Demostración. Como es invertible, por el teorema que acabamos de demostrar existe tal que para todo .
Por nuestra caracterización de funciones , Ahora como en (abierto) para , existe tal que , y para todo y para todo .
Por la desigualdad del triángulo,
de donde
De esta manera, el resultado es cierto para la que dimos y para .
El siguiente corolario es consecuencia inmediata de lo discutido en esta sección y está escrito de acuerdo a la aplicación que haremos más adelante en la demostración del teorema de la función inversa.
Corolario. Sea una función de clase en y . Si es invertible, entonces, existe tal que y es invertible para todo .
Queda como tarea moral responder por qué este corolario es consecuencia inmediata del teorema anterior.
Un poco de intuición geométrica
Dejamos esta entrada hasta aquí, la naturaleza densamente teórica de lo que estamos haciendo puede hacer pesadas las exposiciones. Lo que hasta aquí demostramos es que para un campo vectorial si su derivada en es invertible, entonces lo es en toda una vecindad que tiene a . Imaginemos al pedacito de superficie cubierto con pequeños rectángulos. En cada punto, las imágenes de estos rectángulos están muy cerquita, casi pegados a la superficie. Esto nos garantizaría la invertibilidad de en esta vecindad.
Figura 2
En la Figura 2 vemos ilustrado esto. El círculo inferior corresponde a la vecindad en el dominio de . La función levanta una porción del plano en la sabana delineada con negro arriba del círculo. En el círculo tenemos al punto en verde agua. Sobre la sábana de arriba tenemos con el mismo color a . Los puntos negros pequeños dentro de la vecindad alrededor de son alzados por a puntos negros sobre la sabana. Sobre de cada punto negro en la sabana tenemos un cuadrito rojo que representa al cachito de plano tangente cerca de la imagen de cada punto. La imagen esta llena de estos pequeños cuadritos, todos ellos representan diferenciales invertibles, esto nos permitirá asegurar la invertibilidad de en al menos una vecindad.
Más adelante…
En la siguiente entrada demostraremos el teorema de la función inversa, inciso por inciso. Es importante que estes familiarizado con los resultados de esta entrada, pues serán parte importante de la demostración.
Tarea moral
¿Qué diría el teorema de la función inversa para campos vectoriales ? ¿Se puede usar para Si es así, ¿para qué valores de y ? ¿Qué diría en este caso explícitamente?
Explica por qué el corolario que enunciamos en efecto se deduce de manera inmediata de lo discutido en la sección correspondiente.
Revisa todas las desigualdades que usamos en esta entrada. ¿Qué resultado estamos usando? ¿Cuándo se darían estas igualdades?
Demuestra que el determinante de una matriz es una función continua en términos de las entradas de la matriz. Usa esto para demostrar que si es una matriz y es una matriz muy cercana a , entonces también es invertible.
Demuestra que si una transformación es diagonalizable, entonces en el teorema de caracterización de invertibilidad se puede usar como al mínimo de la expresión variando sobre todos los eigenvalores de .