Archivo de la etiqueta: función

Cálculo Diferencial e Integral III: Introducción al teorema de la función inversa

Por Alejandro Antonio Estrada Franco

Introducción

Estamos a punto de entrar a discutir dos de los resultados principales de nuestro curso: el teorema de la función inversa y el teorema de la función implícita. Repasemos un poco qué hemos hecho hasta ahora. En las dos entradas anteriores introdujimos la noción de diferenciabilidad, la cual cuando sucede para una función f:RnRm, nos dice que f se parece mucho a una función lineal en un punto dado. Vimos que esta noción implica continuidad y que tiene una regla de la cadena relacionada con el producto de matrices. También, hemos discutido cómo esta noción se relaciona con la existencia de espacios tangentes a gráficas multidimensionales.

Ahora queremos entender todavía mejor a las funciones diferenciables. Hay dos teoremas que nos permiten hacer eso. Uno es el teorema de la función inversa y el otro es el teorema de la función implícita. En esta entrada hablaremos del primero, y en un par de entradas más introduciremos el segundo resultado. El propósito del teorema de la función inversa es dar una condición bajo la cual una función es invertible, por lo menos localmente. De hecho, la mayoría de las veces sólo se puede garantizar la invertibilidad localmente, pues las funciones usualmente no son inyectivas y esto da comportamientos globales más difíciles de manejar.

Enunciar el teorema y entenderlo requiere de cierto esfuerzo. Y demostrarlo todavía más. Por esta razón, en esta entrada nos enfocaremos sólo en dar el teorema y presentar herramientas preliminares que necesitaremos para hacer su demostración.

Enunciado del teorema de la función inversa

Supongamos que tenemos f:RnRn y que es diferenciable en el punto a¯. Entonces, f se parece mucho a una función lineal en a¯, más o menos f(x¯)f(a¯)+Ta¯(x¯a¯). Así, si Ta¯ es invertible, suena a que «cerquita de a¯» la función f(x¯) debe de ser invertible. El teorema de la función inversa pone estas ideas de manera formal.

Teorema (de la función inversa). Sea f:SRnRn de clase C1 en el abierto S. Si la matriz Df(a¯) es invertible, entonces, existe δ>0 tal que:

  1. Bδ(a¯)S y f es inyectiva en Bδ(a¯).
  2. f1:f(Bδ(a¯))RnRn es continua en f(Bδ(a¯)).
  3. f(Bδ(a¯))Rn es un conjunto abierto.
  4. f1 es de clase C1 en f(Bδ(a¯)) y además, si x¯=f(v¯)f(Bδ(a¯)), entonces, Df1(x¯)=Df1(f(v¯))=(Df(v¯))1.

Veamos qué nos dice de manera intuitiva cada una de las conclusiones del teorema.

  1. Tendremos una bola Bδ(a¯) dentro de la cual f será inyectiva, y por lo tanto será biyectiva hacia su imagen. Así, f restringida a esta bola será invertible. Es importante que sea una bola abierta, porque entonces sí tenemos toda una región «gordita» en donde pasa la invertibilidad (piensa que si fuera un cerrado, a lo mejor sólo es el punto a¯ y esto no tiene chiste).
  2. La inversa f1 que existirá para f será continua. Esto es lo mínimo que podríamos esperar, aunque de hecho el punto 4 garantiza algo mucho mejor.
  3. La imagen de f en la bola Bδ(a¯) será un conjunto abierto.
  4. Más aún, se tendrá que f1 será de clase C1 y se podrá dar de manera explícita a su derivada en términos de la derivada de f con una regla muy sencilla: simplemente la matriz que funciona para derivar f le sacamos su inversa como matriz y esa funciona al evaluarla en el punto apropiado.

El teorema de la función inversa es profundo pues tanto su enunciado como su demostración combina ideas de topología, álgebra y cálculo. Por esta razón, para su demostración necesitaremos recopilar varias de las herramientas de álgebra lineal que hemos repasado en la Unidad 2 y la Unidad 5. Así mismo, necesitaremos ideas topológicas de las que hemos visto en la Unidad 3. Con ellas desarrollaremos algunos resultados auxiliares que en la siguiente entrada nos permitirán concluir la demostración.

Un criterio para campos vectoriales C1

El teorema de la función inversa es para funciones de clase C1. Nos conviene entender esta noción mejor. Cuando una función f es de clase C1, entonces es diferenciable. Pero el regreso no es cierto y hay contraejemplos. ¿Qué le falta a una función diferenciable para ser de clase C1? A grandes rasgos, que las funciones derivadas Ta¯ y Tb¯ hagan casi lo mismo cuando a¯ y b¯ son cercanos. En términos de matrices, necesitaremos que la expresión ||(Df(a¯)Df(b¯))(x¯)|| sea pequeña cuando a¯ y b¯ son cercanos entre sí.

El siguiente teorema será importante en nuestro camino hacia el teorema de la función inversa. Intuitivamente, para lo que lo usaremos es para aproximar una función f localmente, con «cuadritos» que corresponden a los planos tangentes, porque «muy cerquita» estos planos varían muy poco si pedimos que f sea de clase C1. Es decir si a¯ y b¯ son dos puntos en el dominio de una función diferenciable, y estos están muy cerca uno del otro, sus planos tangentes serán casi el mismo. Esto nos invita a cambiar localmente a una superficie por cuadritos como más adelante se explicará con detalle.

Figura 1. En azul y en rojo dos planos que corresponden a las derivadas Ta¯ y Tb¯. Este cambio calculado es distintos puntos cercanos es «suave», esto se expresará con la ecuación ||Df(b¯)(x¯)Df(a¯)(x¯)||ϵ||x¯|| ya con las diferenciales para todo x¯.

El teorema concreto que nos interesa demostrar es la siguiente equivalencia para que una función sea de clase C1.

Teorema. Sea f:SRnRm una función diferenciable en S. Se tiene que f es de clase C1 en S si y sólo si para todo a¯S y para cada ε>0 existe δ>0 tal que Bδ(a¯)S, y si b¯Bδ(a¯) se tiene ||(Df(b¯)Df(a¯))(x¯)||ε||x¯|| para todo x¯Rn.

Demostración. ). Supongamos que f es de clase C1 en S, es decir, todas sus funciones componentes tienen derivadas parciales en S y son continuas. Sea ε>0. Veremos que se puede encontrar una δ como en el enunciado.

Tomemos a¯ y b¯ en S. Expresamos a (Df(b¯)Df(a¯))(x¯) como

(f1x1(b¯)f1x1(a¯)f1xn(b¯)f1xn(a¯)fmx1(b¯)fmx1(a¯)fmxn(b¯)fmxn(a¯))(x1xn)

o equivalentemente como

((f1(b¯)f1(a¯))x¯(fm(b¯)fm(a¯))x¯).

De tal manera que por Cauchy-Schwarz:

||(Df(b¯)Df(a¯))(x¯)||2=i=1m((fi(b¯)fi(a¯))x¯)2i=1m||fi(b¯)fi(a¯)||2||x¯||2=||x¯||2i=1m||fi(b¯)fi(a¯)||2=||x¯||2i=1mj=1n(fixj(b¯)fixj(a¯))2

En este punto se ve la importancia de que las parciales sean continuas. Podemos encontrar una δ que nos garantice que BδS y que si ||b¯a¯||<δ, entonces |fixj(b¯)fixj(a¯)|<εmn. En esta situación, podemos seguir acotando ||(Df(b¯)Df(a¯))(x¯)||2 como sigue:
||x¯||i=1mj=1nε2mn=ε2||x¯||2.

Al sacar raiz cuadrada, obtenemos la desigualdad ||(Df(b¯)Df(a¯))(x)||ε||x¯|| buscada.

). Supongamos ahora que para cada ε existe una δ como en el enunciado del teorema. Debemos ver que todas las derivadas parciales de todas las componentes son continuas. Podemos aplicar la desigualdad ||(Df(b¯)Df(a¯))(x¯)||||x¯||ε tomando como x¯ cada vector e^i de la base canónica. Esto nos dice que

||Df(b¯)(e^i)Df(a¯)(e^i)||<ε||e^i||=ε.

Por nuestro desarrollo anterior, para cada i tenemos

ε>||Df(b¯)(e^i)Df(a¯)(e^i)||=||(f1(b¯)e^if1(a¯)e^i,,fm(b¯)e^ifm(a¯)e^i)||=||(f1xi(b¯)f1xi(a¯),,fmxi(b¯)fmxi(a¯))||=j=1m(fjxi(b¯)fjxi(a¯))2.

Elevando al cuadrado,

j=1m(fjxi(b)fjxi(a))2<ε2.

Como todos los términos son no negativos, cada uno es menor a ϵ2. Así, para cada i,j tenemos

|fjxi(b¯)fjxi(a¯)|<ε.

Esto es precisamente lo que estábamos buscando: si b¯ está lo suficientemente cerca de a¯, cada derivada parcial en b¯ está cerca de su correspondiente en a¯.

◻

Invertibilidad de Df(a¯) en todo un abierto

En esta sección demostraremos lo siguiente. Si f:RnRn es un campo vectorial diferenciable en a¯ y Df(a¯) es invertible, entonces Df(x¯) será invertible para cualquier x¯ alrededor de cierta bola abierta alrededor de a¯. Los argumentos en esta ocasión están un poco más relacionados con el álgebra lineal.

Será útil que recuerdes que una transformación lineal T:RnRn es invertible si el único x¯Rn tal que T(x¯)=0¯ es x¯=0¯. El siguiente criterio es otra caracterización de invertibilidad en términos de lo que le hace T a la norma de los vectores.

Teorema. Sea T:RnRn una transformación lineal. La transformación T es invertible si y sólo si existe ε>0 tal que ||T(x¯)||ε||x¯|| para todo x¯Rn.

Demostración. ) Como T es invertible, para todo x¯0¯ sucede que T(x¯)0¯. En particular, esto sucede para todos los vectores en Sn1 (recuerda que es la esfera de radio 1 y dimensión n1 centrada en 0¯). Esta esfera es compacta y consiste exactamente de los x¯Rn de norma 1.

Sabemos que las transformaciones lineales y la función norma son continuas. Por la compacidad de Sn1, la expresión ||T(x¯)|| tiene un mínimo digamos ε, que alcanza en Sn1. Por el argumento del párrafo anterior, ε>0.

Tomemos ahora cualquier vector x¯Rn. Si x¯=0¯, entonces ||T(0¯)||=||0¯||=0ε||0¯||. Si x¯0¯, el vector x¯||x¯|| está en Sn1, de modo que ||T(x¯||x¯||)||ε. Usando linealidad para sacar el factor ||x¯|| y despejando obtenemos ||T(x¯)||ε||x¯||, como estábamos buscando.

) Este lado es más sencillo. Si existe dicha ε>0, entonces sucede que para x¯ en Rn, con x¯0¯ tenemos ||T(x¯)||ε||x¯||>0. Por lo tanto, T(x¯)0¯ y así T es invertible.

◻

Obtengamos una consecuencia del teorema de clasificación de la sección anterior que está muy relacionada con este resultado que acabamos de demostrar.

Teorema. Sea f:SRnRn de clase C1 en el conjunto abierto S y a¯S. Si Df(a¯) es invertible, entonces existen δ>0 y m>0 tales que Bδ(a¯)S y ||Df(b¯)(x¯)||m||x¯||, para todo b¯Bδ(a¯) y para todo x¯Rn.

Demostración. Como Df(a¯) es invertible, por el teorema que acabamos de demostrar existe ε>0 tal que ||Df(a¯)(x¯)||ε||x¯|| para todo x¯Rn.

Por nuestra caracterización de funciones C1, Ahora como fC1 en S (abierto) para ε=ε2>0, existe δ>0 tal que Bδ(a¯)S, y ||Df(b¯)(x¯)Df(a¯)(x¯)||ε2||x¯|| para todo b¯Bδ(a¯) y para todo x¯Rn.

Por la desigualdad del triángulo, ||Df(a¯)(x¯)Df(b¯)(x¯)||+||Df(b¯)(x¯)||||Df(a¯)(x¯)||,

de donde

||Df(b¯)(x¯)||||Df(a¯)(x¯)||||Df(b¯)(x¯)Df(a¯)(x¯)||ε||x¯||ε2||x¯||=ε2||x¯||.

De esta manera, el resultado es cierto para la δ que dimos y para m=ε2.

◻

El siguiente corolario es consecuencia inmediata de lo discutido en esta sección y está escrito de acuerdo a la aplicación que haremos más adelante en la demostración del teorema de la función inversa.

Corolario. Sea f:SRnRn una función de clase C1 en S y a¯S. Si Df(a¯) es invertible, entonces, existe δ>0 tal que Bδ(a¯)S y Df(b¯) es invertible para todo b¯Bδ(a¯).

Queda como tarea moral responder por qué este corolario es consecuencia inmediata del teorema anterior.

Un poco de intuición geométrica

Dejamos esta entrada hasta aquí, la naturaleza densamente teórica de lo que estamos haciendo puede hacer pesadas las exposiciones. Lo que hasta aquí demostramos es que para un campo vectorial C1 si su derivada en a¯ es invertible, entonces lo es en toda una vecindad que tiene a a¯. Imaginemos al pedacito de superficie f(Bδ(a¯)) cubierto con pequeños rectángulos. En cada punto, las imágenes de estos rectángulos están muy cerquita, casi pegados a la superficie. Esto nos garantizaría la invertibilidad de f en esta vecindad.

Figura 2

En la Figura 2 vemos ilustrado esto. El círculo inferior corresponde a la vecindad Bδ(a¯) en el dominio de f. La función f levanta una porción del plano en la sabana delineada con negro arriba del círculo. En el círculo tenemos al punto a¯ en verde agua. Sobre la sábana de arriba tenemos con el mismo color a f(a¯). Los puntos negros pequeños dentro de la vecindad alrededor de a¯ son alzados por f a puntos negros sobre la sabana. Sobre de cada punto negro en la sabana tenemos un cuadrito rojo que representa al cachito de plano tangente cerca de la imagen de cada punto. La imagen esta llena de estos pequeños cuadritos, todos ellos representan diferenciales invertibles, esto nos permitirá asegurar la invertibilidad de f en al menos una vecindad.

Más adelante…

En la siguiente entrada demostraremos el teorema de la función inversa, inciso por inciso. Es importante que estes familiarizado con los resultados de esta entrada, pues serán parte importante de la demostración.

Tarea moral

  1. ¿Qué diría el teorema de la función inversa para campos vectoriales f:R2R2? ¿Se puede usar para f(r,θ)=(rcos(θ),rsin(θ))? Si es así, ¿para qué valores de r y θ? ¿Qué diría en este caso explícitamente?
  2. Explica por qué el corolario que enunciamos en efecto se deduce de manera inmediata de lo discutido en la sección correspondiente.
  3. Revisa todas las desigualdades que usamos en esta entrada. ¿Qué resultado estamos usando? ¿Cuándo se darían estas igualdades?
  4. Demuestra que el determinante de una matriz es una función continua en términos de las entradas de la matriz. Usa esto para demostrar que si AMn(R) es una matriz y B es una matriz muy cercana a A, entonces B también es invertible.
  5. Demuestra que si una transformación T es diagonalizable, entonces en el teorema de caracterización de invertibilidad se puede usar como ϵ al mínimo de la expresión |λ| variando sobre todos los eigenvalores λ de T.

Entradas relacionadas