Archivo de la etiqueta: calculo

Seminario de Resolución de Problemas: El teorema del valor extremo

Introducción

En una entrada anterior, acerca de funciones continuas, mencionamos dos teoremas fundamentales que estas funciones satisfacen: el teorema del valor intermedio y el teorema del valor extremo. Ya hablamos acerca del teorema del valor intermedio en una entrada anterior. El objetivo de esta entrada es mencionar aplicaciones del teorema del valor extremo.

Como recordatorio, el teorema del valor extremo o teorema de los valores extremos nos dice que si una función f(x) es continua en un intervalo cerrado [a, b], entonces existen valores c y d en [a, b] tales que f(c) \leq f(x) \leq f(d) para toda x en el intervalo [a, b].

En otras palabras, lo que nos dice el teorema es que si una función es continua en un intervalo cerrado, tenemos que la función debe alcanzar un valor máximo y un valor mínimo dentro del intervalo.

Dos teoremas para funciones derivables

Aprovecharemos para mencionar dos teoremas importantes que se ocuparán más adelante. Las demostraciones de dichos teoremas tienen que ver con la aplicación del teorema del valor extremo, estos teoremas son el teorema de Rolle y el teorema del valor medio (no confundir con el teorema del valor intermedio).

Teorema de Rolle. Sean a<b reales y f:[a,b]\to\mathbb{R} una función continua en el intervalo [a, b] y derivable en (a, b). Se tiene que si f(a)=f(b), entonces existe c en (a, b) tal que f^\prime(c)=0.

Sugerencia pre-demostración. Por el teorema del valor extremo, la función debe alcanzar un máximo y un mínimo en el intervalo. Divide en casos de acuerdo a dónde están estos valores, si en los extremos o no.

Demostración: Como f(x) es una función continua en [a, b], por el teorema del valor extremo tenemos que f(x) alcanza un valor máximo y un valor mínimo en el intervalo [a, b]. Tenemos entonces los siguientes casos.

  • Caso i: Si el valor máximo y mínimo se encuentran en los extremos del intervalo, tenemos que la función f(x) tiene que ser constante dado que f(a)=f(b). y se tiene que f^\prime(c)=0 para todo c en [a, b].
  • Caso ii: Si el valor mínimo o máximo no están en los extremos. Sean c_1 y c_2 en (a, b), los valores en los que la función alcanza su mínimo y máximo respectivamente. Alguno de estos no está en los extremos. Como f(x) es derivable en (a, b), tenemos que también va a ser derivable en alguno de los puntos c_1 y c_2, teniendo que f^\prime(c_1)=0 o f^\prime(c_2)=0, así que basta con tomar c=c_1 o c=c_2.

\square

Teorema del valor medio. Sean a<b reales y f:[a,b]\to\mathbb{R} una función continua en [a, b] y diferenciable en (a, b). Entonces existe un número c en (a, b) tal que

\frac{f(b)-f(a)}{b-a}=f^\prime(c).

Demostración: Consideremos la siguiente función auxiliar:

g(x)=(f(b)-f(a))x-(b-a)f(x)

Tenemos que g(x) es continua en [a, b] y además es derivable en (a,b). La derivada de g(x) está dada por

g^\prime(x)=f(b)-f(a)-(b-a)f^\prime(x)

Como g(x) es continua en [a, b], tenemos que por el teorema del valor extremo, la función alcanza un máximo y un mínimo en el intervalo [a, b]. Haciendo las cuentas, g(a)=g(b), de modo que si el máximo y mínimo ocurren en los extremos, entonces g es constante y toda c\in (a,b) satisface g'(c)=0

En otro caso, sea c\in(a, b) el valor en donde g(x) alcanza su mínimo o su máximo. Tenemos que g^\prime(c)=0.

Así, como g^\prime(c)=f(b)-f(a)-(b-a)f^\prime(c), tenemos que:

0=f(b)-f(a)-(b-a)f^\prime(c)

(b-a)f^\prime(c)=f(b)-f(a)

f^\prime(c)=\frac{f(b)-f(a)}{b-a}

\square

Alternativamente, en la función anterior pudimos haber aplicado el teorema de Rolle directamente a la función g. En las siguientes entradas veremos aplicaciones de estos resultados a problemas concretos.

Aplicación del teorema del valor extremo a un problema

Problema. Se tiene un circulo de radio r, y una tangente L que pasa por un punto P de la circunferencia. De un punto cualquiera R en la circunferencia se traza una paralela a L que corta a la circunferencia en Q. Determina el área máxima que puede tener el triángulo PQR.

Sugerencia pre-solución. Antes que nada, haz una figura. Usa el teorema del valor extremo para asegurar la existencia del valor máximo. Para ello, necesitarás construir una función continua cuyo valor sea el área buscada. Puedes usar argumentos de simetría para conjeturar cuándo se alcanza el valor máximo.

Solución. Hacemos el siguiente diagrama para entender mejor el problema.

Diagrama del enunciado del problema

Fijémonos que las condiciones de la altura y la base del triángulo PQR se pueden describir mediante la siguiente figura:

Condiciones para la altura y base del triángulo

Notemos que la altura del triángulo está dada por r+h, donde h puede variar entre -r y r. Este dibujo también nos es de ayuda para determinar el valor de la base. Por el teorema de Pitágoras y sabiendo que la distancia del centro C a los puntos R y Q es igual a r, tenemos que la base del triángulo es igual a 2\sqrt{r^2-h^2}.

Así, el área del triángulo está dada por (\sqrt{r^2-h^2})(r+h), pero como h varía, nos conviene ver el área en función de h.

A(h)=\sqrt{r^2-h^2}(r+h),

La función A(h) es una función continua en el intervalo [-r, r].

Notemos que cuando h toma los valores de -r y r, el valor del área es nulo, es decir que en estos valores alcanza el mínimo, lo cual quiere decir que por el teorema del valor extremo, el valor máximo lo alcanza en algún valor en (-r, r).

Si derivamos la función A(h), tenemos

A^\prime(h)=\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}.

Como sabemos que hay un máximo en el intervalo (-r, r) y la derivada en este punto máximo debe ser igual a cero, hacemos A^\prime(h)=0.

Así,

\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}=0.

Resolviendo la ecuación tenemos que

h=\frac{r}{2}.

Así, el área máxima del triángulo PQR es

    \[A=\sqrt{r^2-\left(\frac{r}{2}\right)^2}\left(r+\frac{r}{2}\right)=\frac{3\sqrt{3}r^2}{4}.\]

\square

Más ejemplos

Se pueden encontrar más problemas de aplicación del teorema del vaalor extremo en la Sección 6.4 del libro Problem Solving through Problems de Loren Larson.

Seminario de Resolución de Problemas: El teorema del valor intermedio

Introducción

El teorema del valor intermedio nos dice que si f: [a, b] \to \mathbb{R} es una función continua, entonces para todo y entre f(a) y f(b), existe un número c \in [a, b] tal que f(c)=y. La forma de pensar este teorema es que «las funciones continuas no se pueden saltar valores que quedan entre dos valores que ya tomaron», o bien «las funciones continuas no dan brincos en su imagen».

Veamos algunos problemas que se resuelven usando este teorema

Una aplicación directa del teorema del valor intermedio

Problema 1. Muestra que la ecuación 2x^3+7x^2-27x=-18 tiene una solución en el intervalo [-7,-5].

Sugerencia pre-solución. Formula un problema equivalente definiendo una función continua f para la cual si f(x)=0, entonces x es solución a la ecuación.

Solución. La ecuación la podemos ver como 2x^3+7x^2-27x+18=0. Consideremos la función

    \[f(x)=2x^3+7x^2-27x+18.\]

Como f(x) es una función polinomial, sabemos que es continua en \mathbb{R}, así que es continua en el intervalo [-7,-5]. Lo que queremos ver es que existe un c entre -7 y -5, tal que f(c)=0. Para esto, tenemos que evaluar la función en -7 y en -5.

Tenemos que:

f(-7)=-136 y f(-5)=78.

Tenemos que 0 está entre -136 y 78. Así, por el teorema del valor intermedio, debe de existir un número c entre -7 y -5 de tal forma que f(c)=0. Por lo tanto 2x^3+7x^2-27x=-18 tiene una solución entre -5 y -7.

\square

Notemos que no se encontró el valor de la raíz de la ecuación, sin embargo mostramos la existencia de esta. Esta es una de las características del teorema del valor intermedio: exhibir la existencia de algo sin necesidad de encontrarlo explícitamente.

Definir una buena función

En ocasiones podemos definir dos funciones para un problema y hacerlas interactuar para obtener una sola función continua que nos permite resolver un problema.

Problema 2. Un montañista empezó a escalar una montaña el sábado a las 8:00 hrs y llegó a la cima a las 18:00 hrs del mismo día. Decidió pasar la noche en la cima de la montaña. El día domingo empezó a descender a las 8:00 hrs y llegó al punto de partida a las 18:00 hrs. Prueba que hubo una hora en la que en ambos días estuvo a la misma altura de la montaña.

Sugerencia pre-solución. Plantea el problema usando dos funciones continuas que denoten la altura conforme pasa el tiempo en ambos días. Tienes mucha flexibilidad, así que usa notación efectiva para simplificar los cálculos.

Solución. Veamos que para este problema, podemos establecer dos funciones continuas para describir el cambio de altura con respecto al tiempo en horas, una para el ascenso y otra para el descenso del montañista en ambos días.

Sean h_1(t), y h_2(t) las funciones que representan el ascenso y el descenso del montañista respectivamente. En otras palabras, h_1(t) y h_2(t) denotan la altura en la que está el montañista tras t horas después de haber comenzado su ascenso y descenso, respectivamente. Como amabas funciones son continuas en el intervalo de tiempo [0, 10] (esto es porque tardó 10 horas para ascender y 10 horas para descender), tenemos que la función g(t)=h_2(t)-h_1(t) tiene que ser continua en [0, 10] también.

Ahora bien, sea M la altura en la cima de la montaña. Tenemos lo siguiente:

h_1(0)=0, h_1(10)=M y h_2(0)=M, h_2(10)=0.

Así, g(0)=M y g(10)=-M. A su vez, 0 está entre -M y M, por lo que aplicando el teorema del valor intermedio, debe de existir un t_0 en el intervalo [0, 10] tal que g(t_0)=0.

Y como

g(t)=h_2(t)-h_1(t),

entonces

g(t_0)=h_2(t_0)-h_1(t_0)

0=h_2(t_0)-h_1(t_0)

h_1(t_0)=h_2(t_0).

Con esto podemos concluir que en el tiempo t_0 el día domingo estuvo a la misma altura que el día sábado al tiempo t_0.

\square

Definir un buen intervalo

En algunas ocasiones no es directo qué valores tenemos que usar como los extremos del intervalo al que aplicaremos el teorema del valor intermedio. Un ingrediente adicional que se necesita en el siguiente problema es elegir de manera correcta el extremo derecho.

Problema 3. Prueba que si n es un entero positivo y x_0 > 0, entonces existe un único número positivo x tal que x^n=x_0.

Sugerencia pre-solución. Necesitarás modificar el problema un poco. Se quiere encontrar una solución a x^n=x_0. Limítate a encontrarla en el intervalo [0,c] para una buena elección de c.

Solución. Sea c un número mayor que 1 de tal forma que 0<x_0<c. Si consideramos la función f(x)=x^n, tenemos que dicha función es continua en el intervalo [0, c], y tenemos que

f(0)=0 y f(c)=c^n.

Como

    \[0<x_0<c<c^n,\]

tenemos que x_0 está en el intervalo (0,c), y por el teorema del valor intermedio, tenemos que existe x en el intervalo (0,c) tal que f(x)=x_0, que usando la definición de f quiere decir que

    \[x^n=x_0.\]

No puede existir otro además de x_0 ya que la función f(x)=x^n es creciente en el intervalo [0,c].

\square

Más ejemplos

Puedes encontrar más problemas que se pueden resolver usando el teorema del valor intermedio en el libro Problem Solving Strategies de Loren Larson, en la Sección 6.2.

Seminario de Resolución de Problemas: Funciones continuas

Introducción

En entradas anteriores platicamos de propiedades aritméticas de los números enteros, del anillo de enteros módulo n y de los números complejos. Vimos cómo pueden ser de utilidad para resolver problemas de matemáticas de distintos tipos. Ahora veremos temas de funciones continuas.

En esta entrada, y las subsecuentes, entraremos al mundo del cálculo y de la continuidad. En el transcurso de diez entradas veremos cómo aprovechar distintas herramientas de continuidad, cálculo diferencial e integral.

Seguiremos con la costumbre de no demostrar los teoremas principales que usemos, pero podemos recomendar al lector las siguientes fuentes para consultar los fundamentos

El orden de presentación de los temas viene del libro Problem Solving Strategies de Loren Larson.

Recordatorio de límites y continuidad

Sea A un subconjunto de \mathbb{R} y f:A\to \mathbb{R} una función. Intuitivamente, el límite de f(x) cuando x tiende a a es c si al acercarnos a x en A tenemos que f(x) se acerca a c.

De manera formal, tenemos que

    \[\lim_{x\to a} f(x) = c\]

si para todo \epsilon>0 tenemos que existe un \delta >0 tal que si x\in A y |x-a|<\delta, entonces |f(x)-c|<\epsilon. Esta es la definición épsilon-delta. Otra forma de denotar lo mismo es decir que f(x)\to c cuando x\to a. Los límites se comportan bien con las operaciones.

Proposición. Sean f:A\to \mathbb{R} y g:A\to \mathbb{R} funciones. Sea a\in A. Si f(x)\to c y g(x)\to d cuando x\to a, entonces

  • f(x)+g(x)\to c+d cuando x\to a
  • f(x)g(x)\to cd cuando x\to a
  • Si d\neq 0, f(x)/g(x)\to c/d cuando x\to a

Definición. Sea f:A\to \mathbb{R} una función real y a\in A. Decimos que f es continua

  • en a si f(x)\to f(a) cuando x\to a.
  • en S\subset A si es continua en todo a\in S.

Si f es continua en A, simplemente decimos que es continua.

Como los límites se comportan bien con las operaciones, tenemos que las funciones continuas también se comportan bien con las operaciones.

Proposición. Sean f:A\to \mathbb{R} y g:A\to \mathbb{R} funciones. Sea a\in A. Si f y g son continuas en a, entonces

  • f+g es continua en a
  • fg es continua en a
  • Si g(a)\neq 0, f/g es continua en a

Ejercicio. Muestra que \frac{x^2+3x+1}{x+1} es continua para todo x\neq -1.

Sugerencia. No uses la definición épsilon-delta directamente en la función, pues será complicado. Demuestra que f(x)=x es continua con la definición epsilon-delta y de ahí usa las demás propiedades enunciadas en las proposiciones.

Funciones continuas y sucesiones

Las funciones continuas y las sucesiones están cercanamente relacionadas. Recuerda que una sucesión de reales es un conjunto ordenado de reales, uno por cada entero positivo, al cual denotaremos así:

    \[\{x_n\}=\{x_1,x_2,x_3,x_4,\ldots\}.\]

Decimos que la sucesión \{x_n\} converge a c, en símbolos

    \[\lim_{n\to \infty} x_n = c\]

si para cada \epsilon >0 existe un natural N tal que si n\geq N, entonces |x_n-c|<\epsilon. También decimos esto como x_n\to c cuando n\to \infty, o simplemente x_n\to c.

Teorema. La función f:A\to \mathbb{R} es continua en a\in A si y sólo si para toda sucesión de reales \{x_n\} en A tal que \{x_n\}\to a se tiene que f(x_n)\to f(a).

Este teorema tiene múltiples usos. Nos dice que para verificar que una sucesión sea continua en un punto a, nos basta ver qué le hace a todas las sucesiones que convergen a a. Si alguna de ellas no converge a f(a), entonces la función no es continua. Si todas ellas convergen a f(a), entonces la función sí es continua. Veamos un ejemplo de su aplicación

Problema. Considera la función f:[0,1]\to \mathbb{R} la función tal que a cada irracional le asigna 0 y a cada racional p/q (expresado con p y q positivos y primos relativos) le asigna 1/q. Estudia la continuidad de esta función.

Sugerencia pre-solución. La continuidad de la función se comporta distinto para los racionales y para los irracionales. Para ver qué sucede en los racionales, acércate con una sucesión de irracionales.

Solución. Demostraremos que f es continua en los irracionales y no es continua en los racionales.

Tomemos un racional r=p/q<1. Observa que la sucesión x_n=r+\frac{\sqrt{3}}{n} para n suficientemente grande cae en [0,1] y x_n\to r. Cada término de la sucesión es irracional. Así, f(x_n)=0 para todo término, de modo que f(x_n)\to 0\neq 1/q = f(r). Esto muestra que f no es continua en r. Para r=1 podemos hacer el mismo truco con x_n=r-\frac{\sqrt{3}}{n} para ver que no es continua.

Tomemos ahora un número irracional r\in[0,1]. Tenemos que f(r)=0. Mostraremos que para toda sucesión \{x_n\} tal que x_n\to r, tenemos que f(x_n)\to 0. Tomemos M un entero positivo. Consideremos el conjunto A_M de todos los números racionales en [0,1] con denominador a lo más M.

Como r es irracional, las distancias de r a los números de A_M son todas positivas, así que su mínimo es un real positivo \epsilon. Como x_n\to r, existe un N tal que si n\geq N, entonces |x_n-r|<\epsilon. Así, para n\geq N, no se puede que x_n esté en A_M. De este modo, para n\geq N tenemos que |f(x_n)|<1/M. Esto muestra que f(x_n)\to 0. Así, f es continua en los irracionales.

\square

Por supuesto, algunas veces es útil regresar a la definición epsilon-delta para funciones continuas.

Problema. Sea f:\mathbb{R}\to\mathbb{R} una función inyectiva y continua tal que f(2x-f(x))=x y tal que tiene por lo menos un punto fijo. Muestra que f(x)=x para todo x\in \mathbb{R}.

Sugerencia pre-solución. Antes de intentar cualquier idea de cálculo, hay que demostrar que si se cumple f(y)=y+r, entonces f(y+nr)=(y+nr)+r. Para demostrar esto para n negativa, usa inducción. Para n positiva necesitarás jugar un poco con la hipótesis. Aplica la hipótesis f(2x-f(x))=x para x=f(z) y usa la inyectividad. De ahí obtendrás una igualdad que te servirá para encontrar f(y+nr) para n positivas.

Solución. La primera observación es que el conjunto de puntos fijos de una función continua es cerrado, pues si \{x_n\} es una sucesión de puntos fijos que converge a un punto c, entonces por un lado \{f(x_n)\}=\{x_n\} también converge a c, y por otro por continuidad converge a f(c). Como los límites, cuando existen, son únicos, tenemos que f(c)=c.

Si f(y)\neq y para alguna y\in \mathbb{R}, entonces tendremos f(y)=y+r para alguna r\neq 0. Mostraremos que f(y+nr)=(y+nr)+r para todo entero n. Aplicando la hipótesis f(2x-f(x))=x para x=y, obtenemos que f(y-r)=y=(y-r)+r, de modo que inductivamente tenemos f(y-nr)=(y-nr)+r para n entero positivo.

Aplicando la hipótesis f(2x-f(x))=x para x=f(x) obtenemos f(2f(z)-f(f(z)))=f(z), de modo que por inyectividad tenemos 2f(z)-f(f(z))=z. Usando esta ecuación para z=y obtenemos que 2f(y)-f(f(y))=y, de donde f(y+r)=2(y+r)-y=(y+r)+r, y de aquí inductivamente f(y+nr)=(y+nr)+r para n enteros positivos. De esta forma, f(y+nr)=(y+nr)+r para todo entero.

Ahora sí viene la parte en la que usamos la continuidad. Supongamos que f(x)\neq x. Sea \epsilon=|f(x)-x|>0. Como f es continua en x, existe un \delta>0 que podemos suponer menor a \frac{\epsilon}{4} tal que si |z-x|<\delta, entonces |f(z)-f(x)|<\frac{\epsilon}{4}.

Sea x_0 un punto frontera del conjunto de puntos fijos. Como f es continua en x_0, podemos encontrar un \alpha>0 y \alpha<\delta tal que si |w-x_0|<\alpha, entonces |f(w)-f(x_0)|<\delta. Como el conjunto de puntos fijos es cerrado, x_0 está en él. Ya que x_0 es punto frontera, existe un y tal que f(y)\neq y y |x_0-y|\leq \alpha. Para este y tenemos por las cotas que hemos encontrado y la desigualdad del triángulo que

    \[|f(y)-y|\leq |f(y)-f(x_0)|+|x_0-y|\leq \delta +\alpha <2\delta.\]

Así, r=f(y)-y es un número de norma entre 0 y 2\delta, de modo que existe una n para la cual y+nr \in (x-\delta,x+\delta). Por lo que probamos previamente, f(y+nr)=(y+nr)+r. A partir de todo esto concluimos que:

    \begin{align*}\epsilon&=|f(x)-x|\\&\leq |f(x)-f(y+nr)|+|f(y+nr)-x|\\&<\frac{\epsilon}{4}+|(y+nr)-x|+|r|\\&<\frac{\epsilon}{4}+3\delta\\&<\frac{\epsilon}{4}+\frac{3\epsilon}{4}=\epsilon.\end{align*}

Esto es una contradicción, así que todos los reales deben ser puntos fijos de f.

\square

Dos teoremas importantes de continuidad

Las funciones continuas satisfacen dos propiedades muy importantes.

Teorema (teorema del valor intermedio). Sea f:[a,b]\to \mathbb{R} una función continua. Entonces para todo y entre f(a) y f(b) existe un real c \in [a,b] tal que f(c)=y.

Aquí, si f(a)\leq f(b) entonces «entre f(a) y f(b)» quiere decir en el intervalo [f(a),f(b)] y si f(b)\leq f(a), quiere decir en el intervalo [f(b),f(a)]. Dicho en otras palabras, si una función continua toma dos valores, entonces toma todos los valores entre ellos.

Teorema (teorema del valor extremo). Sea f:[a,b] \to \mathbb{R} una función continua. Entonces existen números c y d en [a,b] para los cuales f(c)\leq f(x) \leq f(d) para todos los x en [a,b].

Dicho de otra forma, una función continua definida en un intervalo cerrado «alcanza su máximo y su mínimo».

En siguientes entradas hablaremos de aplicaciones de estos teoremas. Por el momento sólo los enunciamos, y en la siguiente sección demostraremos uno de ellos.

El método de la bisección de intervalos

Una de las herramientas más útiles para trabajar con reales y con funciones continuas es el método de la bisección de intervalos. Se trata a grandes rasgos de lo siguiente:

  • Se comienza con un intervalo [a,b]. Definimos a_0=a y b_0=b.
  • Partimos ese intervalo por su punto medio m_0=m en dos intervalos [a,m] y [m,b]. En alguno de esos dos pasa algo especial. Si es en el primero, definimos a_1=a, b_1=m. Si es en el segundo, definimos a_1=m, b_1=b, para conseguir un intervalo [a_1,b_1]\subset [a_0,b_0] especial.
  • Continuamos recursivamente. Ya que definimos al intervalo [a_n,b_n], consideramos a su punto medio m_n. De entre los intervalos [a_n,m_n] y [m_n,b_n] elegimos a uno de ellos que sea «especial» para definir [a_{n+1},b_{n+1}].

Los a_i forman una sucesión no decreciente acotada superiormente por b y los b_i una sucesión no creciente acotada inferiormente por a. De esta forma, ambas sucesiones tienen un límite. Además, notemos que |b_n-a_n|=|b-a|/2^n, de modo que |b_n-a_n|\to 0, por lo que ambas situaciones convergen al mismo límite L, y este límite está en todos los intervalos [a_n,b_n]. Si elegimos a los intervalos [a_n,b_n] de manera correcta, podemos hacer que este límite L tenga propiedades especiales.

Veamos cómo aplicar esta idea para demostrar el teorema del valor extremo.

Demostración (teorema del valor extremo). Comenzamos con una función contínua f:[a,b]\to \mathbb{R}. Basta con probar que f alcanza su máximo, pues para ver que alcanza su mínimo basta aplicar las siguientes ideas a -f.

Usaremos el método de bisección de intervalos. Definimos a_0=a y b_0=b. Suponiendo que ya definimos a_n y b_n, consideremos el punto medio m_n del intervalo [a_n,b_n].

  • Si algún x en [a_n,m_n] cumple que f(x)\geq f(y) para todo y\in [m_n,b_n], elegimos a_{n+1}=a_n y b_{n+1}=m_n.
  • En otro caso, para todo x en [a_n,m_n] tenemos algún y\in [m_n,b_n] que cumple f(x)<f(y) y elegimos a_{n+1}=m_n y b_{n+1}=b_n.

En cualquier caso, notemos que se cumple que «para cualquier x en el intervalo no elegido hay una y en el intervalo sí elegido tal que f(y)\geq f(x)«.

Como discutimos anteriormente, las sucesiones \{a_n\} y \{b_n\} convergen a un mismo límite d. Afirmamos que f(d)\geq f(x) para todo x en [a,b]. Si x=d, esto es claro. Si no, x\neq d y definimos x_0=x.

Vamos a definir recursivamente una sucesión \{x_n\} para la cual

    \[f(x_0)\leq f(x_1)\leq f(x_2)\leq f(x_3)\leq \ldots\]

mediante un proceso que haremos mientras x_n\neq d.

Ya que definimos x_n tal que x_n\neq d, notemos que d y x_n están en el mismo intervalo [a_0,b_0], pero como son distintos existe un primer m\geq 1 tal que en el intervalo [a_m,b_m] está d pero x_n no. Como es la menor m, sí están ambos en el intervalo [a_{m-1},b_{m-1}].

Por cómo definimos la elección de intervalos, hay un y en el intervalo [a_m,b_m] tal que f(y)\geq f(x_n). Si y=d, terminamos (por la cadena de desigualdades). Si no, definimos x_{n+1} como este y. Así, cuando el proceso se detiene, terminamos por la cadena de desigualdades. Si el proceso no se detiene, tenemos una sucesión infinita \{x_n\} que converge a d, de modo que f(d)=\lim{f(x_n)}\geq f(x_0)=f(x), pues cada término es mayor o igual a f(x_0). Esto muestra la desigualdad f(d)\geq f(x) que queríamos.

\square

Más problemas

Se pueden encontrar más problemas de este tema en la Sección 6.1 del libro Problem Solving through Problems de Loren Larson.

Teorema de la función inversa: motivación y ejemplo

Introducción

Imagina, por un momento, que en un futuro trabajas en la Agencia Espacial Mexicana (AEM). De repente, llega la directora y trae una función en las manos. «Para una misión crítica necesito que me conviertas esta función en una función invertible, cuanto antes posible». Te da la función. Le respondes «Ok, directora y, ¿cómo la quiere o qué?». Pero es demasiado tarde. Ya salió y hay que ponerse a trabajar. Entonces tomas la función, la pones en el gis y comienzas a estudiarla en el pizarrón.

Resulta que es una función de varias variables. Específicamente, es la función que pasa de coordenadas polares a coordenadas cartesianas. Es decir, es la función F:\mathbb{R}^2 \to \mathbb{R}^2 dada por:

    \[F(r,\theta)=(r\cos\theta, r \sin\theta).\]

La función sí es suprayectiva, así que ya va parte del trabajo hecho. Pero el problema es que no es inyectiva. Por ejemplo,

    \[F\left(1,\frac{\pi}{2}\right)=\left(\cos\frac{\pi}{2},\sin\frac{\pi}{2}\right)=(0,1)=F\left(1,\frac{5\pi}{2}\right).\]

Peor aún, para todo \theta \in \mathbb{R} se tiene que F(0,\theta)=(0,0).

Pero la situación no es tan terrible. Una forma de solucionarla es restringir el dominio de la función. Si en vez de pensarla en una función F:\mathbb{R}^2\to \mathbb{R}^2 la pensamos como una restricción F:U\to V para algunos conjuntos U y V, entonces muy posiblemente la podamos «convertir» en una función biyectiva.

No podemos ser demasiado arbitrarios. Por ejemplo, si tomamos U=\{(0,0)\} y V=\{(0,0)\}, entonces claramente la restricción es una biyección, pero está muy chafa: sólo nos quedamos con un punto. Por esta razón, vamos a poner una meta un poco más ambiciosa y a la vez más concreta: lograr que U y V sean conjuntos abiertos alrededor de los puntos x y y:=F(x) para algún x\in \mathbb{R}^2. Si lo logramos, habremos encontrado una biyección «cerquita de x» en conjuntos «más gorditos». Para algunos puntos x lo podemos hacer, y para algunos otros puntos x es imposible. Veamos ejemplos de ambas situaciones.

Si x=\left(\sqrt{2},\frac{\pi}{4}\right), entonces y=\left(\sqrt{2}\cos \frac{\pi}{4}, \sqrt{2}\sin\frac{\pi}{4}\right)=(1,1). En este caso, podemos elegir una vecindad pequeña U alrededor de x y tomar V:=F(U), pues los otros puntos w con F(x)=F(w) están lejos (están a brincos verticales de tamaño 2\pi de x). Para resolver el problema de la AEM, basta restringir F a U.

Sin embargo, si x=\left(0, \frac{\pi}{4}\right), entonces y=\left(0,0). Sin importar qué tan pequeña tomemos la vecindad abierta U alrededor de x, vamos a seguir tomando puntos w sobre la recta r=0, para los cuales sucede F(x)=0=F(w). Si la directora de la AEM insiste en que haya un punto con r=0, entonces no hay invertibilidad en todo un abierto alrededor de este punto. Esperemos que la misión no dependa de eso.

Aplicando el teorema de la función inversa

El teorema de la función inversa es una herramienta que da condiciones suficientes para que una función F:\mathbb{R}^n\to \mathbb{R}^n pueda invertirse localmente «cerca» de un punto de su dominio. Podemos utilizar este resultado cuando la función que estudiamos es «bien portada», donde esto quiere decir que sea continuamente diferenciable. Si bien hay ligeras variantes en la literatura, el enunciado que presento aquí es el siguiente:

Teorema de la función inversa

Sea F:\mathbb{R}^n\to \mathbb{R}^n una función de clase \mathcal{C}^1 con matriz Jacobiana DF. Supongamos que F(a)=b y que DF(a) es invertible. Entonces existen vecindades abiertas U y V de a y b respectivamente para las cuales:

a) F:U\to V es una biyección,
b) su inversa F^{-1}:V\to U es de clase \mathcal{C}^1 y
c) DF^{-1}(b)=DF(a)^{-1}.

En otra entrada hablo de la intuición de este teorema, así como de su demostración. Por el momento sólo me enfocaré en dar un ejemplo de cómo podemos usarlo.

Regresemos al ejemplo de la Agencia Espacial Mexicana. La función que tenemos es F:\mathbb{R}^2\to \mathbb{R}^2 que está dada por

    \[F(r,\theta)=(F_1(r,\theta),F_2(r,\theta))=(r\cos\theta, r \sin\theta).\]

Para usar el teorema de la función inversa, tenemos que estudiar la invertibilidad de DF, su matriz Jacobiana. Esta está construida a partir de las derivadas parciales de las funciones coordenadas como sigue:

    \[DF(r,\theta)= \begin{pmatrix}\frac{\partial F_1}{\partial r}(r,\theta) & \frac{\partial F_1}{\partial \theta}(r,\theta)\\\frac{\partial F_2}{\partial r}(r,\theta) & \frac{\partial F_2}{\partial \theta}(r,\theta)\end{pmatrix}= \begin{pmatrix}\cos \theta & -r\sin \theta\\\sin \theta & r \cos \theta.\end{pmatrix}\]

Para estudiar su invertibilidad, notamos que su determinante es

    \begin{align*}\det(DF(r,\theta))&=\cos \theta \cdot r\cos \theta - \sin \theta \cdot (-r\sin \theta) \\&= r\cos^2\theta+r\sin^2\theta \\&= r,\end{align*}

y que es distinto de 0 si y sólo si r\neq 0. Esto coincide con las observaciones que hicimos «a mano»: la función es invertible localmente en (r,\theta) si r\neq 0. Cuando r=0, la invertibilidad no está garantizada.

El teorema de la función inversa tiene más implicaciones. Nos dice además que la inversa F^{-1} también es continuamente diferenciable y que su derivada es la inversa de F. Como ejemplo, consideremos el punto \left(\sqrt{2},\frac{\pi}{4}\right). Tenemos que

    \[F\left(\sqrt{2},\frac{\pi}{4}\right) = (1,1),\]

que

    \[DF\left(\sqrt{2},\frac{\pi}{4}\right) = \begin{pmatrix}\frac{1}{\sqrt{2}}& -1\\ \frac{1}{\sqrt{2}} & 1\end{pmatrix},\]

y que \det\left(DF\left(\sqrt{2},\frac{\pi}{4}\right)\right)=\sqrt{2}.

Así, F es invertible localmente alrededor de \left(\sqrt{2},\frac{\pi}{4}\right), su inversa es continuamente diferenciable y además

    \[D(F^{-1})(1,1)=DF\left(\sqrt{2},\frac{\pi}{4}\right)^{-1} =\frac{1}{\sqrt{2}} \begin{pmatrix}1 & 1\\-\frac{1}{\sqrt{2}}& \frac{1}{\sqrt{2}}\end{pmatrix}.\]

Esto termina la motivación y el ejemplo del teorema de la función inversa. Si quieres entender un poco mejor la intuición detrás del teorema, así como su demostración, puedes darte una vuelta por esta otra entrada.

¿Ahora qué?

Si te gustó esta entrada, puedes compartirla o revisar otras relacionadas con matemáticas a nivel universitario:

Una prueba del teorema de la función inversa

Introducción

Uno de los teoremas clave de los cursos de cálculo de varias variables es el teorema de la función inversa (TFI). En la Facultad de Ciencias de la UNAM se estudia en la materia Cálculo III. En esta entrada me gustaría presentar de la manera más auto-contenida posible este resultado.

Platicaré un poco de las definiciones de los términos que aparecen en el enunciado, así como de la intuición de por qué el teorema es cierto. Después presentaré los ingredientes principales para la prueba «clásica». Finalmente, presentaré la prueba intentando motivarla y dividiéndola en secciones pequeñas.

El enunciado con el que trabajaremos es el siguiente:

Teorema de la función inversa

Sea F:\mathbb{R}^n\to \mathbb{R}^n una función de clase \mathcal{C}^1 con matriz Jacobiana DF. Supongamos que F(a)=b y que DF(a) es invertible. Entonces existen vecindades abiertas U y V de a y b respectivamente para las cuales:

a) F:U\to V es una biyección,
b) su inversa F^{-1}:V\to U es de clase \mathcal{C}^1 y
c) DF^{-1}(b)=DF(a)^{-1}.

Lo que nos espera es aproximadamente lo que está en el siguiente diagrama, donde las flechas indican a grandes rasgos qué resultado se usa para probar qué otro.

Definiciones e intuición

La función con la que comenzamos es una función de \mathbb{R}^n a \mathbb{R}^n, así que la podemos descomponer en sus funciones coordenadas de la siguiente manera:

    \[F(x)=(F_1(x), F_2(x),\ldots, F_n(x))\]

Que la función sea de clase \mathcal{C}^1 quiere decir que las derivadas parciales con respecto a cada una de las variables existen, que estas son continuas y que localmente F «se comporta» como la transformación lineal correspondiente a la matriz Jacobiana siguiente:

    \[DF(x)=\begin{pmatrix}\frac{\partial F_1}{\partial x_1}(x) & \cdots & \frac{\partial F_1}{\partial x_n}(x)\\\vdots & \ddots & \vdots \\\frac{\partial F_n}{\partial x_1}(x) & \cdots & \frac{\partial F_n}{\partial x_n}(x)\end{pmatrix}\]

Entonces, a grandes rasgos lo que nos dice el teorema de la función inversa es lo siguiente. Si F se comporta como una transformación lineal T invertible «cerquita» del punto a, entonces en realidad es invertible «cerquita» del punto a y más aún, la inversa se comporta como la transformación lineal T^{-1} «cerquita» del punto b=f(a).

Suena bastante razonable, pero hay algunos aspectos que son sorprendentes. Uno es que se garantiza la invertibilidad en todo un abierto U. Si no se requiriera que fuera abierto, sería chafa porque podríamos tomar U=\{a\} y V=\{b\} y la restricción sería trivialmente invertible. Lo otro es que el teorema también garantiza que la inversa es diferenciable, lo cual de entrada no es evidente.

Para la prueba necesitamos hablar de dos normas. Cuando tengamos un vector x=(x_1,\ldots,x_n) en \mathbb{R}^n, \norm{x} denotará la norma euclideana

    \[\norm{x}=\sqrt{\sum_{i=1}^nx_i^2.\]

Necesitaremos también la norma de Frobenius. Como recordatorio, para una matriz A=(a_{ij}) de n\times n, su norma de Frobenius está dada por

    \[\norm{A}=\sqrt{\sum_{i=1}^n\sum_{j=1}^n a_{ij}^2},\]

o equivalentemente, si A_i es el i-ésimo renglón de A, tenemos que

    \[\norm{A}=\sqrt{\sum_{i=1}^n\norm{A_{i}}^2},\]

pues ambas expresiones suman todas las entradas de la matriz al cuadrado.

Ingredientes para la prueba

Pasemos ahora a algunos resultados auxiliares que es más cómodo probar desde antes. Algunos de ellos son más generales que lo que enuncio (e incluso con la misma prueba), pero con el fin de que la demostración sea auto-contenida, he decidido enunciar sólo lo que necesitamos.

Teorema del punto fijo de Banach (para \mathbb{R}^n)

Sea X un compacto de \mathbb{R}^n y \varphi:X\to X una función continua. Supongamos que \varphi es una contracción, es decir, que existe un real 0<\lambda<1 para el cual \norm{\varphi(x)-\varphi(y)}\leq\lambda \norm{x-y} para todos x,y \in X.

Entonces \varphi tiene un único punto fijo, es decir existe uno y sólo un punto x_0\in X para el cual \varphi(x_0)=x_0.

Para probar el teorema del punto fijo de Banach basta tomar cualquier punto inicial x_1 y considerar la sucesión \{x_m\} construida recursivamente con la regla x_m=\varphi(x_{m-1}) para m\geq 2. Usando que \varphi es contracción y la fórmula para series geométricas se puede mostrar inductivamente que para m>m' se tiene

    \[\norm{x_m-x_m'}\leq\lambda ^{m'-1} \norm{x_2-x_1} \left(\frac{1}{1-\lambda}\right).\]

Como \lambda<1, el lado derecho se hace arbitrariamente pequeño conforme m' se hace grande, así que ésta es una sucesión de Cauchy. Por la compacidad de X y completud de \mathbb{R}^n, tenemos que la sucesión converge a un punto x_0. Por continuidad, este punto satisface:

    \[x_0=\lim_{m\to \infty} x_{m+1} = \lim_{m\to \infty} \varphi(x_m)=\varphi\left(\lim_{m\to \infty} x_m\right) = \varphi(x_0).\]

La unicidad no necesita la compacidad de X, sino únicamente que \varphi sea contracción. En efecto, si hay otro punto fijo x entonces

    \[\norm{x-x_0}=\norm{\varphi(x)-\varphi(x_0)}\leq \lambda \norm{x-x_0},\]

de donde \norm{x-x_0}=0, pues si no se tendría una contradicción. Así, x=x_0.

Desigualdades entre la norma de Frobenius

Para x\in \mathbb{R}^n y A,B matrices reales de n\times n tenemos que
a) \norm{Ax}\leq \norm{A} \norm{x} y
b) \norm{AB}\leq \norm{A} \norm{B}.

La desigualdad (a) se prueba usando la desigualdad de Cauchy-Schwarz. En efecto, si A_1,\ldots, A_n son los renglones de la matriz A, tenemos que

    \[Ax=(A_1\cdot x, A_2\cdot x, \ldots, A_n\cdot x),\]

entrada a entrada tenemos por Cauchy-Schwarz que

    \[(A_i\cdot x)^2\leq \norm{A_i}^2\norm{x}^2,\]

de modo que sumando para i=1,\ldots, n tenemos que

    \[\norm{Ax}^2\leq \left(\sum_{i=1}^n \norm{A_i}^2\right)\norm{x}^2=\norm{A}^2\norm{x}^2,\]

lo cual prueba la desigualdad (a). La desigualdad (b) se prueba de manera similar, tomando fila por fila a la matriz A y columna por columna a la matriz B.

Desigualdad del valor medio

Sea U\subset \mathbb{R}^n un abierto convexo y F:U\to \mathbb{R}^n una función de clase \mathcal{C}^1. Sean x,y puntos en U para los cuales la cual la norma de Frobenius del Jacobiano \norm{DF} está acotada sobre el segmento xy por una constante C. Entonces:

    \[\norm{F(x)-F(y)}\leq C \norm{x-y}.\]

La desigualdad del valor medio requiere de algunos pasos intermedios. Definamos h=y-x. La clave es probar las siguientes tres afirmaciones:

    \begin{align*}F(x)-F(y)&=\int_0^1 DF(x+th) h \,dt\\\norm{\int_0^1 DF(x+th) h \,dt} &\leq \int_0^1 \norm{DF(x+th)}\norm{h}\, dt\\\int_0^1 \norm{DF(x+th)}\norm{h}\, dt &\leq C \norm{h}.\end{align*}

La primera es una «generalización» del teorema del valor medio de una variable. Se prueba coordenada a coordenada usando el Teorema Fundamental del Cálculo, la regla de la cadena y un intercambio de integral con suma (usando la continuidad de las derivadas parciales).

La segunda se prueba usando desigualdad del triángulo para integrales y la desigualdad (a) que probamos arriba para la norma de Frobenius.

La tercera se sigue de manera inmediata de la cota hipótesis para la matriz Jacobiana, pues x+th=x+t(y-x) recorre el segmento xy conforme t recorre el intervalo [0,1].

Combinando las tres afirmaciones concluimos

    \[\norm{F(x)-F(y)}\leq C\norm{h}=C\norm{y-x},\]

que es justo lo que queríamos probar.

Con esto terminamos los pre-requisitos para probar el TFI. Aquí ya se ve algo interesante sucediendo. En el TFI queremos mostrar que cierta restricción es biyectiva, osea que cierto sistema de ecuaciones tiene una y sólo una solución. Esto se asemeja al teorema del punto fijo de Banach, donde, bajo ciertas condiciones de contracción, hay uno y sólo un punto fijo. El teorema de la desigualdad media puede ayudar a mostrar que una función contrae. Todo esto no es casualidad. A continuación veremos cómo combinar estos ingredientes.

Demostración del TFI

Estamos listos para dar la demostración del teorema de la función inversa. Por comodidad, aquí lo enunciamos de nuevo:

Teorema de la función inversa

Sea F:\mathbb{R}^n\to \mathbb{R}^n una función de clase \mathcal{C}^1 con matriz Jacobiana DF. Supongamos que F(a)=b y que DF(a) es invertible. Entonces existen vecindades abiertas U y V de a y b respectivamente para las cuales:

a) F:U\to V es una biyección,
b) su inversa F^{-1}:V\to U es de clase \mathcal{C}^1 y
c) DF^{-1}(b)=DF(a)^{-1}.

Para el teorema necesitamos definir quién es el abierto U. Lo tomaremos como U:=B(a,\epsilon), una bola abierta y centrada en a de radio \epsilon. La idea es tomar \epsilon tan pequeño como para que para x\in U tengamos que DF(x) sea invertible y

    \[\norm{DF(a)-DF(x)}\leq \frac{1}{2\norm{DF(a)^{-1}}}.\]

Ambas cosas las podemos hacer pues la asignación x \mapsto DF(x) es continua ya que F de clase \mathcal{C}^1. En el transcurso de la prueba discutiremos la motivación de esta elección. A V lo tomaremos como F(U).

Lo primero que haremos es reformular parte (a) en términos de puntos fijos. Queremos que la restricción F:U\to V que estamos buscando sea biyectiva. En otras palabras, para y\in V queremos que la ecuación y=F(x) tenga una y sólo una solución x en U. Como por hipótesis la matriz DF(a) es invertible, esto sucede si y sólo si

    \[x+DF(a)^{-1}(y-F(x))=x,\]

es decir, si y sólo si x es un punto fijo de la función \varphi_y(x)=x+DF(a)^{-1}(y-F(x)). Parece un poco artificial haber introducido a DF(a)^{-1}, pero como veremos a continuación tiene sentido pues nos ayudará para que \varphi_y sea contracción.

Teniendo en mente que queremos usar la desigualdad del valor medio, calculamos y acotamos la norma de la derivada de \varphi_y como sigue

    \begin{align*}\norm{D\varphi_y (x)} &= \norm{I - DF(a)^{-1} DF(x)} \\ &= \norm{DF(a)^{-1}(DF(a) - DF(x))}\\&\leq \norm{DF(a)^{-1}}\norm{DF(a)-DF(x)}\end{align*}

Aquí es donde usamos (y se motiva parte de) nuestra elección de U: nos permite acotar \norm{DF(a)-DF(x)} superiormente con \frac{1}{2\norm{DF(a)^{-1}}} y por lo tanto podemos concluir la desigualdad anterior como

(1)   \begin{align*}\norm{D\varphi_y (x)} \leq \frac{1}{2}.\end{align*}

Por la desigualdad del valor medio, concluimos la siguiente observación clave:

Para y en V tenemos que \varphi_y es contracción en U con factor \lambda=\frac{1}{2}. En otras palabras, para x,w en U, tenemos

    \[\norm{\varphi_y(x)-\varphi_y(w)}\leq \frac{\norm{x-x'}}{2}.\]

La prueba a partir de ahora se divide en los siguientes pasos:

  1. Mostrar que F:U\to V es biyectiva.
  2. Mostrar que V es abierto
  3. Mostrar que F^{-1}:V\to U es diferenciable y y DF^{-1}(b)=DF(a)^{-1}
  4. Mostrar que las derivadas parciales son continuas

F:U\to V es biyectiva.

La suprayectividad la tenemos gratis, pues por definición V=F(U).

Para la inyectividad, tomamos y\in V y supongamos que existen x y w en U tales que F(x)=y=F(w). Esto quiere decir que x y w son puntos fijos de la contracción \varphi_y. Como vimos en la prueba del teorema del punto fijo de Banach, esto implica que x=w. Así, x=w, de modo que F:U\to V es inyectiva y por lo tanto es biyectiva.

Nota: Aquí no estamos usamos el teorema del punto fijo de Banach pues U no es compacto. Sólo estamos usando que las contracciones son inyectivas.

V es abierto

Tomemos y' en V, es decir, para la cual existe x' en U con F(x')=y'. Queremos ver que si «y está muy cerquita de y'» , entonces hay una solución para F(x)=y con x en U.

Como U es abierto, existe r tal que la bola B(x',2r) abierta de centro x' y radio 2r se queda contenida en U. Tomemos y en la bola B\left(y',\frac{r}{2\norm{DF(a)^{-1}}}\right). Vamos a ver que F(x)=y tiene solución en U. Consideremos la función \varphi_y, pero restringida a la bola cerrada X:=\overline{B}(x',r)\subset U. Mostraremos que la imagen de \varphi_y se queda contenida en \overline{B}(x',r). En efecto:

    \begin{align*}\norm{\varphi_y(x)-x'}&=\norm{\varphi_y(x)-\varphi_y(x')+DF(a)^{-1}(y-y')}\\&\leq \norm{\varphi_y(x)-\varphi_y(x')}+\norm{DF(a)^{-1}}\norm{y-y'}\\&\leq \frac{\norm{x-x'}}{2}+\frac{r}{2}\leq r.\end{align*}

De este modo, \varphi_y es una contracción del compacto X a sí mismo. Por lo tanto, tiene un punto fijo en X, de modo que F(x)=y para x\in X\subset U. Esto muestra que V=F(U) es abierto.

F^{-1}:V\to U es diferenciable y DF^{-1}(b)=DF(a)^{-1}

Vamos a demostrar que F^{-1}:V\to U es diferenciable a partir de la definición de diferenciabilidad. Más aún, veremos que si y=F(x) para x en U, entonces DF^{-1}(y)=DF(x)^{-1}. Aquí es donde se termina de motivar nuestra elección en U, pues nos garantiza que a la derecha en efecto tenemos una matriz invertible.

Tomemos entonces y=F(x). Nos interesa el límite cuando \norm{h}\to 0 de la siguiente expresión

    \[\frac{\norm{F^{-1}(y+h)-F^{-1}(y)-DF(x)^{-1}h}}{\norm{h}},\]

Como U es abierto, si \norm{h} es pequeña entonces y+h está en U. De este modo, existe k tal que x+k \in U y F(x+k)=y+h. Así, la expresión anterior la podemos reescribir como

(2)   \begin{align*}\frac{\norm{DF(x)^{-1}(F(x+k)-F(x)-DF(x)k)}}{\norm{k}}\frac{\norm{k}}{\norm{h}}\end{align*}

Antes de continuar, probemos una desigualdad auxiliar. Notemos que

    \begin{align*}\norm{k}-\norm{DF^{-1}(a)h} &\leq \norm{k-DF^{-1}(a)h}\\&=\norm{\varphi_y(x+k)-\varphi_y(x)}\\&\leq\frac{\norm{k}}{2},\end{align*}

así,

(3)   \begin{align*}\norm{k}\leq 2\norm{DF^{-1}(a)h} \leq 2\norm{DF^{-1}(a)}\norm{h}.\end{align*}

Substituyendo el valor de \norm{k} en (2), concluimos que la expresión es menor o igual a

(4)   \begin{align*}2\norm{DF(x)^{-1}}\frac{\norm{F(x+k)-F(x)-DF(x)k}}{\norm{k}}\norm{DF^{-1}(a)}\end{align*}

Estamos listos para terminar. La desigualdad (3) también garantiza que \norm{k}\to 0 cuando \norm{h}\to 0. Así, como F es diferenciable, tenemos que la expresión (4) tiende a 0. Esto muestra que F^{-1} es diferenciable en y con DF^{-1}(y)=DF(x)^{-1}, tal como queríamos.

Las derivadas parciales son continuas

Esta parte es sencilla a partir de la parte anterior. Tenemos que:

    \[DF^{-1}(b)=DF(F^{-1}(b))^{-1}\]

Por la regla de Cramer la inversa de una matriz depende continuamente de las entradas de la matriz original. Además, la asignación b \mapsto F^{-1}(b) es continua. Así, las entradas de DF^{-1}(b) (las derivadas parciales de F^{-1}) dependen continuamente de las derivadas parciales de F, que dependen continuamente de b por hipótesis.

Con esto termina la prueba.

¿Ahora qué?

Si te gustó esta entrada, puedes compartirla o revisar otras relacionadas con matemáticas a nivel universitario: