Archivo de la etiqueta: derivadas

Teorema de la función inversa: motivación y ejemplo

Introducción

Imagina, por un momento, que en un futuro trabajas en la Agencia Espacial Mexicana (AEM). De repente, llega la directora y trae una función en las manos. «Para una misión crítica necesito que me conviertas esta función en una función invertible, cuanto antes posible». Te da la función. Le respondes «Ok, directora y, ¿cómo la quiere o qué?». Pero es demasiado tarde. Ya salió y hay que ponerse a trabajar. Entonces tomas la función, la pones en el gis y comienzas a estudiarla en el pizarrón.

Resulta que es una función de varias variables. Específicamente, es la función que pasa de coordenadas polares a coordenadas cartesianas. Es decir, es la función F:\mathbb{R}^2 \to \mathbb{R}^2 dada por:

    \[F(r,\theta)=(r\cos\theta, r \sin\theta).\]

La función sí es suprayectiva, así que ya va parte del trabajo hecho. Pero el problema es que no es inyectiva. Por ejemplo,

    \[F\left(1,\frac{\pi}{2}\right)=\left(\cos\frac{\pi}{2},\sin\frac{\pi}{2}\right)=(0,1)=F\left(1,\frac{5\pi}{2}\right).\]

Peor aún, para todo \theta \in \mathbb{R} se tiene que F(0,\theta)=(0,0).

Pero la situación no es tan terrible. Una forma de solucionarla es restringir el dominio de la función. Si en vez de pensarla en una función F:\mathbb{R}^2\to \mathbb{R}^2 la pensamos como una restricción F:U\to V para algunos conjuntos U y V, entonces muy posiblemente la podamos «convertir» en una función biyectiva.

No podemos ser demasiado arbitrarios. Por ejemplo, si tomamos U=\{(0,0)\} y V=\{(0,0)\}, entonces claramente la restricción es una biyección, pero está muy chafa: sólo nos quedamos con un punto. Por esta razón, vamos a poner una meta un poco más ambiciosa y a la vez más concreta: lograr que U y V sean conjuntos abiertos alrededor de los puntos x y y:=F(x) para algún x\in \mathbb{R}^2. Si lo logramos, habremos encontrado una biyección «cerquita de x» en conjuntos «más gorditos». Para algunos puntos x lo podemos hacer, y para algunos otros puntos x es imposible. Veamos ejemplos de ambas situaciones.

Si x=\left(\sqrt{2},\frac{\pi}{4}\right), entonces y=\left(\sqrt{2}\cos \frac{\pi}{4}, \sqrt{2}\sin\frac{\pi}{4}\right)=(1,1). En este caso, podemos elegir una vecindad pequeña U alrededor de x y tomar V:=F(U), pues los otros puntos w con F(x)=F(w) están lejos (están a brincos verticales de tamaño 2\pi de x). Para resolver el problema de la AEM, basta restringir F a U.

Sin embargo, si x=\left(0, \frac{\pi}{4}\right), entonces y=\left(0,0). Sin importar qué tan pequeña tomemos la vecindad abierta U alrededor de x, vamos a seguir tomando puntos w sobre la recta r=0, para los cuales sucede F(x)=0=F(w). Si la directora de la AEM insiste en que haya un punto con r=0, entonces no hay invertibilidad en todo un abierto alrededor de este punto. Esperemos que la misión no dependa de eso.

Aplicando el teorema de la función inversa

El teorema de la función inversa es una herramienta que da condiciones suficientes para que una función F:\mathbb{R}^n\to \mathbb{R}^n pueda invertirse localmente «cerca» de un punto de su dominio. Podemos utilizar este resultado cuando la función que estudiamos es «bien portada», donde esto quiere decir que sea continuamente diferenciable. Si bien hay ligeras variantes en la literatura, el enunciado que presento aquí es el siguiente:

Teorema de la función inversa

Sea F:\mathbb{R}^n\to \mathbb{R}^n una función de clase \mathcal{C}^1 con matriz Jacobiana DF. Supongamos que F(a)=b y que DF(a) es invertible. Entonces existen vecindades abiertas U y V de a y b respectivamente para las cuales:

a) F:U\to V es una biyección,
b) su inversa F^{-1}:V\to U es de clase \mathcal{C}^1 y
c) DF^{-1}(b)=DF(a)^{-1}.

En otra entrada hablo de la intuición de este teorema, así como de su demostración. Por el momento sólo me enfocaré en dar un ejemplo de cómo podemos usarlo.

Regresemos al ejemplo de la Agencia Espacial Mexicana. La función que tenemos es F:\mathbb{R}^2\to \mathbb{R}^2 que está dada por

    \[F(r,\theta)=(F_1(r,\theta),F_2(r,\theta))=(r\cos\theta, r \sin\theta).\]

Para usar el teorema de la función inversa, tenemos que estudiar la invertibilidad de DF, su matriz Jacobiana. Esta está construida a partir de las derivadas parciales de las funciones coordenadas como sigue:

    \[DF(r,\theta)= \begin{pmatrix}\frac{\partial F_1}{\partial r}(r,\theta) & \frac{\partial F_1}{\partial \theta}(r,\theta)\\\frac{\partial F_2}{\partial r}(r,\theta) & \frac{\partial F_2}{\partial \theta}(r,\theta)\end{pmatrix}= \begin{pmatrix}\cos \theta & -r\sin \theta\\\sin \theta & r \cos \theta.\end{pmatrix}\]

Para estudiar su invertibilidad, notamos que su determinante es

    \begin{align*}\det(DF(r,\theta))&=\cos \theta \cdot r\cos \theta - \sin \theta \cdot (-r\sin \theta) \\&= r\cos^2\theta+r\sin^2\theta \\&= r,\end{align*}

y que es distinto de 0 si y sólo si r\neq 0. Esto coincide con las observaciones que hicimos «a mano»: la función es invertible localmente en (r,\theta) si r\neq 0. Cuando r=0, la invertibilidad no está garantizada.

El teorema de la función inversa tiene más implicaciones. Nos dice además que la inversa F^{-1} también es continuamente diferenciable y que su derivada es la inversa de F. Como ejemplo, consideremos el punto \left(\sqrt{2},\frac{\pi}{4}\right). Tenemos que

    \[F\left(\sqrt{2},\frac{\pi}{4}\right) = (1,1),\]

que

    \[DF\left(\sqrt{2},\frac{\pi}{4}\right) = \begin{pmatrix}\frac{1}{\sqrt{2}}& -1\\ \frac{1}{\sqrt{2}} & 1\end{pmatrix},\]

y que \det\left(DF\left(\sqrt{2},\frac{\pi}{4}\right)\right)=\sqrt{2}.

Así, F es invertible localmente alrededor de \left(\sqrt{2},\frac{\pi}{4}\right), su inversa es continuamente diferenciable y además

    \[D(F^{-1})(1,1)=DF\left(\sqrt{2},\frac{\pi}{4}\right)^{-1} =\frac{1}{\sqrt{2}} \begin{pmatrix}1 & 1\\-\frac{1}{\sqrt{2}}& \frac{1}{\sqrt{2}}\end{pmatrix}.\]

Esto termina la motivación y el ejemplo del teorema de la función inversa. Si quieres entender un poco mejor la intuición detrás del teorema, así como su demostración, puedes darte una vuelta por esta otra entrada.

Generalizar el problema

HeuristicasA veces tener un problema concreto es más difícil que tener un problema más general. En los problemas concretos puede haber números grandes, o un brinco muy difícil, o bien simplemente no existen herramientas para atacarlo por separado. Cuando generalizamos podemos aprovechar más teoría, por ejemplo el principio de inducción.

En estos videos veremos algunos ejemplos en los cuales es más fácil resolver un problema que aparentemente debería de ser más difícil.

Ir a los videos…