Estamos a punto de entrar a discutir dos de los resultados principales de nuestro curso: el teorema de la función inversa y el teorema de la función implícita. Repasemos un poco qué hemos hecho hasta ahora. En las dos entradas anteriores introdujimos la noción de diferenciabilidad, la cual cuando sucede para una función , nos dice que se parece mucho a una función lineal en un punto dado. Vimos que esta noción implica continuidad y que tiene una regla de la cadena relacionada con el producto de matrices. También, hemos discutido cómo esta noción se relaciona con la existencia de espacios tangentes a gráficas multidimensionales.
Ahora queremos entender todavía mejor a las funciones diferenciables. Hay dos teoremas que nos permiten hacer eso. Uno es el teorema de la función inversa y el otro es el teorema de la función implícita. En esta entrada hablaremos del primero, y en un par de entradas más introduciremos el segundo resultado. El propósito del teorema de la función inversa es dar una condición bajo la cual una función es invertible, por lo menos localmente. De hecho, la mayoría de las veces sólo se puede garantizar la invertibilidad localmente, pues las funciones usualmente no son inyectivas y esto da comportamientos globales más difíciles de manejar.
Enunciar el teorema y entenderlo requiere de cierto esfuerzo. Y demostrarlo todavía más. Por esta razón, en esta entrada nos enfocaremos sólo en dar el teorema y presentar herramientas preliminares que necesitaremos para hacer su demostración.
Enunciado del teorema de la función inversa
Supongamos que tenemos y que es diferenciable en el punto . Entonces, se parece mucho a una función lineal en , más o menos . Así, si es invertible, suena a que «cerquita de » la función debe de ser invertible. El teorema de la función inversa pone estas ideas de manera formal.
Teorema (de la función inversa). Sea de clase en el abierto . Si la matriz es invertible, entonces, existe tal que:
y es inyectiva en .
es continua en .
es un conjunto abierto.
es de clase en y además, si , entonces, .
Veamos qué nos dice de manera intuitiva cada una de las conclusiones del teorema.
Tendremos una bola dentro de la cual será inyectiva, y por lo tanto será biyectiva hacia su imagen. Así, restringida a esta bola será invertible. Es importante que sea una bola abierta, porque entonces sí tenemos toda una región «gordita» en donde pasa la invertibilidad (piensa que si fuera un cerrado, a lo mejor sólo es el punto y esto no tiene chiste).
La inversa que existirá para será continua. Esto es lo mínimo que podríamos esperar, aunque de hecho el punto garantiza algo mucho mejor.
La imagen de en la bola será un conjunto abierto.
Más aún, se tendrá que será de clase y se podrá dar de manera explícita a su derivada en términos de la derivada de con una regla muy sencilla: simplemente la matriz que funciona para derivar le sacamos su inversa como matriz y esa funciona al evaluarla en el punto apropiado.
El teorema de la función inversa es profundo pues tanto su enunciado como su demostración combina ideas de topología, álgebra y cálculo. Por esta razón, para su demostración necesitaremos recopilar varias de las herramientas de álgebra lineal que hemos repasado en la Unidad 2 y la Unidad 5. Así mismo, necesitaremos ideas topológicas de las que hemos visto en la Unidad 3. Con ellas desarrollaremos algunos resultados auxiliares que en la siguiente entrada nos permitirán concluir la demostración.
Un criterio para campos vectoriales
El teorema de la función inversa es para funciones de clase . Nos conviene entender esta noción mejor. Cuando una función es de clase , entonces es diferenciable. Pero el regreso no es cierto y hay contraejemplos. ¿Qué le falta a una función diferenciable para ser de clase ? A grandes rasgos, que las funciones derivadas y hagan casi lo mismo cuando y son cercanos. En términos de matrices, necesitaremos que la expresión sea pequeña cuando y son cercanos entre sí.
El siguiente teorema será importante en nuestro camino hacia el teorema de la función inversa. Intuitivamente, para lo que lo usaremos es para aproximar una función localmente, con «cuadritos» que corresponden a los planos tangentes, porque «muy cerquita» estos planos varían muy poco si pedimos que sea de clase . Es decir si y son dos puntos en el dominio de una función diferenciable, y estos están muy cerca uno del otro, sus planos tangentes serán casi el mismo. Esto nos invita a cambiar localmente a una superficie por cuadritos como más adelante se explicará con detalle.
Figura 1. En azul y en rojo dos planos que corresponden a las derivadas y . Este cambio calculado es distintos puntos cercanos es «suave», esto se expresará con la ecuación ya con las diferenciales para todo .
El teorema concreto que nos interesa demostrar es la siguiente equivalencia para que una función sea de clase .
Teorema. Sea una función diferenciable en . Se tiene que es de clase en si y sólo si para todo y para cada existe tal que , y si se tiene para todo .
Demostración. Supongamos que es de clase en , es decir, todas sus funciones componentes tienen derivadas parciales en y son continuas. Sea . Veremos que se puede encontrar una como en el enunciado.
Tomemos y en . Expresamos a como
o equivalentemente como
De tal manera que por Cauchy-Schwarz:
En este punto se ve la importancia de que las parciales sean continuas. Podemos encontrar una que nos garantice que y que si , entonces En esta situación, podemos seguir acotando como sigue:
Al sacar raiz cuadrada, obtenemos la desigualdad buscada.
Supongamos ahora que para cada existe una como en el enunciado del teorema. Debemos ver que todas las derivadas parciales de todas las componentes son continuas. Podemos aplicar la desigualdad tomando como cada vector de la base canónica. Esto nos dice que
Por nuestro desarrollo anterior, para cada tenemos
Elevando al cuadrado,
Como todos los términos son no negativos, cada uno es menor a . Así, para cada tenemos
Esto es precisamente lo que estábamos buscando: si está lo suficientemente cerca de , cada derivada parcial en está cerca de su correspondiente en .
Invertibilidad de en todo un abierto
En esta sección demostraremos lo siguiente. Si es un campo vectorial diferenciable en y es invertible, entonces será invertible para cualquier alrededor de cierta bola abierta alrededor de . Los argumentos en esta ocasión están un poco más relacionados con el álgebra lineal.
Será útil que recuerdes que una transformación lineal es invertible si el único tal que es . El siguiente criterio es otra caracterización de invertibilidad en términos de lo que le hace a la norma de los vectores.
Teorema. Sea una transformación lineal. La transformación es invertible si y sólo si existe tal que para todo .
Demostración. Como es invertible, para todo sucede que . En particular, esto sucede para todos los vectores en (recuerda que es la esfera de radio y dimensión centrada en ). Esta esfera es compacta y consiste exactamente de los de norma .
Sabemos que las transformaciones lineales y la función norma son continuas. Por la compacidad de , la expresión tiene un mínimo digamos , que alcanza en . Por el argumento del párrafo anterior, .
Tomemos ahora cualquier vector . Si , entonces Si , el vector está en , de modo que Usando linealidad para sacar el factor y despejando obtenemos como estábamos buscando.
Este lado es más sencillo. Si existe dicha , entonces sucede que para en , con tenemos Por lo tanto, y así es invertible.
Obtengamos una consecuencia del teorema de clasificación de la sección anterior que está muy relacionada con este resultado que acabamos de demostrar.
Teorema. Sea de clase en el conjunto abierto y . Si es invertible, entonces existen y tales que y , para todo y para todo .
Demostración. Como es invertible, por el teorema que acabamos de demostrar existe tal que para todo .
Por nuestra caracterización de funciones , Ahora como en (abierto) para , existe tal que , y para todo y para todo .
Por la desigualdad del triángulo,
de donde
De esta manera, el resultado es cierto para la que dimos y para .
El siguiente corolario es consecuencia inmediata de lo discutido en esta sección y está escrito de acuerdo a la aplicación que haremos más adelante en la demostración del teorema de la función inversa.
Corolario. Sea una función de clase en y . Si es invertible, entonces, existe tal que y es invertible para todo .
Queda como tarea moral responder por qué este corolario es consecuencia inmediata del teorema anterior.
Un poco de intuición geométrica
Dejamos esta entrada hasta aquí, la naturaleza densamente teórica de lo que estamos haciendo puede hacer pesadas las exposiciones. Lo que hasta aquí demostramos es que para un campo vectorial si su derivada en es invertible, entonces lo es en toda una vecindad que tiene a . Imaginemos al pedacito de superficie cubierto con pequeños rectángulos. En cada punto, las imágenes de estos rectángulos están muy cerquita, casi pegados a la superficie. Esto nos garantizaría la invertibilidad de en esta vecindad.
Figura 2
En la Figura 2 vemos ilustrado esto. El círculo inferior corresponde a la vecindad en el dominio de . La función levanta una porción del plano en la sabana delineada con negro arriba del círculo. En el círculo tenemos al punto en verde agua. Sobre la sábana de arriba tenemos con el mismo color a . Los puntos negros pequeños dentro de la vecindad alrededor de son alzados por a puntos negros sobre la sabana. Sobre de cada punto negro en la sabana tenemos un cuadrito rojo que representa al cachito de plano tangente cerca de la imagen de cada punto. La imagen esta llena de estos pequeños cuadritos, todos ellos representan diferenciales invertibles, esto nos permitirá asegurar la invertibilidad de en al menos una vecindad.
Más adelante…
En la siguiente entrada demostraremos el teorema de la función inversa, inciso por inciso. Es importante que estes familiarizado con los resultados de esta entrada, pues serán parte importante de la demostración.
Tarea moral
¿Qué diría el teorema de la función inversa para campos vectoriales ? ¿Se puede usar para Si es así, ¿para qué valores de y ? ¿Qué diría en este caso explícitamente?
Explica por qué el corolario que enunciamos en efecto se deduce de manera inmediata de lo discutido en la sección correspondiente.
Revisa todas las desigualdades que usamos en esta entrada. ¿Qué resultado estamos usando? ¿Cuándo se darían estas igualdades?
Demuestra que el determinante de una matriz es una función continua en términos de las entradas de la matriz. Usa esto para demostrar que si es una matriz y es una matriz muy cercana a , entonces también es invertible.
Demuestra que si una transformación es diagonalizable, entonces en el teorema de caracterización de invertibilidad se puede usar como al mínimo de la expresión variando sobre todos los eigenvalores de .
Tenemos ya la definición de diferenciabilidad, y su versión manejable: la matriz jacobiana. Seguiremos construyendo conceptos y herramientas del análisis de los campos vectoriales muy importantes e interesantes. A continuación, enunciaremos una nueva versión de la regla de la cadena, que nos permitirá calcular las diferenciales de composiciones de campos vectoriales entre espacios de dimensión arbitraria. Esta regla tiene numerosas aplicaciones y es sorprendentemente fácil de enunciar en términos de producto de matrices.
Primeras ideas hacia la regla de la cadena
La situación típica de regla de la cadena es considerar dos funciones diferenciables que se puedan componer. A partir de ahí, buscamos ver si la composición también es diferenciable y, en ese caso, intentamos dar la derivada de la composición en términos de las derivadas de las funciones. Veamos qué pasa en campos vectoriales.
Pensemos en , y en su composición definida sobre alguna vecindad de y tal que . Pensemos que es diferenciable en con derivada y que es diferenciable en con derivada .
Exploremos la diferenciabilidad de la composición en el punto . Para ello, tomemos un tal que y consideremos la siguiente expresión:
Tomando , tenemos . De esta forma,
Por la diferenciabilidad de en , tenemos que podemos escribir
con .
Usando la diferenciabilidad de en , y la linealidad de su derivada , tenemos entonces que:
con .
Concatenando nuestras igualdades, podemos reescribir esto como
en donde hemos definido
Si logramos demostrar que , entonces tendremos la diferenciabilidad buscada, así como la derivada que queremos. Dejemos esto en pausa para enunciar y demostrar un lema auxiliar.
Un lema para acotar la norma de la derivada en un punto
Probemos el siguiente resultado.
Lema. Sea un campo vectorial diferenciable en un punto y su derivada. Entonces, para todo , se tiene:
Donde
Demostración. Procedemos con desigualdad del triángulo como sigue:
y luego usamos la desigualdad de Cauchy-Schwarz en cada sumando para continuar como sigue
que es lo que buscábamos.
Conclusión del análisis para regla de la cadena
Retomando el análisis para , dividamos el límite en los dos sumandos.
Primer sumando:
Como es lineal, entonces es continua. También, sabemos que . Así,
Segundo sumando:
Retomando la definición de , aplicando desigualdad del triángulo y el lema que demostramos,
Dividiendo ambos lados entre , obtenemos entonces que
De aquí se ve que conforme , la expresión está acotada superiormente por la constante Además, si , entonces . Así,
pues implica .
Hemos concluido que
con . Esto precisamente es la definición de es diferenciable en , y su derivada en es la transformación lineal dada por la composición de transformaciones lineales .
Recapitulación de la regla de la cadena
Recapitulamos toda la discusión anterior en el siguiente teorema.
Teorema (Regla de la cadena). Sean , campos vectoriales. Supongamos que la composición está definida en todo un abierto . Supongamos que es diferenciable en un punto con derivada y es diferenciable en con derivada . Entonces, es diferenciable en con derivada .
Dado que la representación matricial de la composición de dos transformaciones lineales es igual al producto de estas, podemos reescribir esto en términos de las matrices jacobianas como el siguiente producto matricial:
Usos de la regla de la cadena
Hagamos algunos ejemplos de uso de regla de la cadena. En el primer ejemplo que veremos a continuación, la función es un campo escalar.
Ejemplo 1. Tomemos campo vectorial, y campo escalar. Consideremos y supongamos que se satisfacen las hipótesis del teorema de la regla de la cadena. Tenemos: y
Por la regla de la cadena tenemos esto implica
Así
En otras palabras, tenemos las siguientes ecuaciones para calcular cada derivada parcial de :
Ejemplo 2. Sean y puntos en . Pensemos que las entradas de están dadas en función de las entradas de mediante las ecuaciones y . Pensemos que tenemos un campo escalar , y definimos mediante
Por el ejemplo anterior y Como tarea moral queda que reflexiones qué significa cuando aparece en el «numerador» y qué significa cuando aparece en el «denominador».
Ejemplo 3. Para un campo escalar consideremos un cambio de coordenadas , es decir tomemos la función .
Por el ejemplo anterior tenemos y donde, haciendo las derivadas parciales tenemos: y Finalmente obtenemos: y que son las derivadas parciales del cambio de coordenadas en el dominio de .
Mas adelante…
En la siguiente entrada comenzaremos a desarrollar la teoría para los importantes teoremas de la función inversa e implícita si tienes bien estudiada esta sección disfrutaras mucho de las siguientes.
Tarea moral
Considera el campo escalar . Imagina que están dados por valores y mediante las condiciones , , . Calcula , .
Sea , y . Encuentra la matriz jacobiana del campo vectorial . Encuentra también la matriz jacobiana del campo vectorial .
En la demostración del lema que dimos, hay un paso que no justificamos: el primero. Convéncete de que es cierto repasando el contenido de la entrada anterior Diferenciabilidad.
Imagina que sabemos que la función es invertible y derivable en con derivada . Imagina que también sabemos que su inversa es derivable en con derivada . De acuerdo a la regla de la cadena, ¿Qué podemos decir de ? En otras palabras, ¿Cómo son las matrices jacobianas entre sí, en términos de álgebra lineal?
Reflexiona en cómo todas las reglas de la cadena que hemos estudiado hasta ahora son un corolario de la regla de la cadena de esta entrada.
Después de haber abordado a modo de repaso las herramientas que usaremos de álgebra lineal, estamos listos para estudiar la diferenciabilidad en funciones más generales. Ya estudiamos la diferenciabilidad en curvas (funciones ) y en campos escalares (funciones ). Ahora podemos estudiar la diferenciabilidad en campos vectoriales, que recuerda que ahora sí son funciones para cualesquiera y enteros positivos.
Intuición de diferenciabilidad en campos vectoriales
Con anterioridad, hemos discutido la intuición geométrica de lo que quiere decir que un campo escalar sea diferenciable. A grandes rasgos, estamos pidiendo que cerca de un punto la función cambie «como una función lineal». Esto quiere decir que la gráfica de la función se parece mucho a un hiperplano en cerca del punto , tanto que de hecho podemos dar un hiperplano tangente a la gráfica en . Bajo suficiente regularidad, esta función lineal estaba dada por las derivadas parciales y estaba muy relacionada con el gradiente .
La situación para campos vectoriales es parecida. Si tenemos una función , entonces está dada por funciones coordenada que la expresan de la manera para cada . La diferenciabilidad que buscaremos ahora deberá suceder coordenada a coordenada, y por ello lo que pensaremos como derivada tendrá algo así como un gradiente por cada coordenada. Esto nos daría gradientes, pero una mejor forma de pensar en resumen a la derivada es como una transformación lineal que nos diga con mucha precisión cuándo cambia la funciíon (cuando esto sea posible).
Para tener clara idea de lo que queremos hacer recordemos el ejemplo de campos escalares, y de aquí construiremos una generalización a campos vectoriales: Observa la Figura . A la izquierda, hemos dibujado dos copias de (pero que puedes pensar como ). A la derecha, hemos dibujado la gráfica de dos funciones. Una es una función cualquiera . La otra es una transformación lineal que ha sido trasladada sobre el plano y sobre el eje con la función . Estas gráficas son objetos en (ponemos un punto por cada pareja con ).
Como es lineal, cumple . Al hacer la traslación, obtenemos . Así, traslada un subespacio de dimensión a un subespacio afín de dimensión que pasa por . Lo que buscaremos al pedir que la función sea diferenciable con derivada es que la gráfica de se parezca mucho a este subespacio , tanto que de hecho dicho subespacio lo podremos pensar como tangente a la gráfica en el punto .
Figura 1
Definición de diferenciabilidad para campos vectoriales
¿Cuál es la condición algebraica que pediremos? Será muy similar a lo que pasaba en campos escalares. Lo que queremos es que el cambio se parezca mucho a cuando es pequeño. De hecho, tiene que parecerse tanto, tanto, que debe parecerse a más rápido de lo que se va a . Esto nos lleva a plantear que la condición buscada sea la siguiente:
La Figura tiene un diagrama que ayuda a entender esto un poco mejor. Queremos que la flecha indicada en amarillo acabe muy cerca de .
El vector es el vector transportado hasta el plano tangente el cual está en color rosa. La idea es que , que es el vector señalado con amarillo abajo, se aproxime mucho en el sentido señalado por el límite mencionado en el párrafo de arriba. De esta manera tenemos la mejor aproximación lineal. Esta definición se inspira en el polinomio de Tylor de grado 1 para funciones de una variable real.
Por supuesto, la discusión que hemos tenido sólo aplica para cuando estamos trabajando cerca del punto , así que más bien la transformación lineal de la que estamos hablando dependerá del punto . Todo esto nos lleva a nuestra primera definición formal de diferenciabilidad.
Definición. Sea un campo vectorial. Decimos que es diferenciable en si existe una transformación lineal tal que
En este caso, a le llamamos la derivada de en el punto .
Antes de empezar a demostrar propiedades de esta noción, nos conviene tener una versión alternativa y totalmente equivalente.
Definición. Sea un campo vectorial. Decimos que es diferenciable en si existe una transformación lineal y una función de manera que con
Esta definición es equivalente a la anterior pues si despejamos tenemos: de donde se puede verificar que se cumple una definición si y sólo si se cumple la otra. Los detalles quedan como tarea moral.
Ejemplo. Consideremos la función y tomemos el punto . ¿Será diferenciable en ? Afirmamos que sí, que la función lineal cumple con la definición de límite que se pide. Veamos esto en la primera versión de la definición. Tendríamos, usando , que
Dividiendo entre que es la norma de , y haciendo manipulaciones algebraicas, se obtiene
Por la desigualdad entre la media cuadrática y la media geométrica,
de modo que cuando , la segunda coordenada del vector que nos interesa converge a cero. La primera coordenada también se puede ver que converge a cero: el primero, segundo, tercero y sexto sumandos se acotan de manera similar, pues tienen factores o adicionales. El cuarto y quinto sumando se acotan notando que , que también converge a cero con y . Los detalles quedan de tarea moral.
Diferenciabilidad implica continuidad
En el caso de las funciones de una variable real teníamos claramente que diferenciabilidad implica continuidad. Como es de esperarse, lo mismo se cumple para campos vectoriales, ya que una función diferenciable es más «suave» que una continua.
Teorema. Supongamos es un campo vectorial diferenciable en un punto de . Entonces es continuo en .
Demostración. Si es diferenciable en entonces cumple con la ecuación con una función tal que (¿Por qué es válida esta última afirmación?). Por ello:
El primer sumando no depende de , así que es . El segundo se va a cero pues las transformaciones lineales son continuas. Finalmente, el tercer sumando se va a cero por lo que sabemos de . Así, . Por lo tanto es continua.
.
Derivadas direccionales y derivadas parciales
Si bien tenemos dos definiciones de diferenciabilidad, aún no tenemos una manera muy práctica de encontrar o describir a la transformación lineal , que es la mejor aproximación lineal. En el ejemplo después de nuestra definición, nos dieron la transformación y funcionó, pero hasta donde hemos platicado, todavía es un misterio cómo obtenerla.
Nos gustaría tener una descripción más explícita pues queremos resolver problemas específicos como encontrar, por ejemplo, la ecuación de un hiperplano tangente. Este problema ya lo habíamos resuelto para campos escalares: si tenemos suficiente regularidad, entonces podemos construir la derivada a través de las derivadas parciales (que a su vez son derivadas direccionales). La teoría que ya desarrollamos prácticamente se puede copiar, considerando que ahora tendremos derivadas en cada función coordenada.
Lo primero que notaremos es que así como para campos escalares, para campos vectoriales también podemos definir la noción de derivadas direccionales. Pensemos en una función . Tomemos un vector fijo . Coloquemos una flecha que comience en y tenga dirección dada por otro vector dado . Si multiplicamos a por un escalar positivo, esto estira o encoge al vector , pero lo deja con la misma dirección. En el ejemplo de la Figura 3, al variar sobre todos los valores de se genera la recta . Si a los puntos de esta recta le aplicamos la función , se obtiene un cierto lugar geométrico conforme se varían los valores de . Lo que definiremos como derivada direccional nos permitirá hablar de un espacio afín tangente de dimensión a este lugar geométrico en el punto .
Figura 3
A continuación tenemos nuestra definición de derivada direccional para campos vectoriales.
Definición. Sea un campo vectorial. Tomemos , . Definimos la derivada direccional de en en la dirección como: siempre y cuando el límite exista.
Notemos que es un vector de .
En los campos escalares teníamos derivadas parciales. En este caso también las tenemos y describen a las derivadas direccionales en el mismo sentido que en el caso escalar. Para formalizar las cosas, damos la definición a continuación.
Definición. Sea un campo vectorial. Tomemos , . Definimos la derivada direccional de en la coordenada en como la derivada parcial , donde es el -ésimo vector de la base canónica, siempre y cuando esta exista.
Como en el caso de los campos escalares, las derivadas direccionales pueden entenderse en términos de las derivadas parciales bajo suficiente regularidad. Tomemos la base canónica de . Tomemos . Pensemos que todas las derivadas parciales de existen en un punto dado y que son continuas. Expresemos a como con la base canónica de . En esta entrada discutiremos hacia el final que bajo estas condiciones tendremos que existe y de hecho que
El tener derivadas parciales continuas resultará una hipótesis muy fuerte y de hecho implicará todavía más que la existencia de derivadas direccionales. De hecho, como en el caso de campos escalares, esta hipótesis implicará diferenciabilidad. Antes de discutir esto, veremos en la siguiente sección qué pasa componente a componente.
Si las derivadas parciales no son continuas, no deberíamos esperar que las derivadas direccionales existan: ¡hay muchas posibles direcciones y sólo sabemos que pasa en dos de ellas! Como tarea moral, puedes pensar en un contraejemplo de un campo escalar con derivadas parciales en cierto punto , pero sin alguna (o algunas) derivadas direccionales en .
Derivadas por componente
Las derivadas direccionales pueden entenderse mediante las derivadas parciales, pero también, como en el caso de las trayectorias, pueden entenderse mediante las derivadas por componente. Para pensar en ello, tomemos la base canónica de . Tomemos con funciones coordenadas . Pensemos que las derivadas direccionales de en en la dirección existen.
Tenemos entonces:
En la última igualdad estamos usando la suposición de que las derivadas existen componente a componente. Como mostramos que el límite planteado inicialmente existe, obtenemos entonces que
Lo que tenemos aquí es que la derivada direccional de en en dirección de es la suma vectorial de cada vector de la base escalado por la derivada direccional del campo escalar en con respecto a la dirección de .
Diferenciabilidad implica derivadas direccionales
La noción de diferenciabilidad que dimos implica la diferenciabilidad de cada una de las funciones componente de una función . Es decir, si el campo vectorial es diferenciable, entonces cada uno de los campos escalares componentes son también diferenciables, pues el límite se cumple, y por lo tanto se cumple componente a componente. En el caso de el -ésimo componente es precisamente hacer el producto interior del -ésimo renglon de la matriz que representa a con , y entonces la derivada del campo escalar está dada precisamente por dicho -ésimo renglón.
A su vez, sabemos que si un campo escalar es diferenciable, entonces existen todas las derivadas parciales. Por lo que hemos platicado en unidades anteriores, si se escribe en la base canónica como , al aplicar obtenemos
lo cual abreviamos como
Usando esta igualdad para cada y sustituyendo la ecuación que obtuvimos al analizar componente por componente, obtenemos entonces que
¡Pero esto se puede denotar de manera mucho más compacta mediante un producto matricial! Reflexiona un poco por qué la expresión anterior dice exactamente lo mismo que la siguiente:
Como tarea moral, tendrás que verificar que en un campo vectorial diferenciable en se debe cumplir que . Por lo discutido, debe pasar entonces para cada que
Esto precisamente nos está diciendo que si es diferenciable en , entonces sus derivadas parciales deben existir y se debe cumplir que la forma matricial de en las bases canónicas de y debe ser
Matriz jacobiana
Toda la discusión anterior nos lleva a lo siguiente.
Definición. Dado un campo vectorial diferenciable en un punto con derivada , a la matriz que representa a en las bases canónicas la denotamos por y le llamamos la matriz jacobiana de en .
Por lo discutido en la sección anterior,
Escribiremos para referirnos al producto de la matriz con el vector (columna) , que precisamente coincide con . Así, bajo la hipótesis de diferenciabilidad, hemos recuperado entonces lo que hace como una multiplicación matricial, donde la matriz tiene como elementos a las derivadas parciales de las funciones coordenada en el punto .
Ejemplos de diferenciabilidad en campos vectoriales
Con todo lo discutido hasta ahora, obtenemos un método para obtener la derivada para campos vectoriales, lo que nos permitirá, por ejemplo, encontrar la transformación lineal de forma explícita y encontrar hiperplanos tangentes.
Ejemplo. Consideremos Calculemos su diferencial en el punto . Las funciones coordenada son
de donde tenemos: Así
Ejemplo. Ahora obtengamos el plano tangente a una superficie dada en un punto dado. Sea la superficie de descrita por la imagen de la función . Vamos a determinar el plano tangente a dicha superficie en el punto . Comencemos calculando . En primer lugar calculemos las parciales:
Por lo tanto
Esta transformación manda al punto del plano al punto
De modo que el plano centrado en el origen es el conjunto
Pero este plano debemos todavía trasladarlo por el vector para que pase por el punto . Concluimos entonces que el plano tangente buscado es el conjunto
En la Figura 4 tenemos la en rojo la imagen del campo vectorial de este ejemplo y en verde la del plano tangente, el punto negro es el punto .
Figura 4
¿Y derivadas parciales implica diferenciabilidad?
Cuando un campo vectorial es diferenciable, existen todas las derivadas parciales de todos sus campos escalares coordenados. El regreso no es cierto. Sin embargo, sí se vale bajo una condición adicional de regularidad.
Definición. Diremos que un campo vectorial es de clase (o simplemente es ) en un punto si todas las derivadas parciales de todas las funciones componentes de existen y son continuas en . Definimos de manera análoga lo que significa que sea de clase en todo .
Teorema. Si es un campo vectorial, y es en , entonces es diferenciable y su derivada tiene como forma matricial a la matriz jacobiana .
En esta entrada introdujimos el concepto de diferenciabilidad, de derivadas parciales, direccionales y por componente. Además, mostramos que cuando una función es diferenciable, entonces su derivada tiene una forma matricial muy sencilla, dada por las derivadas parciales de las componentes. Esto es nuestra primera señal de que las derivadas y las matrices están muy relacionadas entre sí. Lo que veremos en la siguiente entrada es que esta conexión se sigue dando, y de hecho nos permitirá enunciar de manera muy elegante la regla de la cadena para campos vectoriales: ¡será una multiplicación de matrices!
Después de entender mejor la diferenciabilidad, presentaremos y demostraremos teoremas clásicos e importantes de campos vectoriales: el teorema de la función inversa, y el teorema de la función implícita.
Tarea moral
Completa los detalles faltantes del primer ejemplo que dimos de diferenciabilidad.
Calcula la matriz jacobiana de la función . Úsala para encontrar la ecuación del espacio tangente a la gráfica en el punto .
Halla el campo vectorial cuya imagen es el plano tangente a la superficie dada por la ecuación en el punto . Como ayuda al graficar en nos dibuja la misma superficie que obtenemos de la imagen del campo vectorial que esta contenida en .
Verifica que en efecto las dos definiciones de diferenciabilidad que dimos son equivalentes.
Demuestra que si las parciales de cada componente de un campo vectorial existen, y son continuas, entonces la función es diferenciable. Tendrás que seguir la sugerencia dada en la última sección. Después, justifica la igualdad que dimos que escribe a las derivadas direccionales en términos de las parciales.
Explica a detalle por qué la expresión a la que llegamos para en efecto se puede pensar como el producto matricial mencionado.
Encuentra un ejemplo de campo vectorial en donde las derivadas parciales existen en algún punto , pero no todas las derivadas direccionales existen.
En esta parte del curso estamos abordando los resultados principales de campos vectoriales y su diferenciabilidad. Hemos hablado de cómo la derivada de una composición se calcula con regla de la cadena. También, enunciamos el teorema de la función inversa, lo demostramos, y vimos un ejemplo de cómo se usa. Ahora pasaremos a otro de los resultados fundamentales en el tema: el teorema de la función implícita. Vamos a motivarlo a partir del problema de resolver sistemas de ecuaciones no lineales. Luego, lo enunciaremos formalmente y lo demostraremos. La discusión y los ejemplos los dejaremos para la siguiente entrada.
Una motivación: resolver sistemas de ecuaciones no lineales
Con lo que repasamos sobre sistemas de ecuaciones lineales, y con lo que se ve en un curso de Álgebra Lineal I, se puede entender completamente cómo resolver sistemas de eccuaciones lineales. Recordemos un poco de esto. Tomemos el siguiente sistema de ecuaciones lineales en las variables :
Para resolverlo, se podría utilizar el proceso de reducción gaussiana. Tras hacer esto, podíamos clasificar a las variables en libres (que podían valer lo que sea) y pivote (que dependían afinmente de las libres). Esto daba todas las soluciones. Si, por decir algo, las variables pivote son y las libre son , entonces podemos reescribir lo anterior de la siguiente manera: «podemos despejar a las primeras en función de las segundas», algo así como
Elegimos a como queramos. De ahí quedan definidos afinmente con las . Y esto da todas las soluciones. Pero, ¿qué sucedería si tenemos un sistema de ecuaciones mucho más general?
Para plantear esto, imaginemos que ahora tenemos cualesquiera funciones y que queremos encontrar todas las soluciones al siguiente sistema de ecuaciones:
Esto es tan general como pudiéramos esperar. A la izquierda hay ceros, pero es porque si hubiera otras cosas, podríamos pasarlas a la izquierda para dejar ceros a la derecha.
Este sistema parece imposible de resolver: no tenemos idea de quiénes son las funciones , no hay reducción gaussiana, no hay variables libres, etc. Pero imaginemos que el campo vectorial es de clase alrededor de algún punto en donde queremos despejar. Esto nos diría que cerca de cada expresión con se parece muchísimo a su mejor aproximación lineal:
donde, tenemos:
donde . Pero entonces el sistema es prácticamente el mismo sistema que
Esto se ve un poco complicado, pero cada es simplemente un número real. ¡Cerquita de el sistema de ecuaciones es prácticamente un sistema lineal! Sería entonces de esperarse que las soluciones el sistema original sean muy cercanas a las del sistema lineal que sale y de nuevo recuperamos los trucos usuales: reducción gaussiana, variables libres, variables pivote, etc.
Pensando en que en el sistema las variables pivote son y las libres son , entonces podemos encontrar transformaciones afines tales que las soluiones de consisten en elegir arbitrariamente, y tomar
Muy probablemente no será una solución de , pues son sistemas diferentes entre sí. Pero suena a que son tan tan cercanos, que con tantita maniobra podremos encontrar funciones tales que cualquier solución a similarmente está dada por elegir arbitrariamente y tomar
Gracias a que pudimos poner a todos los en función de los , hemos logrado encontrar todas las soluciones a cerca de . El teorema de la función inversa nos ayuda a volver precisas muchas de las cosas discutidas en esta sección.
Enunciado del teorema de la función implícita
Pensemos que tenemos algunas restricciones dadas por ecuaciones como las del sistema . Lo que el teorema de la función implícita nos dirá es que bajo suficiente regularidad y algunas condiciones de invertibilidad, en una vecindad de un punto las incógnitas se pueden poner en función de las incógnitas , es decir, que se puede despejar como lo mencionamos al final de la sección anterior. El enunciado es el siguiente.
Teorema (de la función implícita). Sea un campo vectorial de clase en con funciones componentes , para .
Pensemos en el conjunto de soluciones del siguiente sistema de ecuaciones:
Supongamos además que para el punto la matriz
es invertible. Entonces existen abiertos y con , , para los cuales hay una única función de clase en , tal que si y sólo si .
Sólo para aclarar algunas diferencias con lo discutido anteriormente, aquí ya estamos separando en lo que esperaremos que serán las variables libres y las variables pivote . Estamos además estudiando el caso en el que tenemos tantas variables libres como ecuaciones, pues este caso es fácil de enunciar en términos de la invertibilidad de una matriz. El caso más general se trata con reducción gaussiana como platicamos en la sección anterior. La igualdad es lo que entendemos como «despejar» a los ’s en función de los ’s.
Demostración del teorema de la función implícita
Veamos la demostración del teorema.
Demostración. Definamos como . Dado que es de clase , se tendrá que también (explica esto como tarea moral).
Notemos que
Por otro lado, notemos que la matriz jacobiana de en es
esta matriz además es invertible (también tendrás que explicar ambas cosas de tarea moral).
La idea clave es que entonces podemos usar el teorema de la función inversa en . Aplícandolo en este contexto, obtenemos que existe tal que es inyectiva en una bola . Nos dice también que es un conjunto abierto, y que es de clase en . También dice algo de quién es la derivada explícitamente, pero eso no lo necesitaremos por ahora (de tarea moral tendrás que pensar qué nos dice esto).
Como manda a y es un abierto, entonces hay una bola abierta alrededor de contenida en . El conjunto que propondremos será el abierto que se obtiene al intersectar con el espacio en donde la coordenada correspondiente a es cero. En otras palabras, es un abierto y consiste de para los cuales existe un tal que (es decir, ).
Tomemos ahora un . Afirmamos que hay sólo un tal que y . Si hubiera y que satisfacen eso, tendríamos
que por la inyectividad de implica . De hecho, dicho único está en función de , que es de clase de modo que el conjunto de los asignados a los en es un abierto .
Así, podemos definir de la siguiente manera: , donde es el único elemento para el cual y . De la discusión desarrollada, está bien definida y cumple con las propiedades buscadas.
Por último probemos que es de clase en . Como esta definida y, además es de clase sobre el conjunto , si escribimos que , bastaría con demostrar:
para cada . Esto se hace como sigue:
Así queda terminada de la demostración de este importante teorema.
Algunas reflexiones finales
Si quisiéramos usar de manera práctica la demostración para encontrar la función implícita , necesitaríamos calcular la inversa . Sin embargo, las técnicas que tenemos hasta ahora no nos permiten hacer eso tan fácilmente. La versión del teorema de la función inversa que tenemos nos dice que hay una inversa, pero no nos dice quién es. La mayoría de las veces dar esta inversa es muy difícil, por no decir imposible.
Aunque esto parezca algo negativo, de cualquier forma tenemos un resultado muy importante. En algunos casos, sí podremos dar la función inversa con relativa facilidad. Y en otros contextos, aunque no podamos dar la inversa explícitamente, sí tendremos una base teórica robusta para demostrar otros resultados. El teorema de la función implícita es una palanca importante para otros resultados que brindan mucha luz acerca del comportamiento de los campos vectoriales.
Mas adelante…
La demostración y el desarrollo teórico tanto del teorema de la función inversa, como el de la función implícita, son muy técnicos. Dejaremos los aspectos técnicos hasta aquí y en la siguiente entrada procesaremos mejor lo que quiere decir este teorema hablando de varios ejemplos, y también de sus consecuencias.
Tarea moral
Considérese la función dada por aplica el teorema de la función implícita para obtener una función tal que es solución de la ecuación .
Explica con detalle por qué la función de la demostración del teorema de la función implícita es de clase .
Verifica que en efecto es la expresión dada en la demostración del teorema. Además, justifica por qué es invertible.
Justifica con detalle por qué los conjuntos y de la demostración en efecto son conjuntos abiertos.
El teorema de la función inversa también nos dice quién es la derivada de la inversa. ¿Eso qué quiere decir en el contexto del teorema de la función implícita?
En la entrada anterior hablamos de derivadas parciales de segundo orden y dimos una condición sencilla de verificar para garantizar que ciertas derivadas mixtas sean iguales. Lo que haremos ahora es dar un siguiente paso y hablar de derivadas parciales de orden superior. Enunciaremos un resultado análogo al de la entrada anterior, para garantizar que cualesquiera dos derivadas conmuten. Un poco más adelante, usaremos las derivadas de orden superior para enunciar un teorema de Taylor para funciones de varias variables.
Definiciones de derivadas parciales de orden superior
En la entrada anterior tomamos un campo escalar con dominio cierto abierto con derivadas parciales
en un cierto abierto . Hicimos notar que cada una de estas funciones es nuevamente un campo escalar en el abierto y que por lo tanto podríamos hacernos nuevamente la pregunta, para cada una de ellas, si resulta tener derivadas parciales o no. En caso de que sí, esto nos permitía crear derivadas parciales de segundo orden, del estilo
Al variar y de a , obtenemos otras posibles funciones, que nuevamente son campos escalares, de las cuales nuevamente podemos preguntarnos si tienen o no derivadas parciales. Esta idea podemos iterarla tantas veces como queramos. Para formalizarla, planteamos la siguiente definición. La definición es para funciones con dominio y un punto dado , pero se pueden hacer las adecuaciones necesarias para hablar de la diferenciabilidad de una función cunado su dominio es cierto abierto, o cuando se quiere hablar de diferenciabilidad en todo un abierto.
Definición. Sea una función y un vector. Definimos recursivamente sobre el símbolo
para como sigue:
Si , el símbolo simplemente representa a .
En otro caso, siempre y cuando se pueda derivar con respecto a la variable en el punto .
A ese símbolo le llamamos la derivada parcial de de -ésimo orden con respecto a las variables .
En otras palabras, siempre y cuando sea posible, tomamos y la vamos derivando primero con respecto a , luego con respecto a y así sucesivamente hasta que la última derivación es con respecto a .
Como en el caso de dos variables, nos permitiremos «agrupar variables en potencias» para simplificar algunas notaciones en caso de que la derivación sea consecutivamente con respecto a una misma variable. Por ejemplo, a la siguiente derivada parcial de orden :
usualmente la escribiremos en forma simplificada
Ejemplos de derivadas parciales de orden
Ejemplo. Tomemos el campo escalar dado por
Encontremos las siguientes derivadas parciales:
Comenzamos con
Luego calculemos
Por último calcularemos
Sería algo laborioso encontrar todas todas las derivadas parciales de orden en el ejemplo anterior. ¡Son 27! Aunque, bueno, muchas de ellas serán iguales gracias a un teorema que enunciaremos en la siguiente sección.
Veamos un ejemplo de en el que sí encontraremos todas las derivadas parciales de orden .
Ejemplo. Veamos cuáles son todas las derivadas parciales de orden para el siguiente campo escalar :
Primero encontremos ambas derivadas parciales de primer orden
Con ellas podemos encontrar las de segundo orden:
Finalmente, usamos estas últimas para encontrar las derivadas parciales de tercer orden. Primero, aquellas en donde derivamos las anteriores con respecto a :
y sólo faltan en donde derivamos las de segundo orden con respecto a :
Hay varias de estas derivadas parciales del ejemplo anterior que son iguales. ¿Cuáles? ¿Cuál parece ser que sea el criterio para que dos derivadas parciales de orden superior sean iguales?
Conmutatividad de derivadas parciales de orden superior
En los ejemplos anteriores hay algunas derivadas de orden superior que coinciden entre sí. El siguiente teorema nos da una condición para garantizar la conmutatividad en el orden en que derivamos para una gran cantidad de situaciones. Una vez más, nos limitamos a enunciar el resultado para un punto dentro de un abierto
Teorema. Sea una función y un entero. Sean enteros con valores en . Supongamos que:
Hay un abierto en el que las siguiente derivadas de orden existen:
Dichas derivadas son continuas en un punto .
Cada entero de a aparece la misma cantidad de veces en que en .
Entonces, ambas derivadas coinciden en .
La última condición es muy natural: tuvimos que haber derivado la misma cantidad de veces con respecto a cada variable. Así pues, por ejemplo, si tenemos con las condiciones adecuadas de continuidad y diferenciabilidad, podríamos por ejemplo garantizar que:
No daremos la demostración del teorema, pero quedará como tarea moral. Para que puedas realizarla, estudia con mucho detalle la demostración del teorema de la entrada anterior. Ya que la manejes bien, la demostración de este teorema requerirá de que plantees adecuadamente una inducción para aprovechar al máximo la definición recursiva para derivadas parciales de orden .
Más adelante…
Ya que hemos definido y entendido las derivadas parciales para cualquier orden , podemos enunciar otro de los teoremas clásicos de cálculo de una variable, pero en su versión para campos escalares: el teorema de Taylor. Haremos esto en la siguiente entrada.
Tarea moral
Encuentra todas las derivadas parciales de orden (con respecto a todas las formas de elegir variables) para las siguientes funciones, enunciando apropiadamente el dominio en el que estás trabajando y en el que funionan tus cálculos.
Demuestra que el campo escalar dado por tiene todas sus derivadas parciales con respecto a cualesquiera variables para todos los órdenes .
Cuando una función tiene todas sus derivadas de todos sus órdenes , decimos que es infinitamente diferencible o -infinito (en símbolos « es »). Haz una propuesta de qué querría decir que un campo escalar sea -infinito. Verifica que si un campo escalar es -infinito en todo , entonces se dan todas las conmutatividades de derivadas parciales.
Para convencerte de que el teorema de conmutatividad de derivadas parciales funciona, encuentra explícitamente las derivadas para el campo escalar dado por .
Demuestra el teorema de conmutatividad para derivadas parciales.