Archivo de la etiqueta: matriz jacobiana

Cálculo Diferencial e Integral III: Diferenciabilidad en campos vectoriales

Por Alejandro Antonio Estrada Franco

Introducción

Después de haber abordado a modo de repaso las herramientas que usaremos de álgebra lineal, estamos listos para estudiar la diferenciabilidad en funciones más generales. Ya estudiamos la diferenciabilidad en curvas (funciones $f:S\subseteq \mathbb{R}\to \mathbb{R}^m$) y en campos escalares (funciones $f:S\subseteq \mathbb{R}^n \to \mathbb{R}$). Ahora podemos estudiar la diferenciabilidad en campos vectoriales, que recuerda que ahora sí son funciones $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ para cualesquiera $m$ y $n$ enteros positivos.

Intuición de diferenciabilidad en campos vectoriales

Con anterioridad, hemos discutido la intuición geométrica de lo que quiere decir que un campo escalar $f:\mathbb{R}^n\to \mathbb{R}$ sea diferenciable. A grandes rasgos, estamos pidiendo que cerca de un punto $\bar{a}$ la función $f(\bar{a})$ cambie «como una función lineal». Esto quiere decir que la gráfica de la función se parece mucho a un hiperplano en $\mathbb{R}^{n+1}$ cerca del punto $\bar{a}$, tanto que de hecho podemos dar un hiperplano tangente a la gráfica en $\bar{a}$. Bajo suficiente regularidad, esta función lineal estaba dada por las derivadas parciales y estaba muy relacionada con el gradiente $\triangledown f$.

La situación para campos vectoriales es parecida. Si tenemos una función $f:\mathbb{R}^n\to \mathbb{R}^m$, entonces está dada por funciones coordenada que la expresan de la manera $f(\bar{x})=(f_1(\bar{x}),\ldots,f_m(\bar{x}))$ para cada $\bar{x}\in \mathbb{R}^n$. La diferenciabilidad que buscaremos ahora deberá suceder coordenada a coordenada, y por ello lo que pensaremos como derivada tendrá algo así como un gradiente por cada coordenada. Esto nos daría $m$ gradientes, pero una mejor forma de pensar en resumen a la derivada es como una transformación lineal $T:\mathbb{R}^n\to \mathbb{R}^m$ que nos diga con mucha precisión cuándo cambia la funciíon $f$ (cuando esto sea posible).

Para tener clara idea de lo que queremos hacer recordemos el ejemplo de campos escalares, y de aquí construiremos una generalización a campos vectoriales: Observa la Figura $1$. A la izquierda, hemos dibujado dos copias de $\mathbb{R}^n$ (pero que puedes pensar como $\mathbb{R}^2$). A la derecha, hemos dibujado la gráfica de dos funciones. Una es una función cualquiera $f:\mathbb{R}^{n}\rightarrow \mathbb{R}^m$. La otra es una transformación lineal $T:\mathbb{R}^{n}\rightarrow \mathbb{R}^m$ que ha sido trasladada sobre el plano $xy$ y sobre el eje $z$ con la función $G(\bar{v})=T(\bar{v}-\bar{a})+f(\bar{a})$. Estas gráficas son objetos en $\mathbb{R}^n \times \mathbb{R}^m$ (ponemos un punto por cada pareja $(\bar{x},f(\bar{x}))$ con $\bar{x}\in \mathbb{R}^n$).

Como $T$ es lineal, cumple $T(\bar{0})=0$. Al hacer la traslación, obtenemos $G(\bar{a})=T(\bar{0})+f(\bar{a})=f(\bar{a})$. Así, $T$ traslada un subespacio $H$ de dimensión $n$ a un subespacio afín de dimensión $n$ que pasa por $f(\bar{a})$. Lo que buscaremos al pedir que la función $f$ sea diferenciable con derivada $T$ es que la gráfica de $f$ se parezca mucho a este subespacio $H+f(\bar{a})$, tanto que de hecho dicho subespacio lo podremos pensar como tangente a la gráfica en el punto $(\bar{a},f(\bar{a}))$.

Figura 1

Definición de diferenciabilidad para campos vectoriales

¿Cuál es la condición algebraica que pediremos? Será muy similar a lo que pasaba en campos escalares. Lo que queremos es que el cambio $f(\bar{a}+\bar{v})-f(\bar{a})$ se parezca mucho a $T(\bar{v})$ cuando $\bar{v}$ es pequeño. De hecho, tiene que parecerse tanto, tanto, que $f(\bar{a}+\bar{v})-f(\bar{a})$ debe parecerse a $T(\bar{v})$ más rápido de lo que $\bar{v}$ se va a $\bar{0}$. Esto nos lleva a plantear que la condición buscada sea la siguiente:

$$\lim_{\bar{v}\to \bar{0}}\frac{||(f(\bar{a}+\bar{v})-f(\bar{a}))-T(\bar{v})||}{||\bar{v}||}=0.$$ La Figura $2$ tiene un diagrama que ayuda a entender esto un poco mejor. Queremos que la flecha indicada en amarillo acabe muy cerca de $f(\bar{a}+\bar{v})$.

El vector $T(\bar{v}-\bar{a})+f(\bar{a})$ es el vector $T(\bar{v})$ transportado hasta el plano tangente el cual está en color rosa. La idea es que $f(\bar{a}+\bar{v})-f(\bar{a})$, que es el vector señalado con amarillo abajo, se aproxime mucho en el sentido señalado por el límite mencionado en el párrafo de arriba. De esta manera tenemos la mejor aproximación lineal. Esta definición se inspira en el polinomio de Tylor de grado 1 para funciones de una variable real.

Por supuesto, la discusión que hemos tenido sólo aplica para cuando estamos trabajando cerca del punto $\bar{a}$, así que más bien la transformación lineal de la que estamos hablando dependerá del punto $\bar{a}$. Todo esto nos lleva a nuestra primera definición formal de diferenciabilidad.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Decimos que $f$ es diferenciable en $\bar{a}\in Int(S)$ si existe una transformación lineal $T_{\bar{a}}:\mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ tal que

$$\lim_{\bar{v}\to \bar{0}}\frac{||f(\bar{a}+\bar{v})-f(\bar{a})-T_{\bar{a}}(\bar{v})||}{||\bar{v}||}=0.$$

En este caso, a $T_{\bar{a}}$ le llamamos la derivada de $f$ en el punto $\bar{a}$.

Antes de empezar a demostrar propiedades de esta noción, nos conviene tener una versión alternativa y totalmente equivalente.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Decimos que $f$ es diferenciable en $\bar{a}\in Int(S)$ si existe una transformación lineal $T_{\bar{a}}:\mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ y una función $E:\mathbb{R}^n\times \mathbb{R}^n\to \mathbb{R}^m$ de manera que $$f(\bar{a}+\bar{v})=f(\bar{a})+T_{\bar{a}}(\bar{v})+||\bar{v}||E(\bar{a};\bar{v})$$ con $$\lim_{||\bar{v}||\to 0}E(\bar{a};\bar{v})=0.$$

Esta definición es equivalente a la anterior pues si despejamos tenemos: \[E(\bar{a};\bar{v})=\frac{f(\bar{a}+\bar{v})-f(\bar{a})-T_{\bar{a}}(\bar{v})}{||\bar{v}||},\] de donde se puede verificar que se cumple una definición si y sólo si se cumple la otra. Los detalles quedan como tarea moral.

Ejemplo. Consideremos la función $f(x,y)=(x^2y^2,xy)$ y tomemos el punto $a=(1,1)$. ¿Será $f$ diferenciable en $a$? Afirmamos que sí, que la función lineal $T_a(x,y)=(2x+2y, x+y)$ cumple con la definición de límite que se pide. Veamos esto en la primera versión de la definición. Tendríamos, usando $\bar{v}=(h,k)$, que

\begin{align*}
f((1,1)&+(h,k))-f(1,1)-T_a(h,k)\\
&=((h+1)^2(k+1)^2,(h+1)(k+1))-(1,1)-(2h+2k,h+k)\\
&=(h^2k^2+2h^2k+2hk^2+h^2+k^2+4hk,hk)
\end{align*}

Dividiendo entre $\sqrt{h^2+k^2}$ que es la norma de $v$, y haciendo manipulaciones algebraicas, se obtiene

$$\left(\frac{h^2k^2+2h^2k+2hk^2+h^2+k^2+4hk}{\sqrt{h^2+k^2}},\frac{hk}{\sqrt{h^2+k^2}}\right).$$

Por la desigualdad entre la media cuadrática y la media geométrica, $$\frac{|hk|}{\sqrt{h^2+k^2}}\leq \sqrt{\frac{|hk|}{2}},$$

de modo que cuando $(h,k)\to (0,0)$, la segunda coordenada del vector que nos interesa converge a cero. La primera coordenada también se puede ver que converge a cero: el primero, segundo, tercero y sexto sumandos se acotan de manera similar, pues tienen factores $h$ o $k$ adicionales. El cuarto y quinto sumando se acotan notando que $\frac{h^2+k^2}{\sqrt{h^2+k^2}}=\sqrt{h^2+k^2}$, que también converge a cero con $h$ y $k$. Los detalles quedan de tarea moral.

$\triangle$

Diferenciabilidad implica continuidad

En el caso de las funciones de una variable real teníamos claramente que diferenciabilidad implica continuidad. Como es de esperarse, lo mismo se cumple para campos vectoriales, ya que una función diferenciable es más «suave» que una continua.

Teorema. Supongamos $f:S\subseteq \mathbb{R}^n\to\mathbb{R}^m$ es un campo vectorial diferenciable en un punto $\bar{a}$ de $S$. Entonces $f$ es continuo en $\bar{a}$.

Demostración. Si $f$ es diferenciable en $\bar{a}$ entonces cumple con la ecuación \[f(\bar{a}+\bar{v})=f(\bar{a})+T_{\bar{a}}(\bar{v})+||\bar{v}||E(\bar{a};\bar{v})\] con $E(\bar{a};\bar{v})$ una función tal que $\lim_{\bar{v}\to \bar{0}} E(\bar{a}; \bar{v})=0$ (¿Por qué es válida esta última afirmación?). Por ello:

\begin{align*}
\lim\limits_{\bar{v}\to \bar{0}}f(\bar{a}+\bar{v})&=\lim\limits_{\bar{v}\to \bar{0}}\left( f(\bar{a})+T_{\bar{a}}(\bar{v})+||\bar{v}||E(\bar{a};\bar{v}) \right)\\
&= \lim\limits_{\bar{v}\to \bar{0}}f(\bar{a})+\lim\limits_{\bar{v}\to \bar{0}}T_{\bar{a}}(\bar{v})+\lim\limits_{\bar{v}\to \bar{0}}||\bar{v}||E(\bar{a};\bar{v}).
\end{align*}

El primer sumando no depende de $\bar{v}$, así que es $f(\bar{a})$. El segundo se va a cero pues las transformaciones lineales son continuas. Finalmente, el tercer sumando se va a cero por lo que sabemos de $E(\bar{a},\bar{v})$. Así, $\lim\limits_{\bar{v}\to \bar{0}}f(\bar{a}+\bar{v})=f(\bar{a})$. Por lo tanto $f$ es continua.

$\square$.

Derivadas direccionales y derivadas parciales

Si bien tenemos dos definiciones de diferenciabilidad, aún no tenemos una manera muy práctica de encontrar o describir a la transformación lineal $T_{\bar{a}}$, que es la mejor aproximación lineal. En el ejemplo después de nuestra definición, nos dieron la transformación y funcionó, pero hasta donde hemos platicado, todavía es un misterio cómo obtenerla.

Nos gustaría tener una descripción más explícita pues queremos resolver problemas específicos como encontrar, por ejemplo, la ecuación de un hiperplano tangente. Este problema ya lo habíamos resuelto para campos escalares: si tenemos suficiente regularidad, entonces podemos construir la derivada a través de las derivadas parciales (que a su vez son derivadas direccionales). La teoría que ya desarrollamos prácticamente se puede copiar, considerando que ahora tendremos derivadas en cada función coordenada.

Lo primero que notaremos es que así como para campos escalares, para campos vectoriales también podemos definir la noción de derivadas direccionales. Pensemos en una función $f:S\subseteq \mathbb{R}^{n}\to \mathbb{R}^n$. Tomemos un vector fijo $\bar{a}\in Int=(S)$. Coloquemos una flecha que comience en $\bar{a}$ y tenga dirección dada por otro vector dado $\bar{y}\in \mathbb{R}^{n}$. Si multiplicamos a $\bar{y}$ por un escalar $h$ positivo, esto estira o encoge al vector $\bar{y}$, pero lo deja con la misma dirección. En el ejemplo de la Figura 3, al variar sobre todos los valores de $h$ se genera la recta $\bar{a}+h\bar{y}$. Si a los puntos de esta recta le aplicamos la función $f$, se obtiene un cierto lugar geométrico $$f(\bar{a}+h\bar{y})=(f_1(\bar{a}+h\bar{y}),\ldots,f_m(\bar{a}+h\bar{y})),$$ conforme se varían los valores de $h$. Lo que definiremos como derivada direccional nos permitirá hablar de un espacio afín tangente de dimensión $m$ a este lugar geométrico en el punto $f(\bar{a})$.

Figura 3

A continuación tenemos nuestra definición de derivada direccional para campos vectoriales.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Tomemos $\bar{a}\in Int(S)$, $\bar{y}\in \mathbb{R}^{n}$. Definimos la derivada direccional de $f$ en $\bar{a}$ en la dirección $\bar{y}$ como: \[ f'(\bar{a};\bar{y})=\lim\limits_{h\to 0}\frac{f(\bar{a}+h\bar{y})-f(\bar{a})}{h}, \] siempre y cuando el límite exista.

Notemos que $f'(\bar{a};\bar{y})$ es un vector de $\mathbb{R}^{m}$.

En los campos escalares teníamos derivadas parciales. En este caso también las tenemos y describen a las derivadas direccionales en el mismo sentido que en el caso escalar. Para formalizar las cosas, damos la definición a continuación.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Tomemos $\bar{a}\in Int(S)$, $\bar{y}\in \mathbb{R}^{n}$. Definimos la derivada direccional de $f$ en la coordenada $x_i$ en $a$ como la derivada parcial $f'(\bar{a};\hat{e}_i)$, donde $\hat{e}_i$ es el $i$-ésimo vector de la base canónica, siempre y cuando esta exista.

Como en el caso de los campos escalares, las derivadas direccionales pueden entenderse en términos de las derivadas parciales bajo suficiente regularidad. Tomemos $\hat{e}_1,\ldots,\hat{e}_n$ la base canónica de $\mathbb{R}^n$. Tomemos $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$. Pensemos que todas las derivadas parciales de $f$ existen en un punto dado $\bar{a}$ y que son continuas. Expresemos a $\bar{y}$ como $\bar{y}=\alpha_1\hat{e}_1+\alpha_2\hat{e}_2+\ldots+\alpha_n\hat{e}_n$ con $\hat{e}_1,\ldots,\hat{e}_n$ la base canónica de $\mathbb{R}^n$. En esta entrada discutiremos hacia el final que bajo estas condiciones tendremos que $f'(\bar{a};\bar{y})$ existe y de hecho que $$f'(\bar{a};\bar{y})=\sum_{i=1}^n \alpha_i f'(\bar{a};\bar{e}_i).$$

El tener derivadas parciales continuas resultará una hipótesis muy fuerte y de hecho implicará todavía más que la existencia de derivadas direccionales. De hecho, como en el caso de campos escalares, esta hipótesis implicará diferenciabilidad. Antes de discutir esto, veremos en la siguiente sección qué pasa componente a componente.

Si las derivadas parciales no son continuas, no deberíamos esperar que las derivadas direccionales existan: ¡hay muchas posibles direcciones y sólo sabemos que pasa en dos de ellas! Como tarea moral, puedes pensar en un contraejemplo de un campo escalar $f:\mathbb{R}^2\to \mathbb{R}^2$ con derivadas parciales en cierto punto $\bar{a}$, pero sin alguna (o algunas) derivadas direccionales en $\bar{a}$.

Derivadas por componente

Las derivadas direccionales pueden entenderse mediante las derivadas parciales, pero también, como en el caso de las trayectorias, pueden entenderse mediante las derivadas por componente. Para pensar en ello, tomemos $\hat{e}_1,\ldots,\hat{e}_m$ la base canónica de $\mathbb{R}^m$. Tomemos $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ con funciones coordenadas $f(\bar{x})=\left( f_{1}(\bar{x}),\dots ,f_{m}(\bar{x})\right)$. Pensemos que las derivadas direccionales de $f_1,\ldots, f_m$ en $\bar{a}$ en la dirección $\bar{y}$ existen.

Tenemos entonces:

\begin{align*} \lim\limits_{h\to 0}\frac{f(\bar{a}+h\bar{y})-f(\bar{a})}{h} &=\lim\limits_{h\to 0}\frac{\left( f_{1}(\bar{a}+h\bar{y}),\dots ,f_{m}(\bar{a}+h\bar{y})\right) -\left( f_{1}(\bar{a}),\dots ,f_{m}(\bar{a})\right)}{h}\\ &=\lim\limits_{h\to 0}\left( \frac{f_{1}(\bar{a}+h\bar{y})-f_{1}(\bar{a})}{h},\dots ,\frac{f_{m}(\bar{a}+h\bar{y})-f_{m}(\bar{a})}{h}\right)\\ &=\lim\limits_{h\to 0}\sum_{i=1}^{m}\frac{f_{i}(\bar{a}+h\bar{y})-f_{i}(\bar{a})}{h}{\hat{e}_{i}}\\
&=\sum_{i=1}^{m}\lim\limits_{h\to 0}\frac{f_{i}(\bar{a}+h\bar{y})-f_{i}(\bar{a})}{h}{\hat{e}_{i}}\\ &=\sum_{i=1}^{m}f_{i}'(\bar{a};\bar{y}){\hat{e}_{i}}. \end{align*}

En la última igualdad estamos usando la suposición de que las derivadas existen componente a componente. Como mostramos que el límite planteado inicialmente existe, obtenemos entonces que
\begin{equation} \label{eq:porcomponente} f'(\bar{a};\bar{y})=\sum_{i=1}^{m}f_{i}'(\bar{a};\bar{y}){\hat{e}_{i}} .\end{equation}

Lo que tenemos aquí es que la derivada direccional de $f$ en $\bar{a}$ en dirección de $\bar{y}$ es la suma vectorial de cada vector de la base escalado por la derivada direccional del campo escalar $f_{i}$ en $\bar{a}$ con respecto a la dirección de $\bar{y}$.

Diferenciabilidad implica derivadas direccionales

La noción de diferenciabilidad que dimos implica la diferenciabilidad de cada una de las funciones componente $f_i$ de una función $f:\mathbb{R}^n\to \mathbb{R}^m$. Es decir, si el campo vectorial es diferenciable, entonces cada uno de los campos escalares $f_1,\ldots,f_m$ componentes son también diferenciables, pues el límite $$\lim_{\bar{v}\to \bar{0}}\frac{||f(\bar{a}+\bar{v})-f(\bar{a})-T_{\bar{a}}(\bar{v})||}{||\bar{v}||}=0$$ se cumple, y por lo tanto se cumple componente a componente. En el caso de $T_{\bar{a}}$ el $i$-ésimo componente es precisamente hacer el producto interior del $i$-ésimo renglon de la matriz que representa a $T_{\bar{a}}$ con $\bar{v}$, y entonces la derivada $\triangledown f_i(\bar{a})$ del campo escalar $f_i$ está dada precisamente por dicho $i$-ésimo renglón.

A su vez, sabemos que si un campo escalar es diferenciable, entonces existen todas las derivadas parciales. Por lo que hemos platicado en unidades anteriores, si $\bar{y}\in \mathbb{R}^{n}$ se escribe en la base canónica como $\bar{y}=\sum_{j=1}^{n}y_{j}{\hat{e}_{j}}$, al aplicar $\triangledown f_i(\bar{a})$ obtenemos

\begin{align*}
\triangledown f_i(\bar{a})(\bar{y})&=\sum_{j=1}^n y_j\triangledown f_i(\bar{a})(\hat{e}_j)\\
&=\sum_{j=1}^n y_j \frac{\partial f_i}{\partial x_j}(\bar{a}),\\
\end{align*}

lo cual abreviamos como

$$f_i'(\bar{a};\bar{y})=\left(\frac{\partial f_i}{\partial x_1}(\bar{a}), \ldots, \frac{\partial f_i}{\partial x_n}(\bar{a})\right) \cdot \bar{y}.$$

Usando esta igualdad para cada $i$ y sustituyendo la ecuación \eqref{eq:porcomponente} que obtuvimos al analizar componente por componente, obtenemos entonces que

$$f^{\prime}(\bar{a};\bar{y})=\sum_{i=1}^m \left(\left(\frac{\partial f_i}{\partial x_1}(\bar{a}), \ldots, \frac{\partial f_i}{\partial x_n}(\bar{a})\right) \cdot \bar{y}\right)\hat{e}_i.$$

¡Pero esto se puede denotar de manera mucho más compacta mediante un producto matricial! Reflexiona un poco por qué la expresión anterior dice exactamente lo mismo que la siguiente:

$$f'(\bar{a};\bar{y})= \begin{pmatrix} \frac{\partial f_{1}}{\partial y_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial y_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}\begin{pmatrix} y_{1} \\ \vdots \\ y_{n} \end{pmatrix}.$$

Como tarea moral, tendrás que verificar que en un campo vectorial diferenciable en $\bar{a}$ se debe cumplir que $f'(\bar{a};\bar{y})=T_{\bar{a}}(\bar{y})$. Por lo discutido, debe pasar entonces para cada $y$ que \[ T_{\bar{a}}(\bar{y})=\begin{pmatrix} \frac{\partial f_{1}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial x_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}\begin{pmatrix} y_{1} \\ \vdots \\ y_{n} \end{pmatrix}.\]

Esto precisamente nos está diciendo que si $f$ es diferenciable en $a$, entonces sus derivadas parciales deben existir y se debe cumplir que la forma matricial de $T_{\bar{a}}$ en las bases canónicas de $\mathbb{R}^n$ y $\mathbb{R}^m$ debe ser \begin{equation}\label{eq:jacobiana}\begin{pmatrix} \frac{\partial f_{1}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial x_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}.\end{equation}

Matriz jacobiana

Toda la discusión anterior nos lleva a lo siguiente.

Definición. Dado un campo vectorial $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ diferenciable en un punto $\bar{a}\in Int(S)$ con derivada $T_{\bar{a}}$, a la matriz que representa a $T_{\bar{a}}$ en las bases canónicas la denotamos por $Df(\bar{a})$ y le llamamos la matriz jacobiana de $f$ en $\bar{a}$.

Por lo discutido en la sección anterior,

$$Df(\bar{a})=\begin{pmatrix} \frac{\partial f_{1}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial x_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}.$$

Escribiremos $Df(\bar{a})(\bar{x})$ para referirnos al producto de la matriz $Df(\bar{a})$ con el vector (columna) $\bar{x}$, que precisamente coincide con $T_{\bar{a}}(\bar{x})$. Así, bajo la hipótesis de diferenciabilidad, hemos recuperado entonces lo que hace $T_{\bar{a}}$ como una multiplicación matricial, donde la matriz tiene como elementos a las derivadas parciales de las funciones coordenada en el punto $\bar{a}$.

Ejemplos de diferenciabilidad en campos vectoriales

Con todo lo discutido hasta ahora, obtenemos un método para obtener la derivada para campos vectoriales, lo que nos permitirá, por ejemplo, encontrar la transformación lineal de forma explícita y encontrar hiperplanos tangentes.

Ejemplo. Consideremos $f(x,y)=(x^{2},xy,y^{2}).$ Calculemos su diferencial en el punto $(1,-1)$. Las funciones coordenada son

\begin{align*}
f_{1}(x,y)&=x^{2}\\
f_{2}(x,y)&=xy\\
f_{3}(x,y)&=y^{2},
\end{align*}

de donde tenemos: \[ \frac{\partial f_{1}}{\partial x}(1,-1)=\left. 2x\right|_{_{(1,-1)}}=2;\hspace{3cm} \frac{\partial f_{1}}{\partial y}(1,-1)=0;\hspace{3cm}\frac{\partial f_{2}}{\partial x}(1,-1)=\left. y\right|_{_{(1,-1)}}=-1;\] \[ \frac{\partial f_{2}}{\partial y}(1,-1)=\left. x\right|_{_{(1,-1)}}=1;\hspace{3cm}\frac{\partial f_{3}}{\partial x}(1,-1)=0;\hspace{3cm}\frac{\partial f_{3}}{\partial y}(1,-1)=\left. 2y\right|_{_{(1,-1)}}=-2.\] Así \[ Df(1,-1)=\begin{pmatrix} \frac{\partial f_{1}}{\partial x}(1,-1) & \frac{\partial f_{1}}{\partial y}(1,-1) \\ \frac{\partial f_{2}}{\partial x}(1,-1) & \frac{\partial f_{2}}{\partial y}(1,-1) \\ \frac{\partial f_{3}}{\partial x}(1,-1) & \frac{\partial f_{3}}{\partial y}(1,-1) \end{pmatrix}= \begin{pmatrix} 2 & 0 \\ -1 & 1 \\ 0 & -2 \end{pmatrix}.\]

$\triangle$

Ejemplo. Ahora obtengamos el plano tangente a una superficie dada en un punto dado. Sea $\mathcal{S}$ la superficie de $\mathbb{R}^{3}$ descrita por la imagen de la función $f(x,y)=(x,y,xy^{2})$. Vamos a determinar el plano tangente a dicha superficie en el punto $(1,1,1)$. Comencemos calculando $Df(1,1)$. En primer lugar calculemos las parciales: \[ \frac{\partial f_{1}}{\partial x}(1,1)=1;\hspace{3cm}\frac{\partial f_{1}}{\partial y}(1,1)=0;\hspace{3cm}\frac{\partial f_{2}}{\partial x}(1,1)=0 \] \[ \frac{\partial f_{2}}{\partial y}(1,1)=1;\hspace{3cm}\frac{\partial f_{3}}{\partial y}(1,1)=1;\hspace{3cm}\frac{\partial f_{3}}{\partial y}(1,1)=2.\]

Por lo tanto \[ Df(1,1)=\begin{pmatrix} 1 & 0 \\ 0 & 1 \\ 1 & 2 \end{pmatrix}.\]

Esta transformación manda al punto $(x,y)$ del plano $\mathbb{R}^2$ al punto\[ \begin{pmatrix} 1 & 0 \\ 0 & 1 \\ 1 & 2 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} x \\ y \\ x+2y \end{pmatrix}.\]

De modo que el plano centrado en el origen es el conjunto $$H=\{(x,y,x+2y)\in \mathbb{R}^{3}|(x,y)\in \mathbb{R}^{2}\}.$$

Pero este plano debemos todavía trasladarlo por el vector $(1,1,1)$ para que pase por el punto $f(1,1)$. Concluimos entonces que el plano tangente buscado es el conjunto

$$\{(x+1,y+1,x+2y+1)\in \mathbb{R}^{3}|(x,y)\in \mathbb{R}^{2}\}.$$

En la Figura 4 tenemos la en rojo la imagen del campo vectorial de este ejemplo y en verde la del plano tangente, el punto negro es el punto $(1,1,1)$.

Figura 4

$\triangle$

¿Y derivadas parciales implica diferenciabilidad?

Cuando un campo vectorial es diferenciable, existen todas las derivadas parciales de todos sus campos escalares coordenados. El regreso no es cierto. Sin embargo, sí se vale bajo una condición adicional de regularidad.

Definición. Diremos que un campo vectorial $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ es de clase $C^1$ (o simplemente es $C^1$) en un punto $\bar{a}\in S$ si todas las derivadas parciales de todas las funciones componentes de $f$ existen y son continuas en $\bar{a}$. Definimos de manera análoga lo que significa que $f$ sea de clase $C^1$ en todo $S$.

Teorema. Si $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ es un campo vectorial, $\bar{a}\in S$ y $f$ es $C^1$ en $\bar{a}$, entonces $f$ es diferenciable y su derivada $T_a$ tiene como forma matricial a la matriz jacobiana \eqref{eq:jacobiana}.

La prueba de este resultado se hace coordenada a coordenada, aplicando en cada una de ellas el teorema de diferenciabilidad y derivadas parciales para campos escalares que demostramos en la entrada del teorema del valor medio para campos escalares.

Más adelante

En esta entrada introdujimos el concepto de diferenciabilidad, de derivadas parciales, direccionales y por componente. Además, mostramos que cuando una función es diferenciable, entonces su derivada tiene una forma matricial muy sencilla, dada por las derivadas parciales de las componentes. Esto es nuestra primera señal de que las derivadas y las matrices están muy relacionadas entre sí. Lo que veremos en la siguiente entrada es que esta conexión se sigue dando, y de hecho nos permitirá enunciar de manera muy elegante la regla de la cadena para campos vectoriales: ¡será una multiplicación de matrices!

Después de entender mejor la diferenciabilidad, presentaremos y demostraremos teoremas clásicos e importantes de campos vectoriales: el teorema de la función inversa, y el teorema de la función implícita.

Tarea moral

  1. Completa los detalles faltantes del primer ejemplo que dimos de diferenciabilidad.
  2. Calcula la matriz jacobiana de la función $g(x,y,z)=(xz,xy,x^{2}y^{2}z^{2})$. Úsala para encontrar la ecuación del espacio tangente a la gráfica en el punto $g(2,1,0)$.
  3. Halla el campo vectorial cuya imagen es el plano tangente a la superficie dada por la ecuación $F(x,y)=x^{2}y^{2}+1$ en el punto $(1,1)$. Como ayuda al graficar $F$ en $\mathbb{R}^{3}$ nos dibuja la misma superficie que obtenemos de la imagen del campo vectorial $f(x,y)=(x,y,x^{2}y^{2}+1)$ que esta contenida en $\mathbb{R}^{3}$.
  4. Verifica que en efecto las dos definiciones de diferenciabilidad que dimos son equivalentes.
  5. Demuestra que si las parciales de cada componente de un campo vectorial existen, y son continuas, entonces la función es diferenciable. Tendrás que seguir la sugerencia dada en la última sección. Después, justifica la igualdad que dimos que escribe a las derivadas direccionales en términos de las parciales.
  6. Explica a detalle por qué la expresión a la que llegamos para $f^{\prime}(\bar{a};\bar{y})$ en efecto se puede pensar como el producto matricial mencionado.
  7. Encuentra un ejemplo de campo vectorial $f:\mathbb{R}^2\to \mathbb{R}^2$ en donde las derivadas parciales existen en algún punto $\bar{a}$, pero no todas las derivadas direccionales existen.

Entradas relacionadas

Ecuaciones Diferenciales I: Linealización de los puntos de equilibrio de sistemas no lineales

Por Omar González Franco

La educación en matemáticas es mucho más complicada que lo que esperabas,
incluso si esperabas que es más complicada que lo que esperabas.
– Edward Griffith Begle

Introducción

Nos acercamos al final de este curso. Para concluir estudiaremos un último tema que tiene que ver con los sistemas autónomos de ecuaciones diferenciales no lineales.

Resolver de forma analítica sistemas de ecuaciones diferenciales no lineales puede ser una tarea sumamente complicada y en algunos casos hasta imposible, es por ello que en muchas ocasiones se opta por resolverlos con métodos numéricos. En este curso no veremos métodos numéricos y mucho menos métodos analíticos para resolver sistemas de ecuaciones diferenciales no lineales debido a que requerimos de más teoría que queda fuera de este primer curso de ecuaciones diferenciales. Pero lo que si podemos hacer es un análisis cualitativo como lo hemos estado haciendo en esta unidad.

Recordemos que el espacio fase de un sistema de ecuaciones diferenciales aporta la suficiente información como para conocer de forma completa el comportamiento de los soluciones a diferentes tiempos, incluso esta información puede ser suficiente para describir el fenómeno que estemos estudiando sin la necesidad de conocer explícitamente las soluciones del sistema.

En esta y las próximas entradas comenzaremos a desarrollar métodos cualitativos que nos permitirán construir el espacio fase de sistemas no lineales y por tanto conocer el comportamiento de sus soluciones a diferentes tiempos y diferentes condiciones iniciales.

En estos momentos ya conocemos métodos analíticos y geométricos que nos permiten entender completamente a los sistemas lineales, es posible combinar estos métodos con algunas otras técnicas cualitativas adicionales para describir a los sistemas no lineales. Comenzaremos desarrollando el método de linealización, el cual nos mostrará cómo es que puede aproximarse un sistema no lineal a un punto de equilibrio por medio de un sistema lineal.

Trayectorias de los sistemas no lineales

Consideremos el siguiente sistema no lineal.

\begin{align*}
x^{\prime} &= y \\
y^{\prime} &= -x + (1 -x^{2})y \label{1} \tag{1}
\end{align*}

Enseguida podemos darnos cuenta de que el único punto de equilibrio del sistema es el origen. Usando la herramienta que hemos estado utilizando a lo largo de esta unidad podemos visualizar el plano fase del sistema acompañado del campo vectorial asociado.

Plano fase del sistema no lineal (1).

Las trayectorias en general no muestran un comportamiento parecido a alguno de los sistemas estudiados en las entradas anteriores y claro que debe ser así, ya que en este caso se trata de un sistema no lineal. Sin embargo, se puede notar que alrededor del punto de equilibrio, es decir del origen, si hay un comportamiento que nos parece familiar, pues se trata de una espiral que se aleja del origen (parecido a foco inestable).

Lo que haremos será aproximar el sistema (\ref{1}) con un sistema que sea mucho más fácil de analizar. Observemos que el término que hace que el sistema no sea lineal es $x^{2}y$ en la ecuación para $y^{\prime}$. Si $x$ y $y$ son pequeñas (cercanas al punto de equilibrio), entonces el término $x^{2}y$ es aún mucho más pequeño, de manera que para valores pequeños de $x$ y de $y$ es posible aproximar el sistema (\ref{1}) en un sistema lineal en el que no aparece el término $x^{2}y$, dicho sistema es

\begin{align*}
x^{\prime} &= y \\
y^{\prime} &= -x + y \label{2} \tag{2}
\end{align*}

Ambos sistemas deben ser muy similares en una vecindad muy próxima al punto de equilibrio, en este caso en el origen. Veamos el plano fase del sistema lineal (\ref{2}).

Plano fase del sistema lineal (2).

Si observamos con cuidado ambos planos fase vemos que efectivamente son muy similares alrededor del origen, ya que ambos corresponden a espirales que se alejan del origen.

El plano fase del sistema (\ref{2}) corresponde a un sistema con valores propios complejos. Prueba que efectivamente los valores propios son

$$\lambda_{1} = \dfrac{1 + i \sqrt{3}}{2} \hspace{1cm} y \hspace{1cm} \lambda_{2} = \dfrac{1 -i \sqrt{3}}{2}$$

Como son complejos con parte real positiva, sabemos que las soluciones del sistema lineal se mueven en espiral alejándose del origen.

Lo que hemos hecho se conoce como linealización del punto de equilibrio. Cerca del punto de equilibrio aproximamos el sistema no lineal por medio de un sistema lineal apropiado. Para condiciones iniciales cerca del punto de equilibrio las soluciones del sistema no lineal y de la aproximación lineal permanecen cercanas entre sí, por lo menos en algún intervalo.

El sistema no lineal (\ref{1}) se conoce como ecuación de Van der Pol y más adelante volveremos a él.

Veamos cómo sería hacer una linealización de un sistema no polinomial. Consideremos el sistema no lineal

\begin{align*}
x^{\prime} &= y \\
y^{\prime} &= -y -\sin(x) \label{3} \tag{3}
\end{align*}

El término no lineal corresponde a la función seno. Este modelo bien puede representar el movimiento de un péndulo amortiguado.

Los puntos de equilibrio del sistema son $Y_{0} = (0, 0), (\pm \pi, 0), (\pm 2\pi, 0)$, etcétera. Concentrémonos sólo en el origen.

Sabemos que

$$\sin(x) = x -\dfrac{x^{3}}{3!} + \dfrac{x^{5}}{5!} – \cdots \label{4} \tag{4}$$

Entonces podemos escribir al sistema (\ref{3}) como

\begin{align*}
x^{\prime} &= y \\
y^{\prime} &= -y -\left( x -\dfrac{x^{3}}{3!} + \dfrac{x^{5}}{5!} – \cdots \right) \label{5} \tag{5}
\end{align*}

Para $x$ muy pequeña los términos con potencia son aún más pequeños, así que los podemos omitir aproximándonos al siguiente sistema lineal.

\begin{align*}
x^{\prime} &= y \\
y^{\prime} &= -y -x \label{6} \tag{6}
\end{align*}

Los valores propios de este sistema son

$$\lambda_{1} = \dfrac{-1 + i \sqrt{3}}{2} \hspace{1cm} y \hspace{1cm} \lambda_{2} = \dfrac{-1 -i \sqrt{3}}{2}$$

Como estos números son complejos con parte real negativa, esperamos que el correspondiente punto de equilibrio para el sistema no lineal sea un foco estable.

A continuación se muestra el plano fase del sistema no lineal (\ref{3}) y posteriormente el plano fase del sistema linealizado (\ref{6}) y observemos en ambos el comportamiento de las trayectorias alrededor del punto de equilibrio $Y_{0} = (0, 0)$.

Plano fase del sistema (3).
Plano fase del sistema (6).

Efectivamente, en ambos planos fase alrededor del origen presentan el mismo comportamiento correspondiente a un foco estable.

El proceso de linealización puede ser directo independientemente del sistema no lineal que tengamos, pero debemos apoyarnos de una herramienta del cálculo diferencial conocida como matriz Jacobiana.

Linealización de los puntos de equilibrio

Consideremos el siguiente sistema autónomo no lineal.

\begin{align*}
x^{\prime} &= F_{1}(x, y) \\
y^{\prime} &= F_{2}(x, y) \label{7} \tag{7}
\end{align*}

Supongamos que $Y_{0} = (x_{0}, y_{0})$ es un punto de equilibrio de este sistema (no necesariamente el origen). Queremos entender qué sucede con las soluciones cerca de $Y_{0}$, es decir, linealizar el sistema cerca de $Y_{0}$. Introducimos nuevas variables.

\begin{align*}
u &= x -x_{0} \\
v &= y -y_{0} \label{8} \tag{8}
\end{align*}

Lo que hacen estas variables es mover el punto de equilibrio al origen. Si $x$ y $y$ están cerca del punto de equilibrio $(x_{0}, y_{0})$, entonces $u$ y $v$ tienden a $0$.

Como los números $x_{0}$ y $y_{0}$ son constantes y además

$$x = u + x_{0} \hspace{1cm} y \hspace{1cm} y = v + y_{0}$$

entonces el sistema (\ref{7}) escrito en términos de $u$ y $v$ es

\begin{align*}
\dfrac{du}{dt} &= \dfrac{d(x -x_{0})}{dt} = \dfrac{dx}{dt} = F_{1}(x, y) = F_{1}(x_{0} + u, y_{0} + v) \\
\dfrac{dv}{dt} &= \dfrac{d(y -y_{0})}{dt} = \dfrac{dy}{dt} = F_{2}(x, y) = F_{2}(x_{0} + u, y_{0} + v)
\end{align*}

Esto es,

\begin{align*}
u^{\prime} &= F_{1}(x_{0} + u, y_{0} + v) \\
v^{\prime} &= F_{2}(x_{0} + u, y_{0} + v) \label{9} \tag{9}
\end{align*}

Si $u = v = 0$, entonces

\begin{align*}
u^{\prime} &= F_{1}(x_{0}, y_{0}) \\
v^{\prime} &= F_{2}(x_{0}, y_{0})
\end{align*}

Pero,

$$F_{1}(x_{0}, y_{0}) = 0 \hspace{1cm} y \hspace{1cm} F_{2}(x_{0}, y_{0}) = 0$$

ya que $Y_{0} = (x_{0}, y_{0})$ es un punto de equilibrio, esto nos muestra que hemos movido el punto de equilibrio al origen en el plano $UV$.

Lo que haremos a continuación es apoyarnos de algunos resultados del curso de Cálculo III. Necesitamos eliminar los términos de orden superior o no lineales del sistema (\ref{9}). Como esas expresiones pueden incluir funciones exponenciales, logarítmicas y trigonométricas, no siempre es claro cuáles son los términos lineales. En este caso es necesario estudiar a $F_{1}$ y $F_{2}$ con más atención.

De cálculo sabemos que es posible estudiar una función analizando su mejor aproximación lineal, la cual está dada por el plano tangente para funciones de dos variables, es decir

$$F_{1}(x_{0} + u, y_{0} + v) \approx F_{1}(x_{0}, y_{0}) + \left[ \dfrac{\partial F_{1}}{\partial x}(x_{0}, y_{0}) \right]u + \left[ \dfrac{\partial F_{1}}{\partial y}(x_{0}, y_{0}) \right]v \label{10} \tag{10}$$

El lado derecho es la ecuación para el plano tangente a la gráfica de $F_{1}$ en $Y_{0} = (x_{0}, y_{0})$. Recordemos que la expresión (\ref{10}) es también la aproximación polinomial de primer grado de Taylor para $F_{1}$.

Podemos, entonces, reescribir el sistema (\ref{9}) como

\begin{align*}
u^{\prime} &= F_{1}(x_{0}, y_{0}) + \left[ \dfrac{\partial F_{1}}{\partial x}(x_{0}, y_{0}) \right]u + \left[ \dfrac{\partial F_{1}}{\partial y}(x_{0}, y_{0}) \right]v + \vartheta_{F_{1}} \\
v^{\prime} &= F_{2}(x_{0}, y_{0}) + \left[ \dfrac{\partial F_{2}}{\partial x}(x_{0}, y_{0}) \right]u + \left[ \dfrac{\partial F_{2}}{\partial y}(x_{0}, y_{0}) \right]v + \vartheta_{F_{2}} \label{11} \tag{11}
\end{align*}

Donde $\vartheta_{F_{1}}$ y $\vartheta_{F_{2}}$ son los términos que forman la diferencia entre el plano tangente y las funciones $F_{1}$ y $F_{2}$, respectivamente, y son precisamente los términos que deseamos ignorar al formar la aproximación lineal del sistema.

Como $Y_{0} = (x_{0}, y_{0})$ es un punto de equilibrio, entonces

$$F_{1}(x_{0}, y_{0}) = 0 \hspace{1cm} y \hspace{1cm} F_{2}(x_{0}, y_{0}) = 0$$

Así, las funciones (\ref{11}) se pueden aproximar como

\begin{align*}
u^{\prime} &\approx \left[ \dfrac{\partial F_{1}}{\partial x}(x_{0}, y_{0}) \right]u + \left[ \dfrac{\partial F_{1}}{\partial y}(x_{0}, y_{0}) \right]v \\
v^{\prime} &\approx \left[ \dfrac{\partial F_{2}}{\partial x}(x_{0}, y_{0}) \right]u + \left[ \dfrac{\partial F_{2}}{\partial y}(x_{0}, y_{0}) \right]v \label{12} \tag{12}
\end{align*}

Si usamos la notación matricial podemos escribir el sistema anterior como

$$\begin{pmatrix}
u^{\prime} \\ v^{\prime}
\end{pmatrix} \approx \begin{pmatrix}
\dfrac{\partial F_{1}}{\partial x}(x_{0}, y_{0}) & \dfrac{\partial F_{1}}{\partial y}(x_{0}, y_{0}) \\ \dfrac{\partial F_{2}}{\partial x}(x_{0}, y_{0})
& \dfrac{\partial F_{2}}{\partial y}(x_{0}, y_{0})
\end{pmatrix} \begin{pmatrix}
u \\ v
\end{pmatrix} \label{13} \tag{13}$$

La matriz de $2 \times 2$ de las derivadas parciales en esta expresión se llama matriz Jacobiana del sistema en $Y_{0} = (x_{0}, y_{0})$.

$$\mathbf{J}(x_{0}, y_{0}) = \begin{pmatrix}
\dfrac{\partial F_{1}}{\partial x}(x_{0}, y_{0}) & \dfrac{\partial F_{1}}{\partial y}(x_{0}, y_{0}) \\ \dfrac{\partial F_{2}}{\partial x}(x_{0}, y_{0})
& \dfrac{\partial F_{2}}{\partial y}(x_{0}, y_{0})
\end{pmatrix} \label{14} \tag{14}$$

Por lo tanto, el sistema linealizado en el punto de equilibrio $Y_{0} = (x_{0},y_{0})$ es

$$\begin{pmatrix}
u^{\prime} \\ v^{\prime}
\end{pmatrix} = \mathbf{J} \begin{pmatrix}
u \\ v
\end{pmatrix} \label{15} \tag{15}$$

Una observación importante de este proceso es que para crear el sistema linealizado sólo es necesario conocer las derivadas parciales de las componentes $F_{1}$ y $F_{2}$ del campo vectorial en el punto de equilibrio $Y_{0}$, no es necesario hacer el cambio de variable moviendo el punto de equilibrio al origen. Más adelante veremos ejemplos para mostrar este hecho.

Clasificación de los puntos de equilibrio

El método de linealización tiene como propósito usar un sistema lineal para predecir el comportamiento de las soluciones de un sistema no lineal cerca de un punto de equilibrio. En una vecindad de dicho punto, las soluciones de los sistemas lineales y no lineales están cercanas entre sí, por lo menos en un intervalo corto. Para la mayor parte de los sistemas, la información ganada al estudiar la linearización es suficiente para determinar el comportamiento a largo plazo de las soluciones del sistema no lineal cerca del punto de equilibrio.

Esta vez no seremos explícitos, pero es posible hacer una clasificación de los puntos de equilibrio en base a los valores propios de la matriz Jacobiana (\ref{14}).

Si todos los valores propios de $\mathbf{J}$ son números reales negativos o números complejos con parte real negativa, entonces $(u, v) = (0, 0)$ es un nodo atractor para el sistema lineal y todas las soluciones se acercan a $(u, v) = (0, 0)$ cuando $t \rightarrow \infty$. Para el sistema no lineal, las soluciones que empiezan cerca del punto de equilibrio $(x, y) = (x_{0}, y_{0})$ se acercan a éste cuando $t \rightarrow \infty$. Por tanto, decimos que $(x_{0}, y_{0})$ es un nodo atractor. Si los valores propios son complejos, entonces $(x_{0}, y_{0})$ es un foco estable.

De modo similar, si $\mathbf{J}$ sólo tiene valores propios positivos o complejos con parte real positiva, entonces las soluciones con condiciones iniciales cerca del punto de equilibrio $(x_{0}, y_{0})$ tienden a alejarse de éste cuando $t$ crece. Decimos entonces que para un sistema no lineal el punto $(x_{0}, y_{0})$ es una nodo repulsor. Si los valores propios son complejos, entonces $(x_{0}, y_{0})$ es un foco inestable.

Si $\mathbf{J}$ tiene un valor propio positivo y uno negativo, entonces el punto de equilibrio $(x_{0}, y_{0})$ es un punto silla.

Es importante mencionar que esta clasificación de los puntos de equilibrio para los sistemas no lineales no nos dice nada acerca del comportamiento de las soluciones con posiciones iniciales lejanas del punto de equilibrio $(x_{0}, y_{0})$.

Para concluir con esta entrada realicemos algunos ejemplos.

Ejemplo: Linealizar el siguiente sistema no lineal.

\begin{align*}
x^{\prime} &= x(2 -x -y) \\
y^{\prime} &= -x + 3y -2xy
\end{align*}

Solución: Comencemos por observar el plano fase de este sistema no lineal.

Plano fase del sistema no lineal.

Nota: Cuando estudiamos las propiedades cualitativas de las trayectorias vimos que es posible esbozar el plano fase de un sistema no lineal si resolvemos la ecuación diferencial

$$\dfrac{dy}{dx} = \dfrac{F_{2}(x, y)}{F_{1}(x, y)} \label{16} \tag{16}$$

pero no siempre obtendremos una ecuación sencilla de resolver. En general, aún no sabemos cómo esbozar el plano fase de un sistema no lineal, lo ideal es que nosotros lo pudiéramos hacer a mano. Por ahora sólo nos estaremos apoyando de un programa que nos permite obtenerlo, más adelante veremos cómo esbozarlo no sólo cerca de los puntos de equilibrio.

Continuemos con el ejemplo. Del plano fase podemos observar que los puntos de equilibrio son

$$Y_{0} = (0, 0), \hspace{1cm} Y_{1} = (1, 1) \hspace{1cm} y \hspace{1cm} Y_{2} = (3, -1)$$

Veamos que es así analíticamente y linealicemos cada uno de ellos.

La función vectorial $F(x, y)$ que define al campo vectorial es

$$F(x, y) = (x(2 -x -y), -x + 3y -2xy)$$

Vemos que las funciones $F_{1}(x, y)$ y $F_{2}(x, y)$ son

\begin{align*}
F_{1}(x, y) &= x(2 -x -y) \\
F_{2}(x, y) &= -x + 3y -2xy
\end{align*}

No es necesario hacer algún tipo de cambio de variable, directamente podemos determinar la matriz Jacobiana para obtener una expresión similar a (\ref{15}). Calculemos las derivadas parciales de $F_{1}(x, y)$ y $F_{2}(x, y)$.

$$\dfrac{\partial F_{1}}{\partial x} = 2 -2x -y, \hspace{1cm} \dfrac{\partial F_{1}}{\partial y} = -x, \hspace{1cm} \dfrac{\partial F_{2}}{\partial x} = -1 -2y, \hspace{1cm} \dfrac{\partial F_{2}}{\partial y} = 3 -2x$$

Por lo tanto, la matriz Jacobiana es

$$\mathbf{J}(x, y) = \begin{pmatrix}
2 -2x -y & -x \\ -1 -2y & 3 -2x
\end{pmatrix}$$

Por otro lado, determinemos los puntos de equilibrio. Buscamos los valores de $x$ y $y$, tal que

$$F_{1}(x, y) = 0 \hspace{1cm} y \hspace{1cm} F_{2}(x, y) = 0$$

es decir,

\begin{align*}
x(2 -x -y) &= 0 \\
-x + 3y -2xy &= 0
\end{align*}

De la primer ecuación obtenemos que $x = 0$ y $2 -x -y = 0$, de este segundo resultado vemos que $x = 2 -y$, sustituyamos ambos valores en la segunda ecuación.

Para $x =0$ obtenemos $3y =0$, de donde $y =0$. Por lo tanto, el origen es un punto de equilibrio.

Para $x =2 -y$, tenemos

$$-(2 -y) + 3y -2(2 -y)y =y^{2} -1 = 0$$

De donde $y_{1} = 1$ y $y_{2} = -1$, sustituyendo ambas raíces en $x = 2 -y$, se tiene

\begin{align*}
x_{1} &= 2 -1 = 1 \\
x_{2} &= 2 -( -1) = 3
\end{align*}

Por lo tanto, los puntos de equilibrio son

$$Y_{0} = (0, 0), \hspace{1cm} Y_{1} = (1, 1) \hspace{1cm} y \hspace{1cm} Y_{2} = (3, -1)$$

tal como lo indica el plano fase.

Linealicemos el sistema, para ello evaluemos cada punto de equilibrio en la matriz Jacobiana.

$$\mathbf{J}(0, 0) = \begin{pmatrix}
2 & 0 \\ -1 & 3
\end{pmatrix}, \hspace{1cm} \mathbf{J}(1, 1) = \begin{pmatrix}
-1 & -1 \\ -3 & 1
\end{pmatrix}, \hspace{1cm} \mathbf{J}(3, -1) = \begin{pmatrix}
-3 & -3 \\ 1 & -3
\end{pmatrix}$$

Por lo tanto, alrededor del punto de equilibrio $Y_{0} = (0, 0)$ el sistema no lineal puede ser descrito por el sistema lineal

$$\mathbf{Y}^{\prime} = \begin{pmatrix}
2 & 0 \\ -1 & 3
\end{pmatrix}\mathbf{Y}$$

Plano fase del sistema linealizado en el punto de equilibrio $Y_{0} = (0, 0)$.

Alrededor del punto de equilibrio $Y_{0} = (1, 1)$ el sistema no lineal puede ser descrito por el sistema lineal

$$\mathbf{Y}^{\prime} = \begin{pmatrix}
-1 & -1 \\ -3 & 1
\end{pmatrix} \mathbf{Y}$$

Plano fase del sistema linealizado en el punto de equilibrio $Y_{0} = (1, 1)$.

Y finalmente el sistema no lineal, alrededor del punto de equilibrio $Y_{0} = (3, -1)$, puede ser descrito por el sistema lineal

$$\mathbf{Y}^{\prime} = \begin{pmatrix}
-3 & -3 \\ 1 & -3
\end{pmatrix} \mathbf{Y}$$

Plano fase del sistema linealizado en el punto de equilibrio $Y_{0} = (3, -1)$.

Por su puesto que se puede aplicar todo lo que sabemos sobre sistemas lineales, podemos determinar los valores propios y los vectores propios para obtener las soluciones generales, podemos también determinar la traza, el determinante, el discriminante y determinar la estabilidad de los puntos de equilibrio, etcétera.

Lo que estamos obteniendo es una descripción local del comportamiento de las soluciones del sistema no lineal alrededor de los puntos de equilibrio.

Una aclaración importante es que los planos fase de los sistemas lineales obtenidos están siendo graficados en el plano $UV$, es por ello que cada uno se encuentra centrado en el origen, en el origen de dicho plano.

$\square$

Finalicemos esta entrada con un ejemplo de especies en competencia.

Un modelo de especies en competencia

El sistema Volterra – Lotka es un conocido sistema para especies en competencia y es de la forma

\begin{align*}
x^{\prime} &= x(-Ax -By + C) \\
y^{\prime} &= y(-Dx -Ey + F) \label{17} \tag{17}
\end{align*}

donde $x$ y $y$ son mayores o igual a cero y los parámetros $A -F$ son siempre positivos.

Consideremos un ejemplo particular del sistema Volterra – Lotka. Sean $x$ y $y$ las poblaciones de dos especies que compiten por recursos, un incremento en cualquier especie tiene un efecto adverso sobre la razón de crecimiento de la otra. El modelo es el siguiente.

\begin{align*}
x^{\prime} &= 2x \left( 1 -\dfrac{x}{2} \right) -xy \\
y^{\prime} &= 3y \left( 1 -\dfrac{y}{3} \right) -2xy
\end{align*}

Para un valor dado de $x$, si $y$ se incrementa entonces el término $-xy$ ocasiona que $x^{\prime}$ decrezca. De forma similar, para un valor dado de $y$, si $x$ crece entonces $-2xy$ provoca que $y^{\prime}$ disminuya. Un aumento en la población de cualquiera de las especies ocasiona una disminución en la razón de crecimiento de la otra.

El plano fase del sistema no lineal es

Plano fase del sistema de especies en competencia.

Nota: El plano fase se ilustra para $x$ y $y$ en $\mathbb{R}$, sin embargo, recordemos que el sistema Volterra – Lotka sólo esta definido en el primer cuadrante en el que $x, y \geq 0$, esto debido a que no existen poblaciones negativas. Se puede observar que los cuatro puntos de equilibrio del sistema si pertenecen al primer cuadrante. Sólo consideraremos esta zona.

La funciones $F_{1}(x, y)$ y $F_{2}(x, y)$ son

\begin{align*}
F_{1}(x, y) &= 2x \left( 1 -\dfrac{x}{2} \right) -xy \\
F_{2}(x, y) &= 3y \left( 1 -\dfrac{y}{3} \right) -2xy
\end{align*}

Calculemos las derivadas parciales.

$$\dfrac{\partial F_{1}}{\partial x} = 2 -2x -y, \hspace{1cm} \dfrac{\partial F_{1}}{\partial y} = -x, \hspace{1cm} \dfrac{\partial F_{2}}{\partial x} = -2y, \hspace{1cm} \dfrac{\partial F_{2}}{\partial y} = 3 -2y -2x$$

Por lo tanto, la matriz Jacobiana es

$$\mathbf{J}(x, y) = \begin{pmatrix}
2 -2x -y & -x \\ -2y & 3 -2y -2x
\end{pmatrix}$$

Determinemos los puntos de equilibrio.

\begin{align*}
x(2 -x -y) &= 0 \\
y(3 -y-2x) &= 0
\end{align*}

La primer ecuación se satisface si $x = 0$ o si $2 -x -y = 0$, y la segunda se cumple si $y = 0$ o si $3 -y -2x = 0$.

Supongamos primero que $x = 0$. Entonces la ecuación $y = 0$ da un punto de equilibrio en el origen y $3 -y -2x = 0$ lo proporciona en $(0, 3)$.

Digamos ahora que $2 -x -y = 0$. Entonces la ecuación $y = 0$ da un punto de equilibrio en $(2, 0)$ y $3 -y -2x = 0$ lo da en $(1, 1)$.

Por lo tanto, los puntos de equilibrio son

$$Y_{0} = (0, 0), \hspace{1cm} Y_{1} = (0, 3), \hspace{1cm} Y_{2} = (2, 0) \hspace{1cm} y \hspace{1cm} Y_{3} = (1, 1)$$

Consideremos el punto de equilibrio $Y_{3} = (1,1)$, el cual nos indica que es posible para las dos especies coexistir en equilibrio (como las flores y las abejas que se ayudan a sobrevivir y prosperar mutuamente).

Linealizamos el sistema alrededor del punto de equilibrio $Y_{3} = (1, 1)$, para ello evaluemos en la matriz Jacobiana.

$$\mathbf{J}(1,1) = \begin{pmatrix}
-1 & -1 \\ -2 & -1
\end{pmatrix}$$

Por lo tanto, el sistema lineal que describe al sistema no lineal alrededor del punto de equilibrio $Y_{3} = (1, 1)$, es

$$\mathbf{Y}^{\prime} = \begin{pmatrix}
-1 & -1 \\ -2 & -1
\end{pmatrix}\mathbf{Y}$$

Los valores propios del sistema son

$$\lambda_{1} = -1 + \sqrt{2} \hspace{1cm} y \hspace{1cm} \lambda_{2} = -1 -\sqrt{2}$$

como uno es positivo y otro negativo concluimos que el punto de equilibrio es un punto silla. El plano fase del sistema lineal es

Plano fase linealizado alrededor del punto de equilibrio $Y_{3} = (1, 1)$.

Sólo hay dos trayectorias que tienden hacia el punto de equilibrio $Y_{3} = (1, 1)$ cuando $t$ crece, de modo que bajo cualquier perturbación en las condiciones iniciales provocará que una especie domine sobre la otra, sin embargo, este modelo de especies es muy simplificado que no esperamos ver soluciones que conduzcan al punto de equilibrio $(1, 1)$ en la naturaleza.

De tarea moral linealiza el sistema para el resto de puntos de equilibrio.

$\square$

Ahora sabemos como estudiar las soluciones de un sistema no lineal alrededor de sus puntos de equilibrio, esto sólo nos dará información local, de manera que no es suficiente si lo que queremos es describir las soluciones para tiempos grandes. En la siguiente entrada veremos una técnica que nos permite describir las soluciones lejos de los puntos de equilibrio.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  1. Considerar los siguientes tres sistemas no lineales:
  • $x^{\prime} = 2x + y$
    $y^{\prime} = -y + x^{2}$
  • $x^{\prime} = 2x + y$
    $y^{\prime} = y + x^{2}$
  • $x^{\prime} = 2x + y$
    $y^{\prime} = -y -x^{2}$

    Los tres sistemas tienen un punto de equilibrio en $(0,0)$. ¿Cuáles dos sistemas tienen planos fase similares cerca de $(0,0)$?. Justificar la respuesta.
  1. Considerar los siguientes tres sistemas no lineales:
  • $x^{\prime} = 3 \sin(x) + y$
    $y^{\prime} = 4x + \cos(y) -1$
  • $x^{\prime} = -3 \sin(x) + y$
    $y^{\prime} = 4x + \cos(y) -1$
  • $x^{\prime} = -3 \sin(x) + y$
    $y^{\prime} = 4x + 3 \cos(y) -3$

    Los tres sistemas tienen un punto de equilibrio en $(0,0)$. ¿Cuáles son los dos sistemas que tienen planos fase similares cerca de $(0,0)$?. Justificar la respuesta.
  1. Dado el siguiente sistema no lineal:

    $x^{\prime} = -2x + y$
    $y^{\prime} = -y + x^{2}$
  • Encontrar el sistema linealizado para el punto de equilibrio $(0, 0)$.
  • Clasificar el punto de equilibrio.
  • Esbozar el plano fase para el sistema no lineal cerca del origen $(0, 0)$.
  • Repetir los puntos anteriores para el punto de equilibrio $(2, 4)$.
  1. Para el modelo de población de especies en competencia

    $x^{\prime} = 2x \left( 1 -\dfrac{x}{2} \right) -xy$
    $y^{\prime} = 3y \left( 1 -\dfrac{y}{3} \right) -2xy$

    mostramos que el punto de equilibrio $(1, 1)$ es un punto silla.
  • Encontrar el sistema linealizado cerca de cada uno de los otros puntos de equilibrio.
  • Clasificar cada punto de equilibrio.
  • Esbozar el plano fase de cada sistema linealizado.
  • Dar una breve descripción del plano fase cerca de cada punto de equilibrio del sistema no lineal.
  1. Considerar el siguiente sistema no lineal:

    $x^{\prime} = y -(x^{2} + y^{2})x$
    $y^{\prime} = -x-(x^{2} + y^{2})y$
  • Visualizar el plano fase del sistema.
  • Determinar los puntos de equilibrio.
  • Linealizar el sistema con respecto al punto de equilibrio $(0, 0)$.
  • Visualizar el plano fase del sistema linealizado.

    ¿Los planos fase de ambos sistemas alrededor del punto de equilibrio $(0, 0)$ son similares?.
    ¿Qué puede estar sucediendo?.

Más adelante…

Una propiedad interesante del campo vectorial

$$F(x, y) = (F_{1}(x, y), F_{2}(x, y))$$

es que en un punto el vector $F$ puede ser totalmente vertical si la componente $F_{1}$ es cero, o bien puede ser totalmente horizontal se la componente $F_{2}$ es cero. Esta propiedad resultará sumamente útil a la hora de estudiar las trayectorias de un sistema no lineal lejos de un punto de equilibrio.

Al conjunto de puntos en los que alguna de las componentes de la función vectorial $F$ es cero se les denomina nulclinas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»