Archivo de la etiqueta: unicidad

Álgebra Lineal II: Unicidad de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan y demostramos la existencia de dicha forma bajo ciertas hipótesis. Como corolario, quedó pensar cuál es la versión para matrices. En esta entrada enunciamos la versión para matrices (totalmente equivalente a la de transformaciones lineales) y nos enfocamos en mostrar la unicidad de la forma canónica de Jordan.

Unicidad de la forma canónica de Jordan

El siguiente teorema es totalmente análogo al enunciado en la entrada anterior. Recuerda que $\leq$ es un orden total fijo de $F$ (en $\mathbb{R}$, es el orden usual).

Teorema. Sea $A$ una matriz $M_n(F)$ cuyo polinomio característico $\chi_A(X)$ se divide en $F$. Entonces, existen únicos valores $\lambda_1\leq \ldots \leq \lambda_n$ en $F$ y únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} para los cuales $A$ es similar a la siguiente matriz de bloques de Jordan:

$$\begin{pmatrix} J_{\lambda_1,k_1} & 0 & \cdots & 0 \\ 0 & J_{\lambda_2,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{\lambda_d,k_d}\end{pmatrix}.$$

Usaremos esta versión para demostrar la unicidad, lo cual también implicará la unicidad para la versión de transformaciones lineales.

Mediante la demostración de existencia de la entrada anterior, llegamos a que si el polinomio característico de $A$ es

$$\chi_A(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r},$$

entonces $A$ es similar a una matriz conformada por matrices de bloques de Jordan $J_1,J_2,\ldots,J_r$, en donde cada $J_i$ es de tamaño $m_i$ y de bloques de Jordan de eigenvalor $\lambda_i$.

Si $A$ fuera similar a otra matriz $K$ de bloques de Jordan, podríamos agrupar por eigenvalores de los bloques $\kappa_1< \ldots < \kappa_s$ en matrices de bloques de Jordan tamaños $o_1,\ldots,o_s$, digamos $K_1,\ldots,K_s$. El polinomio característico de $K$ sería entonces

$$\chi_{K}(X)=(X-\kappa_1)^{o_1}(X-\kappa_2)^{o_2}\cdots(X-\kappa_s)^{o_s}.$$

Pero $K$ es similar a $A$, y entonces deben tener el mismo polinomio característico, así que conciden en raíces y multiplicidad. Esto demuestra que $r=s$ y como los $\lambda_i$ y los $\kappa_i$ están ordenados, también demuestra las igualdades $\lambda_i=\kappa_i$ y $m_i=o_i$ para todo $i\in\{1,\ldots,r\}.$

Sólo nos queda argumentar la igualdad entre cada $J_i$ y $K_i$ para $i\in\{1,\ldots,r\}$. Pero ambas una forma canónica de Jordan para la transformación nilpotente que se obtiene de restringir $T_{A-\lambda_i I}$ a $\ker(T_{A-\lambda_i I}^{m_i})$. Por la unicidad que demostramos para la forma canónica de Jordan para transformaciones nilpotentes, concluimos que $J_i=K_i$. Esto termina la demostración de la unicidad de la forma canónica de Jordan.

$\square$

Una receta para encontrar la forma canónica de Jordan

Ya con el teorema demostrado, ¿cómo juntamos todas las ideas para encontrar la forma canónica de Jordan de una matriz $A$ en $M_n(F)$ cuyo polinomio característico se divida en $F$? Podemos proceder como sigue.

Encontramos el polinomio característico $\chi_A(X)$ y su factorización, digamos $$\chi_A(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r}.$$
Nos enfocamos en encontrar las matrices de bloque de Jordan $J_i$ para cada eigenvalor $\lambda_i$. Sabemos que la matriz $J_i$ será de tamaño $m_i$.
Para saber exactamente cuál matriz de bloques de Jordan es $J_i$, pensaremos en que tiene $b_1,b_2,\ldots,b_{m_i}$ bloques de Jordan de eigenvalor $\lambda_i$ de tamaños $1,2, \ldots,m_i$. Consideramos la matriz $A_i=A-\lambda_i I$. Los $b_1,\ldots,b_{m_i}$ son la solución al siguiente sistema de ecuaciones en las variables $x_1,\ldots,x_{m_i}$.
\begin{align*}
m_i&= 1\cdot x_1 + 2\cdot x_2 + 3 \cdot x_3 + \ldots + m_i \cdot x_{m_i}\\
m_i-n+\text{rango}(A_i-\lambda_i I)&=0\cdot x_1 + 1\cdot x_2 + 2 \cdot x_3 + \ldots + (m_i-1) \cdot x_{m_i}\\
m_i-n+\text{rango}({A_i-\lambda_i I}^2)&= 0 \cdot x_1 + 0 \cdot x_2 + 1 \cdot x_3 + \ldots + (m_i-2)\cdot x_{m_i}\\
m_i-n+\text{rango}({A_i-\lambda_i I}^3)&= 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + (m_i-3)\cdot x_{m_i}\\
&\vdots\\
m_i-n+\text{rango}({A_i-\lambda_i I}^{m_i-1})&= 0\cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + 1 \cdot x_{m_i}.
\end{align*}
Juntamos todos los $J_i$ en una misma matriz y los ordenamos apropiadamente.

El paso número $3$ está motivado por lo que sabemos de las matrices nilpotentes, y es bueno que pienses por qué se estudia específicamente ese sistema de ecuaciones para cada eigenvalor $\lambda_i$ y multiplicidad $m_i$.

Ejemplo de obtener la forma canónica de Jordan

Veamos un ejemplo del procedimiento descrito en la sección anterior.

Ejemplo. Encontraremos la forma canónica de Jordan de la siguiente matriz: $$A=\begin{pmatrix}-226 & -10 & -246 & 39 & 246\\234 & 23 & 236 & -46 & -236\\-198 & -20 & -192 & 41 & 195\\-93 & 10 & -122 & 10 & 122\\-385 & -30 & -393 & 74 & 396\end{pmatrix}.$$

Con herramientas computacionales, podemos darnos cuenta de que el polinomio característico de esta matriz es $$\chi_A(X)=X^{5} – 11 X^{4} + 46 X^{3} – 90 X^{2} + 81 X- 27.$$

Este polinomio se puede factorizar como $$(X-1)^2(X-3)^3.$$ Así, la submatriz de bloques de Jordan $J_1$ de eigenvalor $1$ tendrá tamaño $2$ y la $J_3$ de eigenvalor $3$ tendrá tamaño $3$. Pero, ¿de qué tamaño son cada uno de los bloques de Jordan en cada una de estas matrices?

Para respondernos esto para $J_1$, notamos que sus bloques son de tamaño $1$ y $2$ solamente. Si hay $b_1$ bloques de tamaño $1$ y $b_2$ bloques de tamaño $2$, por la teoría desarrollada arriba tendremos:

\begin{align*}
b_1+2b_2&=2\\
b_2&=2-5+\text{rango}(A-I)=2-5+4=1.
\end{align*}

El rango de $A-I$ lo obtuvimos computacionalmente, pero recuerda que también puede ser obtenido con reducción gaussiana. Resolviendo el sistema, $b_2=1$ y entonces $b_1=0$. Concluimos que en $J_1$ hay un bloque de Jordan de tamaño $2$.

Para $J_3$, reciclemos las variables $b_i$ (para no introducir nuevas). Los bloques pueden ser de tamaño $1,2,3$. Supongamos que de estos tamaños respectivamente hay $b_1,b_2,b_3$ bloques. Los $b_i$ cumplen:

\begin{align*}
b_1+2b_2+3b_3&=3\\
b_2+2b_3&=3-5+\text{rango}(A-3I)=3-5+3=1\\
b_3&=3-5+\text{rango}((A-3I)^2)=3-5+2=0.
\end{align*}

Así, $b_3=0$, y en consecuencia $b_2=1$ y entonces $b_1=1$. Concluimos que $J_3$ tiene un bloque de tamaño $1$ y uno de tamaño $3$. Por lo tanto, la forma canónica de Jordan de $A$ es:

$$\begin{pmatrix} J_1 & 0 \\ 0 & J_3 \end{pmatrix} = \begin{pmatrix} J_{1,2} & 0 & 0 \\ 0 & J_{3,1} & 0 \\ 0 & 0 & J_{3,2} \end{pmatrix} = \begin{pmatrix}1 & 1 & 0 & 0 & 0\\0 & 1 & 0 & 0 & 0\\0 & 0 & 3 & 0 & 0\\0 & 0 & 0 & 3 & 1\\0 & 0 & 0 & 0 & 3\end{pmatrix}$$

$\triangle$

Otro problema sobre forma canónica de Jordan

La receta anterior funciona en general y da la forma canónica de Jordan. Esto es algo que probablemente en la práctica en aplicaciones no tendrás que hacer manualmente nunca, pues hay herramientas computacionales que te pueden ayudar. Sin embargo, es importante entender con profundidad el teorema y la receta de manera teórica, pues hay problemas conceptuales en los que no podrás usar herramientas computacionales. A continuación veremos un ejemplo.

Problema. Sea $A$ una matriz en $M_6(\mathbb{R})$ con polinomio característico $$\chi_A(X)=X^6-2X^4+X^2.$$

¿Cuántas posibilidades hay para la forma canónica de Jordan de $A$?
Demuestra que si el rango de $A$ es $5$, entonces $A$ no es diagonalizable.

Solución. Podemos factorizar el polinomio característico de $A$ como sigue:

$$\chi_A(X)=X^2(X+1)^2(X-1)^2.$$

Así, la forma canónica de Jordan está conformada por una matriz de bloques de Jordan $J_0$ de eigenvalor $0$ y tamaño $2$; una $J_1$ de eigenvalor $1$ y tamaño $2$; y una $J_{-1}$ de eigenvalor $-1$ y tamaño $2$.

Cada $J_i$ tiene dos chances: o es un bloque de Jordan de tamaño $2$, o son dos bloques de Jordan de tamaño $1$. Así, en total tenemos $2\cdot 2 \cdot 2=8$ posibilidades.

Si $A$ es de rango $5$, entonces tendríamos en las cuentas de cantidad de bloques $b_1$ y $b_2$ para eigenvalor $0$ que

\begin{align*}
b_1+2b_2&=2\\
b_2&=2-6+\text{rango}(A)=2-6+5=1,
\end{align*}

de donde en $J_0$ tendría $1$ bloque de tamaño $2$ y ninguno de tamaño $1$. Si $A$ fuera diagonalizable, su diagonalización sería una forma canónica de Jordan donde para eigenvalor $0$ se tendrían $2$ bloques de tamaño $1$ y ninguno de tamaño $2$. Así, $A$ tendría dos formas canónicas de Jordan distintas, lo cual es imposible.

$\square$

Más adelante…

Con esta entrada terminamos de demostrar el teorema de la forma canónica de Jordan, uno de los teoremas más bonitos de álgebra lineal. ¿Te das cuenta de todo lo que utilizamos en su demostración? Forma matricial de transformaciones lineales, el teorema de Cayley-Hamilton, polinomio característico, subespacios estables, teoría de dualidad, sistemas de ecuaciones lineales, resultados auxiliares de polinomios, etc. Es un resultado verdaderamente integrador.

En la siguiente entrada, la última del curso, hablaremos de algunas de las consecuencias del teorema de la forma canónica de Jordan. Discutiremos cómo lo podemos utilizar para clasificar a las matrices por similaridad. Veremos una aplicación con respecto a una matriz y su transpuesta. También, esbozaremos un poco de por qué en cierto sentido el resultado no sólo vale para las matrices cuyo polinomio se divide sobre el campo, sino que para cualquier matriz. Con ello terminaremos el curso.

Tarea moral

Calcula la forma canónica de Jordan $J$ de la matriz $$A=\begin{pmatrix} 1 & 0 & -3 \\ 1 & -1 & -6 \\ -1 & 2 & 5 \end{pmatrix}.$$ Además de encontrar $J$, encuentra de manera explícita una matriz invertible $P$ tal que $A=P^{-1}JP$.
Calcula la forma canónica de Jordan de la matriz $$\begin{pmatrix} 1 & 1 & 0 & 0 \\ 0 & 1 & 2 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 2 \end{pmatrix}$$
Explica y demuestra cómo obtener lo siguiente para una matriz de bloques de Jordan:
- Su polinomio característico.
- Su polinomio mínimo.
- Su determinante.
- Su traza.
- Sus eigenespacios.
Justifica con más detalle por qué la receta que se propone para calcular la forma canónica de Jordan en efecto funciona. Necesitarás varios de los argumentos que dimos en la entrada anterior.
Demuestra que una matriz $A\in M_n(F)$ para la cual su polinomio característico se divide en $F$ es diagonalizable si y sólo si cada bloque de cada matriz de bloques de la forma canónica de Jordan tiene tamaño $1$.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Existencia de la forma canónica de Jordan
Siguiente entrada del curso: Aplicaciones de la forma canónica de Jordan

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Unicidad de la forma de Jordan para nilpotentes

Por Leonardo Ignacio Martínez Sandoval

Deja un comentario

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan para matrices nilpotentes. Demostramos una parte: la existencia de la forma canónica de Jordan. Para ello, nos enfocamos en el teorema en su versión en términos de transformaciones lineales. En esta entrada nos enfocaremos en demostrar la unicidad de la forma canónica de Jordan. Curiosamente, en este caso será un poco más cómodo trabajar con la forma matricial del teorema. Para recordar lo que queremos probar, volvemos a poner el enunciado del teorema a continuación. Lo que buscamos es ver que los enteros $k_1,\ldots, k_d$ que menciona el teorema son únicos.

Teorema. Sea $A$ una matriz nilpotente en $M_n(F)$. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales $A$ es similar a la siguiente matriz de bloques: $$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

Nuestra estrategia para mostrar la unicidad será el estudio del rango de las potencias de $A$. Si $A$ es similar una matriz en forma canónica $J$, entonces existe $P$ invertible tal que $A=P^{-1}JP$, de donde se puede mostrar indutivamente que $A^k=P^{-1}J^kP$, mostrando que $A^k$ y $J^k$ son similares. Además, sabemos por teoría anterior que matrices similares tienen el mismo rango. De modo que si $A$ es similar a $J$ entonces todas las potencias de $A$ tienen el mismo rango que todas las potencias de $J$. Con esta idea en mente estudiaremos cómo es el rango de matrices de bloques de Jordan de eigenvalor cero.

Rango de potencias de bloques de Jordan

Claramente el rango del bloque de Jordan $J_{0,n}$ es $n-1$, pues ya está en forma escalonada reducida y tiene $n-1$ vectores distintos de cero. El siguiente resultado generaliza esta observación.

Proposición. Sea $n$ un entero positivo, $F$ un campo y $J_{0,n}$ el bloque de Jordan de eigenvalor $0$ y tamaño $n$ en $M_n(F)$. Para $k=1,\ldots,n$ se tiene que el rango de $J_{0,n}^k$ es igual a $n-k$. Para valores de $k$ más grandes, el rango es igual a cero.

Demostración. Si $e_1,\ldots,e_n$ es la base canónica de $F^n$, tenemos que $J_{0,n}e_i=e_{i-1}$ para $i=2,\ldots,n$ y $J_{0,n}e_1=0$. De manera intuitiva, la multiplicación matricial por $J_{0,n}$ va «desplazando los elementos de la base $e_1,\ldots,e_n$ a la izquierda, hasta sacarlos». De este modo, $J_{0,n}^k$ para $k=1,\ldots,n$ hace lo siguiente:

$$J_{0,n}^k e_i=\begin{cases} 0 & \text{para $k\geq i$}\\ e_{i-k} & \text{para $k\leq i-1$.}\end{cases}$$

Así, $J_{0,n}^k$ manda a la base $e_1,\ldots,e_n$ a los vectores $e_1,\ldots,e_{n-k}$ y a $k$ copias del vector cero. Como los primeros son $n-k$ vectores linealmente independientes, obtenemos que el rango de $J_{0,n}^k$ es $n-k$.

Para valores de $k$ más grandes la potencia se hace la matriz cero, así que su rango es cero.

$\square$

Rango de potencias de matrices de bloques de Jordan

¿Qué sucede si ahora estudiamos el rango de las potencias de una matriz de bloques de Jordan? Consideremos, por ejemplo, la siguiente matriz, en donde $k_1,\ldots,k_d$ son enteros positivos de suma $n$ y con $k_1\leq \ldots \leq k_d$:

$$J=\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

Por un lado, es sencillo elevar esta matriz a potencias, pues simplemente los bloques se elevan a las potencias correspondientes. En símbolos:

$$J^r=\begin{pmatrix} J_{0,k_1}^r& 0 & \cdots & 0 \\ 0 & J_{0,k_2}^r& \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}^r\end{pmatrix}.$$

¿Cuál es el rango de esta potencia? Nos conviene cambiar un poco de notación. En vez de considerar a los $k_i$ por separado, los agruparemos de acuerdo a su valor, que puede ir de $1$ a $n$. Así, para cada $j=1,\ldots,n$ definimos $m_j$ como la cantidad de valores $k_i$ iguales a $j$. Bajo esta notación, la igualdad $k_1+\ldots+k_d=n$ se puede reescribir como $$m_1+2m_2+3m_3+\ldots+nm_n=n.$$

Una primera observación es que el rango de $J$ es simplemente la suma de los rangos de cada una de las $J_{0,k_i}$. Cada una de éstas contribuye con rango $k_i-1$. Así, en términos de las $m_j$ tenemos lo siguiente:

\begin{align*}
\text{rango}(J)&=\sum_{i=1}^d (k_i-1)\\
&=\sum_{j=1}^n (j-1) m_j \\
&=0\cdot m_1 + 1\cdot m_2 + 2 \cdot m_3 + \ldots + (n-1) \cdot m_n.
\end{align*}

De manera similar,

\begin{align*}
\text{rango}(J^r)&=\sum_{i=1}^d \text{rango}(J_{0,k_i}^r)\\
&=\sum_{j=1}^n m_j \text{rango}(J_{0,j}^r).
\end{align*}

El término $\text{rango}(J_{0,j}^r)$ lo podemos calcular con la proposición de la sección anterior, cuidando la restricción entre el tamaño y las potencias que queremos. De aquí y de la restricción original para la las $m_j$ salen todas las siguientes igualdades:

\begin{align*}
n&= 1\cdot m_1 + 2\cdot m_2 + 3 \cdot m_3 + \ldots + n \cdot m_n\\
\text{rango}(J)&=0\cdot m_1 + 1\cdot m_2 + 2 \cdot m_3 + \ldots + (n-1) \cdot m_n\\
\text{rango}(J^2)&= 0 \cdot m_1 + 0 \cdot m_2 + 1 \cdot m_3 + \ldots + (n-2)\cdot m_n\\
\text{rango}(J^3)&= 0 \cdot m_1 + 0 \cdot m_2 + 0 \cdot m_3 + \ldots + (n-3)\cdot m_n\\
&\vdots\\
\text{rango}(J^{n-1})&= 0\cdot m_1 + 0 \cdot m_2 + 0 \cdot m_3 + \ldots + 1 \cdot m_n.
\end{align*}

A partir de aquí el rango de $J^n$ es $0$. Esto nos da una manera de entender con mucha precisión el rango de cualquier potencia de una matriz diagonal por bloques hecha con bloques de Jordan.

Unicidad de la forma canónica de Jordan

Estamos listos para justificar la unicidad de la forma canónica de Jordan. Una matriz diagonal por bloques hecha por bloques de Jordan queda totalmente determinada por los valores de $m_j$ de la sección anterior. Supongamos que $A$ tiene como forma canónica de Jordan tanto a una matriz $J$ con valores $m_j$, como a otra matriz $J’$ con valores $m_j’$.

Como dos matrices similares cumplen que sus potencias son todas del mismo rango, entonces para cualquier $r$ de $1$ a $n-1$ se cumple que $$\text{rango}(J^r)=\text{rango}(A^r)=\text{rango}(J’^r).$$ Así, tanto $(m_1,\ldots,m_n)$ como $({m_1}’,\ldots,{m_n}’)$ son soluciones al siguiente sistema de ecuaciones en variables $x_1,\ldots,x_n$.

\begin{align*}
n&= 1\cdot x_1 + 2\cdot x_2 + 3 \cdot x_3 + \ldots + n \cdot x_n\\
\text{rango}(A)&=0\cdot x_1 + 1\cdot x_2 + 2 \cdot x_3 + \ldots + (n-1) \cdot x_n\\
\text{rango}(A^2)&= 0 \cdot x_1 + 0 \cdot x_2 + 1 \cdot x_3 + \ldots + (n-2)\cdot x_n\\
\text{rango}(A^3)&= 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + (n-3)\cdot x_n\\
&\vdots\\
\text{rango}(A^{n-1})&= 0\cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + 1 \cdot x_n.
\end{align*}

Pero este es un sistema de $n$ ecuaciones en $n$ variables y con matriz asociada de determinante $1$, así que su solución es única. Esto muestra que $(m_1,\ldots,m_n)=({m_1}’,\ldots,{m_n}’)$. Entonces, en $J$ y $J’$ aparecen la misma cantidad de bloques de cada tamaño. Como además los bloques van de tamaño menor a mayor tanto en $J$ como en $J’$, concluimos que $J=J’$.

Como consecuencia de toda esta discusión, obtenemos de hecho lo siguiente.

Corolario. Dos matrices nilpotentes son semejantes si y sólo si tienen la misma forma canónica de Jordan. Distintas formas canónicas de Jordan dan distintas clases de semejanza.

Una receta para encontrar la forma canónica de Jordan de nilpotentes

La demostración anterior no sólo demuestra la unicidad de la forma canónica de Jordan. Además, nos dice exactamente cómo obtenerla. Para ello:

Calculamos todas las potencias de $A$ hasta $n-1$.
Usando reducción gaussiana (o de otro modo), calculamos el rango de cada una de estas potencias.
Resolvemos el sistema de ecuaciones en variables $x_j$ de la sección anterior.
La forma canónica de Jordan de $A$ tiene $x_j$ bloques de tamaño $j$, que debemos colocar en orden creciente de tamaño.

Ejemplo. Consideremos la siguiente matriz en $M_7(\mathbb{R})$: $$C=\begin{pmatrix}-27 & 266 & 1 & -37 & 135 & -125 & 53\\217 & -1563 & 118 & 33 & -1251 & 1020 & 361\\236 & -1784 & 188 & 16 & -1512 & 1234 & 585\\11 & -10 & -25 & 12 & 28 & -29 & -80\\-159 & 1133 & -114 & -98 & 878 & -690 & -232\\197 & -1409 & 88 & -19 & -1151 & 952 & 348\\-230 & 1605 & -179 & -100 & 1316 & -1031 & -440\end{pmatrix}$$

Sus números son muy complicados, sin embargo, nos podemos auxiliar de herramientas computacionales para encontrar sus potencias. Soprendentemente esta es una matriz nilpotente de índice $3$ pues:

$$C^2=\begin{pmatrix}0 & -10209 & -3403 & -6806 & -6806 & 10209 & 0\\0 & 14691 & 4897 & 9794 & 9794 & -14691 & 0\\0 & 2739 & 913 & 1826 & 1826 & -2739 & 0\\0 & 7221 & 2407 & 4814 & 4814 & -7221 & 0\\0 & -14193 & -4731 & -9462 & -9462 & 14193 & 0\\0 & 10956 & 3652 & 7304 & 7304 & -10956 & 0\\0 & -11952 & -3984 & -7968 & -7968 & 11952 & 0\end{pmatrix}$$

$$C^3=\begin{pmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\end{pmatrix}.$$

Usando reducción gaussiana, o herramientas computacionales, obtenemos que el rango de $C$ es $4$ y que el rango de $C^2$ es $2$. A partir de $k\geq 3$ obtenemos que $\text{rango}(C^k)=\text{rango}(O_7)=0$. Si queremos encontrar la forma canónica de Jordan de $C$, necesitamos entonces resolver el siguiente sistema de ecuaciones, que nos dirá cuántos bloques $x_j$ de tamaño $j$ hay:

\begin{align*}
7&= x_1+2x_2+3x_3+4x_4+5x_5+6x_6+7x_7\\
4&=x_2 + 2x_3 + 3x_4+4x_5+5x_6+6x_7\\
2&= x_3 + 2x_4+3x_5+4x_6+5x_7 \\
0&= x_4+2x_5+3x_6+4x_7\\
0 &= x_5+2x_6+3x_7\\
0&= x_6+2x_7\\
0&= x_7
\end{align*}

Para resolverlo lo mejor es proceder «de abajo hacia arriba». Las últimas cuatro ecuaciones nos dicen que $x_7=x_6=x_5=x_4=0$. Así, el sistema queda un poco más simple, como:

\begin{align*}
7&= x_1+2x_2+3x_3\\
4&=x_2 + 2x_3\\
2&= x_3.
\end{align*}

De la última igualdad, tenemos $x_3=2$, lo que nos dice que la forma canónica de Jordan tendría dos bloques de tamaño $3$. Sustituyendo en la penúltima igualdad obtenemos que $4=x_2+4$, de donde $x_2=0$. Así, no tendremos ningún bloque de tamaño $2$. Finalmente, sustituyendo ambos valores en la primera igualdad obtenemos que $7=x_1+0+6$. De aquí obtenemos $x_1=1$, así que la forma canónica de Jordan tendrá un bloque de tamaño $1$. En resumen, la forma canónica de Jordan es la matriz $$\begin{pmatrix} J_{0,1} & 0 & 0 \\ 0 & J_{0,3} & 0 \\ 0 & 0 & J_{0,3}\end{pmatrix}.$$ Explícitamente, ésta es la siguiente matriz:

$$\begin{pmatrix} 0& 0 & 0 & 0 & 0 & 0 & 0 \\ 0& 0 & 1 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 1 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 1 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 1 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix}.$$

Para verla un poco más «como de bloques» la podemos reescribir de la siguiente manera:

$$\left(\begin{array}{c|ccc|ccc} 0& 0 & 0 & 0 & 0 & 0 & 0 \\ \hline 0& 0 & 1 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 1 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \\ \hline 0& 0 & 0 & 0 & 0 & 1 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 1 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \end{array}\right).$$

$\triangle$

Más adelante…

Hemos demostrado la existencia y unicidad de la forma canónica de Jordan para matrices nilpotentes. Este es un resultado interesante por sí mismo. Sin embargo, también es un paso intermedio para un resultado más general. En las siguientes entradas hablaremos de una versión más general del teorema de Jordan, para matrices tales que su polinomio característico se descomponga totalmente en el campo en el que estemos trabajando.

Tarea moral

Considera la siguiente matriz: $$M=\begin{pmatrix}11 & 11 & -11 & -11\\-1 & -1 & 1 & 1\\3 & 3 & -3 & -3\\7 & 7 & -7 & -7\end{pmatrix}.$$
1. Muestra que $M$ es una matriz nilpotente y determina su índice.
2. ¿Cuál es la forma canónica de Jordan de $M$?
Describe las posibles formas canónicas de Jordan para una matriz nilpotente $A \in M_{5}(F)$ de índice $2$.
Describe las posibles formas canónicas de Jordan para una matriz nilpotente $A \in M_{7}(F)$ de rango $5$.
Encuentra de manera explícita la inversa de la siguiente matriz en $M_n(\mathbb{R})$ y usa esto para dar de manera explícita la solución al sistema de ecuación en las variables $x_i$ que aparece en la entrada: $$\begin{pmatrix} 1 & 2 & 3 & \cdots & n-1 & n \\ 0 & 1 & 2 & \cdots & n-2 & n-1 \\ 0 & 0 & 1 & \cdots & n-3 & n-2 \\ & \vdots & & \ddots & & \vdots\\ 0 & 0 & 0 & \cdots & 1 & 2 \\ 0 & 0 & 0 & \cdots & 0 & 1\end{pmatrix}.$$
Sea $A$ una matriz nilpotente en $M_n(\mathbb{R})$. Muestra que las matrices $A$ y $5A$ son similares entre sí.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Existencia de la forma canónica de Jordan para nilpotentes
Siguiente entrada del curso: Existencia de la forma canónica de Jordan

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Existencia de la forma canónica de Jordan para nilpotentes

Por Elizabeth Chalnique Ríos Alvarado

Deja un comentario

Introducción

En la entrada anterior estudiamos de manera un poco más sistemática las matrices y transformaciones lineales nilpotentes. Lo que haremos ahora es enunciar el teorema de la forma canónica de Jordan para matrices nilpotentes. Este es un teorema de existencia y unicidad. En esta entrada demostraremos la parte de la existencia. En la siguiente entrada hablaremos de la unicidad y de cómo encontrar la forma canónica de Jordan de matrices nilpotentes de manera práctica.

El teorema de Jordan para nilpotentes

El teorema que queremos demostrar tiene dos versiones: la de transformaciones y la matricial. La versión en transformaciones dice lo siguiente.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ y $T:V\to V$ una transformación lineal nilpotente. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques:

$$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

La versión en forma matricial dice lo siguiente.

A esta matriz de bloques (ya sea para una transformación, o para una matriz) le llamamos la forma canónica de Jordan de $A$.

En vista de que dos matrices son similares si y sólo si representan a la misma transformación lineal en distintas bases, entonces ambos teoremas son totalmente equivalentes. Así, basta enfocarnos en demostrar una de las versiones. Haremos esto con la versión para transformaciones lineales.

Trasnformaciones nilpotentes y unos vectores linealmente independientes

En esta sección enunciaremos un primer resultado auxiliar para demostrar la existencia de la forma canónica de Jordan. Veremos que a partir de una transformación lineal nilpotente podemos obtener algunos vectores linealmente independientes.

Proposición. Sea $V$ un espacio vectorial de dimensión finita y $T:V\to V$ una transformación lineal de índice $k$. Sea $v$ un vector tal que $T^{k-1}(v)\neq 0$, el cual existe ya que $T^{k-1}$ no es la transformación lineal cero. Entonces:

Los vectores $v$, $T(v)$, $\ldots$, $T^{k-1}(v)$ son linealmente independientes.
El subespacio $W$ que generan es de dimensión $k$ y es estable bajo $T$.
La transformación $T$ restringida a $W$ en la base $T^{k-1}(v)$, $T^{k-2}(v)$, $\ldots$, $T(v)$, $v$ tiene como matriz al bloque de Jordan $J_{0,k}$. Ojo. Aquí los vectores los escribimos en orden contrario, empezando con la mayor potencia de $T$ aplicada.

Demostración. Probemos las afirmaciones una por una. Para empezar, supongamos que para ciertos escalares $\alpha_0,\ldots,\alpha_{k-1}$ tenemos que $$\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v)=0.$$

Vamos a probar inductivamente de $0$ a $k-1$ que $\alpha_k=0$. Para mostrar que $\alpha_0=0$, aplicamos $T^{k-1}$ a la combinación lineal anterior para obtener:

\begin{align*}
0&=\alpha_0T^{k-1}(v)+\alpha_1T^k(v)+\ldots+\alpha_{k-1}T^{2k-2}(v)\\
&=\alpha_0T^{k-1}(v).
\end{align*}

Aquí estamos usando en todos los sumandos, excepto el primero, que $T^k=0$. Como $T^{k-1}(v)\neq 0$, concluimos que $\alpha_0=0$. Suponiendo que ya hemos mostrado $\alpha_0=\ldots=\alpha_l=0$, la combinación lineal con la que empezamos queda como $$\alpha_{l+1}T^{l+1}(v)+\alpha_{l+2}T^{l+2}(v)+\ldots+\alpha_{k-1}T^{k-1}(v)=0.$$ Aplicando $T^{k-l-2}$ y usando un argumento similar al anterior se llega a que $\alpha_{l+1}=0$. Esto muestra que la única combinación lineal de los vectores que da cero es la combinación lineal trivial, así que son linealmente independientes.

De manera inmediata obtenemos entonces que esos $k$ vectores generan un subespacio $W$ de dimensión $k$. Para ver que $W$ es $T$ estable, tomemos un elemento $w$ en $W$, es decir $$w=\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v)$$ para algunos escalares $\alpha_0,\ldots,\alpha_{k-1}$. Debemos ver que $T(w)$ está nuevamente en $W$. Haciendo las cuentas y usando nuevamente que $T^k=0$ obtenemos:

\begin{align*}
T(w)&=T(\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v))\\
&= \alpha_0T(v)+\alpha_1T^2(v)+\ldots+\alpha_{k-2}T^{k-1}(v)+\alpha_{k-1}T(v)\\
&= \alpha_0T(v)+\alpha_1T^2(v)+\ldots+\alpha_{k-2}T^{k-1}(v)\\
\end{align*}

Este vector de nuevo es combinación lineal de los vectores que nos interesan, así que $T(w)$ está en $W$, como queríamos.

La afirmación de la forma matricial es inmediata pues precisamente

$$T(T^{j}(v))=0\cdot T^{n-1}(V)+\ldots+1\cdot T^{j+1}(v)+\ldots+0\cdot T(v) + 0\cdot v,$$ de donde se lee que las columnas de dicha forma matricial justo son las del bloque de Jordan $J_{0,k}$.

$\square$

El teorema anterior da otra demostración de algo que ya habíamos mostrado en la entada anterior: el índice de una matriz en $M_n(F)$ (o de una transformación nilpotente en un espacio vectorial de dimensión $n$) no puede exceder $n$.

Encontrar un subespacio complementario y estable

Ahora veremos otro resultado auxiliar que necesitaremos para demostrar la existencia de la forma canónica de Jordan. A partir de él podemos conseguirnos un «subespacio complementario y estable» que en la prueba de la existencia nos ayudará a proceder inductivamente. Este truco ya lo hemos visto antes en la clasificación de matrices ortogonales y el la demostración del teorema espectral.

Proposición. Sea $V$ un espacio vectorial de dimensión finita $n$ y $T:V\to V$ una transformación lineal nilpotente de índice $k$. Tomemos $v$ un vector tal que $T^{k-1}(v)\neq 0$. Sea $W$ el subespacio generado por $v,T(v),\ldots,T^{k-1}(v)$. Entonces, existe un subespacio $W’$ estable bajo $T$ y tal que $T=W\oplus W’$.

La principal dificultad para probar esta proposición es una cuestión creativa: debemos saber de dónde sacar el espacio $W’$. Para ello, haremos uso de la transformación transpuesta y de un espacio ortogonal por dualidad. Como recordatorio, si $T:V\to V$ es una transformación lineal, entonces su transformación transpuesta es una transformación lineal $^tT:V^\ast \to V^\ast$ para la cual $^tT(\ell)(u)=\ell(T(u))$ para cualquier forma lineal $\ell$ y cualquier vector $u$ en $V$.

Demostración. Primero, nos enfocamos en construir $W’$. Para ello procedemos como sigue. Como $T^{k-1}(v)\neq 0$, entonces existe una forma lineal $\ell$ tal que $\ell(T^{k-1}(v))\neq 0$. Se puede mostrar que $S:=\text{ }^t T$ también es nilpotente de índice $k$. Por la proposición de la sección anterior, tenemos entonces que $\ell, S(\ell),\ldots,S^{k-1}(\ell)$ son $k$ vectores linealmente independientes en $V^\ast$ y por lo tanto que generan un subespacio $Z$ de dimensión $k$. El espacio $W’$ que propondremos será $Z^\bot$.

Debemos mostrar que:

En efecto $V=W\oplus W’$.
En efecto $W’$ es $T$ estable.

Para la primer parte, usando teoría de espacios ortogonales tenemos que $$\dim(W’)=\dim(Z^\bot)=n-\dim(Z)=n-k,$$ así que los subespacios tienen la dimensión correcta para ser complementarios. Además, si $u\in W\cap W’$, entonces $u$ es combinación lineal de $v, T(v),\ldots, T^{k-1}(v),$ digamos $$u=\alpha_0v+\ldots+\alpha_{k-1}T^{k-1}(v)$$ y se anula por $\ell, S(\ell),\ldots,S^{k-1}(\ell)$, lo que quiere decir que se anula por $\ell, \ell\circ T, \ldots, \ell \circ T^{k-1}$. Esto permite probar iterativamente que $\alpha_0=\ldots=\alpha_{k-1}=0$, de modo que $u=0$. Con esto, $W$ y $W’$ son de intersección trivial y dimensiones complementarias, lo cual basta para que $V=W\oplus W’$.

Para terminar, debemos ver que $W’$ es $T$ estable. Tomemos un $u$ en $W’$, es decir, tal que se anula por $\ell, \ell\circ T, \ldots, \ell \circ T^{k-1}$. Al aplicar $T$, tenemos que $T(u)$ también se anula por todas estas transformaciones. Esto se debe a que para $\ell \circ T^j$ con $j\leq k-2$ se anula ya que $\ell\circ T^j(T(u))=\ell\circ T^{j+1}(u)=0$ por cómo tomamos $u$ y para $\ell \circ T^{k-1}$ se anula pues $T$ es nilpotente de índice $k$.

$\square$

Existencia de forma canónica de Jordan para nilpotentes

La idea para encontrar la forma canónica de Jordan debe ser clara a estas alturas: se procederá por inducción, el caso base será sencillo, asumiremos la hipótesis inductiva y para hacer el paso inductivo descomponeremos al espacio $V$ mediante la proposición de la sección anterior. Veamos los detalles.

Demostración (existencia de forma canónica de Jordan para nilpotentes). Estamos listos para probar la existencia de la forma canónica de Jordan para una transformación lineal nilpotente $T:V\to V$ con $V$ un espacio vectorial de dimensión finita $n$. Procederemos por inducción en la dimensión. Si $n=1$, entonces $V$ es generado por un vector $v$ y la transformación lineal $T$ debe mandarlo al vector $0$ para ser nilpotente. En esta base, $T(v)=0$ y la matriz que representa a $T$ es entonces $(0)=J_{0,1}$.

Supongamos que existe la forma canónica de Jordan para cuando $V$ es de cualquier dimensión menor a un entero positivo dado $n$. Tomemos $V$ un espacio vectorial de dimensión $n$ y $T:V\to V$ una transformación lineal nilpontente. Si $T$ es de índice $n$, entonces $T^{n-1}(v),\ldots,T(v),v$ son linealmente independientes y por lo tanto son una base de $V$. La forma matricial de $T$ en esta base es el bloque de Jordan $J_{0,n}$, en cuyo caso terminamos.

De otra forma, el índice es un número $k<n$. Entonces, $T^{k-1}(v),\ldots,T(v),v$ generan un subespacio estable $W$ de dimensión $k$. Por la proposición de la sección anterior, podemos encontrar un subespacio complementario $W’$ de dimensión $n-k<n$ y estable bajo $T$. Como la restricción de $T$ a $W’$ tiene codominio $W’$, es nilpotente y $\dim(W)<\dim(V)$, entonces por hipótesis inductiva $W’$ tiene una base $\beta$ bajo la cual la restricción de $T$ a $W’$ tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo $J_{0,k_j}$. Al completar $\beta$ con $T^{k-1}(v),\ldots,T(v),v$ , obtenemos una base de $V$ en la cual $T$ tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo $J_{0,k_j}$ (que vienen de la hipótesis inductiva) y un bloque de Jordan $J_{0,k}$. Salvo quizás un reordenamiento de la base para ordenar los $k_j$ y $k$, obtenemos exactamente lo buscado.

$\square$

Más adelante…

Ya demostramos una parte fundamental del teorema que nos interesa: la existencia de la forma canónica de Jordan para transformaciones (y matrices) nilpotentes. Nos falta otra parte muy importante: la de la unicidad. Las demostraciones de unicidad típicamente son sencillas, pero en este caso no es así. Para decir de manera explícita cuál es la forma canónica de Jordan de una transformación (o matriz) nilpotente, deberemos hacer un análisis cuidadoso del rango de las potencias de la transformación (o matriz). Veremos esto en las siguientes entradas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Verifica que la siguiente matriz es nilpotente: $$\begin{pmatrix}13 & 6 & -14 & -5\\ 2 & 0 & -4 & -2 \\ 29 & 12 & -34 & -13 \\ -45 & -18 & 54 & 21\end{pmatrix}.$$
Siguiendo las ideas de la demostración de existencia de esta entrada, ¿cómo podrías dar la forma canónica de Jordan de esta matriz? Intenta hacerlo.
Sea $V$ un espacio vectorial de dimensión finita y $T:V\to V$ una transformación lineal nilpotente de índice $k$. Demuestra que $^tT$ también es una transformación lineal nilpotente de índice $k$. ¿Cuál sería el resultado análogo para matrices?
Sea $V$ un espacio vectorial de dimensión finita y $T:V \to V$ una transformación lineal tal que para cualquier $v$ en $V$ existe algún entero $n$ tal que $T^n(v)=0$. Estos $n$ pueden ser distintos para distintos $v$. Muestra que $T$ es nilpotente.
Considera el subespacio $V$ de polinomios reales con grado a lo más $4$ y $D:V\to V$ la transformación lineal derivar. Da, de manera explícita, espacios $W$ y $W’$ como en las proposición de encontrar el subespacio complementario estable.
Hay varios detalles que quedaron pendientes en las demostraciones de esta entrada. Revisa la entrada para encontrarlos y da las demostraciones correspondientes.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Matrices y transformaciones nilpotentes
Siguiente entrada del curso: Unicidad de la forma canónica de Jordan para nilpotentes

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Ecuaciones Diferenciales I: Ecuaciones diferenciales como modelos matemáticos

Por Omar González Franco

Deja un comentario

Ninguna investigación humana puede ser llamada verdadera
ciencia si no puede ser demostrada matemáticamente.
– Leonardo da Vinci

Introducción

En la entrada anterior estudiamos algunas propiedades de las soluciones de las ecuaciones diferenciales ordinarias, en particular vimos que una ecuación diferencial puede tener infinitas soluciones y el intervalo de solución puede ser cualquiera en el que la función esté definida, sea derivable $n$ veces y cuyas derivadas sean continuas. En esta entrada estudiaremos cómo obtener una solución particular de una solución general dados unos valores prescritos conocidos como condiciones iniciales y veremos la importancia de saber elegir el intervalo de solución en estos casos particulares.

En esta entrada también estudiaremos algunos problemas del mundo real que involucran ecuaciones diferenciales, a través de estos problemas introduciremos la idea de ecuación diferencial como modelo matemático. Los problemas que estudiaremos tienen el objetivo de presentar el análisis que debemos hacer al intentar modelar un problema usando ecuaciones diferenciales y no con el propósito de resolver el problema mismo, pues resolverlo significa determinar las soluciones de las ecuaciones diferenciales que surjan y hasta este momento aún no hemos visto métodos de resolución.

Problema con valores iniciales

Definición: En algún intervalo $\delta$ que contiene a $x_{0}$, el problema de resolver la ecuación diferencial
$$\dfrac{d^{(n)}y}{dx^{(n)}} = f(x, y, y^{\prime}, \cdots, y^{(n –1)}) \label{1} \tag{1}$$ sujeto a que se cumpla $$y(x_{0}) = y_{0}, \hspace{0.5cm} y^{\prime}(x_{0}) = y_{1}, \hspace{0.5cm} \cdots, \hspace{0.5cm} y^{(n -1)}(x_{0}) = y_{n -1} \label{2} \tag{2}$$ donde $y_{0}, y_{1}, \cdots, y_{n -1}$ son contantes reales arbitrarias dadas, se llama problema con valores iniciales (PVI), o problema con valores iniciales de $n$-ésimo orden.

Definición: Los valores de $y(x)$ y de sus $n -1$ derivadas en el punto $x_{0}$, es decir
$$y(x_{0}) = y_{0}, \hspace{0.5cm} y^{\prime}(x_{0}) = y_{1}, \hspace{0.5cm} \cdots, \hspace{0.5cm} y^{(n -1)}(x_{0}) = y_{n -1}$$ se llaman condiciones iniciales.

De manera resumida podemos decir que un problema con valores iniciales es la ecuación diferencial acompañada de condiciones iniciales.

En el caso de ecuaciones diferenciales de primer y segundo orden tendríamos el siguiente PVI respectivamente:

Resolver $\dfrac{dy}{dx} = f(x, y)$ $\hspace{1.2cm}$ sujeto a $\hspace{0.5cm}$ $y(x_{0}) = y_{0}$

Resolver $\dfrac{d^{2}y}{dx^{2}} = f(x, y, y^{\prime})$ $\hspace{0.5cm}$ sujeto a $\hspace{0.5cm}$ $y(x_{0}) = y_{0}$ $\hspace{0.3cm}$ y $\hspace{0.3cm}$ $y^{\prime}(x_{0}) = y_{1}$

Geométricamente un PVI de primer orden significa que estamos buscando una solución $y(x)$ de la ecuación diferencial en un intervalo $\delta$ que contenga a $x_{0}$ tal que su gráfica pase por el punto $(x_{0}, y_{0})$.

En el caso del PVI de segundo orden estamos buscando una solución $y(x)$ de la ecuación diferencial en un intervalo $\delta$ que contenga a $x_{0}$ de tal manera que su gráfica no sólo pase por el punto $(x_{0}, y_{0})$, sino que también la pendiente a la curva en ese punto tenga como valor $m = y_{1}$.

En la entrada anterior vimos que las soluciones generales tienen constantes arbitrarias, las condiciones iniciales de un PVI nos permitirá determinar el valor de dichas contantes para obtener una solución particular, pues con frecuencia resolver un problema con valores iniciales de $n$-ésimo orden implica primero determinar una familia $n$-paramétrica de soluciones de la ecuación diferencial dada y después usando las $n$ condiciones iniciales en $x_{0}$ determinar los valores numéricos de las $n$ constantes de la familia. Es importante mencionar que la solución particular obtenida debe estar definida en algún intervalo $\delta$ que contenga al punto inicial $x_{0}$. Veamos un ejemplo.

Ejemplo: Considerar la solución general

$$y(x) = c_{1} e^{2x} + c_{2} e^{-x} + c_{3}e^{3x}$$

de la ecuación diferencial

$$y^{\prime \prime \prime} -4 y^{\prime \prime} + y^{\prime} +6y = 0$$

(Más adelante en el curso estudiaremos la forma de obtener este tipo de soluciones). Encontrar la solución particular dadas las siguientes condiciones iniciales:

$$y(0) = 4, \hspace{1cm} y^{\prime}(0) = -1, \hspace{1cm} y \hspace{1cm} y^{\prime \prime}(0) = 0$$

Solución: Como tarea moral verifica que en efecto la función dada es solución de la ecuación diferencial, por ahora asumiremos que lo es.

Tenemos un problema con valores iniciales, así que la solución está sujeta a las condiciones iniciales, lo que debemos hacer para obtener la solución particular no es más que aplicar las condiciones iniciales. En este caso $x_{0} = 0$, la primera condición inicial nos dice que se debe satisfacer $y(x_{0}) = y(0) = 4$, entonces evaluemos la solución en $x_{0} = 0$ y el resultado lo igualamos a $4$.

\begin{align*}
y(0) &= c_{1} e^{2(0)} + c_{2} e^{-0} + c_{3}e^{3(0)} \\
&= c_{1} + c_{2} + c_{3} \\
&= 4
\end{align*}

El resultado de aplicar la primera condición inicial es

$$y(0) = c_{1} + c_{2} + c_{3} = 4$$

Para aplicar la segunda condición inicial necesitamos la derivada de la solución general, dicha función es

$$y^{\prime}(x) = 2c_{1}e^{2x} -c_{2}e^{-x} + 3c_{3}e^{3x}$$

Apliquemos la segunda condición inicial, $y^{\prime}(0) = -1$.

\begin{align*}
y^{\prime}(0) &= 2c_{1} e^{2(0)} -c_{2} e^{-0} + 3c_{3}e^{3(0)} \\
&= 2c_{1} -c_{2} + 3c_{3} \\ &
= -1
\end{align*}

El resultado de aplicar la segunda condición inicial es

$$y^{\prime}(0) = 2c_{1} -c_{2} + 3c_{3} = -1$$

Finalmente, para aplicar la tercera condición inicial necesitamos la segunda derivada de la solución general, esto es

$$y^{\prime \prime}(x) = 4c_{1}e^{2x} + c_{2}e^{-x} + 9c_{3}e^{3x}$$

Apliquemos la condición inicial $y^{\prime \prime}(0) = 0$.

\begin{align*}
y^{\prime \prime}(0) &= 4c_{1} e^{2(0)} + c_{2} e^{-0} + 9c_{3}e^{3(0)} \\
&= 4c_{1} + c_{2} + 9 c_{3} \\
&= 0
\end{align*}

El resultado de aplicar la tercera condición inicial es

$$y^{\prime \prime}(0) = 4c_{1} + c_{2} + 9c_{3} = 0$$

De las ecuaciones obtenidas de aplicar las condiciones iniciales formamos el siguiente sistema de ecuaciones.

\begin{align*}
c_{1} + c_{2} + c_{3} &= 4 \\
2c_{1} -c_{2} + 3c_{3} &= -1 \\
4c_{1} + c_{2} + 9c_{3} &= 0
\end{align*}

Intenta resolver el sistema de ecuaciones usando el método que gustes. Una vez que lo resuelvas notarás que los valores para las incógnitas son:

$$c_{1} = \dfrac{10}{3}, \hspace{1cm} c_{2} = \dfrac{29}{12} \hspace{1cm} y \hspace{1cm} c_{3} = -\dfrac{7}{4}$$

Sólo basta sustituir estos valores en la solución general de la ecuación diferencial para obtener la solución particular. Por lo tanto, la solución particular sujeta a las condiciones iniciales es:

$$y(x) = \dfrac{10}{3} e^{2x} + \dfrac{29}{12} e^{-x} -\dfrac{7}{4}e^{3x}$$

$\square$

En la entrada anterior vimos que el intervalo de solución $\delta$ no es necesariamente el dominio de la función, sino que podemos tomar cualquier intervalo en el que la solución es derivable $n$ veces con derivadas continuas en ese intervalo, en el caso de los problemas con valores iniciales es necesario que el punto $x_{0}$ pertenezca al intervalo de solución $\delta$, esto en ocasiones establecerá un intervalo limitado para la solución, así que debemos tener cuidado con los valores en los que la solución particular está definida. Para visualizar este hecho retomemos el ejemplo visto en la entrada anterior donde mostramos que la función

$$y(x) = \dfrac{1}{4 -x^{2}}$$

es solución de la ecuación diferencial

$$\dfrac{dy}{dx} = 2xy^{2}$$

Realicemos este mismo ejercicio, pero ahora visto como un problema de valores iniciales y veamos la importancia de elegir correctamente el intervalo solución.

Ejemplo: La ecuación diferencial

$$\dfrac{dy}{dx} = 2xy^{2}$$

tiene como solución general a la función

$$y(x) = -\dfrac{1}{x^{2} + c_{1}}$$

Determinar la solución particular dada la condición inicial

$$y(0) = \dfrac{1}{4}$$

Solución: La solución general es

$$y(x) = -\dfrac{1}{x^{2} + c_{1}}$$

Aplicando la condición inicial obtenemos lo siguiente.

$$y(0) = -\dfrac{1}{0^{2} + c_{1}} = -\dfrac{1}{c_{1}} = \dfrac{1}{4}$$

De la última igualdad obtenemos $c_{1} = -4$, sustituyendo en la solución general se tiene

\begin{align*}
y(x) = -\dfrac{1}{x^{2} + c_{1}} = -\dfrac{1}{x^{2} -4} = \dfrac{1}{4 -x^{2}}
\end{align*}

Así que la solución particular

$$y(x) = \dfrac{1}{4 -x^{2}}$$

corresponde a un PVI de $\dfrac{dy}{dx} = 2xy^{2}$ con la condición inicial $y(0) = \dfrac{1}{4}$. En la entrada anterior mostramos la gráfica de esta función.

Pero ahora el intervalo de solución debe ser aquel en el que $x_{0} = 0 \in \delta$. El intervalo más grande que puede tomar la solución particular es $\delta = (-2, 2)$, pues es el intervalo donde está el punto $x_{0} = 0$ y donde la solución es continua. ¡La condición inicial ha restringido el intervalo de solución!

Punto que satisface la condición inicial $y(0) = \dfrac{1}{4}$.

$\square$

Con este ejemplo vemos que las condiciones iniciales establecen un intervalo de solución especifico, en ocasiones (como en el primer ejemplo visto en esta entrada) no habrá mayor problema con el intervalo si la función es derivable y por tanto continua es todo su dominio. Es recomendable primero determinar en donde la solución está definida (encontrar su dominio) y posteriormente revisar si se trata sólo de una solución general o si hay condiciones iniciales que determinarán una solución particular.

Existencia de una solución única

Al trabajar con problemas con valores iniciales debemos hacernos dos preguntas importantes. ¿Existe la solución del problema? y si existe la solución, ¿es única?. Más adelante estudiaremos las ecuaciones diferenciales de primer orden y retomaremos con mayor profundidad este tema, por ahora sólo vamos a enunciar un teorema que da las condiciones suficientes para garantizar la existencia y unicidad de una solución de un PVI de primer orden.

Teorema: Dada una ecuación diferencial de primer orden
$$\dfrac{dy}{dx} = f(x, y) \label{3} \tag{3}$$ donde $f(x, y)$ está definida en una región rectangular $U$ en el plano $XY$, la región está definida por $a \leq x \leq b$, $c \leq y \leq d$ y contiene al punto $(x_{0}, y_{0})$ en su interior. Si $f(x, y)$ satisface las condiciones:

$f(x, y)$ es continua en $U$ y

$\dfrac{\partial f}{\partial y}$ es continua en $U$

Entonces existe algún intervalo $\delta_{0}: (x_{0} -h, x_{0} + h)$, $h > 0$, contenido en $[a, b]$, y una función única $y(x)$, definida en $\delta_{0}$, que satisface la condición inicial $y(x_{0}) = y_{0}$.

Dicho de otra manera, las condiciones para la existencia de soluciones son:

Continuidad de $f(x, y)$ en $U$.

Acotamiento de $f(x, y)$ por $U$.

Y las condiciones para la unicidad son:

Continuidad de $f(x, y)$ y $\dfrac{\partial f}{\partial y}$ en $U$.

Acotamiento de $f(x, y)$ y $\dfrac{\partial f}{\partial y}$ por $U$.

Estas condiciones son suficientes, pero no necesarias, puede existir una solución única que satisface $y(x_{0}) = y_{0}$, pero que no cumple con alguna de las condiciones anteriores o que no cumple con ninguna.

Problemas que se modelan con ecuaciones diferenciales

Las matemáticas permiten modelar muchos de los fenómenos que ocurren en en mundo real, a esta descripción matemática de un sistema de fenómenos se le denomina modelo matemático y se construyen con la intención de representar algunas características del fenómeno para después hacer predicciones. Es cierto que esto puede ser un proceso muy difícil ya que implica que las hipótesis que hagamos deben ser descritas en fórmulas muy precisas que nos permitan predecir lo que ocurrirá. Una vez construido un modelo, las predicciones se deben comparar con los datos del sistema, dependerá de la compatibilidad entre las hipótesis y las predicciones lo que defina si debemos confiar en el modelo o debemos mejorar nuestras suposiciones.

En el caso de las ecuaciones diferenciales, éstas nos permiten modelar sistemas que evolucionan con el tiempo o sistemas que implican una razón de cambio de una o más variables. En este curso consideraremos a un modelo matemático como una ecuación diferencial o un sistema de ecuaciones diferenciales que describen el comportamiento de un fenómeno que estemos estudiando. Una vez que hemos formulado un modelo matemático surge el reto de resolver las ecuaciones diferenciales para saber si la solución es consistente con los hechos conocidos acerca del comportamiento del sistema y si no lo es debemos repetir un proceso de modelado en el que vamos ajustando las hipótesis, identificamos nuevas variables o incluso incluimos leyes empíricas que se puedan aplicar al sistema.

Hasta ahora ya hemos estudiado algunas ecuaciones diferenciales, sabemos cómo verificar cuando una función es solución y hemos estudiado algunas de sus propiedades. Para concluir esta entrada vamos a analizar algunos problemas del mundo real que son modelados con ecuaciones diferenciales. En esta parte nos enfocaremos en la forma en la que surgen las ecuaciones dado un problema y no nos preocuparemos por resolverlas, pues esto es algo que aún desconocemos.

Propagación de una enfermedad contagiosa

Recientemente hemos tenido la experiencia de observar cómo es que una enfermedad contagiosa se puede propagar en la población. En términos muy generales intentemos modelar la propagación de una enfermedad contagiosa a través de una comunidad de personas que han estado en contacto con personas enfermas.

Definamos a $x(t)$ como el número de personas que están enfermos en un cierto tiempo $t$ y sea $y(t)$ el número de personas que aún no han sido expuestas al contagio en ese momento $t$. Es claro que la razón $\dfrac{dx}{dt}$ con la que se propaga la enfermedad debe ser proporcional al número de encuentros o interacciones entre los dos grupos de personas. Si suponemos que el número de interacciones es conjuntamente proporcional a $x(t)$ y $y(t)$, entonces un modelo puede ser

$$\dfrac{dx}{dt} = cxy \label{4} \tag{4}$$

donde $c$ es la constante de proporcionalidad. Consideremos una comunidad con una población fija de $n$ personas, si inicialmente nadie tiene la enfermedad entonces $y = n$, pero si a esa comunidad llega una persona enferma $x = 1$, entonces podemos construir la siguiente relación.

$$x + y = n + 1 \label{5} \tag{5}$$

de donde podemos despejar a $y$ como

$$y = n + 1 -x$$

y sustituir en el modelo.

$$\dfrac{dx}{dt} = cx(n + 1 -x) \label{6} \tag{6}$$

Esta última ecuación sería el modelo que describe la propagación de la enfermedad a través del tiempo. Una condición inicial sería que en el momento en el que llego la persona enferma a la comunidad comenzó a propagarse la enfermedad, esto es, $x(0) = 1$.

$\square$

Ley de enfriamiento de Newton

La ley de enfriamiento de Newton establece que la razón de cambio de la temperatura $T(t)$ de un cuerpo con respecto al tiempo $t$ es proporcional a la diferencia entre la temperatura del cuerpo $T(t)$ y la temperatura del medio ambiente $T_{m}$. Esta ley puede ser modelada con la siguiente ecuación diferencial.

$$\dfrac{dT}{dt} = -k(T -T_{m}) \label{7} \tag{7}$$

donde $k > 0$ es la contante de proporcionalidad y $T_{m}$ es la temperatura del medio ambiente considerada también una constante. Si podemos resolver esta ecuación encontraríamos una función que podría predecir la temperatura del cuerpo en cualquier tiempo $t$.

Sin embargo, sin resolver la ecuación podemos notar que si $T > T_{m}$, entonces $\dfrac{dT}{dt} < 0$, lo que significa que el cuerpo se estaría enfriando, pues la función $T(t)$ sería una función decreciente mientras avanza el tiempo. Por otro lado, si $T < T_{m}$, entonces $\dfrac{dT}{dt} > 0$, es decir la función $T(t)$ sería una función creciente en el tiempo lo que físicamente significa que el cuerpo se esta calentando.

$\square$

Cuerpos en caída

Consideremos un objeto que es lanzado desde lo alto de un edificio, el problema que queremos analizar es hallar la forma de conocer la posición del objeto con respecto al suelo en algún tiempo $t$ después de ser lanzado y antes de tocar el suelo. Por convención consideremos que la dirección hacía arriba es positiva.

Analicemos la situación. Consideremos un edificio de altura $r_{0}$, desde esa altura se lanza un objeto de masa $m$, la velocidad inicial con la que es lanzado es $v_{0}$. El objeto al caer esta sometido a la fuerza de gravedad, la segunda ley de Newton nos dice que cuando la fuerza neta $F$ que actúa sobre un cuerpo no es cero, entonces la fuerza neta es proporcional a su aceleración $a$, estas cantidades están relacionadas por la ecuación

$$F = ma \label{8} \tag{8}$$

con $m$ la masa del cuerpo, si el objeto esta en caída la fuerza neta será su peso.

$$F = -W \label{9} \tag{9}$$

El signo menos es porque el peso del objeto es una fuerza dirigida hacia abajo. Recordando que el peso está dado como

$$W = mg \label{10} \tag{10}$$

donde $m$ es la masa del objeto y $g$ es la aceleración debido a la gravedad de la tierra, usando entonces la segunda ley de Newton podemos establecer que

$$F = ma = -mg = -W$$

es decir $a = -g$. Recordemos que la aceleración de un objeto corresponde a la tasa de cambio de la velocidad y que a su vez la velocidad es la tasa de cambio de la posición del objeto, es decir, la aceleración es la segunda derivada de la posición con respecto al tiempo, si $r(t)$ es la posición del objeto, entonces

$$a(t) = \dfrac{d^{2}r}{dt^{2}} = \ddot{r}(t) \label{11} \tag{11}$$

Por lo tanto, la ecuación diferencial que modela nuestro problema es

$$\dfrac{d^{2}r}{dt^{2}} = -g \label{12} \tag{12}$$

Las condiciones iniciales son claras, al tiempo $t = 0$ el objeto se encuentra en la posición mas alta del edificio es decir $r(0) = r_{0}$ y la velocidad con la que es lanzada al tiempo $t = 0$ es $v(0) = \dot{r}(0) = v_{0}$. Resolviendo la ecuación diferencial y obteniendo la solución particular podremos predecir la posición del objeto con respecto al suelo a cualquier tiempo $t$ antes de caer por completo.

$\square$

Modelo logístico de la población

Este es uno de los modelos más estudiados y representativos al estudiar ecuaciones diferenciales. Lo que se quiere estudiar es el crecimiento de una población, queremos crear un modelo que prediga el crecimiento que puede haber en una población en función de su entorno y los recursos limitados a los que están sujetos. Para comenzar con este estudio se pueden considerar las siguientes hipótesis.

Si la población es pequeña, la tasa de crecimiento de la población es proporcional a su tamaño.
Si la población es demasiado grande para ser soportada por su entorno y recursos, la población disminuirá, en este caso la tasa de crecimiento será negativa.

Las variables involucradas en este problema son las siguientes:

Por supuesto el tiempo $t$ es la variable independiente en la que queremos predecir. Otra variable es la población $P$, esta variable es dependiente del tiempo $P = P(t)$, $k$ será el parámetro que corresponde a la razón de crecimiento en el caso de poblaciones pequeñas y $N$ será otro parámetro que establece cuando la población comienza a ser demasiado grande. El parámetro $N$ se conoce como capacidad de soporte del entorno. De acuerdo a las hipótesis anteriores, estamos suponiendo que $P(t)$ crece si $P(t) < N$ y decrece si $P(t) > N$. Ahora que conocemos las variables que estarán presente en el modelo, matemáticamente podemos escribir a las hipótesis como:

$\dfrac{dP}{dt} = kP$ $\hspace{0.5cm}$ si $P$ es pequeña.

$\dfrac{dP}{dt} < 0$ $\hspace{0.8cm}$ si $P$ es grande, tal que $P > N$

Queremos una expresión (ecuación diferencial) que involucre ambas hipótesis. Supongamos que la ecuación que buscamos es de la forma

$$\dfrac{dP}{dt} = k \alpha P \label{13} \tag{13}$$

Donde $\alpha$ es una función que debe acoplarse a las hipótesis. Para que satisfaga la primea hipótesis debe ocurrir que $\alpha$ sea cercano a $1$ cuando $P$ es pequeño y que $\alpha < 0$ cuando $P > N$. La expresión más simple que satisface esto es

$$\alpha = 1 -\dfrac{P}{N} \label{14} \tag{14}$$

Podemos notar que si $P = 0$, entonces $\alpha = 1$ y si $P > N$, entonces $\alpha < 0$. Por lo tanto, la ecuación diferencial que describe esta situación es:

$$\dfrac{dP}{dt} = k \left(1 -\dfrac{P}{N}\right) P \label{15} \tag{15}$$

Éste es el modelo logístico de la población con velocidad de crecimiento $k$ y capacidad de soporte $N$. Como podemos notar es una ecuación diferencial no lineal y su solución la analizáremos con detalle más adelante en el curso.

$\square$

Sistemas Depredador – Presa

Para concluir estudiemos otro de los modelos más estudiados en ecuaciones diferenciales, el modelo depredador – presa. En el mundo ninguna especie vive aislada y sus interacciones pueden proporcionar algunos de los modelos más interesantes por estudiar. El problema que analizaremos es en el que una especie se come a otra, con fines ilustrativos consideremos a la especie depredador como zorros y a la especie presa como conejos. Llamemos $Z(t)$ a la variable dependiente que describe el número de zorros que hay en una cierta región y sea $C(t)$ otra variable dependiente que describe el número de conejos que hay en esa misma región, ambas funciones son dependientes del tiempo $t$. Nuestras hipótesis tienen que ser tales que describan el aumento o disminución de ambas poblaciones de acuerdo a las interacciones que hay entre zorros y conejos, es claro que si hay muchos conejos los zorros tendrán alimento y su población crecerá, mientras que la de conejos disminuirá y por otro lado, si hay pocos conejos la población de zorros disminuirá (morirán por falta de alimento), mientras que la de conejos aumentará. Las hipótesis que consideraremos son las siguientes:

Si no hay zorros presentes, los conejos se reproducen a una tasa proporcional a su población y no les afecta la sobrepoblación.
Los zorros se comen a los conejos y la razón a la que los conejos son devorados es proporcional a la tasa a la que los zorros y conejos interactúan.
Sin conejos que comer, la población de zorros disminuirá a una tasa proporcional a ella misma.
La tasa de nacimientos de los zorros crece en proporción al número de conejos comidos por zorros que, por la segunda hipótesis, es proporcional a la tasa a la que los zorros y conejos interactúan.

Las variables que tenemos hasta ahora son el tiempo $t$ y las poblaciones $Z(t)$ y $C(t)$, para satisfacer las hipótesis necesitamos de parámetros que las modelen. Los parámetros que consideraremos son los siguientes:

$a$ es el coeficiente de la tasa de crecimiento de conejos.
$b$ es la constante de proporcionalidad que mide el número de interacciones conejos-zorros en las que el conejo es devorado.
$c$ es el coeficiente de la tasa de muertes de zorros.
$d$ es la constante de proporcionalidad que mide el beneficio a la población de zorros de un conejo devorado.

Tomaremos la convención de que todos estos parámetros son positivos. En este caso particular tenemos dos variables dependientes del tiempo por lo tanto será necesario encontrar dos ecuaciones que modelen al sistema. Para que sea más intuitivo entender el modelo vamos a mostrar las ecuaciones que modelan el sistema y veamos por qué son así.

\begin{align*}
\dfrac{dC}{dt} &= aC -bCZ \\
\dfrac{dZ}{dt} &= -cZ + dCZ \label{16} \tag{16}
\end{align*}

La primer hipótesis nos habla de una relación proporcional en el crecimiento de la población de conejos cuando no hay zorros presentes, de ahí el término $aC$ de la primer ecuación, lo mismo ocurre con la tercera hipótesis, pero en este caso se trata de un decremento de población de zorros tras la falta de conejos, por ello el signo menos en el término $-cZ$ de la segunda ecuación. Por otro lado, la segunda y cuarta hipótesis nos habla de una interacción entre los zorros y los conejos, esta interacción puede ser modelada con el producto $CZ$, con este producto hacemos que la interacción aumente si $C$ o $Z$ aumentan, pero desaparece si $C = 0$ o $Z = 0$, así en el caso de la segunda hipótesis los conejos son devorados de manera proporcional a la interacción entre zorros y conejos, por ello agregamos el término $-bCZ$ en la primer ecuación, el signo menos indica que el número de conejos debe disminuir, pues están siendo devorados, así mismo, la cuarta hipótesis nos habla de un crecimiento en el número de zorros al comer conejos, esta interacción es modelada con el término $dCZ$, en este caso es positivo ya que los zorros están aumentando en número. Este análisis es lo que le da sentido al modelo (\ref{16}) que hemos creado.

Algo interesante que notamos es que ahora tenemos dos ecuaciones diferenciales que modelan el fenómeno. Cuando hay dos o más ecuaciones diferenciales decimos que es un sistema de ecuaciones diferenciales, en este caso este sistema de ecuaciones lo llamamos sistema de primer orden de ecuaciones diferenciales ordinarias, se dice también que el sistema es acoplado porque las tasas de cambio $\dfrac{dC}{dt}$ y $\dfrac{dZ}{dt}$ dependen tanto de $C$ como de $Z$. Los sistemas de ecuaciones diferenciales será un tema que estudiaremos en la tercera unidad del curso.

Una solución al modelo que hemos construido consiste en encontrar un par de funciones $C(t)$ y $Z(t)$ que describan las poblaciones de conejos y zorros como funciones del tiempo. Como el sistema es acoplado, no podemos determinar cada una de esas funciones de forma aislada, sino que debemos resolver ambas ecuaciones diferenciales de forma simultánea, sin embargo en este caso no es posible determinar de modo explícito formulas para $C(t)$ y $Z(t)$, no pueden ser expresadas en términos de funciones conocidas tales como polinomios, senos, cosenos, exponenciales, etcétera. Más adelante veremos que las funciones $C(t)$ y $Z(t)$ existen, pero entonces, ¿cómo conocerlas?. En la siguiente entrada estudiaremos un método cualitativo de las ecuaciones diferenciales que puede ser un método que nos ayude en estos casos, por ejemplo.

$\square$

Por supuesto estos son sólo algunos problemas ilustrativos en los que las ecuaciones diferenciales modelan algún fenómeno natural, pero la cantidad de fenómenos que involucran ecuaciones diferenciales son enormes y un tanto el objetivo es que conforme vayamos aprendiendo seamos capaces de construir nuestros propios modelos sobre algún fenómeno que observemos a nuestro alrededor.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

Dada la ecuación diferencial y su solución general, verificar que la función $y(x)$ es solución, determinar la solución particular dadas las condiciones iniciales y determinar el intervalo de solución $\delta$ en donde puede estar definida dicha solución.

$\dfrac{dy}{dx} = y^{2}, \hspace{1cm} y(x) = \dfrac{1}{c_{1} -x}, \hspace{1cm} y(1) = 2$.

$\dfrac{dy}{dx} + y = 0, \hspace{1cm} y(x) = c_{1}e^{-x}, \hspace{1cm} y(0) = 2$.

$\dfrac{d^{2}y}{dx^{2}} + y = 0, \hspace{1cm} y(x) = c_{1} \cos(x) + c_{2} \sin(x), \hspace{1cm} y(0) = -1 \hspace{0.5cm} y \hspace{0.5cm} y^{\prime}(0) = 8$.

Considerar el modelo de población

$\dfrac{dP}{dt} = 0.4 P \left( 1 -\dfrac{P}{230} \right)$

donde $P(t)$ es la población en el tiempo $t$.

¿Para qué valores de $P$ está en equilibrio la población?.
¿Para qué valores de $P$ está creciendo la población?.
¿Para qué valores de $P$ está decreciendo la población?.

El sistema

$\dfrac{dx}{dt} = ax -by\sqrt{x}$
$\dfrac{dy}{dt} = cy\sqrt{x}$

ha sido propuesto como un modelo para un sistema depredador – presa de dos especies particulares de microorganismos (con $a$, $b$ y $c$ parámetros positivos).

¿Qué variable, $x(t)$ o $y(t)$, representa a la población depredadora? y ¿qué variable representa a la población presa?.
¿Qué le pasa a la población depredadora si la presa se extingue?.

Más adelante…

Más adelante aprenderemos a resolver ecuaciones diferenciales ordinarias de primer orden de forma analítica, una vez que estemos listos puede ser conveniente regresar a esta entrada e intentar resolver las ecuaciones diferenciales que modelan cada uno de los problemas vistos para extrapolar en los resultados.

Pero antes de estudiar métodos analíticos estudiaremos un método geométrico o mejor conocido como método cualitativo de las ecuaciones diferenciales que nos permitirá describir las soluciones sin conocer explícitamente la forma analítica de las funciones solución.

Entradas relacionadas

Página principal del curso: Ecuaciones Diferenciales I
Entrada anterior del curso: Soluciones a las ecuaciones diferenciales
Siguiente entrada del curso: Campos de pendientes y su ecuación diferencial asociada

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior I: Cuantificadores existenciales y universales

Por Guillermo Oswaldo Cota Martínez

4 respuestas

Introducción

Hasta ahora hemos visto proposiciones, variables proposicionales, conectores y fórmulas lógicas. Por ello, ya podemos decir cómo se manejan las proposiciones al combinarlas o qué significa que dos proposiciones sean equivalentes.

Sin embargo, hasta ahora no hemos trabajado con tanto rigor los objetos a los que nos referimos dentro de una proposición. Por ejemplo cuando decimos la proposición «Este número es impar» puede que sea o no verdadera, pero esto depende de una cosa: el contexto. ¿A qué número nos estamos refiriendo? Podríamos estar en la siguiente conversación: «Hay números distintos a los múltiplos de 2, por ejemplo el 3. Este número es impar.» A esto último, estando en contexto, ya le podríamos asociar un valor de verdad.

En general esto no es así. Podemos ir variando a qué número nos referimos. En ocasiones las proposiciones tienen una variable y, dependiendo el valor de esa variable, cambian su significado o su valor de verdad. En esta entrada formalizamos estas ideas y hablamos de cuantificadores, que nos permitirán «recorrer» todos los valores posibles de una variable.

Términos variables y predicados

Volvamos a nuestro ejemplo. Al tomar la proposición $P$ «el número es impar», podríamos referirnos al $1$, $2$, $3$, $80$ o $20,000$. Así, es más conveniente pensar en que la proposición depende de una variable como sigue:

$P(\text{el número})$ = «$\text{el número}$ es impar».

Visto de esta manera, $P(2)$ es la proposición «$2$ es impar». En general $P(x)$ es la proposición «$x$ es impar» y esta hace referencia a que el número es una variable que puede tomar distintos valores «permitidos». Observa que en este caso no tendría sentido decir si $P(\text{azul})$ es verdadero o falso. A este tipo de proposiciones que tienen una variable (o más), se les llama predicados.

¿Notas que tenemos que ponernos de acuerdo sobre cuál es el contexto sobre el que estamos hablando al momento de asignarle un valor a nuestra variable? Esto debido a que no podríamos decir que «azul es impar» o «la luna es impar». A este «conjunto» dentro del cual pueden tomar valores nuestras variables le llamamos universo de discurso. Aunque suena algo sofisticado, puedes pensarlo como el contexto al que nos estamos acoplando.

Es muy importante siempre tener claro el universo de discurso cuando usamos predicados. No será lo mismo estar hablando de número pares, que de números enteros. Sabemos que todos los números pares no son impares. Mientras que algunos números enteros son impares. Estas palabras enfatizadas son las que nos van a permitir hablar más sobre cómo es nuestro universo de discurso. No es lo mismo que solo un objeto del universo cumpla un predicado (tenga valor de verdad verdadero) a que todos los objetos de nuestro universo las cumplan.

Cuantificador universal

Cuando tenemos un predicado $P(x)$, no podemos decir si es verdadero o falso hasta que no hayamos decidido quién es exactamente el objeto $x$ dentro de nuestro universo de discurso del que estamos hablando. Pero lo que sí podemos hacer es pensar en si ninguno, alguno o todos los elementos de dicho universo de discurso hacen que $P(x)$ sea verdadero, o no. A esto se le llama cuantificar un predicado.

El primer cuantificador que nos interesa es el cuantificador universal que transforma un predicado en una afirmación de que todo objeto de nuestro universo de discurso hace que la proposición $P(x)$ sea verdadera. Dicho cuantificador universal puede pensarse como agregar un «Para todo $x$ en el universo de discurso,» antes del predicado $P(x)$ que nos interesa. Lo que esto hace es que transforma el predicado $P(x)$ en la proposición $\forall x: P(x)$, la cual acordamos que es cierta siempre y cuando cualquier objeto $x$ de nuestro universo de discurso hace que $P(x)$ sea cierta. Entonces la veracidad de $\forall x: P(x)$ depende fuertemente tanto de:

La proposición $P(x)$
El universo de discurso en el que estemos.

Cotidianamente también decimos simpemente «Para todo $x$, $P(x)$», pero es muy importante que el universo de discurso sea claro.

Veamos un ejemplo poco a poco. Consideremos el siguiente predicado:

$$P(x)= \text{$x$ es múltiplo de $2$.}$$

Este predicado no tiene ningún valor de verdad. Lo podemos pensar como que es una proposición cuyo contenido depende de una variable $x$ que no hemos decidido. Ahora acordemos como universo a los números múltiplos de $4$. A partir de ello, podemos crear la siguiente proposición con el cuantificador universal $\forall$:

$$\forall x \text{ múltiplo de $4$}: P(x).$$

En palabras «todo múltiplo de $4$ es múltiplo de $2$». Al cuantificar el predicado, ya se convierte en una proposición. ¿Es verdadera? Sí, en efecto, sin importar cuál $x$ tomemos que sea múltiplo de $4$, cumplirá que es múltiplo de $2$.

Pero, ¡cuidado! Podríamos estar trabajando en otro universo de discurso, donde los objetos que nos interesan son todos los enteros. Si ese fuera el caso, al cuantificar universalmente tendríamos lo siguiente:

$$\forall x \text{ entero}: P(x).$$

Esta es una proposición, pero es falsa, pues podemos encontrar un entero, digamos $5$, para el cual $P(5)=\text{$5$ es múltiplo de $2$.}$ es falso. Por ello, la proposición con el cuantificador es falsa.

Algunos otros ejemplos de cómo podemos usar este cuantificador son los siguientes. Observa cómo se deja claro el universo de discurso.

$\forall x$ número par, $x$ es múltiplo de 2.
$\forall x$ grupo cíclico, $x$ es generado por un único elemento.
$\forall x$ año bisiesto, $x$ tiene 366 días.
$\forall (x,y)$ vector en $\mathbb{R}^2$, $\norm{x+y}\leq\norm{x}+\norm{y}.$ ^*

Recuerda que ahora no es necesario que conozcamos a la perfección el universo de discurso del que estamos hablando en estos ejemplos. En estas entradas no nos interesa estudiar a los pares, a los grupos cíclicos, o a los años bisiestos. Los ponemos como ejemplos únicamente para ver que las ideas de lógica aplican a todos ellos. Por ejemplo para el segundo ejemplo el objetivo es que entiendas que siempre que consideremos un grupo cíclico (sea lo que signifique un grupo o un grupo cíclico), ese grupo es generado por un único elemento (sea lo que signifique que un grupo se genere por un único elemento). En este caso nuestro universo de discurso serán los grupos cíclicos, mientras que $P(x)$ es el predicado «$x$ es generado por un único elemento». En estos renglones sólo nos interesa entender cuándo estamos hablando de un universo de discurso, un cuantificador y un predicado.

Cuantificador existencial

El cuantificador «para todo» establece que una proposición es verdadera para todos los objetos de un universo de discurso. Pero esto no siempre pasa. Por ejemplo, pensemos en que nuestro universo de discurso es $$A=\{\text{pescados, reptiles, aves, piedras, felinos}\}$$ y nuestro predicado $P(x)$ es «Los gatos son $x$». En este caso no todas las formas de asignar un objeto del universo a la variable $x$ darán proposiciones verdaderas. Los gatos no son pescados, reptiles ni mucho menos piedras o aves. Pero los gatos sí son felinos. En este caso la asignación $x=\text{felinos}$ será la única en la que se cumpla el esquema proposicional.

El cuantificador existencial permite enunciar una proposición que acordamos que se vuelve verdadera cuando uno (o más) de los objetos del universo de discurso hacen que obtengamos una proposición verdadera. Así, una vez acordado un universo de discurso y un predicado $P(x)$, diremos que la proposición $\exists x:P(x)$ es verdadera cuando logremos encontrar algún $x$ para el cual $P(x)$ sea verdadera.

En palabras, esto se dice a veces como «existe $x$ en el universo de discurso que cumple $P(x)$», o simplemente como «existe $x$, $P(x)$», cuando el universo de discurso se sobreentiende.

Algunos ejemplos del uso de este cuantificador son los siguientes:

$\exists n$ número entero que es solución a $n^2=4$.
$\exists n$ número entero que cumple $e^{i\pi}+n=0.$ ^**

Nuevamente, es muy importante que se acuerde el universo de discurso para poder concluir la veracidad de una proposición que involucra un cuantificador existencial. Por ejemplo, la proposición

$$\exists x \text{ número real}: x^2=-1$$

es falsa, pues no existe tal real (al elevar un real al cuadrado siempre queda mayor o igual a cero), mientras que la proposición

$$\exists x \text{ número complejo}: x^2=-1$$

es verdadera, pues el número complejo $x=i$ cumple que $x^2=-1$ es verdadero.

Cuantificador «existe un único»

El cuantificador «existe» tiene una variante más restrictiva. Cuando decimos que existe al menos un elemento en nuestro universo de discurso que cumple una propiedad, también tenemos que puede haber $2$, $3$ o $20$ elementos que lo cumplen. Por ejemplo: «$\exists n$ número entero que es solución a $n^2=4$» tiene dos posibilidades, pues al tomar $n=-2$ o $n=2$ el predicado se transforma en una proposición verdadera.

Pero es muy frecuente en matemáticas que se busque que uno y sólo un elemento que haga verdadero a a un predicado. Para referirnos a estas ocasiones, usamos el cuantificador «$\exists!$», que se lee como «existe un único«. Por ejemplo, sabemos que el único número primo par es 2. Así que podríamos decir: «$\exists! x$ número entero que es primo y par».

La regla de asignación de verdad es que $\exists! x: P(x)$ será verdadera si hay un único $x$ del universo de discurso que haga que $P(x)$ sea verdadera. Si no hay, o hay más de uno, entonces $\exists! x:P(x)$ será falsa.

Otros ejemplos (algunos informales) de su uso son:

$\exists!x$ día de la semana tal que $x$ empieza con la letra L
$\exists!x$ número real tal que $x$ es neutro aditivo. ^***
$\exists!n$ número entero que cumple $e^{i\pi}+n=0.$

¿Observas que la última oración se parece mucho al último ejemplo del cuantificador anterior? Y con esto no estamos contradiciendo nada, en el ejemplo anterior solo estamos diciendo «Existe un número entero $n$ que es solución a $e^{i\pi}+n=0$» con lo que queremos decir que existe al menos uno, mientras que en el último ejemplo, decimos «Existe un único número entero $n$ que es solución a $e^{i\pi}+n=0$». Aquí, el objetivo solo es ser más específicos, lo que quiere decir que sólo estamos dando información extra acerca de la proposición.

Tabla resumen de conjunciones y cuantificadores

A continuación resumimos en una tabla varios símbolos lógicos que hemos discutido.

Negaciones	$\neg$
Conjunciones	$\land$
Disyunciones	$\lor$
Implicaciones	$\Rightarrow$
Dobles implicaciones	$\Leftrightarrow$
Para todos los casos	$\forall$
Para al menos un caso	$\exists$
Para un único caso	$\exists!$

Combinando conectores y cuantificadores

Habiendo conocido los distintos cuantificadores, podríamos hacer afirmaciones un poco más extensas usando otros conectores lógicos en los predicados que usamos. Por ejemplo, pensemos en que nuestro universo de discurso son los números enteros. Consideremos los predicados $P(x)=x<0$ y $Q(x)=x<1$. Entonces podríamos decir

$$\forall \text{$x$ número entero: } (P(x) \Rightarrow Q(x))$$

En palabras: «Para todo número entero $x$, si $x$ es menor a 0, entonces $x$ es menor a 1». Esto es una afirmación verdadera.

También podríamos poner algo del estilo

$$\exists \text{$x$ número entero: } (x+3=8) \land (x^2-2=23).$$

Esta también es una afirmación verdadera pues $x=5$ es un número entero que cumple la proposición $x+3=8$ y la proposición $x^2-2=23$.

También podemos tener predicados con más de una variable e irlos cuantificando poco a poco. Por ejemplo, pensemos nuevamente a los números enteros como nuestro universo de discurso y $P(x,y)$ como la afirmación $x+y=0$. Tenemos que $P(2,-2)$ es verdadero, mientras que $P(2,2)$ es falso, pues es falso que $2+2=0$. Podemos cuantificar a $y$ con un existencial de unicidad para obtener lo siguiente: $$\exists ! y: P(x,y).$$ Esto todavía no es una proposición de la que podamos saber si es cierta o verdadera. Aunque $y$ ya está cuantificado, $x$ sigue siendo variable. Lo que sí es que entonces es un predicado que de la variable $x$ y ahora podemos cuantificarlo con respecto a $x$ para obtener, por ejemplo,

$$\forall x: (\exists! y: P(x,y)).$$

Aquí estaríamos diciendo «para cada número entero $x$, existe un único número entero $y$ tal que $x+y=0$». Dicho de otra forma, cada vez que consideramos un número entero $x$, digamos $3$, existirá un único número entero $y$ que cumplirá la ecuación $x+y=0$. En este caso ese número $y$ es $-3$, pues dijimos que $x=3$ y sólo hay un número que al sumarlo a $3$ nos da $0$.

Entender estas dobles cuantificaciones será crucial para entender, por ejemplo, la definición de límite en Cálculo Diferencial e Integral I.

Notas

Estas son algunas anotaciones del artículo y no es necesario que las sepas, únicamente son curiosidades o temas por aparte que forman parte de la cultura matemática.

* Esta se conoce como la desigualdad del triángulo y nos dice básicamente que la suma de la longitud de dos lados de un triángulo siempre será mayor a la longitud del tercer lado.

** Esta afirmación está relacionada con la llamada identidad de Euler y algunos piensan que es una de las ecuaciones más hermosas de las matemáticas. En otros cursos como Álgebra Superior 2 o Variable Compleja 1 puede que vuelvas a ver esta identidad con su demostración.

*** El único neutro aditivo es el $0$, y esto quiere decir que al sumarle este a cualquier otro número, dará el mismo número.

Más adelante…

Cuando estamos hablando de cuantificadores, también nos van a interesar sus negaciones. Por ejemplo, ¿a qué nos referiremos cuando digamos $\neg (\forall x P(x))$? ¿o cuando digamos $\neg (\exists x (P(x) \Rightarrow Q(x)))$? Lo primero que tenemos que entender es qué quiere decir negar un cuantificador universal y uno existencial. Eso es justo lo que estudiaremos en la siguiente entrada.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Imagina que definitivamente quieres comprar un helado. Cuando vas a la heladería, sólo venden un sabor. Esto tiene desventajas, por supuesto. Pero, ¿qué ventajas tiene que sólo haya un sabor de helado? Enlista todas las que puedas.
En los ejemplos siguientes encuentra el universo de discurso y su predicado.
1. $\forall x$ número par,$x$ es múltiplo de 2.
2. $\forall x$ año bisiesto, $x$ tiene 366 días.
3. $\forall (x,y)$ vector en $\mathbb{R}^2$, $\norm{x+y}\leq\norm{x}+\norm{y}$.
Considera el predicado $P(x)=«x$ es múltiplo de 11». Da cuatro universos de discurso tales que los siguientes enunciados sean ciertos:
- $\forall x P(x)$
- $\exists x P(x)$
- $\exists! x P(x)$
- $\nexists x P(x)$
Considera la proposición: $P(x,y,z)$ = «$x^3+y^3=z^3$». ¿Cuál de los siguientes enunciados representa la oración «No existen números enteros $x,y,z$ que cumplen $P(x,y,z)$»?:
- $\forall x (\exists y (\exists z P(x,y,z)))$
- $\nexists (x,y,z)P(x,y,z)$
- $\forall x (\nexists(y,z)P(x,y,z))$
- $\nexists x (\forall (x,y) P(x,y,z))$
¿El ejercicio anterior sólo tiene una solución? Si hay más de una opción correcta, ¿cómo argumentarías que dos enunciados representan el mismo enunciado?

Entradas relacionadas

Ir a Álgebra Superior I
Entrada anterior del curso: Condicionales y dobles condicionales
Siguiente entrada del curso: Problemas de condicionales y cuantificadores

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»