Archivo de la etiqueta: unicidad

Álgebra Lineal II: Unicidad de la forma de Jordan para nilpotentes

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan para matrices nilpotentes. Demostramos una parte: la existencia de la forma canónica de Jordan. Para ello, nos enfocamos en el teorema en su versión en términos de transformaciones lineales. En esta entrada nos enfocaremos en demostrar la unicidad de la forma canónica de Jordan. Curiosamente, en este caso será un poco más cómodo trabajar con la forma matricial del teorema. Para recordar lo que queremos probar, volvemos a poner el enunciado del teorema a continuación. Lo que buscamos es ver que los enteros $k_1,\ldots, k_d$ que menciona el teorema son únicos.

Teorema. Sea $A$ una matriz nilpotente en $M_n(F)$. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales $A$ es similar a la siguiente matriz de bloques: $$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

Nuestra estrategia para mostrar la unicidad será el estudio del rango de las potencias de $A$. Si $A$ es similar a $B$, entonces existe $P$ invertible tal que $A=P^{-1}BP$, de donde se puede mostrar indutivamente que $A^k=P^{-1}B^kP$, mostrando que $A^k$ y $B^k$ son similares. Además, matrices similares tienen el mismo rango. De modo que si $A$ es similar a $B$ entonces todas las potencias de $A$ tienen el mismo rango que todas las potencias de $B$. Con esta idea en mente, ¿cómo son las potencias de las matrices hechas por bloques de Jordan? Comenzaremos estudiando esto.

Rango de potencias de bloques de Jordan

Claramente el rango del bloque de Jordan $J_{0,n}$ es $n-1$, pues ya está en forma escalonada reducida y tiene $n-1$ vectores distintos de cero. El siguiente resultado generaliza esta observación.

Proposición. Sea $n$ un entero positivo, $F$ un campo y $J_{0,n}$ el bloque de Jordan de eigenvalor $0$ y tamaño $n$ en $M_n(F)$. Para $k=1,\ldots,n$ se tiene que el rango de $J_{0,n}^k$ es igual a $n-k$. Para $k$ más grandes, el rango es igual a cero.

Demostración. Si $e_1,\ldots,e_n$ es la base canónica de $F^n$, tenemos que $J_{0,n}e_i=e_{i-1}$ para $i=2,\ldots,n$ y $J_{0,n}e_1=0$. De manera intuitiva, la multiplicación matricial por $J_{0,n}$ va «desplazando los elementos de la base $e_1,\ldots,e_n$ a la izquierda, hasta sacarlos». De este modo, $J_{0,n}^k$ para $k=1,\ldots,n$ hace lo siguiente:

$$J_{0,n}^k e_i=\begin{cases} 0 & \text{para $i\leq k$}\\ e_{i-k} & \text{para $i\geq k+1$.}\end{cases}$$

Así, $J_{0,n}^k$ manda a la base $e_1,\ldots,e_n$ a los vectores $e_1,\ldots,e_{n-k}$ y a $k$ copias del vector cero. Como los primeros son $n-k$ vectores linealmente independientes, obtenemos que el rango de $J_{0,n}^k$ es $n-k$.

Para varlores de $k$ más grandes la potencia se hace la matriz cero, así que su rango es cero.

$\square$

Rango de potencias de matrices diagonales por bloques de Jordan

¿Qué sucede si ahora estudiamos el rango de las potencias de una matriz diagonal por bloques hecha por puros bloques de Jordan? Consideremos, por ejemplo, la siguiente matriz, con $k_1\leq \ldots \leq k_d$ de suma $n$:

$$J=\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

Por un lado, es sencillo elevar esta matriz a potencias, pues simplemente los bloques se elevan a las potencias correspondientes. En símbolos:

$$J^r=\begin{pmatrix} J_{0,k_1}^r& 0 & \cdots & 0 \\ 0 & J_{0,k_2}^r& \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}^r\end{pmatrix}.$$

¿Cuál es el rango de esta potencia? Nos conviene cambiar un poco de notación. En vez de considerar a los $k_i$ por separado, los agruparemos de acuerdo a su valor, que puede ir de $1$ a $n$. Así, para cada $j=1,\ldots,n$ definimos $m_j$ como la cantidad de valores $k_i$ iguales a $j$. Bajo esta notación, la igualdad $k_1+\ldots+k_d=n$ se puede reescribir como $$m_1+2m_2+3m_3+\ldots+nm_n=n.$$

Una primera observación es que el rango de $J$ es simplemente la suma de los rangos de cada una de las $J_{0,k_i}$. Cada una de estas contribuye con rango $k_i-1$. Así, en términos de las $m_i$ tenemos lo siguiente:

\begin{align*}
\text{rango}(J)&=\sum_{i=1}^d (k_i-1)\\
&=\sum_{j=1}^n (j-1) m_j \\
&=0\cdot m_1 + 1\cdot m_2 + 2 \cdot m_3 + \ldots + (n-1) \cdot m_n.
\end{align*}

De manera similar,

\begin{align*}
\text{rango}(J^r)&=\sum_{i=1}^d \text{rango}(J_{0,k_i}^r)\\
&=\sum_{j=1}^n m_j \text{rango}(J_{0,j}^r).
\end{align*}

El término $\text{rango}(J_{0,j}^r)$ lo podemos calcular con la proposición de la sección anterior, cuidando la restricción entre el tamaño y las potencias que queremos. De aquí y de la restricción original para la las $m_i$ salen todas las siguientes igualdades:

\begin{align*}
n&= 1\cdot m_1 + 2\cdot m_2 + 3 \cdot m_3 + \ldots + n \cdot m_n\\
\text{rango}(J)&=0\cdot m_1 + 1\cdot m_2 + 2 \cdot m_3 + \ldots + (n-1) \cdot m_n\\
\text{rango}(J^2)&= 0 \cdot m_1 + 0 \cdot m_2 + 1 \cdot m_3 + \ldots + (n-2)\cdot m_n\\
\text{rango}(J^3)&= 0 \cdot m_1 + 0 \cdot m_2 + 0 \cdot m_3 + \ldots + (n-3)\cdot m_n\\
&\vdots\\
\text{rango}(J^{n-1})&= 0\cdot m_1 + 0 \cdot m_2 + 0 \cdot m_3 + \ldots + 1 \cdot m_n.
\end{align*}

A partir de aquí el rango de $J^n$ es $0$. Esto nos da una manera de entender con mucha precisión el rango de cualquier potencia de una matriz diagonal por bloques hecha con bloques de Jordan.

Unicidad de la forma canónica de Jordan

Estamos listos para justificar la unicidad de la forma canónica de Jordan. Una matriz diagonal por bloques hecha por bloques de Jordan queda totalmente determinada por los valores de $m_j$ de la sección anterior. Supongamos que $A$ tiene como forma canónica de Jordan tanto a una matriz $J$ con valores $m_j$, como a otra matriz $J’$ con valores $m_j’$.

Como dos matrices similares cumplen que las sus potencias son todas del mismo rango, entonces para cualquier $r$ de $1$ a $n-1$ se cumple que $$\text{rango}(J^r)=\text{rango}(A^r)=\text{rango}(J’^r).$$ Así, tanto $(m_1,\ldots,m_n)$ como $(m_1′,\ldots,m_n’)$ son soluciones al siguiente sistema de ecuaciones en variables $x_1,\ldots,x_n$.

\begin{align*}
n&= 1\cdot x_1 + 2\cdot x_2 + 3 \cdot x_3 + \ldots + n \cdot x_n\\
\text{rango}(A)&=0\cdot x_1 + 1\cdot x_2 + 2 \cdot x_3 + \ldots + (n-1) \cdot x_n\\
\text{rango}(A^2)&= 0 \cdot x_1 + 0 \cdot x_2 + 1 \cdot x_3 + \ldots + (n-2)\cdot x_n\\
\text{rango}(A^3)&= 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + (n-3)\cdot x_n\\
&\vdots\\
\text{rango}(A^{n-1})&= 0\cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + 1 \cdot x_n.
\end{align*}

Pero este es un sistema de ecuaciones de determinante $1$, así que su solución es única. Esto muestra que $(m_1,\ldots,m_n)=(m’_1,\ldots,m’_n)$, con lo cual se deduce que $J=J’$.

Como consecuencia de toda esta discusión, obtenemos de hecho lo siguiente.

Corolario. Dos matrices nilpotentes son semejantes si y sólo si tienen la misma forma canónica de Jordan. Distintas formas canónicas de Jordan dan distintas clases de semejanza.

Una receta para encontrar la forma canónica de Jordan de nilpotentes

La demostración anterior no sólo demuestra la unicidad de la forma canónica de Jordan. Además, nos dice exactamente cómo obtenerla. Para ello:

  1. Calculamos todas las potencias de $A$ hasta $n-1$.
  2. Usando reducción gaussiana (o de otro modo), calculamos el rango de cada una de estas potencias.
  3. Resolvemos el sistema de ecuaciones en variables $x_i$ de la sección anterior.
  4. La forma canónica de Jordan de $A$ tiene $x_i$ bloques de tamaño $i$.

Ejemplo. Consideremos la siguiente matriz en $M_7(\mathbb{R})$: $$C=\begin{pmatrix}-27 & 266 & 1 & -37 & 135 & -125 & 53\\217 & -1563 & 118 & 33 & -1251 & 1020 & 361\\236 & -1784 & 188 & 16 & -1512 & 1234 & 585\\11 & -10 & -25 & 12 & 28 & -29 & -80\\-159 & 1133 & -114 & -98 & 878 & -690 & -232\\197 & -1409 & 88 & -19 & -1151 & 952 & 348\\-230 & 1605 & -179 & -100 & 1316 & -1031 & -440\end{pmatrix}$$

Sus números son muy complicados, sin embargo, nos podemos auxiliar de herramientas computacionales para encontrar sus potencias. Soprendenemente esta es una matriz nilpotente de índice $3$ pues:

$$C^2=\begin{pmatrix}0 & -10209 & -3403 & -6806 & -6806 & 10209 & 0\\0 & 14691 & 4897 & 9794 & 9794 & -14691 & 0\\0 & 2739 & 913 & 1826 & 1826 & -2739 & 0\\0 & 7221 & 2407 & 4814 & 4814 & -7221 & 0\\0 & -14193 & -4731 & -9462 & -9462 & 14193 & 0\\0 & 10956 & 3652 & 7304 & 7304 & -10956 & 0\\0 & -11952 & -3984 & -7968 & -7968 & 11952 & 0\end{pmatrix}$$

y

$$C^3=\begin{pmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\end{pmatrix}.$$

Usando reducción gaussiana, o herramientas computacionales, obtenemos que el rango de $C$ es $4$ y que el rango de $C^2$ es $2$. A partir de $j\geq 3$ obtenemos que $\text{rango}(C^j)=0$. Si quieremos encontrar la forma canónica de Jordan de $C$, necesitamos entonces resolver el siguiente sistema de ecuaciones, que nos dirá cuántos bloques $x_i$ de tamaño $i$ hay:

\begin{align*}
7&= x_1+2x_2+3x_3+4x_4+5x_5+6x_6+7x_7\\
4&=x_2 + 2x_3 + 3x_4+4x_5+5x_6+6x_7\\
2&= x_3 + 2x_4+3x_5+4x_6+5x_7 \\
0&= x_4+2x_5+3x_6+4x_7\\
0&= x_5+2x_6+3x_7\\
0&= x_6+2x_7\\
0&= x_7
\end{align*}

Para resolverlo lo mejor es proceder «de abajo hacia arriba». Las últimas cuatro ecuaciones nos dicen que $x_7=x_6=x_5=x_4=0$. Así, el sistema queda un poco más simple, como:

\begin{align*}
7&= x_1+2x_2+3x_3\\
4&=x_2 + 2x_3\\
2&= x_3.
\end{align*}

De la última igualdad, tenemos $x_3=2$, lo que nos dice que la forma canónica de Jordan tendría dos bloques de tamaño $3$. Sustituyendo en la penúltima igualdad obtenemos que $4=x_2+4$, de donde $x_2=0$. Así, no tendremos ningún bloque de tamaño $2$. Finalmente, sustituyendo ambos valores en la primera igualdad obtenemos que $7=x_1+0+6$. De aquí obtenemos $x_1=1$, así que la forma canónica de Jordan tendrá un bloque de tamaño $1$. En resumen, la forma canónica de Jordan es la matriz $$\begin{pmatrix} J_{0,1} & 0 & 0 \\ 0 & J_{0,3} & 0 \\ 0 & 0 & J_{0,3}\end{pmatrix}.$$ Explícitamente, esta es la siguiente matriz:

$$\begin{pmatrix} 0& 0 & 0 & 0 & 0 & 0 & 0 \\ 0& 0 & 1 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 1 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 1 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 1 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix}.$$

Para verla un poco más «como de bloques» la podemos reescribir de la siguiente manera:

$$\left(\begin{array}{c|ccc|ccc} 0& 0 & 0 & 0 & 0 & 0 & 0 \\ \hline 0& 0 & 1 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 1 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \\ \hline 0& 0 & 0 & 0 & 0 & 1 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 1 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \end{array}\right).$$

$\square$

Más adelante…

Hemos demostrado la existencia y unicidad de la forma canónica de Jordan para matrices nilpotentes. Este es un resultado interesante por sí mismo. Sin embargo, también es un paso intermedio para un resultado más general. En las siguientes entradas hablaremos de una versión más general del teorema de Jordan, para matrices tales que su polinomio característico se descomponga totalmente en el campo en el que estemos trabajando.

Tarea moral

  1. Considera la siguiente matriz: $$M=\begin{pmatrix}11 & 11 & -11 & -11\\-1 & -1 & 1 & 1\\3 & 3 & -3 & -3\\7 & 7 & -7 & -7\end{pmatrix}.$$
    1. Muestra que $M$ es una matriz nilpotente y determina su índice.
    2. ¿Cuál es la forma canónica de Jordan de $M$?
  2. Describe las posibles formas canónicas de Jordan para una matriz nilpotente $A \in M_{5}(F)$ de índice $2$.
  3. Describe las posibles formas canónicas de Jordan para una matriz nilpotente $A \in M_{7}(F)$ de rango $5$.
  4. Encuentra de manera explícita la inversa de la siguiente matriz en $M_n(\mathbb{R})$ y usa esto para dar de manera explícita la solución al sistema de ecuación en las variables $x_i$ que aparece en la entrada: $$\begin{pmatrix} 1 & 2 & 3 & \cdots & n-1 & n \\ 0 & 1 & 2 & \cdots & n-2 & n-1 \\ 0 & 0 & 1 & \cdots & n-3 & n-2 \\ & \vdots & & \ddots & & \vdots\\ 0 & 0 & 0 & \cdots & 1 & 2 \\ 0 & 0 & 0 & \cdots & 0 & 1\end{pmatrix}.$$
  5. Sea $A$ una matriz nilpotente en $M_n(\mathbb{R})$. Muestra que las matrices $A$ y $5A$ son similares entre sí.

Entradas relacionadas

Álgebra Lineal II: Existencia de la forma de Jordan para nilpotentes

Introducción

En la entrada anterior estudiamos de manera un poco más sistemática las matrices y transformaciones lineales nilpotentes. Lo que haremos ahora es enunciar el teorema de la forma canónica de Jordan para matrices nilpotentes. Este es un teorema de existencia y unicidad. En esta entrada demostraremos la parte de la existencia. En la siguiente entrada hablaremos de la unicidad y de cómo encontrar la fórma canónica de Jordan de matrices nilpotentes de manera práctica.

El teorema de Jordan para nilpotentes

El teorema que queremos demostrar tiene dos versiones: la de transformaciones y la matricial. La versión en transformaciones dice lo siguiente.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ y $T:V\to V$ una transformación lineal nilpotente. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques:

$$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

La versión en forma matricial dice lo siguiente.

Teorema. Sea $A$ una matriz nilpotente en $M_n(F)$. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales $A$ es similar a la siguiente matriz de bloques: $$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

A esta matriz de bloques (ya sea para una transformación, o para una matriz) le llamamos la forma canónica de Jordan de $A$.

En vista de que dos matrices son similares si y sólo si representan a la misma trasnformación lineal en distintas bases, entonces ambos teoremas son totalmente equivalentes. Así, basta enfocarnos en demostrar una de las versiones. Haremos esto con la versión para transformaciones lineales.

Trasnformaciones nilpotentes y unos vectores linealmente independientes

En esta sección enunciaremos un primer resultado auxiliar para demostrar la existencia de la forma canónica de Jordan. Veremos que a partir de una transformación lineal nilpotente podemos obtener algunos vectores linealmente independientes.

Proposición. Sea $V$ un espacio vectorial de dimensión finita y $T:V\to V$ una transformación lineal de índice $k$. Sea $v$ un vector tal que $T^{k-1}(v)\neq 0$, el cual existe ya que $T^{k-1}$ no es la transformación lineal cero. Entonces:

  1. Los vectores $v$, $T(v)$, $\ldots$, $T^{k-1}(v)$ son linealmente independientes.
  2. El subespacio $W$ que generan es de dimensión $k$ y es estable bajo $T$.
  3. La transformación $T$ restringida a $W$ en la base $T^{k-1}(v)$, $T^{k-2}(v)$, $\ldots$, $T(v)$, $v$ tiene como matriz al bloque de Jordan $J_{0,k}$.

Demostración. Probemos las afirmaciones una por una. Para empezar, supongamos que para ciertos escalares $\alpha_0,\ldots,\alpha_{k-1}$ tenemos que $$\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v)=0.$$

Vamos a probar inductivamente de $0$ a $k-1$ que $\alpha_k=0$. Para mostrar que $\alpha_0=0$, aplicamos $T^{k-1}$ a la combinación lineal anterior para obtener:

\begin{align*}
0&=\alpha_0T^{k-1}(v)+\alpha_1T^k(v)+\ldots+\alpha_{k-1}T^{2k-2}(v)\\
&=\alpha_0T^{k-1}(v).
\end{align*}

Aquí estamos usando en todos los sumandos, excepto el primero, que $T^k=0$. Como $T^{k-1}(v)\neq 0$, concluimos que $\alpha_0=0$. Suponiendo que ya hemos mostrado $\alpha_0=\ldots=\alpha_l=0$, la combinación lineal con la que empezamos queda como $$\alpha_{l+1}T^{l+1}(v)+\alpha_{l+2}T^{l+2}(v)+\ldots+\alpha_{k-1}T^{k-1}(v)=0.$$ Aplicando $T^{k-l-2}$ y usando un argumento similar al anterior se llega a que $\alpha_{l+1}=0$. Esto muestra que la única combinación lineal de los vectores que da cero es la combinación lineal trivial, así que son linealmente independientes.

De manera inmediata obtenemos entonces que esos $k$ vectores generan un subespacio $W$ de dimensión $k$. Para ver que $W$ es $T$ estable, tomemos un elemento $w$ en $W$, es decir $$w=\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v)$$ para algunos escalares $\alpha_0,\ldots,\alpha_{k-1}$. Debemos ver que $T(w)$ está nuevamente en $W$. Haciendo las cuentas y usando nuevamente que $T^k=0$ obtenemos:

\begin{align*}
T(w)&=T(\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v))\\
&= \alpha_0T(v)+\alpha_1T^2(v)+\ldots+\alpha_{k-2}T^{k-1}(v)+\alpha_{k-1}T(v)\\
&= \alpha_0T(v)+\alpha_1T^2(v)+\ldots+\alpha_{k-2}T^{k-1}(v)\\
\end{align*}

Este vector de nuevo es combinación lineal de los vectores que nos interesan, así que $T(w)$ está en $W$, como queríamos.

La afirmación de la forma matricial es inmediata pues precisamente $T(T^{j}(v))=T^{j+1}(v)$, de donde se lee que las columnas de dicha forma matricial justo son las del bloque de Jordan $J_{0,k}$.

$\square$

Como corolario, el resultado anterior nos dice que el índice de una matriz o una transformación nilpotentes no puede exceder $n$.

Encontrar un subespacio complementario y estable

Ahora veremos otro resultado auxiliar que necesitaremos para demostrar la existencia de la forma canónica de Jordan. A partir de él podemos conseguirnos un «subespacio complementario y estable» que en la prueba de la existencia nos ayudará a proceder inductivamente.

Proposición. Sea $V$ un espacio vectorial de dimensión finita $n$ y $T:V\to V$ una transformación lineal nilpotente de índice $k$. Tomemos $v$ un vector tal que $T^{k-1}(v)\neq 0$. Sea $W$ el subespacio generado por $v,T(v),\ldots,T^{k-1}(v)$. Entonces, existe un subespacio $W’$ estable bajo $T$ y tal que $T=W\oplus W’$.

La principal dificultad para probar esta proposición es una cuestión creativa: debemos saber de dónde sacar el espacio $W’$. Para ello, haremos uso de la transformación transpuesta y de un espacio ortogonal por dualidad. Como recordatorio, si $T:V\to V$ es una transformación lineal, entonces su transformación transpuesta es una transformación lineal $^tT:V^\ast \to V^\ast$ para la cual $^tT(\ell)(u)=\ell(T(u))$ para cualquier forma lineal $\ell$ y cualquier vector $u$ en $V$.

Demostración. Primero, nos enfocamos en construir $W’$. Para ello procedemos como sigue. Como $T^{k-1}(v)\neq 0$, entonces existe una forma lineal $\ell$ tal que $\ell(T^{k-1}(v))\neq 0$. Se puede mostrar que $S:=\text{ }^t T$ también es nilpotente de índice $k$. Por la proposición de la sección anterior, tenemos entonces que $\ell, S(\ell),\ldots,S^{k-1}(\ell)$ son $k$ vectores linealmente independientes en $V^\ast$ y por lo tanto que generan un subespacio $Z$ de dimensión $k$. El espacio $W’$ que propondremos será $Z^\bot$.

Debemos mostrar que:

  1. En efecto $V=W\oplus W’$.
  2. En efecto $W’$ es $T$ estable.

Para la primer parte, usando teoría de espacios ortogonales tenemos que $$\dim(W’)=\dim(Z^\bot)=n-\dim(Z)=n-k,$$ así que los subespacios tienen la dimensión correcta para ser complementarios. Además, si $u\in W\cap W’$, entonces $u$ es combinación lineal de $v, T(v),\ldots, T^{k-1}(v),$ digamos $$u=\alpha_0v+\ldots+\alpha_{k-1}T^{k-1}(v)$$ y se anula por $\ell, S(\ell),\ldots,S^{k-1}(\ell)$, lo que quiere decir que se anula por $\ell, \ell\circ T, \ldots, \ell \circ T^{k-1}$. Esto permite probar iterativamente que $\alpha_0=\ldots=\alpha_{k-1}=0$, de modo que $u=0$. Con esto, $W$ y $W’$ son de intersección trivial y dimensiones complementarias, lo cual basta para que $V=W\oplus W’$.

Para terminar, debemos ver que $W’$ es $T$ estable. Tomemos un $u$ en $W’$, es decir, tal que se anula por $\ell, \ell\circ T, \ldots, \ell \circ T^{k-1}$. Al aplicar $T$, tenemos que $T(u)$ también se anula por todas estas transformaciones. Esto se debe a que para $\ell \circ T^j$ con $j\leq k-2$ se anula ya que $\ell\circ T^j(T(u))=\ell\circ T^{j+1}(u)=0$ por cómo tomamos $u$ y para $\ell \circ T^{k-1}$ se anula pues $T$ es nilpotente de índice $k$.

$\square$

Existencia de forma canónica de Jordan para nilpotentes

Demostración (existencia de forma canónica de Jordan para nilpotentes). Estamos listos para probar la existencia de la forma canónica de Jordan para una transformación lineal nilpotente $T:V\to V$ con $V$ un espacio vectorial de dimensión finita $n$. Procederemos por inducción en la dimensión.

Si $T$ es de índice $n$, entonces $v,\ldots,T^{n-1}(v)$ es una base de $V$ y la forma matricial de $T$ es el bloque de Jordan $J_{0,n}$, en cuyo caso terminamos.

De otra forma, el índice es un número $k<n$. Entonces, $v,\ldots,T^{k-1}(v)$ generan un subespacio estable $W$ de dimensión $k$. Por la proposición anterior podemos encontrar un subespacio complementario $W’$ de dimensión $n-k<n$ y estable bajo $T$. Como la restricción de $T$ a $W’$ tiene codominio $W’$, es nilpotente y $\dim(W)<\dim(V)$, entonces $W’$ tiene una base $\beta$ bajo la cual la restricción de $T$ a $W’$ tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo $J_{0,k_j}$. Al completar $\beta$ con $v,\ldots,T^{k-1}(v)$, obtenemos una base de $V$ en la cual $T$ tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo $J_{0,k_j}$ (que vienen de la hipótesis inductiva) y un bloque de Jordan $J_{0,k}$. Salvo quizás un reordenamiento de la base para ordenar los $k_j$ y $k$, obtenemos exactamente lo buscado.

$\square$

Más adelante…

Ya demostramos una parte fundamental del teorema que nos interesa: la existencia de la forma canónica de Jordan para transformaciones (y matrices) nilpotentes. Nos falta otra parte muy importante: la de la unicidad. Las demostraciones de unicidad típicamente son sencillas, pero en este caso no es así. Para decir de manera explícita cuál es la forma canónica de Jordan de una transformación (o matriz) nilpotente, deberemos hacer un análisis cuidadoso del rango de las potencias de la transformación (o matriz). Veremos esto en las siugientes entradas.

Tarea moral

  1. Usando los resultados de esta entrada, muestra que el índice de una transformación (o matriz) nilpotente en un espacio vectorial de dimensión $n$ (resp. en $M_n(F)$) es menor o igual a $n$. Esto nos da una receta para saber si una transformación es nilpotente o no: basta con hacer las potencias hasta $n$ y si ninguna es la transformación cero, entonces la matriz no es nilpotente.
  2. Sea $V$ un espacio vectorial de dimensión finita y $T:V\to V$ una transformación lineal nilpotente de índice $k$. Demuestra que $^tT$ también es una transformación lineal nilpotente de índice $k$. ¿Cuál sería el resultado análogo para matrices?
  3. Sea $V$ un espacio vectorial de dimensión finita y $T:V \to V$ una transformación lineal tal que para cualquier $v$ en $V$ existe algún entero $n$ tal que $T^n(v)=0$. Estos $n$ pueden ser distintos para distintos $v$. Muestra que $T$ es nilpotente.
  4. Considera el subespacio $V$ de polinomios reales con grado a lo más $4$ y $D:V\to V$ la transformación lineal derivar. Da, de manera explícita, espacios $W$ y $W’$ como en las proposición de encontrar el subespacio complementario estable.
  5. Hay varios detalles que quedaron pendientes en las demostraciones de esta entrada. Revisa la entrada para encontrarlos y da las demostraciones correspondientes.

Entradas relacionadas

Ecuaciones Diferenciales I: Ecuaciones diferenciales como modelos matemáticos

Ninguna investigación humana puede ser llamada verdadera
ciencia si no puede ser demostrada matemáticamente.
– Leonardo da Vinci

Introducción

En la entrada anterior estudiamos algunas propiedades de las soluciones de las ecuaciones diferenciales ordinarias, en particular vimos que una ecuación diferencial puede tener infinitas soluciones y el intervalo de solución puede ser cualquiera en el que la función esté definida, sea derivable $n$ veces y cuyas derivadas sean continuas. En esta entrada estudiaremos cómo obtener una solución particular de una solución general dados unos valores prescritos conocidos como condiciones iniciales y veremos la importancia de saber elegir el intervalo de solución en estos casos particulares.

En esta entrada también estudiaremos algunos problemas del mundo real que involucran ecuaciones diferenciales, a través de estos problemas introduciremos la idea de ecuación diferencial como modelo matemático. Los problemas que estudiaremos tienen el objetivo de presentar el análisis que debemos hacer al intentar modelar un problema usando ecuaciones diferenciales y no con el propósito de resolver el problema mismo, pues resolverlo significa determinar las soluciones de las ecuaciones diferenciales que surjan y hasta este momento aún no hemos visto métodos de resolución.

Problema con valores iniciales

De manera resumida podemos decir que un problema con valores iniciales es la ecuación diferencial acompañada de condiciones iniciales.

En el caso de ecuaciones diferenciales de primer y segundo orden tendríamos el siguiente PVI respectivamente:

  • Resolver $\dfrac{dy}{dx} = f(x, y)$ $\hspace{1.2cm}$ sujeto a $\hspace{0.5cm}$ $y(x_{0}) = y_{0}$
  • Resolver $\dfrac{d^{2}y}{dx^{2}} = f(x, y, y^{\prime})$ $\hspace{0.5cm}$ sujeto a $\hspace{0.5cm}$ $y(x_{0}) = y_{0}$ $\hspace{0.3cm}$ y $\hspace{0.3cm}$ $y^{\prime}(x_{0}) = y_{1}$

Geométricamente un PVI de primer orden significa que estamos buscando una solución $y(x)$ de la ecuación diferencial en un intervalo $\delta$ que contenga a $x_{0}$ tal que su gráfica pase por el punto $(x_{0}, y_{0})$.

En el caso del PVI de segundo orden estamos buscando una solución $y(x)$ de la ecuación diferencial en un intervalo $\delta$ que contenga a $x_{0}$ de tal manera que su gráfica no sólo pase por el punto $(x_{0}, y_{0})$, sino que también la pendiente a la curva en ese punto tenga como valor $m = y_{1}$.

En la entrada anterior vimos que las soluciones generales tienen constantes arbitrarias, las condiciones iniciales de un PVI nos permitirá determinar el valor de dichas contantes para obtener una solución particular, pues con frecuencia resolver un problema con valores iniciales de $n$-ésimo orden implica primero determinar una familia $n$-paramétrica de soluciones de la ecuación diferencial dada y después usando las $n$ condiciones iniciales en $x_{0}$ determinar los valores numéricos de las $n$ constantes de la familia. Es importante mencionar que la solución particular obtenida debe estar definida en algún intervalo $\delta$ que contenga al punto inicial $x_{0}$. Veamos un ejemplo.

Ejemplo: Considerar la solución general

$$y(x) = c_{1} e^{2x} + c_{2} e^{-x} + c_{3}e^{3x}$$

de la ecuación diferencial

$$y^{\prime \prime \prime} -4 y^{\prime \prime} + y^{\prime} +6y = 0$$

(Más adelante en el curso estudiaremos la forma de obtener este tipo de soluciones). Encontrar la solución particular dadas las siguientes condiciones iniciales:

$$y(0) = 4, \hspace{1cm} y^{\prime}(0) = -1, \hspace{1cm} y \hspace{1cm} y^{\prime \prime}(0) = 0$$

Solución: Como tarea moral verifica que en efecto la función dada es solución de la ecuación diferencial, por ahora asumiremos que lo es.

Tenemos un problema con valores iniciales, así que la solución está sujeta a las condiciones iniciales, lo que debemos hacer para obtener la solución particular no es más que aplicar las condiciones iniciales. En este caso $x_{0} = 0$, la primera condición inicial nos dice que se debe satisfacer $y(x_{0}) = y(0) = 4$, entonces evaluemos la solución en $x_{0} = 0$ y el resultado lo igualamos a $4$.

\begin{align*}
y(0) &= c_{1} e^{2(0)} + c_{2} e^{-0} + c_{3}e^{3(0)} \\
&= c_{1} + c_{2} + c_{3} \\
&= 4
\end{align*}

El resultado de aplicar la primera condición inicial es

$$y(0) = c_{1} + c_{2} + c_{3} = 4$$

Para aplicar la segunda condición inicial necesitamos la derivada de la solución general, dicha función es

$$y^{\prime}(x) = 2c_{1}e^{2x} -c_{2}e^{-x} + 3c_{3}e^{3x}$$

Apliquemos la segunda condición inicial, $y^{\prime}(0) = -1$.

\begin{align*}
y^{\prime}(0) &= 2c_{1} e^{2(0)} -c_{2} e^{-0} + 3c_{3}e^{3(0)} \\
&= 2c_{1} -c_{2} + 3c_{3} \\ &
= -1
\end{align*}

El resultado de aplicar la segunda condición inicial es

$$y^{\prime}(0) = 2c_{1} -c_{2} + 3c_{3} = -1$$

Finalmente, para aplicar la tercera condición inicial necesitamos la segunda derivada de la solución general, esto es

$$y^{\prime \prime}(x) = 4c_{1}e^{2x} + c_{2}e^{-x} + 9c_{3}e^{3x}$$

Apliquemos la condición inicial $y^{\prime \prime}(0) = 0$.

\begin{align*}
y^{\prime \prime}(0) &= 4c_{1} e^{2(0)} + c_{2} e^{-0} + 9c_{3}e^{3(0)} \\
&= 4c_{1} + c_{2} + 9 c_{3} \\
&= 0
\end{align*}

El resultado de aplicar la tercera condición inicial es

$$y^{\prime \prime}(0) = 4c_{1} + c_{2} + 9c_{3} = 0$$

De las ecuaciones obtenidas de aplicar las condiciones iniciales formamos el siguiente sistema de ecuaciones.

\begin{align*}
c_{1} + c_{2} + c_{3} &= 4 \\
2c_{1} -c_{2} + 3c_{3} &= -1 \\
4c_{1} + c_{2} + 9c_{3} &= 0
\end{align*}

Intenta resolver el sistema de ecuaciones usando el método que gustes. Una vez que lo resuelvas notarás que los valores para las incógnitas son:

$$c_{1} = \dfrac{10}{3}, \hspace{1cm} c_{2} = \dfrac{29}{12} \hspace{1cm} y \hspace{1cm} c_{3} = -\dfrac{7}{4}$$

Sólo basta sustituir estos valores en la solución general de la ecuación diferencial para obtener la solución particular. Por lo tanto, la solución particular sujeta a las condiciones iniciales es:

$$y(x) = \dfrac{10}{3} e^{2x} + \dfrac{29}{12} e^{-x} -\dfrac{7}{4}e^{3x}$$

$\square$

En la entrada anterior vimos que el intervalo de solución $\delta$ no es necesariamente el dominio de la función, sino que podemos tomar cualquier intervalo en el que la solución es derivable $n$ veces con derivadas continuas en ese intervalo, en el caso de los problemas con valores iniciales es necesario que el punto $x_{0}$ pertenezca al intervalo de solución $\delta$, esto en ocasiones establecerá un intervalo limitado para la solución, así que debemos tener cuidado con los valores en los que la solución particular está definida. Para visualizar este hecho retomemos el ejemplo visto en la entrada anterior donde mostramos que la función

$$y(x) = \dfrac{1}{4 -x^{2}}$$

es solución de la ecuación diferencial

$$\dfrac{dy}{dx} = 2xy^{2}$$

Realicemos este mismo ejercicio, pero ahora visto como un problema de valores iniciales y veamos la importancia de elegir correctamente el intervalo solución.

Ejemplo: La ecuación diferencial

$$\dfrac{dy}{dx} = 2xy^{2}$$

tiene como solución general a la función

$$y(x) = -\dfrac{1}{x^{2} + c_{1}}$$

Determinar la solución particular dada la condición inicial

$$y(0) = \dfrac{1}{4}$$

Solución: La solución general es

$$y(x) = -\dfrac{1}{x^{2} + c_{1}}$$

Aplicando la condición inicial obtenemos lo siguiente.

$$y(0) = -\dfrac{1}{0^{2} + c_{1}} = -\dfrac{1}{c_{1}} = \dfrac{1}{4}$$

De la última igualdad obtenemos $c_{1} = -4$, sustituyendo en la solución general se tiene

\begin{align*}
y(x) = -\dfrac{1}{x^{2} + c_{1}} = -\dfrac{1}{x^{2} -4} = \dfrac{1}{4 -x^{2}}
\end{align*}

Así que la solución particular

$$y(x) = \dfrac{1}{4 -x^{2}}$$

corresponde a un PVI de $\dfrac{dy}{dx} = 2xy^{2}$ con la condición inicial $y(0) = \dfrac{1}{4}$. En la entrada anterior mostramos la gráfica de esta función.

Gráfica de la función $y(x) = \dfrac{1}{4 -x^{2}}$.

Pero ahora el intervalo de solución debe ser aquel en el que $x_{0} = 0 \in \delta$. El intervalo más grande que puede tomar la solución particular es $\delta = (-2, 2)$, pues es el intervalo donde está el punto $x_{0} = 0$ y donde la solución es continua. ¡La condición inicial ha restringido el intervalo de solución!

Punto que satisface la condición inicial $y(0) = \dfrac{1}{4}$.

$\square$

Con este ejemplo vemos que las condiciones iniciales establecen un intervalo de solución especifico, en ocasiones (como en el primer ejemplo visto en esta entrada) no habrá mayor problema con el intervalo si la función es derivable y por tanto continua es todo su dominio. Es recomendable primero determinar en donde la solución está definida (encontrar su dominio) y posteriormente revisar si se trata sólo de una solución general o si hay condiciones iniciales que determinarán una solución particular.

Existencia de una solución única

Al trabajar con problemas con valores iniciales debemos hacernos dos preguntas importantes. ¿Existe la solución del problema? y si existe la solución, ¿es única?. Más adelante estudiaremos las ecuaciones diferenciales de primer orden y retomaremos con mayor profundidad este tema, por ahora sólo vamos a enunciar un teorema que da las condiciones suficientes para garantizar la existencia y unicidad de una solución de un PVI de primer orden.

Dicho de otra manera, las condiciones para la existencia de soluciones son:

  • Continuidad de $f(x, y)$ en $U$.
  • Acotamiento de $f(x, y)$ por $U$.

Y las condiciones para la unicidad son:

  • Continuidad de $f(x, y)$ y $\dfrac{\partial f}{\partial y}$ en $U$.
  • Acotamiento de $f(x, y)$ y $\dfrac{\partial f}{\partial y}$ por $U$.

Estas condiciones son suficientes, pero no necesarias, puede existir una solución única que satisface $y(x_{0}) = y_{0}$, pero que no cumple con alguna de las condiciones anteriores o que no cumple con ninguna.

Problemas que se modelan con ecuaciones diferenciales

Las matemáticas permiten modelar muchos de los fenómenos que ocurren en en mundo real, a esta descripción matemática de un sistema de fenómenos se le denomina modelo matemático y se construyen con la intención de representar algunas características del fenómeno para después hacer predicciones. Es cierto que esto puede ser un proceso muy difícil ya que implica que las hipótesis que hagamos deben ser descritas en fórmulas muy precisas que nos permitan predecir lo que ocurrirá. Una vez construido un modelo, las predicciones se deben comparar con los datos del sistema, dependerá de la compatibilidad entre las hipótesis y las predicciones lo que defina si debemos confiar en el modelo o debemos mejorar nuestras suposiciones.

En el caso de las ecuaciones diferenciales, éstas nos permiten modelar sistemas que evolucionan con el tiempo o sistemas que implican una razón de cambio de una o más variables. En este curso consideraremos a un modelo matemático como una ecuación diferencial o un sistema de ecuaciones diferenciales que describen el comportamiento de un fenómeno que estemos estudiando. Una vez que hemos formulado un modelo matemático surge el reto de resolver las ecuaciones diferenciales para saber si la solución es consistente con los hechos conocidos acerca del comportamiento del sistema y si no lo es debemos repetir un proceso de modelado en el que vamos ajustando las hipótesis, identificamos nuevas variables o incluso incluimos leyes empíricas que se puedan aplicar al sistema.

Hasta ahora ya hemos estudiado algunas ecuaciones diferenciales, sabemos cómo verificar cuando una función es solución y hemos estudiado algunas de sus propiedades. Para concluir esta entrada vamos a analizar algunos problemas del mundo real que son modelados con ecuaciones diferenciales. En esta parte nos enfocaremos en la forma en la que surgen las ecuaciones dado un problema y no nos preocuparemos por resolverlas, pues esto es algo que aún desconocemos.

Propagación de una enfermedad contagiosa

Recientemente hemos tenido la experiencia de observar cómo es que una enfermedad contagiosa se puede propagar en la población. En términos muy generales intentemos modelar la propagación de una enfermedad contagiosa a través de una comunidad de personas que han estado en contacto con personas enfermas.

Definamos a $x(t)$ como el número de personas que están enfermos en un cierto tiempo $t$ y sea $y(t)$ el número de personas que aún no han sido expuestas al contagio en ese momento $t$. Es claro que la razón $\dfrac{dx}{dt}$ con la que se propaga la enfermedad debe ser proporcional al número de encuentros o interacciones entre los dos grupos de personas. Si suponemos que el número de interacciones es conjuntamente proporcional a $x(t)$ y $y(t)$, entonces un modelo puede ser

$$\dfrac{dx}{dt} = cxy \label{4} \tag{4}$$

donde $c$ es la constante de proporcionalidad. Consideremos una comunidad con una población fija de $n$ personas, si inicialmente nadie tiene la enfermedad entonces $y = n$, pero si a esa comunidad llega una persona enferma $x = 1$, entonces podemos construir la siguiente relación.

$$x + y = n + 1 \label{5} \tag{5}$$

de donde podemos despejar a $y$ como

$$y = n + 1 -x$$

y sustituir en el modelo.

$$\dfrac{dx}{dt} = cx(n + 1 -x) \label{6} \tag{6}$$

Esta última ecuación sería el modelo que describe la propagación de la enfermedad a través del tiempo. Una condición inicial sería que en el momento en el que llego la persona enferma a la comunidad comenzó a propagarse la enfermedad, esto es, $x(0) = 1$.

$\square$

Ley de enfriamiento de Newton

La ley de enfriamiento de Newton establece que la razón de cambio de la temperatura $T(t)$ de un cuerpo con respecto al tiempo $t$ es proporcional a la diferencia entre la temperatura del cuerpo $T(t)$ y la temperatura del medio ambiente $T_{m}$. Esta ley puede ser modelada con la siguiente ecuación diferencial.

$$\dfrac{dT}{dt} = -k(T -T_{m}) \label{7} \tag{7}$$

donde $k > 0$ es la contante de proporcionalidad y $T_{m}$ es la temperatura del medio ambiente considerada también una constante. Si podemos resolver esta ecuación encontraríamos una función que podría predecir la temperatura del cuerpo en cualquier tiempo $t$.

Sin embargo, sin resolver la ecuación podemos notar que si $T > T_{m}$, entonces $\dfrac{dT}{dt} < 0$, lo que significa que el cuerpo se estaría enfriando, pues la función $T(t)$ sería una función decreciente mientras avanza el tiempo. Por otro lado, si $T < T_{m}$, entonces $\dfrac{dT}{dt} > 0$, es decir la función $T(t)$ sería una función creciente en el tiempo lo que físicamente significa que el cuerpo se esta calentando.

$\square$

Cuerpos en caída

Consideremos un objeto que es lanzado desde lo alto de un edificio, el problema que queremos analizar es hallar la forma de conocer la posición del objeto con respecto al suelo en algún tiempo $t$ después de ser lanzado y antes de tocar el suelo. Por convención consideremos que la dirección hacía arriba es positiva.

Analicemos la situación. Consideremos un edificio de altura $r_{0}$, desde esa altura se lanza un objeto de masa $m$, la velocidad inicial con la que es lanzado es $v_{0}$. El objeto al caer esta sometido a la fuerza de gravedad, la segunda ley de Newton nos dice que cuando la fuerza neta $F$ que actúa sobre un cuerpo no es cero, entonces la fuerza neta es proporcional a su aceleración $a$, estas cantidades están relacionadas por la ecuación

$$F = ma \label{8} \tag{8}$$

con $m$ la masa del cuerpo, si el objeto esta en caída la fuerza neta será su peso.

$$F = -W \label{9} \tag{9}$$

El signo menos es porque el peso del objeto es una fuerza dirigida hacia abajo. Recordando que el peso está dado como

$$W = mg \label{10} \tag{10}$$

donde $m$ es la masa del objeto y $g$ es la aceleración debido a la gravedad de la tierra, usando entonces la segunda ley de Newton podemos establecer que

$$F = ma = -mg = -W$$

es decir $a = -g$. Recordemos que la aceleración de un objeto corresponde a la tasa de cambio de la velocidad y que a su vez la velocidad es la tasa de cambio de la posición del objeto, es decir, la aceleración es la segunda derivada de la posición con respecto al tiempo, si $r(t)$ es la posición del objeto, entonces

$$a(t) = \dfrac{d^{2}r}{dt^{2}} = \ddot{r}(t) \label{11} \tag{11}$$

Por lo tanto, la ecuación diferencial que modela nuestro problema es

$$\dfrac{d^{2}r}{dt^{2}} = -g \label{12} \tag{12}$$

Las condiciones iniciales son claras, al tiempo $t = 0$ el objeto se encuentra en la posición mas alta del edificio es decir $r(0) = r_{0}$ y la velocidad con la que es lanzada al tiempo $t = 0$ es $v(0) = \dot{r}(0) = v_{0}$. Resolviendo la ecuación diferencial y obteniendo la solución particular podremos predecir la posición del objeto con respecto al suelo a cualquier tiempo $t$ antes de caer por completo.

$\square$

Modelo logístico de la población

Este es uno de los modelos más estudiados y representativos al estudiar ecuaciones diferenciales. Lo que se quiere estudiar es el crecimiento de una población, queremos crear un modelo que prediga el crecimiento que puede haber en una población en función de su entorno y los recursos limitados a los que están sujetos. Para comenzar con este estudio se pueden considerar las siguientes hipótesis.

  • Si la población es pequeña, la tasa de crecimiento de la población es proporcional a su tamaño.
  • Si la población es demasiado grande para ser soportada por su entorno y recursos, la población disminuirá, en este caso la tasa de crecimiento será negativa.

Las variables involucradas en este problema son las siguientes:

Por supuesto el tiempo $t$ es la variable independiente en la que queremos predecir. Otra variable es la población $P$, esta variable es dependiente del tiempo $P = P(t)$, $k$ será el parámetro que corresponde a la razón de crecimiento en el caso de poblaciones pequeñas y $N$ será otro parámetro que establece cuando la población comienza a ser demasiado grande. El parámetro $N$ se conoce como capacidad de soporte del entorno. De acuerdo a las hipótesis anteriores, estamos suponiendo que $P(t)$ crece si $P(t) < N$ y decrece si $P(t) > N$. Ahora que conocemos las variables que estarán presente en el modelo, matemáticamente podemos escribir a las hipótesis como:

  • $\dfrac{dP}{dt} = kP$ $\hspace{0.5cm}$ si $P$ es pequeña.
  • $\dfrac{dP}{dt} < 0$ $\hspace{0.8cm}$ si $P$ es grande, tal que $P > N$

Queremos una expresión (ecuación diferencial) que involucre ambas hipótesis. Supongamos que la ecuación que buscamos es de la forma

$$\dfrac{dP}{dt} = k \alpha P \label{13} \tag{13}$$

Donde $\alpha$ es una función que debe acoplarse a las hipótesis. Para que satisfaga la primea hipótesis debe ocurrir que $\alpha$ sea cercano a $1$ cuando $P$ es pequeño y que $\alpha < 0$ cuando $P > N$. La expresión más simple que satisface esto es

$$\alpha = 1 -\dfrac{P}{N} \label{14} \tag{14}$$

Podemos notar que si $P = 0$, entonces $\alpha = 1$ y si $P > N$, entonces $\alpha < 0$. Por lo tanto, la ecuación diferencial que describe esta situación es:

$$\dfrac{dP}{dt} = k \left(1 -\dfrac{P}{N}\right) P \label{15} \tag{15}$$

Éste es el modelo logístico de la población con velocidad de crecimiento $k$ y capacidad de soporte $N$. Como podemos notar es una ecuación diferencial no lineal y su solución la analizáremos con detalle más adelante en el curso.

$\square$

Sistemas Depredador – Presa

Para concluir estudiemos otro de los modelos más estudiados en ecuaciones diferenciales, el modelo depredador – presa. En el mundo ninguna especie vive aislada y sus interacciones pueden proporcionar algunos de los modelos más interesantes por estudiar. El problema que analizaremos es en el que una especie se come a otra, con fines ilustrativos consideremos a la especie depredador como zorros y a la especie presa como conejos. Llamemos $Z(t)$ a la variable dependiente que describe el número de zorros que hay en una cierta región y sea $C(t)$ otra variable dependiente que describe el número de conejos que hay en esa misma región, ambas funciones son dependientes del tiempo $t$. Nuestras hipótesis tienen que ser tales que describan el aumento o disminución de ambas poblaciones de acuerdo a las interacciones que hay entre zorros y conejos, es claro que si hay muchos conejos los zorros tendrán alimento y su población crecerá, mientras que la de conejos disminuirá y por otro lado, si hay pocos conejos la población de zorros disminuirá (morirán por falta de alimento), mientras que la de conejos aumentará. Las hipótesis que consideraremos son las siguientes:

  • Si no hay zorros presentes, los conejos se reproducen a una tasa proporcional a su población y no les afecta la sobrepoblación.
  • Los zorros se comen a los conejos y la razón a la que los conejos son devorados es proporcional a la tasa a la que los zorros y conejos interactúan.
  • Sin conejos que comer, la población de zorros disminuirá a una tasa proporcional a ella misma.
  • La tasa de nacimientos de los zorros crece en proporción al número de conejos comidos por zorros que, por la segunda hipótesis, es proporcional a la tasa a la que los zorros y conejos interactúan.

Las variables que tenemos hasta ahora son el tiempo $t$ y las poblaciones $Z(t)$ y $C(t)$, para satisfacer las hipótesis necesitamos de parámetros que las modelen. Los parámetros que consideraremos son los siguientes:

  • $a$ es el coeficiente de la tasa de crecimiento de conejos.
  • $b$ es la constante de proporcionalidad que mide el número de interacciones conejos-zorros en las que el conejo es devorado.
  • $c$ es el coeficiente de la tasa de muertes de zorros.
  • $d$ es la constante de proporcionalidad que mide el beneficio a la población de zorros de un conejo devorado.

Tomaremos la convención de que todos estos parámetros son positivos. En este caso particular tenemos dos variables dependientes del tiempo por lo tanto será necesario encontrar dos ecuaciones que modelen al sistema. Para que sea más intuitivo entender el modelo vamos a mostrar las ecuaciones que modelan el sistema y veamos por qué son así.

\begin{align*}
\dfrac{dC}{dt} &= aC -bCZ \\
\dfrac{dZ}{dt} &= -cZ + dCZ \label{16} \tag{16}
\end{align*}

La primer hipótesis nos habla de una relación proporcional en el crecimiento de la población de conejos cuando no hay zorros presentes, de ahí el término $aC$ de la primer ecuación, lo mismo ocurre con la tercera hipótesis, pero en este caso se trata de un decremento de población de zorros tras la falta de conejos, por ello el signo menos en el término $-cZ$ de la segunda ecuación. Por otro lado, la segunda y cuarta hipótesis nos habla de una interacción entre los zorros y los conejos, esta interacción puede ser modelada con el producto $CZ$, con este producto hacemos que la interacción aumente si $C$ o $Z$ aumentan, pero desaparece si $C = 0$ o $Z = 0$, así en el caso de la segunda hipótesis los conejos son devorados de manera proporcional a la interacción entre zorros y conejos, por ello agregamos el término $-bCZ$ en la primer ecuación, el signo menos indica que el número de conejos debe disminuir, pues están siendo devorados, así mismo, la cuarta hipótesis nos habla de un crecimiento en el número de zorros al comer conejos, esta interacción es modelada con el término $dCZ$, en este caso es positivo ya que los zorros están aumentando en número. Este análisis es lo que le da sentido al modelo (\ref{16}) que hemos creado.

Algo interesante que notamos es que ahora tenemos dos ecuaciones diferenciales que modelan el fenómeno. Cuando hay dos o más ecuaciones diferenciales decimos que es un sistema de ecuaciones diferenciales, en este caso este sistema de ecuaciones lo llamamos sistema de primer orden de ecuaciones diferenciales ordinarias, se dice también que el sistema es acoplado porque las tasas de cambio $\dfrac{dC}{dt}$ y $\dfrac{dZ}{dt}$ dependen tanto de $C$ como de $Z$. Los sistemas de ecuaciones diferenciales será un tema que estudiaremos en la tercera unidad del curso.

Una solución al modelo que hemos construido consiste en encontrar un par de funciones $C(t)$ y $Z(t)$ que describan las poblaciones de conejos y zorros como funciones del tiempo. Como el sistema es acoplado, no podemos determinar cada una de esas funciones de forma aislada, sino que debemos resolver ambas ecuaciones diferenciales de forma simultánea, sin embargo en este caso no es posible determinar de modo explícito formulas para $C(t)$ y $Z(t)$, no pueden ser expresadas en términos de funciones conocidas tales como polinomios, senos, cosenos, exponenciales, etcétera. Más adelante veremos que las funciones $C(t)$ y $Z(t)$ existen, pero entonces, ¿cómo conocerlas?. En la siguiente entrada estudiaremos un método cualitativo de las ecuaciones diferenciales que puede ser un método que nos ayude en estos casos, por ejemplo.

$\square$

Por supuesto estos son sólo algunos problemas ilustrativos en los que las ecuaciones diferenciales modelan algún fenómeno natural, pero la cantidad de fenómenos que involucran ecuaciones diferenciales son enormes y un tanto el objetivo es que conforme vayamos aprendiendo seamos capaces de construir nuestros propios modelos sobre algún fenómeno que observemos a nuestro alrededor.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  1. Dada la ecuación diferencial y su solución general, verificar que la función $y(x)$ es solución, determinar la solución particular dadas las condiciones iniciales y determinar el intervalo de solución $\delta$ en donde puede estar definida dicha solución.
  • $\dfrac{dy}{dx} = y^{2}, \hspace{1cm} y(x) = \dfrac{1}{c_{1} -x}, \hspace{1cm} y(1) = 2$.
  • $\dfrac{dy}{dx} + y = 0, \hspace{1cm} y(x) = c_{1}e^{-x}, \hspace{1cm} y(0) = 2$.
  • $\dfrac{d^{2}y}{dx^{2}} + y = 0, \hspace{1cm} y(x) = c_{1} \cos(x) + c_{2} \sin(x), \hspace{1cm} y(0) = -1 \hspace{0.5cm} y \hspace{0.5cm} y^{\prime}(0) = 8$.
  1. Considerar el modelo de población

    $\dfrac{dP}{dt} = 0.4 P \left( 1 -\dfrac{P}{230} \right)$

    donde $P(t)$ es la población en el tiempo $t$.
  • ¿Para qué valores de $P$ está en equilibrio la población?.
  • ¿Para qué valores de $P$ está creciendo la población?.
  • ¿Para qué valores de $P$ está decreciendo la población?.
  1. El sistema

    $\dfrac{dx}{dt} = ax -by\sqrt{x}$
    $\dfrac{dy}{dt} = cy\sqrt{x}$

    ha sido propuesto como un modelo para un sistema depredador – presa de dos especies particulares de microorganismos (con $a$, $b$ y $c$ parámetros positivos).
  • ¿Qué variable, $x(t)$ o $y(t)$, representa a la población depredadora? y ¿qué variable representa a la población presa?.
  • ¿Qué le pasa a la población depredadora si la presa se extingue?.

Más adelante…

Más adelante aprenderemos a resolver ecuaciones diferenciales ordinarias de primer orden de forma analítica, una vez que estemos listos puede ser conveniente regresar a esta entrada e intentar resolver las ecuaciones diferenciales que modelan cada uno de los problemas vistos para extrapolar en los resultados.

Pero antes de estudiar métodos analíticos estudiaremos un método geométrico o mejor conocido como método cualitativo de las ecuaciones diferenciales que nos permitirá describir las soluciones sin conocer explícitamente la forma analítica de las funciones solución.

Entradas relacionadas

Álgebra Superior I: Cuantificadores existenciales y universales

Introducción

Hasta ahora hemos visto proposiciones y sus conectores. Por ello, ya podemos decir cómo se manejan las proposiciones al combinarlas, al tener un valor de verdad dado o qué significa que dos proposiciones sean equivalentes.

Sin embargo, hasta ahora hemos trabajado con cierto rigor los objetos a los que nos referimos dentro de una proposición. Por ejemplo cuando decimos la proposición «Este número es impar» puede que sea o no verdadera, pero esto depende de una cosa: el contexto. ¿A qué número nos estamos refiriendo? Podríamos estar en la siguiente conversación: «Hay números distintos a los múltiplos de 2, por ejemplo el 3. Este número es impar. » A esto último, estando en contexto, ya le podríamos asociar un valor de verdad.

En general esto no es así. Podemos ir variando a qué número nos referimos. En ocasiones las proposiciones tienen una variable y, dependiendo el valor de esa variable, cambian su significado o su valor de verdad. En esta entrada formalizamos estas ideas y hablamos de cuantificadores, que nos permitirán «recorrer» todos los valores posibles de una variable.

Términos variables

Volvamos a nuestro ejemplo. Al tomar la proposición $P$ «el número es impar», podríamos referirnos al $1$, $2$, $3$, $80$ o $20,000$. Así, es más conveniente pensar en que la proposición depende de una variable como sigue:

$P(\text{el número})$ = «$\text{el número}$ es impar».

Visto de esta manera, $P(2)$ es la proposición «$2$ es impar». En general $P(x)$ es la proposición «$x$ es impar» y esta hace referencia a que el número es una variable que puede tomar distintos valores «permitidos». Observa que en este caso no tendría sentido decir si $P(\text{azul})$ es verdadero o falso. A este tipo de proposiciones que tienen una variable (o más), se les llama predicados o esquemas proposicionales. La palabra «esquema» viene del hecho de que podríamos estar refiriéndonos a distintas «cosas» dependiendo del valor que tome nuestra variable.

¿Notas que tenemos que ponernos de acuerdo sobre cuál es el contexto sobre el que estamos hablando al momento de asignarle un valor a nuestra variable? Esto debido a que no podríamos decir que «azul es impar» o «la luna es impar». A este «conjunto» dentro del cual pueden tomar valores nuestras variables le llamamos universo de discurso. Aunque suena algo sofisticado, puedes pensarlo como el contexto al que nos estamos acoplando en el sentido del esquema proposicional.

Es muy importante siempre tener claro el universo de discurso de proposiciones con variables. No será lo mismo estar hablando de número pares, que de números enteros. Sabemos que todos los números pares no son impares. Mientras que algunos números enteros son impares. Estas palabras enfatizadas son las que nos van a permitir hablar más sobre cómo es nuestro universo de discurso. No es lo mismo que solo un objeto del universo cumpla un predicado (tenga valor de verdad verdadero) a que todos los objetos de nuestro universo las cumplan.

Cuantificador «para todo»

Introducimos ahora la idea de cuantificadores. Estas son palabras o ideas que nos ayudarán a identificar cuándo se cumplen los predicados o esquemas proposicionales. Por ejemplo, supongamos que dentro de nuestro universo de discurso, todo posible valor de la variable $x$ cumple el predicado $P(x)$. En este caso diremos «para todo $x$ en nuestro universo de discurso, se cumple $P(x)$». Podemos decir simplemente «para todo $x$, $P(x)$, pero es muy importante que el universo de discurso sea claro.

Veamos un ejemplo. Sabemos que todo número par es múltiplo de $2$. En el caso en que nuestro universo de discurso sean los números pares y tengamos al predicado

$P(x)$=$x$ es múltiplo de $2$

podremos decir «para todo $x$, $P(x)$», pues en cualquier asignación de la variable que consideremos en nuestro universo de discurso, se cumplirá el predicado.

Este cuantificador se expresa mediante el símbolo $\forall$ y se lee: para todo. De esta manera:

«para todo $x$, $P(x)$»=$\forall xP(x)$

Algunos ejemplos de cómo podemos usar este cuantificador son los siguientes. Observa cómo se deja claro el universo de discurso.

  • $\forall x$ número par, $x$ es múltiplo de 2.
  • $\forall x$ grupo cíclico, $x$ es generado por un único elemento.
  • $\forall x$ año bisiesto, $x$ tiene 366 días.
  • $\forall (x,y)$ vector en $\mathbb{R}^2$, $\norm{x+y}\leq\norm{x}+\norm{y}.$ *

Recuerda que ahora no es necesario que conozcamos a la perfección el universo de discurso del que estamos hablando en estos ejemplos. En estas entradas no nos interesa estudiar a los pares, a los grupos cíclicos, o a los años bisiestos. Los ponemos como ejemplos únicamente para ver que las ideas de lógica aplican a todos ellos. Por ejemplo para el segundo ejemplo el objetivo es que entiendas que siempre que consideremos un grupo cíclico (sea lo que signifique un grupo o un grupo cíclico), ese grupo es generado por un único elemento (sea lo que signifique que un grupo se genere por un único elemento). En este caso nuestro universo de discurso serán los grupos cíclicos, mientras que $P(x)$=«$x$ es generado por un único elemento». En estos renglones solo nos interesa entender cuándo estamos hablando de un universo de discurso, un cuantificador y un esquema proposicional.

Cuantificadores «existe» y «existe un único»

El cuantificador «para todo» establece que una proposición es verdadera para todos los objetos de un universo de discurso. Pero esto no siempre pasa. Por ejemplo, pensemos en que nuestro universo de discurso es $$A=\{\text{pescados, reptiles, aves, piedras, felinos}\}$$ y nuestro predicado $P(x)$ es «Los gatos son $x$». En este caso no todas las formas de asignar un objeto del universo a la variable $x$ darán proposiciones verdaderas. Los gatos no son pescados, reptiles ni mucho menos piedras o aves. Pero los gatos sí son felinos. En este caso la asignación $x=\text{felinos}$ será la única en la que se cumpla el esquema proposicional.

Cuando tenemos la situación en la que uno de los objetos de nuestro universo de discurso (o más) hagan que se cumpla la proposición, diremos que «para algún $x$ en el universo de discurso se cumple $P(x)$». Es un poco más usual ver esto escrito como «existe $x$ en el universo de discurso que cumple $P(x)$», o simplemente como «existe $x$, $P(x)$», cuando el universo de discurso se sobreentiende.

En matemáticas, escribiremos este «existe» de la siguiente manera: «$\exists$». Algunos ejemplos del uso de este cuantificador son los siguientes:

  • $\exists n$ número entero que es solución a $n^2=4$.
  • $\exists n$ número entero que cumple $e^{i\pi}+n=0.$ **

El cuantificador «existe» tiene una variante más restrictiva. Cuando decimos que existe al menos un elemento en nuestro universo de discurso que cumple una propiedad, también tenemos que puede haber $2$, $3$ o $20$ elementos que lo cumplen. Por ejemplo: «$\exists n$ número entero que es solución a $n^2=4$» tiene dos posibilidades, pues al tomar $n=-2$ o $n=2$ se cumple el predicado.

Pero es muy frecuente en matemáticas que se busque que uno y sólo un elemento cumpla un predicado. Para referirnos a estas ocasiones, usamos el cuantificador «$\exists!$», que se lee como «existe un único«. Por ejemplo, sabemos que el único número primo par es 2. Así que podríamos decir: «$\exists! x$ número entero que es primo y par». Otros ejemplos de su uso son:

  • $\exists!x$ día de la semana tal que $x$ empieza con la letra L
  • $\exists!x$ número real tal que $x$ es neutro aditivo. ***
  • $\exists!n$ número entero que cumple $e^{i\pi}+n=0.$

¿Observas que la última oración se parece mucho al último ejemplo del cuantificador anterior? Y con esto no estamos contradiciendo nada, en el ejemplo anterior solo estamos diciendo «Existe un número entero $n$ que es solución a $e^{i\pi}+n=0$» con lo que queremos decir que existe al menos uno, mientras que en el último ejemplo, decimos «Existe un único número entero $n$ que es solución a $e^{i\pi}+n=0$». Aquí, el objetivo solo es ser más específicos, lo que quiere decir que solo estamos dando información extra acerca de la proposición.

¿Qué sucede si ningún objeto del universo hace que el predicado sea cierto? En ese caso, podremos decir que «no existe $x$, $P(x)$». En símbolos, «$\nexists$». La siguiente tabla resume los cuantificadores de los que hemos hablado.

Para todos los casos$\forall$
Para al menos un caso$\exists$
Para un único caso$\exists!$
Para ningún caso$\nexists$

Combinando conectores y cuantificadores

Habiendo conocido los distintos cuantificadores, podríamos hacer afirmaciones un poco más extensas considerando cómo funcionan. Por ejemplo, pensemos en que nuestro universo de discurso son los números enteros. Consideremos los predicados $P(x)=x<0$ y $Q(x)=x<1$. Entonces podríamos decir:

$\forall x$ número entero $(P(x) \Rightarrow Q(x))$

En palabras: «Para todo número entero $x$, si $x$ es menor a 0, entonces $x$ es menor a 1».

También podemos tener predicados con más de una variable. Por ejemplo, consideremos a los números enteros como nuestro universo de discurso y $P(x,y)$ al predicado $x+y=0$. No hay problema con que dos variables estén en el mismo predicado, y con la notación $(x,y)$ solo estamos diciendo que la proposición depende de dos variables, por ejemplo $P(1,2)$ es la proposición $1+2=0$. Ahora, con este predicado en mente, podríamos enunciar $$\forall x, (\exists! y, P(x,y)).$$

Sólo estaríamos diciendo «para cada número entero $x$, existe un único número entero $y$ tal que $x+y=0$». Dicho de otra forma, cada vez que consideramos un número entero $x$, digamos $3$, existirá un único número entero $y$ que cumplirá la ecuación $x+y=0$. En este caso ese número $y$ es $-3$, pues dijimos que $x=3$ y solo hay un número que al sumarlo a $3$ nos da $0$.

Notas

Estas son algunas anotaciones del artículo y no es necesario que las sepas, únicamente son curiosidades o temas por aparte que forman parte de la cultura matemática.

* Esta se conoce como la desigualdad del triángulo y nos dice básicamente: que la suma de la longitud de dos lados de un triángulo siempre será mayor a la longitud del otro lado.

** Esta identidad se conoce como la identidad de Euler y algunos piensan que es una de las ecuaciones más hermosas de las matemáticas. En otros cursos como Álgebra Superior 2 o Variable Compleja puede que vuelvas a ver esta identidad con su demostación.

*** El único neutro aditivo es el $0$, y esto quiere decir que al sumarle este a cualquier otro número, dará el mismo número.

Tarea moral

  1. Imagina que definitivamente quieres comprar un helado. Cuando vas a la heladería, sólo venden un sabor. Esto tiene desventajas, por supuesto. Pero, ¿qué ventajas tiene que sólo haya un sabor de helado? Enlista todas las que puedas.
  2. En los ejemplos siguientes encuentra el universo de discurso y su predicado.
    1. $\forall x$ número par,$x$ es múltiplo de 2.
    2. $\forall x$ año bisiesto, $x$ tiene 366 días.
    3. $\forall (x,y)$ vector en $\mathbb{R}^2$, $\norm{x+y}\leq\norm{x}+\norm{y}$.
  3. Considera el predicado $P(x)=«x$ es múltiplo de 11». Da cuatro universos de discurso tales que los siguientes enunciados sean ciertos:
    • $\forall x P(x)$
    • $\exists x P(x)$
    • $\exists! x P(x)$
    • $\nexists x P(x)$
  4. Considera la proposición: $P(x,y,z)$ = «$x^3+y^3=z^3$». ¿Cuál de los siguientes enunciados representa la oración «No existen números enteros $x,y,z$ que cumplen $P(x,y,z)$»?:
    • $\forall x (\exists y (\exists z P(x,y,z)))$
    • $\nexists (x,y,z)P(x,y,z)$
    • $\forall x (\nexists(y,z)P(x,y,z))$
    • $\nexists x (\forall (x,y) P(x,y,z))$
  5. ¿El ejercicio anterior sólo tiene una solución? Si hay más de una opción correcta, ¿cómo argumentarías que dos enunciados representan el mismo enunciado?

Más adelante…

Cuando estamos hablando de cuantificadores, también nos van a interesar las negaciones de aquellos cuantificadores, por ejemplo, ¿a qué nos referiremos cuando digamos $\neg (\forall x P(x))$? ¿o cuando digamos $\neg (\exists x (P(x) \Rightarrow Q(x)))$? Para esta tarea primero deberemos hacer un análisis de qué nos dice cada uno de estos cuantificadores en su negación y es justamente lo que estudiaremos en la siguiente entrada.

Entradas relacionadas

Álgebra Superior II: La conjugación compleja

Introducción

En una entrada anterior definimos el conjunto $\mathbb{C}$ de los números complejos. Vimos que sus elementos tienen la forma $a+bi$, donde $a$ y $b$ son números reales. Definimos las operaciones de suma y producto, y vimos que, con estas operaciones, $\mathbb{C}$ es un campo. En esta entrada hablaremos acerca de la conjugación compleja.

Definición. Sea $z=a+bi$ un número complejo. El conjugado de $z$ es el número complejo $a-bi$ que denotaremos como $\overline{z}$.

Ejemplo. Sea $z=5+8i$, entonces $\overline{z}=5-8i$. Si $z=\sqrt{3}-8\pi i $, entonces $\overline{z}=\sqrt{3}+8\pi i$.

En la entrada anterior justificamos que podíamos abandonar la notación de parejas, sin embargo en ocasiones seguirá siendo útil pensar al complejo $a+bi$ como el punto $(a,b)$ del plano. Si lo pensamos así, la conjugación compleja manda al punto $(a,b)$ en el punto $(a,-b)$, es decir, se comporta como una reflexión en el eje $x$.

La conjugación compleja se comporta como una reflexión en el eje x
La conjugación compleja se comporta como una reflexión en el eje $x$

Conjugación y operaciones complejas

La conjugación compleja «se comporta bien» con las operaciones definidas en $\mathbb{C}$. Este es el contenido de la siguiente proposición.

Proposición 1. Si $w$ y $z$ son números complejos, entonces:

  • El conjugado de la suma es la suma de los conjugados, es decir, $\overline{w+z}=\overline{w}+\overline{z}$.
  • El conjugado del producto es el producto de los conjugados, es decir, $\overline{wz}=\overline{w}\overline{z}$.

Demostración. Si escribimos a $w=a+bi$ y $z=c+di$ con $a,b,c,d$ números reales. Tenemos que
\begin{align*}
\overline{w+z}&=\overline{(a+c)+(b+d)i}\\
&=(a+c)-(b+d)i\\
&=(a-bi)+(c-di)\\
&=\overline{w}+\overline{z},
\end{align*} lo cual prueba la primera parte de la proposición. Por otro lado
\begin{align*}
\overline{wz}&=\overline{(ac-bd)+(ad+bc)i}\\
&=(ac-bd)-(ad+bc)i\\
&=(ac-(-b)(-d))+(a(-d)+b(-c))i\\
&=(a-bi)(c-di)\\
&=\overline{w}\overline{z},
\end{align*} lo cual prueba la segunda parte.

$\square$

Se pueden mostrar resultados análogos para la conjugación compleja de la resta y cociente. Esto se deja en la tarea moral.

Ejemplo. Considera los números complejos $5+4i$, $3+2i$ y $1-i$. Vamos a determinar el conjugado de su suma de dos formas distintas. Por un lado, si los sumamos obtenemos el complejo $$(5+3+1)+(4+2-1)i=9+5i,$$ cuyo conjugado es $9-5i$.

Por otro lado, podemos conjugar a cada uno de los números de manera independiente para obtener $5-4i$, $3-2i$ y $1+i$. Al hacer la suma de estos complejos, obtenemos $$(5+3+1)+(-4-2+1)i=9-5i.$$ En ambos casos obtenemos lo mismo.

$\square$

La conjugación compleja es autoinversa

Proposición 2. La operación «conjugar» es autoinversa, y por lo tanto es biyectiva.

Demostración. En efecto, si $z=a+bi$, entonces $$\overline{\overline{z}}=\overline{a-bi}=a+bi=z.$$

Para ver que conjugar es suprayectivo, tomemos $z$ en $\mathbb{C}$. Tenemos que $\overline{\overline{z}}=z$, de modo que $z$ está en la imagen de la operación conjugación.

Para ver que conjugar es inyectivo, tomemos $w$ y $z$ en $\mathbb{C}$ tales que $\overline{w}=\overline{z}$. Aplicando conjugación a esta igualdad, y usando la primer parte de la proposición, tenemos que $w=z$.

$\square$

Operaciones de un complejo con su conjugado

Sea $z=a+bi$ un número complejo, a $a$ le llamamos la parte real de $z$ y a $b$ le llamamos la parte imaginaria. Usamos la notación $a=\text{Re}(z)$ y $b=\text{Im}(z)$, respectivamente. Cuidado: la parte imaginaria es un número real. Se llama parte imaginaria porque es la que acompaña a $i$.

Si hacemos operaciones de un complejo con su conjugado, obtenemos valores especiales.

Proposición 3. Sea $z$ un número complejo. Entonces:

  • $z+\overline{z}=2\text{Re}(z)$
  • $z-\overline{z}=2\text{Im}(z) i$
  • $z\overline{z}=\text{Re}(z)^2+\text{Im}(z)^2$

La demostración de la Proposición 3 es sencilla y se deja como tarea moral.

Ejemplo. Si tomamos el número complejo $3+4i$ y le sumamos su conjugado $3-4i$, obtenemos el número real $6$, que es dos veces la parte real de $3+4i$.

Si hacemos la multiplicación $(3+4i)(3-4i)$, obtenemos también un número real: $$3^2-(4i)^2=9-(-16)=25.$$

$\square$

Como corolario de la Proposición 3, obtenemos lo siguiente.

Corolario. Si $z=\overline{z}$, entonces $z$ es un número real.

Demostración. Por la primera parte de la Proposición 3, tenemos que $2z=z+\overline{z}=2\text{Re}(z)$, de modo que $z=\text{Re}(z)$ y por lo tanto $z$ es un número real.

$\square$

Ejercicio. Muestra que el complejo $$\left(\frac{1+\sqrt{5}}{2}+\frac{1-\sqrt{5}}{2} i \right) \left(\frac{1+\sqrt{5}}{2}-\frac{1-\sqrt{5}}{2} i \right)$$ es un número real.

Solución. Podríamos hacer las cuentas y verificar que la parte imaginaria es $0$. Sin embargo, basta con notar que la expresión es el producto de un complejo con su conjugado, es decir, es de la forma $z\overline{z}$. De manera directa, por la última parte de la Proposición 3 obtenemos que es un número real.

$\square$

La conjugación compleja es (casi) el único automorfismo que fija a los reales

En las secciones anteriores vimos que la conjugación compleja deja fijos a los reales y que respeta las operaciones. En esta sección veremos que es la única operación, en $\mathbb{C}$, que hace esto sin ser la identidad.

Teorema. Si $\eta:\mathbb{C}\to \mathbb{C}$ es una función biyectiva. tal que:

  • $\eta$ no es la identidad.
  • $\eta(a)=a$ para todo $a$ real.
  • $\eta(w+z)=\eta(w)+\eta(z)$ para todo par de complejos $w$ y $z$.
  • $\eta(wz)=\eta(w)\eta(z)$ para todo par de complejos $w$ y $z$.

Entonces $\eta$ es la conjugación compleja.

Demostración. Sea $z=a+bi$, tenemos que

\begin{align*}
\eta(a+bi)&=\eta(a)+\eta(bi)\\
&=\eta(a)+\eta(b)\eta(i)\\
&=a+b\eta(i),
\end{align*}

así que basta determinar quién es $\eta(i)$. Por otro lado, como $-1$ es real, tenemos también que
\begin{align*}
-1&=\eta(-1)\\
&=\eta(i\cdot i)\\
&=\eta(i)\eta(i)\\
&=\eta(i)^2,
\end{align*}

de modo que $\eta(i)$ es una raíz de $-1$ y por lo tanto es $i$ o $-i$. Si $\eta(i)=i$, tendríamos que $\eta$ es la identidad, lo cual contradice nuestras hipótesis. Así, $\eta(i)=-i$ y por lo tanto $\eta$ es la conjugación compleja.

$\square$

Tarea moral

  • Considera los números complejos $w_j=5+(2-j)i$, en donde $j$ es un entero en $\lbrace 0,1,2,3,4\rbrace$. Encuentra el valor de la suma $w_0+w_1+w_2+w_3+w_4$ y del producto $w_0w_1w_2w_3w_4$.
  • Toma los números complejos $w$ y $z$. Muestra que $\overline{w-z}=\overline{w}-\overline{z}$ y que si $z\neq 0$, entonces $\overline{w/z}=\overline{w}/ \overline{z}$.
  • Haz la demostración de la Proposición 3
  • ¿Cuáles números complejos satisfacen que $z^2=\overline{z}$?
  • Sea $z$ un número complejo distinto de $0$. ¿Qué obtienes cuando realizas la división $z/\overline{z}$?

En el blog hay una entrada acerca de aplicaciones de la aritmética de números complejos a la resolución de problemas en matemáticas. No formará parte de la evaluación del curso, pero puede ayudarte a entender más profundamente lo que estamos haciendo y a motivar la teoría que desarrollamos.