Archivo de la etiqueta: álgebra

Álgebra Lineal II: Clasificación de matrices por similaridad

Por Elizabeth Chalnique Ríos Alvarado

Introducción

En las notas anteriores hemos desarrollado el Teorema de Jordan, y ahora veremos cómo podemos clasificar matrices por similaridad.

Sección

Supongamos que $A$ es una matriz similar a $$\begin{pmatrix} J_{k_{1}}(\lambda_{1}) & 0 & \cdots & 0 \\ 0 & J_{k_{2}}(\lambda_{2}) & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & J_{k_{d}}(\lambda_{d}) \end{pmatrix}$$

Entonces el polinomio característico de $A$ es $$\chi_{A}(X) = \prod_{i=1}^{d}\chi_{J_{k_{i}}} (\lambda_{i})(X).$$

Ahora, dado que $J_{n}$ es nilpotente tenemos $\chi_{J_{k_{i}}}(X) = X^{n}$ y así $$\chi_{J_{n}(\lambda)}(X) = (X – \lambda)^{n}.$$

Se sigue que $$\chi_{A}(X) = \prod_{i=1}^{d} (X – \lambda_{i})^{k_{i}}$$ y así necesariamente $\lambda_{1}, \ldots, \lambda_{d}$ son todos eigenvalores de $A$. Nota que no asumimos que $\lambda_{1}, \ldots, \lambda_{d}$ sean distintos a pares, por lo que no podemos concluir de la igualdad anterior que $k_{1}, \ldots, k_{d}$ sean las multiplicidades algebráicas de los eigenvalores de $A$. Esto no es verdad en general: varios bloques de Jordan correspondientes a un dado eigenvalor pueden aparecer. El problema de la unicidad se resuelve completamente por el siguiente:

Teorema: Supongamos que una matriz $A \in M_{n}(F)$ es similar a $$\begin{pmatrix} J_{k_{1}}(\lambda_{1}) & 0 & \cdots & 0 \\ 0 & J_{k_{2}}(\lambda_{2}) & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & J_{k_{d}}(\lambda_{d}) \end{pmatrix}$$ para algunos enteros positivos $k_{1}, \ldots, k_{d}$ que suman $n$ y algunas $\lambda_{1}, \ldots, \lambda_{d} \in F$. Entonces

Cada $\lambda_{i}$ es un eigenvalor de $A$.
Para cada eigenvalor $\lambda$ de $A$ y cada entero positivo $m$, el número de bloques de Jordan $J_{m}(\lambda)$ entre $J_{k_{1}}(\lambda_{1}), \ldots, J_{k_{d}}(\lambda_{d})$ is $$N_{m}(\lambda) = rango(A – \lambda I_{n})^{m+1} – 2 rango(A – \lambda I_{n})^{m} + rango(A – \lambda I_{n})^{m-1}$$ y depende sólo en la clase de similaridad de $A$.

Demostración. Ya vimos el inciso 1. La prueba del inciso 2 es muy similar a la solución del Problema __. Más precisamente, sea $B = A – \lambda I_{n}$ y observa que $B^{m}$ es similar a $\begin{pmatrix} (J_{k_{1}}(\lambda_{1}) – \lambda I_{k_{1}})^{m} & 0 & \cdots & 0 \\ 0 & (J_{k_{2}}(\lambda_{2}) – \lambda I_{k_{2}})^{m} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & (J_{k_{d}}(\lambda_{d}) – \lambda I_{k_{d}})^{m}\end{pmatrix}$, por lo que $\displaystyle rango(B^{m}) = \sum_{i=1}^{d} rango(J_{k_{i}} (\lambda_{i}) – \lambda I_{k_{i}})^{m}$.

Ahora, el rango de $(J_{n}(\lambda) – \mu I_{n})^{m}$ es

$n$ si $\lambda \neq \mu$, como en este caso $$J_{n}(\lambda) – \mu I_{n} = J_{n} + (\lambda – \mu) I_{n}$$ es invertible,
$n-m$ para $\lambda = \mu$ y $m \leq n$, como se sigue del Problema __.
0 para $\lambda = \mu$ y $m > n$, dado que $J^{n}_{n} = O_{n}$.

De ahí, si $N_{m}(\lambda)$ es el número de bloques de Jordan $J_{m}(\lambda)$ entre $J_{k_{1}}(\lambda_{1}), \ldots, J_{k_{d}}(\lambda_{d})$, entonces $$rango(B^{m}) = \sum_{\substack{\lambda_{i} = \lambda \\ k_{i} \geq m}} (k_{i} – m) + \sum_{\lambda_{i} \neq \lambda} k_{i},$$ luego sustrayendo esas igualdades para $m-1$ y $m$ se tiene que $$rango(B^{m-1}) – rango(B^{m}) = \sum_{\substack{\lambda_{i} = \lambda \\ k_{i} \geq m}} 1$$ y finalmente \begin{align*} rango(B^{m-1}) – 2rango(B^{m}) + rango(B^{m+1}) = \\ (rango(B^{m-1}) – rango(B^{m})) – (rango(B^{m}) – rango(B^{m+1})) = \\ \sum_{\substack{\lambda_{i} = \lambda \\ k_{i} = m}} 1 = N_{m}(\lambda) \end{align*} como queríamos.

$\square$

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

¿Cuáles son las posibles formas canónicas de Jordan de una matriz cuyo polinomio característico es $(X-1)(X-2)^{2}$?
Considera una matriz $A \in M_{6}(\mathbb{C}) de rango 4 cuyo polinomio mínimo es $X(X-1)(X-2)^{2}$.
1. ¿Cuáles son los eigenvalores de $A$?
2. ¿$A$ es diagonalizable?
3. ¿Cuáles son las posibles formas canónicas de Jordan de $A$?

Más adelante…

En la siguiente nota veremos algunos ejemplos de cómo funciona todo esto.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Teorema de formas canónicas de Jordan
Siguiente entrada del curso: Otras aplicaciones de formas canónicas de Jordan

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Existencia de la forma canónica de Jordan para nilpotentes

Por Elizabeth Chalnique Ríos Alvarado

Deja un comentario

Introducción

En la entrada anterior estudiamos de manera un poco más sistemática las matrices y transformaciones lineales nilpotentes. Lo que haremos ahora es enunciar el teorema de la forma canónica de Jordan para matrices nilpotentes. Este es un teorema de existencia y unicidad. En esta entrada demostraremos la parte de la existencia. En la siguiente entrada hablaremos de la unicidad y de cómo encontrar la forma canónica de Jordan de matrices nilpotentes de manera práctica.

El teorema de Jordan para nilpotentes

El teorema que queremos demostrar tiene dos versiones: la de transformaciones y la matricial. La versión en transformaciones dice lo siguiente.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ y $T:V\to V$ una transformación lineal nilpotente. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques:

$$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

La versión en forma matricial dice lo siguiente.

Teorema. Sea $A$ una matriz nilpotente en $M_n(F)$. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales $A$ es similar a la siguiente matriz de bloques: $$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

A esta matriz de bloques (ya sea para una transformación, o para una matriz) le llamamos la forma canónica de Jordan de $A$.

En vista de que dos matrices son similares si y sólo si representan a la misma transformación lineal en distintas bases, entonces ambos teoremas son totalmente equivalentes. Así, basta enfocarnos en demostrar una de las versiones. Haremos esto con la versión para transformaciones lineales.

Trasnformaciones nilpotentes y unos vectores linealmente independientes

En esta sección enunciaremos un primer resultado auxiliar para demostrar la existencia de la forma canónica de Jordan. Veremos que a partir de una transformación lineal nilpotente podemos obtener algunos vectores linealmente independientes.

Proposición. Sea $V$ un espacio vectorial de dimensión finita y $T:V\to V$ una transformación lineal de índice $k$. Sea $v$ un vector tal que $T^{k-1}(v)\neq 0$, el cual existe ya que $T^{k-1}$ no es la transformación lineal cero. Entonces:

Los vectores $v$, $T(v)$, $\ldots$, $T^{k-1}(v)$ son linealmente independientes.
El subespacio $W$ que generan es de dimensión $k$ y es estable bajo $T$.
La transformación $T$ restringida a $W$ en la base $T^{k-1}(v)$, $T^{k-2}(v)$, $\ldots$, $T(v)$, $v$ tiene como matriz al bloque de Jordan $J_{0,k}$. Ojo. Aquí los vectores los escribimos en orden contrario, empezando con la mayor potencia de $T$ aplicada.

Demostración. Probemos las afirmaciones una por una. Para empezar, supongamos que para ciertos escalares $\alpha_0,\ldots,\alpha_{k-1}$ tenemos que $$\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v)=0.$$

Vamos a probar inductivamente de $0$ a $k-1$ que $\alpha_k=0$. Para mostrar que $\alpha_0=0$, aplicamos $T^{k-1}$ a la combinación lineal anterior para obtener:

\begin{align*}
0&=\alpha_0T^{k-1}(v)+\alpha_1T^k(v)+\ldots+\alpha_{k-1}T^{2k-2}(v)\\
&=\alpha_0T^{k-1}(v).
\end{align*}

Aquí estamos usando en todos los sumandos, excepto el primero, que $T^k=0$. Como $T^{k-1}(v)\neq 0$, concluimos que $\alpha_0=0$. Suponiendo que ya hemos mostrado $\alpha_0=\ldots=\alpha_l=0$, la combinación lineal con la que empezamos queda como $$\alpha_{l+1}T^{l+1}(v)+\alpha_{l+2}T^{l+2}(v)+\ldots+\alpha_{k-1}T^{k-1}(v)=0.$$ Aplicando $T^{k-l-2}$ y usando un argumento similar al anterior se llega a que $\alpha_{l+1}=0$. Esto muestra que la única combinación lineal de los vectores que da cero es la combinación lineal trivial, así que son linealmente independientes.

De manera inmediata obtenemos entonces que esos $k$ vectores generan un subespacio $W$ de dimensión $k$. Para ver que $W$ es $T$ estable, tomemos un elemento $w$ en $W$, es decir $$w=\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v)$$ para algunos escalares $\alpha_0,\ldots,\alpha_{k-1}$. Debemos ver que $T(w)$ está nuevamente en $W$. Haciendo las cuentas y usando nuevamente que $T^k=0$ obtenemos:

\begin{align*}
T(w)&=T(\alpha_0v+\alpha_1T(v)+\ldots+\alpha_{k-1}T^{k-1}(v))\\
&= \alpha_0T(v)+\alpha_1T^2(v)+\ldots+\alpha_{k-2}T^{k-1}(v)+\alpha_{k-1}T(v)\\
&= \alpha_0T(v)+\alpha_1T^2(v)+\ldots+\alpha_{k-2}T^{k-1}(v)\\
\end{align*}

Este vector de nuevo es combinación lineal de los vectores que nos interesan, así que $T(w)$ está en $W$, como queríamos.

La afirmación de la forma matricial es inmediata pues precisamente

$$T(T^{j}(v))=0\cdot T^{n-1}(V)+\ldots+1\cdot T^{j+1}(v)+\ldots+0\cdot T(v) + 0\cdot v,$$ de donde se lee que las columnas de dicha forma matricial justo son las del bloque de Jordan $J_{0,k}$.

$\square$

El teorema anterior da otra demostración de algo que ya habíamos mostrado en la entada anterior: el índice de una matriz en $M_n(F)$ (o de una transformación nilpotente en un espacio vectorial de dimensión $n$) no puede exceder $n$.

Encontrar un subespacio complementario y estable

Ahora veremos otro resultado auxiliar que necesitaremos para demostrar la existencia de la forma canónica de Jordan. A partir de él podemos conseguirnos un «subespacio complementario y estable» que en la prueba de la existencia nos ayudará a proceder inductivamente. Este truco ya lo hemos visto antes en la clasificación de matrices ortogonales y el la demostración del teorema espectral.

Proposición. Sea $V$ un espacio vectorial de dimensión finita $n$ y $T:V\to V$ una transformación lineal nilpotente de índice $k$. Tomemos $v$ un vector tal que $T^{k-1}(v)\neq 0$. Sea $W$ el subespacio generado por $v,T(v),\ldots,T^{k-1}(v)$. Entonces, existe un subespacio $W’$ estable bajo $T$ y tal que $T=W\oplus W’$.

La principal dificultad para probar esta proposición es una cuestión creativa: debemos saber de dónde sacar el espacio $W’$. Para ello, haremos uso de la transformación transpuesta y de un espacio ortogonal por dualidad. Como recordatorio, si $T:V\to V$ es una transformación lineal, entonces su transformación transpuesta es una transformación lineal $^tT:V^\ast \to V^\ast$ para la cual $^tT(\ell)(u)=\ell(T(u))$ para cualquier forma lineal $\ell$ y cualquier vector $u$ en $V$.

Demostración. Primero, nos enfocamos en construir $W’$. Para ello procedemos como sigue. Como $T^{k-1}(v)\neq 0$, entonces existe una forma lineal $\ell$ tal que $\ell(T^{k-1}(v))\neq 0$. Se puede mostrar que $S:=\text{ }^t T$ también es nilpotente de índice $k$. Por la proposición de la sección anterior, tenemos entonces que $\ell, S(\ell),\ldots,S^{k-1}(\ell)$ son $k$ vectores linealmente independientes en $V^\ast$ y por lo tanto que generan un subespacio $Z$ de dimensión $k$. El espacio $W’$ que propondremos será $Z^\bot$.

Debemos mostrar que:

En efecto $V=W\oplus W’$.
En efecto $W’$ es $T$ estable.

Para la primer parte, usando teoría de espacios ortogonales tenemos que $$\dim(W’)=\dim(Z^\bot)=n-\dim(Z)=n-k,$$ así que los subespacios tienen la dimensión correcta para ser complementarios. Además, si $u\in W\cap W’$, entonces $u$ es combinación lineal de $v, T(v),\ldots, T^{k-1}(v),$ digamos $$u=\alpha_0v+\ldots+\alpha_{k-1}T^{k-1}(v)$$ y se anula por $\ell, S(\ell),\ldots,S^{k-1}(\ell)$, lo que quiere decir que se anula por $\ell, \ell\circ T, \ldots, \ell \circ T^{k-1}$. Esto permite probar iterativamente que $\alpha_0=\ldots=\alpha_{k-1}=0$, de modo que $u=0$. Con esto, $W$ y $W’$ son de intersección trivial y dimensiones complementarias, lo cual basta para que $V=W\oplus W’$.

Para terminar, debemos ver que $W’$ es $T$ estable. Tomemos un $u$ en $W’$, es decir, tal que se anula por $\ell, \ell\circ T, \ldots, \ell \circ T^{k-1}$. Al aplicar $T$, tenemos que $T(u)$ también se anula por todas estas transformaciones. Esto se debe a que para $\ell \circ T^j$ con $j\leq k-2$ se anula ya que $\ell\circ T^j(T(u))=\ell\circ T^{j+1}(u)=0$ por cómo tomamos $u$ y para $\ell \circ T^{k-1}$ se anula pues $T$ es nilpotente de índice $k$.

$\square$

Existencia de forma canónica de Jordan para nilpotentes

La idea para encontrar la forma canónica de Jordan debe ser clara a estas alturas: se procederá por inducción, el caso base será sencillo, asumiremos la hipótesis inductiva y para hacer el paso inductivo descomponeremos al espacio $V$ mediante la proposición de la sección anterior. Veamos los detalles.

Demostración (existencia de forma canónica de Jordan para nilpotentes). Estamos listos para probar la existencia de la forma canónica de Jordan para una transformación lineal nilpotente $T:V\to V$ con $V$ un espacio vectorial de dimensión finita $n$. Procederemos por inducción en la dimensión. Si $n=1$, entonces $V$ es generado por un vector $v$ y la transformación lineal $T$ debe mandarlo al vector $0$ para ser nilpotente. En esta base, $T(v)=0$ y la matriz que representa a $T$ es entonces $(0)=J_{0,1}$.

Supongamos que existe la forma canónica de Jordan para cuando $V$ es de cualquier dimensión menor a un entero positivo dado $n$. Tomemos $V$ un espacio vectorial de dimensión $n$ y $T:V\to V$ una transformación lineal nilpontente. Si $T$ es de índice $n$, entonces $T^{n-1}(v),\ldots,T(v),v$ son linealmente independientes y por lo tanto son una base de $V$. La forma matricial de $T$ en esta base es el bloque de Jordan $J_{0,n}$, en cuyo caso terminamos.

De otra forma, el índice es un número $k<n$. Entonces, $T^{k-1}(v),\ldots,T(v),v$ generan un subespacio estable $W$ de dimensión $k$. Por la proposición de la sección anterior, podemos encontrar un subespacio complementario $W’$ de dimensión $n-k<n$ y estable bajo $T$. Como la restricción de $T$ a $W’$ tiene codominio $W’$, es nilpotente y $\dim(W)<\dim(V)$, entonces por hipótesis inductiva $W’$ tiene una base $\beta$ bajo la cual la restricción de $T$ a $W’$ tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo $J_{0,k_j}$. Al completar $\beta$ con $T^{k-1}(v),\ldots,T(v),v$ , obtenemos una base de $V$ en la cual $T$ tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo $J_{0,k_j}$ (que vienen de la hipótesis inductiva) y un bloque de Jordan $J_{0,k}$. Salvo quizás un reordenamiento de la base para ordenar los $k_j$ y $k$, obtenemos exactamente lo buscado.

$\square$

Más adelante…

Ya demostramos una parte fundamental del teorema que nos interesa: la existencia de la forma canónica de Jordan para transformaciones (y matrices) nilpotentes. Nos falta otra parte muy importante: la de la unicidad. Las demostraciones de unicidad típicamente son sencillas, pero en este caso no es así. Para decir de manera explícita cuál es la forma canónica de Jordan de una transformación (o matriz) nilpotente, deberemos hacer un análisis cuidadoso del rango de las potencias de la transformación (o matriz). Veremos esto en las siguientes entradas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Verifica que la siguiente matriz es nilpotente: $$\begin{pmatrix}13 & 6 & -14 & -5\\ 2 & 0 & -4 & -2 \\ 29 & 12 & -34 & -13 \\ -45 & -18 & 54 & 21\end{pmatrix}.$$
Siguiendo las ideas de la demostración de existencia de esta entrada, ¿cómo podrías dar la forma canónica de Jordan de esta matriz? Intenta hacerlo.
Sea $V$ un espacio vectorial de dimensión finita y $T:V\to V$ una transformación lineal nilpotente de índice $k$. Demuestra que $^tT$ también es una transformación lineal nilpotente de índice $k$. ¿Cuál sería el resultado análogo para matrices?
Sea $V$ un espacio vectorial de dimensión finita y $T:V \to V$ una transformación lineal tal que para cualquier $v$ en $V$ existe algún entero $n$ tal que $T^n(v)=0$. Estos $n$ pueden ser distintos para distintos $v$. Muestra que $T$ es nilpotente.
Considera el subespacio $V$ de polinomios reales con grado a lo más $4$ y $D:V\to V$ la transformación lineal derivar. Da, de manera explícita, espacios $W$ y $W’$ como en las proposición de encontrar el subespacio complementario estable.
Hay varios detalles que quedaron pendientes en las demostraciones de esta entrada. Revisa la entrada para encontrarlos y da las demostraciones correspondientes.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Matrices y transformaciones nilpotentes
Siguiente entrada del curso: Unicidad de la forma canónica de Jordan para nilpotentes

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Introducción a forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

1 respuesta

Introducción

En esta última unidad usaremos las herramientas desarrolladas hasta ahora para enunciar y demostrar uno de los teoremas más hermosos y útiles en álgebra lineal: el teorema de la forma canónica de Jordan. A grandes rasgos, lo que nos dice este teorema es que cualquier matriz prácticamente se puede diagonalizar. En esta primera entrada hablaremos un poco de qué puedes esperar en el transcurso de la unidad, aunque en un orden algo distinto que te ayudará a entender mejor la motivación de presentar la teoría cómo vendrá en las siguientes notas.

Bloques de Jordan

Un bloque de Jordan de tamaño $k$ y eigenvalor $\lambda$ es una matriz en $M_k(F)$ que se obtiene de comenzar con $\lambda I_k$ y agregar encima de la diagonal principal puros unos. Queda algo así:

$$J_{\lambda,k}=\begin{pmatrix} \lambda & 1 & 0 & \ldots & 0 & 0 \\ 0 & \lambda & 1 & \ldots & 0 & 0 \\ 0 & 0 & \lambda & \ldots & 0 & 0 \\ & \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \ldots & \lambda & 1 \\ 0 & 0 & 0 & \ldots & 0 & \lambda \end{pmatrix}.$$

Puedes notar que esto es prácticamente una matriz diagonal, a excepción de la diagonal de unos que queda por encima de la diagonal principal. Esto debería sugerirte que los bloques de Jordan son casi tan amigables como las matrices diagonales. Como veremos en las siguientes entradas, es muy fácil calcularles su traza, determinante, polinomio característico, polinomio mínimo, eigenvalores, eigenvectores, etc.

A partir de los bloques de Jordan podemos formar matrices de bloques de Jordan pegando varios bloques de Jordan en una diagonal para obtener una matriz del siguiente estilo:

\begin{equation}\label{eq:Jordan}\begin{pmatrix} J_{\lambda_1,k_1} & 0 & 0 & \ldots & 0 \\ 0 & J_{\lambda_2,k_2} & 0 & \ldots & 0 \\ 0 & 0 & J_{\lambda_3,k_3} & \ldots & 0 \\ & \vdots & & \ddots & \vdots \\ 0 & 0 & 0 & \ldots & J_{\lambda_d,k_d}\end{pmatrix}.\end{equation}

Aquí pusimos muchos ceros, pero en el fondo cada uno de estos ceros son una matriz de ceros. Por ejemplo, si tenemos los tres bloques de Jordan $J_{3,2}$, $J_{-2,1}$ y $J_{5,3}$ y pegamos estos bloques, obtenemos la siguiente matriz de bloques:

$$\left( \begin{array}{cc|c|ccc} 3 & 1 & 0 & 0 & 0 & 0 \\ 0 & 3 & 0 & 0 & 0 & 0\\ \hline 0 & 0 & -2 & 0 & 0 & 0 \\ \hline 0 & 0 & 0 & 5 & 1 & 0\\ 0 & 0 & 0 & 0 & 5 & 1 \\ 0 & 0 & 0 & 0 & 0 & 5 \end{array}\right).$$

Recuerda que las líneas que dibujamos en una matriz de bloques son simplemente ayuda visual. Estas matrices también son prácticamente diagonales y, como te imaginarás, también es fácil encontrar muchas de sus propiedades.

Teorema de la forma canónica de Jordan

Si recuerdas, una de las motivaciones fuertes para que nos interesara diagonalizar una matriz $A$ es que la matriz diagonal $D$ semejante comparte muchas propiedades con $A$, pero $D$ es mucho más fácil de entender. A veces no podremos encontrar una matriz diagonal semejante a $A$, pero lo que nos dice el teorema de formas canónicas de Jordan es que prácticamente siempre podremos encontrar una matriz de bloques de Jordan semejante a $A$.

Teorema. Sea $A\in M_n(F)$ una matriz tal que su polinomio característico $\chi_A(X)$ se divide sobre $F$. Entonces, $A$ es similar a una matriz de bloques de Jordan, es decir, una matriz como en \refeq{eq:Jordan}.

En realidad, cuando enunciemos el teorema lo haremos de manera más formal, y hasta diremos en qué sentido la forma canónica de Jordan es única.

¿Por qué decimos que entonces prácticamente siempre podemos diagonalizar una matriz? En cursos más avanzados se muestra que sin importar en qué campo $F$ estemos trabajando, siempre podemos extender el campo $F$ lo suficiente como para que cualquier polinomio se divida sobre una extensión $G$ de $F$. En este campo extendido, cualquier matriz en $M_n(F)$ se puede diagonalizar.

Transformaciones y matrices nilpotentes

Para demostrar el teorema de Jordan, primero tendremos que enunciarlo y demostrarlo para una clase muy especial de matrices: las nilpotentes. Ya hemos hablado un poco de estas matrices en ejercicios particulares y algunos problemas de la tarea moral. Pero si se te pasó, una matriz $A$ en $M_n(F)$ es nilpotente cuando se puede encontrar un expontente $m$ tal que $A^m=O_n$. De manera similar, si $T$ es una transformación lineal, diremos que es nilpotente cuando $T^m=Z$ para algún exponente $m$, donde $Z$ es la transformación lineal trivial que manda todo elemento al $0$. Recuerda que aquí el exponente indica cuántas veces se compone $T$ consigo mismo. Como te imaginarás, $T$ será nilpotente si y sólo si alguna de sus formas matriciales lo es.

Las matrices nilpotentes servirán como nuestros cimientos para demostrar el teorema de la forma canónica de Jordán. Es sencillo ver que los bloques de Jordan de la forma $J_{0,k}$ son nilpotentes. También es sencillo ver que cualquier matriz de bloques de Jordan con puros eigenvalores iguales a cero es nilpotente. Nuestra primera versión del teorema de la forma canónica de Jordán nos dará algo así como un «regreso» de esta afirmación. El siguiente teorema es una versión «light» de lo que demostraremos.

Teorema. Sea $A\in M_n(F)$ una matriz nilpotente. Entonces, $A$ es similar a una matriz de bloques de Jordan, todos ellos con eigenvalor $0$.

La demostración será muy bonita, y hará uso de la teoría de dualidad de Álgebra Lineal I. Una vez que demostremos esta versión, la combinaremos con el teorema de Cayley-Hamilton de la Unidad 1 para obtener el teorema general.

Aplicaciones del teorema de Jordan

Si conocemos la forma canónica de Jordan de una matriz, podemos encontrar a partir de ella fácilmente muchas propiedades, como la traza, determinante, etc. Además de estas aplicaciones «de cálculo de propiedades», el teorema de la forma canónica de Jordán nos permitirá decir exactamente cuándo dos matrices son similares. En particular, veremos que cualquier matriz $A$ es similar a su transpuesta.

Tarea moral

En esta ocasión la tarea moral consistirá en un repaso de contenido anterior tanto de Álgebra Lineal I como Álgebra Lineal II, para que cuentes con todas las herramientas necesarias para aprovechar esta última unidad.

Haz un repaso de la teoría de Matrices de bloques, para recordar a qué se refiere esta notación y cómo se pueden hacer operaciones cuando las matrices están escritas por bloques.
Revisa la entrada de Matrices de cambio de base, para recordar por qué dos matrices similares en el fondo representan a la misma transformación lineal, pero en distintas bases.
Repasa la teoría básica de dualidad en espacios vectoriales. Puedes comenzar con la entrada de Introducción a espacio dual. Concretamente, tendrás que recordar por lo menos hasta la teoría de Ortogonalidad y espacio ortogonal.
Recuerda todo lo que podemos decir de las transformaciones triangularizables, revisando la entrada de Triangularizar y descomposición de Schur, y compara los resultados de ahí con lo que esperamos obtener sobre forma canónica de Jordan. ¿Cuál teorema dice algo más fuerte?
Vuelve a leer todo el contenido relacionado con el teorema de Cayley-Hamilton para recordar no sólo qué dice, sino cómo está relacionado con los eigenespacios asociados a una transformación lineal. Puedes empezar con la entrada de Introducción al teorema de Cayley-Hamilton.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: El teorema espectral y de descomposición polar complejos
Siguiente entrada del curso: Matrices y transformaciones nilpotentes

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior II: Introducción a estructuras algebraicas

Por Leonardo Ignacio Martínez Sandoval

2 respuestas

Introducción

Finalmente terminamos de construir a los números naturales, sus operaciones y su orden. El siguiente conjunto que nos interesa construir es $\mathbb{Z}$, el conjunto de los números enteros. Haremos esto en breve. Sin embargo, primero haremos un paréntesis para hablar de estructuras algebraicas.

Quizás hayas escuchado hablar de varias de ellas. En cálculo y geometría analítica se habla de los números reales y se comenta que es muy importante que sea un campo. En geometría moderna se habla de transformaciones geométricas y cómo algunas de ellas forman un grupo. También es común escuchar de los anillos de enteros o de polinomios (que estudiaremos más adelante). Y por supuesto, también están los espacios vectoriales, que están fuertemente conectados con resolver sistemas de ecuaciones lineales y hacer cálculo y geometría en altas dimensiones.

Todos estos conceptos (campos, grupos, anillos, espacios vectoriales, etc.) son ejemplos de estructuras algebraicas. Cada tipo de estructura algebraica es muy especial por sí misma y sus propiedades se estudian por separado en distintas materias, notablemente aquellas relacionadas con el álgebra moderna. La idea de esta entrada es dar una muy breve introducción al tema, para que te vayas acostumbrando al uso del lenguaje. Esto te servirá más adelante en tu formación matemática.

Intuición de estructuras algebraicas

De manera intuitiva, una estructura algebraica consiste de tomar un conjunto, algunas operaciones en ese conjunto, y ciertas propiedades que tienen que cumplir las operaciones. Eso suena mucho a lo que hemos trabajado con $\mathbb{N}$: es un conjunto, con las operaciones de suma y producto. Y ya demostramos que estas operaciones tienen propiedades especiales como la conmutatividad, la distributividad y la existencia de neutros.

En realidad podríamos tomar cualquier conjunto y cualquier operación y eso nos daría una cierta estructura.

Ejemplo. Consideremos el conjunto $\mathbb{N}$ con la operación binaria $\star$ tal que $$a\star b=ab+a+b.$$ Tendríamos entonces que $$3\star 1=3\cdot 1+3+1= 7,$$ y que $$10\star 10=10\cdot 10 + 10 + 10 = 120.$$

Es posible que la operación $\star$ tenga ciertas propiedades especiales, y entonces algunas proposiciones matemáticas interesantes consistirían en enunciar las propiedades de $\star$.

$\triangle$

Aunque tenemos mucha libertad en decidir cuál es el conjunto, cuáles son las operaciones que le ponemos y qué propiedades vamos a pedir, hay algunos ejemplos que se aparecen muy frecuentemente en las matemáticas. Aparecen de manera tan frecuente, que ameritan nombres especiales. Comencemos a formalizar esto.

Operaciones binarias y magmas

Dado un conjunto $S$, una operación binaria toma parejas de elementos de $S$ y los lleva a otro elemento de $S$. En símbolos, es una función $\star: S\times S\to S$. Cuando usamos la notación de función, tendríamos que escribir todo el tiempo $\times(a,b)$ para referirnos a lo que esta operación le hace a cada pareja de elementos $a$ y $b$ en $S$. Sin embargo, esto resulta poco práctico, y es por esta razón que se usa mucho más la notación $a\times b:=\times (a,b)$.

Ejemplo. En $\mathbb{N}$ ya definimos la operación binaria $+$, que toma dos enteros $a$ y $b$ y los manda a $s_a(b)$, donde $s_a:\mathbb{N}\to \mathbb{N}$ es la función que construimos usando el teorema de recursión estableciendo que $s_a(0)=a$ y $s_a(\sigma(n))=\sigma(s_a(n))$.

$\triangle$

Aquí lo único que nos importa es establecer una operación binaria. No nos importa si tiene otras propiedades adicionales.

Definición. Un magma consiste de un conjunto $S$ con una operación binaria $\ast$.

Otros ejemplos de magma son $\mathbb{N}$ con la operación que dimos en la parte de intuición, o bien $\mathbb{N}$ con el producto que ya definimos. También podemos tener magmas en conjuntos que no sea el de los enteros. Por ejemplo, si $P$ es el conjunto de subconjuntos de $\{0,1,2,3,4\}$, y le damos la operación que manda $A$ y $B$ a $A\cup B\cup \{0\}$, entonces también obtenemos un magma.

Conmutatividad

Cuando tenemos un conjunto $S$ y una operación binaria $\star$ en $S$, puede suceder que de lo mismo hacer $a\star b$ que $b\star a$. Esto ya es una propiedad especial que pueden cumplir las operaciones binarias, y tiene un nombre.

Definición. Decimos que una operación binaria $\star$ en un conjunto $S$ es conmutativa si para cualesquiera dos elementos $a$ y $b$ de $S$ se cumple que $a\star b=b\star a$.

Observa que la igualdad debe suceder para cualesquiera dos elementos. Basta con que falle para una pareja para que la operación ya no sea conmutativa.

Ejemplo. Una de las propiedades que demostramos de la operación de suma en $\mathbb{N}$ es que $s_a(b)=s_b(a)$, es decir, que $a+b=b+a$. En otras palabras, la operación binaria $+$ en $\mathbb{N}$ es conmutativa. Así mismo, vimos que el producto era conmutativo, es decir, que $p_a(b)=p_b(a)$, que en términos de la operación binaria $\cdot$ quiere decir que $a\cdot b=b\cdot a$.

$\triangle$

Más adelante veremos que otras funciones de suma y producto también son conmutativas, por ejemplo, las de los enteros, racionales, reales y complejos. Sin embargo, hay algunas operaciones binarias muy importantes en matemáticas que no son conmutativas. Un ejemplo de ello es el producto de matrices. Otro ejemplo es la diferencia de conjuntos.

Ejemplo. Si $P$ es el conjunto de subconjuntos de $\{0,1,2,3,4\}$ y le damos la operación binaria $\setminus$ tal que dados $A$ y $B$ en $P$ los manda a $A\setminus B$, entonces obtenemos un magma. Sin embargo, la operación $\setminus$ no es conmutativa pues, por ejemplo, $$\{1,2,3\}\setminus\{2,3,4\}=\{1\},$$ pero $$\{2,3,4\}\setminus\{1,2,3\}=\{4\}.$$

$\triangle$

En $\mathbb{N}$ no tenemos una operación de resta, como discutiremos en breve. Pero en el conjunto de los enteros sí, y ese sería otro ejemplo de una operación que no es conmutativa.

Asociatividad y semigrupos

Otra de las propiedades importantes que demostramos de la suma y producto de naturales es que son operaciones asociativas. En general, podemos definir la asociatividad para una operación binaria como sigue.

Definición. Sea $\star$ una operación binaria en un conjunto $S$. Decimos que $\star$ es asociativa si $a\star (b\star c)=(a\star b)\star c$ para cualesquiera tres elementos $a,b,c$ de $S$.

Tanto la suma como el producto de naturales dan una operación asociativa pues ya demostramos que si $a,b,c$ son naturales, entonces $a+(b+c)=(a+b)+c$ y $a(bc)=(ab)c$. Esta propiedad también la tendremos para la suma y producto de enteros, racionales, reales, complejos, polinomios, etc.

A partir de la asociatividad podemos definir la primer estructura algebraica que requiere un poco más de propiedades.

Definición. Un semigrupo es un conjunto $S$ con una operación asociativa $\star$.

Si además $\star$ es una operación conmutativa, entonces decimos que es un semigrupo conmutativo. En realidad, en cualquiera de las definiciones que daremos a continuación podemos agregar el adjetivo «conmutativo» y esto querrá decir que además de las propiedades requeridas, también se cumple que la operación es conmutativa.

En los semigrupos (y demás estructuras con asociatividad) tenemos la ventaja de que podemos «olvidarnos de los paréntesis» sin la preocupación de que haya ambigüedad. Por ejemplo, en los naturales la expresión $3+((2+4)+8)$ se puede escribir simplemente como $3+2+4+8$, pues cualquier otra forma de poner paréntesis, como $(3+2)+(4+8)$, debe dar exactamente el mismo resultado por asociatividad.

Ejemplo. Una operación que no es asociativa es la resta en los enteros. Aunque no hemos definido formalmente esta operación, es intuitivamente claro que $3-(2-1)$ no es lo mismo que $(3-2)-1$.

$\triangle$

Unidades y magmas unitales

A veces sucede que algunos elementos de un conjunto «no afectan a nadie» bajo una cierta operación binaria dada. Por ejemplo, en los naturales «sumar cero» no cambia a ningún entero.

Definición. Sea $\star$ una operación binaria en un conjunto $S$. Una unidad o neutro para $\star$ es un elemento $e$ en $S$ para el cual se cumple que para cualquier elemento $a$ de $S$ se tenga $a\star e = a$ y $e\star a = a$.

Observa que es muy importante pedir las dos igualdades de la definición. Si una se cumple, no necesariamente tiene que pasar la otra, pues no necesariamente la operación es conmutativa. Por supuesto, si ya se sabe que la operación es conmutativa, entonces basta con ver una de ellas.

En $\mathbb{Z}$ tenemos las operaciones de suma y producto. Para no confundir a sus neutros, a $0$ le llamamos el neutro aditivo para hacer énfasis que es el neutro de la suma. Y a $1$ le llamamos el neutro multiplicativo para hacer énfasis que es el neutro del producto. Entre las propiedades que probamos, en efecto vimos que $a+0=a=0+a$ y que $a\cdot 1 = a = 1\cdot a$ para cualquier entero $a$.

Definición. Un magma unital es un conjunto $S$ con una operación $\star$ que tiene un neutro.

El conjunto de naturales con la operación $\star$ que dimos en la sección de intuición también es un magma unital. ¿Puedes decir quién es su neutro?

Monoides

Se puede pedir más de una propiedad a una operación binaria y entonces obtenemos estructuras algebraicas más especiales.

Definición. Un monoide es un conjunto $S$ con una operación $\star$ que es asociativa y que tiene un neutro.

En otras palabras, un monoide es un magma unital con operación asociativa. O bien, un semigrupo cuya operación tiene unidad. Por supuesto, si la operación además es conmutativa entonces decimos que es un monoide conmutativo.

Ejemplo. Por todo lo que hemos visto en esta entrada, tenemos que $\mathbb{N}$ con la suma es un monoide conmutativo. Así mismo, $\mathbb{N}$ con el producto es un monoide conmutativo.

$\triangle$

Semianillos

La última idea importante para discutir en esta entrada es que una estructura algebraica puede tener más de una operación binaria, y además de pedir propiedades para cada operación, también se pueden pedir propiedades que satisfagan ambas operaciones en igualdades que las involucran a las dos.

Definición. Un seminanillo es un conjunto $S$ con dos operaciones binarias $\square$ y $\star$ que satisfacen las siguientes propiedades:

$\square$ es un monoide conmutativo
$\star$ es un monoide
Se cumple distributividad, es decir, que para cualesquiera tres elementos $a,b,c$ de $S$ se tiene $a\star(b\square c) = (a\star b)\square(a\star c)$ y $(a\square b)\star c = (a\star c)\square(b\star c)$.
El neutro $e$ de $\square$ aniquila a los elementos bajo $\star$, es decir, para cualquier elemento $a$ de $S$ se tiene que $a\star 0=0$ y $0\star a = 0$.

Un semianillo conmutativo es un semianillo en donde la operación $\star$ también es conmutativa. Las propiedades que hemos de los números naturales nos permiten enunciar el siguiente resultado.

Teorema. El conjunto $\mathbb{N}$ con las operaciones binarias de suma y producto es un semianillo conmutativo.

Más adelante…

Este sólo fue un pequeño paréntesis para comenzar a hablar de operaciones binarias y de estructuras algebraicas. Ahora regresaremos a seguir construyendo de manera formal los sistemas numéricos con los que se trabaja usualmente: los enteros, los racionales, los reales y los complejos.

Un poco más adelante haremos otro paréntesis de estructuras algebraicas, en el que hablaremos de otras propiedades más que puede tener una operación binaria. Una muy importante es la existencia de inversos para la operación binaria. Esto llevará a las definiciones de otras estructuras algebraicas como los grupos, los anillos, los semigrupos con inversos, los quasigrupos y los campos.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Encuentra el neutro de la operación $\star$ dada en la sección de intuición. Verifica que en efecto es un neutro.
Demuestra que el conjunto de los naturales pares $\{0,2,4,6,\ldots\}$ sí tiene un neutro para la operación de suma, pero no para la operación de producto.
Considera el conjunto $P(S)$ de subconjuntos de un conjunto $S$. Considera las operaciones binarias de unión e intersección de elementos de $P(S)$. Muestra que $P(S)$ con estas operaciones es un semianillo conmutativo.
Da un ejemplo de un magma que no sea un magma unital. Da un ejemplo de un magma unital que no sea un monoide.
Da o busca un ejemplo de un semianillo que no sea un semianillo conmutativo.

Entradas relacionadas

Ir a Álgebra Superior II
Entrada anterior del curso: Compatibilidad del orden con las operaciones de los naturales
Siguiente entrada del curso: Construcción de los enteros y su suma

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: El orden en los enteros

Por Ana Ofelia Negrete Fernández

Deja un comentario

Introducción

En las entradas anteriores introdujimos al conjunto de los números enteros, así como sus operaciones de suma y producto. Lo que haremos ahora es ver cómo ordenar a los elementos en $\mathbb{Z}$. Lo haremos de una forma similar a la que hicimos lo de las operaciones: usando las nociones que ya teníamos definidas en $\mathbb{N}$.

Como recordatorio, en $\mathbb{N}$ dijimos que $a<b$ cuando $a\in b$. De esta noción de «menor que» dimos la noción de «menor o igual que», diciendo que $a\leq b$ cuando ya sea que $a<b$ o bien $a=b$. Vimos que esta relación $\leq$ define un orden parcial en $\mathbb{N}$ que además es tricotómico. Quizás los resultados más importantes para trabajar con esta noción de desigualdad fue ponerla en términos de suma de elementos en $\mathbb{N}$:

En $\mathbb{N}$ se cumple que $a<b$ si y sólo si existe un natural $k>0$ tal que $a+k=b$.
En $\mathbb{N}$ se cumple que $a\leq b$ si y sólo si existe un natural $k$ tal que $a+k=b$.

Con esto en mente, veamos ahora cómo construir un orden en $\mathbb{Z}$. Antes de hacer eso, conviene primero pensar en números positivos, negativos y el cero.

Los positivos, los negativos y el cero en $\mathbb{Z}$

Ya sabemos que la identidad aditiva en $\mathbb{Z}$ es la clase $\overline{(0,0)}$, que también se puede pensar como la clase $\overline{(a,a)}$ para cualquier $a$ en $\mathbb{N}$. Si tenemos cualquier otra clase $\overline{(a,b)}$, por tricotomía del orden en $\mathbb{N}$ nos quedan sólo otras dos opciones: o bien $a<b$, o bien $b<a$. Esto nos ayudará a definir la noción de positividad y negatividad.

Definición. Sea $\overline{(a,b)}$ un entero. Diremos que ${(a,b)}$ es:

Cero si $a=b$,
Positivo si $a>b$ y
Negativo si $a<b$.

Una vez más, por la tricotomía del orden en $\mathbb{N}$, siempre sucede exactamente una de las posibilidades anteriores. Es importante ver que esta definición está bien hecha, es decir, que no depende de la clase de equivalencia que se eligió. Por ejemplo, si $\overline{(a,b)}$ es positivo, sucede que $a>b$. Si tomamos $(c,d)$ tal que $(a,b)\sim (c,d)$, nos gustaría ver que también sucede $c>d$. Esto se debe a que $a+d=b+c$. Si tuviéramos $c\leq d$, entonces nos pasaría que $a+d>b+c$ y tendríamos una contradicción. Así, por tricotomía debe pasar $c>d$. El caso de la negatividad se verifica de manera análoga.

Recuerda que el inverso aditivo de un entero $\overline{(a,b)}$ es el entero $-\overline{(a,b)}=\overline{(b,a)}$. Así, si $\overline{(a,b)}$ es positivo, entonces su inverso aditivo es negativo y viceversa.

Definición. Usaremos la letra $P$ para referirnos al conjunto de todos los enteros positivos. Usaremos $-P$ para referirnos al conjunto de todos los enteros negativos.

¿Cómo se comportan estas definiciones con las operaciones que ya tenemos en $\mathbb{Z}$? Ahora tenemos todo lo necesario para poder formalizar oraciones como «negativo por negativo es positivo», o «positivo más positivo es positivo.

Proposición. En $\mathbb{Z}$ se cumple todo lo siguiente:

Si $\overline{(a,b)}$ y $\overline{(c,d)}$ están en $P$, entonces su suma está en $P$ y su producto también.
Si $\overline{(a,b)}$ y $\overline{(c,d)}$ están en $-P$, entonces su suma está en $-P$ y su producto está en $P$.

Demostración. Todas estas afirmaciones se traducen a proposiciones que debemos demostrar en $\mathbb{N}$. En el caso de la primera, debemos ver que si $a>b$ y $c>d$, entonces $a+c>b+d$ y que $ac+bd>ad+bc$. Lo primero es sencillo, pues sale de la compatibilidad de $>$ con la suma de $\mathbb{N}$. Demostremos entonces que $ac+bd>ad+bc$.

Como $a>b$, existe un natural $k>0$ tal que $a=b+k$. Como $c>d$, existe un natural $l>0$ tal que $c=d+l$. Haciendo estas substituciones de $a$ y $c$ en $ac+bd>ad+bc$, obtenemos la siguiente cadena de desigualdades que son equivalentes a lo que debemos demostrar:

\begin{align*}
ac+bd&>ad+bc\\
(b+k)(d+l)+bd&>(b+k)d+b(d+l)\\
bd+bl+kd+kl+bd&>bd+kd+bd+bl.
\end{align*}

La última de estas desigualdades se cumple pues a la izquierda tenemos todos los sumandos que del lado derecho, y además el sumando $kl$ que como $k>0$ y $l>0$, entonces cumple $kl>0$.

Las demostraciones para cuando los elementos son negativos quedan como tarea moral.

$\square$

Al conjunto de enteros positivos también se le conoce en ocasiones como $\mathbb{Z}^+$, y al de enteros positivos también se le conoce como $\mathbb{Z}^-$.

El orden en $\mathbb{Z}$

Estamos listos para definir el orden en $\mathbb{Z}$. Aprovecharemos que ya podemos restar para poner la definición de orden en términos de esta operación.

Definición. Para $\overline{(a,b)}$ y $\overline{(c,d)}$ elementos en $\mathbb{Z}$ diremos que $\overline{(c,d)}<\overline{(a,b)}$ si $\overline{(a,b)}-\overline{(c,d)}$ es un entero positivo.

En realidad la expresión $\overline{(a,b)}-\overline{(c,d)}$ es simplemente $\overline{(a+c,b+d)}$, así que otra forma de escribir la condición de la definición es simplemente pedir que $a+c>b+d$. Como siempre sucede que o bien $a+c>b+d$, o que $a+c<b+d$, o que $a+c=b+d$ (y sólo una de ellas), entonces de manera inmediata obtenemos la tricotomía en $\mathbb{Z}$.

Proposición. Para $\overline{(a,b)}$ y $\overline{(c,d)}$ elementos en $\mathbb{Z}$ siempre sucede exactamente alguna de las siguientes:

$\overline{(a,b)}<\overline{(c,d)}$
$\overline{(c,d)}<\overline{(a,b)}$
$\overline{(a,b)}=\overline{(c,d)}$

Como en el caso de los naturales, a partir de la definición de «menor estricto» es sencillo obtener la noción de «menor o igual».

Definición. Para $\overline{(a,b)}$ y $\overline{(c,d)}$ elementos en $\mathbb{Z}$ diremos que $\overline{(c,d)}\leq \overline{(a,b)}$ si o bien $\overline{(a,b)}-\overline{(c,d)}$ es un entero positivo, o bien $\overline{(a,b)}=\overline{(c,d)}$.

Lo anterior es equivalente a pedir que $a+c\geq b+d$.

Proposición. La relación $\leq$ es un orden parcial en $\mathbb{Z}$.

Demostración. Es inmediato que esta relación $\leq$ es reflexiva, pues $\overline{(a,b)}\leq \overline{(a,b)}$ se obtiene de manera inmediata de la segunda parte de la definición.

Para ver que es antisimétrica, si tuviéramos $\overline{(c,d)}\leq \overline{(a,b)}$ y $\overline{(a,b)}\leq \overline{(c,d)}$, entonces tendríamos las desigualdades $a+c\geq b+d$ y $b+d\geq a+c$, que por la antisimetría en $\mathbb{N}$ implican que $a+c=b+d$, que justo es $\overline{(a,b)}=\overline{(c,d)}$.

Finalmente, para ver que $\leq$ es una relación transitiva, comenzamos con enteros $\overline{(a,b)}, \overline{(c,d)}, \overline{(e,f)}$ tales que $\overline{(e,f)}\leq \overline{(c,d)}$ y $\overline{(c,d)}\leq \overline{(a,b)}$.

De la primer desigualdad obtenemos $c+f\geq e+d$ y de la segunda obtenemos que $a+d\geq b+c$. Sumando ambas desigualdades, obtenemos que $c+f+a+d\geq b+c+e+d$. De aquí podemos deducir que $a+f\geq b+e$. Esto precisamente nos dice que $\overline{(e,f)}\leq \overline{(a,b)}$, como queríamos.

$\square$

Las dos proposiciones anteriores se pueden resumir en el siguiente enunciado.

Teorema. La relación $\leq$ es un orden total en $\mathbb{Z}$.

Compatibilidad del orden con las operaciones en $\mathbb{Z}$

Lo último que nos queda por mencionar es cómo se comporta la relación $\leq$ en $\mathbb{Z}$ con sus operaciones de suma y producto. A continuación mencionamos algunas de las propiedades que se cumplen, aunque hay varias cosas más que se pueden demostrar.

Proposición. En $\mathbb{Z}$ se cumple lo siguiente:

Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}\leq \overline{(g,h)}$, entonces $$\overline{(a,b)}+\overline{(e,f)}\leq \overline{(c,d)}+\overline{(g,h)}.$$
Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}$ es positivo, entonces $$\overline{(a,b)}\overline{(e,f)}\leq \overline{(c,d)}\overline{(e,f)}.$$
Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}$ es negativo, entonces $$\overline{(c,d)}\overline{(e,f)}\leq \overline{(a,b)}\overline{(e,f)}$$

Demostración.

Las hipótesis se pueden escribir como $a+d\leq b+c$ y $e+h\leq f+g$. Sumando ambas y asociando de un modo que nos convenga, obtenemos que $(a+e)+(d+h)\leq (b+f)+(c+g)$. Esto lo que nos dice es que $\overline{(a+e,b+f)}\leq $\overline{(c+g,d+h)}$, que es precisamente lo que queríamos demostrar.
Por la hipótesis, tenemos que $\overline{(c,d)}-\overline{(a,b)}$ es positivo y que $\overline{(e,f)}$ también. Por lo que ya vimos antes, el producto de estos dos enteros debe ser entonces positivo. Por distributividad, este producto es $\overline{(c,d)}\overline{(e,f)}-\overline{(a,b)}\overline{(e,f)}$. Así, $\overline{(a,b)}\overline{(e,f)}\leq \overline{(c,d)}\overline{(e,f)},$ como queríamos.
Por la hipótesis, tenemos que $\overline{(c,d)}-\overline{(a,b)}$ es positivo y que $\overline{(e,f)}$ es negativo. Entonces $\overline{(f,e)}=-\overline{(e,f)}$ es positivo. Por lo que ya vimos antes, el producto de estos dos enteros debe ser entonces positivo. Por distributividad, este producto es $\overline{(c,d)}\overline{(f,e)}-\overline{(a,b)}\overline{(f,e)}$. Esta expresión se puede escribir de manera alternativa como $\overline{(a,b)}\overline{(e,f)}-\overline{(c,d)}\overline{(e,f)}$. Como es positiva, obtenemos justo lo que queríamos.

$\square$

En los ejercicios de la tarea moral explorarás más propiedades de la relación $\leq$ y cómo interactúa con las operaciones en $\mathbb{Z}$.

Más adelante…

Ya tenemos todo lo que necesitamos en los enteros: su definición, sus operaciones y su noción de orden. Sin embargo, aún tenemos una gran dificultad: es muy difícil escribirlos. Cada que queremos referirnos a un entero, debemos usar la clase de equivalencia de una pareja de naturales. Nos gustaría que los enteros fueran algo mucho más intuitivo: los naturales y sus negativos. Lo que haremos en la siguiente entrada es ver cómo formalizar esta idea para que podamos, finalmente, abandonar la notación de parejas de naturales y relaciones de equivalencia. Esto será bastante útil para después entrar en muchas otras propiedades que nos interesan de los enteros como la noción de divisibilidad y otras propiedades aritméticas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Completa las demostraciones de las nociones de positivo, negativo y orden en $\mathbb{Z}$ están bien definidas.
Demuestra que la suma de dos enteros negativos es un entero negativo y que su producto es un entero positivo. Haz una demostración que funcione en general, pero luego verifícalo «a mano» para los enteros $\overline{(3,7)}$ y $\overline{(9,11)}$.
En la entrada dimos la definición formal de $<$ y de $\leq$ en $\mathbb{Z}$, pero aún no hemos definido ni usado los símbolos $>$ y $\geq$ en $\mathbb{Z}$. Formaliza una definición para ellos. Demuestra que $\geq$ también es un orden total en $\mathbb{Z}$.
Demuestra que en $\mathbb{Z}$, si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}$ es negativo, entonces $$\overline{(a,b)}\overline{(e,f)}\geq \overline{(c,d)}\overline{(e,f)}.$$
Determina si la siguiente propiedad del producto y el orden en $\mathbb{Z}$ siempre es verdadera, o bien si hay ocasiones en las que falla: «Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}\leq \overline{(g,h)}$, entonces $$\overline{(a,b)}\overline{(e,f)}\leq \overline{(c,d)}\overline{(g,h)}.»

Entradas relacionadas

Ir a: Álgebra Superior II
Entrada anterior del curso: El producto en los enteros
Siguiente entrada del curso: Inmersión de $\mathbb{N}$ en $\mathbb{Z}$

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»