Álgebra Lineal II: Matrices similares y su polinomio característico

Por Julio Sampietro

Introducción

En esta entrada exploramos otros aspectos del polinomio característico. Principalmente nos encargamos de comparar los polinomios característicos de matrices similares, así como los de dos productos (recordamos que el producto de matrices no es conmutativo).

Matrices similares

Recuerda que dos matrices $A,B\in M_n(F)$ se dicen similares si representan a la misma transformación lineal en $F^n$ en bases posiblemente diferentes de este espacio. Equivalentemente, $A$ y $B$ son similares si existe $P\in GL_n(F)$ tal que $B=PAP^{-1}$: o sea, si son conjugadas por una matriz invertible.

Una propiedad importante que veremos enseguida es que el polinomio característico es invariante bajo similitud de matrices. Más precisamente tenemos el siguiente:

Teorema. Dos matrices similares tienen el mismo polinomio característico.

Demostración. Supón que $A$ y $B$ son dos matrices similares, entonces existe $P$ invertible tal que $B=PAP^{-1}$. Nota que

\begin{align*}
X I_n-B=XPP^{-1}-PAP^{-1}= P(X I_n-A)P^{-1}.
\end{align*}

Ahora vamos a dar por hecho que el determinante está definido y es multiplicativo para matrices con entradas en $F[X]$. Definirlo no es complicado: Si $A$ es una matriz de la forma $[a_{ij}]$ con $a_{ij}\in F[X]$ ponemos

\begin{align*}
\det A=\sum_{\sigma\in S_n} \operatorname{sign}(\sigma) a_{1\sigma(1)}\cdots a_{n\sigma(n)}.
\end{align*}

Es decir, la definición es la misma que la usual. Sin embargo, resulta un poco más difícil el argumentar que con esta definición el determinante sigue siendo multiplicativo (especialmente si $F$ es finito). Por esto solo asumiremos que lo es.

Tenemos tres matrices de este estilo en juego: $P, XI_n-A$ y $XI_n-B$. Vista como una matriz con entradas en $F[X]$, $P$ sigue siendo invertible y su inversa es $P^{-1}$ (lo puedes pensar como que solo estamos ‘expandiendo los posibles coeficientes’). Entonces

\begin{align*}
\chi_B(X)&=\det(X I_n -B)\\
&= \det(P)\cdot \det(X I_n-A)\cdot \det(P)^{-1}\\
&= \det(XI_n-A)\\
&=\chi_A(X).
\end{align*}

Esto concluye la demostración.

$\square$

Ejemplos y consecuencias del teorema

Aquí vienen unos problemas y definiciones a partir del teorema anterior.

Problema. Demuestra que si $A,B\in M_n(F)$ son dos matrices entonces $AB$ y $BA$ tienen el mismo polinomio característico. Puedes asumir que $F=\mathbb{R}$ o $F=\mathbb{C}$ por simplicidad.

Solución. Si $A$ es invertible, entonces $AB$ y $BA$ son similares, puesto que

\begin{align*}
AB= ABAA^{-1}= A(BA)A^{-1}.
\end{align*}

Usando el teorema anterior queda demostrado este caso.

Por otro lado, si $A$ no es invertible al menos sabemos que tiene una cantidad finita de eigenvalores. Como estamos asumiendo que $F=\mathbb{R}$ o $F=\mathbb{C}$, en cualquier caso tenemos que $F$ es infinito. Así existen infinitos $\lambda\in F$ tales que $A_{\lambda}:= A-\lambda \cdot I_n$ es una matriz invertible.

Ahora, tomemos cualquier escalar fijo $X$ que queramos. Por el primer párrafo, para cualquier $\lambda$ que hace a $A_\lambda$ invertible se cumple que

\begin{align*}
\det (XI_n-A_{\lambda} B)= \det(XI_n-BA_{\lambda}).
\end{align*}

Otra manera de escribir esto es

\begin{align*}
\det (XI_n-AB+\lambda B)-\det(XI_n- BA + \lambda B)=0.
\end{align*}

Pero observa que el lado izquierdo es una expresión polinomial en $\lambda$ que se está anulando en una infinidad de valores de $\lambda$, de modo que la expresión izquierda debe ser el polinomio cero y en particular, evaluando en $\lambda=0$ obtenemos que

\begin{align*}
\det (XI_n-AB)-\det(XI_n-BA)=0.
\end{align*}

En otras palabras, para todo valor de $X$ hemos demostrado que $$\det (XI_n-AB)=\det (XI_n-BA),$$ es decir, que $AB$ y $BA$ tienen el mismo polinomio característico.

$\square$

Más adelante…

En la siguiente entrada daremos una introducción al teorema de Cayley-Hamilton, y después nos lanzaremos a ver aplicaciones así como a dar dos demostraciones completas.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación y sirven para revisar los conceptos de esta entrada.

  1. Encuentra dos matrices $A$ y $B$ que no sean similares pero tengan el mismo polinomio característico y el mismo polinomio mínimo.
  2. ¿Existen dos matrices $A$ y $B$ en $M_2(\mathbb{R})$ que tengan el mismo polinomio mínimo, el mismo polinomio característico pero no sean similares?
  3. Considera las siguientes matrices con coeficientes reales
    \begin{align*}
    A=\begin{pmatrix} 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 &0\\ 0 &0 &0 &1 &0\\0 & 0 &0 &0 &0\\ 0 & 0 &0 &0 &0\end{pmatrix}, B=\begin{pmatrix} 0 & 1 & 0 & 0 &0 \\ 0 & 0& 1 & 0 &0\\ 0 & 0 & 0 & 0 &0\\ 0 & 0 &0 & 0 &0\\ 0& 0 & 0 &0 &0\end{pmatrix}, C=\begin{pmatrix} 0 & 1 & 0 & 0 &0\\ 0 & 0 & 1 & 0 &0 \\ 0&0 &0 &0 &0 \\ 0 & 0 &0 &0 & 1\\ 0 &0 &0 &0 &0\end{pmatrix}.
    \end{align*}
    Calcula el polinomio característico de cada una. Sugerencia. Usa la entrada anterior.
  4. Calcula el polinomio mínimo de cada una. Concluye que $A$ no es similar a $B$ o a $C$.
  5. Computa la dimensión de los kernels de cada una. Concluye que $B$ no es similar a $C$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior II: Definición del producto y sus propiedades básicas

Por Roberto Manríquez Castillo

Introducción

En la entrada anterior, nos dedicamos a buscar una definición apropiada para la suma de números naturales, y después nos dedicamos a probar las propiedades más elementales que esta operación satisface.

Ahora es el turno de la multiplicación o producto, que se definirá de forma similar a la suma, ya que ocuparemos el teorema de Recursión Débil, y para probar sus propiedades ocuparemos el principio de Inducción.

Te motivamos a releer la entrada anterior y pensar unos momentos en el ejercicio 5 de la entrada anterior.

Definición del producto

Así como con la suma, recurriremos a una definición recursiva, la cual existe en virtud del teorema de Recursión.

Definición. Sea $m\in\mathbb{N}$, defnimos la función $p_{m}:\mathbb{N}\longrightarrow\mathbb{N}$, como la función que satisface las propiedades siguientes:

  1. $p_{m}(0)=0$.
  2. $p_{m}(\sigma(n))=s_{m}((p_{m}(n))$.

Denotaremos a $p_{m}(n)$ como $m\cdot n$, o simplemente como $mn$

Ejemplo. Para aclarar la definición anterior, consideremos $p_{7}$ y realicemos el diagrama conmutativo correspondiente a su definición recursiva.

Recordemos que las flechas indican a donde es mandado cada elemento bajo cada función, entonces las flechas verticales, justamente son las que nos indican los valores de $p_{7}$ en cada número natural, observemos que estos valores coinciden con la conocida tabla del $7$.

$\triangle$

Aprendiendo a multiplicar por uno

En este momento, demostraremos las propiedades más importantes del producto. Tenemos la fortuna de que contamos con una buena cantidad de propiedades de las funciones $s_{n}$, las cuales ya podremos usar sin ningún problema, más aún, para simplificar la notación haremos uso de la notación $m+n$, en vez de la notación $s_{m}(n)$, cada vez que se pueda.

Siguiendo la idea anterior, mencionamos la siguiente identidad, que es solo una reformulación del punto (2) de la definición del producto, pero que nos servirá para esclarecer la mayor parte de las pruebas.

Observación. $a\cdot\sigma(n)=a+(a\cdot n)$.

Para referir a esta observación en una demostración ocuparemos el símbolo $\overset{*}{=}$.

Proposición. Para toda $n\in\mathbb{N}$, se tiene que $p_{1}(n)=n$, es decir, $1\cdot n=n$

Demostración. Como se esperaba, la prueba es por inducción sobre $n$.

Base inductiva: Por la definición de $p_{1}$, tenemos que $p_{1}(0)=0$.

Hipótesis de inducción: Supongamos que para algún $n$, se tiene que $p_{1}(n)=n$

Paso inductivo: Debemos demostrar que $p_{1}(\sigma(n))=\sigma(n)$, esto se sigue por las siguientes igualdades

\begin{align*}
p_{1}(\sigma(n))&\overset{*}{=}1+(p_{1}(n))\\ &\overset{\text{H.I.}}{=}1+n=\sigma(n).
\end{align*}

Donde la última igualdad se da recordando que en la entrada anterior probamos que $s_{1}(n)=\sigma(n)$.

$\square$

Con esto hemos aprendido a multiplicar por $1$.

Aprendiendo a multiplicar por cero

Proposición. Para toda $n\in\mathbb{N}$, se tiene que $p_{0}(n)=0$.

Demostración. Procedamos por inducción sobre $n$, la base inductiva es directa de la definición, ya que $p_{0}(0)=0$.

Nuestra hipótesis de inducción consiste en suponer que para alguna $n$ se tiene que $p_{0}(n)=0$. Entonces queda demostrar que $p_{0}(\sigma(n))=0$. Esto se sigue de las siguientes igualdades.

\begin{align*}
p_{0}(\sigma(n))&\overset{*}{=}0+p_{0}(n)\\ &\overset{\text{H.I.}}{=}0+0=0
\end{align*}

$\square$

La propiedad distributiva izquierda

La siguiente propiedad es una de las más famosas, ya que nos permitirá relacionar la suma y el producto, además jugará un papel importante en la demostración de las siguientes propiedades.

Proposición (propiedad distributiva izquierda). Si $a,b,n$ son números naturales, entonces $p_{s_{a}(b)}(n)=s_{p_{a}(n)}(p_{b}(n))$, u ocupando la notación familiar $(a+b)\cdot n=(a\cdot n)+(b\cdot n)$.

Demostración. Procedamos por inducción, como podrás notar con todas estas demostraciones, la inducción será sobre la variable que aparezca más a la derecha de nuestras expresiones, es decir, la inducción será sobre $n$.

Base inductiva: Por la definición del producto tenemos que, $(a+b)\cdot 0=0$, y por las propiedades que demostramos para la suma, concluimos que $0=0+0$, sin embargo; de nuevo por la definición del producto, $0=(a\cdot n)$ y $0=(b\cdot n)$, uniendo todas estas igualdades concluimos que $(a+b)\cdot 0=(a\cdot n)+(b\cdot n)$, justo como queremos.

Hipótesis de inducción: Supongamos que para algún $n$ se tiene que $(a+b)\cdot n=(a\cdot n)+(b\cdot n)$.

Paso inductivo: Debemos probar que $(a+b)\cdot\sigma(n)=(a\cdot\sigma(n))+(b\cdot\sigma(n))$. Por la observación que hicimos, tenemos

\begin{align*}
(a+b)\cdot\sigma(n)&\overset{*}{=}(a+b)+((a+b)\cdot n)\\ &\overset{\text{H.I.}}{=}(a+b)+((a\cdot n)+(b\cdot n))
\end{align*}

A partir de aquí, el resultado se seguirá usando la asociatividad y la conmutatividad de la suma, en la siguiente cadena de igualades detallamos la demostración paso a paso ¿Puedes identificar cómo ocupamos las propiedades de la suma?.

\begin{align*}
(a+b)+((a\cdot n)+(b\cdot n))&=a+(b+((a\cdot n)+(b\cdot n)))\\
&=a+((b+(a\cdot n))+(b\cdot n))\\
&=a+(((a\cdot n)+b)+(b\cdot n))\\
&=a+((a\cdot n)+(b+(b\cdot n)))\\
&=(a+(a\cdot n))+(b+(b\cdot n))\\
&\overset{*}{=}(a\cdot \sigma (n))+(b\cdot \sigma (n))
\end{align*}

$\square$

Aunque la prueba anterior fue un poco más confusa que las anteriores, las consecuencias que tendrá esta proposición serán sumamente importantes.

El producto es conmutativo

Como mencionamos, la asociatividad y la conmutatividad, serán una consecuencia de las propiedades distributivas, por el momento veamos que en efecto el producto conmuta.

Proposición (conmutatividad). Si $m,n\in \mathbb{N}$, entonces $m\cdot n=n\cdot m$.

Demostración. Una vez más hagamos la prueba por inducción sobre $n$

Base inductiva: Por definición tenemos que $m\cdot 0 =0$, además $p_{0}(m)=0$ por lo demostrado antes, es decir que $m\cdot 0=0=0\cdot m$

Hipótesis de inducción: Supongamos que para alguna $n$, se tiene que $m\cdot n=n\cdot m$.

Paso inductivo: Debemos probar que $m\cdot\sigma(n)=\sigma(n)\cdot m$. Esto se sigue ya que

\begin{align*}
m\cdot\sigma(n)&\overset{*}{=}m+(m\cdot n)\\
&\overset{\text{H.I.}}{=}m+(n\cdot m)
\end{align*}

Pero ya demostramos que $m=1\cdot m$, usando esto y la propiedad ditributiva, podemos concluir que

\begin{align*}
m+(n\cdot m)&=(1\cdot m )+(n\cdot m)\\
&=(1+n)\cdot m=\sigma(n)\cdot m
\end{align*}

$\square$

Con la conmutatividad, podemos probar de manera inmediata el siguiente resultado

Corolario (propiedad distributiva derecha). Si $a,b,n$ son números naturales, entonces $a\cdot(b+ n)=(a\cdot b)+(a\cdot n)$.

La prueba queda como un ejercicio moral, en parte porque su prueba no requiere Inducción. Con este resultado, podemos probar la propiedad asociativa del producto.

El producto es asociativo

Con la propiedad distributiva derecha , podemos dar la demostración de la propiedad asociativa del producto.

Proposición (asociatividad). Si $a,b,n$ son números naturales, se tiene que $a\cdot(b\cdot n)=(a\cdot b)\cdot n$.

Demostración. De nuevo procedamos por inducción sobre $n$

Base inductiva: Notemos que por definición, para cualquier número natural $m$ se tiene que $0=p_{m}(0)=m\cdot 0$. Con esto en mente tenemos que, $(a\cdot b)\cdot(0)=0=a\cdot 0=a\cdot(b\cdot 0)$ que es justo la base de inducción.

Hipótesis de Inducción: Supongamos que para alguna $n\in \mathbb{N}$, tenemos que $(a\cdot b)\cdot n=a\cdot(b\cdot n)$

Paso Inductivo: Demostremos que $(a\cdot b)\cdot\sigma(n)=a\cdot(b\cdot \sigma(n))$. Como

\begin{align*}
(a\cdot b)\cdot\sigma(n)&\overset{*}{=}(a\cdot b)+(a\cdot b)\cdot n\\
&\overset{\text{H.I.}}{=}(a\cdot{b})+a\cdot(b\cdot n)\\
&=a\cdot (b+b\cdot n)\\
&\overset{*}{=}a\cdot(b\cdot \sigma (n))
\end{align*}

la igualdad que no está justificada es la aplicación de la propiedad distributiva.

$\square$

Ley de la cancelación

Para concluir con las propiedades del producto, enunciamos la propiedad de la cancelación del producto, recordemos que esta propiedad también es válida para la suma. Para hacer esta prueba necesitamos trabajar un poco.

Recordemos el ejercicio 2 de la Tarea moral de la entrada Principio de inducción y teoremas de recursión, el cual ya hemos ocupado anteriormente:

Si $n\neq0$, entonces existe $a\in \mathbb{N}$ tal que $n=\sigma(a)$

De la misma forma, el ejercicio 1 de la Tarea moral de la entrada pasada dice que:

Si $a,b\in\mathbb{N}$ son tales que $a+b=0$, entonces $a=b=0$

Con estos resultados en mente probamos el siguiente lema.

Lema. Si $n\neq 0$ y $m\in \mathbb{N}$ es tal que $m\cdot n=0$, entonces $m=0$.

Demostración. Como $n\neq0$, entonces existe $a\in \mathbb{N}$, tal que $n=\sigma(a)$, entonces tenemos que

\begin{align*}
0&=m\cdot n\\
&=m\cdot\sigma(a)\\
\overset{*}{=}m+(m\cdot a).
\end{align*}

Entonces tenemos que $m\cdot a=0$ y que $m=0$ que es lo que debíamos probar.

$\square$

Es común usar una equivalencia lógica del enunciado anterior, la cual dice:

Si $n,m\in \mathbb{N}\setminus\{0\}$, entonces $n\cdot m\in \mathbb{N}\setminus\{0\}$

Proposición (ley de cancelación). Si $m,n$ son números naturales y $a\neq0$ y cumplen que $a\cdot n=a\cdot m$, entonces, $n=m$

Demostración. De nuevo, procedamos por inducción sobre $n$

Base inductiva: Supongamos que $n=0$ y $a\neq0$, entonces $a\cdot m=a\cdot n=a\cdot0 =0,$ por el Lema tenemos que $m=0=n$.

Hipótesis de inducción: Supongamos que para algún $n$, tenemos que si $a\neq0$ y $a\cdot n=a\cdot m$, entonces $n=m$.

Paso inductivo: Probemos para $\sigma(n)$, sea $a\neq 0$ y supongamos que $a\cdot\sigma(n)=a\cdot m$.

Como $\sigma(n)\neq 0$, y por hipótesis, $a\neq0$, entonces por la equivalencia del lema, concluimos que $a\cdot\sigma(n)\neq 0$, de donde $a\cdot m\neq 0$, esto implica que $m\neq 0$, por lo que existe $b$ tal que $m=\sigma(b)$, entonces podemos escribir

\begin{align*}
a+a\cdot n& \overset{*}{=}a\cdot\sigma(n)\\
&=a\cdot m\\
&=a\cdot\sigma(b)\\
&\overset{*}{=}a+a\cdot b
\end{align*}

Ocupando la ley de cancelación de la suma, tenemos que $a\cdot n=a\cdot b$.

Pero por hipótesis de inducción debemos de tener que $n=b$, esto quiere decir que $\sigma(n)=\sigma(b)=m$, justo como debíamos probar.

$\square$

Con esta prueba concluimos las propiedades más fundamentales del producto.

Resumen de las propiedades del producto

Para finalizar con la entrada, haremos un compendio de las propiedades que demostramos

  • Para todo $n$ natural, se tiene que $1\cdot n=n=n \cdot 1$
  • Para todo $n$ natural, se tiene que $0\cdot n=0=n \cdot 0$
  • Para $l,m,n$ naturales cualesquiera se tiene que $(l+m)\cdot n=(l\cdot n)+(m\cdot n)$
  • Para $m,n$ naturales se tiene que $m\cdot n=n\cdot m$
  • Para $l,m,n$ naturales cualesquiera se tiene que $l\cdot(m+n)=(l\cdot m)+(l\cdot n)$
  • Para $l,m,n$ naturales cualesquiera se tiene que $(l\cdot m)\cdot n=l\cdot(m\cdot n)$
  • Para $m,n$ naturales con $m\neq 0$, si $m\cdot n=0$, entonces $n=0$
  • Para $l,m,n$ naturales con $l\neq 0$, si $l\cdot n=l\cdot m$, entonces $n=m$

Más adelante…

Con las propiedades de la suma y del producto en nuestra bolsa de herramientas, tenemos ya una rica teoría que desarrollar; nos falta aún definir una relación muy familiar en el conjunto $\mathbb{N}$, el orden, al cual ya hemos apelado en la demostración del teorema de la Recursión Débil.

Por el momento estudiaremos con mayor detalle los conjuntos infinitos, donde veremos la importancia de los naturales dentro de esta clase de conjuntos.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Prueba la Propiedad distributiva derecha.
  2. Usando únicamente la ley de cancelación el producto, demuestra el Lema previo a la demostración de la ley de cancelación.
  3. ¿Qué pasa si en el enunciado de la ley de la cancelación, no asumimos que $a\neq 0$?
  4. Demuestra usando el Lema previo a la demostración de la ley de cancelación que si $n,m\in \mathbb{N}\setminus\{0\}$, entonces $n\cdot m\in \mathbb{N}\setminus\{0\}$.
  5. Da una definición recursiva de las funciones $\eta_{m} (n)=m^n$ y prueba las leyes de los exponentes.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: Definición de la suma y sus propiedades básicas

Por Roberto Manríquez Castillo

Introducción

Para continuar con nuestra tarea de construir las operaciones más elementales de los números naturales, en esta entrada definimos la conocida operación suma. Un buen ejercicio antes de empezar con el contenido de la entrada, es pensar ¿Cómo podemos definir la suma de dos números enteros? De nuevo nos encontramos con el problema de intentar definir formalmente algo que ha sido intuitivo para nosotros durante la mayor parte de nuestra vida.

Sin embargo, todo el trabajo que hicimos en las entradas anteriores, especialmente en la demostración del teorema de Recursión, nos servirán para poder dar una definición precisa de qué es la suma. Además, usando el principio de Inducción, podremos demostrar las propiedades que nos han sido tan familiares desde hace mucho tiempo.

La idea intuitiva de la suma

La primera forma en la que aprendimos a sumar, al menos de manera intuitiva y tal vez limitada, fue usando nuestros dedos. Ocuparemos esta idea como hilo conductor, para poder llegar a la definición recursiva de la suma. Con esta forma de pensar, si queríamos sumar $3+4$, poníamos frente a nosotros nuestras manos con los dedos abajo, e instantáneamente mencionábamos la palabra «tres«. Después estirábamos un primer dedo y al mismo tiempo, mencionábamos la palabra «cuatro» (a quien ahora conocemos como el sucesor de $3$), después alzábamos un segundo dedo y decíamos «cinco» (el sucesor de $4$) , y continuábamos de la misma manera hasta que tuviéramos cuatro dedos totalmente extendidos; momento en el cual, decíamos el resultado: «siete«.

Analicemos un poco qué es lo que queremos decir con «continuábamos de la misma manera«. Entre cada número que contábamos, varias cosas pasaban por nuestra mente. Al mencionar un número, lo primero que hacíamos era cerciorarnos que aún tuviéramos extendidos menos dedos de los que queríamos añadir. Si esta condición se satisfacía, teníamos que grabarnos el número que habíamos mencionado justo en ese instante (el olvidar dicho número, tenía como consecuencia empezar el procedimiento desde el inicio), después alzábamos el siguiente dedo, y mencionábamos el sucesor del número memorizado (es por esto que recordar ese número era tan importante). Muy a grandes rasgos esto es lo mismo que lo que haremos de manera formal.

Definición de la suma

Esperamos que en los párrafos anteriores puedas encontrar una analogía entre el algoritmo que usábamos para sumar cotidianamente, y el método recursivo que describiremos a continuación. Antes de precisar la definición de la suma, hay que aclarar que no definiremos «de golpe» qué quiere decir «sumar dos números». Más bien, lo que haremos es, para cada natural, decir qué quiere decir «sumarle otro». Lo haremos de esta manera pues esto es lo que nos permite hacer el teorema de Recursión. Así, para cada número natural $m$ (fijo) obtendremos una función que nos sume a ese número fijo, una cantidad arbitraria.

Definición: Sea $m\in\mathbb{N}$. Definimos la función $s_{m}:\mathbb{N}\longrightarrow\mathbb{N}$, como la única función que satisface las propiedades siguientes:

  1. $s_{m}(0)=m$.
  2. $s_{m}(\sigma(n))=\sigma(s_{m}(n))$.

Denotaremos $s_{m}(n)$ como $m+n$.

Vale la pena hacer un par de comentarios de la definición anterior. Primero mencionamos que esta definición depende totalmente del teorema de Recursión Débil. Si regresas al enunciado del teorema, podemos notar que la función $s_m$ se obtiene tomando $X=\mathbb{N}$, $x_{0}=m$, $f=\sigma$ y $g=s_{m}$.

En segundo lugar, hay que remarcar que a pesar de nuestra intuición, los papeles de $m$ y $n$ en la expresión $m+n$, no son intercambiables. Por definición $m+n=s_{m}(n)$, mientras que $n+m=s_{n}(m)$. A primera vista, estos valores no tienen por qué coincidir. Veremos que en efecto esta y otras propiedades sí son válidas, para que posteriormente podamos utilizarlas de manera directa.

Aprender a sumar cero

De aquí en adelante probaremos varias propiedades de la suma. Debido a la definición recursiva de esta función, la mayor herramienta que ocuparemos es el principio de Inducción.

Antes de lanzarnos a demostrar la primer propiedad, nota que directamente de las definiciones de las funciones $s_{m}$ y de la notación que estamos usando, se tiene que $m+0=s_m(0)=m$. Ahora nos gustaría ver que también $0+m=m$, pero como aún no sabemos que la suma sea conmutativa, tendremos que probarlo por inducción.

Proposición: Para todo $n\in\mathbb{N}$ se tiene que $s_{0}(n)=n$, es decir, $0+n=n$

Demostración. Como se mencionó, procedamos por inducción sobre $n$.

Base inductiva: Por el punto (1) de la definición de $s_0$, tenemos que s_{0}(0)=0.

Hipótesis inductiva: Supongamos que para algún $n\in\mathbb{N}$, se tiene que $s_{0}(n)=n$.

Paso inductivo: Demostremos que $s_{0}(\sigma(n))=\sigma(n)$.

La demostración se sigue de la siguiente cadena de igualdades, las cuales justificamos una a una abajo:

\begin{align*}
s_{0}(\sigma(n))&=\sigma(s_{0}(n)) \\&\overset{\text{H.I.}}{=}\sigma(n).
\end{align*}

La primera igualdad sucede por el punto (2) de la definición de $s_0$. La segunda igualdad sucede por la hipótesis inductiva, lo cual estamos indicando con un «H.I.» sobre el símbolo de igualdad.

Esto termina el paso inductivo y entonces la proposición se vale para todos los naturales.

$\square$

Así, ya sabemos «sumar cero».

Aprender a sumar uno

Veamos ahora que nuestra intuición de «sumar uno» en efecto coincide de manera formal con «ir al sucesor».

Observación: Tenemos la siguiente cadena de igualdades \[n+1=s_{n}(1)=s_{n}(\sigma(0))=\sigma(s_{n}(0))=\sigma(n).\]

La primera es por nuestra elección de notación. La segunda por la definición del símbolo 1, pues simplemente es el sucesor de 0. La tercera es por el punto (2) de la definición de $s_n$. Finalmente, la última es por el punto (1) de la definición de $s_n$.

$\triangle$

Proposición: Para todo $n\in\mathbb{N}$ se tiene que $s_{1}(n)=\sigma(n)$, es decir, que al juntarlo con la observación anterior obtenemos $1+n=\sigma(n)=n+1$.

Demostración. Demostremos que $s_1(n)=\sigma(n)$ por inducción sobre $n$. Tenemos que $s_{1}(0)=1=\sigma(0)$ por el punto (1) de la definición de $s_1$ y por la definición de 1. Esto muestra que la igualdad se cumple en el caso base $n=0$.

Nuestra hipótesis de inducción es suponer que $s_{1}(n)=\sigma(n)$ y a partir de ella debemos demostrar que $s_{1}(\sigma(n))=\sigma(\sigma(n))$. Esto lo logramos mediante la siguiente cadena de igualdades:

\begin{align*}
s_{1}(\sigma(n))&=\sigma(s_{1}(n))\\ &= \sigma(\sigma(n))
\end{align*}

La primera igualdad se debe al punto (2) de la definición de $s_1$. La segunda, a la hipótesis inductiva.

$\square$

La suma es asociativa

Con los resultados probados en las dos secciones anteriores, continuamos ahora probando propiedades más interesantes de la suma. Aunque las aprendimos desde la educación básica, ahora será momento de justificar por qué se deducen de lo que hemos construido. Empezamos por la asociatividad.

Proposición (asociatividad): Si $a, b, n$, son naturales arbitrarios, entonces $(a+b)+n=a+(b+n)$.

Como es usual, aquí los paréntesis significan «hacer esa operación primero». Si quisiéramos usar la notación formal, tendríamos que enunciar la asociatividad como $$s_{a+b}(n)=s_a(s_b(n)),$$ y cuando hagamos la demostración aprovecharemos la definición de estas funciones $s_{a+b}$, $s_a$ y $s_b$.

Demostración. Procedamos por inducción. Tenemos tres variables naturales. ¿Sobre cuál hacemos inducción? Esto es una decisión importante y el hacer una elección incorrecta puede dificultar la prueba o impedir concluirla. Haremos inducción sobre $n$, pero te recomendamos que intentes hacerlo sobre las otras variables para detectar las dificultades que pueden surgir.

Base inductiva: $(a+b)+0=a+b=a+(b+0)$. En el primer paso usamos el punto (1) de la definición de $s_{a+b}$ y en el segundo usamos el punto (1) de la definición de $s_b$.

Hipótesis inductiva: Supongamos que $(a+b)+n=a+(b+n)$. Recuerda que en una prueba inductiva sólo se hace la hipótesis inductiva para un valor fijo de $n$, pero lo que se quiere suponer es que se vale para todo valor de $n$. Así, no estamos suponiendo que cualquier $n$ pueda asociarse con cualesquiera dos números, solo estamos suponiendo que una $n$ fija puede asociarse con los valores fijos de $a$ y de $b$; más aún, el orden de $a$ y $b$ importa, ya que no hemos demostrado aún la conmutatividad.

Paso inductivo: Demostremos que $(a+b)+\sigma(n)=a+(b+\sigma(n))$.

Hagamos esto mediante la siguiente cadena de igualdades:

\begin{align*}
(a+b)+\sigma(n)&=\sigma((a+b)+n)\\
&\overset{\text{H.I}}{=}\sigma(a+(b+n))\\
&=a+\sigma(b+n)\\
&=a+(b+\sigma(n)).
\end{align*}

Aquí las igualdades se siguen, respectivamente, de la definición de $s_{a+b}$, de la hipótesis inductiva, de la definición de $s_a$ y de la definición de $s_b$. Con esto, concluimos la prueba del paso inductivo y con ello la prueba por inducción.

$\square$

En la demostración anterior ya no estamos siendo tan específicos con exactamente qué parte de la definición de las funciones estamos usando. Sin embargo, te sugerimos completar estos detalles pues te ayudarán a entender mucho mejor por qué cada uno de los pasos tiene su justificación.

La suma es conmutativa

Otra de las propiedades de la suma que nos enseñan en educación básica es que «el orden de los factores no afecta el resultado». Esto tiene un nombre en matemáticas formales: conmutatividad. El objetivo de la siguiente proposición es demostrar que en efecto la suma es conmutativa.

Proposición (conmutatividad): Si, $n, m$ son naturales, entonces $n+m=m+n$.

En términos de las funciones que construimos mediante el teorema de recursión esto se ve como $s_n(m)=s_m(n)$.

Demostración. De nuevo, procedamos por inducción sobre $n$, por la misma razón remarcamos que entonces $m$ es un número arbitrario pero fijo.

Base inductiva. Por la primer proposición que probamos, tenemos que $0+m=m=m+0$.

Hipótesis de Inducción: Supongamos que $n$ cumple que $n+m=m+n$.

Paso inductivo: Demostremos que $\sigma(n)+m=m+\sigma(n)$.

Hagamos esto mediante la siguiente cadena de igualdades:

\begin{align*}
m+\sigma(n)&=\sigma(m+n)\\
&\overset{H.I.}{=}\sigma(n+m)\\
&=n+\sigma(m)\\
&=n+(1+m)\\
&=(n+1)+m\\
&=\sigma(n)+m.
\end{align*}

Como siempre, es importante justificar cada igualdad. Pero ahora es tu turno. ¿Cuáles son las justificaciones de cada una de estas igualdades? Nota que algunas serán las definiciones, algunas serán la notación que estamos usando y finalmente otras se deducen de propiedades que ya demostramos (como la asociatividad).

$\square$

La suma se cancela

Imagina por un momento que tenemos una igualdad del estilo $x+8=y+8$ en los números naturales. Nos gustaría poder concluir que $x=y$. Sin embargo, no podemos hacer el «truco tradicional» de «restar 8» en cada lado de la igualdad para cancelar al 8, pues en los naturales no existe la operación de resta. Nos encontraremos con ella más adelante, hasta que trabajemos con los números enteros.

Aunque no podamos restar, de cualquier forma podemos realizar cancelaciones de este estilo. La siguiente proposición formaliza este hecho.

Proposición (cancelación por la derecha): Si, $a, b, n$ son naturales, tales que $a+n=b+n$, entonces $a=b$.

Demostración. Como ya esperábamos, sean $a$ y $b$ arbitrarios, y procedamos por inducción sobre $n$.

Base inductiva. Si $a+0=b+0$, por definición de $s_a$ y $s_b$ obtenemos $a=b$.

Hipótesis inductiva. Supongamos que $n$ es tal que cada vez que tengamos $a+n=b+n$, obtenemos que $a=b$.

Paso inductivo. Demostremos que si $a+\sigma(n)=b+\sigma(n)$, entonces $a=b$.

Entonces supongamos que $a+\sigma(n)=b+\sigma(n)$. Por definición $a+\sigma(n)=\sigma(a+n)$ y $b+\sigma(n)=\sigma(b+n)$. Por nuestra hipótesis tendríamos entonces que $\sigma(a+n)=\sigma(b+n)$. Usando el cuarto axioma de Peano, obtendríamos entonces que $a+n=b+n$. Finalmente, la hipótesis inductiva nos garantiza que entonces $a=b$, como buscábamos.

$\square$

Podemos enunciar el resultado anterior en una forma un poco más «funcional».

Corolario: Las funciones $s_{m}$ con $m\in \mathbb{N}$ son inyectivas.

Demostración: Con todas las herramientas que hemos desarrollado, ya no será necesario ocupar la inducción.

Si $s_{m}(a)=s_{m}(b)$, por la conmutatividad de la suma, tenemos que $s_{m}(a)=s_{a}(m)$ y $s_{m}(b)=s_{b}(m)$. Esto quiere decir que $a+m=b+m$, y por la proposición anterior, $a=b$.

$\square$

Con esto hemos demostrado las propiedades más fundamentales de la suma, a partir de las cuales podremos probar muchas más.

Resumen de propiedades de la suma

Para recapitular, en esta entrada demostramos las siguientes propiedades de la suma y por lo tanto podremos usarlas directamente de aquí en adelante:

  • Para todo $n$ natural, se tiene $0+n=n=n+0$.
  • Para todo $n$ natural, se tiene $1+n=\sigma(n)=n+1$.
  • Para $m$ y $n$ naturales cualesquiera, se tiene $m+n=n+m$.
  • Para $l,m,n$ naturales cualesquiera, se tiene que $l+(m+n)=(l+m)+n$.
  • Para $l,m,n$ naturales cualesquiera, si $m+l=n+l$, entonces $m=n$.

Más adelante…

Ya que conocemos las propiedades de la suma, podemos pasar a definir el producto, y análogamente, a como lo hicimos antes, estudiaremos sus propiedades usando el principio de Inducción.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $a, b\in \mathbb{N}$, y $a+b=0$, entonces $a=b=0$.
  2. Demuestra que si $a+a=b+b$, entonces $a=b$. ¡Ten cuidado! En los números naturales no se vale «dividir», así que más bien tendrás que hacer una prueba inductiva.
  3. Sean $m,n,l$ naturales cualesquiera. Demuestra, usando sólo las propiedades que ya mostramos (ya sin inducción), que todas las siguientes expresiones son iguales:
    \begin{align*}
    m+(n+l)\\
    (l+m)+n\\
    n+(m+l)\\
    (n+l)+m\\
    \end{align*}
  4. ¿Cuáles de las funciones $s_{m}$ tienen inversa? ¿Qué significa esto?
  5. Antes de dominar las tablas de multiplicar de memoria, ¿Cómo multiplicabas? Ocupa esta idea para motivar una definición recursiva del producto de números naturales.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Geometría Analítica I: Rectas en forma paramétrica

Por Elsa Fernanda Torres Feria

Introducción

Anteriormente definimos las operaciones de suma y de producto escalar en $\mathbb{R}^2$. Después de eso, enunciamos varias de sus propiedades y demostramos algunas de ellas. Lo que haremos ahora es utilizar lo que hemos construido para dar una definición clave de nuestro modelo: la de recta.

Mediante varios interactivos veremos que las propiedades algebraicas que estamos pidiendo en efecto satisfacen lo que queremos de las rectas a partir de nuestra intuición geométrica. Además de esto, demostraremos una proposición que unifica los postulados $1$ y $3$ de Euclides, lo cual será señal de que vamos en buen camino para obtener dichos postulados a partir de nuestro enfoque algebraico. Cerraremos con algunos ejemplos de rectas en su forma paramétrica.

Rectas en forma paramétrica

Iniciemos formalmente con la definición de la recta.

Definición. Dados un punto $P$ y un vector $Q \neq 0 $, la recta que pasa por $P$ con dirección $Q$ es el conjunto

$L=\{ P+rQ : r \in \mathbb{R} \}$

En la definición anterior se piensan a $P$ y $Q$ fijos y a $r$ como un parámetro variable. Con esto en mente, tiene sentido que esta expresión sea conocida como la forma paramétrica de la recta.

Como lo mencionamos al inicio, conocemos todo lo necesario para comprender esta forma paramétrica y es pertinente analizar un poco sus partes para poder realizar la representación gráfica.

El conjunto $L$ está representado por la suma de un punto fijo $P$ en el espacio y por un término de la forma $rQ$ que, si recuerdas, representa un producto escalar y que sabemos cómo se ve en el espacio. Si $r$ es fijo, tenemos un re-escalamiento del vector $Q$ y en el caso en el que $r<0$ un cambio de dirección. Para la forma paramétrica de la recta, resulta que $r$ no es fijo, y aunque esta es la primera vez que vemos algo así, es posible pensarlo como la unión de los casos cuando $r$ es fijo, una unión de tantos elementos como $\mathbb{R}$. Así $rQ$ representa una recta formada por todos los re-escalamientos posibles de el vector $Q$: la recta que pasa por el origen y por $Q$.

¿Cómo se verá entonces el total $P+rQ$? Si de nuevo pensamos en un $r$ específico, tenemos que $rQ$ es un re-escalamiento. Por el método del paralelogramo sabemos que $P+rQ$ es avanzar desde el origen hasta el punto $P$ y tomando ahora este «como origen», avanzar hasta $rQ$; de cierta manera estamos trasladando $rQ$ para que empiece en $P$. Volviendo al caso general, la recta dada por $P+rQ$ se ve como la recta dada por $rQ$, pero trasladada paralelamente para que pase por el punto $P$.

Ejemplo. Sean $P=(-3,5)$ y $Q=(2,7)$. Tenemos que la recta $L$ por $P$ y con dirección $Q$ es el conjunto

\begin{align*}
L&=\{ (-3,5)+r(2,7) : r \in \mathbb{R} \}\\
&=\{ (-3+2r,5+7r) : r \in \mathbb{R} \}
\end{align*}

En el siguiente interactivo el punto $P$ se encuentra de color rojo, el vector $Q$ y la recta dada por $rQ$ de color verde. La recta paralela a $rQ$ que pasa por $P$ se encuentra de color azul y por último, de color morado se encuentra $P+rQ$ para un $r$ fijo cuyo valor puedes controlar con el deslizador a tu izquierda. El punto $P+rQ$ está diseñado para que al cambiar el valor de $r$ (con el deslizador), puedas ver su rastro, es decir que deje marca por donde pasa. Nota cómo al mover el deslizador, todos los puntos $P+rQ$ se encuentran sobre la recta paralela a la recta definida por la expresión $rQ$ que pasa por el punto $P$.

Así, podemos concluir que la recta dadad por $P+rQ$ es precisamente la recta dada por $rQ$ trasladada paralelamente para que pase por el punto $P$.

$\triangle$

Para cerrar un poco la definición de la forma paramétrica, planteemos algunos casos especiales del parámetro $r$:

  • Cuando $r=0$ tenemos al punto $P$.
  • Cuando $r=1$, el punto en la recta corresponde a $P+Q$.
  • ¿Qué pasa entonces cuando $0<r<1$ ? Resulta que en tal caso nos encontramos en el segmento comprendido entre $P$ y $P+Q$ pues $rQ$ será una fracción de $Q$ y al sumárselo a $P$ obtenemos un vector que parte de $P$ ($0<r$) y llega hasta $P+rQ$, que «queda antes» de $P+Q$, pues $r<1$.

Función asociada a la recta

Hagamos un pequeño paréntesis para hablar de la relación que tiene esta expresión de la recta con los números reales.

Como acabamos de ver, la forma paramétrica de la recta $L$ está definida con base en un parámetro $r \in \mathbb{R}$. Al decir «parámetro» queremos expresar que es una variable que nos ayuda a definir nuestro objeto, en este caso una recta. Como $r$ corre en todos los reales, puede fungir como la variable de una función asociada a la recta. Aquí $\mathbb{R}$ es nuestro dominio, y el codominio es $L$. Así, podemos definir $\phi: \mathbb{R} \rightarrow L$ como

$\phi (r)=P+rQ.$

Resulta que esta función bajo esta función a cada valor de $r$ le corresponde uno y sólo un valor en $L$ (es función suprayectiva) y cada valor de $L$ se obtiene de un único $r$ (es inyectiva).

Proposición. La función $\phi(r)$ es biyectiva.

Demostración. Ver que $\phi$ es suprayectiva es inmediato pues la recta $L$ está definida precisamente mediante el parámetro $r$ y no hay manera de que en $L$ haya puntos que tengan otra expresión. Veamos ahora que es inyectiva. Para esto supongamos que existen $r,s \in \mathbb{R}$ tales que $\phi(r)=\phi(s)$. Para probar la inyectividad debemos concluir que $r=s$.

Si $\phi(r)=\phi(s)$, por definición de la función se tiene

$P+rQ=P+sQ$

Sumando $-(P+sQ)$ de ambos lados obtenemos, $P+rQ-(P+sQ)=0$ y desarrollando el lado izquierdo con las propiedades de suma y producto escalar obtenemos que

\begin{align*}
0&=P+rQ-(P+sQ)\\
&=P+rQ-P-sQ\\
&=P-P+rQ-sQ\\
&=0+rQ-sQ\\
&=rQ-sQ\\
&=Q(r-s).
\end{align*}

Es importante que en este punto te cuestiones qué propiedades de la suma y producto escalar se están usando en cada una de las igualdades anteriores.

En resumen, obtenemos que $Q(r-s)=0$. Pero en la definición de la recta se establece que $Q \neq 0$. De este modo, concluimos que $r-s=0$, que en otras palabras es la igualdad $r=s$ que buscábamos. Concluimos que existe una biyección entre cualquier recta y los reales.

$\square$

Otra forma de pensar la inyectividad en el resultado anterior es que «una recta no pasa más de una vez por cada punto».

Ejemplos de rectas en forma paramétrica

Para cerrar esta entrada plantearemos algunos ejercicios de rectas en su forma paramétrica e incluiremos sus interactivos.

Problema. Dibuja las siguientes rectas:

  1. $L_1=\{ (2,3)+ t(1,1) : t \in \mathbb{R} \}$
  2. $L_2= \{ (r-1,-2r) : r \in \mathbb{R} \}$

Solución.

  1. En este ejercicio el punto es $P=(2,3)$ y el vector director $Q=(1,1)$. Para construir la recta que definen, «dibujamos» primero la recta dada por $t(1,1)$ (en azul) y después trazamos su paralela que pase por $(2,3)$ (en verde). Si hicimos bien el procedimiento, cuando muevas el deslizador de $t$, el rastro de $(2,3)+t(1,1)$ debe estar sobre la recta verde. Así, la recta dada por $(2,3)+t(1,1)$ es la recta verde.

$\square$

  1. En este ejercicio tenemos a $P$ y a $rQ$ ya sumados, por lo que tenemos que separarlos (con ayuda de la definición de suma vectorial) para saber cuáles son individualmente. El vector $rQ$ es aquel cuyas entradas tienen a $r$, $P$ es lo que queda. Así,

$rQ=(r,-2r)$ y $P=(-1,0).$

Por lo que

$Q=(1,-2).$

Siguiendo el mismo procedimiento del ejercicio anterior, localizamos la recta dada por $rQ=r(1,-2)$ (verde) y trazamos su paralela que pase por $(-1,0)$ (rojo). Si el procedimiento es correcto, entonces cuando muevas el deslizador de $r$ el rastro de $(-10)+r(1,-2)$ se debe posicionar sobre la recta roja. Así la recta roja es la dada por $(r-1,-2r)$.

$\square$

Más adelante…

Con lo que aquí se desarrolló, en la siguiente entrada será posible construir las rectas en su forma baricéntrica y seremos capaces de darle a esta una interpretación física. Más adelante trataremos la intersección de rectas y definiremos la forma normal de una recta.

Tarea moral

  • Justifica cada paso de cada procedimiento con ayuda de los axiomas de los reales y las propiedades que se probaron en la entrada anterior.
  • Escribe la ecuación que representa a una partícula que pasa por el orígen en un tiempo $t=0$ («su punto de partida») y que cada unidad de tiempo avanza cambia su posición sumando $(-5,-3)$. La ecuación tendrá la forma paramétrica de una recta.
  • Dibuja las siguientes dos rectas (si te es posible con ayuda de GeoGebra):
    • $L_a=\{ (0,-2)+(-r,2r) : r \in \mathbb{R} \}$
    • $L_b=\{ (2s-1,s) : s \in \mathbb{R} \}$
  • Considera los puntos $P=(5,-3)$ y $Q=(-7,2)$. ¿Es la misma la recta por $P$ con dirección $Q$ que la recta por $Q$ con dirección $P$? Realiza una figura.

Álgebra Lineal II: Polinomio característico de familias especiales

Por Julio Sampietro

Introducción

En la entrada anterior dimos la definición de polinomio característico. Vimos que siempre es un polinomio mónico y que su grado es exactamente del tamaño de la matriz. También, vimos cómo calcular el polinomio mínimo en algunos casos particulares. En esta entrada veremos varias propiedades que nos van a facilitar el calcular el polinomio característico (y por tanto los eigenvalores) en un amplio rango de matrices diferentes.

Comenzaremos estudiando el polinomio mínimo de las triangulares superiores. Luego, veremos cómo calcular el polinomio de matrices nilpotentes. No solo nos harán la vida más fácil los resultados a continuación, si no que los usaremos en la teoría más adelante.

Matrices triangulares superiores y transpuestas

El caso de las matrices triangulares superiores es muy sencillo, como veremos a través del siguiente problema.

Problema. Sea $A=[a_{ij}]$ una matriz triangular superior. Demuestra que

\begin{align*}
\chi_A(X)=\prod_{i=1}^{n}(X-a_{ii}).
\end{align*}

Solución. La matriz $X I_n-A$ sigue siendo triangular superior, y sus entradas diagonales son precisamente $X-a_{ii}$. Usando que el determinante de una matriz triangular superior es el producto de sus entradas diagonales y usando la definición se sigue que

\begin{align*}
\chi_A(X)=\det(X I_n-A)=\prod_{i=1}^{n} (X-a_{ii}).
\end{align*}

$\square$

Ejemplo. Si queremos calcular el polinomio característico de la matriz

\begin{align*}
A=\begin{pmatrix}
1 & -\pi & \sqrt{2}\\
0 & -2 & 10^{10}\\
0 & 0 &3
\end{pmatrix}.
\end{align*}

entonces podemos aplicar el problema anterior y deducir inmediatamente que

\begin{align*}
\chi_A(X)=(X-1)(X+2)(X-3).
\end{align*}

¡Qué complicado hubiera sido calcular el determinante a pie!

$\triangle$

Por otro lado, recordando la demostración que dice que los eigenvalores de la transpuesta de una matriz son iguales a los de la matriz original era de esperarse que el polinomio característico también «se portara bien» bajo transposición.

Problema. Demuestra que las matrices $A$ y $^{t}A$ tienen el mismo polinomio característico para cualquier $A\in M_n(F)$.

Solución. Notamos que $^{t}(X I_n-A)= XI_n-\ ^{t}A$. Como una matriz y su transpuesta tienen el mismo determinante se tiene que

\begin{align*}
\chi_A(X)&=\det(XI_n-A)\\&=\det(\ ^{t}(XI_n-A))\\&= \det(XI_n-\ ^{t}A)\\&=\chi_{^t A}(X).
\end{align*}

$\square$

Estrictamente hablando, estamos haciendo un poquito de trampa en la demostración anterior (y de hecho en varias que involucran a la variable $X$). Las propiedades de determinantes que hemos visto (como que una matriz y su transpuesta tienen el mismo determinante) las obtuvimos partiendo de la hipótesis de que las entradas vienen de un campo $F$. Pero cuando agregamos a la variable $X$, ahora las entradas vienen más bien de un anillo: el anillo de polinomios en $F[X]$. Aunque esto parezca un problema, en realidad no lo es. Las propiedades que usamos pueden mostrarse también en ese contexto.

Veamos ahora cómo podemos aplicar el resultado anterior en un ejemplo concreto.

Ejemplo. Queremos calcular el polinomio característico de la matriz

\begin{align*}
A= \begin{pmatrix} 0 & 0 &0\\ -4 & 9 & 0\\ -1 & -1 & 2.\end{pmatrix}
\end{align*}

Para esto notamos que

\begin{align*}
^t A=\begin{pmatrix} 0 & -4 & -1\\ 0 & 9 & -1\\ 0 & 0 & 2\end{pmatrix}
\end{align*}

que es triangular superior. Usando el primer problema

\begin{align*}
\chi_{^t A}(X)= X(X-9)(X-2).
\end{align*}

Finalmente por el último problema $$\chi_{A}(X)=\chi_{^t A}(X)=X(X-9)(X-2).$$

$\triangle$

El término de la traza

Como vimos en la entrada anterior, en el polinomio $\det(XA+B)$ aparecen los términos $\det(A)$ y $\det(B)$. El siguiente problema aplica esto al polinomio característico e incluso deducimos otro término: la traza.

Problema. Demuestra que el polinomio característico de $A\in M_n(F)$ es de la forma

\begin{align*}
\chi_A(X)= X^n- \operatorname{Tr}(A)X^{n-1}+\dots+(-1)^n \det A.
\end{align*}

Solución. Regresemos a la definición

\begin{align*}
\det (X I_n-A)=\sum_{\sigma\in S_n} \operatorname{sign}(\sigma)\left(X\delta_{1\sigma(1)}-a_{1\sigma(1)}\right)\cdots \left(X \delta_{n\sigma(n)}-a_{n\sigma(n)}\right).
\end{align*}

Haciendo la expansión salvajemente podemos recuperar al menos los primeros términos de $$(X\delta_{1\sigma(1)}-a_{1\sigma(1)})\cdots (X\delta_{n\sigma(n)}-a_{n\sigma(n)}),$$ que son $$X^{n}\prod_{i=1}^{n} \delta_{i\sigma(i)} – X^{n-1}\sum_{j=1}^{n}\left(\prod_{k\neq j} \delta_{k\sigma(k)}\right)a_{j\sigma(j)}+\dots.$$

Más aún, nota cómo el producto $\prod_{j=1}^{n}\delta_{j\sigma(j)}$ es distinto de cero si y sólo si $j=\sigma(j)$ para todo $j$: es decir si $\sigma$ es la identidad. Esto muestra que $\chi_A(X)$ es mónico de grado $n$, como ya habíamos mencionado en la entrada anterior.

Además, el término constante está dado por \begin{align*}\chi_A(0)&=\det(0\cdot I_n-A)\\&=\det(-A)\\&=(-1)^{n}\det(A).\end{align*} Alternativamente pudimos haber usado la primera proposición de esta entrada para concluir estos hechos.

Nos falta estudiar el término de grado $n-1$. Si $j\in \{1,2,\dots, n\}$, entonces $\prod_{k\neq j}\delta_{j\sigma(j)}$ es distinto de cero solo si $\sigma(k)=k$ para todo $k\neq j$: pero $\sigma$ es una permutación, en particular una biyección, lo que fuerza que $\sigma(j)=j$ también y entonces $\sigma$ sea la identidad. Entonces el término de $X^{n-1}$ en $$(X\delta_{1\sigma(1)}-a_{1\sigma(1)})\cdots (X\delta_{n\sigma(n)}-a_{n\sigma(n)})$$ es distinto de cero sólo cuando $\sigma$ es la identidad. En ese caso es precisamente $$-\sum_{j=1}^{n} a_{jj}=-\operatorname{Tr}(A).$$

$\square$

Ejemplo. Si $A$ es la matriz del primer problema de esta entrada, tenemos que

\begin{align*}
\chi_A(X)&=(X-1)(X+2)(X-3)\\&= X^3-2 X^2+\dots +6.
\end{align*}

Nota cómo el término de $X^2$ es en efecto $-\text{Tr}(A)= -(1-2+3)$ y el último es $-\det(A)$.

$\triangle$

Matrices nilpotentes

El caso de las matrices nilpotentes es todavía más sencillo.

Problema. Sea $A\in M_n(F)$ una matriz nilpotente. Es decir, existe $k\geq 1$ tal que $A^{k}=O_n$.

  1. Demuestra que
    \begin{align*}
    \chi_A(X)=X^{n}.
    \end{align*}
  2. Demuestra que $\operatorname{Tr}A^{m}=0$ para todo $m\geq 1$.

Solución.

  1. Sea $k\geq 1$ tal que $A^{k}=O_n$ (existe pues $A$ es nilpotente). Entonces
    \begin{align*}
    X^{k}I_n&=X^{k}I_n-A^{k}\\&=(XI_n-A)(X^{k-1}I_n+X^{k-2}A+\dots +A^{k-1}).
    \end{align*}
    Tomando el determinante de ambos lados y recordando que abre productos llegamos a
    \begin{align*}
    X^{nk}&=\det(X^{k}I_n)\\&= \chi_{A}(X)\cdot \det(X^{k-1}I_n+\dots +A^{k-1}).
    \end{align*}
    De aquí, concluimos que $\chi_{A}(X)$ tiene que dividir a $X^{nk}$, pero sabemos que $\chi_A(X)$ es mónico y de grado $n$. Concluimos entonces que $\chi_A(X)=X^{n}$.
  2. Puesto que $A^{m}$ también es una matriz nilpotente, el inciso anterior nos dice que
    \begin{align*}
    \chi_{A^{m}}(X)=X^{n}.
    \end{align*}
    Pero sabemos por la sección sobre la traza que el término de $X^{n-1}$ es $-\operatorname{Tr}(A^{m})$. Como este término no aparece, concluimos que la traza es cero.

$\square$

Ejemplo. Para calcular el polinomio característico de la matriz

\begin{align*}
A=\begin{pmatrix}
5 & -3 &2\\
15 & -9 & 6\\
10 & -6 &4
\end{pmatrix}
\end{align*}

podríamos notar (aunque no sea obvio a simple vista) que $A^2=O_3$. Luego, por el problema anterior, $\chi_A(X)=X^3$.

$\triangle$

Un último caso particular

Acabamos con una última familia de matrices con polinomio característico simple. Esta familia está descrita por su forma, y será de particular importancia para el teorema de Cayley-Hamilton.

Problema. Para escalares $a_0,\dots, a_{n-1}\in F$ consideramos la matriz

\begin{align*}
A=\begin{pmatrix}
0 & 0 & 0 & \dots & 0 & a_0\\
1 & 0 & 0 & \dots & 0 & a_1\\
0 & 1 & 0 & \dots & 0 & a_2\\
\dots & \dots & \dots & \dots & \dots &\dots\\
0 & 0 & 0 & \dots & 1 &a_{n-1}
\end{pmatrix}.
\end{align*}

en $M_n(F)$.

Demuestra que

\begin{align*}
\chi_A(X)=X^{n}-a_{n-1}X^{n-1}-\dots -a_0.
\end{align*}

Solución. Sea $P(X)=X^{n}-a_{n-1}X^{n-1}-\dots-a_0$. Considera la matriz

\begin{align*}
B=X I_n-A=\begin{pmatrix} X & 0 & 0 &\dots &0& -a_0\\ -1 & X & 0 &\dots & 0 &-a_1\\ 0 & -1 & X &\dots& 0&-a_2\\ \dots & \dots & \dots & \dots &\dots &\dots\\ 0 & 0 & 0 & \dots & -1 & X-a_{n-1}\end{pmatrix}.
\end{align*}

Sumando el segundo renglón multiplicado por $X$ al primer renglón, luego sumándole también al primer renglón el tercero multiplicado por $X^2$, el cuarto por $X^3$, y así sucesivamente hasta sumar el último renglón multiplicado por $X^{n-1}$ llegamos a la matriz

\begin{align*}
C=\begin{pmatrix}
0 & 0 & 0 & \dots &0& P(X)\\
-1 & X & 0 & \dots &0 & -a_1\\
0 & -1 & X & \dots & 0 & -a_2\\
\dots & \dots & \dots & \dots & \dots &\dots\\
0 & 0 & 0 & \dots & -1 & X-a_{n-1}
\end{pmatrix}.
\end{align*}

Recordamos que el determinante es invariante bajo sumas de renglones, por lo que

\begin{align*}
\chi_A=\det B=\det C.
\end{align*}

Expandiendo el determinante de $C$ en el primer renglón obtenemos sencillamente

\begin{align*}
\det C&=(-1)^{n+1}P(X) \cdot \begin{vmatrix} -1 & X & \dots & 0\\ 0 & -1 & \dots & 0\\ \dots &\dots & \dots & \dots \\ 0 & 0 & \dots & -1 \end{vmatrix}\\&= (-1)^{n+1} P(X)(-1)^{n-1}\\&=P(X).
\end{align*}

Para la segundaigualdad usamos que el determinante es el de una matriz triangular superior con puros $-1$ como entradas. Para la última, usamos que $n+1+n-1=2n$ siempre es un número par, así que queda $-1$ elevado a un número par. Esto concluye la prueba.

$\square$

Una de las consecuencias de la proposición anterior es que para cualquier polinomio mónico $P$ de grado $n$ en $F[X]$, existe una matriz en $M_n(F)$ tal que su polinomio característico es $P$.

Más adelante…

En la próxima entrada veremos unos últimos aspectos teóricos del polinomio característico antes de lanzarnos de lleno al teorema de Cayley-Hamilton y su demostración.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra una matriz $A$ tal que $\chi_A(X)=X^5-5X^3+X^2-2X+2$. Sugerencia: Usa el último problema.
  2. Demuestra que el polinomio característico de una matriz $A=[a_{ij}]$ triangular inferior está dado por $\prod_{i=1}^{n}(X-a_{ii})$.
  3. Demuestra que $0$ es eigenvalor de una matriz si y sólo si su determinante es cero.
  4. Calcula el polinomio característico de la siguiente matriz con entradas reales:
    \begin{align*}
    A= \begin{pmatrix} 5 & 5 & 5 \\ 6 & 6 & 6\\ -11 & -11 & -11\end{pmatrix}.
    \end{align*} Sugerencia: ¿Quién es $A^2$?
  5. ¿Es cierto que si $F$ es cualquier campo y $A$ es una matriz con entradas en $F$, entonces el hecho de que $\operatorname{Tr}(A)=0$ implica que $A$ sea nilpotente? Sugerencia: Piensa en $F_2$.
  6. Da una demostración alternativa al último problema de esta entrada usando inducción matemática sobre el tamaño de la matriz.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»