Archivo de la etiqueta: polinomio mínimo

Álgebra Lineal II: Matrices y transformaciones nilpotentes

Por Elizabeth Chalnique Ríos Alvarado

Introducción

Hemos estudiado varias clases importantes de matrices y transformaciones lineales: diagonales, triangulares superiores, simétricas, ortogonales, normales, etc. Es momento de aprender sobre otro tipo fundamental de matrices y transformaciones lineales: las transformaciones nilpotentes. Nos hemos encontrado con estas matrices ocasionalmente a lo largo del primer curso de álgebra lineal y de éste. Ahora las trataremos de manera más sistemática.

Matrices y transformaciones nilpotentes

En la última unidad estuvimos trabajando únicamente en R o en C. Los resultados que presentaremos a continuación son válidos para espacios vectoriales sobre cualquier campo F.

Definición. Sea A una matriz en Mn(F). Diremos que A es nilpotente si Am=On para algún entero positivo m. Al menor entero positivo m para el cual suceda esto le llamamos el índice de A.

Ejemplo 1. La matriz A=(3913) es nilpotente. En efecto, tenemos que A2=(0000). Como A10, entonces el índice de A es igual a dos.

Tenemos una definición correspondiente para transformaciones lineales.

Definición. Sea V un espacio vectorial sobre un campo F y sea T:VV una transformación lineal. Diremos que que T es nilpotente si Tm es la transformación lineal cero para algún entero positivo m. Al menor entero positivo m para el cual suceda esto le llamamos el índice de T.

Recuerda que por definición Tm es la transformación T compuesta consigo misma m veces.

Ejemplo 2. Si estamos trabajando en el espacio V=Rn[x] de polinomios reales de grado a lo más n, entonces la transformación derivada D:VV para la cual D(p)=p es una transformación lineal nilpotente. En efecto, tras aplicarla n+1 veces a cualquier polinomio de grado a lo más n obtenemos al polinomio 0. Su índice es exactamente n+1 pues derivar n veces no anula al polinomio xn de V.

Si estuviéramos trabajando en el espacio vectorial R[x] de todos los polinomios reales, entonces la transformación derivada ya no sería nilpotente. En efecto, para cualquier m siempre existe un polinomio tal que al derivarlo m veces no se anula.

Bloques de Jordan de eigenvalor cero

Hay una familia importante de matrices nilpotentes.

Definición. Sea F un campo. El bloque de Jordan de eigenvalor 0 y tamaño k es la matriz J0,k en Mk(F) cuyas entradas son todas cero, a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, J0,k=[aij] con aij={1si j=i+10en otro caso.

También podemos expresarlo de la siguiente manera:

J0,k=(0100000100000000000100000), en donde estamos pensando que la matriz es de k×k.

Ejemplo 3. A continuación tenemos la matriz J0,4:

J0,4=(0100001000010000)

Esta es una matriz nilpotente. En efecto, haciendo las cuentas de matrices correspondientes tenemos que:

J0,42=(0100001000010000)(0100001000010000)=(0010000100000000)

Luego que

J0,43=J0,4J0,42=(0100001000010000)(0010000100000000)=(0001000000000000)

Y finalmente que

J0,44=J0,4J0,43=(0100001000010000)(0001000000000000)=(0000000000000000)

De esta manera, hay una potencia de J0,4 que se hace igual a cero. Como la mínima potencia es 4, entonces J0,4 es nilpotente de índice 4. Observa cómo la diagonal de unos «se va recorriendo hacia arriba a la derecha».

Todos los bloques de Jordan son nilpotentes

El siguiente resultado generaliza el ejemplo anterior y nos da una mejor demostración, interpretando a la matriz como transformación lineal.

Teorema. La matriz J0,k es nilpotente de índice k.

Demostración. Veamos qué hace la matriz J0,k cuando la multiplicamos por un vector: J0,k(x1x2x3xk1xk)=(0100000100000000000100000)(x1x2x3xk1xk)=(x2x3x4xk0).

En otras palabras, la matriz J0,k «recorre» las entradas del vector hacia arriba «empujando» con ceros desde abajo. Al hacer esto k veces, claramente llegamos al vector 0, así, J0,kk está asociada a la transformación lineal cero y por lo tanto es la matriz Ok. Y J0,kk1 no es la matriz cero pues al aplicarla en ek, el k-ésimo vector de la base canónica de Fk tenemos por las mismas ideas de arriba que J0,kk1en=e1.

◻

Una caracterización de matrices y transformaciones nilpotentes

El siguiente resultado nos da algunas equivalencias para que una transformación sea nilpotente.

Proposición. Sea AMn(F) una matriz. Todo lo siguiente es equivalente:

  1. A es nilpotente.
  2. El polinomio mínimo de A es de la forma μA(X)=Xk.
  3. El polinomio característico de A es χA(X)=Xn.

Demostración. 1)2). Si A es nilpotente, entonces hay un entero m tal que Am=On. Entonces, el polinomio p(X)=Xm anula a la matriz A. Pero el polinomio mínimo divide a cualquier polinomio que anule a A, entonces μA(X)|Xm, de donde μA(X) debe ser también de la forma Xk. De hecho, no puede suceder que k<m pues en dicho caso como el polinomio mínimo anula a la matriz, tendríamos que Ak=On, pero esto es imposible pues m es el menor entero tal que Am=On. Así, en este caso k es justo el índice de A.

2)3). Supongamos que el polinomio mínimo de A es de la forma μA(X)=Xk. Como el polinomio mínimo anula a la matriz tenemos que Ak=On. Tomemos un escalar λ en F fijo. Tenemos que:

λkIn=λkInAk=(λInA)(λk1In+λk2A++λAk2+Ak1)

Al tomar determinante de ambos lados y usando en la derecha la multiplicatividad del determinante, tenemos:

det(λkIn)=det(λInA)det(λk1In+λk2A++λAk2+Ak1).

Del lado izquierdo tenemos det(λkIn)=λnk. Del lado derecho tenemos χA(λ) multiplicado por otra expresión polinomial en λ, digamos P(λ). Como esto se vale para todo escalar λ, se vale polinomialmente que Xnk=χA(X)P(X). Así, χA(X)|Xnk y como el polinomio característico es de grado exactamente n, obtenemos que χA(X)=Xn.

3)1). Si el polinomio característico de A es χA(X)=Xn, entonces por el teorema de Cayley-Hamilton tenemos que An=On, de donde A es nilpotente.

◻

Como consecuencia del teorema anterior, obtenemos los siguientes resultados.

Corolario. Si A es una matriz nilpotente en Mn(F), entonces An=On y por lo tanto el índice de A es menor o igual a n. Análogamente, si T:VV es nilpotente y dim(V)=n, entonces el índice de T es menor o igual a n.

Corolario. Si A es una matriz nilpotente en Mn(F), entonces su traza, su determinante y cualquier eigenvalor son todos iguales a cero.

Más adelante…

En esta entrada definimos a las matrices y transformaciones nilpotentes. También enunciamos algunas de sus propiedades. En la siguiente entrada enunciaremos nuestra primer versión del teorema de Jordan, en donde nos enfocaremos únicamente en lo que nos dice para las matrices nilpotentes. Esto servirá más adelante como uno de los peldaños que usaremos para demostrar el teorema de Jordan en general.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra una matriz nilpotente de índice 2 en M7(R). En general, para cualquier entero positivo n y cualquier entero k con 1kn, da una forma de construir una matriz nilpotente de índice n en Mn(R).
  2. Encuentra una matriz con determinante cero y que no sea una matriz nilpotente. Encuentra una matriz con traza cero y que no sea una matriz nilpotente.
  3. Sea V un espacio vectorial de dimensión finita n. Demuestra que las siguientes afirmaciones son equivalentes:
    1. Una transformación T:VV es nilpotente de índice k.
    2. Alguna forma matricial de T es nilpotente de índice k.
    3. Todas las formas matriciales de T son nilpotentes de índice k.
    4. Tn es la transformación lineal 0.
  4. Demuestra los dos corolarios al final de la entrada. Como sugerencia para el segundo, recuerda que la traza, determinante y los eigenvalores de una matriz están muy relacionados con su polinomio característico.
  5. Prueba que la única matriz nilpotente diagonalizable en Mn(F) es On.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Aplicaciones del teorema de Cayley-Hamilton

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores ya enunciamos y demostramos el teorema de Cayley-Hamilton. Veremos ahora algunas aplicaciones de este resultado.

Encontrar inversas de matrices

El teorema de Cayley-Hamilton nos puede ayudar a encontrar la inversa de una matriz haciendo únicamente combinaciones lineales de potencias de la matriz. Procedemos como sigue. Supongamos que una matriz A en Mn(F) tiene polinomio característico χA(x)=xn+an1xn1++a1x+a0. Como a0=det(A), si a0=0 entonces la matriz no es invertible. Supongamos entonces que a00. Por el teorema de Cayley-Hamilton tenemos que An+an1An1++a1A+a0In=On. De aquí podemos despejar la matriz identidad como sigue:

In=1a0(An+an1An1++a1A)=1a0(An1+an1An2++a1I)A.

Estos cálculos muestran que la inversa de A es la matriz 1a0(An1+an1An2++a1I).

Ejemplo. Supongamos que queremos encontrar la inversa de la siguiente matriz A=(220010111). Su polinomio característico es λ32λ2λ+2. Usando la fórmula de arriba, tenemos que

A1=12(A22AI).

Necesitamos entonces A2, que es:

A2=(420010321).

De aquí, tras hacer las cuentas correspondientes, obtenemos que:

A1=(12100101201).

Puedes verificar que en efecto esta es la inversa de A realizando la multiplicación correspondiente.

El método anterior tiene ciertas ventajas y desventajas. Es práctico cuando es sencillo calcular el polinomio característico, pero puede llevar a varias cuentas. En términos de cálculos, en general reducción gaussiana funciona mejor para matrices grandes. Como ventaja, el resultado anterior tiene corolarios teóricos interesantes. Un ejemplo es el siguiente resultado.

Corolario. Si A es una matriz con entradas en los enteros y determinante 1 ó 1, entonces A1 tiene entradas enteras.

Encontrar el polinomio mínimo de una matriz

Otra de las consecuencias teóricas del teorema de Cayley-Hamilton con aplicaciones prácticas ya la discutimos en la entrada anterior.

Proposición. El polinomio mínimo de una matriz (o transformación lineal) divide a su polinomio característico.

Esto nos ayuda a encontrar el polinomio mínimo de una matriz: calculamos el polinomio característico y de ahí intentamos varios de sus divisores polinomiales para ver cuál de ellos es el de grado menor y que anule a la matriz. Algunas consideraciones prácticas son las siguientes:

  • Si el polinomio característico se factoriza totalmente sobre el campo y conocemos los eigenvalores, entonces conocemos todos los factores lineales. Basta hacer las combinaciones posibles de factores lineales para encontrar el polinomio característico (considerando posibles multiplicidades).
  • Además, para cada eigenvalor λ ya vimos que λ debe ser raíz no sólo del polinomio característico, sino también del polinomio mínimo. Así, debe aparecer un factor xλ en el polinomio mínimo para cada eigenvalor λ.

Ejemplo 1. Encontramos el polinomio mínimo de la siguiente matriz:

B=(204311002).

Una cuenta estándar muestra que el polinomio característico es (x2)2(x+1). El polinomio mínimo debe ser mónico, dividir al polinomio característico y debe contener forzosamente a un factor (x2) y un factor (x+1). Sólo hay dos polinomios con esas condiciones: (x2)(x+1) y (x2)2(x+1). Si (x2)(x+1) anula a B, entonces es el polinomio mínimo. Si no, es el otro. Haciendo las cuentas:

(B2I3)(B+I3)=(004331000)(304301003)=(00120012000).

Así, (x2)(x+1) no anula a la matriz y por lo tanto el polinomio mínimo es justo el polinomio característico (x2)2(x+1).

Ejemplo 2. Consideremos la matriz C=(300030003). Su polinomio característico es (x3)3. Así, su polinomio mínimo es x3, (x3)2 ó (x3)3. Nos damos cuenta rápidamente que x3 sí anula a la matriz pues A3I3=O3. De este modo, el polinomio mínimo es x3.

Clasificación de matrices con alguna condición algebraica

Si sabemos que una matriz cumple una cierta condición algebraica, entonces el teorema de Cayley-Hamilton puede ayudarnos a entender cómo debe ser esa matriz, es decir, a caracterizar a todas las matrices que cumplan la condición.

Por ejemplo, ¿quienes son todas las matrices en Mn(R) que son su propia inversa? La condición algebraica es A2=I2. Si el polinomio característico de A es x2+bx+c, entonces por el teorema de Cayley-Hamilton y la hipótesis tenemos que O2=A2+bA+cI2=bA+(c+1)I2. De aquí tenemos un par de casos:

  • Si b0, podemos despejar a A como A=c+1bI2, es decir A debe ser un múltiplo de la identidad. Simplificando la notación, A=xI2. Así, la condición A2=I2 se convierte en x2I2=I2, de donde x2=1 y por lo tanto x=±1. Esto nos da las soluciones A=I2 y A=I2.
  • Si b=0, entonces O2=(c+1)I2, de donde c=1. De este modo, el polinomio característico es x21=(x+1)(x1). Se puede demostrar que aquí las soluciones son las matices semejantes a la matriz (1001), y sólo esas.

Más adelante…

El teorema de Cayley-Hamilton es un resultado fundamental en álgebra lineal. Vimos dos demostraciones, pero existen varias más. Discutimos brevemente algunas de sus aplicaciones, pero tiene otras tantas. De hecho, más adelante en el curso lo retomaremos para aplicarlo nuevamente.

Por ahora cambiaremos ligeramente de tema. De manera muy general, veremos cómo llevar matrices a otras matrices que sean más simples. En las siguientes entradas haremos esto mediante similaridades de matrices. Más adelante haremos esto mediante congruencias de matrices. Hacia la tercer unidad del curso encontraremos un resultado aún más restrictivo, en el que veremos que cualquier matriz simétrica real puede ser llevada a una matriz diagonal mediante una matriz que simultáneamente da una similaridad y una congruencia.

Tarea moral

  1. Encuentra el polinomio mínimo de la matriz (3100030000210002).
  2. Encuentra la inversa de la siguiente matriz usando las técnica usada en esta entrada: (011112221).
  3. Demuestra el corolario de matrices con entradas enteras. De hecho, muestra que es un si y sólo si: una matriz invertibles con entradas enteras cumple que su inversa tiene únicamente entradas enteras si y sólo si su determinante es 1 ó 1.
  4. ¿Cómo son todas las matrices en M2(R) tales que A2=A?
  5. ¿Cómo son todas las matrices en M3(R) de determinante 0 tales que A3=O3?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Caracterizaciones de diagonalizar

Por Julio Sampietro

Introducción

Ya dimos la definición de que una matriz sea diagonalizable y encontramos buenas razones para, dada una matriz, intentar encontrar una matriz similar que sea diagonal. En esta entrada enunciaremos y demostraremos un teorema de caracterización de matrices diagonalizables, el cual nos ayudará a entender con más profundidad la diagonalizabilidad.

El teorema de caracterización

El teorema principal de esta entrada es el siguiente.

Teorema. Sea V un espacio de dimensión finita sobre F y T:VV una transformación lineal. Las siguientes afirmaciones son equivalentes.

  1. T es diagonalizable.
  2. Existe un polinomio PF[X] que se divide sobre F y tiene raíces distintas dos a dos, tal que P(T)=0.
  3. El polinomio mínimo μT de T se divide sobre F y tiene raíces distintas dos a dos.
  4. Sea Sp(T)F el conjunto de eigenvalores de T. Entonces
    λSp(T)ker(TλId)=V.

Demostración. Demostremos primero que 1 implica 2. Escogemos una base en la que T se represente por una matriz diagonal D. Sea P el polinomio cuyas raíces son las diferentes entradas de la diagonal de D. Entonces P(T) está representada por la matriz diagonal P(D) con entradas P(dii)=0. Es decir P(T)=0.

Que 2 implica 3 se sigue de la definición del polinomio mínimo: si P cumple 2, entonces μT divide a P y por tanto cumple 3.

La implicación 34 es consecuencia del último teorema de la entrada anterior aplicado a P=μT y los factores lineales siendo los Pi.

Finalmente veamos que 4 implica 1. Sea Sp(T)={λ1,,λk} y sea v1,vn una base de V obtenida al pegar una base de ker(Tλ1Id) a una base de ker(Tλ2Id) y a una base de ker(Tλ3Id) y así sucesivamente hasta pegar una base de ker(TλnId). Entonces v1,,vn es una base de eigenvectores de V y por tanto se cumple 1.

◻

Consecuencias del teorema

Hacemos algunas observaciones que son consecuencia del teorema anterior.

Observación. Si T es una transformación lineal diagonalizable, entonces el polinomio mínimo de T es

μT(X)=λSp(T)(Xλ)

dónde el producto se toma sobre todos los valores propios, contados sin multiplicidad. El mismo producto pero tomado con multiplicidades rinde el polinomio característico de T.

Observación. Si T es cualquier transformación lineal en un espacio vectorial de dimensión finita entonces T es diagonalizable si y sólo si la suma de las dimensiones de los eigenespacios coincide con la dimensión de V, es decir si

λSp(T)dimker(TλId)=dimV.

Observación. Supongamos que T es diagonalizable. Para cada λSpT sea πλ la proyección al subespacio ker(TλId). Entonces

T=λSp(T)λπλ.

Esto se sigue de la descomposición λSp(T)ker(TλId)=V y que si

v=λSp(T)vλ,vλker(TλId),

entonces

T(v)=λSp(T)T(vλ)=λSp(T)λvλ=λSp(T)λπλ(v).

Finalmente enunciamos el teorema que demostramos en su forma matricial (que es ciertamente una consecuencia del teorema para transformaciones lineales).

Teorema. Sea AMn(F). Entonces las siguientes afirmaciones son equivalentes.

  1. A es diagonalizable en Mn(F).
  2. Si Sp(A) es el conjunto de eigenvalores de A, entonces
    λSp(A)ker(λInA)=Fn.
  3. El polinomio mínimo μA de A se divide sobre F con raíces distintas dos a dos.
  4. Existe un polinomio PF[X] que se divide sobre F con raíces distintas dos a dos tal que P(A)=On.

Problemas para practicar

Terminamos esta entrada con unos cuantos problemas para aplicar los resultados vistos.

Problema 1. Considera la matriz

A=(010001100).

¿Es A diagonalizable en M3(C)? ¿ En M3(R)?

Solución. El polinomio característico de A está dado por χA(X)=X31. Este polinomio se divide sobre C con raíces distintas, ya que tenemos 3 soluciones dadas por las raíces de la unidad. Por el teorema de Cayley-Hamilton sabemos que χA(A)=O3. Usando el teorema de esta entrada concluimos que A es diagonalizable sobre C.

Sin embargo, dado que el polinomio característico no se divide sobre R podemos deducir que A no es diagonalizable en M3(R).

Problema 2. ¿Es la matriz

A=(010440212)M3(R)

diagonalizable?

Solución. Comenzamos calculando el polinomio característico de A:

χA(X)=|X104X4021X2|=(X2)|X14X4|=(X2)(X24X+4)=(X2)3.

Por tanto 2 es un eigenvalor con multiplicidad algebraíca 3. Si A fuese diagonalizable, entonces 2 tendría multiplicidad geométrica 3, es decir ker(A2I3) sería 3-dimensional: ¡pero entonces sería todo R3! Esto implicaría que A2I3=0, de otra manera que A=2I3, lo que claramente no es cierto.

Más adelante…

En las siguientes entradas estudiaremos formas bilineales, lo que forma el segundo bloque del curso.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para repasar lo visto en esta entrada.

  1. Encuentra todos los valores de aR tales que la matriz
    A=(2121a1111)M3(R)
    sea diagonalizable.
  2. Explicita el por qué el teorema para operadores lineales implica el teorema para matrices.
  3. Calcula la n-ésima potencia de
    A=(133313331).
    Sugerencia. Diagonaliza a A.
  4. Demuestra que si T:VV es una transformación lineal con V un espacio vectorial de dimensión finita sobre C tal que T2 diagonalizable y kerT=kerT2 entonces T es diagonalizable.
  5. Si V es un espacio de dimensión finita sobre F y T:VV es una transformación lineal diagonalizable fija, entonces cualquier otra transformación lineal S:VV satisface ST=TS si y sólo si S deja invariante cada eigenespacio de T.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Introducción al teorema de Cayley-Hamilton

Por Julio Sampietro

Introducción

En esta entrada introducimos el teorema de Cayley-Hamilton, otro de los teoremas importantes del curso. Intuitivamente este teorema nos dice que «el polinomio característico anula al operador lineal». Es decir, si P(λ) es el polinomio característico de una transformación lineal T, entonces P(T)=0.

Algunos ejemplos

Damos unos cuantos ejemplos para que entendamos que está pasando.

Ejemplo 1. Sea AM2(R) la matriz dada por

A=(0110).

Calculemos su polinomio característico

χA(X)=det(X11X)=X2+1.

Así, si evaluamos al polinomio χA en la matriz A tenemos que calcular

χA(A)=A2+I2.

Por un lado

A2=(0110)(0110)=(1001)=I2.

Luego

χA(A)=A2+I2=I2+I2=O2.

Es decir, ¡χA(A) es la matriz cero!

Ejemplo 2. Calculemos el polinomio característico de la matriz AM3(R) dónde A está dada por

A=(012034005.)

Notamos que A es una matriz triangular superior. Por una entrada anterior sabemos que el polinomio característico es solo el producto de los monomios (Xaii). Es decir

χA(X)=(X0)(X3)(X(5))=X(X3)(X+5).

Enseguida, evaluemos χA(A). Recordamos que esto quiere decir que tenemos que calcular

χA(A)=A(A3I3)(A+5I3).

Por un lado

A3I3=(312004008),

y por otro

A+5I3=(512084000).

Así

(A3I3)(A+5I3)=(312004008)(512084000)=(1552000000).

Finalmente

A(AI3)(A+5I3)=(012034005.)(1552000000)=O3.

Una vez más χA(A)=0.

El teorema

Los ejemplos anteriores sirven de calentamiento para enunciar el teorema de Cayley-Hamilton, que dice exactamente lo que sospechamos.

Teorema (de Cayley-Hamilton). Para cualquier matriz AMn(F) se cumple

χA(A)=On.

En otras palabras, si χA(X)=Xn+an1Xn1++a0 entonces

An+an1An1++a0In=On.

Demostraremos este teorema en la próxima entrada. Uno podría sospechar que la demostración consiste en simplemente sustituir A en la expresión de χA como sigue

χA(A)=det(AInA)=det(0)=0.

Sin embargo, esta ‘prueba’ no es correcta, ya que estamos multiplicando a A con In como si fueran matrices, mientras que la expresión de χA se refiere a escalares. Más aún, observa como el resultado de la expresión que anotamos es el escalar cero, mientras que sabemos que χA(A) debería ser la matriz cero.

Concluimos esta sección con una breve aplicación del teorema de Cayley-Hamilton.

Proposición. El polinomio mínimo de una matriz AMn(F) divide al polinomio característico.

Demostración. Por el teorema de Cayley-Hamilton, χA(A)=0. Luego por definición del polinomio mínimo se sigue que μA(X) divide a χA(X).

◻

Más adelante…

En la próxima entrada demostraremos el teorema de Cayley-Hamilton, y luego pasaremos a dar aplicaciones de este.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. En una entrada anterior calculamos el polinomio característico de una matriz nilpotente. Explica por qué el teorema de Cayley-Hamilton es compatible con dicho cálculo. De otra manera, verifica el teorema de Cayley-Hamilton en ese caso particular.
  2. Sea AM3(R) tal que Tr(A)=Tr(A2)=0. Usa el teorema de Cayley-Hamilton para demostrar que existe un αR tal que A3=αI3.
  3. Calcula el polinomio característico de AM2(C) donde
    A=(0110).
    Es decir, A es la misma matriz que en el ejemplo pero pensada como una matriz compleja. Verifica que χA(A)=O2.
  4. Verifica que χA(A)=O3 con
    A=(101111021)M3(R).
  5. Sea AMn(R) una matriz tal que A y 3A son similares. Demuestra que An=On.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Polinomio característico

Por Julio Sampietro

Introducción

En el transcurso de esta unidad hemos construido varios de los objetos algebraicos que nos interesan. En primer lugar, dejamos claro qué quería decir evaluar un polinomio en una matriz o transformación lineal. Esto nos llevó a preguntarnos por aquellos polinomios que anulan a una matriz o transformación lineal. De manera natural, descubrimos que aquellos polinomios que anulan son múltiplos de un polinomio especial asociado a la matriz o transformación lineal llamado polinomio mínimo.

De manera un poco separada, comenzamos a estudiar los eigenvalores, eigenvectores y eigenespacios de una transformación lineal y en la entrada anterior nos enfocamos en varias de sus propiedades principales. Uno de los resultados clave que encontramos es que los eigenvalores de una matriz o transformación lineal son las raíces del polinomio mínimo que estén en el campo en el que estemos trabajando.

Aunque este resultado sea interesante de manera teórica, en la práctica debemos hacer algo diferente pues no es tan sencillo encontrar el polinomio mínimo de una matriz o transformación lineal. Es por esto que ahora estudiaremos con profundidad otro objeto que resultará fundamental en nuestro estudio: el polinomio característico. Ya nos encontramos con él anteriormente. Si A es una matriz en Mn(F), dicho polinomio en la variable λ es el determinante det(λInA).

Esta entrada es más bien una introducción, así que nos enfocaremos en probar las cosas más básicas de este objeto. Lo primero, y más importante, es verificar que en efecto es un polinomio (y con ciertas características específicas). También, aprovecharemos para calcularlo en varios contextos (y campos) diferentes.

Definición de polinomio característico

Comencemos con una matriz AMn(F). Vimos que encontrar los eigenvalores de A se reduce a encontrar las soluciones de la ecuación

det(λInA)=0

en F. Vamos a estudiar más a detalle la expresión de la izquierda.

El siguiente teorema va un poco más allá y de hecho estudia expresiones un poco más generales.

Teorema. Sean A,BMn(F) dos matrices. Existe un polinomio PF[X] tal que para todo xF se cumple

P(x)=det(xA+B).

Si denotamos a este polinomio por P(X)=det(XA+B), entonces

det(XA+B)=det(A)Xn+αn1Xn1++α1X+detB

para algunas expresiones polinomiales α1,,αn1 con coeficientes enteros en las entradas de A y B.

Demostración. Consideremos el siguiente polinomio en la variable X y coeficientes en F, es decir, el siguiente polinomio en F[X]:

P(X)=σSnsign(σ)(a1σ(1)X+b1σ(1))(anσ(n)X+bnσ(n)).

Por construcción, P es un polinomio cuyos coeficientes son expresiones polinomiales enteras en las entradas de A y B. Más aún, se cumple que P(x)=det(xA+B) para xF (podría ser útil revisar la entrada sobre determinantes para convencerte de ello). El término constante lo obtenemos al evaluar en X=0, pero eso no es más que P(0)=det(0A+B)=det(B). Finalmente para cada σSn tenemos que el primer término de cada sumando es

sign(σ)(a1σ(1)X+b1σ(1))(anσ(n)X+bnσ(n))

Notemos que la única manera de obtener un término Xn en esta expresión es cuando en cada binomio que se está multiplicando se usa el término X. Así, el coeficiente de Xn es sign(σ)a1σ(1)anσ(n)Xn.

Agrupando todos los sumandos para todas las σ y comparando con la definición del determinante llegamos a que P(X)=det(A)Xn+, es decir el término de orden n es en efecto det(A).

◻

Del teorema se sigue que si A y B tienen entradas enteras o racionales, det(XA+B) tiene coeficientes enteros o racionales respectivamente.

Enseguida podemos definir (gracias al teorema) el siguiente objeto:

Definición. El polinomio característico de la matriz AMn(F) es el polinomio χAF[X] definido por

χA(X)=det(XInA).

Una observación inmediata es que, de acuerdo al teorema, el coeficiente principal de χA(X) tiene coeficiente det(In)=1. En otras palabras, acabamos de demostrar la siguiente propiedad fundamental del polinomio característico.

Proposición. El polinomio característico de una matriz en Mn(F) siempre tiene grado exactamente n y además es un polinomio mónico, es decir, que el coeficiente que acompaña al término de grado n es igual a 1.

Veamos un ejemplo sencillo.

Ejemplo. Si queremos calcular el polinomio característico de

A=(1110)M2(R)

entonces usamos la definición

χA(X)=det(XI2A)=|X111X|=X(X1)+1.

Y así los eigenvalores de A son las raíces reales de χA(X). Es decir, tenemos que resolver

0=x(x1)+1=x2x+1.

Sin embargo, el discriminante de esta ecuación cuadrática es (1)24(1)(1)=3, el cual es un real negativo, por lo que no tenemos eigenvalores reales. Si estuviéramos trabajando en C tendríamos dos eigenvalores complejos:

x1,2=1±i32.

De aquí, ¿cómo encontramos los eigenvectores y eigenespacios? Basta con resolver los sistemas lineales homogéneos de ecuaciones (Ax1I2)X=0 para encontrar el x1-eigenespacio y (Ax2)X=0 para encontrar el x2-eigenespacio.

Algunos cálculos de polinomios característicos

Ya que calcular polinomios característicos se reduce a calcular determinantes, te recomendamos fuertemente que recuerdes las propiedades que tienen los determinantes. Sobre todo, aquellas que permiten calcularlos.

¡A calcular polinomios característicos!

Problema 1. Encuentra el polinomio característico y los eigenvalores de A dónde A es

A=(0100201007060030)M4(R).

Solución. Usamos la expansión de Laplace respecto al primer renglón:

χA(X)=det(XI4A)=|X1002X1007X6003X|=X|X107X603X|+|2100X603X|=X(X311X)2(X218)=X413X2+36.

Después, para encontrar los eigenvalores de A tenemos que encontrar las raíces reales de la ecuación

x413x2+36=0.

Sin embargo, no hay que desalentarse por ver una ecuación de grado 4. Si hacemos el cambio y=x2 podemos llevar nuestro problema a resolver

y213y+36=0.

¡Es una ecuación de segundo orden! Esta la podemos resolver usando ‘la chicharronera’ y obtenemos como soluciones y1=4 y y2=9. Pero todavía tenemos que resolver x2=y1 y x2=y2. Al resolver estas últimas dos ecuaciones obtenemos que x=±2,±3 son los eigenvalores de A.

Problema 2. Calcula el polinomio característico y los eigenvalores de la matriz

A=(101110101)M3(F2).

Solución. Nota que estamos trabajando en el campo de dos elementos F2, por lo que 1=1. Usando la definición:

χA(X)=det(XI3A)=|X1011X1010X1|=|X+1011X+1010X+1|.

Aquí estamos usando repetidamente 1=1. Usamos otra vez la expansión de Laplace en el primer renglón para llegar a

χA(X)=(X+1)|X+100X+1|+|1X+110|=(X+1)3(X+1).

Luego, si queremos encontrar los eigenvalores de A tenemos que resolver

(x+1)3(x+1)=0.

Si bien existen varias maneras de resolver la ecuación, podemos simplemente sustituir los únicos valores posibles de x : 0 o 1. Sustituyendo es fácil ver que ambos satisfacen la ecuación, por lo que los eigenvalores de A son 0 y 1.

Más adelante…

En la próxima entrada calcularemos el polinomio característico de una variedad de matrices importantes: triangulares superiores, nilpotentes, etc. Esto nos permitirá entender mejor al polinomio característico y lidiar con muchos casos para facilitarnos los cálculos más adelante.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Demuestra que 0 es un eigenvalor de una matriz A si y sólo si det(A)=0.
  • ¿Una matriz compleja de tamaño n tiene necesariamente n eigenvalores distintos?
  • Calcular el polinomio característico y los eigenvalores de
    A=(120012201)M3(F3).
  • Usando la fórmula del determinante para matrices de tamaño 2, encuentra un criterio simple para saber si una matriz con entradas reales de tamaño 2 tiene dos, uno o ningún eigenvalor real.
  • Da un criterio simple para saber si una matriz de tamaño 2 con entradas complejas tiene eigenvalores puramente imaginarios.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»