Archivo de la etiqueta: polinomio característico

Álgebra Lineal II: Polinomio característico

Por Julio Sampietro

Introducción

En el transcurso de esta unidad hemos construido varios de los objetos algebraicos que nos interesan. En primer lugar, dejamos claro qué quería decir evaluar un polinomio en una matriz o transformación lineal. Esto nos llevó a preguntarnos por aquellos polinomios que anulan a una matriz o transformación lineal. De manera natural, descubrimos que aquellos polinomios que anulan son múltiplos de un polinomio especial asociado a la matriz o transformación lineal llamado polinomio mínimo.

De manera un poco separada, comenzamos a estudiar los eigenvalores, eigenvectores y eigenespacios de una transformación lineal y en la entrada anterior nos enfocamos en varias de sus propiedades principales. Uno de los resultados clave que encontramos es que los eigenvalores de una matriz o transformación lineal son las raíces del polinomio mínimo que estén en el campo en el que estemos trabajando.

Aunque este resultado sea interesante de manera teórica, en la práctica debemos hacer algo diferente pues no es tan sencillo encontrar el polinomio mínimo de una matriz o transformación lineal. Es por esto que ahora estudiaremos con profundidad otro objeto que resultará fundamental en nuestro estudio: el polinomio característico. Ya nos encontramos con él anteriormente. Si A es una matriz en Mn(F), dicho polinomio en la variable λ es el determinante det(λInA).

Esta entrada es más bien una introducción, así que nos enfocaremos en probar las cosas más básicas de este objeto. Lo primero, y más importante, es verificar que en efecto es un polinomio (y con ciertas características específicas). También, aprovecharemos para calcularlo en varios contextos (y campos) diferentes.

Definición de polinomio característico

Comencemos con una matriz AMn(F). Vimos que encontrar los eigenvalores de A se reduce a encontrar las soluciones de la ecuación

det(λInA)=0

en F. Vamos a estudiar más a detalle la expresión de la izquierda.

El siguiente teorema va un poco más allá y de hecho estudia expresiones un poco más generales.

Teorema. Sean A,BMn(F) dos matrices. Existe un polinomio PF[X] tal que para todo xF se cumple

P(x)=det(xA+B).

Si denotamos a este polinomio por P(X)=det(XA+B), entonces

det(XA+B)=det(A)Xn+αn1Xn1++α1X+detB

para algunas expresiones polinomiales α1,,αn1 con coeficientes enteros en las entradas de A y B.

Demostración. Consideremos el siguiente polinomio en la variable X y coeficientes en F, es decir, el siguiente polinomio en F[X]:

P(X)=σSnsign(σ)(a1σ(1)X+b1σ(1))(anσ(n)X+bnσ(n)).

Por construcción, P es un polinomio cuyos coeficientes son expresiones polinomiales enteras en las entradas de A y B. Más aún, se cumple que P(x)=det(xA+B) para xF (podría ser útil revisar la entrada sobre determinantes para convencerte de ello). El término constante lo obtenemos al evaluar en X=0, pero eso no es más que P(0)=det(0A+B)=det(B). Finalmente para cada σSn tenemos que el primer término de cada sumando es

sign(σ)(a1σ(1)X+b1σ(1))(anσ(n)X+bnσ(n))

Notemos que la única manera de obtener un término Xn en esta expresión es cuando en cada binomio que se está multiplicando se usa el término X. Así, el coeficiente de Xn es sign(σ)a1σ(1)anσ(n)Xn.

Agrupando todos los sumandos para todas las σ y comparando con la definición del determinante llegamos a que P(X)=det(A)Xn+, es decir el término de orden n es en efecto det(A).

◻

Del teorema se sigue que si A y B tienen entradas enteras o racionales, det(XA+B) tiene coeficientes enteros o racionales respectivamente.

Enseguida podemos definir (gracias al teorema) el siguiente objeto:

Definición. El polinomio característico de la matriz AMn(F) es el polinomio χAF[X] definido por

χA(X)=det(XInA).

Una observación inmediata es que, de acuerdo al teorema, el coeficiente principal de χA(X) tiene coeficiente det(In)=1. En otras palabras, acabamos de demostrar la siguiente propiedad fundamental del polinomio característico.

Proposición. El polinomio característico de una matriz en Mn(F) siempre tiene grado exactamente n y además es un polinomio mónico, es decir, que el coeficiente que acompaña al término de grado n es igual a 1.

Veamos un ejemplo sencillo.

Ejemplo. Si queremos calcular el polinomio característico de

A=(1110)M2(R)

entonces usamos la definición

χA(X)=det(XI2A)=|X111X|=X(X1)+1.

Y así los eigenvalores de A son las raíces reales de χA(X). Es decir, tenemos que resolver

0=x(x1)+1=x2x+1.

Sin embargo, el discriminante de esta ecuación cuadrática es (1)24(1)(1)=3, el cual es un real negativo, por lo que no tenemos eigenvalores reales. Si estuviéramos trabajando en C tendríamos dos eigenvalores complejos:

x1,2=1±i32.

De aquí, ¿cómo encontramos los eigenvectores y eigenespacios? Basta con resolver los sistemas lineales homogéneos de ecuaciones (Ax1I2)X=0 para encontrar el x1-eigenespacio y (Ax2)X=0 para encontrar el x2-eigenespacio.

Algunos cálculos de polinomios característicos

Ya que calcular polinomios característicos se reduce a calcular determinantes, te recomendamos fuertemente que recuerdes las propiedades que tienen los determinantes. Sobre todo, aquellas que permiten calcularlos.

¡A calcular polinomios característicos!

Problema 1. Encuentra el polinomio característico y los eigenvalores de A dónde A es

A=(0100201007060030)M4(R).

Solución. Usamos la expansión de Laplace respecto al primer renglón:

χA(X)=det(XI4A)=|X1002X1007X6003X|=X|X107X603X|+|2100X603X|=X(X311X)2(X218)=X413X2+36.

Después, para encontrar los eigenvalores de A tenemos que encontrar las raíces reales de la ecuación

x413x2+36=0.

Sin embargo, no hay que desalentarse por ver una ecuación de grado 4. Si hacemos el cambio y=x2 podemos llevar nuestro problema a resolver

y213y+36=0.

¡Es una ecuación de segundo orden! Esta la podemos resolver usando ‘la chicharronera’ y obtenemos como soluciones y1=4 y y2=9. Pero todavía tenemos que resolver x2=y1 y x2=y2. Al resolver estas últimas dos ecuaciones obtenemos que x=±2,±3 son los eigenvalores de A.

Problema 2. Calcula el polinomio característico y los eigenvalores de la matriz

A=(101110101)M3(F2).

Solución. Nota que estamos trabajando en el campo de dos elementos F2, por lo que 1=1. Usando la definición:

χA(X)=det(XI3A)=|X1011X1010X1|=|X+1011X+1010X+1|.

Aquí estamos usando repetidamente 1=1. Usamos otra vez la expansión de Laplace en el primer renglón para llegar a

χA(X)=(X+1)|X+100X+1|+|1X+110|=(X+1)3(X+1).

Luego, si queremos encontrar los eigenvalores de A tenemos que resolver

(x+1)3(x+1)=0.

Si bien existen varias maneras de resolver la ecuación, podemos simplemente sustituir los únicos valores posibles de x : 0 o 1. Sustituyendo es fácil ver que ambos satisfacen la ecuación, por lo que los eigenvalores de A son 0 y 1.

Más adelante…

En la próxima entrada calcularemos el polinomio característico de una variedad de matrices importantes: triangulares superiores, nilpotentes, etc. Esto nos permitirá entender mejor al polinomio característico y lidiar con muchos casos para facilitarnos los cálculos más adelante.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Demuestra que 0 es un eigenvalor de una matriz A si y sólo si det(A)=0.
  • ¿Una matriz compleja de tamaño n tiene necesariamente n eigenvalores distintos?
  • Calcular el polinomio característico y los eigenvalores de
    A=(120012201)M3(F3).
  • Usando la fórmula del determinante para matrices de tamaño 2, encuentra un criterio simple para saber si una matriz con entradas reales de tamaño 2 tiene dos, uno o ningún eigenvalor real.
  • Da un criterio simple para saber si una matriz de tamaño 2 con entradas complejas tiene eigenvalores puramente imaginarios.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Propiedades de eigenvectores y eigenvalores

Por Julio Sampietro

Introducción

En la entrada anterior platicamos acerca de eigenvectores, eigenvalores y eigenespacios de matrices y transformaciones lineales. Vimos algunos ejemplos básicos. En esta entrada profundizaremos en el estudio de estos objetos y exploraremos diversas de sus propiedades. Comenzaremos con algunas observaciones inmediatas. Después, veremos cómo encontrar de manera sencilla los eigenvalores de las matrices triangulares superiores. También veremos que «eigenvectores correspondientes a eigenvalores diferentes son linealmente independientes«. Finalmente, conectaremos estas nuevas ideas con un objeto que estudiamos previamente: el polinomio mínimo.

Primeras observaciones

A partir de la proposición de la entrada anterior que nos dice cómo calcular eigenvalores se desprenden algunas consecuencias sencillas pero útiles.

Por ejemplo, recuerda que el determinante de una matriz y su transpuesta es igual. En particular, si AMn(F) entonces

det(λIn tA)=det( t(λInA))=det(λInA).

Luego det(λInA)=0 si y sólo si det(λIn tA)=0. Recordando que las raíces de estos polinomios son precisamente los eigenvalores, se sigue que los eigenvalores de A y tA son iguales.

Por otro lado, como los eigenvalores son las raíces de un polinomio de grado n, sabemos que hay a lo más n soluciones. Entonces toda matriz tiene a lo más n eigenvalores.

Esto también ocurre para transformaciones lineales en espacios de dimensión finita y lo podemos enunciar como sigue:

Corolario. Sea V un espacio de dimensión finita sobre F y T:VV lineal. Entonces T tiene a lo más dimV eigenvalores distintos.

Sin embargo, si el espacio no es de dimensión finita no podemos hacer tal afirmación. Si V es el espacio de todas las funciones suaves (es decir con derivadas de todos los órdenes) de R en R y T:VV es la función lineal que a cada función la manda en su derivada, entonces tenemos «muchos» eigenvalores. Haciendo esto más preciso, para cada real r la función erx es un eigenvector con eigenvalor r puesto que

T(erx)=(erx)=rerx.

Así, tenemos al menos tantos eigenvalores como números reales. De hecho, estos son exactamente los eigenvalores de T, lo cual puede demostrarse mediante el teorema de existencia y unicidad de soluciones de ecuaciones diferenciales, que estudiarás en otro momento de tu formación matemática.

Matrices triangulares superiores

Parte del interés de «triangular» matrices (es decir, encontrar una matriz similar que sea triangular superior) está dada por la facilidad de calcular sus eigenvalores. Exploramos esto mediante los siguientes dos problemas.

Problema 1. Sea A=[aij] una matriz triangular superior en Mn(F). Demuestra que los eigenvalores de A son precisamente los elementos en la diagonal.

Solución. Ya establecimos que encontrar los valores propios se reduce a encontrar las raíces del polinomio det(λInA). Notamos que si A es triangular superior, entonces λInA también es triangular superior. Más aún, las entradas de la diagonal son simplemente λaii. Pero sabemos que el determinante de una matriz triangular superior es el producto de sus entradas diagonales. Así

det(λInA)=(λa11)(λa22)(λann)

cuyas raíces son exactamente los elementos aii.

◻

Podemos combinar el resultado anterior con otras propiedades de matrices triangulares superiores para resolver a mano algunos problemas que de entrada parecen complicados.

Problema 2. Encuentra los eigenvalores de A3 donde

A=(12340567008900010)M4(R).

Solución. En realidad no hace falta hacer el producto de matrices para encontrar la matriz A3. Sabemos que el producto de dos matrices triangulares superiores es triangular superior y que de hecho las entradas de la diagonal son solo el producto de las entradas correspondientes. Es decir, si [aij] y [bij] son dos matrices triangulares superiores, las entradas de la diagonal son aiibii. En nuestro caso, las entradas de la diagonal son 13,53,83 y 103, y por el problema anterior, estos son precisamente los eigenvalores de A3.

Relaciones con independencia lineal y combinaciones polinomiales

El resultado principal de esta entrada es el siguiente teorema, que en particular afirma que si dos eigenvalores son distintos, sus eigenvectores son linealmente independientes. En realidad, el resultado es un poco más general y lo enunciamos a continuación

Teorema. Sean λ1,,λk eigenvalores distintos dos a dos de una transformación lineal T:VV. Entonces los λi-eigenespacios están en posición de suma directa.

Demostración. Por definición, tenemos que demostrar que si tenemos una colección {vi} de vectores con T(vi)=λivi y v1++vk=0 entonces v1==vk=0. Procedemos por inducción sobre k.

Nuestro caso base es una tautología, pues si k=1 entonces tenemos que mostrar que si v1=0 entonces v1=0.

Asumamos que el resultado se cumple para k1 y verifiquemos que se cumple para k. Supongamos que v1++vk=0. Aplicando T de ambos lados de esta igualdad llegamos a

T(v1++vk)=T(v1)++T(vk)=λ1v1++λkvk=0.

Por otro lado, si multiplicamos a la igualdad v1++vk=0 por λk de ambos lados llegamos a

λkv1++λkvk=0.

Sustrayendo y factorizando estas dos igualdades se sigue que

(λkλ1)v1++(λkλk1)vk1=0.

Esto es una combinación lineal de los primeros k1 vectores vi igualada a cero. Luego, la hipótesis inductiva nos dice que (λkλi)vi=0 para todo i=1,,k1. Como λkλi entonces λkλi0 y entonces vi=0. Sustituyendo en la igualdad original, esto implica que vk=0 inmediatamente.

◻

Enseguida veremos que si formamos un polinomio P(T), entonces P(λ) es un eigenvalor de P(T) para cualquier eigenvalor λ de T. Esto lo veremos en el siguiente problema.

Problema. Sea λ un eigenvalor de T:VV y sea P un polinomio en una variable con coeficientes en F. Demuestra que P(λ) es un eigenvalor de P(T).

Solución. Como λ es un eigenvalor de T, existe v un vector no cero tal que T(v)=λv. Inductivamente, se cumple que Tk(v)=λkv. En efecto

Tk+1(v)=T(Tk(v))=T(λkv)=λkT(v)=λk+1v.

Usando esto, si P(X)=anXn++a1X+a0 se tiene que

P(T)(v)=anTn(v)++a1T(v)+a0v=anλnv++a1λv+a0v=(anλn++a1λ+a0)v=P(λ)v.

Esto muestra que P(λ) es un eigenvalor de P(T).

◻

Relación con el polinomio mínimo

Una consecuencia del problema previo es la siguiente proposición.

Proposición. Sea AMn(C) una matriz y PC[X] un polinomio tal que P(A)=On. Entonces cualquier eigenvalor λ de A satisface P(λ)=0.

Solución. Por el problema anterior, P(λ) es un eigenvalor de P(A), pero P(A)=On y el único eigenvalor de la matriz cero es 0. Luego P(λ)=0.

◻

De esto, podemos por fin establecer una conexión con el polinomio mínimo, que enunciamos en forma de teorema.

Teorema. Sea T:VV una transformación lineal sobre un espacio de dimensión finita sobre un campo F. Los eigenvalores de T son precisamente las raíces en F del polinomio mínimo μT.

Demostración. Dado que μT(T)=0, el problema que acabamos de resolver nos dice que todos los eigenvalores de T son raíces de μT.

Conversamente, supongamos que existe λ una raíz de μT que no es eigenvalor. Entonces la transformación TλId es invertible. Como μT(λ)=0, podemos factorizar la raíz y escribir μT(X)=(Xλ)Q(X) para algún QF[X]. Dado que μT(T)=0 deducimos que

(TλId)Q(T)=0.

Recordando una vez más que TλId es invertible, esta ecuación implica que Q(T)=0. Ya que μT es el polinomio mínimo, por una propiedad que mostramos anteriormente obtendríamos que μT divide a Q. Pero esto se contradice con la igualdad μT(X)=(Xλ)Q(X), que nos dice que μT tiene grado mayor. Esto concluye la demostración.

◻

Ejercicios

Terminamos con un par de ejercicios para repasar el material de estas secciones. El primero de entre ellos toma prestados nombres de la probabilidad (lo lo cuál puede sugerirte en qué tipo de texto te podrías encontrar con estas matrices).

Problema 1. Una matriz AMn(R) se dice estocástica si aij0 para todo i,j{1,,n} y j=1naij=1 para todo i{1,,n}.

Demuestra que 1 es un eigenvalor de cualquier matriz estocástica.

Solución. Consideremos el vector v=(1,,1). Nota que

Av=(a11a12a1na21a22a2nan1an2ann)(111)=(a11+a12++a1na21+a22++a2nan1+an2++ann)=(111).

Es decir Av=v, por lo que v es un eigenvector de A con eigenvalor asociado 1.

◻

Problema 2. Sea V el espacio de todos los polinomios con coeficientes reales. Sea T:VV la transformación lineal dada por P(X)P(1X). ¿Cuáles son los eigenvalores de T?

Solución. Observa que
T2(P)=TT(P)=T(P(1X))=P(1(1X))=P(X). Así T2=Id, o bien T2Id=0. Luego, el polinomio mínimo μT tiene que dividir al polinomio X21. Sin embargo, los únicos factores de este polinomio son X1 y X+1. Dado que T±Id se tiene que μT(X)=X21. Por el último teorema que vimos, los eigenvalores de T son precisamente las raíces de μT en R, es decir ±1.

Más adelante…

En las entradas subsecuentes iremos más a fondo en el concepto de polinomio característico, para eventualmente llegar al teorema de Cayley-Hamilton. Para eso tendremos que equiparnos de bastante teoría y repasar varias propiedades de dicho polinomio.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Sea V el espacio de polinomios con coeficientes reales de grado a lo más n. Encuentra los eigenvalores de la transformación T:P(X)P(X)(1+X)P(X).
  • Si V es el espacio de polinomios con coeficientes reales, encuentra los eigenvalores de T:P(X)P(3X).
  • Sean A,B matrices en Mn(C) tales que ABBA=B. Demuestra que para todo k1 se cumple que ABkBkA=kBk y de esto deduce que B es nilpotente: existe m tal que Bm=0. Sugerencia: ¿Cuántos eigenvalores puede tener T:XAXXA?
  • ¿Puedes generalizar el último problema de la sección de matrices triangulares superiores?
  • Sea A una matriz cuadrada con entradas reales. Supón que λ es un real positivo que es eigenvalor de A2. Demuestra que λ o λ es un eigenvalor de A. ¿Sucederá a veces que sólo una de estas es eigenvalor?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Seminario de Resolución de Problemas: Polinomios asociados a matrices y el teorema de Cayley-Hamilton

Por Leonardo Ignacio Martínez Sandoval

Introducción

Para terminar esta serie de entradas de álgebra lineal, y con ello el curso de resolución de problemas, hablaremos de polinomios especiales asociados a una matriz: el polinomio mínimo y el polinomio característico. Después, hablaremos del teorema de Cayley-Hamilton, que a grandes rasgos dice que una matriz se anula en su polinomio característico.

Estos resultados forman parte fundamental de la teoría que se aprende en un curso de álgebra lineal. En resolución de problemas, ayudan mucho para entender a los eigenvalores de una matriz, y expresiones polinomiales de matrices.

Polinomio mínimo de una matriz

Podemos evaluar un polinomio en una matriz cuadrada de acuerdo a la siguiente definición.

Definición. Si A es una matriz de n×n con entradas reales y p(x) es un polinomio en R[x] de la forma p(x)=a0+a1x+a2x2++anxn, definimos a la matriz p(A) como la matriz a0In+a1A+a2A2++anAn.

De manera análoga se puede dar una definición cuando las entradas de la matriz, o los coeficientes del polinomio, son números complejos.

Cuando una matriz está diagonalizada, digamos A=P1DP con P invertible y D diagonal, entonces evaluar polinomios en A es sencillo. Se tiene que p(A)=P1p(D)P, y si las entradas en la diagonal principal de D son d1,,dn, entonces p(D) es diagonal con entradas en la diagonal principal iguales a p(d1),,p(dn).

Dada una matriz A, habrá algunos polinomios p(x) en R[x] para los cuales p(A)=0. Si p(x) es uno de estos, entonces cualquier eigenvalor de A debe ser raíz de p(x). Veamos un problema de la International Mathematics Competition de 2011 que usa esto. Es el Problema 2 del día 1.

Problema. Determina si existe una matriz A de 3×3 con entradas reales tal que su traza es cero y A2+tA=I3.

Sugerencia pre-solución. Busca un polinomio p(x) tal que p(A)=0.

Solución. La respuesta es que no existe dicha matriz. Procedamos por contradicción. Si existiera, podríamos transponer la identidad dada para obtener que
A=I3t(A2)=I3(tA)2=I3(I3A2)2=2A2A4.

De aquí, tendríamos que A42A2+A=0, de modo que cualquier eigenvalor de A debe ser una raíz del polinomio p(x)=x42x2+x=x(x1)(x2+x1),

es decir, debe ser alguno de los números 0,1,1+52,152.

Los eigenvalores de A2 son los cuadrados de los eigenvalores de A, así que son algunos de los números 0,1,3+52,352.

Como la traza de A es 0, la suma de sus tres eigenvalores (con multiplicidades), debe ser 0. Como la traza de A2 es la de I3tA, que es 3, entonces la suma de los eigenvalores de A al cuadrado (con multiplicidades), debe ser 0. Un sencillo análisis de casos muestra que esto no es posible.

◻

De entre los polinomios que se anulan en A, hay uno especial. El polinomio mínimo de una matriz A con entradas reales es el polinomio mónico μA(x) de menor grado tal que μA(A)=On, donde On es la matriz de n×n con puros ceros. Este polinomio siempre es de grado menor o igual a n.

Una propiedad fundamental del polinomio mínimo de una matriz es que es mínimo no sólo en un sentido de grado, sino también de divisibilidad.

Teorema. Sea A una matriz de n×n con entradas reales. Entonces para cualquier polinomio p(x) en R[x] tal que p(A)=On, se tiene que μA(x) divide a p(x) en R[x].

Veamos cómo se puede usar este resultado.

Problema. La matriz A de 2×2 con entradas reales cumple que A3A2+A=O2. Determina los posibles valores que puede tener A2A.

Sugerencia pre-solución. Encuentra las posibles opciones que puede tener el polinomio mínimo de A y haz un análisis de casos con respecto a esto.

Solución. La matriz A se anula en el polinomio p(x)=x3x2+x=x(x2x+1), en donde x2x+1 tiene discriminante negativo y por lo tanto es irreducible.

El polinomio mínimo μA(x) debe ser un divisor de p(x). Además, es de grado a lo más 2. Esto nos deja con las siguientes opciones:

  • μA(x)=x, de donde A=O2, y por lo tanto A2=O2. De aquí, A2A=O2.
  • μA(x)=x2x+1. En este caso, tenemos que A2A+I2=0. Así, A2A=I2.

Para mostrar que ambas opciones son posibles, en el primer caso usamos A=O2 y en el segundo caso usamos A=(0111).

◻

Polinomio característico de una matriz

El polinomio característico de una matriz A de n×n se define como χA(x)=det(xInA).

Teorema. El polinomio característico de una matriz A cumple que:

  • Es un polinomio mónico en x de grado n.
  • El coeficiente del término de grado n1 es la traza de A.
  • El coeficiente libre es χA(0)=(1)ndet(A).
  • Es igual al polinomio característico de cualquier matriz similar a A.

Para ver ejemplos de cómo obtener el polinomio característico y cómo usar sus propiedades, hacemos referencia a la siguiente entrada:

Propiedades del polinomio característico

En particular, para fines de este curso, es importante leer los ejemplos y problemas resueltos de esa entrada.

El teorema de Cayley-Hamilton y una demostración con densidad

Finalmente, hablaremos de uno de los resultados fundamentales en álgebra lineal.

Teorema (Cayley-Hamilton). Si A es una matriz de n×n con entradas en C y χA(x) es su polinomio característico, entonces χA(A)=On.

En realidad el teorema de Cayley-Hamilton es válido para matrices más generales. Daremos un esbozo de demostración sólo para matrices con entradas complejas pues eso nos permite introducir una técnica de perturbaciones.

Esbozo de demostración. Vamos a hacer la técnica de la bola de nieve, construyendo familias poco a poco más grandes de matrices que satisfacen el teorema.

Si A es una matriz diagonal, las entradas en su diagonal son sus eigenvalores λ1,,λn. Por la discusión al inicio de esta entrada, χA(A) es diagonal con entradas χA(λ1),,χA(λn), y como los eigenvalores son raíces del polinomio característico, entonces todos estos valores son 0, y por lo tanto χA(A)=0.

Si A es diagonalizable, digamos, de la forma A=P1DP, entonces A y D tienen el mismo polinomio característico. Por la discusión al inicio de la entrada, y por el caso anterior:
χA(A)=χD(A)=χD(P1DP)=P1χD(D)P=P1OnP=On.

Si A tiene todos sus eigenvalores distintos, se puede mostrar que A es diagonalizable. Ahora viene la idea clave del argumento de continuidad.

Pensemos al espacio métrico de matrices de n×n. Afirmamos que las matrices con eigenvalores todos distintos son densas en este espacio métrico. Para ello, tomemos una matriz A. En efecto, como estamos trabajando en C, existe una matriz invertible P tal que P1AP es triangular. Como P es invertible, define una transformación continua. Los eigenvalores de P1AP son sus entradas en la diagonal, y podemos perturbarlos tan poquito como queramos para hacer que todos sean distintos.

De esta forma, existe una sucesión de matrices Ak, todas ellas diagonalizables, tales que AkA conforme k. El resultado se sigue entonces de las siguientes observaciones:

  • Los coeficientes del polinomio característico de una matriz dependen continuamente de sus entradas.
  • Las entradas de potencias de una matriz dependen continuamente de sus entradas.
  • Así, la función χM(M) es continua en la matriz variable M.

Concluimos como sigue χAk(Ak)=0, por ser cada una de las matrices Ak diagonalizables. Por la continuidad de χM(M), tenemos que
χA(A)=limkχAk(Ak)=limkOn=On.

◻

Terminamos esta entrada con un problema que usa el teorema de Cayley-Hamilton.

Problema. Muestra que para cualesquiera matrices X,Y,Z de 2×2 con entradas reales se cumple que
ZXYXY+ZYXYX+XYYXZ+YXXYZ=XYXYZ+YXYXZ+ZXYYX+ZYXXY.

Sugerencia pre-solución. Muestra que las matrices reales de 2×2 de traza cero conmutan con cualquier matriz de 2×2.

Solución. Si A es una matriz de 2×2 de traza cero, su polinomio característico es
χA(x)=x2tr(A)x+det(A)=x2+det(A).

Por el teorema de Cayley-Hamilton, se satisface entonces que A2=det(A)I2, así que A2 es un múltiplo de la identidad, y por lo tanto conmuta con cualquier matriz de 2×2.

La identidad que queremos mostrar se puede reescribir como Z(XYYX)2=(XYYX)2Z.

La traza de XY es igual a la traza de YX, y como la traza es una transformación lineal, tenemos que tr(XYYX)=tr(XY)tr(YX)=0. El problema se termina aplicando la discusión de arriba a la matriz A=XYYX.

◻

Más problemas

Puedes encontrar más problemas relacionados con el polinomio mínimo, el polinomio característico y el teorema de Cayley-Hamilton en la Sección 8.2, 8.4 y 8.5 del libro Essential Linear Algebra de Titu Andreescu. También hay más problemas relacionados con el teorema de Cayley-Hamilton en el Capítulo 4 del libro Mathematical Bridges de Andreescu, Mortici y Tetiva.

Álgebra Lineal I: Problemas de eigenvalores, eigenvectores y polinomio característico.

Por Ayax Calderón

Para esta entrada haremos uso de las definiciones y propiedades básicas de eigenvalores y polinomio característico vistas en las clases del miércoles y viernes de la semana pasada.

Problema 1. Encuentra los valores propios de la matriz.
A=(0110)

Solución. Consideremos a A como una matriz con entradas complejas. Sea λ un eigenvalor y x un vector no nulo tal que Ax=λx. Si x1,x2 son las coordenadas de x, la condición Ax=λx es equivalente a las ecuaciones

x2=λx1,x1=λx2.

Sustituyendo x1 en la primera ecuación se sigue que x2=λ2x2.
Si x2=0, entonces x1=0, lo cual es imposible. Por lo tanto x20 y necesariamente λ2=1, entonces λ{i,i}. Conversamente, i y i son ambos eigenvalores, ya que podemos escoger x2=1 y x1=λ como solución del sistema anterior. Así que vista como matriz compleja, A tiene dos valores propios ±i.

Por otro lado, si vemos a A como matriz con entradas reales, y λR es un eigenvalor y x un eigenvector como arriba, entonces

(λ2+1)x2=0.

Como λ es real, λ2+1 es distinto de cero y así x2=0, luego x1=0 y x=0. Así que, en conclusión, vista como matriz con entradas reales, A no tiene eigenvalores.

Problema 2. Encuentra el polinomio característico y los eigenvalores de la matriz

A=(011101111)M3(F2).

Solución. χA(λ)=det(λI3A)=det(λI3+A) (pues 1=1 en F2).

|λ111λ111λ+1|=|1+λ011+λ1+λ10λλ+1|

La igualdad anterior se obtiene de sumar la segunda columna a la primera y la tercera columna a la segunda.

Ahora vemos que

|λ+1011+λ1+λ10λλ+1|=(λ+1)|10111+λ10λλ+1|

=(λ+1)(λ+1)2=(λ+1)3.

Por lo tanto, χA(λ)=(λ+1)3, y así el único eigenvalor es 1.

Problema 3. Sean a0,a1,,an1F y sea

A=(0000a01000a10100a20001an1).

Demuestra que

χA=xnan1xn1a0.

Demostración. Sea P=xnan1xn1a1xa0. Considera la matriz

B=xInA=(x000a01x00a101x0a20001xan1).

Sumando a la primera fila de B la segunda fila multiplicada por x, la tercera fila multiplicada por x2, , la nésima fila multiplicada por xn1 obtenemos la matriz.

C=(0000P1x00a101x0a20001xan1).

Tenemos que χA=detB=detC y, desarrollando detC con respecto a la primera fila, obtenemos

detC=(1)n+1P|1x0010001|=(1)n+1P(1)n1=P.

◻

Problema 4. Sea AMn(F) una matriz con polinomio característico
χA(t)=(1)ntn++a1t+a0.
Demuestra queχA(0)=a0. Deduce que A es invertible si y sólo si a00.

Demostración. Es fácil ver que χA(0)=a0, ya que a0 es el término independiente. Por otro lado, recordamos que χA(t)=det(AtIn), entonces χA(0)=detA. se sigue que χA(0)=a0=detA, y por la última igualdad sabemos que A es invertible si y sólo si a00.

◻

Problema 5. Demuestra que cualquier matriz AMn(R) es suma de dos matrices invertibles.

Demostración. Veamos que existen B,CMn(R) tales que A=B+C.
Definimos la matriz B como: bii=1 si aii=0 y bii=aii2 si aii0,bij=aij si i>j y bij=0 si i<j.

Similarmente definimos la matriz C como: cii=1 si aii=0, cii=aii2 si aii0, cij=aij si i<j y cij=0 si i>j.

Por construcción B y C son matrices triangulares con todas sus entradas diagonales distintas de cero. Por lo tanto 0{detB,detC}, es decir, B y C son invertibles. Además por la manera en la que construimos las matrices B y C se tiene que A=B+C.

◻

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Matrices simétricas reales y sus eigenvalores

Por Leonardo Ignacio Martínez Sandoval

Introducción

Hemos llegado a la cima del curso. En estas últimas entradas probaremos uno de los teoremas más bellos en álgebra lineal: el teorema espectral para matrices simétricas reales. También hablaremos de varias de las consecuencias que tiene.

Hay dos formas equivalentes de enunciar el teorema.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Teorema. Sea A una matriz simétrica en Rn. Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Rn, tales que A=P1DP.

Para hablar de la demostración y de las consecuencias del teorema espectral para matrices simétricas reales, necesitaremos usar teoría de todas las unidades del curso. En particular, usaremos las siguientes definiciones:

  • Una matriz A en Mn(F) es simétrica si es igual a su transpuesta.
  • Una matriz A en Mn(F) es ortogonal si es invertible y A1=tA.
  • Si T:VV es una transformación lineal de un espacio vectorial V a sí mismo y W es un subespacio de V, entonces decimos que W es estable bajo T si T(W)W.
  • Un producto interior es una forma bilineal simétrica y positiva definida.
  • Un espacio Euclideano es un espacio vectorial de dimensión finita con un producto interior.
  • Si W es un subespacio de un espacio Euclideano V, entonces W es el conjunto de todos los vectores que de V que son ortogonales a todos los vectores de W.
  • Una matriz A en Mn(F) es diagonalizable si existen matrices P y D en Mn(F) con P invertible, D diagonal y tales que A=P1DP.

Y los siguientes resultados principales:

En esta entrada enunciaremos tres resultados auxiliares de interés propio. A partir de estos resultados, la demostración del teorema espectral para matrices simétricas reales y la equivalencia entre ambas versiones será mucho más limpia.

Los eigenvalores de matrices simétricas reales

El polinomio característico de una matriz A en Mn(R) tiene coeficientes reales. Por el teorema fundamental del álgebra, debe tener exactamente n raíces en C, contando multiplicidades. Si alguna de estas raíces r no es real, entonces A no puede ser diagonalizable en Mn(R). La razón es que A sería similar a una matriz diagonal D, y los eigenvalores de las matrices diagonales (incluso triangulares) son las entradas de la diagonal principal. Como A y D comparten eigenvalores (por ser similares), entonces r tendría que ser una entrada de D, pero entonces D ya no sería una matriz de entradas reales.

Lo primero que veremos es que las matrices simétricas reales «superan esta dificultad para poder diagonalizarse». Esta va a ser nuestra primer herramienta para demostrar el teorema espectral.

Teorema. Sea A una matriz simétrica en Mn(R) y λ una raíz del polinomio característico de A. Entonces, λ es un número real.

Demostración. El polinomio característico de A es un polinomio con coeficientes reales, así que por el teorema fundamental del álgebra se tiene que λ debe ser un número en C. Así, podemos escribirlo de la forma λ=a+ib, con a y b números reales. Lo que mostraremos es que b=0.

Se tiene que λ es un eigenvalor de A vista como matriz en Mn(C), y por lo tanto le corresponde un eigenvector U en Cn, es decir, un U0 tal que AU=λU. Este vector U lo podemos separar en partes reales e imaginarias con vectores V y W en Rn tales que U=V+iW.

En estos términos,
AU=A(V+iW)=AV+iAWyλU=(a+ib)(V+iW)=(aVbW)+i(aW+bV),

de modo que igualando partes reales e imaginarias en la expresión AU=λU tenemos que
AV=aVbWyAW=aW+bV.

Como A es simétrica, tenemos que

(1)AV,W=tAV,W=V,AW.

Estudiemos las expresiones en los extremos, reemplazando los valores de AV y AW que encontramos arriba y usando la bilinealidad del producto interior. Se tiene que

AV,W=aVbW,W=aV,WbW,W=aV,WbW2,

y que

V,AW=V,aW+bV=aV,W+bV,V=aV,W+bV2.

Substituyendo estos valores en la expresión (1), obtenemos la igualdad

aV,WbW2=aV,W+bV2,

que se simplifica a b(V2+W2)=0.

Estamos listos para dar el argumento final. Como U=V+iW es un eigenvector, entonces no es nulo, de modo que no es posible que V y W sean ambos el vector 0 de Rn. Como el producto interior es positivo definido, entonces alguna de las normas V o W no es cero, de modo que V2+W20.

Concluimos que b=0, y por lo tanto que λ es un número real.

◻

La demostración anterior es ejemplo de un truco que se usa mucho en las matemáticas. Aunque un problema o un teorema no hablen de los números complejos en su enunciado, se puede introducir a C para usar sus propiedades y trabajar ahí. Luego, se regresa lo obtenido al contexto real. Aquí en el blog hay otra entrada en donde damos más ejemplos de «brincar a los complejos».

Un resultado auxiliar de transformaciones simétricas

A continuación damos la segunda herramienta que necesitaremos para probar el teorema espectral. Recuerda que si V es un espacio Euclideano y T:VV es una transformación lineal, entonces decimos que T es simétrica si para todo par de vectores u y v en V se tiene que T(u),v=u,T(v). Enunciamos el resultado en términos de transformaciones, pero también es válido para las matrices simétricas asociadas.

Teorema. Sea V un espacio Eucideano y T:VV una transformación lineal simétrica. Sea W un subespacio de V estable bajo T. Entonces:

  • W también es estable bajo T y
  • Las restricciones de T a W y a W son transformaciones lineales simétricas en esos espacios.

Demostración. Para el primer punto, lo que tenemos que mostrar es que si w pertenece a W, entonces T(w) también, es decir, que T(w) es ortogonal a todo vector v en W.

Tomemos entonces un vector v en W. Como W es estable bajo T, tenemos que T(v) está en W, de modo que w,T(v)=0. Como T es simétrica, tenemos entonces que T(w),v=w,T(v)=0. Esto es lo que queríamos probar.

Para la segunda parte, si T1 es la restricción de T1 a W y tomamos vectores u y v en W, tenemos que
T1(u),v=T(u),v=u,T(v)=u,T1(v),

lo cual muestra que T1 es simétrica. La prueba para W es análoga y queda como tarea moral.

◻

Matrices diagonalizables y bases ortonormales de eigenvectores

El tercer y último resultado enuncia una equivalencia entre que una matriz en Mn(F) sea diagonalizable, y que exista una base especial para Fn. Es lo que usaremos para probar la equivalencia entre ambas formulaciones del teorema espectral para matrices simétricas reales.

Teorema. Sea A una matriz en Mn(F). Las siguientes dos afirmaciones son equivalentes:

  • A es diagonalizable, es decir, existen matrices P y D en Mn(F), con P invertible y D diagonal tales que A=P1DP.
  • Existe una base para Fn que consiste de eigenvectores de A.

Demostración. Antes de comenzar la demostración, recordemos que si tenemos una matriz B en Mn(F) de vectores columna C1,,Cn, entonces los vectores columna del producto AB son AC1,ACn. Además, si D es una matriz diagonal en Mn(F) con entradas en la diagonal d1,,dn, entonces los vectores columna de BD son d1C1,,dnCn.

Comencemos la prueba del teorema. Supongamos que A es diagonalizable y tomemos matrices P y D en Mn(F) con P invertible y D diagonal de entradas d1,,dn, tales que A=P1DP. Afirmamos que los vectores columna C1,,Cn de P1 forman una base de Fn que consiste de eigenvectores de A.

Por un lado, como son los vectores columna de una matriz invertible, entonces son linealmente independientes. En total son n, como la dimensión de Fn. Esto prueba que son una base.

De A=P1DP obtenemos la igualdad AP1=P1D. Por las observaciones al inicio de la prueba, tenemos al igualar columnas que para cada j=1,,n se cumple ACj=djCj. Como Cj forma parte de un conjunto linealmente independiente, no es el vector 0. Así, Cj es un eigenvector de A con eigenvalor dj. Con esto terminamos una de las implicaciones.

Supongamos ahora que existe una base de Fn que consiste de eigenvectores C1,,Cn de A. Para cada j=1,,n, llamemos λj al eigenvalor correspondiente a Cj, y llamemos D a la matriz diagonal con entradas λ1,,λn.

Como C1,,Cn son vectores linealmente independientes, la matriz B cuyas columnas son C1,,Cn es invertible. Además, por las observaciones al inicio de la prueba, se tiene que la columna j de la matrizAB es ACj y la columna j de la matriz BD es λjCj. Entonces, por construcción, estas matrices son iguales columna a columna, y por lo tanto lo son iguales. De esta forma, tenemos que AB=BD, o bien, reescribiendo esta igualdad, que A=BDB1. Así, la matriz invertible P=B1 y la matriz diagonal D diagonalizan a A.

◻

Las matrices simétricas reales serán todavía más especiales que simplemente las matrices diagonalizables. Lo que asegura el teorema espectral es que podremos encontrar no sólo una base de eigenvectores, sino que además podemos garantizar que esta base sea ortonormal. En términos de diagonalización, la matriz P no sólo será invertible, sino que además será ortogonal.

Más adelante…

En esta entrada enunciamos dos formas del teorema espectral y hablamos de algunas consecuencias que tiene. Además, repasamos un poco de la teoría que hemos visto a lo largo del curso y vimos cómo nos ayuda a entender mejor este teorema.

En la siguiente entrada, que es la última del curso, demostraremos las dos formas del teorema espectral que enunciamos en esta entrada y haremos un pequeño comentario sobre qué hay más allá del teorema espectral en el álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra un ejemplo de una matriz simétrica en Mn(C) cuyos eigenvalores no sean reales.
  • En el contexto del segundo teorema, muestra que la restricción de T a W es simétrica.
  • Realiza la demostración de que si A y B son matrices en Mn(F) y los vectores columna de B son C1,,Cn, entonces los vectores columna de AB son AC1,,ACn. También, prueba que si D es diagonal de entradas d1,,dn, entonces las columnas de BD son d1C1,,dnCn.
  • Encuentra una matriz A con entradas reales similar a la matriz (100050003), tal que ninguna de sus entradas sea igual a 0. Encuentra una base ortogonal de eigenvectores de A para R3.
  • Diagonaliza la matriz (2000020019730765724767207487237).

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»