Archivo del Autor: Julio Sampietro

Álgebra Lineal II: Matrices similares y su polinomio característico

Por Julio Sampietro

Introducción

En esta entrada exploramos otros aspectos del polinomio característico. Principalmente nos encargamos de comparar los polinomios característicos de matrices similares, así como los de dos productos (recordamos que el producto de matrices no es conmutativo).

Matrices similares

Recuerda que dos matrices A,BMn(F) se dicen similares si representan a la misma transformación lineal en Fn en bases posiblemente diferentes de este espacio. Equivalentemente, A y B son similares si existe PGLn(F) tal que B=PAP1: o sea, si son conjugadas por una matriz invertible.

Una propiedad importante que veremos enseguida es que el polinomio característico es invariante bajo similitud de matrices. Más precisamente tenemos el siguiente:

Teorema. Dos matrices similares tienen el mismo polinomio característico.

Demostración. Supón que A y B son dos matrices similares, entonces existe P invertible tal que B=PAP1. Nota que

XInB=XPP1PAP1=P(XInA)P1.

Ahora vamos a dar por hecho que el determinante está definido y es multiplicativo para matrices con entradas en F[X]. Definirlo no es complicado: Si A es una matriz de la forma [aij] con aijF[X] ponemos

detA=σSnsign(σ)a1σ(1)anσ(n).

Es decir, la definición es la misma que la usual. Sin embargo, resulta un poco más difícil el argumentar que con esta definición el determinante sigue siendo multiplicativo (especialmente si F es finito). Por esto solo asumiremos que lo es.

Tenemos tres matrices de este estilo en juego: P,XInA y XInB. Vista como una matriz con entradas en F[X], P sigue siendo invertible y su inversa es P1 (lo puedes pensar como que solo estamos ‘expandiendo los posibles coeficientes’). Entonces

χB(X)=det(XInB)=det(P)det(XInA)det(P)1=det(XInA)=χA(X).

Esto concluye la demostración.

◻

Ejemplos y consecuencias del teorema

Aquí vienen unos problemas y definiciones a partir del teorema anterior.

Problema. Demuestra que si A,BMn(F) son dos matrices entonces AB y BA tienen el mismo polinomio característico. Puedes asumir que F=R o F=C por simplicidad.

Solución. Si A es invertible, entonces AB y BA son similares, puesto que

AB=ABAA1=A(BA)A1.

Usando el teorema anterior queda demostrado este caso.

Por otro lado, si A no es invertible al menos sabemos que tiene una cantidad finita de eigenvalores. Como estamos asumiendo que F=R o F=C, en cualquier caso tenemos que F es infinito. Así existen infinitos λF tales que Aλ:=AλIn es una matriz invertible.

Ahora, tomemos cualquier escalar fijo X que queramos. Por el primer párrafo, para cualquier λ que hace a Aλ invertible se cumple que

det(XInAλB)=det(XInBAλ).

Otra manera de escribir esto es

det(XInAB+λB)det(XInBA+λB)=0.

Pero observa que el lado izquierdo es una expresión polinomial en λ que se está anulando en una infinidad de valores de λ, de modo que la expresión izquierda debe ser el polinomio cero y en particular, evaluando en λ=0 obtenemos que

det(XInAB)det(XInBA)=0.

En otras palabras, para todo valor de X hemos demostrado que det(XInAB)=det(XInBA), es decir, que AB y BA tienen el mismo polinomio característico.

◻

Más adelante…

En la siguiente entrada daremos una introducción al teorema de Cayley-Hamilton, y después nos lanzaremos a ver aplicaciones así como a dar dos demostraciones completas.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación y sirven para revisar los conceptos de esta entrada.

  1. Encuentra dos matrices A y B que no sean similares pero tengan el mismo polinomio característico y el mismo polinomio mínimo.
  2. ¿Existen dos matrices A y B en M2(R) que tengan el mismo polinomio mínimo, el mismo polinomio característico pero no sean similares?
  3. Considera las siguientes matrices con coeficientes reales
    A=(0100000100000100000000000),B=(0100000100000000000000000),C=(0100000100000000000100000).
    Calcula el polinomio característico de cada una. Sugerencia. Usa la entrada anterior.
  4. Calcula el polinomio mínimo de cada una. Concluye que A no es similar a B o a C.
  5. Computa la dimensión de los kernels de cada una. Concluye que B no es similar a C.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Polinomio característico de familias especiales

Por Julio Sampietro

Introducción

En la entrada anterior dimos la definición de polinomio característico. Vimos que siempre es un polinomio mónico y que su grado es exactamente del tamaño de la matriz. También, vimos cómo calcular el polinomio mínimo en algunos casos particulares. En esta entrada veremos varias propiedades que nos van a facilitar el calcular el polinomio característico (y por tanto los eigenvalores) en un amplio rango de matrices diferentes.

Comenzaremos estudiando el polinomio mínimo de las triangulares superiores. Luego, veremos cómo calcular el polinomio de matrices nilpotentes. No solo nos harán la vida más fácil los resultados a continuación, si no que los usaremos en la teoría más adelante.

Matrices triangulares superiores y transpuestas

El caso de las matrices triangulares superiores es muy sencillo, como veremos a través del siguiente problema.

Problema. Sea A=[aij] una matriz triangular superior. Demuestra que

χA(X)=i=1n(Xaii).

Solución. La matriz XInA sigue siendo triangular superior, y sus entradas diagonales son precisamente Xaii. Usando que el determinante de una matriz triangular superior es el producto de sus entradas diagonales y usando la definición se sigue que

χA(X)=det(XInA)=i=1n(Xaii).

◻

Ejemplo. Si queremos calcular el polinomio característico de la matriz

A=(1π2021010003).

entonces podemos aplicar el problema anterior y deducir inmediatamente que

χA(X)=(X1)(X+2)(X3).

¡Qué complicado hubiera sido calcular el determinante a pie!

Por otro lado, recordando la demostración que dice que los eigenvalores de la transpuesta de una matriz son iguales a los de la matriz original era de esperarse que el polinomio característico también «se portara bien» bajo transposición.

Problema. Demuestra que las matrices A y tA tienen el mismo polinomio característico para cualquier AMn(F).

Solución. Notamos que t(XInA)=XIn tA. Como una matriz y su transpuesta tienen el mismo determinante se tiene que

χA(X)=det(XInA)=det( t(XInA))=det(XIn tA)=χtA(X).

◻

Estrictamente hablando, estamos haciendo un poquito de trampa en la demostración anterior (y de hecho en varias que involucran a la variable X). Las propiedades de determinantes que hemos visto (como que una matriz y su transpuesta tienen el mismo determinante) las obtuvimos partiendo de la hipótesis de que las entradas vienen de un campo F. Pero cuando agregamos a la variable X, ahora las entradas vienen más bien de un anillo: el anillo de polinomios en F[X]. Aunque esto parezca un problema, en realidad no lo es. Las propiedades que usamos pueden mostrarse también en ese contexto.

Veamos ahora cómo podemos aplicar el resultado anterior en un ejemplo concreto.

Ejemplo. Queremos calcular el polinomio característico de la matriz

A=(000490112.)

Para esto notamos que

tA=(041091002)

que es triangular superior. Usando el primer problema

χtA(X)=X(X9)(X2).

Finalmente por el último problema χA(X)=χtA(X)=X(X9)(X2).

El término de la traza

Como vimos en la entrada anterior, en el polinomio det(XA+B) aparecen los términos det(A) y det(B). El siguiente problema aplica esto al polinomio característico e incluso deducimos otro término: la traza.

Problema. Demuestra que el polinomio característico de AMn(F) es de la forma

χA(X)=XnTr(A)Xn1++(1)ndetA.

Solución. Regresemos a la definición

det(XInA)=σSnsign(σ)(Xδ1σ(1)a1σ(1))(Xδnσ(n)anσ(n)).

Haciendo la expansión salvajemente podemos recuperar al menos los primeros términos de (Xδ1σ(1)a1σ(1))(Xδnσ(n)anσ(n)), que son Xni=1nδiσ(i)Xn1j=1n(kjδkσ(k))ajσ(j)+.

Más aún, nota cómo el producto j=1nδjσ(j) es distinto de cero si y sólo si j=σ(j) para todo j: es decir si σ es la identidad. Esto muestra que χA(X) es mónico de grado n, como ya habíamos mencionado en la entrada anterior.

Además, el término constante está dado por χA(0)=det(0InA)=det(A)=(1)ndet(A). Alternativamente pudimos haber usado la primera proposición de esta entrada para concluir estos hechos.

Nos falta estudiar el término de grado n1. Si j{1,2,,n}, entonces kjδjσ(j) es distinto de cero solo si σ(k)=k para todo kj: pero σ es una permutación, en particular una biyección, lo que fuerza que σ(j)=j también y entonces σ sea la identidad. Entonces el término de Xn1 en (Xδ1σ(1)a1σ(1))(Xδnσ(n)anσ(n)) es distinto de cero sólo cuando σ es la identidad. En ese caso es precisamente j=1najj=Tr(A).

◻

Ejemplo. Si A es la matriz del primer problema de esta entrada, tenemos que

χA(X)=(X1)(X+2)(X3)=X32X2++6.

Nota cómo el término de X2 es en efecto Tr(A)=(12+3) y el último es det(A).

Matrices nilpotentes

El caso de las matrices nilpotentes es todavía más sencillo.

Problema. Sea AMn(F) una matriz nilpotente. Es decir, existe k1 tal que Ak=On.

  1. Demuestra que
    χA(X)=Xn.
  2. Demuestra que TrAm=0 para todo m1.

Solución.

  1. Sea k1 tal que Ak=On (existe pues A es nilpotente). Entonces
    XkIn=XkInAk=(XInA)(Xk1In+Xk2A++Ak1).
    Tomando el determinante de ambos lados y recordando que abre productos llegamos a
    Xnk=det(XkIn)=χA(X)det(Xk1In++Ak1).
    De aquí, concluimos que χA(X) tiene que dividir a Xnk, pero sabemos que χA(X) es mónico y de grado n. Concluimos entonces que χA(X)=Xn.
  2. Puesto que Am también es una matriz nilpotente, el inciso anterior nos dice que
    χAm(X)=Xn.
    Pero sabemos por la sección sobre la traza que el término de Xn1 es Tr(Am). Como este término no aparece, concluimos que la traza es cero.

◻

Ejemplo. Para calcular el polinomio característico de la matriz

A=(53215961064)

podríamos notar (aunque no sea obvio a simple vista) que A2=O3. Luego, por el problema anterior, χA(X)=X3.

Un último caso particular

Acabamos con una última familia de matrices con polinomio característico simple. Esta familia está descrita por su forma, y será de particular importancia para el teorema de Cayley-Hamilton.

Problema. Para escalares a0,,an1F consideramos la matriz

A=(0000a01000a10100a20001an1).

en Mn(F).

Demuestra que

χA(X)=Xnan1Xn1a0.

Solución. Sea P(X)=Xnan1Xn1a0. Considera la matriz

B=XInA=(X000a01X00a101X0a20001Xan1).

Sumando el segundo renglón multiplicado por X al primer renglón, luego sumándole también al primer renglón el tercero multiplicado por X2, el cuarto por X3, y así sucesivamente hasta sumar el último renglón multiplicado por Xn1 llegamos a la matriz

C=(0000P(X)1X00a101X0a20001Xan1).

Recordamos que el determinante es invariante bajo sumas de renglones, por lo que

χA=detB=detC.

Expandiendo el determinante de C en el primer renglón obtenemos sencillamente

detC=(1)n+1P(X)|1X0010001|=(1)n+1P(X)(1)n1=P(X).

Para la segundaigualdad usamos que el determinante es el de una matriz triangular superior con puros 1 como entradas. Para la última, usamos que n+1+n1=2n siempre es un número par, así que queda 1 elevado a un número par. Esto concluye la prueba.

◻

Una de las consecuencias de la proposición anterior es que para cualquier polinomio mónico P de grado n en F[X], existe una matriz en Mn(F) tal que su polinomio característico es P.

Más adelante…

En la próxima entrada veremos unos últimos aspectos teóricos del polinomio característico antes de lanzarnos de lleno al teorema de Cayley-Hamilton y su demostración.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra una matriz A tal que χA(X)=X55X3+X22X+2. Sugerencia: Usa el último problema.
  2. Demuestra que el polinomio característico de una matriz A=[aij] triangular inferior está dado por i=1n(Xaii).
  3. Demuestra que 0 es eigenvalor de una matriz si y sólo si su determinante es cero.
  4. Calcula el polinomio característico de la siguiente matriz con entradas reales:
    A=(555666111111). Sugerencia: ¿Quién es A2?
  5. ¿Es cierto que si F es cualquier campo y A es una matriz con entradas en F, entonces el hecho de que Tr(A)=0 implica que A sea nilpotente? Sugerencia: Piensa en F2.
  6. Da una demostración alternativa al último problema de esta entrada usando inducción matemática sobre el tamaño de la matriz.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Polinomio característico

Por Julio Sampietro

Introducción

En el transcurso de esta unidad hemos construido varios de los objetos algebraicos que nos interesan. En primer lugar, dejamos claro qué quería decir evaluar un polinomio en una matriz o transformación lineal. Esto nos llevó a preguntarnos por aquellos polinomios que anulan a una matriz o transformación lineal. De manera natural, descubrimos que aquellos polinomios que anulan son múltiplos de un polinomio especial asociado a la matriz o transformación lineal llamado polinomio mínimo.

De manera un poco separada, comenzamos a estudiar los eigenvalores, eigenvectores y eigenespacios de una transformación lineal y en la entrada anterior nos enfocamos en varias de sus propiedades principales. Uno de los resultados clave que encontramos es que los eigenvalores de una matriz o transformación lineal son las raíces del polinomio mínimo que estén en el campo en el que estemos trabajando.

Aunque este resultado sea interesante de manera teórica, en la práctica debemos hacer algo diferente pues no es tan sencillo encontrar el polinomio mínimo de una matriz o transformación lineal. Es por esto que ahora estudiaremos con profundidad otro objeto que resultará fundamental en nuestro estudio: el polinomio característico. Ya nos encontramos con él anteriormente. Si A es una matriz en Mn(F), dicho polinomio en la variable λ es el determinante det(λInA).

Esta entrada es más bien una introducción, así que nos enfocaremos en probar las cosas más básicas de este objeto. Lo primero, y más importante, es verificar que en efecto es un polinomio (y con ciertas características específicas). También, aprovecharemos para calcularlo en varios contextos (y campos) diferentes.

Definición de polinomio característico

Comencemos con una matriz AMn(F). Vimos que encontrar los eigenvalores de A se reduce a encontrar las soluciones de la ecuación

det(λInA)=0

en F. Vamos a estudiar más a detalle la expresión de la izquierda.

El siguiente teorema va un poco más allá y de hecho estudia expresiones un poco más generales.

Teorema. Sean A,BMn(F) dos matrices. Existe un polinomio PF[X] tal que para todo xF se cumple

P(x)=det(xA+B).

Si denotamos a este polinomio por P(X)=det(XA+B), entonces

det(XA+B)=det(A)Xn+αn1Xn1++α1X+detB

para algunas expresiones polinomiales α1,,αn1 con coeficientes enteros en las entradas de A y B.

Demostración. Consideremos el siguiente polinomio en la variable X y coeficientes en F, es decir, el siguiente polinomio en F[X]:

P(X)=σSnsign(σ)(a1σ(1)X+b1σ(1))(anσ(n)X+bnσ(n)).

Por construcción, P es un polinomio cuyos coeficientes son expresiones polinomiales enteras en las entradas de A y B. Más aún, se cumple que P(x)=det(xA+B) para xF (podría ser útil revisar la entrada sobre determinantes para convencerte de ello). El término constante lo obtenemos al evaluar en X=0, pero eso no es más que P(0)=det(0A+B)=det(B). Finalmente para cada σSn tenemos que el primer término de cada sumando es

sign(σ)(a1σ(1)X+b1σ(1))(anσ(n)X+bnσ(n))

Notemos que la única manera de obtener un término Xn en esta expresión es cuando en cada binomio que se está multiplicando se usa el término X. Así, el coeficiente de Xn es sign(σ)a1σ(1)anσ(n)Xn.

Agrupando todos los sumandos para todas las σ y comparando con la definición del determinante llegamos a que P(X)=det(A)Xn+, es decir el término de orden n es en efecto det(A).

◻

Del teorema se sigue que si A y B tienen entradas enteras o racionales, det(XA+B) tiene coeficientes enteros o racionales respectivamente.

Enseguida podemos definir (gracias al teorema) el siguiente objeto:

Definición. El polinomio característico de la matriz AMn(F) es el polinomio χAF[X] definido por

χA(X)=det(XInA).

Una observación inmediata es que, de acuerdo al teorema, el coeficiente principal de χA(X) tiene coeficiente det(In)=1. En otras palabras, acabamos de demostrar la siguiente propiedad fundamental del polinomio característico.

Proposición. El polinomio característico de una matriz en Mn(F) siempre tiene grado exactamente n y además es un polinomio mónico, es decir, que el coeficiente que acompaña al término de grado n es igual a 1.

Veamos un ejemplo sencillo.

Ejemplo. Si queremos calcular el polinomio característico de

A=(1110)M2(R)

entonces usamos la definición

χA(X)=det(XI2A)=|X111X|=X(X1)+1.

Y así los eigenvalores de A son las raíces reales de χA(X). Es decir, tenemos que resolver

0=x(x1)+1=x2x+1.

Sin embargo, el discriminante de esta ecuación cuadrática es (1)24(1)(1)=3, el cual es un real negativo, por lo que no tenemos eigenvalores reales. Si estuviéramos trabajando en C tendríamos dos eigenvalores complejos:

x1,2=1±i32.

De aquí, ¿cómo encontramos los eigenvectores y eigenespacios? Basta con resolver los sistemas lineales homogéneos de ecuaciones (Ax1I2)X=0 para encontrar el x1-eigenespacio y (Ax2)X=0 para encontrar el x2-eigenespacio.

Algunos cálculos de polinomios característicos

Ya que calcular polinomios característicos se reduce a calcular determinantes, te recomendamos fuertemente que recuerdes las propiedades que tienen los determinantes. Sobre todo, aquellas que permiten calcularlos.

¡A calcular polinomios característicos!

Problema 1. Encuentra el polinomio característico y los eigenvalores de A dónde A es

A=(0100201007060030)M4(R).

Solución. Usamos la expansión de Laplace respecto al primer renglón:

χA(X)=det(XI4A)=|X1002X1007X6003X|=X|X107X603X|+|2100X603X|=X(X311X)2(X218)=X413X2+36.

Después, para encontrar los eigenvalores de A tenemos que encontrar las raíces reales de la ecuación

x413x2+36=0.

Sin embargo, no hay que desalentarse por ver una ecuación de grado 4. Si hacemos el cambio y=x2 podemos llevar nuestro problema a resolver

y213y+36=0.

¡Es una ecuación de segundo orden! Esta la podemos resolver usando ‘la chicharronera’ y obtenemos como soluciones y1=4 y y2=9. Pero todavía tenemos que resolver x2=y1 y x2=y2. Al resolver estas últimas dos ecuaciones obtenemos que x=±2,±3 son los eigenvalores de A.

Problema 2. Calcula el polinomio característico y los eigenvalores de la matriz

A=(101110101)M3(F2).

Solución. Nota que estamos trabajando en el campo de dos elementos F2, por lo que 1=1. Usando la definición:

χA(X)=det(XI3A)=|X1011X1010X1|=|X+1011X+1010X+1|.

Aquí estamos usando repetidamente 1=1. Usamos otra vez la expansión de Laplace en el primer renglón para llegar a

χA(X)=(X+1)|X+100X+1|+|1X+110|=(X+1)3(X+1).

Luego, si queremos encontrar los eigenvalores de A tenemos que resolver

(x+1)3(x+1)=0.

Si bien existen varias maneras de resolver la ecuación, podemos simplemente sustituir los únicos valores posibles de x : 0 o 1. Sustituyendo es fácil ver que ambos satisfacen la ecuación, por lo que los eigenvalores de A son 0 y 1.

Más adelante…

En la próxima entrada calcularemos el polinomio característico de una variedad de matrices importantes: triangulares superiores, nilpotentes, etc. Esto nos permitirá entender mejor al polinomio característico y lidiar con muchos casos para facilitarnos los cálculos más adelante.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Demuestra que 0 es un eigenvalor de una matriz A si y sólo si det(A)=0.
  • ¿Una matriz compleja de tamaño n tiene necesariamente n eigenvalores distintos?
  • Calcular el polinomio característico y los eigenvalores de
    A=(120012201)M3(F3).
  • Usando la fórmula del determinante para matrices de tamaño 2, encuentra un criterio simple para saber si una matriz con entradas reales de tamaño 2 tiene dos, uno o ningún eigenvalor real.
  • Da un criterio simple para saber si una matriz de tamaño 2 con entradas complejas tiene eigenvalores puramente imaginarios.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Propiedades de eigenvectores y eigenvalores

Por Julio Sampietro

Introducción

En la entrada anterior platicamos acerca de eigenvectores, eigenvalores y eigenespacios de matrices y transformaciones lineales. Vimos algunos ejemplos básicos. En esta entrada profundizaremos en el estudio de estos objetos y exploraremos diversas de sus propiedades. Comenzaremos con algunas observaciones inmediatas. Después, veremos cómo encontrar de manera sencilla los eigenvalores de las matrices triangulares superiores. También veremos que «eigenvectores correspondientes a eigenvalores diferentes son linealmente independientes«. Finalmente, conectaremos estas nuevas ideas con un objeto que estudiamos previamente: el polinomio mínimo.

Primeras observaciones

A partir de la proposición de la entrada anterior que nos dice cómo calcular eigenvalores se desprenden algunas consecuencias sencillas pero útiles.

Por ejemplo, recuerda que el determinante de una matriz y su transpuesta es igual. En particular, si AMn(F) entonces

det(λIn tA)=det( t(λInA))=det(λInA).

Luego det(λInA)=0 si y sólo si det(λIn tA)=0. Recordando que las raíces de estos polinomios son precisamente los eigenvalores, se sigue que los eigenvalores de A y tA son iguales.

Por otro lado, como los eigenvalores son las raíces de un polinomio de grado n, sabemos que hay a lo más n soluciones. Entonces toda matriz tiene a lo más n eigenvalores.

Esto también ocurre para transformaciones lineales en espacios de dimensión finita y lo podemos enunciar como sigue:

Corolario. Sea V un espacio de dimensión finita sobre F y T:VV lineal. Entonces T tiene a lo más dimV eigenvalores distintos.

Sin embargo, si el espacio no es de dimensión finita no podemos hacer tal afirmación. Si V es el espacio de todas las funciones suaves (es decir con derivadas de todos los órdenes) de R en R y T:VV es la función lineal que a cada función la manda en su derivada, entonces tenemos «muchos» eigenvalores. Haciendo esto más preciso, para cada real r la función erx es un eigenvector con eigenvalor r puesto que

T(erx)=(erx)=rerx.

Así, tenemos al menos tantos eigenvalores como números reales. De hecho, estos son exactamente los eigenvalores de T, lo cual puede demostrarse mediante el teorema de existencia y unicidad de soluciones de ecuaciones diferenciales, que estudiarás en otro momento de tu formación matemática.

Matrices triangulares superiores

Parte del interés de «triangular» matrices (es decir, encontrar una matriz similar que sea triangular superior) está dada por la facilidad de calcular sus eigenvalores. Exploramos esto mediante los siguientes dos problemas.

Problema 1. Sea A=[aij] una matriz triangular superior en Mn(F). Demuestra que los eigenvalores de A son precisamente los elementos en la diagonal.

Solución. Ya establecimos que encontrar los valores propios se reduce a encontrar las raíces del polinomio det(λInA). Notamos que si A es triangular superior, entonces λInA también es triangular superior. Más aún, las entradas de la diagonal son simplemente λaii. Pero sabemos que el determinante de una matriz triangular superior es el producto de sus entradas diagonales. Así

det(λInA)=(λa11)(λa22)(λann)

cuyas raíces son exactamente los elementos aii.

◻

Podemos combinar el resultado anterior con otras propiedades de matrices triangulares superiores para resolver a mano algunos problemas que de entrada parecen complicados.

Problema 2. Encuentra los eigenvalores de A3 donde

A=(12340567008900010)M4(R).

Solución. En realidad no hace falta hacer el producto de matrices para encontrar la matriz A3. Sabemos que el producto de dos matrices triangulares superiores es triangular superior y que de hecho las entradas de la diagonal son solo el producto de las entradas correspondientes. Es decir, si [aij] y [bij] son dos matrices triangulares superiores, las entradas de la diagonal son aiibii. En nuestro caso, las entradas de la diagonal son 13,53,83 y 103, y por el problema anterior, estos son precisamente los eigenvalores de A3.

Relaciones con independencia lineal y combinaciones polinomiales

El resultado principal de esta entrada es el siguiente teorema, que en particular afirma que si dos eigenvalores son distintos, sus eigenvectores son linealmente independientes. En realidad, el resultado es un poco más general y lo enunciamos a continuación

Teorema. Sean λ1,,λk eigenvalores distintos dos a dos de una transformación lineal T:VV. Entonces los λi-eigenespacios están en posición de suma directa.

Demostración. Por definición, tenemos que demostrar que si tenemos una colección {vi} de vectores con T(vi)=λivi y v1++vk=0 entonces v1==vk=0. Procedemos por inducción sobre k.

Nuestro caso base es una tautología, pues si k=1 entonces tenemos que mostrar que si v1=0 entonces v1=0.

Asumamos que el resultado se cumple para k1 y verifiquemos que se cumple para k. Supongamos que v1++vk=0. Aplicando T de ambos lados de esta igualdad llegamos a

T(v1++vk)=T(v1)++T(vk)=λ1v1++λkvk=0.

Por otro lado, si multiplicamos a la igualdad v1++vk=0 por λk de ambos lados llegamos a

λkv1++λkvk=0.

Sustrayendo y factorizando estas dos igualdades se sigue que

(λkλ1)v1++(λkλk1)vk1=0.

Esto es una combinación lineal de los primeros k1 vectores vi igualada a cero. Luego, la hipótesis inductiva nos dice que (λkλi)vi=0 para todo i=1,,k1. Como λkλi entonces λkλi0 y entonces vi=0. Sustituyendo en la igualdad original, esto implica que vk=0 inmediatamente.

◻

Enseguida veremos que si formamos un polinomio P(T), entonces P(λ) es un eigenvalor de P(T) para cualquier eigenvalor λ de T. Esto lo veremos en el siguiente problema.

Problema. Sea λ un eigenvalor de T:VV y sea P un polinomio en una variable con coeficientes en F. Demuestra que P(λ) es un eigenvalor de P(T).

Solución. Como λ es un eigenvalor de T, existe v un vector no cero tal que T(v)=λv. Inductivamente, se cumple que Tk(v)=λkv. En efecto

Tk+1(v)=T(Tk(v))=T(λkv)=λkT(v)=λk+1v.

Usando esto, si P(X)=anXn++a1X+a0 se tiene que

P(T)(v)=anTn(v)++a1T(v)+a0v=anλnv++a1λv+a0v=(anλn++a1λ+a0)v=P(λ)v.

Esto muestra que P(λ) es un eigenvalor de P(T).

◻

Relación con el polinomio mínimo

Una consecuencia del problema previo es la siguiente proposición.

Proposición. Sea AMn(C) una matriz y PC[X] un polinomio tal que P(A)=On. Entonces cualquier eigenvalor λ de A satisface P(λ)=0.

Solución. Por el problema anterior, P(λ) es un eigenvalor de P(A), pero P(A)=On y el único eigenvalor de la matriz cero es 0. Luego P(λ)=0.

◻

De esto, podemos por fin establecer una conexión con el polinomio mínimo, que enunciamos en forma de teorema.

Teorema. Sea T:VV una transformación lineal sobre un espacio de dimensión finita sobre un campo F. Los eigenvalores de T son precisamente las raíces en F del polinomio mínimo μT.

Demostración. Dado que μT(T)=0, el problema que acabamos de resolver nos dice que todos los eigenvalores de T son raíces de μT.

Conversamente, supongamos que existe λ una raíz de μT que no es eigenvalor. Entonces la transformación TλId es invertible. Como μT(λ)=0, podemos factorizar la raíz y escribir μT(X)=(Xλ)Q(X) para algún QF[X]. Dado que μT(T)=0 deducimos que

(TλId)Q(T)=0.

Recordando una vez más que TλId es invertible, esta ecuación implica que Q(T)=0. Ya que μT es el polinomio mínimo, por una propiedad que mostramos anteriormente obtendríamos que μT divide a Q. Pero esto se contradice con la igualdad μT(X)=(Xλ)Q(X), que nos dice que μT tiene grado mayor. Esto concluye la demostración.

◻

Ejercicios

Terminamos con un par de ejercicios para repasar el material de estas secciones. El primero de entre ellos toma prestados nombres de la probabilidad (lo lo cuál puede sugerirte en qué tipo de texto te podrías encontrar con estas matrices).

Problema 1. Una matriz AMn(R) se dice estocástica si aij0 para todo i,j{1,,n} y j=1naij=1 para todo i{1,,n}.

Demuestra que 1 es un eigenvalor de cualquier matriz estocástica.

Solución. Consideremos el vector v=(1,,1). Nota que

Av=(a11a12a1na21a22a2nan1an2ann)(111)=(a11+a12++a1na21+a22++a2nan1+an2++ann)=(111).

Es decir Av=v, por lo que v es un eigenvector de A con eigenvalor asociado 1.

◻

Problema 2. Sea V el espacio de todos los polinomios con coeficientes reales. Sea T:VV la transformación lineal dada por P(X)P(1X). ¿Cuáles son los eigenvalores de T?

Solución. Observa que
T2(P)=TT(P)=T(P(1X))=P(1(1X))=P(X). Así T2=Id, o bien T2Id=0. Luego, el polinomio mínimo μT tiene que dividir al polinomio X21. Sin embargo, los únicos factores de este polinomio son X1 y X+1. Dado que T±Id se tiene que μT(X)=X21. Por el último teorema que vimos, los eigenvalores de T son precisamente las raíces de μT en R, es decir ±1.

Más adelante…

En las entradas subsecuentes iremos más a fondo en el concepto de polinomio característico, para eventualmente llegar al teorema de Cayley-Hamilton. Para eso tendremos que equiparnos de bastante teoría y repasar varias propiedades de dicho polinomio.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Sea V el espacio de polinomios con coeficientes reales de grado a lo más n. Encuentra los eigenvalores de la transformación T:P(X)P(X)(1+X)P(X).
  • Si V es el espacio de polinomios con coeficientes reales, encuentra los eigenvalores de T:P(X)P(3X).
  • Sean A,B matrices en Mn(C) tales que ABBA=B. Demuestra que para todo k1 se cumple que ABkBkA=kBk y de esto deduce que B es nilpotente: existe m tal que Bm=0. Sugerencia: ¿Cuántos eigenvalores puede tener T:XAXXA?
  • ¿Puedes generalizar el último problema de la sección de matrices triangulares superiores?
  • Sea A una matriz cuadrada con entradas reales. Supón que λ es un real positivo que es eigenvalor de A2. Demuestra que λ o λ es un eigenvalor de A. ¿Sucederá a veces que sólo una de estas es eigenvalor?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Eigenvectores y eigenvalores

Por Julio Sampietro

Introducción

En esta entrada revisitamos los conceptos de eigenvalores y eigenvectores de una transformación lineal. Estos son esenciales para entender a las transformaciones lineales, y tienen un rango de aplicabilidad impresionante: aparecen en la física, las ecuaciones diferenciales parciales, la ciencia de datos, la topología algebraica y la probabilidad.

Primero enunciaremos la definición, después veremos un primer ejemplo para convencernos de que no son objetos imposibles de calcular. Luego daremos un método para vislumbrar una manera más sencilla de hacer dicho cálculo y concluiremos con unos ejercicios.

Eigen-definiciones

Comenzamos con V un espacio vectorial sobre F y T:VV una transformación lineal.

Definición. Un eigenvalor (también conocido como valor propio) de T es un escalar λF tal que λIdT no es invertible. Un eigenvector (también conocido como vector propio o λ-eigenvector) correspondiente a λ es un vector no-cero de ker(λIdT). A este kernel se le conoce como el eigenespacio correspondiente a λ (o λ-eigenespacio).

Entonces un λ-eigenvector es por definición distinto de cero y satisface

T(v)=λv.

Hay que tener cuidado. se permite que λ=0 sea eigenvalor, pero no se permite que v=0 sea eigenvector.

La colección de todos los eigenvectores, junto con el vector cero, es el eigenespacio asociado a λ. Podemos enunciar definiciones análogas con matrices.

Definición. Sea AMn(F) una matriz cuadrada. Un escalar λF es un eigenvalor de A si existe un vector XFn distinto de cero (un eigenvector) tal que AX=λX. En este caso el subespacio

ker(λInA):={XFnAX=λX}

es el λ-eigenespacio de A.

Puedes verificar que ambas definiciones se corresponden en el siguiente sentido:

Si V es un espacio de dimensión finita y T:VV es una transformación lineal, podemos escoger cualquier base de V y asociarle a T su forma matricial, digamos A, en esta base. Los eigenvalores de T son precisamente los eigenvalores de A. ¡Pero cuidado! Los eigenvectores de A dependerán de la base elegida.

Un primer ejemplo

Seguimos con un sencillo pero importante ejemplo.

Ejemplo 1. Considera la matriz

A=(0110).

Busquemos los eigenvectores y eigenvalores de A, pensando a A como una matriz con entradas complejas. Sea λC un eigenvalor y X un eigenvector asociado. Entonces se cumple la relación AX=λX. Si X=(x1,x2) entonces la condición mencionada es equivalente al par de ecuaciones

x2=λx1,x1=λx2.

Sustituyendo una en la otra obtenemos

x2=λ2x2.

Si x2=0 entonces x1=0 y así X es un vector nulo, lo que es imposible por definición (recuerda que pedimos que los eigenvectores sean distintos de cero). Entonces x20 y podemos dividir por x2 a la ecuación previa, de manera que λ2=1, o sea λ=±i. Conversamente, i y i son eigenvalores. En efecto, podemos tomar x2=1 y x1=λ como soluciones del problema anterior y obtener un vector propio asociado. De hecho, el eigenespacio está dado por

ker(λI2A)={(λx2,x2)x2C}

y esto no es más que la recta generada por el vector v=(λ,1)C2. Por lo tanto, vista como una matriz compleja, A tiene dos eigenvalores distintos ±i y dos eigenespacios, los generados por (i,1) y (i,1).

Por otro lado, veamos qué pasa si pensamos a A como una matriz con entradas reales. Haciendo las mismas cuentas llegamos a la misma ecuación, x2=λ2x2. Podemos reescribirla factorizando el término x2:

(λ2+1)x2=0.

Como λ esta vez es un número real, λ2+1 siempre es distinto de cero. Entonces para que el producto sea cero, tiene que ocurrir que x2=0, ¡pero entonces x1=0 y así X=0! En conclusión: vista como una matriz con entradas reales, A no tiene eigenvalores, y por tanto no tiene eigenespacios. La moraleja es que los eigenvalores y eigenvectores dependen mucho del campo en el que trabajemos.

¿Cómo calcularlos?

Si bien el ejemplo anterior resultó simple, no es difícil imaginar que matrices más complicadas y más grandes pueden resultar en procedimientos menos claros. En general:

  • ¿Cómo podemos calcular los eigenvalores?
  • ¿Cómo podemos calcular los eigenespacios de manera eficiente?
  • ¿Cómo podemos calcular los eigenvectores?

Una vez calculados los eigenvalores, calcular los eigenespacios se reduce a resolver el sistema de ecuaciones homogéneo (AλIn)X=0, lo cual ya hemos hecho muchas veces mediante reducción gaussiana. Luego, calcular los eigenvectores simplemente es tomar los elementos no cero del eigenespacio. Sin embargo, el cálculo de eigenvalores involucra encontrar raíces de polinomios lo cual de entrada no es obvio. Un primer paso es la siguiente observación que enunciamos como proposición.

Proposición. Un escalar λF es un eigenvalor de AMn(F) si y sólo si

det(λInA)=0.

Demostración. El sistema (λInA)X=0 tiene soluciones no triviales si y sólo si la matriz λInA no es invertible. A su vez, la matriz λInA no es invertible si y sólo si su determinante es nulo. El resultado se sigue.

◻

Regresemos a nuestra pregunta. Si

A=(a11a12a1na21a22a2nan1an2ann)

entonces la proposición nos dice que podemos calcular los valores propios de A resolviendo la ecuación polinomial

|λa11a12a1na21λa22a2nan1an2λann|=0

en F. Esta es una ecuación polinomial de grado n, y si el grado es mayor a 4 en general no existe una fórmula para resolverla en términos de radicales (aunque claro que hay casos particulares que si podemos resolver sin mucho problema).

Problema 2. Queremos calcular los eigenvalores de A, donde A está dada por

A=(100001010).

Solución. Como vimos en la proposición, esto se reduce a calcular las raíces del polinomio

|λ1000λ101λ|=0.

Calculando el determinante vemos que esto es de hecho

(λ1)(λ2+1)=0.

Sin embargo tenemos que recordar que las raíces dependen de nuestro campo de elección. Como no comentamos nada sobre el campo en el cual trabajamos, consideraremos dos casos. Si el campo es C entonces los eigenvalores son 1 y ±i. Si trabajamos sobre R entonces tenemos un único eigenvalor: 1.

Ejercicios

Acabamos esta entrada con unos ejercicios para reforzar lo que vimos.

Problema 1. Encuentra todos los números reales x tales que la matriz

A=(1x21)

tiene exactamente dos eigenvalores distintos. La misma pregunta para ningún eigenvalor.

Solución. El número de eigenvalores va a estar dado por el número de raíces del polinomio det(λI2A). Es decir, tenemos que trabajar la ecuación

det(λI2A)=|λ1x2λ1|=0.

Que a su vez se reduce a

(λ1)22x=0.

Y para que tenga dos soluciones basta con que 2x sea un número positivo. En efecto, en ese caso podemos despejar y resolver

λ=1±2x.

Como 2x es positivo solo si x lo es, podemos concluir que la condición necesaria y suficiente es que x sea un real positivo. Similarmente, si x es un número negativo no tendremos ningún eigenvalor.

Problema 2. Sea V el conjunto de todas las matrices AM2(C) tales que v=(12) es un eigenvector de A. Demuestra que V es un subespacio de M2(C) y da una base.

Solución. Supongamos que v es un eigenvector de A, con eigenvalor λ, y que es eigenvector de B, con eigenvalor μ. Entonces

(A+cB)(v)=Av+cBv=λv+cμv=(λ+cμ)v

por lo que v es eigenvector de A+cB con eigenvalor λ+cμ. Esto demuestra que V es un subespacio. Para darnos una idea de cómo podría ser una base para V, comencemos con una matriz genérica A=(abcd) tal que AV. Entonces A tiene que satisfacer Av=λv para algún λ. Escribamos esto más explícitamente

(abcd)(12)=(a+2bc+2d)=(λ2λ).

Así se desprenden dos ecuaciones

{a+2b=λc+2d=2λ.

Sabemos que λ es un parámetro libre, pues puede ser cualquier eigenvalor. Si conocemos a λ entonces necesitamos alguna de las variables, a o b para determinar a la otra y lo mismo con c y d. Entonces escojamos b y d como variables libres. Enseguida nuestra matriz es de la forma (reemplazando a a y c por sus valores en b y d):

A=(λ2bb2λ2dd)=b(2100)+d(0021)+λ(1020).

Entonces proponemos como base

β={(2100),(0021),(1020)}.

Ya vimos que β genera a V, y dejamos la independencia lineal como ejercicio.

◻

Más adelante…

En las próximas entradas desarrollaremos las propiedades relevantes de los eigenvalores y eigenvectores para eventualmente llegar al polinomio característico y establecer el puente con el polinomio mínimo.

Tarea moral

Aquí unos ejercicios para que repases el material de esta entrada.

  1. Encuentra todos los eigenvalores de la matriz A=(110021001)M3(C).
  2. Completa la demostración del último ejercicio de la sección de ejercicios, verificando que las soluciones encontradas son matrices linealmente independientes. ¿Puedes generalizar este ejercicio de alguna manera?
  3. Encuentra los eigenvalores de la matriz AMn(R) cuyas entradas son puros 2.
  4. Da contraejemplos para cada una de las siguientes afirmaciones:
    1. Si u y v son eigenvectores de A, entonces u+v es eigenvector de A.
    2. Si λ es eigenvalor de A y μ es eigenvalor de B, entonces λμ es eigenvalor de AB.
    3. Si A y B son formas matriciales de una misma transformación T y v es eigenvector de A, entonces v es eigenvector de B.
  5. Considera la transformación derivada en R[x]. ¿Quienes son sus eigenvectores y eigenvalores? Como sugerencia, estudia el coeficiente de mayor grado.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»