Archivo de la etiqueta: producto de matrices

Álgebra Lineal I: Propiedades del polinomio característico

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada continuamos con el estudio de eigenvalores y eigenvectores de matrices y trasformaciones lineales. Para ello, estudiaremos más a profundidad el polinomio característico.

Como recordatorio, en una entrada pasada demostramos que si A es una matriz en Mn(F), entonces la expresión det(λInA) es un polinomio en λ de grado n con coeficientes en F. A partir de ello, definimos el polinomio característico de A como χA(λ)=det(λInA).

En esta entrada probaremos algunas propiedades importantes del polinomio característico de matrices. Además, hablaremos de la multiplicidad algebraica de los eigenvalores. Finalmente enunciaremos sin demostración dos teoremas fundamentales en álgebra lineal: el teorema de caracterización de matrices diagonalizables y el teorema de Cayley-Hamilton.

Las raíces del polinomio característico son los eigenvalores

Ya vimos que las raíces del polinomio característico son los eigenvalores. Pero hay que tener cuidado. Deben ser las raíces que estén en el campo en el cual la matriz esté definida. Veamos un ejemplo más.

Problema. Encuentra el polinomio característico y los eigenvalores de la matriz (0100201007060030).

Solución. Debemos encontrar las raíces del polinomio dado por el siguiente determinante:
|λ1002λ1007λ6003λ|.

Haciendo expansión de Laplace en la primer columna, tenemos que este determinante es igual a

λ|λ107λ603λ|+2|1007λ603λ|.

Para calcular los determinantes de cada una de las matrices de 3×3 podemos aplicar la fórmula por diagonales para obtener:
λ|λ107λ603λ|=λ(λ318λ+7λ)=λ(λ311λ)=λ411λ2

y
2|1007λ603λ|=2(λ2+18)=2λ2+36.

Concluimos que el polinomio característico es
λ413λ2+36=(λ24)(λ29)=(λ+2)(λ2)(λ+3)(λ3).

De esta factorización, las raíces del polinomio (y por lo tanto los eigenvalores que buscamos) son 2,2,3,3.

Si quisiéramos encontrar un eigenvector para, por ejemplo, el eigenvalor 2, tenemos que encontrar una solución no trivial al sistema lineal de ecuaciones homogéneo (2InA)X=0.

Propiedades del polinomio característico

Veamos ahora algunas propiedades importantes del polinomio característico. El primer resultado habla del polinomio característico de matrices triangulares superiores. Un resultado análogo se cumple para matrices inferiores, y su enunciado y demostración quedan como tarea moral.

Proposición. Si A=[aij] es una matriz triangular superior en Mn(F), entonces su polinomio característico es χA(λ)=i=1n(λaii).

Demostración. Como A es triangular superior, entonces λInA también, y sus entradas diagonales son precisamente λaii para i=1,,n. Como el determinante de una matriz triangular es el producto de sus entradas en la diagonal, tenemos que χA(λ)=i=1n(λaii).

◻

Como el polinomio característico es un determinante, podemos aprovechar otras propiedades de determinantes para obtener otros resultados.

Proposición. Una matriz y su transpuesta tienen el mismo polinomio característico.

Demostración. Sea A una matriz en Mn(F). Una matriz y su transpuesta tienen el mismo determinante. Además, transponer es una transformación lineal. De este modo:
χA(λ)=det(λInA)=det(t(λInA))=det(λ(tIn)tA)=det(λIntA)=χtA(λ).

◻

Ya antes habíamos mostrado que matrices similares tienen los mismos eigenvalores, pero que dos polinomios tengan las mismas raíces no necesariamente implica que sean iguales. Por ejemplo, los polinomios (x1)2(x+1)y(x+1)2(x1) tienen las mismas raíces, pero no son iguales.

De esta forma, el siguiente resultado es más fuerte de lo que ya habíamos demostrado antes.

Proposición. Sean A y P matrices en Mn(F) con P invertible. Entonces A y P1AP tienen el mismo polinomio característico.

Demostración. El resultado se sigue de la siguiente cadena de igualdades, en donde usamos que det(P)det(P1)=1 y que el determinante es multiplicativo:

χP1AP(λ)=det(P)χP1AP(λ)det(P)1=det(P)det(λInP1AP)det(P1)=det(P(λInP1AP)P1)=det(λPP1PP1APP1)=det(λInA)=χA(λ)

◻

Ten cuidado. El determinante es multiplicativo, pero el polinomio característico no es multiplicativo. Esto es evidente por el siguiente argumento. Si A y B son matrices en Mn(F), entonces χA(λ) y χB(λ) son cada uno polinomios de grado n, así que su producto es un polinomio de grado 2n, que por lo tanto no puede ser igual al polinomio característico χAB(λ) pues este es de grado n. Así mismo, χA2(λ) no es χA(λ)2.

Una última propiedad que nos interesa es mostrar que el determinante de una matriz y su traza aparecen en los coeficientes del polinomio característico.

Teorema. Sea A una matriz en Mn(F) y χA(λ) su polinomio característico. Entonces χA(λ) es de la forma λn(trA)λn1++(1)ndetA.

Demostración. Tenemos que mostrar tres cosas:

  • El polinomio χA es mónico, es decir, tiene coeficiente principal 1,
  • que el coeficiente del término de grado n1 es trA y
  • el coeficiente libre es (1)ndetA.

El coeficiente libre de un polinomio es su evaluación en cero. Usando la homogeneidad del determinante, dicho coeficiente es:
χA(0)=det(0InA)=det(A)=(1)ndet(A).

Esto muestra el tercer punto.

Para el coeficiente del término de grado n1 y el coeficiente principal analicemos con más detalle la fórmula del determinante
|λa11a12a1na21λa22a1nan1an2λann|
en términos de permutaciones.

Como discutimos anteriormente, la única forma de obtener un término de grado n es cuando elegimos a la permutación identidad. Pero esto también es cierto para términos de grado n1, pues si no elegimos a la identidad, entonces la permutación elige por lo menos dos entradas fuera de la diagonal, y entonces el grado del producto de entradas correspondiente es a lo más n2.

De este modo, los únicos términos de grado n y n1 vienen del producto (λa11)(λann).

El único término de grado n viene de elegir λ en todos los factores, y se obtiene el sumando λn, lo cual muestra que el polinomio es mónico.

Los únicos términos de grado n1 se obtienen de elegir λ en n1 factores y un término del estilo aii. Al considerar todas las opciones, el término de grado n1 es (a11+a22++ann)λn1=(trA)λn1, que era lo último que debíamos mostrar.

◻

Ejemplo. El teorema anterior muestra que si A es una matriz en M2(F), es decir, de 2×2, entonces χA(λ)=λ2(trA)λ+detA. De manera explícita en términos de las entradas tendríamos entonces que si A=(abcd), entonces su polinomio característico es λ2(a+d)λ+(adbc).

Como ejemplo, si A=(5283), entonces su polinomio característico es λ22λ+1=(λ1)2. Su único eigenvalor sería entonces 1.

Suma y producto de eigenvalores de matrices complejas

A veces queremos referirnos al conjunto de todos los eigenvalores de una matriz.

Definición. Para A una matriz en Mn(F), el espectro de A es el conjunto de eigenvalores de A. Lo denotamos por spec(A)

Tenemos una definición análoga para el espectro de una transformación lineal. Esa definición da un poco de intuición de por qué los teoremas de diagonalización de matrices se llaman teoremas espectrales. La siguiente definición habla de un sentido en el cual un eigenvalor «se repite».

Definición. Sea A una matriz en Mn(F) y λ un eigenvalor de A. La multiplicidad algebraica de λ es el mayor entero mλ tal que (xλ)mλ divide a χA(x).

Cuando estamos en C, por el teorema fundamental del álgebra todo polinomio de grado n se puede factorizar en exactamente n términos lineales. Además, los polinomios característicos son mónicos. De este modo, si tenemos una matriz A en Mn(C), su polinomio característico se puede factorizar como sigue:

χA(λ)=j=1n(λλj),

en donde λ1,,λn son eigenvalores de A, no necesariamente distintos, pero en donde cada eigenvalor aparece en tantos términos como su multiplicidad algebraica.

Desarrollando parcialmente el producto del lado derecho, tenemos que el coeficiente de λn1 es (λ1++λn) y que el coeficiente libre es (1)nλ1λn. Combinando este resultado con el de la sección anterior y agrupando eigenvalores por multiplicidad, se demuestra el siguiente resultado importante. Los detalles de la demostración quedan como tarea moral.

Teorema. Sea A una matriz en Mn(C)

  • La traza A es igual a la suma de los eigenvalores, contando multiplicidades algebraicas, es decir: trA=λspec(A)mλλ.
  • El determinante de A es igual al producto de los eigenvalores, contando multiplicidades algebraicas, es decir: detA=λspec(A)λmλ.

Veamos un problema en donde se usa este teorema.

Problema. Sea A una matriz en Mn(C) tal que A24A+3In=0. Muestra que el determinante de A es una potencia de 3.

Solución. Sea λ un eigenvalor de A y v un eigenvector para λ. Tenemos que A2v=A(λv)=λ(Av)=λ2v. De esta forma, tendríamos que
0=(A24A+3In)v=(λ2v4λv+3v)=(λ24λ+3)v.

Como v no es el vector 0, debe suceder que λ24λ+3=0. Como λ24λ+3=(λ3)(λ1), entonces λ=1 ó λ=3. Con esto concluimos que los únicos posibles eigenvectores de A son 1 y 3.

Como A es una matriz en C, tenemos entonces que su polinomio característico es de la forma (x1)a(x3)b con a y b enteros no negativos tales que a+b=n. Pero entonces por el teorema de producto de eigenvalores, tenemos que el determinante es 1a3b=3b, con lo que queda demostrado que es una potencia de 3.

◻

Dos teoremas fundamentales de álgebra lineal (opcional)

Tenemos todo lo necesario para enunciar dos resultados de álgebra lineal. Sin embargo, las demostraciones de estos resultados requieren de más teoría, y se ven en un siguiente curso. No los demostraremos ni los usaremos en el resto de este curso, pero te pueden servir para anticipar el tipo de resultados que verás al continuar tu formación en álgebra lineal.

El primer resultado fundamental es una caracterización de las matrices que pueden diagonalizarse. Para ello necesitamos una definición adicional. Hay otro sentido en el cual un eigenvalor λ de una matriz A puede repetirse.

Definición. Sea A una matriz en Mn(F) y λ un eigenvalor de A. La multiplicidad geométrica de λ es la dimensión del kernel de la matriz λInA pensada como transformación lineal.

En estos términos, el primer teorema al que nos referimos queda enunciado como sigue.

Teorema. Una matriz A en Mn(F) es diagonalizable si y sólo si su polinomio característico χA(λ) se puede factorizar en términos lineales en F[λ] y además, para cada eigenvalor, su multiplicidad algebraica es igual a su multiplicidad geométrica.

Ejemplo. La matriz A=(0110) tiene como polinomio característico a χA(λ)=λ2+1. Este polinomio no se puede factorizar en R[x], así que A no es diagonalizable con matrices de entradas reales.

Sin embargo, en C tenemos la factorización en términos lineales λ2+1=(λ+i)(λi), que dice que i y i son eigenvalores de multiplicidad algebraica 1. Se puede mostrar que la multiplicidad geométrica también es 1. Así, A sí es diagonalizable con matrices de entradas complejas.

◻

El segundo resultado fundamental dice que «cualquier matriz se anula en su polinomio característico». Para definir correctamente esto, tenemos que decir qué quiere decir evaluar un polinomio en una matriz. La definición es más o menos natural.

Definición. Si A es una matriz en Mn(F) y p es un polinomio en F[λ] de la forma p(λ)=a0+a1λ+a2λ2++anλn, definimos a la matriz p(A) como la matriz a0In+a1A+a2A2++anAn.

En estos términos, el resultado queda enunciado como sigue.

Teorema (Cayley-Hamilton). Si A es una matriz en Mn(F) y χA(x) es su polinomio característico, entonces χA(A)=On.

Ejemplo. Tomemos de nuevo a la matriz A=(0110) del ejemplo anterior. Su polinomio característico es x2+1. En efecto, verificamos que se cumple el teorema de Cayley-Hamilton pues:
A2+I2=(0110)(0110)+(1001)=(1001)+(1001)=(0000).

◻

Más adelante…

En esta entrada estudiamos algunas propiedades de los eigenvalores y eigenvectores de transformaciones lineales y matrices; vimos cómo obtener eigenvalores de una matriz a partir del polinomio característico y enunciamos dos teoremas muy importantes como parte opcional del curso.

En la siguiente entrada haremos varios ejercicios para desarrollar un poco de práctica al obtener los eigenvalores y eigenvectores de una transformación lineal y de una matriz.

Entradas relacionadas

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Enuncia y demuestra cómo es el polinomio característico de una matriz triangular inferior.
  • Completa los detalles de la demostración del teorema de suma y producto de eigenvalores. Úsalo para encontrar la suma y producto (con multiplicidades) de los eigenvalores de la matriz (5012321200050240).
  • Sea A una matriz en Mn(F). ¿Cómo es el polinomio característico de A en términos del polinomio característico de A?
  • Tomemos A una matriz en Mn(F) y k un entero positivo. Muestra que si λ es un eigenvalor de la matriz A, entonces λk es un eigenvalor de la matriz Ak.

De la sección opcional:

  • Demuestra, haciendo todas las cuentas, el caso particular del teorema de Cayley-Hamilton para matrices de 2×2.
  • Ya sabemos calcular el polinomio característico de matrices diagonales. Muestra el teorema de Cayley-Hamilton en este caso particular.
  • Las matrices diagonales trivialmente son diagonalizables. Muestra que la multiplicidad algebraica de sus eigenvalores en efecto coincide con la multiplicidad geométrica.

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Determinantes de matrices y transformaciones lineales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior dimos la definición de determinante para ciertos vectores con respecto a una base. En esta entrada continuamos con la construcción de determinantes. Primero, basados en la teoría que desarrollamos anteriormente, definiremos determinantes de transformaciones lineales. Luego, mediante la cercanía entre transformaciones lineales y matrices, definimos determinantes de matrices.

Determinantes de transformaciones lineales

Ahora definiremos el determinante para transformaciones lineales. Antes de esto, necesitamos hacer algunas observaciones iniciales y demostrar un resultado.

Si tomamos un espacio vectorial V de dimensión finita n1 sobre un campo F, una transformación lineal T:VV y una forma n-lineal f:VnF, se puede mostrar que la transformación Tf:VnF dada por Tf(x1,,xn)=f(T(x1),,T(xn)) también es una forma n-lineal. Además, se puede mostrar que si f es alternante, entonces Tf también lo es. Mostrar ambas cosas es relativamente sencillo y queda como tarea moral.

Teorema. Sea V un espacio vectorial de dimensión finita n1 sobre el campo F. Para cualquier transformación lineal T:VV existe un único escalar detT en F tal que f(T(x1),,T(xn))=detTf(x1,,xn) para cualquier forma n-lineal alternante f:VnF y cualquier elección x1,,xn de vectores en V.

Demostración. Fijemos una base B=(b1,,bn) cualquiera de V. Llamemos g a la forma n-lineal alternante det(b1,,bn). Por la discusión de arriba, la asignación Tg:VnF dada por (x1,,xn)g(T(x1),,T(xn)) es una forma n-lineal y alternante.

Por el teorema que mostramos en la entrada de determinantes de vectores, se debe cumplir que Tg=Tg(b1,,bn)g. Afirmamos que detT:=Tg(b1,,bn) es el escalar que estamos buscando.

En efecto, para cualquier otra forma n-lineal alternante f, tenemos por el mismo teorema que f=f(b1,,bn)g. Usando la linealidad de T y la igualdad anterior, se tiene que

Tf=f(b1,,bn)Tg=f(b1,,bn)detTg=detTf.

Con esto se prueba que detT funciona para cualquier forma lineal f. La unicidad sale eligiendo (x1,,xn)=(b1,,bn) y f=g en el enunciado del teorema, pues esto forza a que detT=g(T(b1),,T(bn)).

◻

Ahora sí, estamos listos para definir el determinante de una transformación lineal.

Definición. El escalar detT del teorema anterior es el determinante de la transformación lineal T.

Para obtener el valor de detT, podemos entonces simplemente fijar una base B=(b1,,bn) y el determinante estará dado por detT=det(b1,,bn)(T(b1),,T(bn)). Como el teorema también prueba unicidad, sin importar que base B elijamos este número siempre será el mismo.

Ejemplo 1. Vamos a encontrar el determinante de la transformación lineal T:R3R3 dada por T(x,y,z)=(2z,2y,2x). Para ello, usaremos la base canónica de R3. Tenemos que
T(1,0,0)=(0,0,2)=2e3T(0,1,0)=(0,2,0)=2e2T(0,0,1)=(2,0,0)=2e1.

De acuerdo al teorema anterior, podemos encontrar al determinante de T como detT=det(e1,e2,e3)(2e3,2e2,2e1).

Como el determinante (para vectores) es antisimétrico, al intercambiar las entradas 1 y 3 su signo cambia en 1. Usando la 3-linealidad en cada entrada, podemos sacar un factor 2 de cada una. Así, tenemos:
detT=det(e1,e2,e3)(2e3,2e2,2e1)=det(e1,e2,e3)(2e1,2e2,2e3)=8det(e1,e2,e3)(e1,e2,e3)=8.

Concluimos entonces que el determinante de T es 8.

Ejemplo 2. Vamos ahora a encontrar el determinante de la transformación T:Rn[x]Rn[x] que deriva polinomios, es decir, tal que T(p)=p. Tomemos q0=1,q1=x,,qn=xn la base canónica de Rn[x].

Notemos que, T(1)=0, de modo que los vectores T(1),,T(xn) son linealmente dependientes. Así, sin tener que hacer el resto de los cálculos, podemos deducir ya que det(q0,,qn)(T(q0),,T(qn))=0. Concluimos entonces que detT=0.

Determinantes de matrices

La expresión detT=det(b1,,bn)(T(b1),,T(bn)) para una transformación lineal T también nos permite poner al determinante en términos de las entradas de la matriz de T con respecto a la base B. Recordemos que dicha matriz AT=[aij] tiene en la columna i las coordenadas de bi en la base B. En otras palabras, para cada i se cumple que T(bi)=j=1najibi.

Usando esta notación, obtenemos que detT=σSnsign(σ)a1σ(1)anσ(n), de manera que podemos expresar a detT en términos únicamente de su matriz en la base B.

Esto nos motiva a definir el determinante de una matriz en general.

Definición. Para una matriz A en Mn(F) de entradas A=[aij], el determinante de A es detA=σSnsign(σ)a1σ(1)anσ(n). A detA también lo escribimos a veces en notación de «matriz con barras verticales» como sigue:

detA=|a11a12a1na21a22a2nan1an2ann.|

Ejemplo. Si queremos calcular el determinante de una matriz en M2(F), digamos A=(abcd), debemos considerar dos permutaciones: la identidad y la transposición (1,2).

La identidad tiene signo 1 y le corresponde el sumando ad. La transposición tiene signo 1 y le corresponde el sumando bc. Así, |abcd|=adbc.

Retomando la discusión antes de la definición, tenemos entonces que detT=detAT, en donde a la izquierda hablamos de un determinante de transformaciones lineales y a la derecha de uno de matrices. La matriz de T depende de la base elegida, pero como vimos, el determinante de T no. Esta es una conclusión muy importante, y la enunciamos como teorema en términos de matrices.

Teorema. Sean A y P matrices en Mn(F) con P invertible. El determinante de A y el de P1AP son iguales.

Determinantes de matrices triangulares

Terminamos esta entrada con un problema que nos ayudará a repasar la definición y que más adelante servirá para calcular determinantes.

Problema. Muestra que el determinante de una matriz triangular superior o triangular inferior es igual al producto de las entradas de su diagonal.

Solución. En una matriz triangular superior tenemos que aij=0 si i>j. Vamos a estudiar la expresión σSnsign(σ)a1σ(1)anσ(n).

Si una permutación σ no es la identidad, entonces hay un entero i que no deja fijo, digamos σ(i)i. Tomemos a i como el mayor entero que σ no deja fijo. Notemos que σ(i) tampoco queda fijo por σ pues σ(σ(i))=σ(i) implica σ(i)=i, ya que σ es biyectiva, y estamos suponiendo σ(i)i. Por la maximalidad de i, concluimos que σ(i)<i.Entonces el sumando correspondiente a σ es 0 pues tiene como factor a la entrada aiσ(i)=0.

En otras palabras, la única permutación a la que le puede corresponder un sumando no cero es la identidad, cuyo signo es 1. De esta forma,
det(A)=σSnsign(σ)a1σ(1)anσ(n)=a11ann.

◻

Más adelante…

En esta entrada planteamos cómo se define el concepto de matriz para transformaciones lineales y cómo esta definición se extiende naturalmente a la definición del determinante de una matriz, recordando que a cada transformación lineal se le puede asociar una matriz y viceversa.

En las siguientes entradas vamos a ver qué propiedades que cumplen los determinantes y aprenderemos diferentes técnicas para calcularlos. A lo largo de la unidad, desarrollaremos bastante práctica en el cálculo y la manipulación de los determinantes, ya sea el determinante de un conjunto de vectores, de una transformación lineal o de una matriz.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Muestra que la transformación Tf definida en la entrada es n-lineal y alternante.
  • Usando la definición de determinante para transformaciones lineales, encuentra el determinante de la transformación lineal T:RnRn dada por T(x1,x2,,xn)=(x2,x3,,x1).
  • Calcula por definición el determinante de las matrices (3241) y (1241391416).
  • Calcula por definición el determinante de la matriz (1112344916) y compáralo con el de la matriz de 3×3 del inciso anterior. ¿Qué notas?
  • Completa el argumento para mostrar que el determinante de una matriz triangular inferior es el producto de las entradas en su diagonal.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»