Archivo de la etiqueta: matrices positivas

Seminario de Resolución de Problemas: El teorema espectral y matrices positivas

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada hablaremos de matrices simétricas y de matrices positivas. Nos enfocaremos en el caso en el que sus entradas sean números reales. Ambos tipos de matrices son fundamentales en la teoría de álgebra lineal. Tanto para las matrices simétricas como para las positivas hay resultados de caracterización que podemos utilizar en varios problemas matemáticos.

El teorema espectral para matrices simétricas reales

Si A es una matriz de m×n, su transpuesta tA es la matriz de n×m que se obtiene de reflejar a las entradas de A en su diagonal principal. Otra forma de decirlo es que si en términos de entradas tenemos A=[aij], entonces tA=[aji]. Una matriz y su transpuesta comparten muchas propiedades, como su determinante, su polinomio característico, su rango, sus eigenvalores, etc.

Decimos que una matriz es simétrica si es igual a su transpuesta. Una matriz es ortogonal si es invertible y tA=A1. Las matrices simétricas y ortogonales con entradas reales son muy importantes y cumplen propiedades bonitas.

Teorema (teorema espectral). Si A es una matriz de n×n con entradas reales y simétrica, entonces:

  • Sus eigenvalores λ1,,λn (contando multiplicidades), son todos reales.
  • Existe una matriz ortogonal P de n×n y con entradas reales tal que si tomamos a D la matriz diagonal de n×n cuyas entradas en la diagonal principal son λ1,,λn, entonces A=P1DP.

No todas las matrices se pueden diagonalizar. Cuando una matriz sí se puede diagonalizar, entonces algunas operaciones se hacen más sencillas. Por ejemplo si A=P1DP como en el teorema anterior, entonces
A2=(P1DP)(P1DP)=P1DDP=P1D2P,

y de manera inductiva se puede probar que Ak=P1DkP. Elevar la matriz D a la k-ésima potencia es sencillo, pues como es una matriz diagonal, su k-ésima potencia consiste simplemente en elevar cada una de las entradas en su diagonal a la k.

Problema. Sea A una matriz de n×n simétrica y de entradas reales. Muestra que si Ak=On para algún entero positivo k, entonces A=On.

Sugerencia pre-solución. La discusión anterior te permite enunciar la hipótesis en términos de los eigenvalores de A. Modifica el problema a demostrar que todos ellos son cero.

Solución. Como A es simétrica y de entradas reales, entonces sus eigenvalores λ1,,λn son reales y es diagonalizable. Digamos que su diagonalización es P1DP. Tenemos que On=Ak=P1DkP. Multiplicando por la matriz P a la izquierda, y la matriz P1 a la derecha, tenemos que Dk=On. Las entradas de Dk son λ1k,,λnk, y la igualdad anterior muestra que todos estos números son iguales a cero. De este modo, λ1==λn=0.

Concluimos que D=On, y que por lo tanto A=P1OnP=On.

◻

Veamos ahora un bello problema que motiva una fórmula para los números de Fibonacci desde la teoría del álgebra lineal.

Problema. Toma la matriz A=(0111). Calcula las primeras potencias de A a mano. Conjetura y muestra cómo es An en términos de la sucesión de Fibonacci. A partir de esto, encuentra una fórmula para el n-ésimo término de la sucesión de Fibonacci.

Sugerencia pre-solución. Para empezar, haz las primeras potencias y busca un patrón. Luego, para la demostración de esa parte, procede por inducción. Hay varias formas de escribir a la sucesión de Fibonacci, usa una notación que sea cómoda.

Solución. Al calcular las primeras potencias de la matriz A obtenemos:

A=(0111),A2=(1112),A3=(1223),A4=(2335),A5=(3558).

Al parecer, en las entradas de A van apareciendo los números de Fibonacci. Seamos más concretos. Definimos F0=0, F1=1 y para n0 definimos Fn+2=Fn+Fn+1. La conjetura es que para todo entero n1, se tiene que An=(Fn1FnFnFn+1).

Esto se puede probar por inducción. Arriba ya hicimos el caso n=1. Supongamos la conjetura cierta hasta un entero n dado, y consideremos la matriz An+1. Tenemos haciendo el producto de matrices, usando la hipótesis inductiva y la recursión de Fibonacci, que

An+1=AAn=(0111)(Fn1FnFnFn+1)=(FnFn+1Fn1+FnFn+Fn+1)=(FnFn+1Fn+1Fn+2).

Esto termina el argumento inductivo y prueba la conjetura.

Para encontrar una fórmula para los Fibonaccis, lo que haremos ahora es usar el teorema espectral. Esto lo podemos hacer pues la matriz A es de entradas reales y simétrica. Para encontrar la matriz diagonal de la factorización, necesitamos a los eigenvalores de A. Su polinomio característico es |λ11λ1|=λ2λ1.

Usando la fórmula cuadrática, las raíces de este polinomio (y por tanto, los eigenvalores de A) son 1±52. Por el momento, para simplificar la notación, llamemos α a la de signo más y β a la raíz de signo menos. Por el teorema espectral, existe una matriz invertible P de 2×2 tal que A=P1(α00β)P.

De esta forma, An=P1(αn00βn)P.

Aquí no es tan importante determinar concretamente P ni realizar las cuentas, sino darnos cuenta de que tras realizarlas cada entrada será una combinación lineal de αn y βn y de que los coeficientes de esta combinación lineal ya no dependen de n, sino sólo de las entradas de P. En particular, la entrada superior derecha de An por un lado es Fn, y por otro lado es rαn+sβn.

¿Cómo obtenemos los valores de α y β? Basta substituir n=1 y n=2 para obtener un sistema de ecuaciones en α y β. Aquí abajo usamos que como α y β son raíces de x2x1, entonces α2=α+1, β2=β+1 y α+β=1.

{1=F1=rα+sβ1=F2=rα2+sβ2=r+s+1.

De aquí, obtenemos la solución
r=1αβ=15s=r=15.

Finalmente, todo este trabajo se resume a que una fórmula para los números de Fibonacci es Fn=(1+52)n(152)n5.

◻

Matrices positivas y positivas definidas

Por definición, una matriz simétrica A de n×n con entradas reales es positiva si para cualquier vector (columna) v en Rn se tiene que tvAv0. Aquí tv es la transposición de v, es decir, el mismo vector, pero como vector fila.

Si además la igualdad se da sólo para el vector v=0, entonces decimos que A es positiva definida. Un ejemplo sencillo de matriz positiva es la matriz A=(1111), pues para cualquier vector v=(x,y) se tiene que tvAv=x22xy+y2=(xy)20. Sin embargo, esta matriz no es positiva definida pues la expresión anterior se anula en vectores no cero como (1,1). Como puedes verificar, un ejemplo de matriz positiva definida es B=(3004).

Las matrices reales que son positivas definidas son importantes pues caracterizan todos los productos interiores en Rn. Una vez que se tiene un producto interior en un espacio vectorial de dimensión finita, se pueden aprovechar muchas de sus propiedades o consecuencias, por ejemplo, la desigualdad de Cauchy-Schwarz o la existencia de bases ortogonales para hacer descomposiciones de Fourier.

Para cuando se quieren resolver problemas, es muy útil conocer varias equivalencias de que una matriz sea positiva.

Equivalencias para matrices positivas

El siguiente resultado enuncia algunas de las equivalencias para que una matriz sea positiva

Teorema. Sea A una matriz simétrica. Entonces todas las siguientes afirmaciones son equivalentes:

  1. A es positiva.
  2. Todos los eigenvalores de A son no negativos.
  3. A=B2 para alguna matriz simétrica B en Mn(R).
  4. A=tCC para alguna matriz C en Mn(R).

Hay un resultado análogo para cuando se quiere determinar si una matriz A es positiva definida. En ese caso, los eigenvalores tienen que ser todos positivos. Para los puntos 3 y 4 se necesita además que B y C sean invertibles.

Problema. Sea A una matriz de n×n con entradas reales, simétrica y positiva. Muestra que si tr(A)=ndet(A)n, entonces A conmuta con cualquier matriz de n×n.

Sugerencia pre-solución. Necesitarás usar que matrices similares tienen la misma traza y el mismo determinante, o una versión particular para este problema.

Solución. Las siguientes son propiedades de la traza y el determinante:

  • El determinante de una matriz diagonal es el producto de las entradas en su diagonal.
  • Si tenemos dos matrices similares, entonces tienen la misma traza.

En particular, las hipótesis implican, por el teorema espectral, que A se puede diagonalizar con matrices A=P1DP, donde D es la matriz diagonal que tiene en su diagonal principal a los eigenvalores λ1,,λn de A, y P1 es una matriz invertible. Como A y D son similares, se tiene que
tr(A)=tr(D)=λ1++λndet(A)=det(D)=λ1λn.

Como A es positiva, entonces todos sus eigenvalores son no negativos, así que satisfacen la desigualdad MA-MG:

λ1++λnnλ1λnn.

Por la última hipótesis del problema, esta desigualdad es de hecho una igualdad. Pero la igualdad en MA-MG se alcanza si y sólo si todos los números son iguales entre sí. Tenemos entonces que todos los eigenvalores son iguales a un cierto valor λ, y entonces D=λIn. Como cualquier múltiplo escalar de la matriz identidad conmuta con cualquier matriz de n×n, tendríamos entonces que

A=P1DP=P1(λIn)P=(λIn)(P1P)=λIn.

Con esto probamos que A es de hecho un múltiplo de la matriz identidad, y por lo tanto conmuta con cualquier matriz de n×n.

◻

Más problemas

Puedes encontrar más problemas del teorema espectral, de formas y matrices positivas en la Sección 10.2 y la Sección 10.8 del libro Essential Linear Algebra de Titu Andreescu.

Álgebra Lineal I: Teorema espectral para matrices simétricas reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada demostramos el teorema espectral para matrices simétricas reales en sus dos formas. Como recordatorio, lo que probaremos es lo siguiente.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Teorema. Sea A una matriz simétrica en Rn. Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Rn, tales que A=P1DP.

Para ello, usaremos los tres resultados auxiliares que demostramos en la entrada de eigenvalores de matrices simétricas reales. Los enunciados precisos están en ese enlace. Los resumimos aquí de manera un poco informal.

  • Los eigenvalores complejos de matrices simétricas reales son números reales.
  • Si una transformación T es simétrica y W es un subespacio estable bajo T, entonces W también lo es. Además, T restringida a W o a W también es simétrica.
  • Es lo mismo que una matriz sea diagonalizable, a que exista una base formada eigenvectores de la matriz.

Además de demostrar el teorema espectral, al final de la entrada probaremos una de sus consecuencias más importantes. Veremos una clasificación de las matrices que inducen formas bilineales positivas.

Demostración de la primera versión del teorema espectral

Comenzamos mostrando la siguiente versión del teorema espectral.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Demostración. Como V es espacio Euclideano, entonces tiene cierta dimensión finita n. Haremos inducción fuerte sobre n. Si n=1, el polinomio característico de T es de grado 1 y con coeficientes reales, así que tiene una raíz λ real. Si v es un eigenvector de T para λ, entonces vv también es eigenvector de T y conforma una base ortonormal para V.

Supongamos que el resultado es cierto para todo espacio Euclideano de dimensión menor a n y tomemos V espacio Euclideano de dimensión n. Por el teorema fundamental del álgebra, el polinomio característico de T tiene por lo menos una raíz λ en C. Como T es simétrica, cualquier matriz A que represente a T también, y λ sería una raíz del polinomio característico de A. Por el resultado que vimos en la entrada anterior, λ es real.

Consideremos el kernel W de la transformación λidT. Si W es de dimensión n, entonces W=V, y por lo tanto T(v)=λv para todo vector v en V, es decir, todo vector no cero de V es eigenvector de T. De esta forma, cualquier base ortonormal de V satisface la conclusión. De esta forma, podemos suponer que WV y que por lo tanto 1dimWn1, y como V=WW, se obtiene que 1dimWn1. Sea B una base ortonormal de W, que por lo tanto está formada por eigenvectores de T con eigenvalor λ.

Como la restricción T1 de T a W es una transformación simétrica, podemos aplicar la hipótesis inductiva y encontrar una base ortonormal B de eigenvectores de T1 (y por lo tanto de T) para W.

Usando de nuevo que V=WW, tenemos que BB es una base de V formada por eigenvectores de T.

El producto interior de dos elementos distintos de B, o de dos elementos distintos de B es cero, pues individualmente son bases ortonormales. El producto de un elemento de B y uno de B es cero pues un elemento está en W y el otro en W. Además, todos los elementos de BB tiene norma 1, pues vienen de bases ortogonales. Esto muestra que BB es una base ortonormal de V que consiste de eigenvectores de T.

◻

Demostración de la segunda versión del teorema espectral

Veamos ahora la demostración del teorema espectral en su enunciado con matrices.

Teorema. Sea A una matriz simétrica en Mn(R). Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Mn(R), tales que A=P1DP.

Demostración. Como A es una matriz simétrica, la transformación T:FnFn dada por T(X)=AX es simétrica. Aplicando la primer versión del teorema espectral, existe una base ortonormal de Fn que consiste de eigenvectores de T. Digamos que estos eigenvectores son C1,,Cn. Por definición de T, estos eigenvectores de T son exactamente eigenvectores de A.

Anteriormente demostramos que si construimos a una matriz B usando a C1,,Cn como columnas y tomamos la matriz diagonal D cuyas entradas son los eigenvalores correspondientes λ1,,λn, entonces A=BDB1.

Afirmamos que la matriz B es ortogonal. En efecto, la fila j de la matriz tB es precisamente Cj. De esta forma, la entrada (i,j) del producto tBB es precisamente el producto punto de Ci con Cj. Como la familia C1,,Cn es ortonormal, tenemos que dicho producto punto es uno si i=j y cero en otro caso. De aquí, se concluye que tBB=In.

Si una matriz es ortogonal, entonces su inversa también. Esto es sencillo de demostrar y queda como tarea moral. Así, definiendo P=B1, tenemos la igualdad A=P1DP, con D diagonal y P ortogonal, justo como lo afirma el teorema.

◻

Matrices positivas y positivas definidas

Una matriz A simétrica en Mn(R) induce una forma bilineal simétrica en Rn mediante la asignación (x,y)txAy, con forma cuadrática correspondiente xtxAx.

Definición. Una matriz A en Mn(R) es positiva o positiva definida si su forma bilineal asociada es positiva o positiva definida respectivamente.

Una de las aplicaciones del teorema espectral es que nos permite dar una clasificación de las matrices simétricas positivas.

Teorema. Sea A una matriz simétrica. Entonces todas las siguientes afirmaciones son equivalentes:

  1. A es positiva.
  2. Todos los eigenvalores de A son no negativos.
  3. A=B2 para alguna matriz simétrica B en Mn(R).
  4. A=tCC para alguna matriz C en Mn(R).

Demostración. (1) implica (2). Supongamos que A es positiva y tomemos λ un eigenvalor de A. Tomemos v un eigenvector de eigenvalor λ. Tenemos que:
λv2=λtvv=tv(λv)=tvAv0.

Como v20, debemos tener λ0.

(2) implica (3). Como A es matriz simétrica, por el teorema espectral tiene una diagonalización A=P1DP con P una matriz invertible y D una matriz diagonal cuyas entradas son los eigenvalores λ1,,λn de A. Como los eigenvalores son no negativos, podemos considerar la matriz diagonal E cuyas entradas son los reales λ1,,λn. Notemos que E2=D, así que si definimos a la matriz B=P1EP, tenemos que B2=P1E2P=P1DP=A.

Además, B es simétrica pues como E es diagonal y P es ortogonal, tenemos que
tB=tPtEt(P1)=P1EP=B.

(3) implica (4). Es inmediato, tomando C=B y usando que B es simétrica.

(4) implica (1). Si A=tCC y tomamos un vector v en Rn, tenemos que

tvAv=tvtCCv=t(Cv)(Cv)=Cv20,

lo cual muestra que A es positiva.

◻

También hay una versión de este teorema para matrices simétricas positivas definidas. Enunciarlo y demostrarlo queda como tarea moral.

En una entrada final, se verá otra consecuencia linda del teorema espectral: el teorema de descomposición polar. Dice que cualquier matriz con entradas reales se puede escribir como el producto de una matriz ortogonal y una matriz simétrica positiva.

Más allá del teorema espectral

Durante el curso introdujimos varias de las nociones fundamentales de álgebra lineal. Con ellas logramos llegar a uno de los teoremas más bellos: el teorema espectral. Sin embargo, la teoría de álgebra lineal no termina aquí. Si en tu formación matemática profundizas en el área, verás otros temas y resultados fundamentales como los siguientes:

  • El teorema de Cayley-Hamiltón: toda matriz se anula en su polinomio característico.
  • La clasificación de matrices diagonalizables: una matriz es diagonalizable si y sólo si su polinomio característico se factoriza en el campo de la matriz, y la multiplicidad algebraica de sus eigenvalores corresponde con la multiplicidad geométrica.
  • El teorema de la forma canónica de Jordan: aunque una matriz no se pueda diagonalizar, siempre puede ser llevada a una forma estándar «bonita».
  • Productos interiores con imágenes en C, a los que también se les conoce como formas hermitianas.
  • Los polinomios mínimos de matrices y transformaciones, que comparten varias propiedades con el polinomio característico, pero dan información un poco más detallada.

Más adelante…

En esta entrada discutimos dos demostraciones del teorema espectral. Sólo nos falta discutir cómo podemos aplicarlo. En la siguiente entrada trabajaremos con algunos problemas, por ejemplo, ver cómo se usa para demostrar que una matriz simétrica no es diagonalizable.

Finalmente, discutiremos cómo podemos pensar en las nociones de continuidad y acotamiento en el álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Muestra que la inversa de una matriz ortogonal es ortogonal.
  • Encuentra una base ortonormal de R3 conformada por eigenvectores de la matriz (10070307010).
  • Determina si la matriz anterior es positiva y/o positiva definida.
  • Enuncia y demuestra un teorema de clasificación de matrices simétricas positivas definidas.
  • Muestra que la matriz (51711077718) es positiva.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»