Archivo de la etiqueta: matrices simétricas

Geometría Analítica I: Diagonalización ortogonal de matrices simétricas

Por Paola Lizeth Rojas Salazar

Introducción

Anteriormente, estudiamos los vectores y valores propios de las matrices simétricas, en esta entrada vamos a usar que ya sabemos muchas cosas sobre el comportamiento respecto al producto interior, para hablar sobre la diagonalización ortogonal de matrices simétricas, cuyo procedimiento inicia resolviendo su polinomio característico.

Teoremas importantes

Antes de ver el proceso para la diagonalización ortogonal de matrices simétricas, vamos a enunciar un lema y un teorema que van a justificar la «receta» a seguir para esta diagonalización.

Lema 4.12: Considera una matriz simétrica $A$ . Si $λ_{1}, u$ y $λ_{2}, v$ , son pares propios de $A$ con $λ_{1} \neq λ_{2}$ , entonces $u$ y $v$ son ortogonales.

Demostración

Sabemos que:

$\begin{matrix} (1) & λ_{1} (u \cdot v) = (λ_{1} u) \cdot v = A u \cdot v = u \cdot A v = u \cdot (λ_{2} v) = λ_{2} (u \cdot v) \end{matrix}$

Esto implica que $(λ_{1} - λ_{2}) (u \cdot v) = 0$

Y $λ_{1} \neq λ_{2}$ , entonces $u \cdot v$ =0.

Con lo que hemos terminado la demostración.

Teorema 4.13: Considera una matriz simétrica de $2 \times 2$ , $A$ . Entonces existe una rotación $B \in O (2)$ tal que $B^{T} A B$ es diagonal de la siguiente forma:

$\begin{matrix} (2) & (\begin{matrix} λ_{1} & 0 \\ 0 & λ_{2} \end{matrix}) \end{matrix}$

Con $λ_{1}$ y $λ_{2}$ , los valores propios de $A$ .

Demostración

Por las entradas anteriores, las siguientes implicaciones son ciertas, puedes comprobarlo tú mismo con facilidad.

Como $A$ es simétrica de $2 \times 2$ , entonces $A$ tiene valores propios $λ_{1}, λ_{2} \in R$ .

Caso 1 $λ_{1} = λ_{2}$

Entonces $A$ es diagonal y puede tomarse a $B$ como la matriz identidad que es rotación en $O (2)$ .

Caso 2 $λ_{1} \neq λ_{2}$

Consideramos a $u, v$ , los vectores propios correspondientes a $λ_{1}$ y $λ_{2}$ . Observa que $u$ es diferente al vector cero.

Sabemos que $u$ y $v$ son ortogonales, entonces $v$ es paralelo a $u^{T}$ que también es vector propio correspondiente a $λ_{2}$ .

Considera $B = \frac{1}{| u |} (u, u^{T})$ , donde se puede comprobar fácilmente que $B$ es la matriz de una rotación y que cumple que $B^{T} A B$ es diagonal.

«Receta»

Ingredientes

Una matriz simétrica $A = A^{T}$ de $2 \times 2$

Procedimiento

Resolver su polinomio característico con $d e t (A - λ I)$ .
Encontrar $u \neq 0$ tal que $(A - λ_{1} I) u = 0$ .
Declarar $B = \frac{1}{| u |} (u, u^{T})$ .
La matriz diagonal, con entradas $λ_{1}$ y $λ_{2}$ , estará dada por $B^{T} A B$ .

Tarea moral

Termina de escribir la demostración del Teorema 4.13.
Demuestra que, si una matriz $A$ cualquiera, tiene dos valores propios distintos, entonces existe una matriz $B \in G l (2)$ tal que $B^{- 1} A B$ es diagonal.
Encuentra la matriz $B$ de una rotación que diagonalice las siguientes matrices simétricas: Además, calcula $B^{T} A B$ :
- $\begin{matrix} (3) & A = (\begin{matrix} 1 & 1 \\ 1 & 1 \end{matrix}) \end{matrix}$
- $\begin{matrix} (4) & A = (\begin{matrix} - 6 & 12 \\ 12 & 1 \end{matrix}) \end{matrix}$
- $\begin{matrix} (5) & A = (\begin{matrix} - 7 & - 6 \\ - 6 & 2 \end{matrix}) \end{matrix}$

Más adelante…

Avanza a las siguientes entradas, en las que usaremos estos conocimientos para dar dos nuevas formas de clasificación de las curvas.

Álgebra Lineal II: Matrices de formas bilineales

Por Diego Ligani Rodríguez Trejo

1 respuesta

Introducción

Al principio de esta unidad, especialmente en la entrada del teorema de Gauss empezamos a hablar de una relación entre formas bilineales y matrices. Aquí formalizaremos esta relación. Veremos cómo se define la matriz asociada a una forma bilineal y cómo podemos traducir operaciones con la forma bilineal en operaciones con su matriz asociada.

Matriz asociada a una forma bilineal y una forma cuadrática

En toda esta entrada, $V$ es un espacio vectorial sobre $R$ de dimensión finita.

Definición. Sea $e_{1}, \dots, e_{n}$ una base de $V$ y $b : V \times V \to R$ una forma bilineal de $V$ . La matriz de $b$ con respecto a la base $e_{1}, \dots, e_{n}$ es la matriz

$\begin{array}{r} A = [a_{i j}] con a_{i j} = b (e_{i}, e_{j}), \end{array}$

para todo $i, j$ tal que $1 \leq i, j \leq n$ .

Para definir la forma matricial de una forma cuadrática tenemos que ser un poco más cuidadosos. Hay más de una forma bilineal que puede generar a una misma forma cuadrática. Sin embargo, por la identidad de polarización tenemos que esta forma bilineal es única si pedimos adicionalmente que sea simétrica. De aquí obtenemos la siguiente definición.

Definición. Sea $e_{1}, \dots, e_{n}$ una base de $V$ y $q$ una forma cuadrática de $V$ , la matriz de $q$ con respecto a la base $e_{1}, \dots, e_{n}$ es la matriz de su forma polar en esa misma base.

Problema. Sea $V = R^{3}$ y $q$ dada como sigue
$\begin{array}{r} q (x) = x_{1} x_{2} + x_{2} x_{3} + x_{3} x_{1}, \end{array}$

para cada $x = (x_{1}, x_{2}, x_{3}) \in R^{3}$ .

Encuentra su matriz asociada $A$ en la base canónica y su matriz asociada $B$ en la base $\begin{aligned} u_{1} & = (1, 1, 0), \\ u_{2} & = (1, 0, 1), \\ u_{3} & = (0, 1, 1) . \end{aligned}$

Solución. Primero, mediante la identidad de polarización tenemos que la forma polar $b$ de $q$ cumple que $b (x, x^{'})$ es

$\begin{array}{r} \frac{x_{1}^{'} x_{2} + x_{2}^{'} x_{1} + x_{1}^{'} x_{3} + x_{3}^{'} x_{1} + x_{2}^{'} x_{3} + x_{3}^{'} x_{2}}{2}, \end{array}$

para $x = (x_{1}, x_{2}, x_{3})$ y $x^{'} = (x_{1}^{'}, x_{2}^{'}, x_{3}^{'})$ .

Ahora, calculemos qué le hace esta forma bilineal a la base canónica de par en par.

$\begin{aligned} b (e_{1}, e_{1}) = b (e_{2}, e_{2}) = b (e_{3}, e_{3}) = 0 \\ y & b (e_{1}, e_{2}) = b (e_{1}, e_{3}) = b (e_{2}, e_{3}) = \frac{1}{2} . \end{aligned}$

Por lo que su matriz asociada en la base canónica es

$\begin{array}{r} A = (\begin{array}{c} 0 & \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & 0 & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} & 0 \end{array}) \end{array}$

Por otro lado, calculando lo que $b$ le hace a nuestra otra base

$\begin{aligned} b (u_{1}, u_{1}) = b (u_{2}, u_{2}) = b (u_{3}, u_{3}) = 1 \\ y & b (u_{1}, u_{2}) = b (u_{1}, u_{3}) = b (u_{2}, u_{3}) = \frac{3}{2} \end{aligned}$

Y construyendo esta otra matriz:

$\begin{array}{r} B = (\begin{array}{c} 1 & \frac{3}{2} & \frac{3}{2} \\ \frac{3}{2} & 1 & \frac{3}{2} \\ \frac{3}{2} & \frac{3}{2} & 1 \end{array}) \end{array}$

$△$

Evaluar la forma bilineal con su matriz

En la entrada del teorema de Gauss vimos que si $b$ es una forma bilineal de $V$ y $e_{1}, \dots, e_{n}$ es una base, entonces para cualesquiera vectores

$\begin{aligned} x & = x_{1} e_{1} + \dots + x_{n} e_{n} \\ y & = y_{1} e_{1} + \dots + y_{n} e_{n} \end{aligned}$

tenemos que $b (x, y) = \sum_{i = 1}^{n} \sum_{j = 1}^{n} x_{i} y_{j} b (e_{i}, e_{j}) .$

Por la regla del producto de matrices, la expresión de la derecha es precisamente lo que se obtiene al realizar la siguiente operación:

$^{t} X (\begin{matrix} b (e_{1}, e_{1}) & b (e_{1}, e_{2}) & \dots & b (e_{1}, e_{n}) \\ b (e_{2}, e_{1}) & b (e_{2}, e_{2}) & \dots & b (e_{2}, e_{n}) \\ ⋮ & ⋱ & ⋮ \\ b (e_{n}, e_{1}) & b (e_{n}, e_{2}) & \dots & b (e_{n}, e_{n}) \end{matrix}) Y,$

donde $X = (x_{1}, \dots, x_{n})$ y $Y = (y_{1}, \dots, y_{n})$ .

Notemos que en medio tenemos justo la forma matricial de $b$ en la base $e_{1}, \dots, e_{n}$ . Al lado izquierdo tenemos al transpuesto del vector de coordenadas de $x$ en la base $e_{1}, \dots, e_{n}$ y al lado derecho tenemos al vector de coordenadas de $y$ en esta misma base. Hemos demostrado lo siguiente.

Proposición. Sea $b$ una forma bilineal de $V$ y $β$ una base de $V$ . Sea $A$ la matriz de $b$ en la base $β$ . Sean $X$ y $Y$ los vectores de coordenadas de vectores $x$ y $y$ de $V$ en la base $β$ , respectivamente. Entonces $b (x, y) =^{t} X A Y .$

Algunas consecuencias de la proposición anterior son:

Una forma bilineal es simétrica si y sólo si su matriz en una base cualquiera es simétrica.
Si fijamos la base $β$ y la forma bilineal $b$ , entonces la matriz que hace que $b (x, y) =^{t} X A Y$ para todos $x, y$ es única.

La discusión anterior nos permite comenzar con una forma bilineal $b$ y una base $β$ y obtener una (y sólo una) matriz. Partiendo de una matriz y una base $β$ también podemos obtener una forma bilineal mediante la regla $b (x, y) =^{t} X A Y .$

Cambios de base

En los resultados anteriores al fijar un espacio vectorial $V$ de dimensión $n$ y una base $β$ obtenemos una asociación biyectiva (de hecho un isomorfismo) entre formas bilineales de $V$ y matrices en $M_{n} (R)$ .

Sin embargo, al cambiar la base de $V$ , la matriz que representa a una forma bilineal puede cambiar.

Proposición. Supongamos que una forma bilineal $b$ tiene asociada una matriz $A$ con respecto a una base $β$ y una matriz $A^{'}$ con respecto a otra base $β^{'}$ . Sea $P$ la matriz de cambio de base de $β$ a $β^{'}$ . Entonces
$\begin{array}{r} A^{'} =^{t} P A P . \end{array}$

Demostración. Sean $x, y \in V$ dos vectores cualesquiera. Escribamos $β = {u_{1}, \dots, u_{n}}$ y $β^{'} = {u_{1}^{'}, \dots, u_{n}^{'}}$ . Usando $β$ escribamos

$\begin{array}{r} x = x_{1} u_{1} + \dots + x_{n} u_{n} . \end{array}$

Definamos a $X$ como el vector columna de las coordenadas de $x$ en la base $β$ , es decir:

$X = (\begin{matrix} x_{1} \\ ⋮ \\ x_{n} \end{matrix}) .$

Definimos análogamente a $X^{'}, Y, Y^{'}$ como los vectores columnas de coordenadas de $x$ en la base $β^{'}$ , de $y$ en la base $β$ y de $y$ en la base $β^{'}$ , respectivamente.

Sabemos entonces que

$\begin{array}{r} b (x, y) =^{t} X A Y =^{t} X^{'} A^{'} Y^{'} \end{array}$

Además, sabemos que

$\begin{aligned} X & = P X^{'} \\ Y & = P Y^{'} \end{aligned}$

De aquí se tiene la siguiente cadena de igualdades:

$\begin{aligned} ^{t} X^{'} A^{'} Y^{'} & = b (x, y) \\ =^{t} X A Y \\ =^{t} (P X^{'}) A (P Y^{'}) \\ =^{t} X^{'}^{t} P A P Y^{'} . \end{aligned}$

Fijándonos en los extremos

$\begin{array}{r} ^{t} X^{'} A^{'} Y^{'} =^{t} X^{'}^{t} P A P Y^{'} . \end{array}$

Por la unicidad de la matriz que representa a $b$ en la base $β^{'}$ , finalmente concluimos que

$\begin{array}{r} A^{'} =^{t} P A P . \end{array}$

Más adelante…

Esta es una pequeña introducción a la relación entre las formas bilineales (y cuadráticas por extensión) y las matrices. Podemos ver que ésta nos dio otra manera de entender y calcular a las formas bilineales. Algo que no hemos explorado es el poder que esta relación nos entrega al aplicar todo lo que conocemos acerca de matrices a las matrices asociadas a una forma bilineal. Antes de llegar a eso, primero veremos el análogo complejo de lo que acabamos de estudiar.

Otro problema que enfrentamos es la dependencia de las matrices a su base. Aunque este no es un problema que podamos evitar, nos gustaría encontrar propiedades que se mantengan sin importar la base que sea elegida. Esto lo abordaremos un poco más adelante. De hecho, cuando lo hagamos estaremos listos para enunciar y demostrar un resultado muy interesante: la ley de inercia de Sylvester.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

Sea $V = R^{3}$ y definamos $q : V \to R$
$\begin{array}{r} q (x, y, z) = (x + 2 y + 3 z)^{2} + (y + z)^{2} . \end{array}$
Prueba que $q$ es cuadrática y encuentra su forma polar. ¿Es esta forma cuadrática $q$ positiva definida? ¿Es positiva?
Encuentra la matriz $A$ asociada a la forma cuadrática $q$ del ejercicio anterior con respecto a la base canónica y la matriz $B$ asociada a $q$ con respecto a la base $(1, 1, 1), (0, - 1, - 1), (0, 0, 2)$ .
Encuentra las matrices de cambio de base entre la base canónica y la base del inciso anterior. Verifica que se cumple el resultado de cambios de base.
Encuentra una expresión de Gauss para $q$ .
Encuentra el rango de $A$ y de $B$ . Encuentra el determinante de $A$ y de $B$ ¿Notas algo en particular?

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Formas cuadráticas hermitianas
Siguiente entrada del curso: Matrices de formas sesquilineales

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal I: Transposición de matrices, matrices simétricas y antisimétricas

Por Julio Sampietro

7 respuestas

Introducción

En esta sección introducimos el concepto de transpuesta de una matriz, que consiste en solo ‘voltear’ una matriz. De ahí sale la operación de transposición de matrices. Si bien esta operación es sencilla, las aplicaciones son vastas, especialmente cuando veamos el concepto de espacio dual. Veremos propiedades básicas de esta operación y cómo se relaciona con suma, producto e inversa de matrices.

Luego definimos tres tipos de matrices importantes, las simétricas, antisimétricas y ortogonales. Estos tipos de matrices nos permiten entender un poco mejor los espacios de matrices, que son más grandes, y nos dan mucha información geométrica sobre nuestro espacio de trabajo. Profundizaremos en esto en la tercera unidad.

Transposición de matrices

Sea $A \in M_{m, n} (F)$ una matriz. Intuitivamente, la transpuesta de $A$ se obtiene al trazar una línea de «pendiente» $- 1$ desde la entrada $(1, 1)$ a lo largo de la diagonal y reflejar la matriz con respecto a esta línea. Daremos unos ejemplos para entender esto más adelante. Primero damos una definición formal.

Definición. La transpuesta de $A \in M_{m, n} (F)$ , denotada por $^{t} A$ se obtiene intercambiando los renglones y las columnas de $A$ . Consecuentemente $^{t} A$ es una matriz de tamaño $n \times m$ , es decir $^{t} A \in M_{n, m} (F)$ . Dicho de otra manera, si $A = [a_{i j}]$ , entonces $^{t} A = [a_{j i}]$ .

Observación. En otras fuentes es posible que encuentres una notación un poco diferente para matriz transpuesta. Algunas veces se pone el superíndice $t$ arriba a la derecha, así: $A^{t}$ . Otras veces se usa una $T$ mayúscula así: $A^{T}$ . Nosotros usaremos el superíndice a la izquierda.

Ejemplo 1. La transpuesta de

$\begin{array}{r} A = (\begin{array}{c} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{array}) \end{array}$

$\begin{array}{r} ^{t} A = (\begin{array}{c} 1 & 4 & 7 \\ 2 & 5 & 8 \\ 3 & 6 & 9 \end{array}) . \end{array}$

En general, la transpuesta de una matriz cuadrada en $M_{n} (F)$ también es cuadrada y está en $M_{n} (F)$ .

$△$

Es claro también que $^{t} I_{n} = I_{n}$ .

Ejemplo 2. La transpuesta de

$\begin{array}{r} A = (\begin{array}{c} 0 & 1 & 0 & 3 \\ 4 & 7 & 2 & 0 \end{array}) \end{array}$

$\begin{array}{r} ^{t} A = (\begin{array}{c} 0 & 4 \\ 1 & 7 \\ 0 & 2 \\ 3 & 0 \end{array}) . \end{array}$

$△$

Propiedades de transposición de matrices

Hasta ahora hemos hablado de sumas de matrices, multiplicación por escalar y multiplicación de matrices. Una forma frecuente de trabajar con álgebra es preguntarse cómo una nueva definición interactúa con lo que ya hemos definido anteriormente.

Resumimos las propiedades de la transposición de matrices $A \mapsto^{t} A$ y cómo se relaciona con operaciones anteriores en el siguiente resultado.

Proposición. La operación de transponer satisface:

$^{t} (^{t} A) = A$ para toda $A \in M_{m, n} (F)$ .
$^{t} (A + B) =^{t} A +^{t} B$ para todas $A, B \in M_{m, n} (F)$ .
$^{t} (c A) = c^{t} A$ si $c \in F$ es un escalar y $A \in M_{m, n} (F)$ .
$^{t} (A B) =^{t} B^{t} A$ si $A \in M_{m, n} (F)$ y $B \in M_{n, p} (F)$ .
$^{t} (A^{k}) = {(^{t} A)}^{k}$ si $A \in M_{n} (F)$ y $k$ es un entero positivo.
Si $A \in M_{n} (F)$ es invertible, entonces $^{t} A$ también es invertible y
$\begin{array}{r} {(^{t} A)}^{- 1} =^{t} (A^{- 1}) . \end{array}$

Demostración: Las primeras tres propiedades son consecuencia casi inmediata de la definición y las dejamos como tarea moral. Una sugerencia es demostrarlas usando la notación de entradas.

Comencemos pues demostrando la cuarta propiedad. Primero, observamos que $^{t} B \in M_{p, n} (F)$ y $^{t} A \in M_{n, m} (F)$ por lo que el producto $^{t} B^{t} A$ tiene sentido. Luego si $A = [a_{i j}]$ y $B = [b_{j k}]$ tenemos por la regla del producto que

$\begin{aligned} ^{t} (A B)_{k i} & = (A B)_{i k} \\ = \sum_{j = 1}^{n} a_{i j} b_{j k} \\ = \sum_{j = 1}^{n} {(^{t} B)}_{k j} {(^{t} A)}_{j i} \\ = {(^{t} B^{t} A)}_{k i} . \end{aligned}$

Así $^{t} (A B) =^{t} B^{t} A$ .

La quinta propiedad la demostramos por inducción sobre $k$ . El caso base $k = 1$ es claro. Asumamos entonces que se cumple para algún $k$ , y verifiquemos que la propiedad sigue siendo cierta para $k + 1$ .

$\begin{aligned} ^{t} (A^{k + 1}) & =^{t} (A^{k} \cdot A) \\ =^{t} A^{t} (A^{k}) \\ =^{t} A \cdot {(^{t} A)}^{k} \\ = {(^{t} A)}^{k + 1} . \end{aligned}$

Donde la segunda igualdad se debe a la cuarta propiedad y la tercera a la hipótesis de inducción. Por inducción, queda probado el resultado.

Finalmente la sexta propiedad se sigue de la cuarta, dado que

$\begin{array}{r} ^{t} A \cdot^{t} (A^{- 1}) =^{t} (A^{- 1} \cdot A) =^{t} I_{n} = I_{n} . \end{array}$

La igualdad simétrica se verifica de la misma manera, y queda demostrada la última propiedad.

Observación. La transposición de matrices «voltea» el producto de matrices. Es decir, si en el producto $A B$ aparece $A$ a la izquierda y $B$ a la derecha, al transponer obtenemos $^{t} B^{t} A$ , con $^{t} B$ a la izquierda y $^{t} A$ a la derecha.

Observación. Por la proposición anterior, la transposición de matrices preserva la invertibilidad de las matrices y así lo podemos ver como un mapeo $^{t} : G L_{n} (F) \to G L_{n} (F)$ .

Problema. Sea $X \in F^{n}$ un vector con coordenadas $x_{1}, \dots, x_{n}$ considerado como una matriz en $M_{n, 1} (F)$ . Demuestre que para cualquier matriz $A \in M_{n} (F)$ se tiene

$\begin{array}{r} ^{t} X (^{t} A \cdot A) X = \sum_{i = 1}^{n} {(a_{i 1} x_{1} + a_{i 2} x_{2} + \dots + a_{i n} x_{n})}^{2} . \end{array}$

Solución: Primero, usamos la proposición para transformar el lado izquierdo de la igualdad buscada:

$\begin{array}{r} ^{t} X (^{t} A \cdot A) X =^{t} X^{t} A A X =^{t} (A X) \cdot A X . \end{array}$

Luego nombrando $Y = A X$ tenemos que

$\begin{array}{r} Y = A X = (\begin{array}{c} a_{11} x_{1} + \dots + a_{1 n} x_{n} \\ a_{21} x_{1} + \dots + a_{2 n} x_{n} \\ ⋮ \\ a_{n 1} x_{1} + \dots + a_{n n} x_{n} \end{array}) = (\begin{array}{c} y_{1} \\ y_{2} \\ ⋮ \\ y_{n} \end{array}) . \end{array}$

Así

$\begin{array}{r} ^{t} Y \cdot Y = (\begin{array}{c} y_{1} & y_{2} & \dots & y_{n} \end{array}) \cdot (\begin{array}{c} y_{1} \\ y_{2} \\ ⋮ \\ y_{n} \end{array}) \end{array}$

y usando la regla del producto para matrices concluimos que esta última cantidad no es más que $y_{1}^{2} + \dots + y_{n}^{2}$ . Finalmente, sustituyendo $y_{i}$ por su correspondiente $a_{i 1} x_{1} + \dots + a_{i n} x_{n}$ obtenemos la igualdad buscada.

Matrices simétricas, antisimétricas y ortogonales

En el álgebra lineal hay tres tipos de matrices muy importantes y relacionadas con la transposición de matrices. Todas ellas son matrices cuadradas.

Las matrices simétricas. Son aquellas matrices $A \in M_{n} (F)$ tales que $^{t} A = A$ , equivalentemente $a_{i j} = a_{j i}$ para cualesquiera $1 \leq i, j \leq n$ . Más adelante veremos que son de fundamental importancia para la teoría de formas cuadráticas y espacios euclideanos (donde $F = R$ ), y un cacho importante de nuestro curso se dedicará a estudiar sus propiedades. Por ejemplo todas las matrices simétricas de tamaños $2$ y $3$ son de la forma
$\begin{array}{r} (\begin{array}{c} a & b \\ b & c \end{array}), a, b, c \in F y (\begin{array}{c} a & b & c \\ b & d & e \\ c & e & f \end{array}), a, b, c, d, e, f \in F . \end{array}$
Las matrices ortogonales. Estas son las matrices invertibles $A \in G L_{n} (F)$ que satisfacen $A^{- 1} =^{t} A$ . Estas (como su nombre lo indica) tienen una interpretación geométrica muy importante, pues corresponden a isometrías de espacios euclideanos. También las estudiaremos a detalle más adelante.
Las matrices antisimétricas. Son matrices $A \in M_{n} (F)$ que cumplen con $A^{t} = - A$ . Estas tienen que ver con formas alternantes, y cumplen $a_{i j} = - a_{j i}$ . Si $F \in {Q, R, C}$ , esta última condición nos implica que $a_{i i} = - a_{i i}$ , de dónde $a_{i i} = 0$ . Entonces, si $F$ es alguno de estos las entradas en la diagonal son todas cero. Todas las matrices antisimétricas de tamaños $2$ y $3$ sobre el campo $C$ se ven:
$\begin{array}{r} (\begin{array}{c} 0 & a \\ - a & 0 \end{array}), a \in C y (\begin{array}{c} 0 & a & b \\ - a & 0 & c \\ - b & - c & 0 \end{array}), a, b, c \in C . \end{array}$
Sin embargo, si $F$ es por ejemplo $F_{2}$ , entonces la condición $2 a_{i i} = 0$ no nos aporta ninguna información nueva, ya que para todo elemento $x$ en $F_{2}$ , $2 x = 0$ . De hecho, sobre campos de este estilo ¡no hay diferencia entre matrices simétricas y antisimétricas!

A continuación resumimos algunas propiedades iniciales de matrices simétricas y antisimétricas. La idea de las demostraciones es usar las propiedades de transposición de matrices.

Proposición. Todas las matrices en los enunciados siguientes son matrices cuadradas del mismo tamaño. Son ciertas:

La suma de una matriz y su transpuesta es simétrica, la diferencia de una matriz y su transpuesta es antisimétrica.
El producto de una matriz y su transpuesta es simétrica.
Cualquier potencia de una matriz simétrica es simétrica.
Cualquier potencia par de una matriz antisimétrica es simétrica, y cualquier potencia impar de una matriz antisimétrica es antisimétrica.
Si $A$ es invertible y simétrica entonces $A^{- 1}$ es simétrica.
Si $A$ es invertible y antisimétrica, entonces $A^{- 1}$ es antisimétrica.

Demostración:

Si $A$ es una matriz, entonces $^{t} (A +^{t} A) =^{t} A +^{t} (^{t} A) =^{t} A + A = A +^{t} A .$ Es decir, $A +^{t} A$ es igual a su transpuesta y por tanto es simétrica. El cálculo para verificar la antisimetría de $A -^{t} A$ es similar.
Queremos ver que $A^{t} A$ es simétrica. Lo podemos hacer directamente $^{t} (A^{t} A) =^{t} {(^{t} A)}^{t} A = A^{t} A,$ lo que verifica la simetría de la matriz.
Se sigue de la proposición anterior, pues si $A$ es simétrica
$\begin{array}{r} ^{t} (A^{n}) = {(^{t} A)}^{n} = A^{n} . \end{array}$
Hacemos el caso en el que la potencia es par y dejamos el otro como tarea moral, el razonamiento es análogo. Si $A$ es antisimétrica y $n = 2 k$ para algún $k$ entonces
$\begin{array}{r} ^{t} (A^{n}) = {(^{t} A)}^{n} = (- A)^{n} = (- 1)^{2 k} A^{n} = A^{n} . \end{array}$ Aquí usamos que $(- 1)^{2 k} = 1$ .
Si $A$ es simétrica, usando la proposición anterior tenemos que
$\begin{array}{r} ^{t} (A^{- 1}) = {(^{t} A)}^{- 1} = A^{- 1} . \end{array}$
Es análogo al inciso anterior.

Algunos problemas

Acabamos la entrada con algunos problemas que servirán de práctica.

Problema 1. Describe las matrices simétricas $A \in M_{n} (F)$ que sean simultáneamente simétricas y triangulares superiores.

Solución: Sea $A = [a_{i j}]$ simétrica y triangular superior. Por definición $a_{i j} = 0$ si $i > j$ por ser triangular superior, y $a_{i j} = a_{j i}$ por ser simétrica para cualesquiera $i, j \in {1, \dots, n}$ . Así, si $i \neq j$ entonces $a_{i j} = 0$ , pues si $i < j$ , entonces $0 = a_{j i} = a_{i j}$ . Se sigue que $A$ tiene que ser diagonal. Conversamente, es fácil verificar que cualquier matriz diagonal es simétrica y triangular superior. Es decir, la respuesta es precisamente las matrices diagonales.

$△$

Problema 2. ¿Cuántas matrices simétricas hay en $M_{n} (F_{2})$ ?

Solución: Observamos que una matriz simétrica está determinada por las entradas que están sobre o por encima de la diagonal, pues sabemos que para llenar los otros espacios hay que reflejar estas entradas (de otra manera, se puede pensar como colorear solo un lado del papel y luego doblarlo). Conversamente, cada elección de suficientes números para llenar la diagonal y el área encima de ella determina una matriz simétrica.

Así, contemos cuántas entradas hay sobre o por encima de la diagonal: El primer renglón está enteramente por encima de la diagonal, lo que nos da $n$ entradas, luego el segundo renglón está, con excepción de una entrada, contenido en esta área superior, es decir tenemos $n - 1$ entradas más. Al tercer renglón le quitamos dos entradas, al cuarto tres entradas y así sucesivamente hasta llegar al último renglón, donde la única entrada sobre o por encima de la diagonal es la última, es decir, una entrada que podemos escoger.

Sumando, tenemos

$\begin{array}{r} n + (n - 1) + (n - 2) + \dots + 2 + 1 = \frac{n (n + 1)}{2} \end{array}$

entradas que rellenar, y por tanto $\frac{n (n + 1)}{2}$ elecciones de números que hacer. Ahora, ¿cuántos números podemos escoger? Al estar trabajando en $F_{2}$ , solo dos: $0$ ó $1$ . Por un argumento combinatorio, concluimos que hay

$\begin{array}{r} 2^{\frac{n (n + 1)}{2}} \end{array}$

matrices simétricas en $M_{n} (F_{2})$ .

$△$

Problema 3. Demuestra que toda matriz $A \in M_{n} (C)$ se puede escribir de manera única como $A = B + C$ , con $B$ simétrica y $C$ antisimétrica.

Solución: Suponiendo que $A = B + C$ con $B$ simétrica y $C$ antisimétrica, obtenemos que

$\begin{array}{r} ^{t} A =^{t} (B + C) =^{t} B +^{t} C = B - C \end{array}$

Así, resolviendo el sistema

$\begin{array}{r} {\begin{cases} A = B + C \\ ^{t} A = B - C \end{cases} \end{array}$

obtenemos que

$\begin{array}{r} B = \frac{1}{2} (A +^{t} A) y C = \frac{1}{2} (A -^{t} A) . \end{array}$

Así la elección de $B$ y $C$ es única, pues están totalmente determinadas. Además, definiendo $B$ y $C$ como en las igualdades de arriba podemos ver que cumplen las condiciones buscadas (probando así existencia).

Más adelante…

La transposición de matrices es una operación importante, que más adelante veremos que está relacionada con la dualidad. Las matrices simétricas y antisimétricas son también muy importantes en álgebra lineal. De hecho, el teorema principal del curso (el teorema espectral) es un resultado acerca de matrices simétricas con entradas reales. Por el momento le pondremos una pausa al estudio de estas matrices, pero más adelante las retomaremos.

En la siguiente clase hablaremos de otra clase de matrices: las de bloque. Estas nos ayudarán a enunciar más cómodamente algunos resultados y procedimientos, como el uso de la reducción gaussiana para resolver sistemas de ecuaciones.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Escribe, de manera explícita, todas las matrices simétricas, antisimétricas y ortogonales de $M_{2} (F_{2})$ .
La siguiente matriz es una matriz antisimétrica en $M_{4} (R)$ , pero algunas de sus entradas se borraron. ¿Cuáles son estas entradas? $(\begin{matrix} 0 & 2 & 3 \\ 0 & - 4 \\ 1 & 4 & \frac{1}{2} \\ - \frac{2}{3} & 0 \end{matrix}) .$
Demuestra las tres primeras propiedades de la proposición de propiedades de transposición de matrices.
¿Será cierto que las matrices de $M_{n} (F)$ que son simultáneamente invertibles y simétricas forman un subgrupo de $G L_{n} (F)$ ? En otras palabras, ¿es cierto que el producto de dos matrices invertibles y simétricas es una matriz invertible y simétrica? ¿Que puedes en este sentido de las matrices ortogonales? ¿De las antisimétricas?
Demuestra que cualquier potencia impar de una matriz antisimétrica es antisimétrica
Demuestra que en $M_{n} (F_{2})$ , una matriz es simétrica si y sólo si es antisimétrica.

Entradas relacionadas

Ir a Álgebra Lineal I
Entrada anterior del curso: Problemas de multiplicación de matrices y matrices invertibles
Siguiente entrada del curso: Matrices de bloques

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Teorema espectral para matrices simétricas reales

Por Leonardo Ignacio Martínez Sandoval

3 respuestas

Introducción

En esta entrada demostramos el teorema espectral para matrices simétricas reales en sus dos formas. Como recordatorio, lo que probaremos es lo siguiente.

Teorema. Sea $V$ un espacio euclideano y $T : V \to V$ una transformación simétrica. Entonces, existe una base ortonormal de $V$ que consiste de eigenvectores de $T$ .

Teorema. Sea $A$ una matriz simétrica en $R^{n}$ . Entonces, existe una matriz ortogonal $P$ y una matriz diagonal $D$ , ambas en $R^{n}$ , tales que $A = P^{- 1} D P .$

Para ello, usaremos los tres resultados auxiliares que demostramos en la entrada de eigenvalores de matrices simétricas reales. Los enunciados precisos están en ese enlace. Los resumimos aquí de manera un poco informal.

Los eigenvalores complejos de matrices simétricas reales son números reales.
Si una transformación $T$ es simétrica y $W$ es un subespacio estable bajo $T$ , entonces $W^{⊥}$ también lo es. Además, $T$ restringida a $W$ o a $W^{⊥}$ también es simétrica.
Es lo mismo que una matriz sea diagonalizable, a que exista una base formada eigenvectores de la matriz.

Además de demostrar el teorema espectral, al final de la entrada probaremos una de sus consecuencias más importantes. Veremos una clasificación de las matrices que inducen formas bilineales positivas.

Demostración de la primera versión del teorema espectral

Comenzamos mostrando la siguiente versión del teorema espectral.

Teorema. Sea $V$ un espacio euclideano y $T : V \to V$ una transformación simétrica. Entonces, existe una base ortonormal de $V$ que consiste de eigenvectores de $T$ .

Demostración. Como $V$ es espacio Euclideano, entonces tiene cierta dimensión finita $n$ . Haremos inducción fuerte sobre $n$ . Si $n = 1$ , el polinomio característico de $T$ es de grado $1$ y con coeficientes reales, así que tiene una raíz $λ$ real. Si $v$ es un eigenvector de $T$ para $λ$ , entonces $\frac{v}{‖ v ‖}$ también es eigenvector de $T$ y conforma una base ortonormal para $V$ .

Supongamos que el resultado es cierto para todo espacio Euclideano de dimensión menor a $n$ y tomemos $V$ espacio Euclideano de dimensión $n$ . Por el teorema fundamental del álgebra, el polinomio característico de $T$ tiene por lo menos una raíz $λ$ en $C$ . Como $T$ es simétrica, cualquier matriz $A$ que represente a $T$ también, y $λ$ sería una raíz del polinomio característico de $A$ . Por el resultado que vimos en la entrada anterior, $λ$ es real.

Consideremos el kernel $W$ de la transformación $λ id - T$ . Si $W$ es de dimensión $n$ , entonces $W = V$ , y por lo tanto $T (v) = λ v$ para todo vector $v$ en $V$ , es decir, todo vector no cero de $V$ es eigenvector de $T$ . De esta forma, cualquier base ortonormal de $V$ satisface la conclusión. De esta forma, podemos suponer que $W \neq V$ y que por lo tanto $1 \leq \dim W \leq n - 1$ , y como $V = W \oplus W^{⊥},$ se obtiene que $1 \leq \dim W^{⊥} \leq n - 1$ . Sea $B$ una base ortonormal de $W$ , que por lo tanto está formada por eigenvectores de $T$ con eigenvalor $λ$ .

Como la restricción $T_{1}$ de $T$ a $W^{⊥}$ es una transformación simétrica, podemos aplicar la hipótesis inductiva y encontrar una base ortonormal $B^{'}$ de eigenvectores de $T_{1}$ (y por lo tanto de $T$ ) para $W^{⊥}$ .

Usando de nuevo que $V = W \oplus W^{⊥},$ tenemos que $B \cup B^{'}$ es una base de $V$ formada por eigenvectores de $T$ .

El producto interior de dos elementos distintos de $B$ , o de dos elementos distintos de $B^{'}$ es cero, pues individualmente son bases ortonormales. El producto de un elemento de $B$ y uno de $B^{'}$ es cero pues un elemento está en $W$ y el otro en $W^{⊥}$ . Además, todos los elementos de $B \cup B^{'}$ tiene norma $1$ , pues vienen de bases ortogonales. Esto muestra que $B \cup B^{'}$ es una base ortonormal de $V$ que consiste de eigenvectores de $T$ .

Demostración de la segunda versión del teorema espectral

Veamos ahora la demostración del teorema espectral en su enunciado con matrices.

Teorema. Sea $A$ una matriz simétrica en $M_{n} (R)$ . Entonces, existe una matriz ortogonal $P$ y una matriz diagonal $D$ , ambas en $M_{n} (R)$ , tales que $A = P^{- 1} D P .$

Demostración. Como $A$ es una matriz simétrica, la transformación $T : F^{n} \to F^{n}$ dada por $T (X) = A X$ es simétrica. Aplicando la primer versión del teorema espectral, existe una base ortonormal de $F^{n}$ que consiste de eigenvectores de $T$ . Digamos que estos eigenvectores son $C_{1}, \dots, C_{n}$ . Por definición de $T$ , estos eigenvectores de $T$ son exactamente eigenvectores de $A$ .

Anteriormente demostramos que si construimos a una matriz $B$ usando a $C_{1}, \dots, C_{n}$ como columnas y tomamos la matriz diagonal $D$ cuyas entradas son los eigenvalores correspondientes $λ_{1}, \dots, λ_{n}$ , entonces $A = B D B^{- 1} .$

Afirmamos que la matriz $B$ es ortogonal. En efecto, la fila $j$ de la matriz $^{t} B$ es precisamente $C_{j}$ . De esta forma, la entrada $(i, j)$ del producto $^{t} B B$ es precisamente el producto punto de $C_{i}$ con $C_{j}$ . Como la familia $C_{1}, \dots, C_{n}$ es ortonormal, tenemos que dicho producto punto es uno si $i = j$ y cero en otro caso. De aquí, se concluye que $^{t} B B = I_{n}$ .

Si una matriz es ortogonal, entonces su inversa también. Esto es sencillo de demostrar y queda como tarea moral. Así, definiendo $P = B^{- 1}$ , tenemos la igualdad $A = P^{- 1} D P,$ con $D$ diagonal y $P$ ortogonal, justo como lo afirma el teorema.

Matrices positivas y positivas definidas

Una matriz $A$ simétrica en $M_{n} (R)$ induce una forma bilineal simétrica en $R^{n}$ mediante la asignación $(x, y) \mapsto^{t} x A y,$ con forma cuadrática correspondiente $x \mapsto^{t} x A x .$

Definición. Una matriz $A$ en $M_{n} (R)$ es positiva o positiva definida si su forma bilineal asociada es positiva o positiva definida respectivamente.

Una de las aplicaciones del teorema espectral es que nos permite dar una clasificación de las matrices simétricas positivas.

Teorema. Sea $A$ una matriz simétrica. Entonces todas las siguientes afirmaciones son equivalentes:

$A$ es positiva.
Todos los eigenvalores de $A$ son no negativos.
$A = B^{2}$ para alguna matriz simétrica $B$ en $M_{n} (R)$ .
$A =^{t} C C$ para alguna matriz $C$ en $M_{n} (R)$ .

Demostración. (1) implica (2). Supongamos que $A$ es positiva y tomemos $λ$ un eigenvalor de $A$ . Tomemos $v$ un eigenvector de eigenvalor $λ$ . Tenemos que:
$\begin{aligned} λ {‖ v ‖}^{2} & = λ^{t} v v \\ =^{t} v (λ v) \\ =^{t} v A v \\ \geq 0. \end{aligned}$

Como ${‖ v ‖}^{2} \geq 0$ , debemos tener $λ \geq 0$ .

(2) implica (3). Como $A$ es matriz simétrica, por el teorema espectral tiene una diagonalización $A = P^{- 1} D P$ con $P$ una matriz invertible y $D$ una matriz diagonal cuyas entradas son los eigenvalores $λ_{1}, \dots, λ_{n}$ de $A$ . Como los eigenvalores son no negativos, podemos considerar la matriz diagonal $E$ cuyas entradas son los reales $\sqrt{λ_{1}}, \dots, \sqrt{λ_{n}} .$ Notemos que $E^{2} = D$ , así que si definimos a la matriz $B = P^{- 1} E P$ , tenemos que $B^{2} = P^{- 1} E^{2} P = P^{- 1} D P = A .$

Además, $B$ es simétrica pues como $E$ es diagonal y $P$ es ortogonal, tenemos que
$\begin{aligned} ^{t} B & =^{t} P^{t} E^{t} (P^{- 1}) \\ = P^{- 1} E P \\ = B . \end{aligned}$

(3) implica (4). Es inmediato, tomando $C = B$ y usando que $B$ es simétrica.

(4) implica (1). Si $A =^{t} C C$ y tomamos un vector $v$ en $R^{n}$ , tenemos que

$\begin{aligned} ^{t} v A v & =^{t} v^{t} C C v \\ =^{t} (C v) (C v) \\ = {‖ C v ‖}^{2} \\ \geq 0, \end{aligned}$

lo cual muestra que $A$ es positiva.

También hay una versión de este teorema para matrices simétricas positivas definidas. Enunciarlo y demostrarlo queda como tarea moral.

En una entrada final, se verá otra consecuencia linda del teorema espectral: el teorema de descomposición polar. Dice que cualquier matriz con entradas reales se puede escribir como el producto de una matriz ortogonal y una matriz simétrica positiva.

Más allá del teorema espectral

Durante el curso introdujimos varias de las nociones fundamentales de álgebra lineal. Con ellas logramos llegar a uno de los teoremas más bellos: el teorema espectral. Sin embargo, la teoría de álgebra lineal no termina aquí. Si en tu formación matemática profundizas en el área, verás otros temas y resultados fundamentales como los siguientes:

El teorema de Cayley-Hamiltón: toda matriz se anula en su polinomio característico.
La clasificación de matrices diagonalizables: una matriz es diagonalizable si y sólo si su polinomio característico se factoriza en el campo de la matriz, y la multiplicidad algebraica de sus eigenvalores corresponde con la multiplicidad geométrica.
El teorema de la forma canónica de Jordan: aunque una matriz no se pueda diagonalizar, siempre puede ser llevada a una forma estándar «bonita».
Productos interiores con imágenes en $C$ , a los que también se les conoce como formas hermitianas.
Los polinomios mínimos de matrices y transformaciones, que comparten varias propiedades con el polinomio característico, pero dan información un poco más detallada.

Más adelante…

En esta entrada discutimos dos demostraciones del teorema espectral. Sólo nos falta discutir cómo podemos aplicarlo. En la siguiente entrada trabajaremos con algunos problemas, por ejemplo, ver cómo se usa para demostrar que una matriz simétrica no es diagonalizable.

Finalmente, discutiremos cómo podemos pensar en las nociones de continuidad y acotamiento en el álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Muestra que la inversa de una matriz ortogonal es ortogonal.
Encuentra una base ortonormal de $R^{3}$ conformada por eigenvectores de la matriz $(\begin{matrix} 10 & 0 & - 7 \\ 0 & 3 & 0 \\ - 7 & 0 & 10 \end{matrix}) .$
Determina si la matriz anterior es positiva y/o positiva definida.
Enuncia y demuestra un teorema de clasificación de matrices simétricas positivas definidas.
Muestra que la matriz $(\begin{matrix} 5 & 1 & 7 \\ 1 & 10 & - 7 \\ 7 & - 7 & 18 \end{matrix})$ es positiva.

Entradas relacionadas

Ir a Álgebra Lineal I
Entrada anterior del curso: Matrices simétricas reales y sus eigenvalores
Siguiente entrada del curso: Aplicaciones del teorema espectral, bases ortogonales y más propiedades de transformaciones lineales

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Matrices simétricas reales y sus eigenvalores

Por Leonardo Ignacio Martínez Sandoval

Deja un comentario

Introducción

Hemos llegado a la cima del curso. En estas últimas entradas probaremos uno de los teoremas más bellos en álgebra lineal: el teorema espectral para matrices simétricas reales. También hablaremos de varias de las consecuencias que tiene.

Hay dos formas equivalentes de enunciar el teorema.

Teorema. Sea $V$ un espacio euclideano y $T : V \to V$ una transformación simétrica. Entonces, existe una base ortonormal de $V$ que consiste de eigenvectores de $T$ .

Teorema. Sea $A$ una matriz simétrica en $R^{n}$ . Entonces, existe una matriz ortogonal $P$ y una matriz diagonal $D$ , ambas en $R^{n}$ , tales que $A = P^{- 1} D P .$

Para hablar de la demostración y de las consecuencias del teorema espectral para matrices simétricas reales, necesitaremos usar teoría de todas las unidades del curso. En particular, usaremos las siguientes definiciones:

Una matriz $A$ en $M_{n} (F)$ es simétrica si es igual a su transpuesta.
Una matriz $A$ en $M_{n} (F)$ es ortogonal si es invertible y $A^{- 1} =^{t} A$ .
Si $T : V \to V$ es una transformación lineal de un espacio vectorial $V$ a sí mismo y $W$ es un subespacio de $V$ , entonces decimos que $W$ es estable bajo $T$ si $T (W) \subseteq W$ .
Un producto interior es una forma bilineal simétrica y positiva definida.
Un espacio Euclideano es un espacio vectorial de dimensión finita con un producto interior.
Si $W$ es un subespacio de un espacio Euclideano $V$ , entonces $W^{⊥}$ es el conjunto de todos los vectores que de $V$ que son ortogonales a todos los vectores de $W$ .
Una matriz $A$ en $M_{n} (F)$ es diagonalizable si existen matrices $P$ y $D$ en $M_{n} (F)$ con $P$ invertible, $D$ diagonal y tales que $A = P^{- 1} D P$ .

Y los siguientes resultados principales:

Los eigenvalores de una matriz en $M_{n} (F)$ son las raíces de su polinomio característico que estén en $F$ .
Una matriz «brinca a la otra entrada» de un producto interior transponiéndose. Formalmente, para cualquier matriz $A$ en $M_{n} (R)$ y vectores $u, v$ en $R^{n}$ , se tiene que $⟨^{t} A u, v ⟩ = ⟨ u, A v ⟩ .$
Todo espacio Euclideano tiene una base ortonormal que se puede encontrar mediante el proceso de Gram-Schmidt.

En esta entrada enunciaremos tres resultados auxiliares de interés propio. A partir de estos resultados, la demostración del teorema espectral para matrices simétricas reales y la equivalencia entre ambas versiones será mucho más limpia.

Los eigenvalores de matrices simétricas reales

El polinomio característico de una matriz $A$ en $M_{n} (R)$ tiene coeficientes reales. Por el teorema fundamental del álgebra, debe tener exactamente $n$ raíces en $C$ , contando multiplicidades. Si alguna de estas raíces $r$ no es real, entonces $A$ no puede ser diagonalizable en $M_{n} (R)$ . La razón es que $A$ sería similar a una matriz diagonal $D$ , y los eigenvalores de las matrices diagonales (incluso triangulares) son las entradas de la diagonal principal. Como $A$ y $D$ comparten eigenvalores (por ser similares), entonces $r$ tendría que ser una entrada de $D$ , pero entonces $D$ ya no sería una matriz de entradas reales.

Lo primero que veremos es que las matrices simétricas reales «superan esta dificultad para poder diagonalizarse». Esta va a ser nuestra primer herramienta para demostrar el teorema espectral.

Teorema. Sea $A$ una matriz simétrica en $M_{n} (R)$ y $λ$ una raíz del polinomio característico de $A$ . Entonces, $λ$ es un número real.

Demostración. El polinomio característico de $A$ es un polinomio con coeficientes reales, así que por el teorema fundamental del álgebra se tiene que $λ$ debe ser un número en $C$ . Así, podemos escribirlo de la forma $λ = a + i b$ , con $a$ y $b$ números reales. Lo que mostraremos es que $b = 0$ .

Se tiene que $λ$ es un eigenvalor de $A$ vista como matriz en $M_{n} (C)$ , y por lo tanto le corresponde un eigenvector $U$ en $C^{n}$ , es decir, un $U \neq 0$ tal que $A U = λ U .$ Este vector $U$ lo podemos separar en partes reales e imaginarias con vectores $V$ y $W$ en $R^{n}$ tales que $U = V + i W .$

En estos términos,
$\begin{aligned} A U & = A (V + i W) = A V + i A W y \\ λ U & = (a + i b) (V + i W) \\ = (a V - b W) + i (a W + b V), \end{aligned}$

de modo que igualando partes reales e imaginarias en la expresión $A U = λ U$ tenemos que
$\begin{aligned} A V & = a V - b W y \\ A W & = a W + b V . \end{aligned}$

Como $A$ es simétrica, tenemos que

$\begin{matrix} (6) & ⟨ A V, W ⟩ = ⟨^{t} A V, W ⟩ = ⟨ V, A W ⟩ . \end{matrix}$

Estudiemos las expresiones en los extremos, reemplazando los valores de $A V$ y $A W$ que encontramos arriba y usando la bilinealidad del producto interior. Se tiene que

$\begin{aligned} ⟨ A V, W ⟩ & = ⟨ a V - b W, W ⟩ \\ = a ⟨ V, W ⟩ - b ⟨ W, W ⟩ \\ = a ⟨ V, W ⟩ - b {‖ W ‖}^{2}, \end{aligned}$

y que

$\begin{aligned} ⟨ V, A W ⟩ & = ⟨ V, a W + b V ⟩ \\ = a ⟨ V, W ⟩ + b ⟨ V, V ⟩ \\ = a ⟨ V, W ⟩ + b {‖ V ‖}^{2} . \end{aligned}$

Substituyendo estos valores en la expresión (1), obtenemos la igualdad

$a ⟨ V, W ⟩ - b {‖ W ‖}^{2} = a ⟨ V, W ⟩ + b {‖ V ‖}^{2},$

que se simplifica a $b ({‖ V ‖}^{2} + {‖ W ‖}^{2}) = 0.$

Estamos listos para dar el argumento final. Como $U = V + i W$ es un eigenvector, entonces no es nulo, de modo que no es posible que $V$ y $W$ sean ambos el vector $0$ de $R^{n}$ . Como el producto interior es positivo definido, entonces alguna de las normas $‖ V ‖$ o $‖ W ‖$ no es cero, de modo que ${‖ V ‖}^{2} + {‖ W ‖}^{2} \neq 0.$

Concluimos que $b = 0$ , y por lo tanto que $λ$ es un número real.

La demostración anterior es ejemplo de un truco que se usa mucho en las matemáticas. Aunque un problema o un teorema no hablen de los números complejos en su enunciado, se puede introducir a $C$ para usar sus propiedades y trabajar ahí. Luego, se regresa lo obtenido al contexto real. Aquí en el blog hay otra entrada en donde damos más ejemplos de «brincar a los complejos».

Un resultado auxiliar de transformaciones simétricas

A continuación damos la segunda herramienta que necesitaremos para probar el teorema espectral. Recuerda que si $V$ es un espacio Euclideano y $T : V \to V$ es una transformación lineal, entonces decimos que $T$ es simétrica si para todo par de vectores $u$ y $v$ en $V$ se tiene que $⟨ T (u), v ⟩ = ⟨ u, T (v) ⟩ .$ Enunciamos el resultado en términos de transformaciones, pero también es válido para las matrices simétricas asociadas.

Teorema. Sea $V$ un espacio Eucideano y $T : V \to V$ una transformación lineal simétrica. Sea $W$ un subespacio de $V$ estable bajo $T$ . Entonces:

$W^{⊥}$ también es estable bajo $T$ y
Las restricciones de $T$ a $W$ y a $W^{⊥}$ son transformaciones lineales simétricas en esos espacios.

Demostración. Para el primer punto, lo que tenemos que mostrar es que si $w$ pertenece a $W^{⊥}$ , entonces $T (w)$ también, es decir, que $T (w)$ es ortogonal a todo vector $v$ en $W$ .

Tomemos entonces un vector $v$ en $W$ . Como $W$ es estable bajo $T$ , tenemos que $T (v)$ está en $W$ , de modo que $⟨ w, T (v) ⟩ = 0$ . Como $T$ es simétrica, tenemos entonces que $⟨ T (w), v ⟩ = ⟨ w, T (v) ⟩ = 0.$ Esto es lo que queríamos probar.

Para la segunda parte, si $T_{1}$ es la restricción de $T_{1}$ a $W$ y tomamos vectores $u$ y $v$ en $W$ , tenemos que
$\begin{aligned} ⟨ T_{1} (u), v ⟩ & = ⟨ T (u), v ⟩ \\ = ⟨ u, T (v) ⟩ \\ = ⟨ u, T_{1} (v) ⟩, \end{aligned}$

lo cual muestra que $T_{1}$ es simétrica. La prueba para $W^{⊥}$ es análoga y queda como tarea moral.

Matrices diagonalizables y bases ortonormales de eigenvectores

El tercer y último resultado enuncia una equivalencia entre que una matriz en $M_{n} (F)$ sea diagonalizable, y que exista una base especial para $F^{n}$ . Es lo que usaremos para probar la equivalencia entre ambas formulaciones del teorema espectral para matrices simétricas reales.

Teorema. Sea $A$ una matriz en $M_{n} (F)$ . Las siguientes dos afirmaciones son equivalentes:

$A$ es diagonalizable, es decir, existen matrices $P$ y $D$ en $M_{n} (F)$ , con $P$ invertible y $D$ diagonal tales que $A = P^{- 1} D P .$
Existe una base para $F^{n}$ que consiste de eigenvectores de $A$ .

Demostración. Antes de comenzar la demostración, recordemos que si tenemos una matriz $B$ en $M_{n} (F)$ de vectores columna $C_{1}, \dots, C_{n},$ entonces los vectores columna del producto $A B$ son $A C_{1}, \dots A C_{n} .$ Además, si $D$ es una matriz diagonal en $M_{n} (F)$ con entradas en la diagonal $d_{1}, \dots, d_{n}$ , entonces los vectores columna de $B D$ son $d_{1} C_{1}, \dots, d_{n} C_{n} .$

Comencemos la prueba del teorema. Supongamos que $A$ es diagonalizable y tomemos matrices $P$ y $D$ en $M_{n} (F)$ con $P$ invertible y $D$ diagonal de entradas $d_{1}, \dots, d_{n}$ , tales que $A = P^{- 1} D P$ . Afirmamos que los vectores columna $C_{1}, \dots, C_{n}$ de $P^{- 1}$ forman una base de $F^{n}$ que consiste de eigenvectores de $A$ .

Por un lado, como son los vectores columna de una matriz invertible, entonces son linealmente independientes. En total son $n$ , como la dimensión de $F^{n}$ . Esto prueba que son una base.

De $A = P^{- 1} D P$ obtenemos la igualdad $A P^{- 1} = P^{- 1} D$ . Por las observaciones al inicio de la prueba, tenemos al igualar columnas que para cada $j = 1, \dots, n$ se cumple $A C_{j} = d_{j} C_{j} .$ Como $C_{j}$ forma parte de un conjunto linealmente independiente, no es el vector $0$ . Así, $C_{j}$ es un eigenvector de $A$ con eigenvalor $d_{j}$ . Con esto terminamos una de las implicaciones.

Supongamos ahora que existe una base de $F^{n}$ que consiste de eigenvectores $C_{1}, \dots, C_{n}$ de $A$ . Para cada $j = 1, \dots, n$ , llamemos $λ_{j}$ al eigenvalor correspondiente a $C_{j}$ , y llamemos $D$ a la matriz diagonal con entradas $λ_{1}, \dots, λ_{n}$ .

Como $C_{1}, \dots, C_{n}$ son vectores linealmente independientes, la matriz $B$ cuyas columnas son $C_{1}, \dots, C_{n}$ es invertible. Además, por las observaciones al inicio de la prueba, se tiene que la columna $j$ de la matriz $A B$ es $A C_{j}$ y la columna $j$ de la matriz $B D$ es $λ_{j} C_{j}$ . Entonces, por construcción, estas matrices son iguales columna a columna, y por lo tanto lo son iguales. De esta forma, tenemos que $A B = B D$ , o bien, reescribiendo esta igualdad, que $A = B D B^{- 1} .$ Así, la matriz invertible $P = B^{- 1}$ y la matriz diagonal $D$ diagonalizan a $A$ .

Las matrices simétricas reales serán todavía más especiales que simplemente las matrices diagonalizables. Lo que asegura el teorema espectral es que podremos encontrar no sólo una base de eigenvectores, sino que además podemos garantizar que esta base sea ortonormal. En términos de diagonalización, la matriz $P$ no sólo será invertible, sino que además será ortogonal.

Más adelante…

En esta entrada enunciamos dos formas del teorema espectral y hablamos de algunas consecuencias que tiene. Además, repasamos un poco de la teoría que hemos visto a lo largo del curso y vimos cómo nos ayuda a entender mejor este teorema.

En la siguiente entrada, que es la última del curso, demostraremos las dos formas del teorema espectral que enunciamos en esta entrada y haremos un pequeño comentario sobre qué hay más allá del teorema espectral en el álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Encuentra un ejemplo de una matriz simétrica en $M_{n} (C)$ cuyos eigenvalores no sean reales.
En el contexto del segundo teorema, muestra que la restricción de $T$ a $W^{⊥}$ es simétrica.
Realiza la demostración de que si $A$ y $B$ son matrices en $M_{n} (F)$ y los vectores columna de $B$ son $C_{1}, \dots, C_{n}$ , entonces los vectores columna de $A B$ son $A C_{1}, \dots, A C_{n}$ . También, prueba que si $D$ es diagonal de entradas $d_{1}, \dots, d_{n}$ , entonces las columnas de $B D$ son $d_{1} C_{1}, \dots, d_{n} C_{n}$ .
Encuentra una matriz $A$ con entradas reales similar a la matriz $(\begin{matrix} 1 & 0 & 0 \\ 0 & 5 & 0 \\ 0 & 0 & - 3 \end{matrix}),$ tal que ninguna de sus entradas sea igual a $0$ . Encuentra una base ortogonal de eigenvectores de $A$ para $R^{3}$ .
Diagonaliza la matriz $(\begin{matrix} - 2 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ \frac{19}{7} & \frac{30}{7} & \frac{65}{7} & \frac{24}{7} \\ \frac{6}{7} & - \frac{20}{7} & - \frac{48}{7} & - \frac{23}{7} \end{matrix}) .$

Entradas relacionadas

Ir a Álgebra Lineal I
Entrada anterior del curso: Problemas de eigenvalores, eigenvectores y polinomio característico
Siguiente entrada del curso: Teorema espectral para matrices simétricas reales

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»