Álgebra Lineal II: Teorema de Sylvester

Por Diego Ligani Rodríguez Trejo

Introducción

En entradas anteriores estudiamos las formas bilineales y las cuadráticas. También vimos las matrices que las representan. Introdujimos una noción de congruencia de matrices relacionada con todo esto. Y vimos que la congruencia de matrices preserva una noción de positividad para matrices. Ahora daremos un paso más y veremos que de hecho la congruencia de matrices preserva más que sólo eso.

Para ello, introduciremos la noción de la signatura de una matriz. A grandes rasgos, esta noción nos dice «qué tan positiva» es una matriz simétrica. Para definir esta noción, lo haremos primero para las matrices diagonales. Luego lo definiremos para todas las matrices simétricas a través del teorema que demostramos la entrada anterior. Toda la discusión la haremos en el caso real. El caso complejo tiene sus versiones análogas, que quedarán descritas en los ejercicios.

Signatura de una matriz diagonal

Comenzamos con la siguiente definición.

Definición. Sea A una matriz diagonal en Mn(R). Sea P la cantidad de entradas positivas en la diagonal y N la cantidad de entradas negativas en la diagonal. A (P,N) le llamamos la signatura de A.

En cierto sentido, la signatura generaliza tanto la noción de rango, como la noción de positividad y de positividad definida. Esto queda plasmado en las siguientes observaciones.

Observación. Una matriz diagonal ya está en forma escalonada reducida. Y el rango de una matriz en forma escalonada reducida coincide con la cantidad de renglones no cero. Así, si la signatura de una matriz diagonal es (P,N), entonces su rango es P+N.

Observación. Por lo que vimos en la entrada anterior, una matriz diagonal en Mn(R) es positiva si y sólo si ninguna de sus entradas diagonales es negativa. Esto pasa si y sólo si su signatura es de la forma (k,0) para algún 0kn.

Observación. Por un resultado análogo al de la entrada anterior, una matriz diagonal es Mn(R) es positiva definida si y sólo si todas sus entradas diagonales son positivas. Esto pasa si y sólo si su signatura es (n,0).

La signatura es invariante bajo congruencias

El resultado clave de esta entrada es el siguiente lema.

Lema. Sean A y B matrices diagonales en Mn(R) congruentes entre sí. Entonces la signatura de A y la de B son iguales.

Demostración. Llamemos (P,N) a la signatura de A y (Q,M) a la signatura de B.

Como A y B son congruentes, entonces representan a una misma forma cuadrática q:RnR, pero quizás en diferentes bases. Sea α la base en la cual q tiene matriz A y β la la base en la cual q tiene matriz B. Sea b la forma polar de p.

Como la signatura de A es (P,N), entonces q es positivo (resp. negativo, cero) para P (resp. N, nPN) elementos de la base α. Tenemos algo análogo para B. Así, podemos llamar a las bases

α={a1+,,aP+,a1,,aN,a10,anPN0},β={b1+,,bQ+,b1,,bM,b10,bnQM0},

en donde q aplicado a alguno de estos elementos tiene el signo del superíndice.

Demostraremos que P=Q por contradicción. Supongamos que no. Sin perder generalidad, P>Q. Consideremos V el subespacio de Rn generado por los vectores a1+,,aP+ y W el subespacio de Rn generado por los vectores b1,,bM,b10,bnQM0. Estos espacios tienen dimensión P y nQ respectivamente. Como P>Q, tenemos que P+(nQ)>Q+(nQ)=n. Así, los espacios V y W tienen intersección no trivial, y por lo menos hay un vector v distinto de 0 en VW. ¿Cuánto vale q(v)?

Por un lado, v está en V así que es combinación lineal de elementos ai+: v=i=1Priai+. De este modo:

q(v)=i=1Pri2q(ai+)+2i=1Pj=1Pb(ai+,aj+).

El primer sumando es positivo pues q es positivo en todo ai+. El segundo sumando es cero pues cada término es 0 por ser una entrada (i,j) con ij de la matriz diagonal A. Así, q(v)>0.

Similarmente, v está en W así que es combinación lineal de elementos bi y elementos bi0, de donde se puede mostrar que q(v)0.

Hemos encontrado una contradicción que surgió de suponer PQ, así que P=Q. De manera análoga se demuestra que N=M. Así, la signatura de A y de B debe ser la misma.

◻

Signatura para matrices simétricas

En la entrada anterior vimos que cualquier matriz simétrica en Mn(R) es congruente a alguna matriz diagonal. Es posible que sea congruente a más de una matriz diagonal.

Definición. Sea A una matriz simétrica en Mn(R). Sea D una matriz diagonal congruente a A. Definimos la signatura de A como la signatura de D.

El lema de la sección anterior nos permite asegurarnos de que la siguiente definición está bien hecha. Si A fuera congruente a dos matrices diagonales D y E, entonces D y E serían congruentes entre sí. De este modo, la signatura de A no cambia si la tomamos con respecto a D o con respecto a E.

Pensemos que dos matrices A y B son congruentes entre sí. Sean D y E matrices diagonales congruentes a A y B respectivamente. Por transitividad, D y E son congruentes, así que tienen la misma signatura. Así, A y B tienen la misma signatura.

Una última observación es la siguiente. Si A y B son simétricas y congruentes entre sí, entonces están relacionadas mediante un producto con matrices invertibles. Como el producto por matrices invertibles no afecta el rango, concluimos que A y B tienen el mismo rango. Juntando esto con observaciones anteriores, una matriz simétrica A de signatura (P,N) tiene rango P+N.

Resumimos todo esto en el siguiente resultado.

Proposición. Sean A y B matrices simétricas.

  • Si la signatura de A es (P,N), entonces su rango es P+N.
  • Si A y B son congruentes, entonces tienen la misma signatura. En particular:
    • Tienen el mismo rango.
    • Si una es positiva, la otra también lo es.
    • Si una es positiva definida, la otra también lo es.

El teorema de Sylvester

Enunciemos las versiones análogas a lo anterior en términos de formas cuadráticas. Comencemos con el teorema de Gauss. Tomemos una forma cuadrática q de Rn y escribámosla como q=i=1raili2 con a1,,ar reales y l1,,lr formas lineales linealmente independientes.

Podemos quitar todos los términos con ai=0 sin afectar la igualdad. Además, si ai es positivo podemos factorizarlo en li2 para definir mi=(aili)2, y si ai es negativo podemos factorizar ai en li2 para obtener mi=(aili)2. En otras palabras, de cualquier expresión de Gauss podemos llegar a una de la forma q=i=1rϵimi2,

en donde los ϵi son 1 o 1. Si tenemos P valores de ϵi iguales a 1 y N valores de ϵi iguales a 1 diremos que la signatura de q es (P,N) y que el rango de q es P+N.

¿Por qué esto está bien definido? Porque ya vimos que cada forma de Gauss de q da una base en la cual la matriz que representa a q es diagonal. Las entradas de la diagonal son los coeficientes de la forma de Gauss. Dos matrices que salen así son congruentes, así que por el lema de la sección anterior tienen la misma signatura. Esto garantiza que en ambas expresiones de Gauss de las de arriba hay la misma cantidad de 1s y 1s.

El gran resumen de todo esto es el siguiente teorema.

Teorema (ley de inercia de Sylvester). Sea q una forma cuadrática de Rn. Entonces existen ϵ1,,ϵr iguales a 1 o a 1 y formas lineales l1,,lr linealmente independientes tales que q=i=1rϵili2.

Cualesquiera dos expresiones de este estilo tienen la misma cantidad de coeficientes positivos, y la misma cantidad de coeficientes negativos.

Dato curioso: ¿Por qué ley de inercia?

En esta entrada nos hemos referido al teorema de Sylvester de dos maneras intercambiables: teorema de Sylvester y ley de inercia de Sylvester. La intuición diría que quizás existe alguna relación con la física. Quizás es porque algún uso especial de este teorema lo hace importante para el cálculo de la inercia. Esto no es así.

El nombre, curiosamente, viene de esta frase de Sylvester:

Este número constante de signos positivos que se asocian a una función cuadrática bajo cualquier transformación […] puede ser llamado, convenientemente, su inercia, hasta que una mejor palabra sea encontrada.

J. J. Sylvester, On the Theory of the Syzygetic Relations… (1853)

Aparentemente no se encontró una mejor palabra y ahora es el térimo que se usa. Interpretando un poco lo que dice Sylvester, la inercia se refiere a la resistencia de un cuerpo de cambiar de estado. Así, tal vez Sylvester pensó en la «resistencia a cambiar» de la signatura de una forma cuadrática bajo cambios de base.

Más adelante…

Hay mucha más teoría que se puede enunciar y demostrar para formas cuadráticas en general. Por ahora detendremos nuestra exploración hasta aquí, y ya sólo nos enfocaremos en las formas bilineales simétricas y positivas, es decir, en los productos interiores. Queremos enunciar y demostrar varios resultados para espacios con producto interior y para espacios euclideanos.

Dos conceptos que estudiaremos a continuidad son el de dualidad y el de ortogonalidad. Esto nos abrirá las puertas a entender correctamente algunos tipos de transformaciones lineales muy importantes, como las transformaciones simétricas, las normales y las ortogonales.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, ayudan para repasar los conceptos vistos en esta entrada.

En los siguientes ejercicios, usa el algoritmo de Gauss para escribir cada forma como combinación cuadrática de formas lineales linealmente independientes. Además encuentra su rango y signatura.

  1. Encuentra el rango y la signatura de la forma cuadráticaq:R4R dada por
    q(x,y,z,t)=xy+yz+zt+tx.
  2. Completa algunos detalles faltantes en las demostraciones anteriores. Por ejemplo:
    1. ¿Por qué las formas mi de la discusión del teorema de Sylvester son linealmente independientes?
    2. ¿Por qué son análogas las demostraciones faltantes en el lema que demostramos?
  3. Demuestra que cualquier matriz simétrica es congruente a una matriz diagonal cuya diagonal es de la forma 1,,1,1,1,0,,0.
  4. Enuncia y demuestra un resultado análogo al lema principal de esta entrada, pero para matrices con entradas complejas. Recuerda que en este caso debes usar matrices hermitianas y las congruencias son a través de usar una matriz invertible y su traspuesta conjutada.
  5. Enuncia y demuestra una ley de inercia de Sylvester para formas cuadráticas hermitianas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

5 comentarios en “Álgebra Lineal II: Teorema de Sylvester

  1. Carlos Saúl Rivera Landeros

    Hola, entonces si consigo expresar a una forma cuadratica (no importa el camino que siga) en Rn como combinacion de formas lineales elevadas al cuadrado y linealmente independientes, entonces la signatura y el rango siempre van a ser el mismo?? por ejemplo, si en el primer ejemplo haciamos x_1 = y, x_2=z, x_3=x obtenemos los mismos números?

    Responder
    1. Leonardo Ignacio Martínez SandovalLeo

      Así es. Ese es justo el resultado. Es muy interesante que aunque haya muchas formas de escribir a una forma cuadrática así, siempre se usa la misma cantidad de coeficientes no cero, de coeficientes positivos, y de coeficientes negativos.

      Responder
    2. Diego Ligani Rodríguez Trejo Autor

      Y en el caso que propones no es necesario el teorema, ya que como sólo estamos reproduciendo la demostración, y esa se hace en general, no importa los nombres que decidas asignar, justo por eso en la entrada anterior podíamos no perder generalidad aunque hiciéramos el caso únicamente para x_n, si no se pudiera bastaría cambiar nombres como sea conveniente

      Responder
    1. Leonardo Ignacio Martínez SandovalLeo

      Hola Sebastián. Gracias por el comentario. Ya cambiamos la entrada bastante. Me parece que el comentario que pones ya está remediado en la nueva versión.

      Responder

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.