Álgebra lineal II: Ejemplos del teorema de Gauss y Teorema de Sylvester

Introducción

En la entrada anterior nos dedicamos a hacer preparaciones y posteriormente demostrar el teorema de Gauss, sin embargo, la prueba no parece arrojar un método con el cual podamos eficientemente representar cualquier forma cuadrática, en esta entrada veremos un par de ejemplos de cómo hacerlo.

Posteriormente seguiremos manipulando la nueva forma en la que el teorema de Gauss nos permite escribir las formas cuadráticas lo que nos arrojará nuevas definiciones, como rango y signatura, finalmente hablaremos un poco del Teorema de Sylvester (También conocido como Ley de inercia de Sylvester) aunque su demostración tendrá que esperar a que tengamos un par de herramientas extra.

Ejemplos del teorema de Gauss

Ejemplo

$q$ es la forma cuadrática en $\mathbb{R}^3$ definida como sigue
\begin{align*} q(x,y,z)= xy+yz+xz \end{align*}
Reescribe $q$ como combinación de formas lineales, linealmente independientes.

La primera manera (no muy elegante) de resolver este ejercicio es reproducir la demostración del teorema de Gauss, ubicando únicamente que caso es necesario reproducir.

Solución

Revisando la demostración dada en la entrada anterior, como la dimensión en este caso es $3$ no podemos utilizar lo hecho cuando $n=1$, así el proceso para probar que el teorema se valía para $n \neq 1$ se separa en dos casos:

  • Si $a_{ii}=0$ para todo $i \in \{1,\dots , n \}$
  • Si $a_{ii} \neq 0$ para algún $i \in \{1,\dots , n \}$

Esto es, verificar si los coeficientes de $x^2,y^2$ y $z^2$ son todos $0$ o existe uno que no, como todos son ceros procederemos como en el segundo caso.
Nombrando
\begin{align*} x_1=x, \qquad x_2=y \qquad \text{y} \qquad x_3=z\end{align*}
Haciendo esto, tenemos
\begin{align*} xy+yz+xz= q(x_1, x_2, x_3)=2\sum_{1 \leq i < j \leq 3} x_i x_j a_{ij} \end{align*} \begin{align*} =2a_{12}x_1x_2+2a_{13}x_1x_3+2_{23}x_2x_3 = 2a_{12}xy+2a_{13}xz+2_{23}yz \end{align*}
Comparando los coeficientes, tenemos que
\begin{align*} a_{12}=a_{13}=a_{23}=1/2, \end{align*}
Escribiéndolo como en la demostración
\begin{align*} q(x_1,\dots , x_n)= 2a_{n-1.n}x_{n-1}x_n +2\sum_{i=1}^{n-2}a_{in}x_ix_n+ 2\sum_{i=1}^{n-2}a_{i,n-1}x_ix_{n-1} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \\
=2a_{23}x_2x_3+2\sum_{i=1}^{1}a_{i3}x_ix_3 +2\sum_{i=1}^{1}a_{i2}x_ix_{2}+ 2\sum_{1 \leq i < j \leq 1} x_i x_j a_{ij} \end{align*}.
De nuevo, utilizando la identidad
\begin{align*} axy+bx+cy= a ( x + \frac{c}{a} ) ( y + \frac{b}{a} ) -\frac{bc}{a} \end{align*}
Y nombrando
\begin{align*} a =2a_{23}=1, \qquad b=2\sum_{i=1}^1a_{i3}x_i=x, \qquad c=2\sum_{i=1}^{1}a_{i2}x_i=x, \qquad x=x_3, \qquad y=x_2 \end{align*}
Y sustituyendo
\begin{align*} 1( x_3+\frac{x}{1} ) (x_2 +\frac{x}{1} )-\frac{x \times x}{1}= (z+x) (y+x)-x^2 \end{align*}
Aquí, la prueba usa la hipótesis de inducción para afirmar que el último término ($x^2$) ya está de la forma que deseamos, es decir, como una combinación de formas lineales linealmente independientes elevadas al cuadrado, esta vez sí tenemos ese caso, si no fuera así habría que repetir todo este procedimiento para el último término únicamente hasta poder escribirlo de la forma deseada.
Finalmente, la demostración indica que hay que fijarse en la multiplicación $(z+x) (y+x)$ y utilizar la identidad
\begin{align*} ab=\frac{(a+b)^2 -(a-b)^2 }{4} \end{align*}
Con
\begin{align*} a=z+x \qquad \text{y} \qquad b=y+x \end{align*}
Sustituyendo esto en la identidad, tenemos que
\begin{align*} ab= \frac{(z+x+y+x)^2 -(z+x-y-x)^2 }{4} =\frac{(2x+z+y)^2}{4}+\frac{(z-y)^2}{4} \end{align*}
Por lo que
\begin{align*} q= (2x+z+y)^2+(z-y)^2 -x^2 \end{align*}
El teorema anterior nos asegura que, al menos $2x+z+y$ y $z-y$ son linealmente independientes, basta verificar que agregando $x$ la independencia se mantiene, que no lo haremos aquí, pero no está de más que tú lo intentes.

Ejemplo
$q$ es la forma cuadrática en $\mathbb{R}^3$ definida como sigue
\begin{align*} q(x,y,z)= (x – y)^2+(y – z)^2+ (z – x)^2 \end{align*}
Reescribe $q$ como combinación de formas lineales, linealmente independientes elevadas al cuadrado.

Solución

Sería fácil asumir que $q$ ya está de la forma deseada, sin embargo, una revisión rápida nos deja ver qué $x – y$, $y-z$ y $z-x$ no son linealmente independientes en $(\mathbb{R}^3)^*$.
Primero desarrollemos todo
\begin{align*} q(x,y,z)= 2x^2+2y^2+2z^2 -2xy-2xz-2yz \end{align*}
De nuevo, como la dimensión no es $1$ habrá que fijarnos en el paso inductivo de la demostración, esta vez, $q$ cae en el primer caso ya que en particular el coeficiente de $x$ (que con la notación de la demostración se llamará x_1, por lo que su coeficiente seria $a_{11}$) no es cero.
Siguiendo el caso este nos indica que expresemos a $q$ como polinomio de segundo grado en $x$ y completemos el cuadrado
\begin{align*} 2x^2+2y^2+2z^2 -2xy-2xz-2yz= 2 ( x- \frac{y+z}{2})^2 – \frac{(y+z)^2}{2} + 2y^2 +2z^2-2yz \end{align*}
Una vez más, en la demostración la hipótesis de inducción asegura que los términos sin $x$ en este caso $ – \frac{(y+z)^2}{2} + 2y^2 +2z^2-2yz$ se pueden escribir como una combinación de formas lineales linealmente independientes elevadas al cuadrado, como no es el caso, deberíamos repetir el procedimiento desde el primer paso, esta vez únicamente en $- (\frac{y+z}{2})^2 + 2y^2 +2z^2-2yz$ sin embargo, para nuestra suerte, una pequeña manipulación muestra que
\begin{align*} – \frac{(y+z)^2}{2} + 2y^2 +2z^2-2yz = \frac{3}{2}(y – z)^2\end{align*}
Que cumple ser linealmente independiente con $x- \frac{y+z}{2}$ por lo que
\begin{align*} q(x,y,z)= 2 ( x- \frac{y+z}{2})^2 + \frac{3}{2}(y – z)^2 \end{align*}

Con esto visto, podemos describir un algoritmo en 4 pasos.

  1. Desarrollar todos los términos $q$ si es necesario.
  2. Revisar que forma tiene $q$ con respecto a los 3 casos que se vieron en la demostración.
  3. Reproducir el caso elegido de la demostración, dependiendo de la forma de $q$.
    Dentro de este paso, puede ser necesario repetir desde el paso 1.
  4. Verificar que los nuevos términos de $q$ sean efectivamente linealmente independientes.

Si bien, así escritos puede parecer bastante sencillo, en la práctica incluso acortando pasos y notación esto muestra no ser sencillo ni práctico, veremos después otras formas de expresar $q$ de esta misma manera de una forma más eficaz.

Teorema de Sylvester (Ley de inercia de Sylvester)

Ya teniendo en nuestro poder el teorema de Gauss, sabemos que dado $q$ una forma cuadrática en $V=\mathbb{R}^n$. Existen $\alpha_1, \dots , \alpha_r \in \mathbb{R}$ y formas (funciones) lineales $l_1, \dots l_r \in (\mathbb{R}^n)^*$ linealmente independientes tales que, para todo $x \in V$
\begin{align*} q(x)= \sum_{i=1}^r \alpha _i (l_i(x))^2 \end{align*}
Revisemos esta última igualdad, podemos asumir que $\alpha_i \neq 0$ para $1 \leq i \leq r$ si alguno de estos fuera $0$, simplemente eliminemos ese término.

Por otro lado, definamos los siguientes conjuntos
\begin{align*} I=\{i \in \{1, \dots , r\} : \alpha_i > 0 \} \qquad \text{y} \qquad J=\{j \in \{1, \dots , r\} : \alpha_j < 0 \} \end{align*}.
Con estos nombres, $q$ se puede reescribir como
\begin{align*} q(x)= \sum_{i \in I}( \sqrt{\alpha_i} l_i) ^2(x) – \sum_{i \in J}( \sqrt{\alpha_i} l_i) ^2(x) \end{align*}
Definamos $L_1, \dots L_r \in (\mathbb{R}^n)^*$ formas lineales
\begin{align*} L_i=\sqrt{\alpha_i} l_i \text{ si } i \in I \qquad \text{y} \qquad L_i=\sqrt{-\alpha_i} l_i \text{ si } i \in j \end{align*}
y así nombrado
\begin{align*} q(x)= \sum_{i \in I}L_i^2(x) – \sum_{i \in J}L_j^2(x) \end{align*}
Y cabe notar que $L_1, \dots L_r \in (\mathbb{R}^n)^*$ aún son linealmente independientes y que $|I|+|J|=r$.

Dado esto, reescribiremos el teorema de Gauss y ya que lo único que cambiamos es la notación la demostración hecha sigue siendo válida.

Teorema de Gauss

Sea $q$ una forma cuadrática en $\mathbb{R} ^n$, existen formas lineales, linealmente independientes $L_1. \dots L_r \in (\mathbb{R} ^n)^*$ tales que, para todo $x \in \mathbb{R} ^n$
\begin{align*} q(x)=\sum_{i=1}^r (L_i(x))^2 \end{align*}.
Además, si escribimos $q$ como
\begin{align*} q(x)= \sum_{i \in I}L_i^2(x) – \sum_{i \in J}L_j^2(x) \end{align*}
Podemos formular las siguientes definiciones.

Definición

Sea $q$ una forma cuadrática en $\mathbb{R}^n$ tal que
\begin{align*} q(x)=\sum_{i=1}^r (L_i(x))^2= \sum_{i \in I}L_i^2(x) – \sum_{i \in J}L_j^2(x) \end{align*}
Al par ordenado $(|I|,|J|)$ le llamaremos la signatura de $q$.

Definición

Sea $q$ una forma cuadrática en $\mathbb{R} ^n$ con signatura $(|I|,|J|)$ a $r \in \mathbb{R} $ tal que
\begin{align*} r =|I|+|J| \end{align*}
le llamaremos el rango de $q$.

Es oportuno notar que en matrices también tenemos definido el concepto de rango, otro recordatorio de a donde nos dirigimos al estudiar esta teoría.

De nuevo, al ver una definición nueva, la pregunta debería ser ¿Aquí se define correctamente un concepto único?

En este caso, puedes notar que la demostración del teorema de Gauss y por consiguiente estas definiciones se basaron en escribir a cualquier $x \in \mathbb{R}^n$ como combinación lineal en la base canónica, entonces ¿por qué en estas definiciones no se menciona nada acerca de la base? sería de esperar que si cambiamos la base en la que expresemos a $x$ también deberían cambiar la signatura y el rango.

Por suerte estos números son invariantes bajo cambio de base, lo que nos permite definirlos sin necesidad de detallar eso.

A esta afirmación se le conoce como el Teorema de Sylvester y como puedes esperar, deberíamos enunciarlo correctamente y demostrarlo, aunque la escritura del teorema y su demostración son posibles con la notación que tenemos, se vuelve mucho más sencillo una vez que nos adentremos en la relación de funciones cuadráticas con matrices y las herramientas que esto nos proporcionará, por lo que dejaremos este enunciado y su demostración para después.

Dato curioso

Algo que no se mencionó en esta entrada, nos hemos referido al Teorema de Sylvester de dos maneras intercambiables, Teorema de Sylvester y Ley de Inercia de Sylvester, la intuición diría que existe relación con la física, algún uso especial de este teorema que lo hace importante para el cálculo de inercia.

No, curiosamente, viene de esta frase

This constant number of positive signs which attaches to a quadratic function under all its transformations […] may be termed conveniently its inertia, until a better word is found.

J. J. Sylvester, On the Theory of the Syzygetic Relations… (1853)

Interpretando un poco, podemos pensar a la inercia inicial, como la resistencia de un cuerpo de moverse, así, tal vez Sylvester pensó en la resistencia a moverse del rango y la signatura bajo cambios de base.

Más adelante

Las formas cuadráticas, aunque interesantes, muestran estar limitadas por como las definimos, ya que son únicamente funciones reales, en las siguientes entradas expandiremos un poco esta definición para también abarcar al menos funciones a los complejos (formas sesquilineales ) y nos enfocaremos en un tipo especial de estas (formas hermitianas).

Ya teniendo más tipos de formas bilineales para trabajar, entraremos finalmente a la relación con matrices donde, tal vez ya te disté cuenta porque, pero se volverá muy importante el concepto de diagonalización, esta es otra de las razones del gran enfoque de esta materia en encontrar una forma de diagonalizar matrices, o al menos saber si es posible.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

En los siguientes ejercicios, usa el algoritmo de Gauss para escribir cada forma como combinación de formas lineales linealmente independientes, además encuentra su rango y signatura.

  1. $q : \mathbb{R}^4 \rightarrow \mathbb{R}$ dada por
    \begin{align*} q(x,y,z,t)=xy+2z^2+tx-t^2 \end{align*}.
  2. $q : \mathbb{R}^3 \rightarrow \mathbb{R}$ dada por
    \begin{align*} q(x,y,z)=(x-2y+z)^2-(x-y)^2+z^2 \end{align*}.
  3. $q : \mathbb{R}^4 \rightarrow \mathbb{R}$ dada por
    \begin{align*} q(x,y,z,t)= xy + yz + zt+tx \end{align*}.
  4. Demuestra que las formas $L_1, \dots , L_r$ definidas aquí y en los dos ejemplos, son linealmente independientes.
  5. ¿Como definirías formas bilineales pero esta vez, que partan de un espacio vectorial $V$ sobre $\mathbb{C}$ a $\mathbb{C}$? ¿Se cumplen todas las propiedades de forma bilineal que hemos visto hasta ahora?

Entradas relacionadas

3 comentarios en “Álgebra lineal II: Ejemplos del teorema de Gauss y Teorema de Sylvester

  1. Carlos Saúl Rivera Landeros

    Hola, entonces si consigo expresar a una forma cuadratica (no importa el camino que siga) en Rn como combinacion de formas lineales elevadas al cuadrado y linealmente independientes, entonces la signatura y el rango siempre van a ser el mismo?? por ejemplo, si en el primer ejemplo haciamos x_1 = y, x_2=z, x_3=x obtenemos los mismos números?

    Responder
    1. LeoLeo

      Así es. Ese es justo el resultado. Es muy interesante que aunque haya muchas formas de escribir a una forma cuadrática así, siempre se usa la misma cantidad de coeficientes no cero, de coeficientes positivos, y de coeficientes negativos.

      Responder
    2. Diego Ligani Rodríguez Trejo Autor

      Y en el caso que propones no es necesario el teorema, ya que como sólo estamos reproduciendo la demostración, y esa se hace en general, no importa los nombres que decidas asignar, justo por eso en la entrada anterior podíamos no perder generalidad aunque hiciéramos el caso únicamente para x_n, si no se pudiera bastaría cambiar nombres como sea conveniente

      Responder

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.