Álgebra Lineal II: Teorema de Gauss

Introducción

En la entrada anterior vimos un recordatorio de las formas bilineales, cuadráticas y sus polares, en esta entrada continuaremos recordando algunas propiedades vistas previamente enfocándonos en el teorema de Gauss y su demostración, la cual, cabe decirlo, nos dará una pequeña pista de la relación (que esperaríamos tener, al ser álgebra lineal) entre las formas cuadráticas y matrices.

Además, con el teorema de Gauss obtendremos un algoritmo (aunque ciertamente no es obvio cual es este, basado en la demostración) para poder escribir cualquier forma cuadrática en una forma estandarizada, permitiéndonos así buscar propiedades particulares a cada forma cuadrática que más adelante motivara otro resultado importante.

Preparaciones para el teorema de Gauss

Antes de empezar con el teorema, veamos una propiedad de las formas cuadráticas en $\mathbb{R}^n$.
Sea $q$ una forma cuadrática en $\mathbb{R}^n$ con $b$ su polar, y sea $e_1, \dots , e_n$ la base canónica. sabemos que, dado $x \in \mathbb{R}^n$ con $x=(x_1, \dots , x_n)$
\begin{align*} q(x)=q(x_1,\dots , x_n)=q(\sum_{i=1}^nx_ie_i)=b(\sum_{i=1}^nx_ie_i, \sum_{j=1}^nx_je_j) \end{align*}
Desarrollemos la suma presentada en la primera entrada
\begin{align*} =b(x_1e_1, \sum_{j=1}^nx_je_j)+ b(x_2e_2, \sum_{j=1}^nx_je_j) + \dots + b(x_ne_n, \sum_{j=1}^nx_je_j) \end{align*}
Ahora, desarrollemos únicamente la suma de la segunda entrada de $ b(x_1e_1, \sum_{j=1}^nx_je_j)$
\begin{align*} =b(x_1e_1, x_1e_1)+ b(x_1e_1, x_2e_2) + \dots + b(x_1e_1,x_ne_n) \end{align*}
Haciendo lo mismo en cada sumando hasta desarrollar la suma de $b(x_ne_n, \sum_{j=1}^nx_je_j)$
\begin{align*} =b(x_ne_n, x_1e_1)+ b(x_ne_n, x_2e_2) + \dots + b(x_n e_n ,x_n e_n) \end{align*}
Acomodemos todas estas sumas de la siguiente manera, que si has llevado teoría de conjuntos podría resultarte familiar
\begin{align*} =b(x_1e_1, x_1e_1)+ b(x_1e_1, x_2e_2) + \dots + b(x_1e_1,x_ne_n) \\
+b(x_2e_2, x_1e_1) + b (x_2e_2, x_2e_2) + \dots + b(x_2e_2,x_ne_n) \\
\vdots \qquad \qquad \qquad \qquad \qquad \qquad \\
+b(x_ne_n, x_1e_1) + b (x_n e_n, x_2e_2) + \dots + b (x_n e_n , x_n e_n) \end{align*}
Al encontrarnos con esta notación un tanto engorrosa, intentemos simplificarla, nombremos $b(e_i , e_j)=a_{ij}$ y como sabemos que $b$ es simétrica (¿por qué?), podemos afirmar que $a_{ij}=a_{ji}$ además, en cada uno de estos sumandos utilicemos la linealidad, sacando los coeficientes $x_i$ y $x_j$
\begin{align*} =x_1^2a_{11}+ x_1x_2a_{12} + \dots + x_1x_na_{1n} \\
+x_2x_1a_{21}+ x_2^2a_{22} + \dots +x_2x_na_{2n} \\
\vdots \qquad \qquad \qquad \qquad \qquad \qquad \\
+x_nx_1a_{n1} + x_nx_2a_{n2} + \dots + x_n^2 a_{nn} \end{align*}
No está de más notar la similitud que esta notación tiene con una matriz, ¿será que $q$ se puede representar como una matriz?
Más allá de ello, notemos que las $ij$-esima entrada es igual a la entrada $ji$ por lo que $q$ se puede terminar reescribiendo de la siguiente manera
\begin{align*} q(x_1,\dots , x_n)= \sum_{i=1}^nx_i^2a_{ii} + 2\sum_{1 \leq i < j \leq n} x_i x_j a_{ij} \end{align*}
Al juntar todos los elementos de la diagonal en la primera suma y todos los que están fuera de ella en la segunda.

Habiendo hecho esto, procedamos a el teorema cuya demostración, como es de esperar, utilizará la observación recién hecha.

Teorema de Gauss de formas cuadráticas

Teorema
Sea $q$ una forma cuadrática en $V=\mathbb{R}^n$. Existen $\alpha_1, \dots , \alpha_r \in \mathbb{R}$ y formas (funciones) lineales $l_1, \dots l_r \in V^*$ linealmente independientes tales que, para todo $x \in V$
\begin{align*} q(x)= \sum_{i=1}^r \alpha _i (l_i(x))^2 \end{align*}
Recordemos que $V^*$ es el espacio vectorial dual de $V$.

Demostración

Sea $q$ una forma cuadrática cualquiera en $\mathbb{R}^n$.

Procedamos por inducción sobre $n$.

$\underline{ \text{Cuando }n=1}.$

Utilizando la observación anterior sabemos que $q$ se puede escribir como
\begin{align*} q(x_1)=x_1^2a_{11}=x_1^2b(1,1)=x_1^2q(1) \end{align*}.
Con $b$ la polar de $q$, nombrando $\alpha=q(1)$ y $l: V \rightarrow \mathbb{R}$ la identidad, tenemos que
\begin{align*} q(x_1)= x_1^2q(1)=(l_1(x_1))^2 \alpha_1 \end{align*}.

Por lo que el teorema se cumple cuando n=1.

$\underline{ \text{Supongamos que el teorema se cumple para }n-1}$

Nuevamente, por la observación anterior, sabemos que
\begin{align*} q(x_1,\dots , x_n)= \sum_{i=1}^nx_i^2a_{ii} + 2\sum_{1 \leq i < j \leq n} x_ix_ja_{ij} \end{align*}
Separemos este pedazo de la demostración en dos casos.

  • Si existe $ i \in \{ 1, \dots n\}$ tal que $a_{ii} \neq 0$ sin pérdida de generalidad, supongamos que $a_{nn} \neq 0$ (¿Por qué podemos hacer esto?)

    Observemos que
    \begin{align*} 2\sum_{1 \leq i < j \leq n} x_ix_ja_{ij}= 2\sum_{1 \leq i < j \leq n-1} x_ix_ja_{ij} +2(\sum_{i=1}^{n-1} x_ia_{in})x_n \end{align*}
    y
    \begin{align*} \sum_{i=1}^n x_i^2a_{ii}=x_n^2a_{nn} + \sum_{i=1}^{n-1} x_i^2a_{ii} \end{align*}
    Con esto
    \begin{align*} q(x_1,\dots , x_n)=x_n^2a_{nn} + \sum_{i=1}^{n-1} x_i^2a_{ii}+2\sum_{1 \leq i < j \leq n-1} x_ix_ja_{ij} +2(\sum_{i=1}^{n-1} x_ia_{in})x_n \end{align*}
    Dado esto, utilicemos el primero y último término para completar el cuadrado, viendo a $q$ como un polinomio de segundo grado en $x_n$
    \begin{align*} q(x_1,\dots , x_n)= a_{nn} (x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i )^2- a_{nn}(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i )^2 + \sum_{i=1}^{n-1} x_i^2a_{ii}+2\sum_{1 \leq i < j \leq n-1} x_ix_ja_{ij} \end{align*}
    Y finalmente, nombrando
    \begin{align*} q'(x_1,\dots , x_{n-1})= – a_{nn}(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i )^2 + \sum_{i=1}^{n-1} x_i^2a_{ii}+2\sum_{1 \leq i < j \leq n-1} x_ix_ja_{ij} \end{align*}
    Tenemos que
    \begin{align*} q(x_1,\dots , x_n)= a_{nn} (x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i )^2+q'(x_1,\dots , x_{n-1}) \end{align*}
    Donde $q’$ es una forma cuadrática en $\mathbb{R}^{n-1}$ (¿Por qué?) por lo que podemos aplicar la hipótesis de inducción, es decir que
    \begin{align*} q'(x_1,\dots , x_{n-1})= \sum_{i=1}^r \alpha_i (l_i'(x))^2 \end{align*}
    Con $\{ l’_1, \dots , l’_r\} \subseteq (\mathbb{R}^{n-1})^*$ linealmente independientes, definamos
    \begin{align*} l_{r+1}(x_1, \dots , x_n)= x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \text{,} \qquad \alpha_{r+1}=a_{nn}\end{align*}
    Y
    \begin{align*} l_i(x_1, \dots , x_n)=l_i'(x_1, \dots , x_{n-1}) \end{align*}
    con $1 \leq i \leq r$, ya con estos nombres tenemos que
    \begin{align*} q(x_1,\dots , x_n)= \sum_{i=1}^{r+1} \alpha_i (l_i(x_1, \dots , x_n))^2 \end{align*}
    Por lo tanto, para todo $x \in \mathbb{R}^n$
    \begin{align*} q(x)= \sum_{i=1}^{r+1} \alpha_i (l_i(x))^2 \end{align*}
    con $\{ l_1, \dots , l_{r+1} \}$ linealmente independientes (¿Por qué?).
    \begin{align*} \\ \end{align*}
  • Si $ \forall i \in \{ 1, \dots n\}$ $a_{ii}=0$

    De nuevo, separaremos este caso en dos:

    Si suponemos que $\forall i,j \in \{ 1, \dots n\}$ $a_{ij}=0$ entonces debemos tener que $q=0$ así tomando a $\{ l_1, \dots , l_{n} \}$ como la base de $V^*$ que sabemos es linealmente independiente y a $\alpha_i=0$ para todo $1 \leq i \leq n$ es claro que
    \begin{align*} q(x)= \sum_{i=1}^{n} \alpha_i (l_i(x))^2 \end{align*}.

    Así supongamos que existe algún $a_{ij} \neq 0$ sin pérdida de generalidad supongamos que $a_{n-1.n} \neq 0$ (De nuevo ¿Por qué aquí podemos hacer esta afirmación sin pérdida de generalidad?)

    Recordando la observación del principio, tenemos que
    \begin{align*} q(x_1,\dots , x_n)= \sum_{i=1}^nx_i^2a_{ii} + 2\sum_{1 \leq i < j \leq n} x_i x_j a_{ij} \end{align*}
    Además, como $ \forall i \in \{ 1, \dots n\}$ $a_{ii}=0$ tenemos que $q$ se puede simplificar aún más
    \begin{align*} q(x_1,\dots , x_n)= 2\sum_{1 \leq i < j \leq n} x_i x_j a_{ij} \end{align*}
    Más aún esta suma se puede separar como sigue
    \begin{align*} q(x_1,\dots , x_n)= 2a_{n-1.n}x_{n-1}x_n +2\sum_{i=1}^{n-2}a_{in}x_ix_n+ 2\sum_{i=1}^{n-2}a_{i,n-1}x_ix_{n-1} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \end{align*}.
    Para no alargar esta entrada, te sugiero intentes probar que $q$ efectivamente se puede escribir de esta manera, tal vez te resulte útil volver a pensar a $q$ en la «notación matricial» que utilizamos al principio.
    Prosigamos, utilizaremos la siguiente identidad algebraica
    \begin{align*} axy+bx+cy= a ( x + \frac{c}{a} ) ( y + \frac{b}{a} ) -\frac{bc}{a} \end{align*}
    Y nombrando
    \begin{align*} a =2a_{n-1.n}, \qquad b=2\sum_{i=1}^{n-2}a_{in}x_i, \qquad c=2\sum_{i=1}^{n-2}a_{i,n-1}x_i, \qquad x=x_n, \qquad y=x_{n-1} \end{align*}
    Tenemos que $q$ se puede escribir como sigue
    \begin{align*}2a_{n-1.n}(x_n + \sum_{i=1}^{n-2}\frac{a_{i,n-1}}{a_{n-1.n}} x_i )( x_{n-1} + \sum_{i=1}^{n-2}\frac{a_{i,n}}{a_{n-1.n}} x_i ) – 2\frac{\sum_{i=1}^{n-2}a_{in}x_i \times \sum_{i=1}^{n-2}a_{i,n-1}x_i}{a_{n-1.n}} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \end{align*}
    Por suerte, para la notación nombraremos
    \begin{align*} q'(x_1,\dots , x_{n-2})= – 2\frac{\sum_{i=1}^{n-2}a_{in}x_i \times \sum_{i=1}^{n-2}a_{i,n-1}x_i}{a_{n-1.n}} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \end{align*}
    Que es una forma cuadrática en $\mathbb{R}^{n-2}$ por lo que, gracias a la hipótesis de inducción se puede escribir como
    \begin{align*} q'(x_1, \dots , x_{n-2})= \sum_{i=1}^r \alpha’_i (l’_i(x_1, \dots , x_{n-2}))^2 \end{align*}
    Con $\{ l’_1, \dots , l’_r\} \subseteq (\mathbb{R}^{n-2})^*$ linealmente independientes, trabajemos con la otra parte de $q$, para esto usaremos otra identidad algebraica
    \begin{align*} ab=\frac{(a+b)^2 -(a-b)^2 }{4} \end{align*}
    Y nombrando
    \begin{align*} a =(x_n + \sum_{i=1}^{n-2}\frac{a_{i,n-1}}{a_{n-1.n}} x_i ), \qquad b= ( x_{n-1} + \sum_{i=1}^{n-2}\frac{a_{i,n}}{a_{n-1.n}} x_i ) \end{align*}
    Por suerte, aquí no necesitamos sustituir y desarrollar, definamos ingeniosamente $l_{r+1}$ y $l_{r+2}$ como sigue
    \begin{align*} l_{r+1}(x_1, \dots , x_n)= x_n + x_{n-1} + \sum_{i=1}^{n-2}\frac{a_{i,n-1}+a_{i,n}}{a_{n-1.n}} x_i \end{align*}
    Y
    \begin{align*} l_{r+2}(x_1, \dots , x_n)= x_n – x_{n-1} + \sum_{i=1}^{n-2}\frac{a_{i,n-1}-a_{i,n}}{a_{n-1.n}} x_i \end{align*}
    De esta manera
    \begin{align*}2a_{n-1.n}(x_n + \sum_{i=1}^{n-2}\frac{a_{i,n-1}}{a_{n-1.n}} x_i )( x_{n-1} + \sum_{i=1}^{n-2}\frac{a_{i,n}}{a_{n-1.n}} x_i ) \\
    =\frac{a_{n-1.n}}{2} [ (l_{r+1}(x_1, \dots , x_n))^2- (l_{r+2}(x_1, \dots , x_n))^2 ] \end{align*}
    Para finalizar, con todas estas igualdades tenemos que
    \begin{align*} q(x_1,\dots , x_n)= \sum_{i=1}^r \alpha’_i (l’_i(x_1, \dots , x_{n-2} ))^2 + \frac{a_{n-1.n}}{2} [ (l_{r+1}(x_1, \dots , x_n))^2- (l_{r+2}(x_1, \dots , x_n))^2 ]\end{align*}
    Y sólo resta cambiar nombres como sigue
    \begin{align*} l_i(x_1, \dots x_n) = l’_i(x_1, \dots , x_{n-2}) \qquad \text{y} \qquad \alpha_i=\alpha’_i \end{align*}
    Para $ i \in \{1, \dots r \}$ y
    \begin{align*} \alpha_{r+1}=\frac{a_{n-1.n}}{2} \qquad \text{y} \qquad \alpha_{r+2}=-\frac{a_{n-1.n}}{2} \end{align*}
    Ya con estos nombres, $q$ se escribe como sigue
    \begin{align*} q(x_1,\dots , x_n)= \sum_{i=1}^{r+2} \alpha_i (l_i(x_1, \dots , x_n ))^2 \end{align*}
    con $\{ l_1, \dots , l_{r+2} \}$ linealmente independientes (¿Por qué?).

Por lo que, en cualquiera de los dos casos propuestos se cumple que
\begin{align*} q(x)= \sum_{i=1}^{r} \alpha_i (l_i(x))^2 \end{align*}
con con $\{ l_1, \dots , l_{r} \}$ linealmente independientes.

Así por principio de inducción tenemos que el teorema de Gauss se cumple para cualquier forma cuadrática $q$ en $\mathbb{R^n}$ pata todo $n \in \mathbb{N}$.

$\square$

Más adelante

Debido a la longitud de esta demostración, los ejemplos serán reservados para la siguiente entrada, además, al principio de la entrada se dieron pistas a que existe una relación entre formas bilineales y matrices, esto será explorado posteriormente.

Por el momento nos centraremos en utilizar el teorema de Gauss para poder escribir $q$ de una forma estándar y observar que propiedades extra podemos obtener al escribirla de esta manera, esto motivará el siguiente teorema de interés la ley de inercia de Sylvester.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea $q$ una forma cuadrática en $\mathbb{R}^n$ y $x=(x_1, \dots x_n)$ muestra que \begin{align*} q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \text{ con } a_{ij}=b(e_i,e_j). \end{align*}
  2. Sea $A=[a_{ij}]$ con $a_{ij}$ definida del problema anterior, ¿Qué podrías afirmar acerca de A sin importar la $q$ elegida?
  3. Sea $A=[a_{ij}]$ una matriz simétrica en $M_n(\mathbb{R})$ y definamos
    \begin{align*} q: \mathbb{R}^n \rightarrow \mathbb{R} \text{ con } q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \end{align*} ¿Es $q$ así definida una forma cuadrática?
  4. En el ejercicio anterior, ¿Es necesario que $A$ sea simétrica?
  5. Sean $\alpha _1, \dots , \alpha_r $ números reales y $l_1 , \dots , l_r$ formas lineales, linealmente independientes en $\mathbb{R}^n$ y $x \in \mathbb{R}^n$ definamos $q$ como sigue:
    \begin{align*} q(x)=\sum_{i,j=1}^n \alpha_i(l_i(x)) \end{align*}
    ¿Es $q$ así definida una forma cuadrática en $\mathbb{R}^n$?

Entradas relacionadas

2 comentarios en “Álgebra Lineal II: Teorema de Gauss

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.