Archivo de la etiqueta: forma cuadrática

Álgebra Lineal II: Teorema de Gauss

Por Diego Ligani Rodríguez Trejo

Introducción

En la entrada anterior vimos un recordatorio de las formas bilineales, cuadráticas y sus polares. En esta entrada continuaremos recordando algunas propiedades vistas previamente enfocándonos en el teorema de Gauss y su demostración. Esto nos dará una pequeña pista de la relación entre las formas cuadráticas y matrices.

Además, con el teorema de Gauss obtendremos un algoritmo para poder escribir cualquier forma cuadrática en una forma estandarizada. Esto nos llevará más adelante a plantear la ley de inercia de Sylvester.

Preparaciones para el teorema de Gauss

Antes de empezar con el teorema, veamos una propiedad de las formas cuadráticas en Rn. Tomemos e1,,en la base canónica de Rn. Tomemos q una forma cuadrática de Rn y b su forma polar.

Cualquier vector x=(x1,,xn) de Rn se escribe como (x1,,xn)=i=1nxiei. Por lo que hicimos en la entrada anterior tenemos entonces:

q(x)=b(x,x)=i=1nj=1nxixjb(ei,ej).

Para simplificar la notación definamos aij:=b(ei,ej). Podemos «ver» todos los sumandos en la siguiente expresión:

q(x)=x12a11+x1x2a12++x1xna1n+x2x1a21+x22a22++x2xna2n+xnx1an1+xnx2an2++xn2ann

Aquí hay algunos términos «puros» de la forma aiixi2. Se encuentran en la «diagonal». Tenemos también algunos términos «mixtos» de la forma aijxixj con ij. Por la simetría de b, en los términos mixtos tenemos aij=aji. Al separar en términos puros y mixtos obtenemos entonces la siguiente expresión:

(1)q(x)=i=1naiixi2+21i<jnaijxixj.

Usaremos esto más abajo.

Teorema de Gauss de formas cuadráticas

Teorema. Sea q una forma cuadrática en V=Rn. Existen reales α1,,αr y formas lineales l1,lr de V linealmente independientes tales que, para todo xV se tiene
q(x)=i=1rαi(li(x))2.

Recordemos que la independencia lineal de las formas l1,,lr sucede en el espacio dual V.

Demostración. Procedamos por inducción sobre n. De la igualdad (1), cuando n=1 la forma cuadrática es de la forma q(x)=a11x12. Al definir α1=a11 y l1(x)=x1 obtenemos la forma deseada.

Supongamos que el teorema se cumple para n1. De la igualdad (1) sabemos que q se puede escribir como sigue:

q(x)=i=1naiixi2+21i<jnaijxixj.

Tenemos tres posibilidades:

  • Que todos los aii y todos los aij sean cero. Este caso es inmediato pues entonces q es la forma cuadrática cero y podemos tomar l1(x)=x1 y α1=0.
  • Que algún aii sea distinto de cero.
  • Que todos los aii sean cero, pero algún aij sea distinto de cero.

Hagamos cada uno de los últimos dos casos por separado. Comencemos por el caso en el que algún aii es distinto de cero. Sin pérdida de generalidad (¿por qué?) podemos suponer que es ann.

Apartando los términos que tienen xn de los que no obtenemos:

i=1naiixi2=annxn2+i=1n1aiixi2.

y

21i<jnaijxixj=2(i=1n1ainxi)xn+21i<jn1aijxixj

Con esto

q(x)=annxn2+2(i=1n1ainxi)xn+i=1n1aiixi2+21i<jn1aijxixj.

Si bien esta expresión se ve complicada, en realidad podemos pensar que en términos de la variable xn es «simplemente una cuadrática». Basados en los primeros dos términos podemos completar un binomio al cuadrado como sigue:

q(x)=ann(xn+i=1n1ainannxi)2ann(i=1n1ainannxi)2+i=1n1aiixi2+21i<jn1aijxixj.

Notemos que la expresión

ann(i=1n1ainannxi)2+i=1n1aiixi2+21i<jn1aijxixj

ya no tiene a la variable xn y que de hecho es una forma cuadrática en las variables x1,,xn1 (¿por qué?). De este modo, podemos aplicarle hipótesis inductiva para obtener que existen escalares α1,,αr y formas lineales l1,,lr linalmente independientes de Rn1 tales que

q(x1,,xn1)=i=1rαi(li(x))2.

Si bien estas li son formas lineales de Rn1, también podemos pensarlas como formas lineales de Rn. Formalmente, tomamos li:RnR dada por li(x1,,xn)=li(x1,,xn1). Para finalizar, definimos

lr+1(x1,,xn)=xn+i=1n1ainannxi,αr+1=ann.

De aquí, obtenemos la expresión deseada para q:

q(x)=i=1r+1αi(li(x))2

Falta argumentar por qué las li son linealmente independientes. Si una combinación lineal de ellas da cero, como lr+1 es la única que involucra a xn, entonces su coeficiente debe ser cero. Así, obtendríamos una combinación lineal de l1,,lr igualada a cero. Pero esta es una combinación lineal de l1,,lr. Por hipótesis inductiva, estas son linealmente independientes así que todos los coeficientes deben ser cero.

Lo anterior termina el caso para cuando hay algún «término puro». Falta el caso en el que todos los «términos puros» tienen coeficiente cero, pero hay por lo menos un «término mixto». Por la igualdad (1) tenemos que la forma cuadrática se ve así:

q(x)=21i<jnaijxixj.

Sin pérdida de generalidad podemos suponer que el término mixto que no es cero es el an1,n (¿por qué?). La idea es ahora separar a los términos que tienen xn1 ó xn de los que no, y utilizar la siguientes identidades algebraicas que se valen para cualesquiera A,B,C,D,E (haz las cuentas):

(2)Axn1xn+Bxn1+Cxn=A(xn1+CA)(xn+BA)BCA,

(3)DE=14(D+E)214(DE)2.

Al realizar la separación nos queda:

q(x)=2an1,nxn1xn+2i=1n2ainxixn+2i=1n2ai,n1xixn1+21i<jn2xixjaij.

Así, podemos usar la identidad (2) con los siguientes valores

A=2an1.n,B=2i=1n2ai,n1xi,C=2i=1n2ai,nxi

para obtener que q es:

A(xn1+CA)(xn+BA)BCA+21i<jn2xixjaij

Al primer sumando podemos reescribirlo usando la identidad (3) como

A4(xn1+xn+B+CA)2A4(xn1xnBCA)2

A la expresión conformada por los últimos dos sumandos le podemos aplicar hipótesis inductiva (¿por qué?) para escribirla de la forma q(x1,,xn2)=i=1rαi(li(x1,,xn2))2 con l1,,lr formas lineales linealmente independientes de Rn2. Como en el caso anterior, podemos «convertir» estas formas lineales a formas lineales l1,,lr en Rn. Al agregar las siguientes dos formas lineales

lr+1(x)=xn1+xn+B+CAlr+2(x)=xn1xnBCA

y tomar αr+1=A4, αr+2=A4, obtenemos la expresión deseada:
q(x)=i=1r+2αi(li(x))2.

La demostración de que en efecto l1,,lr+2 son linealmente independientes queda como ejercicio.

Así por principio de inducción tenemos que el teorema de Gauss se cumple para cualquier forma cuadrática q en Rn para todo n1 entero.

◻

Más adelante…

Debido a la longitud de esta demostración, los ejemplos serán reservados para la siguiente entrada.

Las formas cuadráticas, aunque interesantes, muestran estar limitadas por cómo las definimos, ya que se definen sólo en espacios vectoriales reales. En las siguientes entradas expandiremos un poco esta definición para también abarcar al menos espacios vectoriales complejos y luego nos enfocaremos en un tipo especial de éstas.

Además, al principio de la entrada se dieron pistas a que existe una relación entre formas bilineales y matrices, esto será explorado posteriormente.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea q una forma cuadrática en Rn y x=(x1,,xn). Muestra que q(x)=i,j=1naijxixj con aij=b(ei,ej).
  2. Sea A la matriz con entradas aij dadas en el problema anterior. ¿Qué podrías afirmar acerca de A sin importar la q elegida?
  3. Sea A=[aij] una matriz simétrica en Mn(R) y definamos
    q:RnR dada por q(x)=i,j=1naijxixj ¿Es q así definida una forma cuadrática? ¿Es necesario que A sea simétrica?
  4. Demuestra que las formas lineales definidas en el segundo caso de la demostración del teorema de Gauss en efecto son linealmente independientes.
  5. Sean α1,,αr números reales y l1,,lr formas lineales, linealmente independientes en Rn y xRn. Definamos q como sigue:
    q(x)=inαili(x)
    ¿Es q así definida una forma cuadrática en Rn?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Repaso de formas bilineales y formas cuadráticas

Por Diego Ligani Rodríguez Trejo

Introducción

Aunque en previas entradas ya se ha hablado de formas bilineales y formas cuadráticas, retomaremos su estudio en esta entrada y nos dedicaremos a probar algunas propiedades que previamente no fueron demostradas.

También nos familiarizaremos con algunos tipos especiales de formas bilineales e intentaremos extender las definiciones ya dadas, esta vez para espacios vectoriales cuyo campo sea C.

Formas bilineales

Definición. Sea V un espacio vectorial sobre R. Una forma bilineal es una función b:V×VR tal que:

  • Para cualquier xV la función b(x,):VR que envía v a b(x,v) es lineal.
  • Para cualquier yV la función b(,y):VR que envía v a b(v,y) es lineal.

Definición. Una forma bilineal b se llama simétrica si b(x,y)=b(y,x) para cualquier par x,yV.

A partir de la definición de forma bilineal podemos saber cómo «abrir combinaciones lineales» si las tenemos en ambas entradas.

Proposición. Sea b una forma bilineal en un espacio vectorial V sobre R. Sean x1,xnV, y1,ymV y a1,an,c1,cmR. Tenemos que:
b(i=1naixi,j=1mcjyj)=i=1nj=1maicjb(xi,yj)

Demostración. Usando la linealidad en la primera entrada de b tenemos que:

b(i=1naixi,j=1mcjyj)=i=1naib(xi,j=1mcjyj).
Procediendo de manera similar en la segunda entrada de cada sumando obtenemos:

i=1naib(xi,j=1mcjyj)=i=1nai(j=1mcjb(xi,yj)).

Multiplicando el real ai por la suma de índice j para que «entre a la suma» obtenemos la expresión deseada.

◻

Obtenemos el siguiente corolario.

Corolario. Sea V un espacio vectorial sobre R de dimensión finita y e1,,en una base. Una forma bilineal b queda totalmente definida por los valores b(ei,ej) para 1in y 1jn.

Formas cuadráticas

Definición. Sea V un espacio vectorial sobre R. Una forma cuadrática es una función q:VR tal que existe una forma bilineal b:V×VR que cumple q(x)=b(x,x).

Identidad de polarización

Puede existir una forma cuadrática que tenga más de una forma bilineal asignada.

Ejemplo. Tomemos V=R2 y b1,b2:V×VR definidas como sigue para x=(x1,x2) y y=(y1,y2):

b1(x,y)=x1y2x2y1b2(x,y)=x2y1x1y2.

De aquí:

b1(x,x)=x1x2x2x1=0b2(x,x)=x2x1x1x2=0,

por lo que b1 y b2 tendrían la misma forma cuadrática asignada.

Por suerte basta agregar una restricción a la forma bilineal para que tengamos esta deseada unicidad. Esto lo afirma el siguiente teorema.

Teorema (Identidad de polarización). Sea V un espacio vectorial sobre R y q:VR una forma cuadrática. Existe una única forma bilineal simétrica b:V×VR tal que q(x)=b(x,x) para todo xV.

Más aún, esta b se puede encontrar de la siguiente manera:
b(x,y)=q(x+y)q(x)q(y)2.

Demostración. Por la definición de forma cuadrática, sabemos que existe una forma bilineal (no necesariamente simétrica) B tal que q(x)=B(x,x). Tomemos la función b:V×VR dada por la siguiente fórmula: b(x,y)=q(x+y)q(x)q(y)2.

Dado que q(x)=B(x,x), podemos calcular b como b(x,y)=B(x+y,x+y)B(x,x)B(y,y)2.

Usando la bilinealidad de B, el primer sumando B(x+y,x+y) es B(x,x+y)+B(y,x+y), que a su vez es B(x,x)+B(x,y)+B(y,x)+B(y,y).

Sustituyendo esto en b(x,y) y simplificando nos arroja la igualdad

b(x,y)=B(x,y)+B(y,x)2.

Esta igualdad nos dice que b es combinación lineal de las formas bilineales (x,y)B(x,y) y (x,y)B(y,x), de modo que b es bilineal. Además, de esta igualdad se concluye de manera inmediata que b(x,y)=b(y,x). Así, b es forma bilineal simétrica.

Una última aplicación de la igualdad previa nos ayuda a probar que q(x)=b(x,x), ya que:

b(x,x)=B(x,x)+B(x,x)2=B(x,x)=q(x).

Lo único que nos falta demostrar es la unicidad. Si tuviéramos otra forma bilineal simétrica b:V×VR tal que q(x)=b(x,x), ésta debe cumplir lo siguiente:

q(x+y)=b(x+y,x+y)=b(x,x)+2b(x,y)+b(y,y).

Al despejar a b(x,y) obtenemos

b(x,y)=q(x+y)q(x)q(y)2=b(x,y).

◻

Finalicemos recordando una última definición que relaciona a q con su única forma bilineal simétrica.

Definición. Sea q:VR una forma cuadrática. A b:V×VR dada por
b(x,y)=q(x+y)q(x)q(y)2
se le llama la forma polar de q.

Más adelante…

En las siguientes entradas veremos un teorema importante que nos ayudará a entender todas las formas cuadráticas en Rn. Un poco más adelante veremos análogos de lo que hemos hecho en R, pero para espacios vectoriales sobre C.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea V=Mn(R) y definamos la función b:V×VR dada por b(A,B)=Tr(AB). Demuestra que b es una forma bilineal simétrica.
  2. Sea V=Mn(R) y definamos la función b:V×VR dada por b(A,B)=Tr(AtB). Demuestra que b es una forma bilineal simétrica.
  3. Sea V=C0[0,1] (El espacio vectorial de funciones reales continuas en el intervalo [0,1]) y q(x):VR tal que q(f)=01f(x)2dx. ¿Es q una forma cuadrática? Si sí, ¿quién es su forma polar?
  4. Sea q una forma cuadrática en V con b su forma polar. Demuestra que para cualquier pareja x,y en V se tiene que
    b(x,y)=q(x+y)q(xy)4.
  5. Sea q una forma cuadrática en V con b su polar. Demuestra que x,yV se tiene
    q(x+y)+q(xy)=2(q(x)+q(y)).
  6. ¿Por qué en esta entrada se utiliza la palabra «forma», en lugar de «función», que es normalmente utilizada? ¿Hay alguna diferencia entre una forma y una función?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal I: Teorema espectral para matrices simétricas reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada demostramos el teorema espectral para matrices simétricas reales en sus dos formas. Como recordatorio, lo que probaremos es lo siguiente.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Teorema. Sea A una matriz simétrica en Rn. Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Rn, tales que A=P1DP.

Para ello, usaremos los tres resultados auxiliares que demostramos en la entrada de eigenvalores de matrices simétricas reales. Los enunciados precisos están en ese enlace. Los resumimos aquí de manera un poco informal.

  • Los eigenvalores complejos de matrices simétricas reales son números reales.
  • Si una transformación T es simétrica y W es un subespacio estable bajo T, entonces W también lo es. Además, T restringida a W o a W también es simétrica.
  • Es lo mismo que una matriz sea diagonalizable, a que exista una base formada eigenvectores de la matriz.

Además de demostrar el teorema espectral, al final de la entrada probaremos una de sus consecuencias más importantes. Veremos una clasificación de las matrices que inducen formas bilineales positivas.

Demostración de la primera versión del teorema espectral

Comenzamos mostrando la siguiente versión del teorema espectral.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Demostración. Como V es espacio Euclideano, entonces tiene cierta dimensión finita n. Haremos inducción fuerte sobre n. Si n=1, el polinomio característico de T es de grado 1 y con coeficientes reales, así que tiene una raíz λ real. Si v es un eigenvector de T para λ, entonces vv también es eigenvector de T y conforma una base ortonormal para V.

Supongamos que el resultado es cierto para todo espacio Euclideano de dimensión menor a n y tomemos V espacio Euclideano de dimensión n. Por el teorema fundamental del álgebra, el polinomio característico de T tiene por lo menos una raíz λ en C. Como T es simétrica, cualquier matriz A que represente a T también, y λ sería una raíz del polinomio característico de A. Por el resultado que vimos en la entrada anterior, λ es real.

Consideremos el kernel W de la transformación λidT. Si W es de dimensión n, entonces W=V, y por lo tanto T(v)=λv para todo vector v en V, es decir, todo vector no cero de V es eigenvector de T. De esta forma, cualquier base ortonormal de V satisface la conclusión. De esta forma, podemos suponer que WV y que por lo tanto 1dimWn1, y como V=WW, se obtiene que 1dimWn1. Sea B una base ortonormal de W, que por lo tanto está formada por eigenvectores de T con eigenvalor λ.

Como la restricción T1 de T a W es una transformación simétrica, podemos aplicar la hipótesis inductiva y encontrar una base ortonormal B de eigenvectores de T1 (y por lo tanto de T) para W.

Usando de nuevo que V=WW, tenemos que BB es una base de V formada por eigenvectores de T.

El producto interior de dos elementos distintos de B, o de dos elementos distintos de B es cero, pues individualmente son bases ortonormales. El producto de un elemento de B y uno de B es cero pues un elemento está en W y el otro en W. Además, todos los elementos de BB tiene norma 1, pues vienen de bases ortogonales. Esto muestra que BB es una base ortonormal de V que consiste de eigenvectores de T.

◻

Demostración de la segunda versión del teorema espectral

Veamos ahora la demostración del teorema espectral en su enunciado con matrices.

Teorema. Sea A una matriz simétrica en Mn(R). Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Mn(R), tales que A=P1DP.

Demostración. Como A es una matriz simétrica, la transformación T:FnFn dada por T(X)=AX es simétrica. Aplicando la primer versión del teorema espectral, existe una base ortonormal de Fn que consiste de eigenvectores de T. Digamos que estos eigenvectores son C1,,Cn. Por definición de T, estos eigenvectores de T son exactamente eigenvectores de A.

Anteriormente demostramos que si construimos a una matriz B usando a C1,,Cn como columnas y tomamos la matriz diagonal D cuyas entradas son los eigenvalores correspondientes λ1,,λn, entonces A=BDB1.

Afirmamos que la matriz B es ortogonal. En efecto, la fila j de la matriz tB es precisamente Cj. De esta forma, la entrada (i,j) del producto tBB es precisamente el producto punto de Ci con Cj. Como la familia C1,,Cn es ortonormal, tenemos que dicho producto punto es uno si i=j y cero en otro caso. De aquí, se concluye que tBB=In.

Si una matriz es ortogonal, entonces su inversa también. Esto es sencillo de demostrar y queda como tarea moral. Así, definiendo P=B1, tenemos la igualdad A=P1DP, con D diagonal y P ortogonal, justo como lo afirma el teorema.

◻

Matrices positivas y positivas definidas

Una matriz A simétrica en Mn(R) induce una forma bilineal simétrica en Rn mediante la asignación (x,y)txAy, con forma cuadrática correspondiente xtxAx.

Definición. Una matriz A en Mn(R) es positiva o positiva definida si su forma bilineal asociada es positiva o positiva definida respectivamente.

Una de las aplicaciones del teorema espectral es que nos permite dar una clasificación de las matrices simétricas positivas.

Teorema. Sea A una matriz simétrica. Entonces todas las siguientes afirmaciones son equivalentes:

  1. A es positiva.
  2. Todos los eigenvalores de A son no negativos.
  3. A=B2 para alguna matriz simétrica B en Mn(R).
  4. A=tCC para alguna matriz C en Mn(R).

Demostración. (1) implica (2). Supongamos que A es positiva y tomemos λ un eigenvalor de A. Tomemos v un eigenvector de eigenvalor λ. Tenemos que:
λv2=λtvv=tv(λv)=tvAv0.

Como v20, debemos tener λ0.

(2) implica (3). Como A es matriz simétrica, por el teorema espectral tiene una diagonalización A=P1DP con P una matriz invertible y D una matriz diagonal cuyas entradas son los eigenvalores λ1,,λn de A. Como los eigenvalores son no negativos, podemos considerar la matriz diagonal E cuyas entradas son los reales λ1,,λn. Notemos que E2=D, así que si definimos a la matriz B=P1EP, tenemos que B2=P1E2P=P1DP=A.

Además, B es simétrica pues como E es diagonal y P es ortogonal, tenemos que
tB=tPtEt(P1)=P1EP=B.

(3) implica (4). Es inmediato, tomando C=B y usando que B es simétrica.

(4) implica (1). Si A=tCC y tomamos un vector v en Rn, tenemos que

tvAv=tvtCCv=t(Cv)(Cv)=Cv20,

lo cual muestra que A es positiva.

◻

También hay una versión de este teorema para matrices simétricas positivas definidas. Enunciarlo y demostrarlo queda como tarea moral.

En una entrada final, se verá otra consecuencia linda del teorema espectral: el teorema de descomposición polar. Dice que cualquier matriz con entradas reales se puede escribir como el producto de una matriz ortogonal y una matriz simétrica positiva.

Más allá del teorema espectral

Durante el curso introdujimos varias de las nociones fundamentales de álgebra lineal. Con ellas logramos llegar a uno de los teoremas más bellos: el teorema espectral. Sin embargo, la teoría de álgebra lineal no termina aquí. Si en tu formación matemática profundizas en el área, verás otros temas y resultados fundamentales como los siguientes:

  • El teorema de Cayley-Hamiltón: toda matriz se anula en su polinomio característico.
  • La clasificación de matrices diagonalizables: una matriz es diagonalizable si y sólo si su polinomio característico se factoriza en el campo de la matriz, y la multiplicidad algebraica de sus eigenvalores corresponde con la multiplicidad geométrica.
  • El teorema de la forma canónica de Jordan: aunque una matriz no se pueda diagonalizar, siempre puede ser llevada a una forma estándar «bonita».
  • Productos interiores con imágenes en C, a los que también se les conoce como formas hermitianas.
  • Los polinomios mínimos de matrices y transformaciones, que comparten varias propiedades con el polinomio característico, pero dan información un poco más detallada.

Más adelante…

En esta entrada discutimos dos demostraciones del teorema espectral. Sólo nos falta discutir cómo podemos aplicarlo. En la siguiente entrada trabajaremos con algunos problemas, por ejemplo, ver cómo se usa para demostrar que una matriz simétrica no es diagonalizable.

Finalmente, discutiremos cómo podemos pensar en las nociones de continuidad y acotamiento en el álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Muestra que la inversa de una matriz ortogonal es ortogonal.
  • Encuentra una base ortonormal de R3 conformada por eigenvectores de la matriz (10070307010).
  • Determina si la matriz anterior es positiva y/o positiva definida.
  • Enuncia y demuestra un teorema de clasificación de matrices simétricas positivas definidas.
  • Muestra que la matriz (51711077718) es positiva.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Producto interior y desigualdad de Cauchy-Schwarz

Por Leonardo Ignacio Martínez Sandoval

Introducción

Anteriormente, platicamos acerca de formas bilineales y de formas cuadráticas. Ahora veremos un tipo de formas bilineales especiales: las positivas y las positivas definidas. Las formas positivas definidas nos ayudan a definir qué es un producto interior. Esta es una noción fundamental que más adelante nos ayudará a definir distancias y ángulos.

Formas bilineales positivas y positivas definidas

Para hablar de geometría en espacios vectoriales, la siguiente noción es fundamental. Es importante notar que es una definición únicamente para formas bilineales simétricas.

Definición. Sea b:V×VR una forma bilineal simétrica.

  • Diremos que b es positiva si b(x,x)0 para todo vector x de V.
  • Diremos que b es positiva definida si b(x,x)>0 para todo vector x0 de v.

Tenemos una noción análoga para formas cuadráticas.

Definición. Sea q:VR una forma cuadrática con forma polar b. Diremos que q es positiva si b lo es, y diremos que es positiva definida si b lo es.

Ejemplo 1. Como ya vimos antes, el producto punto de Rn es una forma bilineal simétrica. También es positiva definida, pues si tenemos x=(x1,,xn), tenemos que xx=x12++xn20, y esta es una igualdad si y sólo si x1==xn=0, lo cual sucede si y sólo si x=0.

Ejemplo 2. Considera V=R2[x] y consideremos la forma bilineal b dada por b(p,q)=p(0)q(1)+p(1)q(0). Esta es una forma bilineal simétrica pues b(p,q)=p(0)q(1)+p(1)q(0)=q(0)p(1)+q(1)p(0)=b(q,p). Notemos que b(p,p)=2p(0)p(1), que no necesariamente es positivo. Por ejemplo, si tomamos el polinomio p(x)=x12, tenemos que b(p,p)=2p(0)p(1)=21212=12. Así, esta es una forma bilineal simétrica, pero no es positiva (y por lo tanto tampoco es positiva definida).

Problema. Considera la forma cuadrática Q en M2(R) que suma el cuadrado de las entradas de la diagonal de una matriz, es decir, aquella dada por Q(abcd)=a2+d2. Determina su forma polar y si es positiva o positiva definida.

Solución. Para encontrar la forma polar B de Q, usamos la identidad de polarización
B((abcd),(efgh))=(a+e)2+(d+h)2a2e2d2h22=2ae+2dh2=ae+dh.

Como Q(abcd)=a2+d20, tenemos que Q (y B) son positivas. Sin embargo, Q no es positiva definida (ni B), pues por ejemplo, Q(0110)=0.

Producto interior

Estamos listos para definir aquellos espacios sobre los que podemos hacer geometría.

Definición. Sea V un espacio vectorial sobre R

  • Un producto interior en V es una forma bilineal simétrica y positiva definida.
  • Decimos que V es un espacio Euclideano si es de dimensión finita y está equipado con un producto interior.

Estamos siguiendo la convención del libro de Titu Andreescu, en donde es importante pedir que V sea de dimensión finita para ser Euclideano.

Cuando estamos hablando de espacios con producto interior, o de espacios Euclideanos, tenemos una forma bilineal simétrica y positiva definida b. Sin embargo, en vez de usar constantemente b(x,y), para simplificar la notación usaremos simplemente x,y.

Definición. Si V es un espacio con producto interior ,, definimos la norma de un vector x como x=x,x.

Ejemplo. Como dijimos arriba, el producto punto en Rn es una forma bilineal simétrica, así que es un producto interior. Como Rn es de dimensión finita, entonces es un espacio Euclideano.

La norma de un vector x=(x1,,xn) está dada por x=x12++xn2, y geométricamente se interpreta como la distancia de x al origen.

Un ejemplo más concreto es R4, en donde la norma del vector (1,2,3,1) es 12+22+32+12=15.

La notación de producto interior quizás te recuerde la notación que se usa cuando hablamos de dualidad. Sin embargo, es muy importante que distingas los contextos. En el caso de dualidad, tenemos ,:V×VR, y en este contexto de producto interior tenemos ,:V×VR. Más adelante, puede que te encuentres en tu preparación matemática con el teorema de representación de Riesz, a partir del cual tendrá sentido que se use la misma notación.

Desigualdad de Cauchy-Schwarz

A continuación presentamos un resultado fundamental es espacios con formas bilineales positivas y positivas definidas.

Teorema (desigualdad de Cauchy-Schwarz). Sea b:V×VR una forma bilineal simétrica y q su forma cuadrática asociada.

  • Si b es positiva, entonces para todo x y y en V tenemos que b(x,y)2q(x)q(y). Si x y y son linealmente dependientes, se alcanza la igualdad.
  • Además, si b es positiva definida y x y y son linealmente independientes, entonces la desigualdad es estricta.

Demostración. Supongamos primero solamente que b es positiva. Consideremos la función f:RR dada por f(t)=q(x+ty). Como q es forma cuadrática positiva, tenemos que f(t)0 para todo real t. Por otro lado, expandiendo y usando que b es simétrica, tenemos que
f(t)=q(x+ty)=b(x+ty,x+ty)=b(x,x)+2b(x,y)t+b(y,y)t2=q(x)+2b(x,y)t+q(y)t2.

En esta expresión, q(x), 2b(x,y) y q(y) son reales, así que f(t) es un polinomio cuadrático en t. Como f(t)0 para todo t en R, el discriminante de este polinomio es no positivo, en otras palabras, (2b(x,y))24q(x)q(y)0.

Sumando 4q(x)q(y) y dividiendo entre 4 ambos lados de la desigualdad, obtenemos que b(x,y)2q(x)q(y), la cual es la desigualdad que queremos.

Si x y y son linealmente dependientes, podemos despejar a uno en términos del otro. Sin perder generalidad, podemos suponer que x=αy. En este caso, b(αy,y)2=α2b(y,y)=q(α(y))q(y), así que se da la igualdad.

Ahora, supongamos además que b es positiva definida y que se da la igualdad. Si esto sucede, el discriminante del polinomio cuadrático de arriba es igual a 0 y por lo tanto el polinomio tiene una raíz t. En otras palabras, q(x+ty)=0. Pero como q es positiva definida, esto implica que x+ty=0, de donde x y y son linealmente dependientes. Así, si x y y son linealmente independientes, tenemos que la desigualdad es estricta.

◻

El siguiente caso particular es uno de los más importantes y los más usados, por lo cual amerita que lo enunciemos separadamente.

Corolario. Sea V un espacio vectorial sobre R equipado con un producto interior ,. Para cualesquiera x,y en V se cumple |x,y|xy.

Puede que te preguntes por qué enfatizamos los resultados de desigualdades. En varias partes de tu formación matemática trabajarás con espacios vectoriales en donde quieres hacer cálculo. Ahí, se define la convergencia y los límites en términos de una norma. Las desigualdades que probemos para espacios vectoriales son útiles para cuando se quiere demostrar la validez de ciertos límites. Más adelante mencionaremos algunas cosas adicionales al respecto.

Más adelante…

En esta entrada definimos el concepto de producto interior y vimos cómo el producto interior induce una norma en el espacio vectorial. El concepto de norma nos permite generalizar la noción de distancia y esto nos permitirá ver cómo se puede hacer cálculo en espacios vectoriales.

En las siguientes entradas veremos cómo se define esta norma para diferentes espacios vectoriales con diferentes productos interiores. Podremos ver entonces cómo se generalizan otras nociones que ya hemos visto en cursos anteriores; como el concepto de ángulo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Considera la función q(w,x,y,z)=wx+yz. Muestra que es una forma cuadrática en R4. Encuentra su forma polar y determina si es una forma cuadrática positiva y/o positiva definida.
  • Muestra que q(w,x,y,z)=x2+y2+z2+xy+yz+zx es una forma cuadrática en R4 y determina si es positiva y/o positiva definida.
  • Considera V=C[0,1] el espacio vectorial de funciones continuas en el intervalo [0,1]. Muestra que f,g=01f(x)g(x)dx define un producto interior en V. ¿Es V un espacio Euclideano? Determina la norma de la función f(x)=x3.
  • Sea V=R2[x] el espacio vectorial de polinomios con coeficientes reales y de grado a lo más 1. Muestra que p,q=p(0)q(0)+p(1)q(1)+p(2)q(2) hace a V un espacio Euclideano.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Formas cuadráticas, propiedades, polarización y Gauss

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior hablamos acerca de formas bilineales y comenzamos a hablar de formas cuadráticas. Discutimos cómo a partir de estas nociones a la larga podremos hablar de geometría y cálculo en espacios vectoriales. El objetivo de esta entrada es entender mejor a las formas cuadráticas y su relación con formas bilineales.

Lo primero que haremos es demostrar la identidad de polarización, que a grandes rasgos dice que hay una biyección entre las formas bilineales simétricas y las formas cuadráticas. Veremos algunos ejemplos concretos de esta biyección. A partir de ella demostraremos algunas propiedades de formas cuadráticas. Finalmente, hablaremos brevemente de un bello resultado de Gauss que caracteriza las formas cuadráticas en Rn en términos de formas lineales, de las cuales discutimos mucho cuando hablamos de espacio dual.

Como pequeño recordatorio de la entrada anterior, una forma bilineal de un espacio vectorial V es una transformación b:V×VR tal que cada que fijamos una coordenada, es lineal en la otra. Esta forma es simétrica si b(x,y)=b(y,x) para cada par de vectores x,y en V. Una forma cuadrática de V es una transformación q:VR tal que q(x)=b(x,x) para alguna forma bilineal b.

Formas cuadráticas y polarización

En la entrada anterior enunciamos el siguiente teorema, que mostraremos ahora.

Teorema (identidad de polarización). Sea q:VR una forma cuadrática. Existe una única forma bilineal simétrica b:V×VR tal que q(x)=b(x,x) para todo vector x. Esta forma bilineal está determinada mediante la identidad de polarización b(x,y)=q(x+y)q(x)q(y)2.

Demostración. Tomemos una forma cuadrática q de V. Por definición, está inducida por una forma bilineal B de V, es decir, q(x)=B(x,x). Definamos la transformación b mediante b(x,y)=q(x+y)q(x)q(y)2. Comencemos probando que b es una transformación bilineal simétrica. Notemos que:
b(x,y)=q(x+y)q(x)q(y)2=B(x+y,x+y)B(x,x)B(y,y)2=B(x,x)+B(x,y)+B(y,x)+B(y,y)B(x,x)B(y,y)2=B(x,y)+B(y,x)2.

De aquí es muy claro que b es forma bilineal, pues fijando x, set tiene que b(x,y) es combinación lineal de dos formas lineales en y; y fijando y, se tiene que b(x,y) es combinación lineal de dos formas lineales en x. Además, de esta igualdad (o directo de la definición de b) es claro que b(x,y)=b(y,x).

También de esta igualdad obtenemos que b(x,x)=B(x,x)=q(x).

Para mostrar la unicidad, notemos que cualquier forma bilineal simétrica b tal que b(x,x)=q(x) debe satisfacer, como en las cuentas que hicimos arriba, que
q(x+y)=b(x+y,x+y)=q(x)+q(y)+b(x,y)+b(y,x)=q(x)+q(y)+2b(x,y).

De aquí, despejando b, se obtiene que debe tener la forma de b.

◻

El teorema anterior justifica la siguiente definición.

Definición. Dada una forma cuadrática q de V, a la única forma bilineal simétrica b de V tal que q(x)=b(x,x) le llamamos la forma polar de q.

Ejemplo 1. En el espacio vectorial Rn, la transformación q:RnR dada por q(x1,,xn)=x12++xn2. es una forma cuadrática. Su forma polar es la forma bilineal producto punto que manda a x=(x1,,xn) y y=(y1,,yn) a b(x,y)=x1y1++xnyn.

Esto coincide con la construcción dada por la identidad de polarización, ya que q(x+y)q(x)q(y)=i=1n(xi+yi)2xi2yi2=i=1nxiyi

Ejemplo 2. En el espacio vectorial R[x] de polinomios con coeficientes reales, la transformación Q dada por Q(p)=p(0)p(1)+p(2)2 es una forma cuadrática. Para encontrar a su forma bilineal polar, usamos la identidad de polarización
B(p,q)=Q(p+q)Q(p)Q(q)2=(p+q)(0)(p+q)(1)+(p+q)(2)2p(0)p(1)p(2)2q(0)q(1)q(2)22=p(0)q(1)+q(0)p(1)+2p(2)q(2)2=p(0)q(1)2+p(1)q(0)2+p(2)q(2).

Propiedades de formas cuadráticas

Si q es una forma cuadrática, x es un vector y c es un real, tenemos que q(cx)=c2q(x), pues sale una c por cada una de las coordenadas de la forma bilineal asociada. En particular, q(x)=q(x).

La identidad de polarización nos permite probar otras propiedades de formas bilineales y formas cuadráticas.

Proposición. Sea q una forma cuadrática en V con forma polar b. Entonces:

  • Para todo par de vectores x y y en V, se tiene que b(x,y)=q(x+y)q(xy)4.
  • (Ley del paralelogramo) Para todo par de vectores x y y en V, se tiene que q(x+y)+q(xy)=2(q(x)+q(y)).
  • (Teorema de Pitágoras) Para vectores x y y tales que b(x,y)=0, se tiene que q(x+y)=q(x)+q(y).
  • (Diferencia de cuadrados) Para todo par de vectores x y y en V, se tiene que b(x+y,xy)=q(x)q(y).

Demostración. Por la identidad de polarización tenemos que b(x,y)=q(x+y)q(x)q(y)2, y como q(y)=q(y), tenemos también por la identidad de polarización que b(x,y)=b(x,y)=q(xy)q(x)q(y)2.

Restando la segunda ecuación de la primera, obtenemos la primer propiedad. Sumando ambas obtenemos la ley del paralelogramo.

El teorema de Pitágoras es una consecuencia directa de la identidad de polarización.

La identidad de diferencia de cuadrados es una consecuencia de la primer propiedad aplicada a los vectores x+y y xy, y de usar que q(2x)=4q(x) y que q(2y)=4q(y).

◻

Forma de las formas cuadráticas

Otra consecuencia de la identidad de polarización es que establece una biyección entre las formas cuadráticas y las formas simétricas bilineales. Esta asociación nos permite decir cómo se ven exactamente las formas cuadráticas en espacios vectoriales de dimensión finita.

Toda forma cuadrática viene de una forma bilineal simétrica. En la entrada anterior, mencionamos que para definir una forma bilineal simétrica en un espacio vectorial V de dimensión n, basta tomar una base {e1,,en} de V y decidir los valores bij de b(ei,ej) para 1ijn. Como b es simétrica, para j<i se tendría que b(ei,ej)=b(ej,ei), es decir, que bji=bij.

De esta forma, para todo vector v en V podemos encontrar el valor de q(v) expresando v en la base {e1,,en}, digamos, v=a1e1++anen, de donde q(v)=i=1nbiiai2+21i<jnbijaiaj.

Ejemplo. Toda forma cuadrática en R3 se obtiene de elegir reales a,b,c,d,e,f y definir q(x,y,z)=ax2+by2+cz2+2dxy+2eyz+2fzx. La forma polar de q es la forma bilineal B tal que para la base canónica e1,e2,e3 de R3 hace lo siguiente

B(e1,e1)=aB(e2,e2)=bB(e3,e3)=cB(e1,e2)=B(e2,e1)=dB(e2,e3)=B(e3,e2)=eB(e3,e1)=B(e1,e3)=f.

Teorema de Gauss de formas cuadráticas (opcional)

Para esta sección, fijemos al espacio vectorial como Rn. Hay una forma muy natural de construir formas cuadráticas a partir de formas lineales. Tomemos números reales α1,,αr y formas lineales l1,,lr. Consideremos q(x)=α1l1(x)2++αrlr(x)2. Se tiene que q es una forma cuadrática. La demostración de ello es sencillo y se queda como tarea moral.

Lo que descubrió Gauss es que todas las formas cuadráticas se pueden expresar de esta forma, y de hecho, es posible hacerlo usando únicamente formas lineales que sean linealmente independientes y coeficientes 1 y 1.

Teorema (clasificación de Gauss de formas cuadráticas). Sea q una forma cuadrática en Rn. Entonces, existen enteros no negativos r y s, y formas lineares l1,,lr,m1,,ms en (Rn), todas ellas linealmente independientes, tales que q=l12++lr2m12ms2.

Hay un pequeño refinamiento de este teorema, demostrado por Sylvester.

Teorema (teorema de la inercia de Sylverster). Los números r y s en el teorema de clasificación de Gauss de formas cuadráticas son únicos.

Ejemplo. Tomemos la forma cuadrática en R3 dada por q(x,y,z)=xy+yz+zx. Por el teorema de Gauss, esta forma se debe de poder poner como combinación lineal de cuadrados de formas lineales independientes. En efecto, tenemos que: xy+yz+zx=(2x+y+z2)2(yz2)2x2, en donde
(x,y,z)2x+y+z2,(x,y,z)yz2 y (x,y,z)x
son formas lineales linealmente independientes.

Más adelante…

En esta entrada estudiamos a fondo la identidad de polarización; esto nos permitió concluir que existe una biyección entre las funciones bilineales simétricas y las formas cuadráticas. También, pusimos mucho énfasis en ejemplos concretos de esta biyección.

Con esto estamos listos para empezar a pensar en cómo haríamos geometría o cálculo en espacios vectoriales. Abordaremos estos temas al final de esta unidad. En la siguiente entrada hablaremos del producto interior.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Verifica que las formas cuadráticas de los ejemplos del teorema de polarización en efecto son formas cuadráticas.
  • Muestra que q(x,y)=3x2y2+7y no es una forma cuadrática.
  • Muestra que si α1,,αr son reales y tomamos formas lineales l1,,lr en Rn, entonces q(x)=a1l1(x)2++αrlr(x)2 es una forma cuadrática.
  • ¿Quién es la forma polar de la forma cuadrática Q(f)=01f2(x)dx en el espacio vectorial de funciones continuas en el intervalo [0,1]?

Una demostración algorítmica del teorema de Gauss se puede encontrar en la Sección 10.1 del libro de Álgebra Lineal de Titu Andreescu.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»