Archivo de la etiqueta: gram-schmidt

Álgebra Lineal II: Proceso de Gram-Schmidt en espacios euclideanos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior recordamos algunas de las aplicaciones que pueden tener las bases ortogonales y ortonormales. Esto nos da la pista de que siempre es bueno intentar conseguir una base ortonormal. ¿Es esto siempre posible? En el primer curso de Álgebra Lineal vimos que si tenemos en espacio euclideano, entonces sí. Esto está explicado a detalle en la entrada del Proceso de Gram-Schmidt.

Esta entrada está escrita únicamente en formato de recordatorio. Enunciamos los resultados principales, pero las demostraciones y más ejemplos se encuentran en otras entradas.

Teorema de Gram-Schmidt

El teorema de Gram-Schmidt asegura que dado un conjunto de vectores linealmente independientes en un espacio vectorial real con un producto interior dado, podemos encontrar otros vectores que ahora sean ortonormales, que generen lo mismo y que además «apunten hacia un lado similar» a los vectores originales. Además, asegura que estos vectores son únicos. El resultado concreto es el siguiente.

Teorema. Sea V un espacio vectorial real con producto interior ,. Sean v1,,vd vectores linealmente independientes. Entonces, existen únicos vectores ortonormales e1,,ed tales que para toda k{1,2,,d} se tiene que span(e1,,ek)=span(v1,,vk) y ek,vk>0.

Muy a grandes rasgos, esta forma de escribir el teorema permite hacer inducción en d. Al pasar a un nuevo d, podemos usar hipótesis inductiva para construir e1,,ed1. Así, sólo hay que ver cómo construir ed para que sea ortogonal a todos los anteriores y para que tenga norma 1. Para encontrar a un buen candidato, se debe poner a ed en términos de los e1,,ed1 y vd, y se debe suponer que cumple lo deseado. Al hacer algunos productos interiores esto nos dice que ed forzosamente se construye definiendo

fd=vdi=1d1vd,eiei

y tomando ed=fdfd.

En los detalles de la prueba se ve que este ed en efecto cumple todo lo deseado.

Si estamos en un espacio euclideano, entonces tenemos una base finita. Podemos usar esta en la hipótesis del teorema de Gram-Schmidt para concluir lo siguiente.

Corolario. Todo espacio euclideano tiene una base ortonormal.

Algoritmo de Gram-Schmidt

La demostración del teorema de Gram-Schmidt a su vez da un algoritmo para encontrar de manera explícita la base ortonormal buscada. Es un algoritmo que poco a poco va construyendo los vectores. Supongamos que nos dan los vectores v1,,vn.

Para empezar, normalizamos v1 para obtener e1=v1v1. De aquí en adelante procedemos recursivamente. Si ya construimos e1,,ek, entonces podemos construir ek+1 a través de la fórmula que pusimos, es decir, primero definimos

fk+1=vk+1i=1kvk+1,eiei,

para luego tomar ek+1 como la normalización de fk+1, es decir, como fk+1fk+1. Seguimos de esta manera hasta terminar.

El siguiente diagrama da una idea un poco más visual de cómo vamos haciendo las operaciones. Comenzamos con los vectores v1,,vd de la fila superior. Luego, vamos construyendo a los ei y fi en el orden indicado por las flechas: e1,f2,e2,,fd1,ed1,fd,ed. Para construir un fi usamos la fórmula con productos interiores. Para construir el ei correspondiente, normalizamos.

Intuición geométrica

Ya tenemos el lenguaje para entender mucho mejor el proceso de Gram-Schmidt. Si te das cuenta, cuando tomamos fk+1=vk+1i=1kvk+1,eiei justamente estamos aprovechando la descomposición

vk+1=(i=1kvk+1)+fk+1

de vk+1 como suma de un elemento en espacio generado por e1,,ek y uno en su ortogonal. El elemento del espacio generado lo obtenemos a través de la fórmula que sale de la descomposición de Fourier que vimos en la entrada anterior. El hecho de que fk+1 esté en el ortogonal es lo que hace que cada nuevo vector sea ortogonal a los anteriores. Al final hay que normalizar fk+1 para que la base sea ortonormal y no sólo ortogonal. Habría dos formas de hacerlo. Una es tomar fk+1fk+1. La otra es tomar fk+1fk+1. El producto escalar positivo que pedimos es lo que nos da la unicidad.

Ejemplo de aplicación del algoritmo de Gram-Schmidt

Hagamos un ejemplo muy sencillo. Será sólo de práctica y como recordatorio. Hay ejemplos más interesantes en la entrada Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt.

Es sencillo verificar que (a,b,c),(x,y,z)=4ax+3by+2cz es un producto interior en R3. Vamos a ortonormalizar la base (1,1,1), (0,1,1), (0,0,1).

En la notación del algoritmo, tenemos entonces v1=(1,1,1), v2=(0,1,1) y v3=(0,0,1). El primer paso es tomar e1=v1v1. La norma de v1 con este producto interior es 4+3+2=3. De este modo, e1=(13,13,13).

Teniendo e1, podemos definir f2 con la fórmula dada:

f2=v2v2,e1e1=(0,1,1)(4013+3113+2113)(13,13,13)=(0,1,1)53(13,13,13)=(59,49,49).

De aquí, debemos normalizar f2. Su norma es 10081+4881+3281=1809=253=1035. De este modo, e2=(56,2515,2515)

Teniendo e1 y e2, podemos definir f3 con la fórmula dada:

f3=v3v3,e1e1v3,e2e2=(0,0,1)23(13,13,13)4515(56,2515,2515)=(0,0,1)(29,29,29)(29,845,845)=(0,25,35).

De aquí, debemos normalizar f3. Su norma es 1225+1825=65=630. De este modo, e3=(0,3015,3010).

Hemos encontrado la base ortonormal buscada e1,e2,e3.

Más adelante…

Con esta entrada-recordatorio terminamos la segunda unidad del curso. A partir de ahora es importante que recuerdes que todo espacio euclideano tiene una base ortonormal. También es útil que recuerdes cómo se obtiene, así que asegúrate de practicar el proceso de Gram-Schmidt.

Todo lo que hemos mencionado tiene su análogo en espacios vectoriales sobre los complejos con un producto interior hermitiano. Asegúrate de entender las diferencias y de realizar los ejercicios que te permitirán entender los resultados correspondientes.

En la siguiente unidad desarrollaremos la teoría necesaria para poder enunciar y demostrar tanto el teorema espectral real, como el teorema espectral complejo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Haz la demostración del teorema de Gram-Schmidt a partir del esquema comentado en la entrada. En caso de que se te dificulte, revisa los detalles en la entrada de blog correspondiente.
  2. Para verificar que todo esté en orden, verifica que los vectores e1,e2,e3 del ejemplo en efecto son una base ortonormal con el producto interior dado.
  3. En el teorema de Gram-Schmidt, ¿es importante el orden en el que elijamos v1 hasta vn? ¿Cambia el conjunto resultante si cambiamos el orden? ¿Es conveniente tomar algún otro orden para simplificar las cuentas?
  4. Aplica el proceso de Gram-Schmidt a los vectores (1,1,1,1)(0,1,1,1)(0,0,1,1)(0,0,0,1) en R4 con el producto interior canónico (el producto punto).
  5. Enuncia y demuestra un teorema de Gram-Schmidt para espacios vectoriales sobre C con un producto interior hermitiano. Obtén el corolario correspondiente para los espacios hermitianos. Aplica este proceso a los vectores (1+i,1+i,1+i),(0,1+i,1+i),(0,0,1+i) de C3 con el producto hermitiano canónico para obtener una base ortonormal.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Espacios hermitianos y bases ortogonales complejas

Por Diego Ligani Rodríguez Trejo

En la entrada anterior nos dedicamos a revisar una serie de resultados relacionados con bases ortogonales, ortonormales y el proceso de Gram-Schmidt, como ya habrás notado la forma de operar de este curso indica que terminemos revisando estos conceptos aplicados a espacios vectoriales complejos, veremos rápidamente las demostraciones que sean idénticas al caso real para enfocarnos un poco más a las que tengan cambios importantes.

Como es de esperarse de la entrada final, juntaremos la gran parte de los conceptos vistos en esta unidad y los resultados vistos en las últimas dos entradas, pero ahora enfocándonos en espacios hermitianos, de los que daremos también su definición.

Bases ortonormales complejas

Definición

Sea V un espacio vectorial complejo, diremos que V es un espacio hermitiano si V es de dimensión finita y con un producto interno hermitiano ,, es decir, una forma sesquilineal hermitiana ,:V×VC tal que x,x>0 para cualquier vector x no cero.

Con esto diremos que dos vectores son ortogonales en V si x,y=0-

Las definiciones de familia y base ortogonal/ortonormal son análogas al caso real.

En adelante consideremos a V un espacio hermitiano.

Ejemplo

Si V=Cn su base canónica {e1,,en} es una base ortonormal y {2e1,,2en} es una base ortogonal. Además, con el producto interno canónico
x,y=i=1nxiyi
V es un espacio hermitiano.

Como en la entrada anterior, nuestra primera proposición será:

Proposición

Sea V, cualquier familia ortogonal (vi)iIV de vectores no cero es linealmente independiente.

Demostración

Sean {v1,,vn} y {α1,,αn} tal que
0=v=i=1nαnvn
Tomando j tal que 1jn, calculando v,vj tenemos que esto es 0 ya que v=0 además utilizando la linealidad conjugada en la primera entrada
tenemos que
0=v,vj=i=1nαivi,vj
Notemos que por la ortogonalidad vi,vj=0 excepto cuando i=j, utilizando esto
0=v,vj=αjvj,vj
Además, sabemos que vj,vj>0 por como definimos el producto interno, en particular esto implica que vj,vj0 por lo que
αj=0
Lo que implica a su vez que αj=0, repitiendo este proceso para cada αi obtendremos la independencia lineal.

◻

Más aún, si n=dim(V) y tenemos β una familia ortonormal de n vectores no nulos contenida en V esta es linealmente independiente, lo que a su vez implica que es una base de V, incluso más, como β ya era ortonormal tenemos que β es una base ortonormal.

Un par de detalles que es importante notar, este resultado no nos asegura la existencia de una base ortonormal en algún espacio, simplemente nos brinda un camino para encontrarla (encontrar un conjunto de vectores ortonormales con dim(V) elementos).

Proposición

Sea V, β={u1,,un} una base ortonormal y x=i=1nuixi, y=i=1nuiyi dos vectores en V, prueba que
x,y=i=1nxiyi.
Demostración
Calculemos directamente x,y,
x,y=i=1nxiui,y
Utilizando que , es lineal conjugada en la primera entrada
x,y=i=1nxiui,y
Haciendo un proceso análogo en la segunda entrada
x,y=i,j=1nxiyjui,uj
Ahora, utilizando la ortogonalidad, el producto ui,uj será cero excepto cuando i=j por lo que
x,y=i=1nxiyiui,ui
Finalmente, utilizando la normalidad, tenemos que ui,ui=||ui||2=1 por lo tanto
x,y=i=1nxiyi.

◻

Este último resultado es una motivación más para encontrar bases ortonormales, así enfoquémonos en esa búsqueda, siguiendo el camino del caso real, demos un análogo al teorema de Gram-Schmidt.

Proposición (Teorema de Gram-Schmidt)

Sean v1,v2,,vd vectores linealmente independientes en V un espacio vectorial complejo (no necesariamente de dimensión finita), con producto interior ,. Existe una única familia de vectores ortonormales e1,e2,,ed en V tales que para todo k=1,2,,d
span(e1,e2,,ek)=span(v1,v2,,vk).
La demostración detallada la puedes encontrar aquí (Proceso de Gram-Schmidt) por lo que no la revisaremos, algo que si vale la pena observar es que el teorema tiene dos diferencias con la versión anterior.

Primero, nuestra versión está escrita para un espacio vectorial complejo, pero para nuestra suerte la demostración anterior no requiere ninguna propiedad de los números reales que no posean los complejos, también una gran diferencia es que nuestra versión puede parecer un tanto más débil al remover que ek,vk>0 para cualquier k{1,,d}, esto sucede debido a que no podemos traspasar el mismo orden que teníamos en los reales al conjunto de los complejos que recordemos es el contradominio de ,.

Mencionando esto vale la pena preguntar, ¿Por qué cuando se definió espacio hermitiano hablamos de orden entonces? ¿Podrías dar una versión de este teorema únicamente para espacios hermitianos donde aún tengamos que ek,vk>0 para cualquier k{1,,d}?

Concluyamos esta sección con uno de los resultados más importantes y que curiosamente será nada más que un corolario.

Proposición

Todo espacio hermitiano tiene una base ortonormal.

Bases ortonormales y ortogonalidad

Empecemos revisando que si tomamos un conjunto ortonormal podemos obtener una base ortonormal a partir de este.

Proposición

Sea β una familia ortonormal del V esta puede ser completada a una base ortonormal de V.

Demostración

Ya que β es una familia ortonormal, en particular es ortogonal, esto nos asegura por la primer proposición de esta entrada que es linealmente independiente, sabemos que span(β)V (si fueran iguales entonces β ya sería una base ortonormal por lo que no sería necesario completarla) de esta manera sabemos que existe xV tal que xVspan(β) a su vez esto sucede si y solo si β1={x}β es linealmente independiente.

Nuevamente, si Vβ1= tenemos entonces que β1 ya es una base, finalmente el proceso de Gram-Schmidt nos arroja una base ortonormal β1y eligiendo a x como el último vector a ortonormalizar nos asegura que el proceso no afectará a los vectores de β ya que estos ya eran ortonormales desde el principio, con esto β1 es la completación que buscábamos.

Si en cambio tenemos que existe yVβ1 ortonormalicemos como arriba y repitamos el proceso, nombrando β2={y}β1.

Notemos que este proceso es finito, ya que lo tendremos que repetir a lo más dim(V)|β| veces, ya que al hacerlo terminaríamos encontrando un conjunto ortonormal con dim(V) vectores, lo que sabemos que es una base de V.

De esta manera, repitiendo este proceso la cantidad necesaria de veces, tenemos que βk es la completación buscada (con k=dim(V)|β|).

◻

Cabe observar que, con un par de argumentos extra (como garantizar la existencia de algún conjunto ortonormal), esta proposición sirve para probar el corolario previo.

Finalicemos con un resultado acerca de ortogonalidad.

Proposición

Sea W un subespacio de V y {w1,,wk} una base ortonormal de este entonces
WW=V.
Demostración

Comencemos tomando a {w1,,wk} que sabemos es un conjunto ortonormal, por la proposición anterior tenemos que este puede ser completado a una base ortonormal de V sea esta {w1,,wk,wn} y dada esta tenemos que para cualquier vV
v=i=1nviwi.
Por otro lado, definamos la siguiente función P:VV como sigue
P(v)=j=1kv,wjwj
Primero probemos que P(v)W para todo vV, para esto fijemos a j y veamos que pasa con v,wjwj. Por lo discutido en el párrafo anterior sabemos que v=i=1nviwi así
v,wjwj=i=1nviwi,wjwj
Utilizando la linealidad en la primer entrada tenemos que
v,wjwj=i=1nviwi,wjwj
Más aún recordar que {w1,,wk,wn} es ortonormal nos arroja que wi,wj=0 si ij y wi,wj=1 en caso contrario, por lo que
v,wjwj=vjwj
Con esto, sustituyendo en P(v)
P(v)=j=1kvjwj
Que notemos es una combinación lineal de {w1,,wk} por lo que es un elemento de W-

Continuando un poco aparte, veamos que sucede con wj,vP(v) para cualquier wj{w1,,wk} y cualquier vV
wj,vP(v)=wj,vwj,P(v)
Utilizando lo hecho arriba, tenemos que
wj,vP(v)=wj,i=1nwiviwj,j=1kwjvj
De nuevo utilizando la ortonormalidad en ambos productos concluimos que
wj,vP(v)=vjvj=0.
Por lo que vP(v) es ortogonal a cada wj{w1,,wk} lo que a su vez nos arroja que vP(v)W ya que al ser ortogonal a toto wj{w1,,wk}, entonces vP(v) es ortogonal a todo elemento de W.
Finalmente, tenemos que para cualquier vV
v=P(v)+(vP(v))
Con P(v)W y vP(v)W de donde se sigue que
V=W+W.
Más aún en entradas anteriores hemos mostrado que WW={0}.

Por lo tanto
V=WW.

◻

Más adelante

Finalmente con esta entrada concluimos la segunda unidad de nuestro curso, podemos ver que el análisis de formas bilineales y cuadráticas y sus análogos complejos, formas sesquilineales y hermitianas dio paso a una gran cantidad de teoría bastante interesante y en particular da origen a un tema sumamente importante que es el producto interno y esto a su vez nos permitió generalizar propiedades que ya teníamos esta vez a espacios vectoriales complejos.

Sin embargo, algo en lo que no abundamos fue el comportamiento de matrices adjuntas ( transpuestas conjugadas ) ni en el comportamiento de sus matrices asociadas, de esto nos encargaremos en la siguiente entrada, que a su vez es el inicio de la siguiente unidad en este curso.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Con la notación de la segunda proposición, demuestra que
    ||x||2=i=1n|xi|2.
  2. Por que al definir espacio hermitiano mencionamos x,x>0 si aunque x,xC.
  3. Escribe con todo detalle la prueba del teorema de Gram-Schmidt y el algoritmo para espacios vectoriales complejos.
  4. Sea C3 un espacio vectorial sobre C con el producto interno canónico, prueba que es un espacio hermitiano y aplica el proceso de Gram-Schmidt al conjunto {(i,0,1),(1,i,1),(0,1,i+1)}.
  5. En otra literatura podrías encontrar forma sesquilineal definida de manera que la primera entrada es lineal y la segunda debe ser lineal conjugada, ¿Esto afecta los resultados obtenidos en esta unidad? ¿Podrías desarrollar la misma teoría utilizando esta definición alterna?

Entradas relacionadas

Álgebra Lineal I: Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt

Por Blanca Radillo

Introducción

Durante las últimas clases hemos visto problemas y teoremas que nos demuestran que las bases ortogonales son extremadamente útiles en la práctica, ya que podemos calcular fácilmente varias propiedades una vez que tengamos a nuestra disposición una base ortogonal del espacio que nos interesa. Veamos más problemas de bases ortogonales y otros resultados que nos permitirán reforzar estas ideas.

Problemas resueltos de bases ortogonales y proyecciones

Para continuar con este tema, veremos que las bases ortogonales nos permiten encontrar de manera sencilla la proyección de un vector sobre un subespacio. Primero, recordemos que si V=WW2, para todo vV podemos definir su proyección en W, que denotamos πW(v), como el único elemento en W tal que vπW(v)W2.

Debido a las discusiones sobre bases ortogonales, no es difícil ver que si w,u=0 para todo wW, entonces uW2. Como consecuencia de esto, tenemos el siguiente resultado:

Teorema. Sea V un espacio vectorial sobre R con producto interior ,, y sea W un subespacio de V de dimensión finita. Sea v1,,vn una base ortogonal de W. Entonces para todo vV tenemos que

πW(v)=i=1nv,vivi2vi.

Demostración. Escribimos v como v=πW(v)+u con uW2. Por la observación previa al teorema, u,vi=0 para todo i. Además existen a1,,an tales que πW(v)=a1v1++anvn. Entonces

0=u,vi=v,viπW(v),vi=v,vij=1najvj,vi=v,viaivi,vi,

porque v1,,vn es una base ortogonal. Por lo tanto, para todo i, obtenemos

ai=v,vivi2.

◻

Distancia de un vector a un subespacio y desigualdad de Bessel

En la clase de ayer, vimos la definición de distancia entre dos vectores. También se puede definir la distancia entre un vector y un subconjunto como la distancia entre el vector y el vector «más cercano» del subconjunto, en símbolos:

d(v,W)=minxWxv.

Dado que xW, xπW(v)W, y por definición de proyección vπW(v)W2, entonces

xv2=(xπW(v))+(πW(v)v)2=xπW(v)2+2xπW(v),πW(v)v+πW(v)v2=xπW(v)2+πW(v)v2πW(v)v2.

Y dado que la proyección pertenece a W, la desigualdad anterior muestra que la proyección es precisamente el vector en W con el que v alcanza la distancia a W. En conclusión, d(v,W)=πW(v)v.

Teorema. Sea V un espacio vectorial sobre R con producto interior ,, y sea W un subespacio de V de dimensión finita. Sea v1,,vn una base ortonormal de W. Entonces para todo vV tenemos que

πW(v)=i=1nv,vivi,

y

d(v,W)2=vi=1nv,vivi2=v2i=1nv,vi2.

En particular

i=1nv,vi2v2.

A esta última desigualdad se le conoce como desigualdad de Bessel.

Demostración. Por el teorema anterior y dado que v1,,vn es una base ortonormal, obtenemos la primera ecuación. Ahora, por Pitágoras,

d(v,W)2=vπW(v)2=v2πW(v)2.

Por otro lado, tenemos que

πW(v)2=i=1nv,vivi2=i,j=1nv,vivi,v,vjvj=i,j=1nv,viv,vjvi,vj=i=1nv,vi2.

Por lo tanto, se cumple la igualdad de la distancia. Finalmente como d(v,W)20, inmediatamente tenemos la desigualdad de Bessel.

◻

Veamos ahora dos problemas más en los que usamos la teoría de bases ortonormales.

Aplicación del proceso de Gram-Schmidt

Primero, veremos un ejemplo más del uso del proceso de Gram-Schmidt.

Problema. Consideremos V como el espacio vectorial de polinomios en [0,1] de grado a lo más 2, con producto interior definido por p,q=01xp(x)q(x)dx.

Aplica el algoritmo de Gram-Schmidt a los vectores 1,x,x2.

Solución. Es fácil ver que ese sí es un producto interior en V (tarea moral). Nombremos v1=1,v2=x,v3=x2. Entonces

e1=v1v1=2v1=2,

ya que v12=01xdx=12.

Sea z2=v2v2,e1e1. Calculando, v2,e1=012x2dx=23. Entonces z2=x232=x23. Esto implica que

e2=z2z2=6(x23)=6x4.

Finalmente, sea z3=v3v3,e1e1v3,e2e2. Haciendo los cálculos obtenemos que

z3=x2(24)2(15)(6x4)

z3=x265x+310.

Por lo tanto

e3=z3z3=106(x265x+310).

El teorema de Plancherel y una fórmula con π

Finalmente, en este ejemplo, usaremos técnicas de la descomposición de Fourier para solucionar un problema bonito de series.

Problema. Consideremos la función 2πperiódica f:RR definida como f(0)=f(π)=0, f(x)=1xπ en el intervalo (π,0), y f(x)=1xπ en el intervalo (0,π).

Problemas de bases ortogonales: Aplicando el teorema de Plancherel para una fórmula que involucra a pi.
Gráfica de la función f.

Usa el teorema de Plancherel para deducir las identidades de Euler

n=11n2=π26,n=01(2n+1)2=π28.

Solución. Notemos que no sólo es 2πperiódica, también es una función impar, es decir, f(x)=f(x). Por lo visto en la clase del miércoles pasado tenemos que calcular

a0(f)=1πππf(x)dx,

ak(f)=1πππf(x)cos(kx)dx,

bk(f)=1πππf(x)sen(kx)dx.

Para no hacer más larga esta entrada, la obtención de los coeficientes de Fourier se los dejaremos como un buen ejercicio de cálculo. Para hacer las integrales hay que separar la integral en cada uno de los intervalos [π,0] y [0,π] y en cada uno de ellos usar integración por partes.

El resultado es que para todo k1, a0=0,ak=0,bk=2kπ.

Entonces por el teorema de Plancherel,

k=14k2π2=1πππf2(x)dx=1π(π0(1+xπ)2dx+0π(1xπ)2dx)=23,

teniendo que k=11k2=23π24=π26.

Ahora para obtener la otra identidad de Euler, notemos que

n=01(2n+1)2=n=11n2n=11(2n)2=π26π246=π28.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Proceso de Gram-Schmidt

Por Blanca Radillo

Introducción

Durante esta semana hemos introducido el concepto de bases ortogonales y ortonormales, así como algunas propiedades especiales. Para poder aplicar los resultados que hemos visto, es necesario insistir en que las bases sean de este tipo (ortonormales). Ahora veremos cómo encontrar bases ortonormales usando algo llamado el proceso de Gram-Schmidt.

Recordando todos los problemas anteriores de este curso, decíamos que una base es un conjunto de vectores linealmente independientes y que el número de vectores coincide con la dimensión del espacio. Pero hasta este momento no nos interesó determinar si las bases eran ortonormales o no. Si nos pusiéramos a ver si lo eran, es probable que muy pocas lo sean. Entonces surgen dos preguntas, ¿será difícil encontrar una base ortonormal de un espacio vectorial? y ¿habrá alguna manera de construir una base ortonormal?

Proceso de Gram-Schmidt

La respuesta a la primera pregunta es «no, no es difícil», y justo la respuesta de la segunda pregunta es la justificación. Dada una base cualquiera del espacio vectorial, podemos construir una base ortonormal de ese mismo espacio gracias al siguiente teorema.

Teorema (Gram-Schmidt). Sean v1,v2,,vd vectores linealmente independientes en un espacio vectorial V sobre R (no necesariamente de dimensión finita), con producto interior ,. Entonces existe una única familia de vectores ortonormales e1,e2,,ed en V con la propiedad de que para todo k=1,2,,d, tenemos que

span(e1,e2,,ek)=span(v1,v2,,vk),yek,vk>0.

Demostración. Lo haremos por inducción sobre d, la cantidad de vectores con la que empezamos.

La base inductiva es cuando d=1. Tomamos un vector e1span(v1), entonces podemos escribirlo como e1=λv1 para cierta λ. Si queremos que 0<e1,v1=λv12, entonces λ>0. Además queremos que e1 tenga norma igual a 1, entonces 1=e12=e1,e1=λ2v12, lo cual es posible si λ=1v1. Como e1 es un múltiplo escalar de v1, se tiene que span(e1)=span(v1). Además, la construcción forzó a que e1=1v1v1 sea el único vector que satisface las condiciones del teorema.

Hagamos ahora el paso inductivo. Tomemos un entero d2, y supongamos que el teorema es cierto para d1. Sean v1,v2,,vd vectores en V linelmente independientes. Por hipótesis, sabemos que existe una única familia de vectores ortonormales e1,,ed1 que satisfacen las condiciones del teorema respecto a la familia v1,,vd1. Es suficiente con probar que existe un único vector ed tal que e1,,ed satisface el teorema con respecto a v1,,vd, esto es
ed=1,ed,ei=01id1,ed,vd>0,

y

span(e1,,ed)=span(v1,,vd),

ya que, por hipótesis, los casos de k<d se cumplen.

La idea para construir ed es tomarlo de span(v1,,vd), expresarlo como combinación lineal de estos y encontrar condiciones necesarias y suficientes sobre los coeficientes de ed para que satisfaga las conclusiones del teorema. Hagamos esto.

Sea ed un vector tal que edspan(v1,,vd). Por ser linealmente independientes y por hipótesis span(v1,,vd)=span(e1,,ed1)+span(vd), entonces podemos escribir ed como

ed=λvd+i=1d1aiei

para algunos λ,a1,,ad1. Si resulta que λ0, esto también implicará que span(e1,,ed)=span(v1,,vd).

Ahora, dado que ed debe formar una familia ortonormal con el resto de los vectores, para todo j=1,,d1, tenemos que


0=ed,ej=λvd,ej+i=1d1aiei,ej=λvd,ej+aj,

entonces aj=λvd,ej. Si logramos mostrar que hay un único λ con el que se pueda satisfacer la conclusión del teorema, el argumento anterior muestra que también hay únicos a1,,ad1 y por lo tanto que hay un único vector ed que satisface el teorema.

Sustituyendo los coeficientes anteriores, obtenemos que

ed=λ(vdi=1d1vd,eiei).

Notemos que si z:=vdi=1d1vd,eiei es cero, vd estaría en span(e1,,ed1)=span(v1,,vd1), contradiciendo que los vectores vi’s son linealmente independientes, entonces z0.

Ahora como queremos que 1=ed=|λ|z, esto implica que |λ|=1z.

Como además queremos que ed,vd>0 y

ed,vd=ed,edλ+i=1d1vd,eiei=1λ,

se deduce que λ es único y está determinado por λ=1z. Por lo tanto existe (y es único) el vector ed que satisface el teorema.

◻

Este proceso de construcción es mejor conocido como el proceso de Gram-Schmidt. La demostración da a la vez un algoritmo que nos permite encontrar bases ortogonales (y de hecho ortonormales). Veremos ejemplos de esto en la siguiente sección. Antes de eso, enunciaremos formalmente una de las conclusiones más importantes del teorema anterior.

Recuerda que un espacio Euclideano es un espacio vectorial de dimensión finita sobre R y con un producto interior. Podemos aplicar el proceso de Gram-Schmidt a cualquier base v1,,vd de un espacio Euclideano V y al final obtendremos una familia e1,,ed de vectores ortonormales. Como sabemos que las familias de vectores ortonormales son linealmente independientes, y tenemos d vectores, concluimos que e1,,ed es una base ortonormal. En resumen, tenemos el siguiente resultado.

Corolario. Todo espacio Euclideano tiene una base ortonormal.

Ejemplos de aplicación del proceso de Gram-Schmidt

A continuación veremos algunos ejemplos que nos ayuden a clarificar más este algoritmo.

Ejemplo 1. Sean v1,v2,v3 vectores en R3 (con el producto interior estándar) definidos por

v1=(1,1,0),v2=(1,1,1),v3=(1,0,1).

Es fácil ver que estos vectores son linealmente independientes. Entonces construyamos según el proceso de Gram-Schmidt la familia ortonormal de vectores e1,e2,e3. Tenemos que

e1=v1v1=v12=(12,12,0).

Ahora, tomando z2=v2v2,e1e1, tenemos que e2 está definido como z2z2, entonces

z2=(1,1,1)[(1,1,1)(12,12,0)](12,12,0)=(1,1,1)[22](12,12,0)=(1,1,1)(2/2,2/2,0)=(1,1,1)(1,1,0)=(0,0,1).

Esto implica que e2=11(0,0,1)=(0,0,1). Finalmente tomando z3=v3v3,e1e1v3,e2e2, sabemos que e3=z3z3. Entonces

z3=v3v3,e1e1v3,e2e2=(1,0,1)(12,12,0)(0,0,1)=(12,12,0).

Por lo tanto

e3=11/2(12,12,0)=(12,12,0).

Ejemplo 2. Sea V el espacio de polinomios en [0,1] con coeficientes reales de grado a lo más 2, con el producto interior

p,q=01p(x)q(x)dx.

Sean v1=1, v2=1+x, v3=1+x2 vectores en V que claramente son linealmente independientes. Encontraremos los vectores que nos da el proceso de Gram-Schmidt.

Primero calculemos

v12=011dx=1,

entonces e1=v1v1=v1=1. Ahora calculemos z2:

z2=v2v2,e1e1=1+x01(1+x)dx=1+x(1+12)=x12.

Haciendo la integral 01(x12)2dx se obtiene que z2=112, entonces e2=12(x12).

Por último, hay que calcular z3 así como su norma. Primero,

z3=v3v3,e1e1v3,e2e2=(1+x2)01(1+x2)dx12(x12)01(1+x2)(x12)dx=1+x2(1+13)12(x12)(112)=x213x+12=x2x+16,

y luego, con la integral 01(x2x+16)2dx se calcula que z3=165, por lo tanto e3=65(x2x+16).

Aunque no es un proceso muy eficiente, nos garantiza que podemos encontrar una base ortonormal para cualquier espacio vectorial (con producto interior). Ya con una base ortonormal, podemos usar la descomposición de Fourier de la cual hablamos la entrada anterior y con ella todas las consecuencias que tiene.

Si quieres ver muchos más ejemplos del proceso en Rn, puedes usar una herramienta en línea que te permite ver el proceso paso a paso en el conjunto de vectores que tu elijas. Una posible página es el Gram-Schmid Calculator de eMathHelp.

Más adelante…

En esta última entrada teórica de la unidad 3, vimos el método de Gram-Schmidt para construir una base ortonormal, que es un proceso algorítmico que parte de tener una base de un espacio y al final calcula una base ortonormal. También se vieron algunos ejemplos de la aplicación de este proceso para espacios vectoriales finitos como R3 y el espacio de polinomios en [0,1] de grado a lo más 2. Aunque no es una manera muy eficaz para encontrar una base ortonormal, sí te garantiza que lo que construye es una.

En la próxima entrada veremos ejercicios resueltos de los temas que hemos estado estudiando a lo largo de esta semana. 

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Verifica que con el valor λ que se encontró en la demostración del teorema de Gram-Schmidt en efecto se obtiene un vector ed que satisface todas las conclusiones que se desean.
  • Revisa que los vectores que se obtuvieron en los ejemplos de aplicación del proceso de Gram-Schmidt en efecto son bases ortogonales de los espacios correspondientes.
  • Aplica el proceso de Gram-Schmidt a los polinomios 1, x, x2 en el espacio Euclideano de los polinomios reales de grado a lo más dos y producto interior p,q=p(0)q(0)+p(1)q(1)+p(2)q(2).
  • Aplica el proceso de Gram-Schmidt a los vectores (1,1,1,1)(0,1,1,1)(0,0,1,1)(0,0,0,1) de R4 con el producto interior canónico (el producto punto).
  • Usa el Gram-Schmidt Calculator de eMathHelp para ver paso a paso cómo se aplica el proceso de Gram-Schmidt a los vectores (1,2,1,1,1)(0,0,1,0,0)(2,0,0,1,1)(0,2,0,0,1)(3,0,0,1,0) de R5.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»