Archivo de la etiqueta: base ortonormal

Álgebra Lineal II: Espacios hermitianos y bases ortogonales complejas

Por Diego Ligani Rodríguez Trejo

En la entrada anterior nos dedicamos a revisar una serie de resultados relacionados con bases ortogonales, ortonormales y el proceso de Gram-Schmidt, como ya habrás notado la forma de operar de este curso indica que terminemos revisando estos conceptos aplicados a espacios vectoriales complejos, veremos rápidamente las demostraciones que sean idénticas al caso real para enfocarnos un poco más a las que tengan cambios importantes.

Como es de esperarse de la entrada final, juntaremos la gran parte de los conceptos vistos en esta unidad y los resultados vistos en las últimas dos entradas, pero ahora enfocándonos en espacios hermitianos, de los que daremos también su definición.

Bases ortonormales complejas

Definición

Sea V un espacio vectorial complejo, diremos que V es un espacio hermitiano si V es de dimensión finita y con un producto interno hermitiano ,, es decir, una forma sesquilineal hermitiana ,:V×VC tal que x,x>0 para cualquier vector x no cero.

Con esto diremos que dos vectores son ortogonales en V si x,y=0-

Las definiciones de familia y base ortogonal/ortonormal son análogas al caso real.

En adelante consideremos a V un espacio hermitiano.

Ejemplo

Si V=Cn su base canónica {e1,,en} es una base ortonormal y {2e1,,2en} es una base ortogonal. Además, con el producto interno canónico
x,y=i=1nxiyi
V es un espacio hermitiano.

Como en la entrada anterior, nuestra primera proposición será:

Proposición

Sea V, cualquier familia ortogonal (vi)iIV de vectores no cero es linealmente independiente.

Demostración

Sean {v1,,vn} y {α1,,αn} tal que
0=v=i=1nαnvn
Tomando j tal que 1jn, calculando v,vj tenemos que esto es 0 ya que v=0 además utilizando la linealidad conjugada en la primera entrada
tenemos que
0=v,vj=i=1nαivi,vj
Notemos que por la ortogonalidad vi,vj=0 excepto cuando i=j, utilizando esto
0=v,vj=αjvj,vj
Además, sabemos que vj,vj>0 por como definimos el producto interno, en particular esto implica que vj,vj0 por lo que
αj=0
Lo que implica a su vez que αj=0, repitiendo este proceso para cada αi obtendremos la independencia lineal.

◻

Más aún, si n=dim(V) y tenemos β una familia ortonormal de n vectores no nulos contenida en V esta es linealmente independiente, lo que a su vez implica que es una base de V, incluso más, como β ya era ortonormal tenemos que β es una base ortonormal.

Un par de detalles que es importante notar, este resultado no nos asegura la existencia de una base ortonormal en algún espacio, simplemente nos brinda un camino para encontrarla (encontrar un conjunto de vectores ortonormales con dim(V) elementos).

Proposición

Sea V, β={u1,,un} una base ortonormal y x=i=1nuixi, y=i=1nuiyi dos vectores en V, prueba que
x,y=i=1nxiyi.
Demostración
Calculemos directamente x,y,
x,y=i=1nxiui,y
Utilizando que , es lineal conjugada en la primera entrada
x,y=i=1nxiui,y
Haciendo un proceso análogo en la segunda entrada
x,y=i,j=1nxiyjui,uj
Ahora, utilizando la ortogonalidad, el producto ui,uj será cero excepto cuando i=j por lo que
x,y=i=1nxiyiui,ui
Finalmente, utilizando la normalidad, tenemos que ui,ui=||ui||2=1 por lo tanto
x,y=i=1nxiyi.

◻

Este último resultado es una motivación más para encontrar bases ortonormales, así enfoquémonos en esa búsqueda, siguiendo el camino del caso real, demos un análogo al teorema de Gram-Schmidt.

Proposición (Teorema de Gram-Schmidt)

Sean v1,v2,,vd vectores linealmente independientes en V un espacio vectorial complejo (no necesariamente de dimensión finita), con producto interior ,. Existe una única familia de vectores ortonormales e1,e2,,ed en V tales que para todo k=1,2,,d
span(e1,e2,,ek)=span(v1,v2,,vk).
La demostración detallada la puedes encontrar aquí (Proceso de Gram-Schmidt) por lo que no la revisaremos, algo que si vale la pena observar es que el teorema tiene dos diferencias con la versión anterior.

Primero, nuestra versión está escrita para un espacio vectorial complejo, pero para nuestra suerte la demostración anterior no requiere ninguna propiedad de los números reales que no posean los complejos, también una gran diferencia es que nuestra versión puede parecer un tanto más débil al remover que ek,vk>0 para cualquier k{1,,d}, esto sucede debido a que no podemos traspasar el mismo orden que teníamos en los reales al conjunto de los complejos que recordemos es el contradominio de ,.

Mencionando esto vale la pena preguntar, ¿Por qué cuando se definió espacio hermitiano hablamos de orden entonces? ¿Podrías dar una versión de este teorema únicamente para espacios hermitianos donde aún tengamos que ek,vk>0 para cualquier k{1,,d}?

Concluyamos esta sección con uno de los resultados más importantes y que curiosamente será nada más que un corolario.

Proposición

Todo espacio hermitiano tiene una base ortonormal.

Bases ortonormales y ortogonalidad

Empecemos revisando que si tomamos un conjunto ortonormal podemos obtener una base ortonormal a partir de este.

Proposición

Sea β una familia ortonormal del V esta puede ser completada a una base ortonormal de V.

Demostración

Ya que β es una familia ortonormal, en particular es ortogonal, esto nos asegura por la primer proposición de esta entrada que es linealmente independiente, sabemos que span(β)V (si fueran iguales entonces β ya sería una base ortonormal por lo que no sería necesario completarla) de esta manera sabemos que existe xV tal que xVspan(β) a su vez esto sucede si y solo si β1={x}β es linealmente independiente.

Nuevamente, si Vβ1= tenemos entonces que β1 ya es una base, finalmente el proceso de Gram-Schmidt nos arroja una base ortonormal β1y eligiendo a x como el último vector a ortonormalizar nos asegura que el proceso no afectará a los vectores de β ya que estos ya eran ortonormales desde el principio, con esto β1 es la completación que buscábamos.

Si en cambio tenemos que existe yVβ1 ortonormalicemos como arriba y repitamos el proceso, nombrando β2={y}β1.

Notemos que este proceso es finito, ya que lo tendremos que repetir a lo más dim(V)|β| veces, ya que al hacerlo terminaríamos encontrando un conjunto ortonormal con dim(V) vectores, lo que sabemos que es una base de V.

De esta manera, repitiendo este proceso la cantidad necesaria de veces, tenemos que βk es la completación buscada (con k=dim(V)|β|).

◻

Cabe observar que, con un par de argumentos extra (como garantizar la existencia de algún conjunto ortonormal), esta proposición sirve para probar el corolario previo.

Finalicemos con un resultado acerca de ortogonalidad.

Proposición

Sea W un subespacio de V y {w1,,wk} una base ortonormal de este entonces
WW=V.
Demostración

Comencemos tomando a {w1,,wk} que sabemos es un conjunto ortonormal, por la proposición anterior tenemos que este puede ser completado a una base ortonormal de V sea esta {w1,,wk,wn} y dada esta tenemos que para cualquier vV
v=i=1nviwi.
Por otro lado, definamos la siguiente función P:VV como sigue
P(v)=j=1kv,wjwj
Primero probemos que P(v)W para todo vV, para esto fijemos a j y veamos que pasa con v,wjwj. Por lo discutido en el párrafo anterior sabemos que v=i=1nviwi así
v,wjwj=i=1nviwi,wjwj
Utilizando la linealidad en la primer entrada tenemos que
v,wjwj=i=1nviwi,wjwj
Más aún recordar que {w1,,wk,wn} es ortonormal nos arroja que wi,wj=0 si ij y wi,wj=1 en caso contrario, por lo que
v,wjwj=vjwj
Con esto, sustituyendo en P(v)
P(v)=j=1kvjwj
Que notemos es una combinación lineal de {w1,,wk} por lo que es un elemento de W-

Continuando un poco aparte, veamos que sucede con wj,vP(v) para cualquier wj{w1,,wk} y cualquier vV
wj,vP(v)=wj,vwj,P(v)
Utilizando lo hecho arriba, tenemos que
wj,vP(v)=wj,i=1nwiviwj,j=1kwjvj
De nuevo utilizando la ortonormalidad en ambos productos concluimos que
wj,vP(v)=vjvj=0.
Por lo que vP(v) es ortogonal a cada wj{w1,,wk} lo que a su vez nos arroja que vP(v)W ya que al ser ortogonal a toto wj{w1,,wk}, entonces vP(v) es ortogonal a todo elemento de W.
Finalmente, tenemos que para cualquier vV
v=P(v)+(vP(v))
Con P(v)W y vP(v)W de donde se sigue que
V=W+W.
Más aún en entradas anteriores hemos mostrado que WW={0}.

Por lo tanto
V=WW.

◻

Más adelante

Finalmente con esta entrada concluimos la segunda unidad de nuestro curso, podemos ver que el análisis de formas bilineales y cuadráticas y sus análogos complejos, formas sesquilineales y hermitianas dio paso a una gran cantidad de teoría bastante interesante y en particular da origen a un tema sumamente importante que es el producto interno y esto a su vez nos permitió generalizar propiedades que ya teníamos esta vez a espacios vectoriales complejos.

Sin embargo, algo en lo que no abundamos fue el comportamiento de matrices adjuntas ( transpuestas conjugadas ) ni en el comportamiento de sus matrices asociadas, de esto nos encargaremos en la siguiente entrada, que a su vez es el inicio de la siguiente unidad en este curso.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Con la notación de la segunda proposición, demuestra que
    ||x||2=i=1n|xi|2.
  2. Por que al definir espacio hermitiano mencionamos x,x>0 si aunque x,xC.
  3. Escribe con todo detalle la prueba del teorema de Gram-Schmidt y el algoritmo para espacios vectoriales complejos.
  4. Sea C3 un espacio vectorial sobre C con el producto interno canónico, prueba que es un espacio hermitiano y aplica el proceso de Gram-Schmidt al conjunto {(i,0,1),(1,i,1),(0,1,i+1)}.
  5. En otra literatura podrías encontrar forma sesquilineal definida de manera que la primera entrada es lineal y la segunda debe ser lineal conjugada, ¿Esto afecta los resultados obtenidos en esta unidad? ¿Podrías desarrollar la misma teoría utilizando esta definición alterna?

Entradas relacionadas

Álgebra Lineal I: Bases ortogonales

Por Leonardo Ignacio Martínez Sandoval

Introducción

Como ya discutimos en las entradas anteriores, si tenemos un espacio vectorial V con producto interior, entonces podemos definir varias nociones geométricas en V, como ángulos, norma y distancia. Ahora vamos a definir una noción muy útil en álgebra lineal: la de bases ortogonales. Para ello, combinaremos las nociones de bases y producto interior.

Las bases ortogonales no sólo tienen aplicaciones en álgebra lineal. También son el punto de partida de muchos conceptos matemáticos avanzados. Un primer ejemplo es el análisis de Fourier, que estudia cómo aproximar funciones mediante funciones trigonométricas y que tiene aplicaciones en el mundo real en análisis de señales. Otro ejemplo es la vasta teoría de polinomios ortogonales, con aplicaciones en el mundo real en aproximación e integración numérica.

En estas entradas de bases ortogonales tomaremos espacios vectoriales sobre R con un producto interior ,.

Conjuntos ortogonales y ortonormales

Comenzamos con la siguiente definición. Recuerda que V es un espacio vectorial sobre R con producto interior, así que induce una norma .

Definición. Sea S un conjunto de vectores en V. Decimos que S es

  • Ortogonal si cualquier par de vectores distintos de S es ortogonal, es decir, si para todo v,w en S, con vw se tiene que v,w=0.
  • Ortonormal si es ortogonal, y además todo vector de S tiene norma 1.

En otras palabras, S es ortonormal si para todo v en S se tiene v,v=1 y para v y w en S distintos se tiene v,w=0.

Ejemplo. Si tomamos a Rn con el producto punto, entonces la base canónica es un conjunto ortonormal pues, en efecto, eiei=1 y para ij se tiene eiej=0.

Todo conjunto de un sólo elemento es ortogonal, pues no hay nada que probar. Otro conjunto ortonormal en R2 es el conjunto que sólo tiene al vector (35,45), pues este es un vector de norma 1.

Los vectores (1,1,0), (1,1,0) y (0,0,1) forman otro conjunto ortogonal en R3, pues en efecto
(1,1,0)(1,1,0)=11=0(1,1,0)(0,0,1)=0(0,0,1)(1,1,0)=0.

Sin embargo, este no es un conjunto ortonormal, pues la norma de (1,1,0) es 21. Si normalizamos a cada vector, es decir, si lo dividimos entre su norma, entonces obtenemos los vectores ortonormales (1/2,1/2,0), (1/2,1/2,0) y (0,0,1).

Propiedades de conjuntos ortogonales y ortonormales

Todo conjunto ortogonal de vectores no nulos se puede normalizar como en el ejemplo de la sección anterior para obtener un conjunto ortonormal. Es decir, si S es un conjunto de vectores distintos de 0, entonces S={vv:vS} es un conjunto ortonormal.

Una propiedad fundamental de los conjuntos ortonormales de vectores es que son linealmente independientes. Se puede probar algo un poco más general.

Proposición. Si S es un conjunto ortogonal de vectores no nulos, entonces los elementos de V son linealmente independientes.

Demostración. Tomemos v1,,vn elementos de S y supongamos que existen α1,,αn escalares tales que v:=i=1nαivi=0.

Tomemos un índice j en 1,,n y hagamos el producto interior v,vj. Por un lado, como v=0, este produto es 0. Por otro lado, por linealidad es i=1nαivi,vj.

Cuando ij, el sumando correspondiente es igual a 0. De este modo, el único sumando no cero es cuando i=j, el cual es αjvj,vj. De estos argumentos, deducimos que αjvj,vj=0. Como los vectores son no nulos, se tiene que vj,vj0. Así, αj=0 para todo j=1,,n, lo cual muestra que los vectores son linealmente independientes.

◻

Como cada elemento de un conjunto ortonormal tiene norma 1, entonces no puede ser nulo, así que como corolario de la proposición anterior, todo conjunto ortonormal es linealmente independiente. Otro corolario es el siguiente.

Corolario. En un espacio Euclideano de dimensión d, los conjuntos ortogonales sin vectores nulos tienen a lo más d elementos.

Bases ortogonales y ortonormales

Cuando una base de un espacio vectorial es ortogonal (o bien, ortonormal), pasan varias cosas buenas. Esto amerita una definición por separado.

Definición. Sea S un conjunto de vectores en V. Decimos que S es

  • Una base ortogonal si S es una base de V y es un conjunto ortogonal.
  • Una base ortonormal si S una base de V y es un conjunto ortonormal.

Ejemplo. En Rn la base canónica es una base ortonormal.

En R2 el conjunto S={(2,3),(9,6)} es un conjunto ortogonal. Además, se puede verificar fácilmente que son dos vectores linealmente independientes. De este modo, S es una base ortogonal.

Sin embargo, S no es una base ortonormal pues el primero de ellos tiene norma 22+32=13. Si quisiéramos convertir a S en una base ortonormal, podemos normalizar a cada uno de sus elementos.

En la sección anterior vimos que los conjuntos ortonormales son linealmente independientes. Otro corolario de este resultado es lo siguiente.

Corolario. En un espacio Euclideano de dimensión n, un conjunto ortonormal de n vectores es una base ortonormal.

La importancia de las bases ortogonales yace en que dada una base ortonormal B y un vector v, podemos encontrar varias propiedades de v en términos de B fácilmente. Por ejemplo, veremos más adelante que:

  • Las coordenadas de v con respecto a la base B son sencillas.
  • Hay una fórmula simple para la norma de v en términos de sus coordenadas en la base B.
  • Si B es una base de un subespacio W de V, entonces es fácil encontrar la distancia de v a W.

Mejor aún, las bases ortonormales siempre existen.

Teorema. Todo espacio Euclideano tiene una base ortonormal.

Es decir, sin importar qué espacio vectorial real de dimensión finita tomemos, y sin importar qué producto punto le pongamos, podemos dar una base ortogonal. De hecho, veremos un resultado un poco más fuerte, que nos dará un procedimiento para encontrar dicha base, incluso imponiendo restricciones adicionales.

Ejemplo de bases ortogonales en polinomios

Ejemplo. Tomemos Rn[x] el espacio de polinomios de grado a lo más n con coeficientes reales. Además, tomemos números reales distintos x0,,xn. A partir de estos reales podemos definir la operación P,Q=j=0nP(xj)Q(xj), la cual es claramente bilineal y simétrica.

Tenemos que P,P es una suma de cuadrados, y por lo tanto es no negativa. Además, si P,P=0, es porque j=0nP(xj)2=0, y como estamos trabajando en R esto implica que cada sumando debe ser cero. Pero las igualdades P(x0)==P(xn)=0 dicen que los n+1 reales distintos xi son raíces de P, y como P es de grado a lo más n, tenemos que P es el polinomio 0. En resumen, , es un producto interior en Rn[x]. Vamos a dar una base ortogonal con respecto a este producto interior.

Para i=0,,n, consideremos los polinomios Li(x)=0kn,kixxkxixk. Observa que Lj(xj)=1 y si ji, tenemos Li(xj)=0. Afirmamos que B={Lj:j=0,,n+1} es una base ortonormal de Rn[x] con el producto interior que definimos. Como consiste de n+1 polinomios y dim(Rn[x])=n+1, basta con que veamos que es un conjunto ortonormal.

Primero, notemos que
Li,Li=j=0nLi(xj)2=Li(xi)2=1,

de modo que cada Li tiene norma 1.

Luego, notemos que si ij, entonces Li(xk)Lj(xk)=0 pues xk no puede ser simultáneamente xi y xj. De este modo,

Li,Lj=k=0nLi(xk)Lj(xk)=0.

Con esto mostramos que cada par de polinomios distintos es ortogonal. Esto termina la demostración de que B es base ortonormal.

◻

Ejemplo de conjuntos ortogonales en funciones periódicas

Ejemplo. Consideremos V el conjunto de funciones f:RR continuas y periódicas de periodo 2π. Definimos f,g=ππf(x)g(x)dx. Se puede mostrar que , así definido es un producto interior en V.

Para cada entero positivo n, definimos
Cn(x)=cos(nx)πSn(x)=sin(nx)π.

Además, definimos C0(x)=12π. Afirmamos que F:={Cn:n0}{Sn:n1} es un conjunto ortonormal de vectores. Mostremos esto.

Para empezar, notamos que C02=ππ12πdx=1.

Luego, tenemos que para n1 que
Cn2=ππ1πcos2(nx)dx=ππ1+cos(2nx)2πdx=1,

ya que para todo entero m0 se tiene que ππcos(mx)dx=0. De manera similar, usando la identidad sin2(nx)=1cos(nx)2, se puede ver que la norma de Sn es 1.

Para ver que las parejas de elementos distintas son ortogonales, tenemos varios casos. Si tomamos n1, el resultado para C0,Cn ó C0,Sn se deduce de que
ππcos(mx)dx=ππsin(mx)dx=0 para todo entero m0.

Si tomamos dos Ci’s distintos, dos Sis distintos o un Ci y un Si, el resultado se deduce de las fórmulas «producto a suma» de las funciones trigonométricas.

◻

Más adelante…

En esta entrada combinamos las nociones de bases y el producto interior, estudiadas en entradas anteriores, para definir a las bases ortogonales. Vimos algunas propiedades de conjuntos ortogonales y ortonormales, para extenderlos a bases ortogonales y ortonormales. Vimos unos ejemplos de bases ortogonales de los polinomios y otros ejemplos de conjuntos ortogonales en funciones periódicas.

En la siguiente entrada veremos aplicaciones de estos conceptos, culminando en una descomposición de Fourier.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra un conjunto ortogonal de vectores en R4 tal que ninguna de las entradas de ninguno de sus vectores sea igual a 0.
  • Escribe las demostraciones de los corolarios enunciados en esta entrada.
  • Muestra que , definido en el ejemplo de funciones periódicas es un producto interior.
  • Termina de mostrar que la familia F del ejemplo de funciones periódicas es ortonormal. Sugerencia: Usa identidades de suma y resta de ángulos para poner el producto de senos (o cosenos o mixto) como una suma de senos y/o cosenos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»