Archivo de la etiqueta: bases ortonormales

Álgebra Lineal II: Aplicaciones de bases ortogonales en espacios euclideanos

Por Diego Ligani Rodríguez Trejo

Introducción

Cerraremos la tercera unidad con dos entradas relacionadas con tener bases ortogonales y cómo encontrar estas bases. En realidad estos temas ya se vieron en el primer curso de Álgebra Lineal, así que estas entradas más bien estarán escritas como recordatorios de esa teoría.

Las entradas correspondientes en el primer curso de Álgebra Lineal son las siguientes: Bases ortogonales, Bases ortogonales y descomposición de Fourier, Proceso de Gram-Schmidt y Problemas de bases ortogonales y proceso de Gram-Schmidt.

Familias ortogonales y ortonormales

En esta entrada $V$ es un espacio vectorial real con producto interior $\langle \cdot, \cdot \rangle$ y norma asociada $\norm{\cdot}$.

Definición. Una familia de vectores $(v_i)_{i \in I} \subseteq V$ es ortogonal si
para cualesquiera $i,j$ en $I$ se tiene que $$\langle v_i,v_j \rangle =0.$$ Aquí $I$ es un conjunto de índices cualquiera.

Definición. Diremos que una $(v_i)_{i \in I}$ es ortonormal si es ortogonal y además cada vector tiene norma $1$.

Definición. Una base ortogonal (resp. base ortonormal) es una base del espacio vectorial que además sea ortogonal (resp. ortonormal).

A partir de una familia de vectores $(v_i)_{i\in I}$ cualquiera podemos obtener una familia en donde todos los vectores tienen norma $1$. Basta con reemplazar $v_i$ por $\frac{v_i}{\norm{v_i})$ para todo $i\in I$. Además, es fácil verificar que esto preserva el espacio generado por la familia.

Lo que no es tan sencillo, y recordaremos más adelante, es ver que a partir de cualquier familia de vectores podemos encontrar otra que sea ortogonal y que genere el mismo espacio. Esto está relacionado con el proceso de Gram-Schmidt, que repasaremos en la siguiente entrada. Por el momento, nos enfocaremos a recordar algunas de las ventajas de contar con familias o bases ortogonales/ortonormales.

Independencia lineal de familias ortogonales

La siguiente proposición está demostrada a detalle en la entrada de Bases ortogonales.

Proposición. Sea $V$ un espacio euclideano con producto interior $\langle \cdot, \cdot \rangle$. Cualquier familia ortogonal $(v_i)_{i \in I} \subseteq V$ con respecto a $\langle \cdot, \cdot \rangle$ y sin vectores cero es linealmente independiente.

La idea de la demostración es sencilla. Si tenemos una combinación lineal $$\sum_{i\in I} \alpha_i v_i=0,$$ entonces hacemos producto interior por cada $v_i$. Tras esto, como la familia es ortogonal, el único elemento que queda es $\alpha_i\langle v_i, v_i\rangle$ y está igualado a cero. Por ser producto interior, $\langle v_i, v_i\rangle\neq 0$, así que $\alpha_i=0$.

Como consecuencia, obtenemos de manera inmediata lo siguiente.

Corolario. Sea $V$ un espacio euclideano de dimensión $n$ con producto interior $\langle \cdot, \cdot \rangle$. Cualquier familia ortogonal $(v_i)_{i \in I} \subseteq V$ con respecto a $\langle \cdot, \cdot \rangle$ y sin vectores cero tiene a lo más $n$ elementos.

Esto es una consecuencia directa de que la dimensión de un espacio vectorial de dimensión finita limita la cantidad de elementos en un conjunto linealmente independiente, lo cual a su vez era consecuencia del lema de Steinitz.

Leer las coordenadas en una base ortonormal

Cuando tenemos una base ortogonal (u ortonormal), es muy sencillo saber quiénes son las coordenadas de un vector dada una base.

Proposición. Sea $V$ un espacio euclidiano de dimensión $n$ y $\beta=\{u_1, \cdots , u_n\}$ una base ortogonal. Para todo $v$ en $V$ tenemos que

\begin{align*}
v&=\sum_{i=1}^n \frac{\langle v,u_i\rangle}{\langle u_i,u_i\rangle} u_i\\
&=\sum_{i=1}^n \frac{\langle v,u_i\rangle}{\norm{u_i}^2} u_i.
\end{align*}

En otras palabras, «la coordenada correspondiente a $u_i$ se obtiene haciendo producto interior con $u_i$ y dividiendo entre el cuadrado de la norma de $u_i$». La demostración completa la puedes encontrar en la entrada de Aplicaciones de bases ortogonales y descomposición de Fourier, pero puedes redescubrirla fácilmente. Basta escribir a $v$ como combinación lineal de los elementos de $\beta$ y aplicar producto punto por cada uno de ellos. De ahí casi todos los términos se eliminan y del que no se puede obtener la coordenada correspondiente.

Cuando la base es ortonormal, las normas de cada $u_i$ son $1$ y entonces obtenemos lo siguiente.

Corolario. Sea $V$ un espacio euclidiano de dimensión $n$ y $\beta=\{u_1, \cdots , u_n\}$ una base ortonormal. Para todo $v$ en $V$ tenemos que

\begin{align*}
v&=\sum_{i=1}^n \langle v,u_i\rangle u_i.
\end{align*}

Tenemos ahora un poco más de vocabulario para decir esto mismo. La proposición anterior es equivalente a decir que:

La base dual de una base ortonormal $u_1,\ldots,u_n$ son las formas lineales $\langle \cdot, u_1\rangle, \ldots, \langle \cdot, u_n\rangle$.
Cada elemento de una base ortonormal es la representación de Riesz de su elemento respectivo en la base dual.

Esta forma de determinar las coordenadas es tan importante que a veces tiene sentido obtenerla aunque el espacio vectorial que tengamos sea de dimensión infinita.

Descomposición y series de Fourier

Dada una base $u_1,\ldots,u_n$ de un espacio euclideano, la expresión

\begin{align*}
v&=\sum_{i=1}^n \langle v,u_i\rangle u_i.
\end{align*}

es muy importante, y se le conoce como la descomposición de Fourier de $v$ con respecto a $\beta$. En los espacios euclideanos tenemos la igualdad entre ambos lados. Sin embargo, esta expresión también aparece en muchos otros contextos en donde no necesariamente tenemos dimensión finita, y en donde el vector $v$ al que le buscamos su «descomposición» no necesariamente está en el espacio que queremos.

En la entrada Aplicaciones de bases ortogonales y descomposición de Fourier vemos un ejemplo de esto, en donde discutimos cómo se pueden usar los polinomios trigonométricos para aproximar una función.

Descomposición de Fourier, norma y proyecciones

Como consecuencia de la expresión $v=\sum_{i=1}^n \langle v,u_i\rangle u_i$ se obtiene de manera inmediata la norma de un vector.

Proposición. Si $v=\sum_{i=1}^n \langle v,u_i\rangle u_i$ para una base ortonormal $u_1,\ldots,u_n$, entonces $\norm{x}^2=\sum_{i=1}^n \langle v,u_i\rangle^2$.

También, es muy sencillo encontrar la proyección ortogonal de un vector conociendo una base ortonormal del subespacio a donde proyectamos ortogonalmente.

Proposición. Sea $V$ un espacio euclideano y $W$ un subespacio. Sea $u_1,\ldots,u_r$ una base ortonormal de $W$. Entonces para todo vector $v\in V$ se tiene que $$p_W(v)=\sum_{i=1}^r \langle v, u_i \rangle u_i.$$

Desigualdad de Bessel

Las aplicaciones de las bases ortogonales pueden extenderse bastante. Como ejemplo final, enunciamos la desigualdad de Bessel.

Proposición (desigualdad de Bessel). Sea $V$ un espacio euclideano y $u_1,\ldots,u_r$ un conjunto ortonormal de vectores. Entonces $$\sum_{i=1}^r \langle v, v_i \rangle ^2\leq \norm{v}^2$$ para todo $v$ en $V$.

La demostración igualmente está en la entrada Problemas de bases ortogonales, Fourier y procesos de Gram-Schmidt. La idea clave es considerar a $W$ el espacio generado por $u_1,\ldots,u_r$ y calcular $d(v,W)$ usando la fórmula de proyección de la sección anterior, y el resultado de distancia de la entrada anterior.

Más adelante…

En esta entrada repasamos algunas de las aplicaciones que pueden tener las bases ortogonales y ortonormales de un espacio vectorial $V$ con producto interior. En la siguiente entrada recordaremos un resultado crucial: si $V$ es de dimensión finita entonce siempre tiene una base ortonormal.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

Intenta reconstruir todas las demostraciones completas de cada uno de los resultados aquí vistos. En caso de tener dificultades, revisa las demostraciones en las entradas correspondientes.
Las matrices en $M_n(\mathbb{R})$ tienen un producto interior dado por $\langle A,B\rangle=\text{traza}(\text{ }^tAB)$. Encuentra una base ortogonal para este producto interior. Da la descomposición de Fourier con respecto a esta base. Encuentra una base ortogonal para el subespacio de matrices simétricas. ¿Qué diría la desigualdad de Bessen en este caso?
Encuentra en términos del producto punto de $\mathbb{R}^n$ cómo es la matriz de cambio de base de una base ortogonal $\beta$ de $\mathbb{R}^n$ a otra base ortogonal $\beta’$.
Sea $V=\mathbb{R}_2[x]$ el espacio de polinomios reales de grado a lo más $2$. Definimos la función $\langle \cdot,\cdot \rangle: V\times V\to\mathbb{R}$ como sigue: $$\langle p,q\rangle = p(-1)q(-1)+p(0)q(0)+p(1)q(1).$$ Demuestra que $\langle \cdot, \cdot \rangle$ así definida es un producto interior. Encuentra una base ortonormal para este producto interior.
En espacios hermitianos también tiene sentido definir conjuntos de vectores (o bases) ortogonales y ortonormales. Demuestra los análogos a todos los resultados de esta entrada para el caso complejo.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Ortogonalidad en espacios euclideanos
Siguiente entrada del curso: Proceso de Gram-Schmidt en espacios euclideanos

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Transformaciones normales, simétricas y antisimétricas

Por Ayax Calderón

5 respuestas

Introducción

A partir de la noción de adjunción que definimos en la entrada anterior, es posible definir ciertos tipos especiales de transformaciones lineales: las transformaciones normales, las simétricas y las antisimétricas.

Primero veremos las transformaciones lineales simétricas y antisimétricas. Estos nombres quizás te recuerden a las matrices simétricas y antisimétricas. Existe una relación importante entre ambos conceptos, aunque no es tan directo enunciarla. Veremos esto con calma.

Después, hablaremos de las transformaciones normales. Este tipo de transformaciones están motivadas por la pregunta de qué sucede cuando una transformación conmuta con su adjunta. Definiremos esto de manera adecuada y demostraremos algunas propiedades que cumplen las transformaciones normales.

En esta entrada $V$ es un espacio euclidiano. En particular, estaremos trabajando únicamente en espacios vectoriales sobre los reales. Más adelante discutiremos los análogos complejos de los resultados que veremos.

Transformaciones simétricas y antisimétricas

Comencemos con las siguientes dos definiciones.

Definición. Sea $V$ un espacio euclideano con producto interior $\langle \cdot, \cdot \rangle$. Sea $T:V\to V$ una transformación lineal. Diremos que $T$ es:

Simétrica o auto-adjunta si $T^*=T$.
Antisimétrica o alternante si $T^*=-T$.

Tal vez estos nombres te parezcan familiares. El siguiente problema nos ayudará a explicar la relación entre las transformaciones simétricas y las matrices que llevan el mismo nombre.

Problema. Sea $V$ un espacio euclideano con producto interior $\langle \cdot, \cdot \rangle$. Sea $T:V\to V$ una transformación lineal simétrica. Sea $A$ la forma matricial de $T$ en alguna base ortonormal de $T$. Demuestra que $A$ es una matriz simétrica.

Solución. Por una proposición de la entrada anterior, por elegir una base ortonormal se tiene que la matriz correspondiente a $T^\ast$ es $^t A$. Pero como $T$ es una matriz simétrica, se tiene que $T^\ast=T$. De este modo, $^t A= A$, y por lo tanto $A$ es una matriz simétrica.

$\square$

Sucede algo análogo con las matrices antisimétricas, lo cual queda como tarea moral.

Transformaciones normales

Introduzcamos una definición más.

Definición. Sea $V$ un espacio euclidiano y $T:V\to V$ una transformación lineal. Diremos que $T$ es normal si $T$ conmuta con su transformación adjunta, es decir, si $$TT^*=T^*T.$$

Similarmente, diremos que una matriz $A\in M_n(\mathbb{R})$ es normal si $$A{}^tA={}^tAA.$$

Ejemplo. La matriz $\begin{pmatrix} 1 & -3 \\ 3 & 1 \end{pmatrix}$ es normal. En efecto, puedes verificar que:

$$\begin{pmatrix} 1 & -3 \\ 3 & 1 \end{pmatrix}\begin{pmatrix} 1 & 3 \\ -3 & 1 \end{pmatrix} = \begin{pmatrix} 10 & 0 \\ 0 & 10 \end{pmatrix} = \begin{pmatrix} 1 & 3 \\ -3 & 1 \end{pmatrix}\begin{pmatrix} 1 & -3 \\ 3 & 1 \end{pmatrix}.$$

$\triangle$

Las definiciones de transformaciones y matrices normales están conectadas mediante el siguiente resultado sencillo de demostrar.

Proposición. Si $T:V\to V$ es una transformación es normal con $V$ espacio euclideano y tomamos una base ortonormal $\beta$ de $V$, entonces $\text{Mat}_\beta(T)$ es normal.

Caracterización geométrica de transformaciones normales

Las matrices normales tienen algunas propiedades geométricas que las caracterizan. El siguiente enunciado formaliza esto.

Problema. Sea $T$ una transformación lineal sobre un espacio euclidiano $V$. Demuestra que los siguientes incisos son equivalentes:

$||T(x)||=||T^*(x)||$ para todo $x\in V$.
$\langle T(x),T(y)\rangle=\langle T^*(x),T^*(y) \rangle$.
$T$ es normal.

Solución. $(1)\Rightarrow (2)$. Supongamos $(1)$. Usando la identidad de polarización dos veces y la linealidad de $T$ y $T^*$ obtenemos
\begin{align*}
\langle T(x),T(y) \rangle &=\frac{||T(x+y)||^2-||T(x)||^2-||T(y)||^2}{2}\\
&=\frac{||T(x+y)^*||^2-||T(x)^*||^2-||T(y)^*||^2}{2}\\
&=\langle T(x)^*,T(y)^* \rangle.
\end{align*} lo cual prueba $(2)$.

$(2)\Rightarrow (3)$. Supongamos ahora $(2)$. Entonces para cualesquiera $x,y\in V$ se tiene que
\begin{align*}
\langle (T\circ T^* – T^*\circ T)(x), y \rangle &=\langle T(T^*(x)),y\rangle- \langle T^*(T(x)) ,y\rangle \\
&=\langle T^*(x),T^*(y) \rangle – \langle y,T^*(T(x))\rangle\\
&=\langle T(x),T(y) \rangle – \langle T(y),T(x)\rangle\\
&=0.
\end{align*}
Como la igualdad anterior se da para todo $y$, en particular se cumple, por ejemplo, para los $y$ de una base. Así, $(T\circ T^*-T^*\circ T)(x)=0$ para cualquier $x\in V$, lo que precisamente significa que $T\circ T^*= T^*\circ T$, es decir, que $T$ es normal.

$(3)\Rightarrow (1)$. Finalmente, supongamos $(3)$. Entonces
\begin{align*}
||T(x)||^2&=\langle T(x),T(x)\rangle\\
&=\langle x,T^*(T(x))\rangle \\
&= \langle T(T^*(x)),x \rangle\\
&=\langle T^*(x),T^*(x) \rangle \\
&= ||T^*(x)||^2,
\end{align*}
y por lo tanto $||T(x)||=||T^*(x)||$ para todo $x\in V$, lo que prueba $(1)$.

$\square$

Más adelante…

Por la proposición que enunciamos para transformaciones normales, tenemos que si $T$ es de este tipo, entonces $||T(x)||=||T^*(x)||$. Esto es una propiedad geométrica, pues está relacionando dos normas. Sin embargo, una cosa que nos interesa mucho estudiar es cuándo sucede algo parecido: $||T(x)||=||x||$. Esto lo que nos estaría diciendo es que «$T$ preserva las normas». En la siguiente entrada motivaremos y exploraremos este tipo de transformaciones lineales, a las que llamaremos ortogonales.

Tarea moral

Demuestra que la forma matricial de una transformación antisimétrica, bajo una base ortonormal, es una matriz antisimétrica.
Demuestra que cualquier transformación lineal $T$ en un espacio euclideano puede ser escrita de la forma $T=S+A$, donde $S$ es transformación lineal simétrica y $A$ es transformación lineal antisimétrica. Demuestra que esta manera de escribir a $T$ es única.
Hemos platicado mucho de qué sucede cuando representamos transformaciones lineales en un espacio euclideano $V$ mediante bases ortonormales. Pero, ¿qué pasa si no hacemos esto? Determina si lo siguiente es verdadero o falso cuando elegimos una base $\beta$ de $V$ que no sea ortonormal.
- Si $A$ es la matriz de una transformación $T$ en la base $\beta$, entonces $^tA$ es la matriz de $T^\ast$ en la base $\beta$.
- Si $T$ es simétrica, entonces su matriz $A$ en la base $\beta$ es simétrica.
- Si $T$ es normal, entonces su matriz $A$ en la base $\beta$ es normal.
Sea $T:\mathbb{R}^2\to \mathbb{R}^2$ un rotación de ángulo $\theta\in(0,\pi)$. La representación matricial de $T$ en la base canónica está dada por
$$\begin{pmatrix}
\cos\theta &-\sin\theta\\
\sin\theta &\cos\theta
\end{pmatrix}.$$
Verifica que $T$ es normal.
Sea $V$ un espacio euclidiano y $T:V\to V$ una transformación lineal normal. Prueba que $T-c\text{id}$ es normal para todo real $c$.

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Adjunta de una transformación lineal
Siguiente entrada del curso: Isometrías reales, transformaciones ortogonales y sus propiedades

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal I: Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt

Por Blanca Radillo

2 respuestas

Introducción

Durante las últimas clases hemos visto problemas y teoremas que nos demuestran que las bases ortogonales son extremadamente útiles en la práctica, ya que podemos calcular fácilmente varias propiedades una vez que tengamos a nuestra disposición una base ortogonal del espacio que nos interesa. Veamos más problemas de bases ortogonales y otros resultados que nos permitirán reforzar estas ideas.

Problemas resueltos de bases ortogonales y proyecciones

Para continuar con este tema, veremos que las bases ortogonales nos permiten encontrar de manera sencilla la proyección de un vector sobre un subespacio. Primero, recordemos que si $V=W\oplus W_2$, para todo $v\in V$ podemos definir su proyección en $W$, que denotamos $\pi_W(v)$, como el único elemento en $W$ tal que $v-\pi_W(v) \in W_2$.

Debido a las discusiones sobre bases ortogonales, no es difícil ver que si $\langle w,u \rangle =0$ para todo $w\in W$, entonces $u\in W_2$. Como consecuencia de esto, tenemos el siguiente resultado:

Teorema. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior $\langle \cdot , \cdot \rangle$, y sea $W$ un subespacio de $V$ de dimensión finita. Sea $v_1,\cdots,v_n$ una base ortogonal de $W$. Entonces para todo $v\in V$ tenemos que

$\pi_W(v)=\sum_{i=1}^n \frac{\langle v,v_i \rangle}{\norm{v_i}^2} v_i .$

Demostración. Escribimos $v$ como $v=\pi_W(v)+u$ con $u\in W_2$. Por la observación previa al teorema, $\langle u,v_i \rangle =0$ para todo $i$. Además existen $a_1,\cdots,a_n$ tales que $\pi_W(v)=a_1 v_1+\cdots+a_n v_n$. Entonces

\begin{align*}
0 &= \langle u,v_i \rangle =\langle v,v_i \rangle – \langle \pi_W(v),v_i \rangle \\
&= \langle v,v_i \rangle – \sum_{j=1}^n a_j \langle v_j,v_i \rangle \\
&= \langle v,v_i \rangle – a_i \langle v_i,v_i \rangle,
\end{align*}

porque $v_1,\cdots,v_n$ es una base ortogonal. Por lo tanto, para todo $i$, obtenemos

$a_i=\frac{\langle v,v_i \rangle}{\norm{v_i}^2}.$

$\square$

Distancia de un vector a un subespacio y desigualdad de Bessel

En la clase de ayer, vimos la definición de distancia entre dos vectores. También se puede definir la distancia entre un vector y un subconjunto como la distancia entre el vector y el vector «más cercano» del subconjunto, en símbolos:

$d(v,W)=\min_{x\in W} \norm{x-v}.$

Dado que $x\in W$, $x-\pi_W(v) \in W$, y por definición de proyección $v-\pi_W(v) \in W_2$, entonces

\begin{align*}
\norm{x-v}^2 &=\norm{(x-\pi_W(v))+(\pi_W(v)-v)}^2 \\
&= \norm{x-\pi_W(v)}^2+2\langle x-\pi_W(v),\pi_W(v)-v \rangle+\norm{\pi_W(v)-v}^2 \\
&= \norm{x-\pi_W(v)}^2+\norm{\pi_W(v)-v}^2\\
&\geq \norm{\pi_W(v)-v}^2.
\end{align*}

Y dado que la proyección pertenece a $W$, la desigualdad anterior muestra que la proyección es precisamente el vector en $W$ con el que $v$ alcanza la distancia a $W$. En conclusión, $$d(v,W)=\norm{\pi_W(v)-v}.$$

Teorema. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior $\langle \cdot , \cdot \rangle$, y sea $W$ un subespacio de $V$ de dimensión finita. Sea $v_1,\ldots,v_n$ una base ortonormal de $W$. Entonces para todo $v\in V$ tenemos que

$\pi_W(v)=\sum_{i=1}^n \langle v,v_i \rangle v_i,$

\begin{align*}
d(v,W)^2&=\norm{v-\sum_{i=1}^n \langle v,v_i \rangle v_i }^2\\
&=\norm{v}^2-\sum_{i=1}^n \langle v,v_i \rangle^2.
\end{align*}

En particular

$\sum_{i=1}^n \langle v,v_i \rangle^2\leq \norm{v}^2.$

A esta última desigualdad se le conoce como desigualdad de Bessel.

Demostración. Por el teorema anterior y dado que $v_1,\cdots,v_n$ es una base ortonormal, obtenemos la primera ecuación. Ahora, por Pitágoras,

$d(v,W)^2=\norm{v-\pi_W(v)}^2=\norm{v}^2-\norm{\pi_W(v)}^2.$

Por otro lado, tenemos que

\begin{align*}
\norm{\pi_W(v)}^2 &=\norm{\sum_{i=1}^n \langle v,v_i \rangle v_i}^2 \\
&= \sum_{i,j=1}^n \langle \langle v,v_i \rangle v_i, \langle v,v_j \rangle v_j \rangle \\
&= \sum_{i,j=1}^n \langle v,v_i \rangle \langle v,v_j \rangle \langle v_i,v_j \rangle \\
&=\sum_{i=1}^n \langle v,v_i \rangle^2.
\end{align*}

Por lo tanto, se cumple la igualdad de la distancia. Finalmente como $d(v,W)^2 \geq 0$, inmediatamente tenemos la desigualdad de Bessel.

$\square$

Veamos ahora dos problemas más en los que usamos la teoría de bases ortonormales.

Aplicación del proceso de Gram-Schmidt

Primero, veremos un ejemplo más del uso del proceso de Gram-Schmidt.

Problema. Consideremos $V$ como el espacio vectorial de polinomios en $[0,1]$ de grado a lo más $2$, con producto interior definido por $$\langle p,q \rangle =\int_0^1 xp(x)q(x) dx.$$

Aplica el algoritmo de Gram-Schmidt a los vectores $1,x,x^2$.

Solución. Es fácil ver que ese sí es un producto interior en $V$ (tarea moral). Nombremos $v_1=1, v_2=x, v_3=x^2$. Entonces

$$e_1=\frac{v_1}{\norm{v_1}}=\sqrt{2}v_1=\sqrt{2},$$

ya que $$\norm{v_1}^2=\int_0^1 x \, dx=\frac{1}{2}.$$

Sea $z_2=v_2-\langle v_2,e_1 \rangle e_1$. Calculando, $$\langle v_2,e_1 \rangle=\int_0^1 \sqrt{2}x^2 dx=\frac{\sqrt{2}}{3}.$$ Entonces $z_2=x-\frac{\sqrt{2}}{3}\sqrt{2}=x-\frac{2}{3}.$ Esto implica que

$e_2=\frac{z_2}{\norm{z_2}}=6\left(x-\frac{2}{3}\right)=6x-4.$

Finalmente, sea $z_3=v_3-\langle v_3,e_1\rangle e_1 -\langle v_3,e_2 \rangle e_2$. Haciendo los cálculos obtenemos que

$z_3=x^2-\left(\frac{\sqrt{2}}{4}\right)\sqrt{2}-\left(\frac{1}{5}\right)(6x-4)$

$z_3=x^2-\frac{6}{5}x+\frac{3}{10}.$

Por lo tanto

$e_3=\frac{z_3}{\norm{z_3}}=10\sqrt{6}(x^2-\frac{6}{5}x+\frac{3}{10}).$

$\triangle$

El teorema de Plancherel y una fórmula con $\pi$

Finalmente, en este ejemplo, usaremos técnicas de la descomposición de Fourier para solucionar un problema bonito de series.

Problema. Consideremos la función $2\pi-$periódica $f:\mathbb{R}\rightarrow \mathbb{R}$ definida como $f(0)=f(\pi)=0,$ $f(x)=-1-\frac{x}{\pi}$ en el intervalo $(-\pi,0)$, y $f(x)=1-\frac{x}{\pi}$ en el intervalo $(0,\pi)$.

Problemas de bases ortogonales: Aplicando el teorema de Plancherel para una fórmula que involucra a pi. — Gráfica de la función $f$.

Usa el teorema de Plancherel para deducir las identidades de Euler

\begin{align*}
\sum_{n=1}^\infty \frac{1}{n^2} &= \frac{\pi^2}{6},\\
\sum_{n=0}^\infty \frac{1}{(2n+1)^2} & = \frac{\pi^2}{8}.
\end{align*}

Solución. Notemos que no sólo es $2\pi-$periódica, también es una función impar, es decir, $f(-x)=-f(x)$. Por lo visto en la clase del miércoles pasado tenemos que calcular

$a_0(f)=\frac{1}{\pi} \int_{-\pi}^{\pi} f(x) dx,$

$a_k(f)=\frac{1}{\pi} \int_{-\pi}^{\pi} f(x) cos(kx) dx,$

$b_k(f)=\frac{1}{\pi} \int_{-\pi}^{\pi} f(x)sen(kx) dx.$

Para no hacer más larga esta entrada, la obtención de los coeficientes de Fourier se los dejaremos como un buen ejercicio de cálculo. Para hacer las integrales hay que separar la integral en cada uno de los intervalos $[-\pi,0]$ y $[0,\pi]$ y en cada uno de ellos usar integración por partes.

El resultado es que para todo $k\geq 1$, $$a_0=0, a_k=0, b_k=\frac{2}{k\pi}.$$

Entonces por el teorema de Plancherel,

\begin{align*}
\sum_{k=1}^\infty \frac{4}{k^2\pi^2} &=\frac{1}{\pi} \int_{-\pi}^{\pi} f^2(x) dx \\
&= \frac{1}{\pi} \left( \int_{-\pi}^0 \left(1+\frac{x}{\pi}\right)^2 dx + \int_0^\pi \left(1-\frac{x}{\pi}\right)^2 dx \right) \\
&= \frac{2}{3},
\end{align*}

teniendo que $$\sum_{k=1}^\infty \frac{1}{k^2} =\frac{2}{3}\frac{\pi^2}{4}=\frac{\pi^2}{6}.$$

Ahora para obtener la otra identidad de Euler, notemos que

\begin{align*}
\sum_{n=0}^\infty \frac{1}{(2n+1)^2} &= \sum_{n=1}^\infty \frac{1}{n^2} – \sum_{n=1}^\infty \frac{1}{(2n)^2} \\
&= \frac{\pi^2}{6}-\frac{\pi^2}{4\cdot6}= \frac{\pi^2}{8}.
\end{align*}

$\triangle$

Entradas relacionadas

Ir a Álgebra Lineal I
Entrada anterior del curso: Proceso de Gram-Schmidt
Siguiente entrada del curso: Transformaciones multilineales

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Proceso de Gram-Schmidt

Por Blanca Radillo

4 respuestas

Introducción

Durante esta semana hemos introducido el concepto de bases ortogonales y ortonormales, así como algunas propiedades especiales. Para poder aplicar los resultados que hemos visto, es necesario insistir en que las bases sean de este tipo (ortonormales). Ahora veremos cómo encontrar bases ortonormales usando algo llamado el proceso de Gram-Schmidt.

Recordando todos los problemas anteriores de este curso, decíamos que una base es un conjunto de vectores linealmente independientes y que el número de vectores coincide con la dimensión del espacio. Pero hasta este momento no nos interesó determinar si las bases eran ortonormales o no. Si nos pusiéramos a ver si lo eran, es probable que muy pocas lo sean. Entonces surgen dos preguntas, ¿será difícil encontrar una base ortonormal de un espacio vectorial? y ¿habrá alguna manera de construir una base ortonormal?

Proceso de Gram-Schmidt

La respuesta a la primera pregunta es «no, no es difícil», y justo la respuesta de la segunda pregunta es la justificación. Dada una base cualquiera del espacio vectorial, podemos construir una base ortonormal de ese mismo espacio gracias al siguiente teorema.

Teorema (Gram-Schmidt). Sean $v_1,v_2,\cdots,v_d$ vectores linealmente independientes en un espacio vectorial $V$ sobre $\mathbb{R}$ (no necesariamente de dimensión finita), con producto interior $\langle \cdot , \cdot \rangle$. Entonces existe una única familia de vectores ortonormales $e_1,e_2,\ldots,e_d$ en $V$ con la propiedad de que para todo $k=1,2,\ldots,d$, tenemos que

\begin{align*}
\text{span}(e_1,e_2,\cdots,e_k)&=\text{span}(v_1,v_2,\cdots,v_k), \quad \text{y} \quad\\
\langle e_k,v_k \rangle&>0.
\end{align*}

Demostración. Lo haremos por inducción sobre $d$, la cantidad de vectores con la que empezamos.

La base inductiva es cuando $d=1$. Tomamos un vector $e_1\in \text{span}(v_1)$, entonces podemos escribirlo como $e_1=\lambda v_1$ para cierta $\lambda$. Si queremos que $0<\langle e_1,v_1 \rangle=\lambda\norm{v_1}^2$, entonces $\lambda>0$. Además queremos que $e_1$ tenga norma igual a 1, entonces $$1=\norm{e_1}^2=\langle e_1,e_1 \rangle=\lambda^2\norm{v_1}^2,$$ lo cual es posible si $\lambda=\frac{1}{\norm{v_1}}$. Como $e_1$ es un múltiplo escalar de $v_1$, se tiene que $\text{span}(e_1)=\text{span}(v_1)$. Además, la construcción forzó a que $e_1=\frac{1}{\norm{v_1}} v_1$ sea el único vector que satisface las condiciones del teorema.

Hagamos ahora el paso inductivo. Tomemos un entero $d\geq 2$, y supongamos que el teorema es cierto para $d-1$. Sean $v_1,v_2,\cdots,v_d$ vectores en $V$ linelmente independientes. Por hipótesis, sabemos que existe una única familia de vectores ortonormales $e_1,\cdots,e_{d-1}$ que satisfacen las condiciones del teorema respecto a la familia $v_1,\cdots,v_{d-1}$. Es suficiente con probar que existe un único vector $e_d$ tal que $e_1,\cdots,e_d$ satisface el teorema con respecto a $v_1,\cdots,v_d$, esto es
\begin{align*}
\norm{e_d}&=1,\\
\langle e_d,e_i \rangle&=0 \quad \forall 1\leq i\leq d-1,\\
\langle e_d, v_d \rangle &> 0,
\end{align*}

$\text{span}(e_1,\cdots,e_d)=\text{span}(v_1,\cdots,v_d),$

ya que, por hipótesis, los casos de $k<d$ se cumplen.

La idea para construir $e_d$ es tomarlo de $\text{span}(v_1,\cdots,v_d)$, expresarlo como combinación lineal de estos y encontrar condiciones necesarias y suficientes sobre los coeficientes de $e_d$ para que satisfaga las conclusiones del teorema. Hagamos esto.

Sea $e_d$ un vector tal que $e_d\in\text{span}(v_1,\cdots,v_d)$. Por ser linealmente independientes y por hipótesis $$\text{span}(v_1,\cdots,v_d)=\text{span}(e_1,\cdots,e_{d-1})+\text{span}(v_d),$$ entonces podemos escribir $e_d$ como

$e_d=\lambda v_d +\sum_{i=1}^{d-1} a_i e_i$

para algunos $\lambda,a_1,\cdots,a_{d-1}$. Si resulta que $\lambda\neq 0$, esto también implicará que $\text{span}(e_1,\cdots,e_d)=\text{span}(v_1,\cdots,v_d)$.

Ahora, dado que $e_d$ debe formar una familia ortonormal con el resto de los vectores, para todo $j=1,\cdots,d-1$, tenemos que

\begin{align*}
0&=\langle e_d,e_j \rangle\\
&=\lambda\langle v_d,e_j\rangle + \sum_{i=1}^{d-1} a_i\langle e_i,e_j \rangle\\
&=\lambda\langle v_d,e_j \rangle +a_j,
\end{align*}

entonces $a_j=-\lambda\langle v_d,e_j \rangle$. Si logramos mostrar que hay un único $\lambda$ con el que se pueda satisfacer la conclusión del teorema, el argumento anterior muestra que también hay únicos $a_1,\ldots,a_{d-1}$ y por lo tanto que hay un único vector $e_d$ que satisface el teorema.

Sustituyendo los coeficientes anteriores, obtenemos que

$e_d=\lambda\left(v_d-\sum_{i=1}^{d-1} \langle v_d,e_i\rangle e_i \right).$

Notemos que si $z:=v_d-\sum_{i=1}^{d-1} \langle v_d,e_i\rangle e_i$ es cero, $v_d$ estaría en $$\text{span}(e_1,\cdots,e_{d-1}) = \text{span}(v_1,\cdots,v_{d-1}),$$ contradiciendo que los vectores $v_i$’s son linealmente independientes, entonces $z\neq 0$.

Ahora como queremos que $1=\norm{e_d}=|\lambda| \norm{z}$, esto implica que $|\lambda|=\frac{1}{\norm{z}}$.

Como además queremos que $\langle e_d,v_d \rangle >0$ y

$\langle e_d,v_d\rangle =\left\langle e_d,\frac{e_d}{\lambda}+\sum_{i=1}^{d-1} \langle v_d,e_i\rangle e_i \right\rangle=\frac{1}{\lambda},$

se deduce que $\lambda$ es único y está determinado por $\lambda=\frac{1}{\norm{z}}.$ Por lo tanto existe (y es único) el vector $e_d$ que satisface el teorema.

$\square$

Este proceso de construcción es mejor conocido como el proceso de Gram-Schmidt. La demostración da a la vez un algoritmo que nos permite encontrar bases ortogonales (y de hecho ortonormales). Veremos ejemplos de esto en la siguiente sección. Antes de eso, enunciaremos formalmente una de las conclusiones más importantes del teorema anterior.

Recuerda que un espacio Euclideano es un espacio vectorial de dimensión finita sobre $\mathbb{R}$ y con un producto interior. Podemos aplicar el proceso de Gram-Schmidt a cualquier base $v_1,\ldots,v_d$ de un espacio Euclideano $V$ y al final obtendremos una familia $e_1,\ldots,e_d$ de vectores ortonormales. Como sabemos que las familias de vectores ortonormales son linealmente independientes, y tenemos $d$ vectores, concluimos que $e_1,\ldots,e_d$ es una base ortonormal. En resumen, tenemos el siguiente resultado.

Corolario. Todo espacio Euclideano tiene una base ortonormal.

Ejemplos de aplicación del proceso de Gram-Schmidt

A continuación veremos algunos ejemplos que nos ayuden a clarificar más este algoritmo.

Ejemplo 1. Sean $v_1,v_2,v_3$ vectores en $\mathbb{R}^3$ (con el producto interior estándar) definidos por

$v_1=(1, 1, 0), \quad v_2=( 1, 1, 1), \quad v_3=( 1, 0, 1)$.

Es fácil ver que estos vectores son linealmente independientes. Entonces construyamos según el proceso de Gram-Schmidt la familia ortonormal de vectores $e_1,e_2,e_3$. Tenemos que

$e_1=\frac{v_1}{\norm{v_1}}=\frac{v_1}{\sqrt{2}}=\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}},0\right)$.

Ahora, tomando $z_2=v_2-\langle v_2,e_1\rangle e_1$, tenemos que $e_2$ está definido como $\frac{z_2}{\norm{z_2}}$, entonces

\begin{align*}
z_2&=(1,1,1)-\left[(1,1,1)\cdot \left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}},0\right)\right]\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}},0\right) \\
&=(1,1,1)-\left[\frac{2}{\sqrt{2}}\right]\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}},0\right) \\
&=(1,1,1)-(2/2,2/2,0)\\
&=(1,1,1)-(1,1,0)=(0,0,1).
\end{align*}

Esto implica que $e_2=\frac{1}{1}(0,0,1)=(0,0,1)$. Finalmente tomando $z_3=v_3-\langle v_3,e_1 \rangle e_1 – \langle v_3,e_2 \rangle e_2$, sabemos que $e_3=\frac{z_3}{\norm{z_3}}$. Entonces

\begin{align*}
z_3&=v_3-\langle v_3,e_1 \rangle e_1 – \langle v_3,e_2 \rangle e_2 \\
&=(1,0,1)-\left(\frac{1}{2},\frac{1}{2},0\right)-(0,0,1) \\
&=\left(\frac{1}{2},-\frac{1}{2},0\right).
\end{align*}

Por lo tanto

$e_3=\frac{1}{\sqrt{1/2}}\left(\frac{1}{2}, -\frac{1}{2},0\right)=\left(\frac{1}{\sqrt{2}},\frac{-1}{\sqrt{2}},0\right).$

$\triangle$

Ejemplo 2. Sea $V$ el espacio de polinomios en $[0,1]$ con coeficientes reales de grado a lo más 2, con el producto interior

$\langle p,q \rangle =\int_0^1 p(x)q(x) dx.$

Sean $v_1=1$, $v_2=1+x$, $v_3=1+x^2$ vectores en $V$ que claramente son linealmente independientes. Encontraremos los vectores que nos da el proceso de Gram-Schmidt.

Primero calculemos

$\norm{v_1}^2=\int_0^1 1 dx= 1$,

entonces $e_1=\frac{v_1}{\norm{v_1}}=v_1=1$. Ahora calculemos $z_2$:

\begin{align*}
z_2&=v_2-\langle v_2,e_1 \rangle e_1 \\
&=1+x- \int_0^1 (1+x)dx=1+x-\left(1+\frac{1}{2}\right) \\
&=x-\frac{1}{2}.
\end{align*}

Haciendo la integral $$\int_0^1 \left(x-\frac{1}{2}\right)^2 dx$$ se obtiene que $\norm{z_2}=\sqrt{\frac{1}{12}}$, entonces $e_2=\sqrt{12}\left(x-\frac{1}{2}\right)$.

Por último, hay que calcular $z_3$ así como su norma. Primero,

\begin{align*}
z_3&=v_3-\langle v_3,e_1 \rangle e_1 – \langle v_3,e_2 \rangle e_2 \\
&=(1+x^2)-\int_0^1 (1+x^2)dx – 12\left(x-\frac{1}{2}\right)\int_0^1 (1+x^2)\left(x-\frac{1}{2}\right)dx \\
&=1+x^2-\left(1+\frac{1}{3}\right)-12\left(x-\frac{1}{2}\right)\left(\frac{1}{12}\right) \\
&=x^2-\frac{1}{3}-x+\frac{1}{2} \\
&=x^2-x+\frac{1}{6},
\end{align*}

y luego, con la integral $$\int_0^1 \left(x^2-x+\frac{1}{6}\right)^2 dx$$ se calcula que $\norm{z_3}=\frac{1}{6\sqrt{5}}$, por lo tanto $e_3=6\sqrt{5}\left(x^2-x+\frac{1}{6}\right)$.

$\triangle$

Aunque no es un proceso muy eficiente, nos garantiza que podemos encontrar una base ortonormal para cualquier espacio vectorial (con producto interior). Ya con una base ortonormal, podemos usar la descomposición de Fourier de la cual hablamos la entrada anterior y con ella todas las consecuencias que tiene.

Si quieres ver muchos más ejemplos del proceso en $\mathbb{R}^n$, puedes usar una herramienta en línea que te permite ver el proceso paso a paso en el conjunto de vectores que tu elijas. Una posible página es el Gram-Schmid Calculator de eMathHelp.

Más adelante…

En esta última entrada teórica de la unidad 3, vimos el método de Gram-Schmidt para construir una base ortonormal, que es un proceso algorítmico que parte de tener una base de un espacio y al final calcula una base ortonormal. También se vieron algunos ejemplos de la aplicación de este proceso para espacios vectoriales finitos como $\mathbb{R}^3$ y el espacio de polinomios en [0,1] de grado a lo más 2. Aunque no es una manera muy eficaz para encontrar una base ortonormal, sí te garantiza que lo que construye es una.

En la próxima entrada veremos ejercicios resueltos de los temas que hemos estado estudiando a lo largo de esta semana.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Verifica que con el valor $\lambda$ que se encontró en la demostración del teorema de Gram-Schmidt en efecto se obtiene un vector $e_d$ que satisface todas las conclusiones que se desean.
Revisa que los vectores que se obtuvieron en los ejemplos de aplicación del proceso de Gram-Schmidt en efecto son bases ortogonales de los espacios correspondientes.
Aplica el proceso de Gram-Schmidt a los polinomios $1$, $x$, $x^2$ en el espacio Euclideano de los polinomios reales de grado a lo más dos y producto interior $$\langle p, q \rangle = p(0)q(0)+p(1)q(1)+p(2)q(2).$$
Aplica el proceso de Gram-Schmidt a los vectores \begin{align*}(1,1,1,1)\\ (0,1,1,1)\\ (0,0,1,1)\\ (0,0,0,1)\end{align*} de $\mathbb{R}^4$ con el producto interior canónico (el producto punto).
Usa el Gram-Schmidt Calculator de eMathHelp para ver paso a paso cómo se aplica el proceso de Gram-Schmidt a los vectores \begin{align*}(1,2,1,1,-1)\\ (0,0,1,0,0)\\ (2,0,0,1,1)\\ (0,2,0,0,1)\\ (-3,0,0,1,0)\end{align*} de $\mathbb{R}^5$.

Entradas relacionadas

Ir a Álgebra Lineal I
Entrada anterior del curso: Bases ortonormales y descomposición de Fourier
Siguiente entrada del curso: Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

El blog de Leo

Aprendiendo, creando y compartiendo matemáticas

Archivo de la etiqueta: bases ortonormales

Álgebra Lineal II: Aplicaciones de bases ortogonales en espacios euclideanos

Introducción

Familias ortogonales y ortonormales

Independencia lineal de familias ortogonales

Leer las coordenadas en una base ortonormal

Descomposición y series de Fourier

Descomposición de Fourier, norma y proyecciones

Desigualdad de Bessel

Más adelante…

Tarea moral

Entradas relacionadas

Agradecimientos

Álgebra Lineal II: Transformaciones normales, simétricas y antisimétricas

Introducción

Transformaciones simétricas y antisimétricas

Transformaciones normales

Caracterización geométrica de transformaciones normales

Más adelante…

Tarea moral

Entradas relacionadas

Agradecimientos

Álgebra Lineal I: Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt

Introducción

Problemas resueltos de bases ortogonales y proyecciones

Distancia de un vector a un subespacio y desigualdad de Bessel

Aplicación del proceso de Gram-Schmidt

El teorema de Plancherel y una fórmula con $\pi$

Entradas relacionadas

Agradecimientos

Álgebra Lineal I: Proceso de Gram-Schmidt

Introducción

Proceso de Gram-Schmidt

Ejemplos de aplicación del proceso de Gram-Schmidt

Más adelante…

Tarea moral

Entradas relacionadas

Agradecimientos