Álgebra Lineal II: Problemas de isometrías y grupo ortogonal

Por Ayax Calderón

Introducción

Un ejemplo importante de transformaciones ortogonales

Una clase importante de transformaciones ortogonales es la de las simetrías ortogonales. Sea $V$ un espacio euclidiano y $W$ un subespacio de $V$. Entonces $V=W\oplus W^\bot$, por lo que podemos definir la simetría $s_W$ sobre $W^\bot$ con respecto a $W$. Recuerda que cualquier $v\in V$ se puede escribir como $v=w+w^\bot$, con $(w,w^\bot)\in W\times W^\bot$, entonces $$s_W(v)=w-w^\bot,$$ de manera que $s_W$ fija puntualmente a $W$ y $-s_W$ fija puntualmente a $W^\bot$.

Para garantizar que $s_W$ es una transformación ortogonal, bastará con verificar que $||s_W(v)||=||v||$ para todo $v\in V$, o equivalentemente
$$||w-w^\bot||=||w+w^\bot|| \hspace{1.5mm}\forall (w,w^\bot)\in W\times W^\bot.$$ Pero por el teorema de Pitágoras se tiene que si elevemos ambos lados a cuadrado se obtiene $||w||^2+||w^\bot||^2$ y se sigue el resultado deseado.

Las simetrías ortogonales se pueden distinguir fácilmente entre las transformaciones ortogonales, pues estas son precisamente las transformaciones ortogonales auto-adjuntas.

Caracterización sobre bases ortonormales

Problema. Sea $V$ un espacio euclidiano y $T:V\to V$ una tranformación lineal. Las siguientes afirmaciones son equivalentes:

  1. $T$ es ortogonal.
  2. Para cualquier base ortonormal $e_1,\dots ,e_n$ de $V$, los vectores $T(e_1),\dots ,T(e_n)$ forman una base ortonormal de $V$.
  3. Existe una base ortonormal de $e_1,\dots ,e_n$ de $V$ tal que $T(e_1),\dots ,T(e_n)$ es una base ortonormal de $V$.

Solución. Supongamos que 1. es cierto y sea $e_1,\dots ,e_n$ una base ortonormal de $V$. Entonces para cada $i,j\in[1,n]$ tenemos
$$\langle T(e_i),T(e_j) \rangle =\langle e_i,e_j \rangle.$$
Se sigue que $T(e_1),\dots ,T(e_n)$ es una familia ortonormal, y como $dim V=n$, entonces es una base ortonormal de $V$. Entonces 1. implica 2. y claramente 2. implica 3.
Supongamos que 3. es cierto. Sea $x\in V$ y escribamos $x=x_1e_1+x_2e_2+\dots +x_ne_n$. Como $e_1,\dots ,e_n$ y $T(e_1),\dots ,T(e_n)$ son bases ortonormales de $V$, tenemos
$$||T(x)||^2=||x_1T(e_1)+\dots +x_nT(e_n)||^2=x_1^2+\dots +x_n^2=||x||^2.$$
Por lo tanto $||T(x)||=||x||$ para todo $x\in V$ y $T$ es ortogonal.

$\square$

El grupo de transformaciones ortogonales en el plano

Definición. Diremos que una isometría $T$ es una isometría positiva si $\det T=1$. Por otro lado, diremos que $T$ es una isometría negativa si $\det T=-1$ En términos geométricos, las isometrías positivas preservan la orientación del espacio, mientras que las isometrías negativas la invierten.

Definición. Sea $B=\{e_1,\dots,e_n\}$ una base ortonormal de un espacio euclidiano $V$. Si $B’=\{f_1,\dots,f_n\}$ es otra base ortonormal de $V$, entonces la matriz de cambio de base de $B$ a $B’$ es ortogonal y por lo tanto $\det P\in\{-1,1\}$. Diremos que $B’$ está orientada positivamente con respecto a $B$ si $\det P=1$ y conversamente diremos que $B’$ está orientada negativamente con respecto a $B$ si $\det P=-1$.

Si $V=\mathbb{R}^n$ está equipado con el producto interior usual, entonces siempre tomamos como $B$ a la base canónica y sólo decimos que una base ortonormal es positiva o negativa.

Observación. El polinomio característo de la matriz
$$\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix}$$
es
$$(x-1)^p(x+1)^q\cdot\displaystyle\prod_{i=1}^k (x^2-2\cos\theta_i x+1).$$
Las raíces complejas del polinomio $x^2-2\cos\theta_i x+1$ son $e^{i\theta}$ y $e^{-i\theta}$, y tienen modulo $1$. Por lo tanto, todos los eigenvalores complejos de una matriz ortogonal tienen módulo $1$.

Estudiando el grupo ortogonal en dimensiones pequeñas

Empezamos analizando el caso de dimensión $2$. Sea $A\in M_2(\mathbb{R})$ una matriz dada por
$$A=\begin{pmatrix}
a & b\\
c & d\end{pmatrix}$$ que satisface $A^tA=I_2$. Sabemos que $\det A\in\{-1,1\}$, así que consideramos ambos casos.

Si $\det A=1$, entonces la inversa de $A$ simplemente es
$$A^{-1}=\begin{pmatrix}
d & -b\\
-c & a\end{pmatrix}$$
y como $A$ es ortogonal, entonces $A^{-1}=\hspace{.5mm}^tA$, por lo que $a=d$ y $b=-c$, lo que nos dice que $A$ es de la forma
$$A=\begin{pmatrix}
a & -c\\
c & a\end{pmatrix}.$$
Más aún, tenemos que $a^2+c^2=1$, por lo que existe un único $\theta\in(-\pi,\pi]$ tal que $A=\cos\theta$ y $c=\sin\theta$. Por lo tanto
$$A=R_{\theta}=\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta \end{pmatrix}.$$
La transformación lineal correspondiente es
\begin{align*}
T:\mathbb{R}^2&\to\mathbb{R}^2\\
(x,y)&\mapsto (\cos\theta x – \sin\theta y, \sin\theta x+ \cos\theta y)
\end{align*}
y geométricamente corresponde a una rotación de ángulo $\theta$. Además
\begin{equation}\label{rot}
R_{\theta_1}\cdot R_{\theta_2}=R_{\theta_1+\theta_2}=R_{\theta_2}\cdot R_{\theta_1}.
\end{equation}
Una consecuencia importante es que la matriz asociada a $T$ con respecto a cualquier base ortonormal positiva de $\mathbb{R}^2$ aún es $R_\theta$, pues la matriz de cambio de base de la base canónica a la nueva base ortonormal positiva sigue siendo una rotación. Análogamente, si en el argumento anterior tomamos una base ortonormal negativa, entonces la matriz asociada a $T$ es $R_{-\theta}$. La relación \eqref{rot} también muestra que para calcular el ángulo de la composición de dos rotaciones basta con tomar la suma de los ángulos y restar un múltiplo adecuado de $2\pi$ tal que el ángulo obtenido quede en el intervalo $(-\pi,\pi]$.

Si $\det A=-1$. Entonces
$$A^{-1}=\begin{pmatrix}
-d & b\\
c & -a\end{pmatrix}$$ y como $A$ es ortogonal, entonces $d=-a$ y $b=c$. También tenemos que $a^2+b^2=1$, por lo que existe un único número real $\theta\in(-\pi,\pi]$ tal que $a=\cos\theta$ y $b=\sin\theta$. Entonces
$$A=S_\theta:=\begin{pmatrix}
\cos\theta & \sin\theta\\
\sin\theta & -\cos\theta \end{pmatrix}.$$
Notemos que $S_\theta$ es simétrica y ortogonal, por lo tanto $S_\theta^2=I_2$ y que la transformación correspondiente es
\begin{align*}
T:\mathbb{R}^2&\to\mathbb{R}^2\\
(x,y)&\mapsto (cos\theta x+\sin\theta y, \sin \theta x-\cos\theta y)
\end{align*}
es una simetría ortogonal. Para encontrar la recta con respecto a la cual $T$ es una simetría ortogonal, bastará con resolver el sistema $AX=X$. El sistema es equivalente a
$$\sin\left(\frac{\theta}{2}\right)\cdot x=\cos \left(\frac{\theta}{2}\right)\cdot y$$ y por lo tanto la recta $AX=X$ está generada por el vector
$$e_1=\left( \cos\left(\frac{\theta}{2}\right), \sin\left(\frac{\theta}{2}\right) \right)$$ y la correspondiente recta ortogonal está generada por el vector
$$e_2=\left(-\sin\left(\frac{\theta}{2}\right),\cos\left(\frac{\theta}{2}\right)\right),$$
y los vectores $e_1,e_2$ forman una base ortonormal de $\mathbb{R}^2$ para la cual la matriz asociada a $T$ es
$$\begin{pmatrix}
1 & 0\\
0 & -1\end{pmatrix}$$
y además $$S_{\theta_1}\cdot S_{\theta_2}=R_{\theta_1-\theta_2}$$
lo que significa que la composición de dos simetrías ortogonales es una rotación. Similarmente tenemos que
$$S_{\theta_1}R_{\theta_2}\hspace{3mm} R_{\theta_1}S_{\theta_2}=S_{\theta_1+\theta_2},$$
por lo que la composición de una rotación y una simetría ortogonal es una simetría ortogonal.

Gracias a todo lo anterior, estamos listos para enunciar el siguiente teorema:

Teorema. Sea $A\in M_2(\mathbb{R})$ una matriz ortogonal.

  1. Si $\det A=1$, entonces
    $$A=R_\theta=\begin{pmatrix}
    \cos\theta & -\sin\theta\\
    \sin\theta &\cos\theta\end{pmatrix}$$
    para único número real $\theta\in(-\pi,\pi]$, y la correspondiente transformación lineal $T$ sobre $\mathbb{R}^2$ es una rotación de ángulo $\theta$. Cualesquiera dos matrices de esa forma conmutan y la matriz asociada a $T$ con respecto a cualquier base ortonormal positiva de $\mathbb{R}^2$ es $R_\theta$.
  2. Si $\det A=-1$, entonces
    $$A=S_\theta=\begin{pmatrix}
    \cos\theta & \sin\theta\\
    \sin\theta &-\cos\theta\end{pmatrix}$$
    para un único número real $\theta\in(-\pi,\pi]$. La matriz $A$ es simétrica y la correspondiente transformación lineal sobre $\mathbb{R}^2$ es la simetría ortogonal con respecto a la recta generada por el vector $\left(\cos\left(\frac{\theta}{2}\right),\sin\left(\frac{\theta}{2}\right)\right)$.

El grupo de transformaciones ortogonales en el espacio

En la entrada anterior estudiamos el grupo de transformaciones ortogonales en dimensión $2$.

Ahora estudiaremos el caso $\dim V=3$, para esto haremos uso del teorema de clasificación de la entrada anterior, así como el estudio que hicimos para el caso de dimensión $2$. Siguendo la misma idea que desarrollamos en el teorema de clasificiación, consideramos enteros $p,q,k$ tales que $$p+q+2k=3,$$ por lo que necesariamente $p\neq 0$ o $q\neq 0$. También podemos probar esto de manera máss directa, observando que el polinomio caracterísitico de $T$ es de grado $3$, por lo que debe tener una raíz real, y por ende un eigenvalor real, el cual será igual a $1$ o $-1$, pues tiene módulo $1$.

Intercambiando $T$ con $-T$ se tiene que simplemente se intercambian los papeles de $p$ y $q$. Supongamos que $p\geq 1$, esto significa que $T$ tiene al menos un punto fijo $v$. Entonces $T$ fija la recta $D=span (v)$ e induce una isometría sobre el plano ortogonal a $D$. Esta isometría se puede clasificar con el último teorema de la entrada anterior. Por lor tanto, hemos reducido el caso de dimensión $3$ al caso de dimensión $2$. Podemos ser más explicitos si consideramos los siguientes casos.

  • $id\in\{T,-T\}$.
  • Tenemos que $\dim \ker (T-id)=2$. Si $e_2,e_1$ es una base ortonormal del plano $\ker (T-id)=2$ y completamos a una base ortonormal de $V$ $\{e_1,e_2,e_3\}$, entonces $T$ fija puntualmente al subespacio generado por $e_2,e_3$ y deja invariante a la recta generada por $e_1$. Por lo tanto la matriz asociada a $T$ con respecto a la base ortonormal es
    $$ \begin{pmatrix}
    t & 0 & 0\\
    0 & 1 & 0\\
    0 & 0 & 1
    \end{pmatrix}$$
    para algun número real $t$, el cual forzosamente es $-1$, pues sabemos que debe ser $1$ o $-1$, pero si fuera $1$, entonces $T$ sería la indentidad. Por lo tanto $T$ es una simetría ortogonal con respecto al plano $\ker (T-id)$. Además, $\det T=-1$, por lo que $T$ es una isometría negativa.
  • Tenemos que $\dim\ker (T-id)$ es la recta generado por algún vector $e_1$ de norma $1$. Completamos $e_1$ a una base ortonormal $\{e_1,e_2,e_3\}$ . Entonces la isometría $T$ inducida sobre es subespacio generado por $\{e_2,e_3\}$ no tiene puntos fijos, ya que todos los puntos fijos de $T$ están sobre $span(e_1)$, por lo tanto $T$ es una rotación de ángulo $\theta$, para un único $\theta\in(-\pi,\pi]$. Además, la matriz asociada a $T$ con respecto a la base ortonormal es
    $$ \begin{pmatrix}
    1 & 0 & 0\\
    0 & \cos\theta & -\sin\theta\\
    0 & \sin\theta & \cos\theta
    \end{pmatrix}.$$
    Diremos que $T$ es la rotación de ángulo $\theta$ alrededor del eje $\mathbb{R}e_1$. Notemos que $\det T=1$, por lo que $T$ es una isometría positiva. Además, el ángulo $\theta$ satisface $$1+2\cos\theta=Tr(A),$$,aunque, al ser el coseno una función par, $-\theta$ también satisface la ecuación anterior. Para encontrar a $\theta$ necesitamos hallar a $\sin\theta$. Para ello verificamos que
    $$\det_{(e_1,e_2,e_3)}(e_1,e_2,T(e_2))=\begin{vmatrix}
    1 & 0 & 0\\
    0 & 1 & \cos\theta\\
    0 & 0 & \sin\theta
    \end{vmatrix}=\sin\theta.$$
  • Supongamos que $\ker(T-id)=\{0\}$. Una posibilidad es que $T=-id$. Supongamos que $T\neq id $. Como $T$ o $-T$ tienen un punto fijo y $T$ tiene puntos fijos, entonces necesariamente $-T$ tiene un punto fijo. Sea $e_1$ un vector de norma $1$ fijado por $-T$, por lo tanto $T(e_1)=-e_1$. Completando $e_1$ a una base ortonormal de $V$ dando un argumento similar al del caso anterior, obtenemos que la matriz asociada a $T$ con respecto a la base ortonormal es
    $$\begin{pmatrix}1- & 0 & 0\\
    0 & \cos\theta & -\sin\theta\\
    0 & \sin\theta & \cos\theta
    \end{pmatrix}=R_\theta \cdot \begin{pmatrix}
    1 & 0 & 0\\
    0 & \cos\theta & -\sin\theta\\
    0 & \sin\theta & \cos\theta
    \end{pmatrix}$$
    para algún $\theta \in (-\pi,\pi]$. Por lo tanto $T$ es la composición de una rotación de ángulo $\theta$ y una simetría ortogonal con respecto al eje de rotación. También notemos que $\det T=-1$, por lo que $T$ es una isometría negativa.
    También podemos mirarlo desde el punto de vista de las matrices. Consideremos una matriz ortogonal $A\in M_3(\mathbb{R})$ y la transformación lineal asociada
    \begin{align*}
    T:V&\to V\\
    X&\mapsto AX
    \end{align*}, donde $V=\mathbb{R}^3$ está equipado con el producto interior usual. Excluiremos los casos triviales $A=\pm I_3$. Para estudiar la isometría $T$, primero revisamos si esta es positiva o negativa, calculando el determinante.
    Supongamos que $T$ es positiva. Ahora veremos si $A$ es simétrica. Para ellos consideremos los siguentes dos casos:
  • Si $A$ es simétrica, entonces $A^2=I_3$ (pues $A$ es ortogonal y simétrica) y por lo tanto $T$ es una simetría ortogonal. Afirmamos que $T$ es una simetría ortogonal con respecto a una recta. En efecto, como $A^2=I_3$, todos los eigenvalores de $A$ son $1$ o $-1$. Más aún, los eigenvalores no son iguales, ya que estamos excluendo los casos $A=\pm I_3$, y el producto de ellos es 1, pues $\det A=1$. Por lo tanto, un eigenvalor es igual a $1$ y los otros dos son iguales a $-1$. Se sigue que la matriz asociada a $T$ con respecto a la base ortonormal $\{e_1,e_2,e_3\}$ es
    $$\begin{pmatrix}
    1 & 0 & 0\\
    0 & -1 & 0\\
    0 & 0 & -1
    \end{pmatrix}$$ y $T$ es la simetría ortogonal con respecto a la recta generado por $e_1$. Para encontrar esta recta de manera explícita, necesitamos calcular $\ker(A-I_3)$ resolviendo el sistema $AX=X$.
  • Si $A$ no es simétrica, entonces $A$ es una rotación de ángulo $\theta$ ara un único $\theta\in(-\pi,\pi]$. Podemos encontrar el eje de rotación resolviendo el sistema $AX=X$: si $Ae_1=e_1$ para algún vector $e_1$, entonces el eje de rotación está generado por $e_1$. Para encontrar el ángulo de rotación usamos la siguiente ecuación
    \begin{equation}\label{angulo}
    1+2\cos\theta=Tr(A),
    \end{equation}
    la cual determina a $\theta$ en valor absoluto (pues $\theta$ y $-\theta$ son soluciones por la paridad del coseno). Ahora escogemos un vector $e_2$ ortogonal a $e_1$ y de norma $1$ y definimos $e_3=(u_2v_3-u_3v_2,u_3v_1-u_1v_3,u_1v_2-u_2v_1)$, donde $e_1=(u_1,u_2,u_3)$ y $e_2=(v_1,v_2,v_3)$. Entonces $e_1,e_2,e_3$ es una base ortonormal positiva de $\mathbb{R}^3$ y $\det_{(e_1,e_2,e_3)}(e_1,e_2,Ae_2)$ nos da el valor de $\sin\theta$, con lo cual podremos determinar a $\theta$ de manera única. En la práctica bastará con encontrar el signo de $\det_{(e_1,e_2,e_3)}(e_1,e_2,Ae_2)$, ya que esto nos dará el signo de $\sin\theta$, lo cual determina $\theta$ de manera única gracias a la ecuación \eqref{angulo}.

Finalmente, si se supone que $T$ es negativa, entoces $-T$ es positiva y por lo tanto todo el estudio que acabamos de hacer se puede aplicar a $-T$.

Para finalizar, veremos un ejemplo concreto.

Ejemplo. Demuestra que a matriz
$$A=\frac{1}{3}\begin{pmatrix}
2 & 2 & 1\\
-2 & 1 & 2\\
1 & -2 & 2
\end{pmatrix}$$ es ortogonal y estudia su isometría correspondiente en $\mathbb{R}^3$.

Solución. El cálculo para verificar que $A$ es ortogonal es muy sencillo y se deja como tarea moral. Luego vemos que $\det A=1$, por lo que la isometría asociada es positiva. Como $A$ no es simétrica, se sigue que $T$ es una rotación. Para encontrar el eje necesitamos resolver el sistema $AX=X$, el cual es equivalente a
\begin{align*}
\begin{cases}
2x+2y+z &= 3x\\
-2x+y+2z &=3y\\
x-2y+2z &=3z
\end{cases}
\end{align*} y entonces $x=z$ y $y=0$. Por lo tanto, el eje de rotación está generado por el vector $(1,0,1)$. Normalizandolo obtenemos el vector
$$e_1=\frac{1}{\sqrt{2}}(1,0,1),$$ que genera al eje de $T$.
sea $\theta$ el ángulo de rotación, tal que
$$1+2\cos\theta=Tr(A)=\frac{5}{3},$$ y por lo tanto
$$cos\theta=\frac{1}{3}.$$
Falta determinar el signo de $\sin \theta$. Para ello, escogemos un vector ortogonal a $e_1$, digamos $$e_2=(0,1,0)$$ y calculamos el signo de
$$\det (e_1,e_2,Ae_2)=\frac{1}{3\sqrt{2}}\begin{vmatrix}
1 & 0 & 2\\
0 & 1 & 0\\
1 & 0 & -2
\end{vmatrix}=-\frac{4}{3\sqrt{2}}<0,$$ por lo que $\sin\theta<0$ y finalmente $\theta=-\arccos\frac{1}{3}$.

$\square$

Más adelante…

Tarea moral

  1. Verifica que la matriz $A$ del ejemplo anterior es ortogonal.
  2. Encuentra la matriz asociada a la simetría ortogonal en $\mathbb{R}^3$ con respecto a la recta generada por el vector $(1,2,3)$.
  3. Encuentra la matriz asociada a la simetría ortogonal en $\mathbb{R}^3$ con respecto al plano generad por los vectores $(1,1,1)$ y $(0,1,0)$.
  4. Sea $V=\mathbb{R}^3$.¿En qué casos una rotación sobre $V$ conmuta con una simetríai ortogonal?

Entradas relacionadas

Probabilidad I-Videos: Teorema de probabilidad total

Por Aurora Martínez Rivas

Introducción

Anteriormente vimos la definición de probabilidad condicional, de dicha definición podemos derivar una fórmula muy útil para determinar probabilidades que llamaremos el Teorema de probabilidad total.

Teorema de probabilidad total

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE 104721: “Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM”. Sitio web del proyecto: https://www.matematicasadistancia.com.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Si $A_1,A_2,\ldots,A_n\ $ es una partición de $\Omega$ con $P\left(A_i\right)>0$ para $i=1, 2, …, n$, entonces para eventos $C$ y $D$ con $P\left(CA_i\right)>0$ para $i=1, 2, …, n$ demuestra que $P\left(C\middle|\ D\right)=\displaystyle\sum_{i=1}^{n}{P\left(A\middle|\ CA_i\right)P(A_i|C})$.
  • Un mago tiene dos monedas: una es justa; y la otra tiene una probabilidad de $\frac{3}{4}$ de dar como resultado Cara. Toma una moneda al azar y la lanza obteniendo una cara en el primer lanzamiento, determina la probabilidad de que la moneda sea justa.
  • Usa los dos ejercicios anteriores para encontrar la probabilidad de obtener una Cara en el segundo lanzamiento dado que hay una Cara en el primer lanzamiento.
  • En una urna hay $m$ canicas rojas y $n$ canicas azules. Se seleccionan al azar a $r$ canicas, una por una y sin reemplazo. Suponga que $r\le\ m,\ n$. Encuentra la probabilidad de que la última canica escogida sea roja.
  • Una persona lanza un dado equilibrado una vez, obteniendo el resultado $k$. Después lanza nuevamente el dado tantas veces como indicó el resultado del primer lanzamiento sumando los resultados de estos últimos lanzamientos y obteniendo un total de $m$. Calcule la probabilidad de que los números $k$ y $m$ coincidan.

Más adelante…

Existen problemas para los que no es evidente la forma de encontrar la probabilidad de cierto evento, pero condicionando adecuadamente, en ocasiones se puede encontrar de manera más fácil la probabilidad buscada. Siguiendo con esta línea de ideas en el siguiente video hablaremos sobre el Teorema de Bayes.

Entradas relacionadas

Ecuaciones Diferenciales I – Videos: Introducción a las bifurcaciones

Por Eduardo Vera Rosales

Introducción

En la entrada anterior demostramos el teorema de existencia y unicidad de Picard. Antes de finalizar con el estudio a las ecuaciones diferenciales de primer orden vamos a regresar un momento a la teoría cualitativa de ecuaciones de primer orden, en específico, al estudio de soluciones de ecuaciones autónomas de la forma $$\frac{dy}{dt}=f(y).$$

En muchas ocasiones las ecuaciones diferenciales involucran constantes. Si hacemos variar esta constante obtendremos una familia de ecuaciones diferenciales que dependen de este nuevo parámetro que llamaremos $\lambda$. A esta familia de ecuaciones la denotaremos por $$\frac{dy}{dt}=f_{\lambda}(y).$$

Estudiaremos entonces a esta familia de ecuaciones, y el cambio cualitativo de las soluciones conforme varía el parámetro. Nos interesará conocer el comportamiento de las soluciones de equilibrio, y los cambios que estas tienen dependiendo del valor de $\lambda$. En particular, estudiaremos el cambio en el número de soluciones de equilibrio bajo pequeñas perturbaciones del parámetro $\lambda$. A este tipo de problemas los llamaremos bifurcaciones. Definiremos el concepto de valor de bifurcación, y mostraremos cómo encontrar este valor, tanto de manera gráfica mediante un diagrama, como de manera analítica.

Bifurcaciones y valor de bifurcación

En este video damos una pequeña introducción al concepto de bifurcación, definimos la familia uniparamétrica de ecuaciones autónomas y el valor de bifurcación, todo mediante un ejemplo sencillo.

Diagrama de bifurcaciones

Mostramos un diagrama geométrico para hallar los valores de bifurcación de una familia uniparamétrica de ecuaciones autónomas, y para conocer el comportamiento de las soluciones a las ecuaciones de la familia, sin dibujarlas explícitamente. A este diagrama lo llamamos diagrama de bifurcaciones.

Determinación de los valores de bifurcación

En el último video de esta entrada hallamos los valores bifurcación mediante un análisis a las gráficas de las funciones $f_{\lambda}(y)$ y con ayuda también de la derivada de dichas funciones en determinados puntos.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Verifica que para toda $\lambda <0$ la ecuación $$\frac{dy}{dt}=y^{2}+\lambda$$ tiene dos soluciones de equilibrio, y para toda $\lambda>0$, la ecuación $$\frac{dy}{dt}=y^{2}+\lambda$$ no tiene soluciones de equilibrio.
  • Prueba que $\lambda=0$ es el único valor de bifurcación para la familia $$\frac{dy}{dt}=y^{2}+\lambda.$$
  • Muestra, según la definición, que $\lambda=-1$ es valor de bifurcación para la familia de ecuaciones $$\frac{dy}{dt}=\sin{y}+\lambda.$$
Bifurcaciones
Gráficas de la familia $sen (y)+\lambda$. Elaboración propia.
  • Considera la familia uniparamétrica $$\frac{dy}{dt}=\lambda y-y^{3}.$$ Encuentra las soluciones de equilibrio para todos los valores de $\lambda$, y esboza el diagrama de bifurcaciones.
  • Encuentra los valores de bifurcación para la familia uniparamétrica $$\frac{dy}{dt}=y^{4}+\lambda y^{2}$$ con ayuda de la derivada y las gráficas de $f_{\lambda}(y)$. Dibuja el diagrama de bifurcaciones.
Bifurcaciones
Gráficas de la familia $y^{4}+\lambda y^{2}$. Elaboración propia.

Para encontrar los valores de bifurcación, buscamos valores de $\lambda_{0}$ y $y_{0}$ tales que $$f_{\lambda_{0}}(y_{0})=0 ; \,\,\,\,\,\,\,\, \frac{df_{\lambda_{0}}}{dy}(y_{0})=0. $$ Sin embargo existen casos donde esto último ocurre pero $\lambda_{0}$ no es un valor de bifurcación.

Prueba que las siguientes familias de ecuaciones no tienen valores de bifurcación y dibuja algunas gráficas de estas familias:

  • $\frac{dy}{dt}=y^{3}+\lambda$
  • $\frac{dy}{dt}=(y+\lambda)^{2}$

Así, en los dos casos, ocurre que $$f_{0}(0)=0 ; \,\,\,\,\,\,\,\, \frac{df_{0}}{dy}(0)=0$$ pero $0$ no es valor de bifurcación.

Más adelante

Con este tema damos por terminado la primera unidad del curso. En la siguiente entrada comenzamos la segunda unidad que tratará de las ecuaciones diferenciales de segundo orden.

En particular, en la siguiente entrada comenzamos con el análisis a las ecuaciones lineales homogéneas de segundo orden con coeficientes constantes.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal II: Formas cuadráticas hermitianas

Por Diego Ligani Rodríguez Trejo

Introducción

El análogo complejo a las formas cuadráticas son las formas cuadráticas hermitianas. En esta entrada las definiremos, enfatizaremos algunas diferencias con el caso real y veremos algunas de sus propiedades.

Al final enunciaremos una versión compleja del teorema de Gauss.

Formas cuadráticas hermitianas

Definición Sea $V$ un espacio vectorial sobre $\mathbb{C}$ y $\varphi$ una forma sesquilineal hermitiana de $V$. La forma cuadrática hermitiana correspondiente a $\varphi$ es la función $\Phi: V\to \mathbb{C}$ tal que para cualquier $x$ en $V$ se tiene que

\begin{align*} \Phi(x)=\varphi (x,x) \end{align*}

Observa que aquí, de entrada, estamos pidiendo que $\varphi$ sea sesquilineal. Esto entra en contraste con el caso real, en donde no nos importaba si la forma bilineal que tomábamos inicialmente era simétrica o no. Como veremos un poco más abajo, dada la forma cuadrática hermitiana $\Phi$, hay una única forma sesquilineal hermitiana de la que viene. Por esta razón, llamaremos a la función $\varphi$ la forma polar de $\Phi$.

Problema 1. Sea $V=\mathbb{C}^n$ y $\Phi : V \rightarrow \mathbb{C}$ definida por
\begin{align*} \Phi(x_1, \ldots, x_n)= |x_1|^2 + \cdots + |x_n|^2.\end{align*} Muestra que $\Phi$ es una forma cuadrática.

Solución. Recordemos que para cualquier $z \in \mathbb{C}$ se tiene $|z|^2=z \overline{z}$. Así propongamos $\varphi$ como sigue:

\begin{align*}
\varphi(x,y):= (\overline{x_1})(y_1) + \cdots + (\overline{x_n})(y_n).
\end{align*}

Es sencillo mostrar que $\varphi$ así definida es una forma sesquilineal hermitiana, y queda como ejercicio.

$\square$

Problema 2. Sea $V$ el espacio de funciones continuas del intervalo $[0,1]$ a $\mathbb{C}$ y $\Phi: V \rightarrow \mathbb{C}$ definida por
\begin{align*} \Phi(f)= \int_0^1|f(t)|^2 dt.\end{align*} Muestra que $\Phi$ es una forma cuadrática.

Solución. La solución es muy parecida. Proponemos $\varphi$ como sigue:

\begin{align*} \varphi(f_1,f_2)= \int_0^1\overline{f_1(t)} f_2(t) dt \end{align*}

Es sencillo mostrar que $\varphi(f,f)=\Phi(f)$ y que $\varphi$ es forma sesquilineal hermitiana. Ambas cosas quedan como ejercicio.

$\square$

Propiedades básicas de formas cuadráticas hermitianas

Veamos algunas propiedades de las formas cuadráticas hermitianas.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{C}$, $\varphi$ una forma sesquilinear hermitiana y $\Phi(x)$ su forma cuadrática asociada.

  1. Para todo $x\in V$, se tiene que $\Phi(x)=\varphi(x,x)$ siempre es un número real.
  2. Para todo $x\in V$ y $a\in \mathbb{C}$ se tiene que $\Phi(ax)=|a|\Phi(x)$.
  3. Para cualesquiera $x,y$ en $V$ se tiene que $\Phi(x+y)=\Phi(x)+\Phi(y)+2\text{Re}(\varphi(x,y))$.

Demostración. Los incisos 1) y 2) son consecuencia inmediata de los ejercicios de la entrada anterior. Para el inciso 3) usamos que la suma de un número con su conjugado es el doble de su parte real para obtener la siguiente cadena de igualdades:

\begin{align*}
\Phi(x+y)&=\varphi(x+y,x+y)\\
&=\varphi(x,x)+ \varphi(y,y)+ \varphi(x,y)+\varphi(y,x)\\
&=\varphi(x,x)+ \varphi(y,y)+ \varphi(x,y)+\overline{\varphi(x,y)}\\
&=\Phi(x) + \Phi(y) + 2\text{Re}(\varphi(x,y)).
\end{align*}

$\square$

Identidad de polarización compleja

Para demostrar que una función es una forma cuadrática hermitiana, usualmente necesitamos a una función que sea la candidata a ser la forma sesquilineal hermitiana que la induzca. Es decir, necesitamos un método para proponer la forma polar. Podemos hacer esto mediante la identidad de polarización compleja.

Proposición (Identidad de polarización). Sea $\Phi: V \rightarrow \mathbb{C}$ una forma cuadrática hermitiana. Existe una única forma sesquilineal hermitiana $\varphi: V \times V \rightarrow \mathbb{C}$ tal que $\Phi(x)=\varphi(x,x)$ para todo $x \in V$.

Más aún, ésta se puede encontrar de la siguiente manera:

\begin{align*} \varphi(x,y)= \frac{1}{4}\sum_{k=0}^4 i^k \Phi (y+i^kx)\end{align*}

Aquí $i$ es el complejo tal que $i^2=-1$. Esta suma tiene cuatro sumandos, correspondientes a las cuatro potencias de $i$: $1,i,-1,-i$.

Demostración. Por definición, como $\Phi$ es una forma cuadrática hermitiana, existe $s:V\times V\to \mathbb{C}$ una forma sesquilineal hermitiana tal que $\Phi(x)=s(x,x)$. Veamos que la fórmula propuesta en el enunciado coincide con $s$. La definición en el enunciado es la siguiente:

\begin{align*} \varphi(x,y)=\frac{1}{4}\sum_{k=0}^4 i^k \Phi (y+i^kx)\end{align*}

Como $\Phi(x)=s(x,x)$ podemos calcular $\varphi$ como sigue
\begin{align*} \varphi(x,y)=\frac{1}{4}\sum_{k=0}^4 i^k s(y+i^kx,y+i^kx)\end{align*}

Desarrollando los sumandos correspondientes a $k=0$ y $k=2$, y simplificando, se obtiene

\begin{align*}2s(y,x) + 2s(x,y).\end{align*}

Del mismo modo, los sumandos para $k=1$ y $k=3$ quedan como

\begin{align*} 2s(x,y) – 2s(y,x) \end{align*}

Sustituyendo esto en la definición original de $\varphi$ tenemos que

\begin{align*} \varphi(x,y)&=\frac{ 2s(y,x) + 2s(x,y) + 2s(x,y) – 2s(y,x) }{4}\\&=s(x,y). \end{align*}

De esta igualdad podemos concluir que $\varphi = s$, por lo que 1) $\varphi$ es forma sesquilineal hermitiana y 2) la forma cuadrática hermitiana de $\varphi$ es $\Phi$. Esta forma debe ser única pues si hubiera otra forma sesquilineal hermitiana tal que $s'(x,x)=\Phi(x)$, los pasos anteriores darían $s'(x,x)=\varphi(x,y)$ nuevamente.

$\square$

En particular, esta identidad nos dice que formas sesquilineales hermitianas distintas van a formas cuadráticas hermitianas distintas. Es por ello que podemos llamar a la función $\varphi$ dada por la fórmula en el enunciado la forma polar de $\Phi$.

Teorema de Gauss complejo

Enunciamos a continuación la versión compleja del teorema de Gauss.

Teorema. Sea $\Phi$ una función cuadrática hermitiana $\mathbb{C}^n$. Existen $\alpha_1, \cdots , \alpha_r$ números complejos y formas lineales $l_1, \cdots l_r$ linealmente independiente de $\mathbb{C}^n$ tales que para todo $x$ en $\mathbb{C}^n$ se tiene:

\begin{align*} \Phi(x_1, \cdots , x_n ) = \sum_{i=1}^r \alpha_i |l_i(x)|^2. \end{align*}

Observa que en la expresión de la derecha no tenemos directamente a las formas lineales, sino a las normas de éstas.

Más adelante…

Ya hablamos de formas bilineales y de formas sesquilineales. ¿Habrá una forma alternativa de representarlas? Cuando teníamos transformaciones lineales entre espacios vectoriales, podíamos representarlas por matrices. Resulta que a las formas bilineales también podemos representarlas por matrices. Veremos cómo hacer esto (y cuáles son las ventajas de hacer eso) en las siguientes dos entradas. En una veremos los resultados correspondientes a formas bilineales y en la otra los resultados correspondientes a formas sesquilineales.

Un poco más adelante aprovecharemos esta representación matricial para retomar el estudio de los productos interiores.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea $V=\mathbb{C}^n$ y definamos $\varphi:V\times V \to \mathbb{C}$ como sigue:
    \begin{align*} \varphi(x,y)= \overline{x_1}y_1 + \cdots + \overline{x_n}y_n, \end{align*}
    para cualquier par $x,y \in V$ con $x=(x_1, \cdots x_n)$ y $y=(y_1, \cdots y_n)$. Demuestra que $\varphi$ es una forma sesquilineal hermitiana.
  2. Sea $V$ el espacio de funciones continuas del intevalo $[0,1]$ a $\mathbb{C}$ y $\varphi: V\times V \to \mathbb{C}$ definida como sigue:
    \begin{align*} \varphi(f_1,f_2)= \int_0^1\overline{f_1(t)} f_2(t) dt,\end{align*}
    para cualquier par $f_1, f_2 \in V$. Demuestra que $\varphi$ es una forma sesquilineal hermitiana.
  3. Sea $V$ un espacio vectorial sobre $\mathbb{C}$ y $\Phi$ una forma cuadrática hermitiana. Prueba la siguiente identidad (identidad del paralelogramo)
    \begin{align*} \Phi(x+y) + \Phi(x-y) = 2(\Phi(x) + \Phi(y)).\end{align*} ¿Cómo se compara con la identidad del paralelogramo real?
  4. Compara la identidad de polarización real con la identidad de polarización compleja. ¿Por qué son tan distintas entre sí?
  5. Demuestra el Teorema de Gauss para formas cuadráticas hermitianas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Cálculo Diferencial e Integral I: Valor absoluto. Desigualdad del triángulo

Por Karen González Cárdenas

Introducción

En esta entrada veremos una función muy particular: el valor absoluto. Ésta nos permitirá «medir la distancia» entre un par de números reales. Finalizaremos con la demostración de la Desigualdad del triángulo y algunas de sus consecuencias. Esta desigualdad es usada en las demostraciones de Límite y Continuidad que veremos más adelante.

Definición formal

Definición (Valor absoluto): Para todo $x\in \r$ definimos la función valor absoluto como sigue:
\begin{equation*}
|x|=
\begin{cases}
x &\text{si $x \geq 0$}\\
-x & \text{si $x< 0$}
\end{cases}
\end{equation*}

Recordando las propiedades de orden, la definición quedaría de la siguiente manera:
\begin{equation*}
|x|=
\begin{cases}
x &\text{si $x =0 \quad\text{o}\quad x\in P$}\\
-x & \text{si $-x\in P$}
\end{cases}
\end{equation*}
Esta última nos será de utilidad para la demostración de la desigualdad del triángulo que veremos más adelante.


Observación: De la definición anterior notamos que para toda $x \in \r$, su valor absoluto $|x|$ es mayor o igual a cero.

Midiendo distancias

Si observamos la definición del valor absoluto, notamos que asocia a cualquier número real con su distancia respecto al cero. Veámoslo en los ejemplos siguientes:

  • $|-3|=3$
  • $|14|= 14$

En consecuencia, si consideramos la distancia entre cualquier par de números reales tendríamos la siguiente definición.

Definición: Para cualesquiera $a,b \in \r$ tenemos que están a distancia $|a-b|$.
Observemos que la distancia siempre será positiva o cero.

Desigualdad del triángulo

Teorema (Desigualdad del triángulo): Para todo $a,b \in \r$ se cumple la siguiente desigualdad:
$$|a+b| \leq |a|+|b|\text{.}$$

Demostración: Dada la definición del valor absoluto, debemos considerar casos sobre los signos de $a$ y $b$.
CASO 1: $a \geq 0$ y $b \geq 0$.
Recordemos que $P$ es cerrado bajo la suma, por lo que tenemos lo siguiente:
\begin{align*}
|a+b|&= a + b\\
&= |a|+|b|.
\end{align*}
La última igualdad se sigue de $a = |a|$ y $b = |b|$.

Para los siguientes casos haremos uso de los siguientes resultados que serán demostrados posteriormente:

Resultados: Para cualesquiera $a,b,c \in \r$ se cumplen:

  1. $-a-b=-(a+b)$.
  2. Si $b<0 \Rightarrow b<-b$.
  3. Si $a<b \Rightarrow a+c < b+c$.

CASO 2: $a < 0$ y $b < 0$.
Notemos que $-a \in P$ y $-b \in P$ por lo que $-a-b \in P$. Así se sigue que:
\begin{align*}
|a+b|&= -(a+b)\tag{por ser $a+b$ negativo}\\
&= -a – b\tag{por el resultado 1}\\
&= (-a)+(-b)\\
&= |a|+|b|,
\end{align*}
porque $|a|=-a$ y $|b|=-b$.

CASO 3: $a \geq 0$ y $b < 0$.
Para esta demostración debemos considerar dos subcasos.
SUBCASO 1: $a+b \geq 0$.
Dado lo anterior aplicando la definición de valor absoluto ocurre que:
\begin{align*}
|a+b|&=a+b\\
&< a-b. \tag{por los resultados 2 y3}\\
\end{align*}
Como tenemos que $a-b = |a|+|b|$, concluimos:
$$|a+b|<|a|+|b|.$$
SUBCASO 2: $a+b < 0$.
Procederemos análogamente al subcaso anterior:
\begin{align*}
|a+b|&=-(a+b)\\
&= -a-b\\
&< a-b. \tag{por resultados 2 y3}\\
\end{align*}
Ya que $a-b = |a|+|b|$, tenemos:
$$|a+b|<|a|+|b|.$$

CASO 4: $a < 0$ y $b \geq 0$.
Al igual que en el caso 3, para verificar la desigualdad se deberán considerar dos subcasos. La demostración de este caso se deja como parte de la Tarea moral.

$\square$

Para poder dar por terminada la prueba, debemos demostrar los siguientes resultados auxiliares que utilizamos:

Resultados: Para cualesquiera $a,b,c \in \r$ se cumplen:

  1. $-a-b=-(a+b)$.
  2. Si $b<0 \Rightarrow b<-b$.
  3. Si $a<b \Rightarrow a+c < b+c$.

Demostración:
1. Debemos verificar que $-a-b =(-a)+(-b)$ es inverso aditivo de $a+b$.
\begin{align*}
(a+b)+((-a)+(-b))&= (b+a)+((-a)+(-b))\\
&= ((b+a)+(-a))+(-b)\\
&= (b+(a+(-a))+(-b)\\
&= (b+0)+(-b)\\
&= b + (-b)\\
&=0.
\end{align*}
Concluimos que $(-a)+(-b) = -(a+b)$.

2. Ya que $b<0$ sabemos que $-b \in P$. Queremos probar que $-b-b > 0$.
Observemos que: $-b-b=(-b)+(-b)\in P$.
Por lo que concluimos que $b<-b$.

3. Bastaría ver que $(b+c)-(a+c) \in P$. Debido a que $b-a \in P$. Observamos lo siguiente.
\begin{align*}
b-a &= (b-a)+0\\
&= (b-a) + (c-c)\\
&= (b+c)-(a+c).
\end{align*}
$$\therefore\quad (b+c)-(a+c) \in P.$$
$$\therefore \quad b+c > a+c.$$

$\square$

Observemos que las demostraciones de estos resultados no utilizan la desigualdad del triángulo, más bien hacen uso de las propiedades vistas en las entradas anteriores.

Consecuencias de la desigualdad del triángulo

Proposición (Consecuencias de la desigualdad del triángulo): Sean $a,b \in \r$. Se cumplen las siguientes desigualdades:

  1. $|a-b| \leq |a|+|b|$
  2. $|a|-|b|\leq |a-b|$
  3. $|b|-|a|\leq |a-b|$

En esta ocasión sólo probaremos el punto 2.

Demostración:
2. Como $|a|= |a+0|$, al desarrollar esta igualdad obtenemos:
\begin{align*}
|a|&= |a+0|\\
&= |a+ (b+ (-b))|\\
&= |(a-b)+b|\\
&\leq |a-b| + |b| \tag{por la desigualdad del triángulo}\\
\end{align*}
$$\therefore |a| \leq |a-b| + |b|$$
$$\therefore |a|-|b| \leq |a-b|$$

$\square$

Más adelante

En la próxima entrada comenzaremos a resolver desigualdades donde el valor absoluto se encuentra involucrado.

Tarea moral

  • Propiedades del valor absoluto.
    Prueba los siguientes resultados:
    • $|a|=|-a|.$
    • $|ab|=|a||b|$.
    • $|\frac{1}{a}|=\frac{1}{|a|}$ con $a\neq 0$.
    • $\frac{|a|}{|b|}=|\frac{a}{b}|$ con $b \neq 0$.
  • Desigualdad del triángulo.
    • Realiza la prueba del CASO 4 .
    • Demuestra que para cualesquiera $a,b \in \r$:
      • $|a-b| \leq |a|+|b|$.
      • $|b|-|a|\leq |a-b|$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»