Archivo de la etiqueta: recta

Álgebra Superior I: Sistemas de ecuaciones lineales

Por Eduardo García Caballero

Introducción

Una de las aplicaciones más importantes de los vectores y matrices tiene que ver con un tema que conociste desde la secundaria y preparatoria: los sistemas de ecuaciones.

Más específicamente, los vectores y matrices nos serán de gran utilidad para resolver sistemas de ecuaciones lineales, determinar cuándo un sistema sí tiene soluciones, y cuáles son todas sus soluciones.

Pero antes, repasemos un poco los conceptos de sistemas de ecuaciones lineales.

Sistemas de ecuaciones lineales

Recordemos que una ecuación es una expresión en la que hay variables o valores que no conocemos. En el caso de una ecuación lineal, se trata de ecuaciones en las que todas sus variables se encuentran elevadas a la primera potencia y acompañadas únicamente por coeficientes constantes. Por ejemplo, podemos ver que las expresiones
\[
2x + 9y – z = 3,
\qquad
4w + 3000a = y + \tfrac{1}{2}x
\]
son ecuaciones lineales, mientras que las expresiones
\[
ax^2 + bx + c = 0,
\qquad
2xz = 9y
\]
no lo son, pues contienen al menos una variable elevada a exponentes distintos de $1$, o bien hay variables multiplicándose entre sí.

De manera más formal, una ecuación de lineal es una ecuación que se puede escribir de la forma
\[
a_1x_2 + a_2x_2 + \cdots + a_nx_n = b,
\]
donde $x_1, \ldots, x_n$ son variables y $a_1, \ldots, a_n, b$ son coeficientes, todos del mismo tipo (en este curso trabajaremos con coeficientes reales, pero en otros cursos podrás encontrar coeficientes de otros tipos, como son números enteros, racionales, y complejos, entre otros).

Por su parte, un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales. Por ejemplo, los siguientes son sistemas de ecuaciones lineales:
\[
\begin{cases}
2x -\tfrac{3}{2}y + 8z = 1 \\
9z + 2w + 5y = 3,
\end{cases}
\qquad
\begin{cases}
2 + 9a = 46b -5c \\
2d + 8x = \sqrt{3} \\
x + y + z = a + b + c \\
x = -y
\end{cases}
\]
Bajo esta definición, una única ecuación se puede considerar un sistema de ecuaciones lineales (con una ecuación).

Notemos que no es necesario que todas las ecuaciones compartan variables, sin embargo, generalmente esto sí sucederá. De hecho, podemos pensar que todas las variables aparecen en todas las ecuaciones. En caso de que esto no suceda, podemos considerar que las variables que no aparecen en una ecuación tienen coeficiente cero. Además, siempre podemos reordenar las variables en las ecuaciones para que en todas ellas aparezcan en el mimo orden. Por ejemplo, a continuación el sistema de ecuaciones a la izquierda lo podemos escribir como el de la derecha, sin alterarlo.

\[
\begin{cases}
2x -\tfrac{3}{2}z + 8y = 11 \\
9z + 2w + 5k = -3,
\end{cases}
\qquad
\begin{cases}
0k+0w+2x + 8y – \tfrac{3}{2}z = 11 \\
5k+2w+0x+0y+9z = -3.
\end{cases}
\]

¿Qué quiere decir resolver un sistema de ecuaciones lineales?

Como recordarás, encontrar una solución de una ecuación corresponde a encontrar valores que, al sustituirlos en las variables, hagan que la expresión sea verdadera. Por ejemplo, si tenemos la ecuación $2x-3y=0$, una solución está dada por $x=3$ y $y=2$, ya que al sustituir en efecto tenemos $(2)(3)-(3)(2)=0$. En ocasiones, una ecuación puede tener más de una solución. Por ejemplo, en este caso otra posible solución es $x=6$ y $y=4$, ya que al sustituir en efecto tenemos $(2)(6)-(3)(4)=0$. Para esta ecuación hemos encontrado entonces dos posibles soluciones. Pero aún no la hemos resuelto. Como veremos un poco más abajo, para resolverla tenemos que alcanzar una meta más grande.

Para el caso de sistemas de ecuaciones lineales, encontrar una solución consiste en dar una asignación de valores a las variables que hagan que todas las ecuaciones sean ciertas simultáneamente. Por ejemplo, podemos verificar que los valores
\[
x = 3 \quad y =5 \quad z = -2
\]
hacen que cada una de las ecuaciones en el sistema
\[
\begin{cases}
x + 2y – z = 15 \\
4x – y + z = 5
\end{cases}
\]
se cumplan simultáneamente. Otra posible solución está dada por la asignación
\[
x = 1 \quad y =15 \quad z = 16.
\]

Cuando hablamos de resolver una ecuación o un sistema de ecuaciones no nos bastará encontrar unas cuantas soluciones que funcionen. Queremos encontrar todas las posibles soluciones.

Como ejemplo más sencillo, tratemos de encontrar todas las soluciones del sigueinte sistema con una única ecuación
\[
\begin{cases}
2x + 3y – z = 5.
\end{cases}
\]

Si despejamos $x$ en la ecuación, obtenemos
\[
x = \frac{-3y+z+5}{2}.
\]
Esto nos indica que podemos escoger valores arbitrarios de $y$ y $z$, y el valor de $x$ quedará determinado por estos valores.

Entonces, la solución de la ecuación son todas las $(x,y,z)$ tales que $x = \frac{-3y+z+5}{2}$; es decir, todas las soluciones del sistema de ecuaciones son de la forma
\[
\left( \frac{-3y+z+5}{2}, y, z \right).
\]

Otra manera de decir esto es que el conjunto de soluciones para el sistema de ecuaciones es el siguiente:

$$S:=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}.$$

Esto ahora sí resuelve el sistema, pues hemos encontrado una descripción para todas las posibles soluciones del sistema. Si tomas los valores que quieras para $y$ y $z$, podrás dar una solución. Por ejemplo, al tomar $y=1,z=2$ obtenemos la solución $(2,1,2)$, la cual puedes verificar que es una solución al sistema de ecuaciones de una ecuación con el que comenzamos. Toda posible solución está en $S$. Como $y$ y $z$ pueden valer lo que sea, las llamamos variables libres. A $x$, que queda totalmente determinada una vez fijas las variables libres, la llamamos variable pivote.

¿Qué sucede si tenemos más ecuaciones? Tratemos de encontrar todas las soluciones para el sistema de ecuaciones siguiente
\[
\begin{cases}
y+z =1 \\
3x+2y+5z&=1.
\end{cases}
\]

Podemos intentar lo mismo que arriba y fijar algún valor e intentar poner al resto en términos de ese. Pero hay que ser cuidadosos. Por ejemplo, al fijar el valor de $x$, no podremos despejar a $y$ (ni a $z$) en términos únicamente de $x$. Sin embargo, fijamos el valor de $z$, sí podemos determinar todo completamente.

Al fijar $z$, entonces $y$ queda determinado como $y = -z + 1$. Sustituyendo este valor de $y$ en la segunda ecuación, obtendremos $3x + 2(-z+1) + 5z = 1$, que equivale a $3x +3z = -1$, de donde tenemos que $x = -z -1/3 $. Entonces, podemos pensar a $z$ como la variable libre y como $y$ y $x$ dependen completamente de $z$, las pensamos como variables pivote. La descripción de las soluciones quedaría entonces como

$$R=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}.$$

Aunque ahora hemos tenido éxito con describir totalmente las soluciones de dos sistemas de ecuaciones y en ambos casos hemos tenido una infinidad de soluciones, lo cierto es que existen sistemas de ecuaciones sin solución. Por ejemplo, consideremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
4x + 3y = 8.
\end{cases}
\]
Podemos ver que cada una de las ecuaciones, de manera individual, tienen soluciones, y hasta podríamos encontrar todas las posibles soluciones (¿puedes dar un par de ejemplos de cada una?). Sin embargo, no existen valores de $x$ y $y$ que resuelvan ambas ecuaciones al mismo tiempo. Esto lo podemos observar porque, si multiplicamos la segunda ecuación por $3$, obtendremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
12x + 9y = 24.
\end{cases}
\]
Si hubiera alguna solución, podríamos igualar ambas ecuaciones y llegar a que $7=24$, una contradicción.

Interpretación geométrica

El primer conjunto solución que encontramos arriba se puede reescribir en términos de cada variable $y$ y $z$ usando la suma y producto escalar que estudiamos en entradas anteriores de la siguiente manera:

\begin{align*}
S&=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}\\
&=\left\{y(-3/2,1,0) + z(1/2,0,1) + (5/2,0,0):y,z\in \mathbb{R}\right\}.
\end{align*}

Posiblemente hayas visto expresiones en algún curso de geometría analítica. Lo anterior es un plano en $\mathbb{R}^3$ que pasa por el punto $(5/2,0,0)$ y generado a partir de ese punto por los vectores $(-3/2,1,0)$ y $(1/2,0,1)$.

Del mismo modo, en el segundo ejemplo que vimos arriba el sistema de ecuaciones puede reescribirse como:

\begin{align*}
R&=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}\\
&=\{(-1/3,1,0)+z(-1,-1,1):z\in \mathbb{R}\},
\end{align*}

que posiblemente identifiques como la recta en $\mathbb{R}^3$ que parte del punto $(-1/3,1,0)$ y tiene dirección $(-1,-1,1)$.

Forma matricial de un sistema de ecuaciones

Como vimos en una entrada previa, dos vectores del mismo tamaño son iguales si y sólo si sus respectivas entradas son iguales. Una consecuencia de esta definición es que el sistema de ecuaciones
\[
\begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n & = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n & = b_2 \\
& \vdotswithin{\mspace{15mu}} \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m
\end{cases}
\]
se cumple si y sólo si
\[
\begin{pmatrix}
a_{11}x_1 + a_{12}x_2 + \cdots a_{1n}x_n \\
a_{21}x_1 + a_{22}x_2 + \cdots a_{2n}x_n \\
\vdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots a_{mn}x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

Más aún, observemos que el lado izquierdo de esta igualdad lo podemos reescribir como un producto de matriz con vector de la siguiente manera
\[
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\begin{pmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix},
\]
lo cual podemos denotar como
\[
Ax = b.
\]

Entonces, podemos decir que nuestro sistema tiene solución si existe un vector $x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}$ tal que $Ax = b$, donde
\[
A
=
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\quad
\text{y}
\quad
b
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

A la expresión $Ax=b$ le llamamos la forma matricial del sistema de ecuaciones.

Ejemplo de la utilidad de la forma matricial

La forma matricial de un sistema de ecuaciones es sumamente útil, como veremos en las siguientes entradas. Pero veamos un pequeño ejemplo de una de sus aplicaciones. Supongamos que sabemos que la matriz $A$ es invertible con inversa $A^{-1}$. Recordemos que entonces se cumple que$A^{-1}A = \mathcal{I}$. Gracias a esto, podemos comenzar con la forma matricial del sistema de ecuaciones y deducir lo siguiente:
\begin{align*}
&Ax = b \\
\Rightarrow & A^{-1}Ax = A^{-1}b \\
\Rightarrow &x = A^{-1}b.
\end{align*}

Es decir, si conocemos la matriz inversa de $A$, ¡podemos obtener de manera única el vector que resuelve el sistema de ecuaciones mediante una multiplicación de matriz por vector!

Aún cuando no hemos visto el método general para saber si una matriz tiene inversa, ya vimos previamente qué sucede con una matriz de $2\times 2$
\[
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\]

Así, verifiquemos mediante un ejemplo que el método que mostramos sirve para encontrar soluciones de sistemas de ecuaciones. Consideremos el sistema de ecuaciones
\[
\begin{cases}
2x + 8y &= 9 \\
-3x + 4y &= 2.
\end{cases}
\]

Este sistema puede ser representado en forma matricial como
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix}.
\]

Como recordarás de entradas pasadas, la matriz inversa de $\begin{pmatrix} 2 & 8 \\ -3 & 4 \end{pmatrix}$ es
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}^{-1}
=
\frac{1}{2\cdot4 – 8\cdot(-3)}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\frac{1}{32}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}.
\]

Entonces si multiplicamos esta por matriz por la izquierda a ambos lados de la ecuación
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix},
\]
obtendremos
\begin{align*}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
5/8 \\
31/32
\end{pmatrix},
\end{align*}
lo que equivale a $x = 5/8$, $y = 31/32$; la solución del sistema. ¡Verifica que es solución!

Más adelante…

En esta entrada repasamos los conceptos y definiciones sobre sistemas de ecuaciones lineales, y nos adentramos a ver cómo existe una relación directa entre los sistemas de ecuaciones lineales y el producto de una matriz por un vector, así como que las matrices invertibles guardan relación con la solución del sistema.

Que la matriz asociada a un sistema de ecuaciones sea invertible en realidad no pasa tanto, y se tienen que desarrollar métodos más generales para resolver sistemas de ecuaciones. En la siguiente entrada conoceremos un algoritmo que nos permitirá resolver sistemas de ecuaciones con una cantidad arbitraria de variables y ecuaciones, y determinar exactamente cómo se ven todas las soluciones.

Tarea moral

  1. Usa el método de las variables libres y las variables pivote para describir al conjunto solución del siguiente sistema de ecuaciones y descríbelo geométricamente. Tendrás que elegir apropiadamente el orden en el que vas fijando las variables.
    \begin{cases}
    w+2x + 8y + 3z&= 0 \\
    -3x + 4y + z&= -1\\
    x+z&=2.\\
    \end{cases}
  2. Usa el método de la inversa para resolver los siguientes tres sistemas de ecuaciones:
    \[
    \begin{cases}
    2x + 8y &= 4 \\
    -3x + 4y &= 1,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 3 \\
    -3x + 4y &= -2,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 1 \\
    -3x + 4y &= -1.
    \end{cases}
    \]
  3. Intenta usar el método de las variables libres y pivote en el siguiente sistema de ecuaciones y explica qué dificultad tiene intentar usarlo directamente:
    \[
    \begin{cases}
    x + y &= 4 \\
    y+z &= 1\\
    z+x&=2.
    \end{cases}
    \]
    ¿Cómo describirías a un sistema de ecuaciones en el cuál se puede hacer el método de variables libres y pivote cómodamente?
  4. Considera un sistema de ecuaciones en forma matricial $Ax=b$. Demuestra que si $x$ y $x’$ son soluciones a este sistema, entonces $\frac{x+x’}{2}$ también lo es. Explica cómo puedes usar esto para a partir de dos soluciones $x$ y $x’$ distintas conseguir una infinidad de soluciones. Concluye que cualquier sistema de ecuaciones lineales o bien no tiene solución, o bien tiene una única solución, o bien tiene una infinidad de soluciones.
  5. Encuentra una matriz no invertible $A$ y un vector $b$ tales que el sistema de ecuaciones $Ax=b$ sí tenga solución. En ese sistema que diste, ¿la solución es única o puedes encontrar otra?

Entradas relacionadas

Álgebra Lineal II: El teorema de clasificación de transformaciones ortogonales

Por Ayax Calderón

Introducción

En la entrada anterior definimos las transformaciones ortogonales y probamos algunas de sus propiedades relacionadas con el producto interior, norma y la transformación adjunta. Vimos también que el conjunto de todas las transformaciones ortogonales de un espacio euclideano $V$ forma un grupo $O(V)$ bajo composición.

En esta entrada queremos entender mucho mejor dicho grupo. El resultado principal que probaremos nos dirá exactamente cómo son todas las posibles transformaciones ortogonales en un espacio euclideano (que podemos pensar que es $\mathbb{R}^n$). Para llegar a este punto, comenzaremos con algunos resultados auxiliares y luego con un lema que nos ayudará a entender a las transformaciones ortogonales en dimensión $2$. Aprovecharemos este lema para probar el resultado para cualquier dimensión.

El lema de los subespacios estables

Lo primero que veremos es que las transformaciones ortogonales preservan completamente los subespacios estables, así como sus espacios ortogonales. Este es el resultado que nos permitirá un poco más adelante trabajar inductivamente.

Lema. Sean $V$ un espacio euclidiano, $T\in O(V)$ y $W$ un subespacio de $V$ estable bajo $T$.

  1. Se tiene que $T(W)=W$ y $T(W^\bot)=W^\bot$.
  2. Se tiene que $T|_W\in O(W)$ y $T|_{W^\bot}\in W^\bot$.

Demostración. 1. Como $T(W)\subseteq W$ y $T|_W$ es inyectiva (pues $T$ es inyectiva en $V$), se sigue que $T|_W:W\to W$ es suprayectiva y por lo tanto $T(W)=W$. Veamos ahora que $W^\bot$ también es estable bajo $T$. Tomemos $x\in W^\bot$ y $y\in W$. Queremos demostrar que $T(x)\in W^\bot$, es decir, que $\langle T(x),y \rangle=0$. Como $T$ es ortogonal, entonces $T^*=T^{-1}$ y por lo tanto
$$\langle T(x),y \rangle=\langle x,T^{-1}(y) \rangle.$$

Como $T|_W:W\to W$ es biyectiva, se tiene que $W$ es estable bajo $T^{-1}$. Entonces $T^{-1}(y)\in W$, y como $x\in W^\bot$, entonces $\langle x,T^{-1}(y) \rangle=0$. Por lo tanto $\langle T(x),y \rangle=0$. Esto muestra que $W^\bot$ es estable bajo $T$ y por la primer parte de este inciso, llegamos a $T(W^\bot)=W^\bot$.

2. Para todo $x\in W$ se tiene que
$$||T|_W(x)||=||T(x)||=||x||,$$
lo que significa que $T|_W\in O(W)$. De manera análoga se tiene que $T_{W^\bot}\in O(W^\bot)$.

$\square$

El lema de la invarianza de una recta o un plano

Para poder aplicar el lema de la sección anterior, tendremos que poder encontrar subespacios estables. El siguiente lema nos dice que siempre podemos encontrar subespacios estables en espacios euclideanos.

Lema. Sea $V$ un espacio euclidiano y $T$ una transformación lineal sobre $V$. Entonces existe una recta (subespacio de dimensión $1$) o un plano (subespacio de dimensión $2$) en $V$ estable bajo $T$.

Demostración. El polinomio mínimo de $T$ es un polinomio $\mu_T(x)$ con coeficientes reales. Si tiene una raíz real, se sigue que $T$ tiene un eigenvalor y por consiguiente, la recta generada por un eigenvector es estable bajo $T$.

Ahora supongamos que $\mu_T(x)$ no tiene raíces reales. Sea $z$ una raíz compeja de $\mu_T(x)$, que existe por el teorema fundamental del álgebra. Como $\mu_T(x)$ tiene coeficientes reales, entonces $\overline{z}$ también es raíz de $\mu_T(x)$.Por lo tanto, $Q(x)=(x-z)(x-\overline{z})$ divide a $\mu_T(x)$.

Es imposible que $Q(T)$ sea una matriz invertible, pues de serlo, tendríamos que $\frac{\mu_T}{Q}(x)$ sería un polinomio de grado más chico que $\mu_T(x)$ y anularía a $T$. Esto nos dice que existe $x\in V$ distinto de $0$ tal que $Q(T)(x)=0$. Si $Q(x)=x^2+ax+b$, esto se traduce a $T^2(x)+aT(x)+bx=0$. De aquí, se tiene que $x$ y $T(x)$ generan un plano estable bajo $T$.

$\square$

Las transformaciones ortogonales en dimensión $2$

Los lemas de las secciones anteriores nos permitirán ir partiendo a un espacio euclideano $T$ en «cachitos estables» ya sea de dimensión $1$ o de dimensión $2$. En los de dimensión $1$ ya sabemos cómo debe verse una matriz que represente a $T$: simplemente corresponden a eigenvectores y entonces consistirán en reescalamientos (que deben de ser por factor $1$ ó $-1$ para tener ortogonalidad). Pero, ¿cómo se verá matricialmente la transformación $T$ en subespacios estables de dimensión $2$ que no se puedan descomponer más? Esto es lo que nos responde el siguiente lema.

Lema. Sea $V$ un espacio euclidiano de dimensión $2$ y $T\in O(V)$ sin eigenvalores reales. Entonces existe una base ortonormal de $V$ tal que la matriz asociada a $T$ en dicha base es de la forma
$$R_\theta=\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta\end{pmatrix}.$$

Demostración. Sea $\beta=\{e_1,e_2\}$ una base ortonormal de $V$ y escribimos $T(e_1)=ae_1+be_2$ para algunos números reales $a,b$. Como
$$a^2+b^2=||T(e_1)||^2=||e_1||^2=1,$$ entonces podemos encontrar un número real $\theta$ tal que $(a,b)=(\cos\theta,\sin\theta)$.

Para que $\langle T(e_1), T(e_2)\rangle = 0$, necesitamos que exista un $c$ tal que $T(e_2)=c(-\sin\theta e_1+\cos \theta e_2)$. Finalmente, ya que $$||T(e_2)||=||e_2||=1, $$ debemos tener $|c|=1$ y así $c\in \{-1,1\}$.

El caso $c=-1$ podemos descartarlo pues la matriz que representa a $T$ en la base $\beta$ sería
$$\begin{pmatrix}
\cos \theta & \sin \theta\\
\sin \theta & -\cos\theta\end{pmatrix},$$
cuyo polinomio caracterísitco es $x^2-1$ y por lo tanto tiene a $1$ como eigenvalor, lo cual no entra en nuestras hipótesis. Así, $c=1$ y por lo tanto la matriz que representa a $T$ en la base $\beta$ es
$$\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta\end{pmatrix},$$

como queríamos.

$\square$

El teorema de clasificación

Con lo visto hasta ahora, ya estamos listos para demostrar el teorema fundamental de clasificación de transformaciones lineales ortogonales de un espacio euclidiano.

Teorema (clasificación de ortogonales). Sea $V$ un espacio euclidiano y $T\in O(V)$. Entonces podemos encontrar una base ortonormal $\beta$ de $V$ tal que la matriz asociada a $T$ con respecto a la base $\beta$ es de la forma
\begin{equation}\label{forma}
A=\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix},\end{equation}
donde $\theta_1,\dots, \theta_k$ son números reales y
$$R_\theta=\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta
\end{pmatrix}.$$

Demostración. Procederemos por inducción sobre $\dim V$. Si $\dim V=1$, entonces ya terminamos, pues se tendría que $T=\pm id$ (esto quedó de tarea moral en la entrada anterior).

Supongamos que el resultado se satisface para todos los espacios euclideanos de dimensión a lo más $n-1$. Tomemos $V$ un espacio euclideano de dimensión $n$ y $T$ una transformación ortogonal de $V$. Por el lema de la invarianza de una recta o un plano, o bien $V$ tiene una recta estable bajo $T$, o bien un plano estable bajo $T$.

El caso en que $T$ tiene una recta estable bajo $T$ corresponde a que $T$ tiene un eigenvalor real $t$ con eigenvector, digamos, $e_1$. Entonces $$|t|||e_1||=||te_1||=||T(e_1)||=||e_1||,$$
por lo cual $t\in\{-1,1\}$. Sea $W$ la recta generada por $e_1$.

Tenemos que $V=W\oplus W^\bot$. Por el lema de subespacios estables, $T(W)=W$ y $T|_{W^\bot}$ es ortogonal de $W^\bot$. Por hipótesis inductiva, $W^\bot$ tiene una base ortonormal $\{e_2,\dots , e_n\}$ tal que la matriz asociada a dicha base y restringida a $W^\bot$ es de la forma \eqref{forma}. Añadiendo el vector $\frac{e_1}{||e_1||}$ se añade un $1$ o $-1$ en la diagonal, así que, posiblemente permutando la base ortonormal resultante $\{\frac{e_1}{||e_1||},e_2,\dots ,e_n\}$ de $V$ obtenemos una base ortonormal tal que la matriz asociada a $T$ con respecto a esta base es de la forma \eqref{forma}.

Ahora supongamos que $T$ no tiene valores propios reales, es decir, que estamos en el caso de tener un plano estable bajo $T$. Como $T$ es ortogonal, el espacio $W^\bot$ también es estable bajo $T$, y las restricciones de $T$ a $W$ y $W^\bot$ son transformaciones otogonales sobre estos espacios. Por hipótesis inductiva, $W^\bot$ tiene una base ortonormal $\{e_3,\dots,e_n\}$ tal que la matriz asociada a $T|_{W^\bot}$ con respecto a esta base es una matriz diagonal de bloques de la forma $R_{\theta_i}$. Por el lema de transformaciones ortogonales en dimensión $2$, el subespacio $W$ tiene una base ortonormla $\{e_1,e_2\}$ tal que la matriz asociada a $T|_W$ con respecto a esta base es de la forma $R_\theta$. Como $V=W\oplus W^\bot$, entonces la matriz asociada a $T$ con respecto a la base $\{e_1,\dots, e_n\}$ es de la forma \eqref{forma}, con lo cual concluimos con la prueba deseada.

$\square$

También podemos enunciar el teorema anterior en términos de matrices:

Corolario. Sea $A\in M_n(\mathbb{R})$ una matriz ortogonal. Entonces existen enteros $p,q,k$ que satisfacen $p+q+2k=n$, una matriz ortogonal $P\in M_n(\mathbb{R})$ y números reales $\theta_1,\dots , \theta_n$ tales que
$$A=P^{-1}\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix}P.$$

Observación. El determinante de la matriz
$$\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix}$$
es $(-1)^q\in\{1,-1\}$ (estamos usando $\det R_{\theta_i}=1$ para $1\leq i\leq k$). Se sigue que $$\det T\in\{-1,1\}$$ para cualquier $T\in O(V)$.

Más adelante…

Por lo platicado en esta entrada, ya podemos decir cómo es cualquier transformación ortogonal, y no es tan complicado: simplemente en alguna base apropiada, se rota en pares de coordenadas, o bien se refleja en coordenadas, o bien no se hace nada en alguna coordenada (o una combinación de estas cosas). Todo esto intuitivamente deja fijas las normas y el teorema de clasificación nos dice que si se fijan normas entonces debe ser así. Por ello, podemos pensar a las transformaciones ortonormales como «sencillas» o por lo menos «entendibles».

Aprovecharemos esto en el siguiente tema, pues enunciaremos el teorema espectral real, que nos dice que las transformaciones simétricas se entienden muy bien a partir de las ortogonales y de las diagonales. Así, las transformaciones simétricas también serán «entendibles». Finalmente, con el teorema de descomposición polar llevaremos este entendimiento a todas, todas las matrices.

Tarea moral

  1. Verifica que, en efecto, las matrices $R_\theta$ de la entrada tienen determinante igual a $1$.
  2. Sea $V$ un espacio euclidiano y $T:V\to V$ una transformación lineal. Demuestra que $T$ es ortogonal si y sólo si $||T(x)||=||x||$ para los vectores $x$ de norma $1$.
  3. Encuentra la matriz de rotación de ángulo $\frac{\pi}{3}$ alrededor de la recta generada por el vector $(1,1,1)$.
  4. Describe todas las matrices en $M_3(\mathbb{R})$ que son simultaneamente ortogonales y diagonales.
  5. Describe todas las matrices en $M_3(\mathbb{R})$ que sean simultáneamente ortogonales y triangulares superiores.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Geometría Analítica I: Rectas en forma paramétrica

Por Elsa Fernanda Torres Feria

Introducción

Anteriormente definimos las operaciones de suma y de producto escalar en $\mathbb{R}^2$. Después de eso, enunciamos varias de sus propiedades y demostramos algunas de ellas. Lo que haremos ahora es utilizar lo que hemos construido para dar una definición clave de nuestro modelo: la de recta.

Mediante varios interactivos veremos que las propiedades algebraicas que estamos pidiendo en efecto satisfacen lo que queremos de las rectas a partir de nuestra intuición geométrica. Además de esto, demostraremos una proposición que unifica los postulados $1$ y $3$ de Euclides, lo cual será señal de que vamos en buen camino para obtener dichos postulados a partir de nuestro enfoque algebraico. Cerraremos con algunos ejemplos de rectas en su forma paramétrica.

Rectas en forma paramétrica

Iniciemos formalmente con la definición de la recta.

Definición. Dados un punto $P$ y un vector $Q \neq 0 $, la recta que pasa por $P$ con dirección $Q$ es el conjunto

$L=\{ P+rQ : r \in \mathbb{R} \}$

En la definición anterior se piensan a $P$ y $Q$ fijos y a $r$ como un parámetro variable. Con esto en mente, tiene sentido que esta expresión sea conocida como la forma paramétrica de la recta.

Como lo mencionamos al inicio, conocemos todo lo necesario para comprender esta forma paramétrica y es pertinente analizar un poco sus partes para poder realizar la representación gráfica.

El conjunto $L$ está representado por la suma de un punto fijo $P$ en el espacio y por un término de la forma $rQ$ que, si recuerdas, representa un producto escalar y que sabemos cómo se ve en el espacio. Si $r$ es fijo, tenemos un re-escalamiento del vector $Q$ y en el caso en el que $r<0$ un cambio de dirección. Para la forma paramétrica de la recta, resulta que $r$ no es fijo, y aunque esta es la primera vez que vemos algo así, es posible pensarlo como la unión de los casos cuando $r$ es fijo, una unión de tantos elementos como $\mathbb{R}$. Así $rQ$ representa una recta formada por todos los re-escalamientos posibles de el vector $Q$: la recta que pasa por el origen y por $Q$.

¿Cómo se verá entonces el total $P+rQ$? Si de nuevo pensamos en un $r$ específico, tenemos que $rQ$ es un re-escalamiento. Por el método del paralelogramo sabemos que $P+rQ$ es avanzar desde el origen hasta el punto $P$ y tomando ahora este «como origen», avanzar hasta $rQ$; de cierta manera estamos trasladando $rQ$ para que empiece en $P$. Volviendo al caso general, la recta dada por $P+rQ$ se ve como la recta dada por $rQ$, pero trasladada paralelamente para que pase por el punto $P$.

Ejemplo. Sean $P=(-3,5)$ y $Q=(2,7)$. Tenemos que la recta $L$ por $P$ y con dirección $Q$ es el conjunto

\begin{align*}
L&=\{ (-3,5)+r(2,7) : r \in \mathbb{R} \}\\
&=\{ (-3+2r,5+7r) : r \in \mathbb{R} \}
\end{align*}

En el siguiente interactivo el punto $P$ se encuentra de color rojo, el vector $Q$ y la recta dada por $rQ$ de color verde. La recta paralela a $rQ$ que pasa por $P$ se encuentra de color azul y por último, de color morado se encuentra $P+rQ$ para un $r$ fijo cuyo valor puedes controlar con el deslizador a tu izquierda. El punto $P+rQ$ está diseñado para que al cambiar el valor de $r$ (con el deslizador), puedas ver su rastro, es decir que deje marca por donde pasa. Nota cómo al mover el deslizador, todos los puntos $P+rQ$ se encuentran sobre la recta paralela a la recta definida por la expresión $rQ$ que pasa por el punto $P$.

Así, podemos concluir que la recta dadad por $P+rQ$ es precisamente la recta dada por $rQ$ trasladada paralelamente para que pase por el punto $P$.

$\triangle$

Para cerrar un poco la definición de la forma paramétrica, planteemos algunos casos especiales del parámetro $r$:

  • Cuando $r=0$ tenemos al punto $P$.
  • Cuando $r=1$, el punto en la recta corresponde a $P+Q$.
  • ¿Qué pasa entonces cuando $0<r<1$ ? Resulta que en tal caso nos encontramos en el segmento comprendido entre $P$ y $P+Q$ pues $rQ$ será una fracción de $Q$ y al sumárselo a $P$ obtenemos un vector que parte de $P$ ($0<r$) y llega hasta $P+rQ$, que «queda antes» de $P+Q$, pues $r<1$.

Función asociada a la recta

Hagamos un pequeño paréntesis para hablar de la relación que tiene esta expresión de la recta con los números reales.

Como acabamos de ver, la forma paramétrica de la recta $L$ está definida con base en un parámetro $r \in \mathbb{R}$. Al decir «parámetro» queremos expresar que es una variable que nos ayuda a definir nuestro objeto, en este caso una recta. Como $r$ corre en todos los reales, puede fungir como la variable de una función asociada a la recta. Aquí $\mathbb{R}$ es nuestro dominio, y el codominio es $L$. Así, podemos definir $\phi: \mathbb{R} \rightarrow L$ como

$\phi (r)=P+rQ.$

Resulta que esta función bajo esta función a cada valor de $r$ le corresponde uno y sólo un valor en $L$ (es función suprayectiva) y cada valor de $L$ se obtiene de un único $r$ (es inyectiva).

Proposición. La función $\phi(r)$ es biyectiva.

Demostración. Ver que $\phi$ es suprayectiva es inmediato pues la recta $L$ está definida precisamente mediante el parámetro $r$ y no hay manera de que en $L$ haya puntos que tengan otra expresión. Veamos ahora que es inyectiva. Para esto supongamos que existen $r,s \in \mathbb{R}$ tales que $\phi(r)=\phi(s)$. Para probar la inyectividad debemos concluir que $r=s$.

Si $\phi(r)=\phi(s)$, por definición de la función se tiene

$P+rQ=P+sQ$

Sumando $-(P+sQ)$ de ambos lados obtenemos, $P+rQ-(P+sQ)=0$ y desarrollando el lado izquierdo con las propiedades de suma y producto escalar obtenemos que

\begin{align*}
0&=P+rQ-(P+sQ)\\
&=P+rQ-P-sQ\\
&=P-P+rQ-sQ\\
&=0+rQ-sQ\\
&=rQ-sQ\\
&=Q(r-s).
\end{align*}

Es importante que en este punto te cuestiones qué propiedades de la suma y producto escalar se están usando en cada una de las igualdades anteriores.

En resumen, obtenemos que $Q(r-s)=0$. Pero en la definición de la recta se establece que $Q \neq 0$. De este modo, concluimos que $r-s=0$, que en otras palabras es la igualdad $r=s$ que buscábamos. Concluimos que existe una biyección entre cualquier recta y los reales.

$\square$

Otra forma de pensar la inyectividad en el resultado anterior es que «una recta no pasa más de una vez por cada punto».

Ejemplos de rectas en forma paramétrica

Para cerrar esta entrada plantearemos algunos ejercicios de rectas en su forma paramétrica e incluiremos sus interactivos.

Problema. Dibuja las siguientes rectas:

  1. $L_1=\{ (2,3)+ t(1,1) : t \in \mathbb{R} \}$
  2. $L_2= \{ (r-1,-2r) : r \in \mathbb{R} \}$

Solución.

  1. En este ejercicio el punto es $P=(2,3)$ y el vector director $Q=(1,1)$. Para construir la recta que definen, «dibujamos» primero la recta dada por $t(1,1)$ (en azul) y después trazamos su paralela que pase por $(2,3)$ (en verde). Si hicimos bien el procedimiento, cuando muevas el deslizador de $t$, el rastro de $(2,3)+t(1,1)$ debe estar sobre la recta verde. Así, la recta dada por $(2,3)+t(1,1)$ es la recta verde.

$\square$

  1. En este ejercicio tenemos a $P$ y a $rQ$ ya sumados, por lo que tenemos que separarlos (con ayuda de la definición de suma vectorial) para saber cuáles son individualmente. El vector $rQ$ es aquel cuyas entradas tienen a $r$, $P$ es lo que queda. Así,

$rQ=(r,-2r)$ y $P=(-1,0).$

Por lo que

$Q=(1,-2).$

Siguiendo el mismo procedimiento del ejercicio anterior, localizamos la recta dada por $rQ=r(1,-2)$ (verde) y trazamos su paralela que pase por $(-1,0)$ (rojo). Si el procedimiento es correcto, entonces cuando muevas el deslizador de $r$ el rastro de $(-10)+r(1,-2)$ se debe posicionar sobre la recta roja. Así la recta roja es la dada por $(r-1,-2r)$.

$\square$

Más adelante…

Con lo que aquí se desarrolló, en la siguiente entrada será posible construir las rectas en su forma baricéntrica y seremos capaces de darle a esta una interpretación física. Más adelante trataremos la intersección de rectas y definiremos la forma normal de una recta.

Tarea moral

  • Justifica cada paso de cada procedimiento con ayuda de los axiomas de los reales y las propiedades que se probaron en la entrada anterior.
  • Escribe la ecuación que representa a una partícula que pasa por el orígen en un tiempo $t=0$ («su punto de partida») y que cada unidad de tiempo avanza cambia su posición sumando $(-5,-3)$. La ecuación tendrá la forma paramétrica de una recta.
  • Dibuja las siguientes dos rectas (si te es posible con ayuda de GeoGebra):
    • $L_a=\{ (0,-2)+(-r,2r) : r \in \mathbb{R} \}$
    • $L_b=\{ (2s-1,s) : s \in \mathbb{R} \}$
  • Considera los puntos $P=(5,-3)$ y $Q=(-7,2)$. ¿Es la misma la recta por $P$ con dirección $Q$ que la recta por $Q$ con dirección $P$? Realiza una figura.