Archivo de la etiqueta: plano

Álgebra Superior I: Sistemas de ecuaciones lineales

Por Eduardo García Caballero

Introducción

Una de las aplicaciones más importantes de los vectores y matrices tiene que ver con un tema que conociste desde la secundaria y preparatoria: los sistemas de ecuaciones.

Más específicamente, los vectores y matrices nos serán de gran utilidad para resolver sistemas de ecuaciones lineales, determinar cuándo un sistema sí tiene soluciones, y cuáles son todas sus soluciones.

Pero antes, repasemos un poco los conceptos de sistemas de ecuaciones lineales.

Sistemas de ecuaciones lineales

Recordemos que una ecuación es una expresión en la que hay variables o valores que no conocemos. En el caso de una ecuación lineal, se trata de ecuaciones en las que todas sus variables se encuentran elevadas a la primera potencia y acompañadas únicamente por coeficientes constantes. Por ejemplo, podemos ver que las expresiones
\[
2x + 9y – z = 3,
\qquad
4w + 3000a = y + \tfrac{1}{2}x
\]
son ecuaciones lineales, mientras que las expresiones
\[
ax^2 + bx + c = 0,
\qquad
2xz = 9y
\]
no lo son, pues contienen al menos una variable elevada a exponentes distintos de $1$, o bien hay variables multiplicándose entre sí.

De manera más formal, una ecuación de lineal es una ecuación que se puede escribir de la forma
\[
a_1x_2 + a_2x_2 + \cdots + a_nx_n = b,
\]
donde $x_1, \ldots, x_n$ son variables y $a_1, \ldots, a_n, b$ son coeficientes, todos del mismo tipo (en este curso trabajaremos con coeficientes reales, pero en otros cursos podrás encontrar coeficientes de otros tipos, como son números enteros, racionales, y complejos, entre otros).

Por su parte, un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales. Por ejemplo, los siguientes son sistemas de ecuaciones lineales:
\[
\begin{cases}
2x -\tfrac{3}{2}y + 8z = 1 \\
9z + 2w + 5y = 3,
\end{cases}
\qquad
\begin{cases}
2 + 9a = 46b -5c \\
2d + 8x = \sqrt{3} \\
x + y + z = a + b + c \\
x = -y
\end{cases}
\]
Bajo esta definición, una única ecuación se puede considerar un sistema de ecuaciones lineales (con una ecuación).

Notemos que no es necesario que todas las ecuaciones compartan variables, sin embargo, generalmente esto sí sucederá. De hecho, podemos pensar que todas las variables aparecen en todas las ecuaciones. En caso de que esto no suceda, podemos considerar que las variables que no aparecen en una ecuación tienen coeficiente cero. Además, siempre podemos reordenar las variables en las ecuaciones para que en todas ellas aparezcan en el mimo orden. Por ejemplo, a continuación el sistema de ecuaciones a la izquierda lo podemos escribir como el de la derecha, sin alterarlo.

\[
\begin{cases}
2x -\tfrac{3}{2}z + 8y = 11 \\
9z + 2w + 5k = -3,
\end{cases}
\qquad
\begin{cases}
0k+0w+2x + 8y – \tfrac{3}{2}z = 11 \\
5k+2w+0x+0y+9z = -3.
\end{cases}
\]

¿Qué quiere decir resolver un sistema de ecuaciones lineales?

Como recordarás, encontrar una solución de una ecuación corresponde a encontrar valores que, al sustituirlos en las variables, hagan que la expresión sea verdadera. Por ejemplo, si tenemos la ecuación $2x-3y=0$, una solución está dada por $x=3$ y $y=2$, ya que al sustituir en efecto tenemos $(2)(3)-(3)(2)=0$. En ocasiones, una ecuación puede tener más de una solución. Por ejemplo, en este caso otra posible solución es $x=6$ y $y=4$, ya que al sustituir en efecto tenemos $(2)(6)-(3)(4)=0$. Para esta ecuación hemos encontrado entonces dos posibles soluciones. Pero aún no la hemos resuelto. Como veremos un poco más abajo, para resolverla tenemos que alcanzar una meta más grande.

Para el caso de sistemas de ecuaciones lineales, encontrar una solución consiste en dar una asignación de valores a las variables que hagan que todas las ecuaciones sean ciertas simultáneamente. Por ejemplo, podemos verificar que los valores
\[
x = 3 \quad y =5 \quad z = -2
\]
hacen que cada una de las ecuaciones en el sistema
\[
\begin{cases}
x + 2y – z = 15 \\
4x – y + z = 5
\end{cases}
\]
se cumplan simultáneamente. Otra posible solución está dada por la asignación
\[
x = 1 \quad y =15 \quad z = 16.
\]

Cuando hablamos de resolver una ecuación o un sistema de ecuaciones no nos bastará encontrar unas cuantas soluciones que funcionen. Queremos encontrar todas las posibles soluciones.

Como ejemplo más sencillo, tratemos de encontrar todas las soluciones del sigueinte sistema con una única ecuación
\[
\begin{cases}
2x + 3y – z = 5.
\end{cases}
\]

Si despejamos $x$ en la ecuación, obtenemos
\[
x = \frac{-3y+z+5}{2}.
\]
Esto nos indica que podemos escoger valores arbitrarios de $y$ y $z$, y el valor de $x$ quedará determinado por estos valores.

Entonces, la solución de la ecuación son todas las $(x,y,z)$ tales que $x = \frac{-3y+z+5}{2}$; es decir, todas las soluciones del sistema de ecuaciones son de la forma
\[
\left( \frac{-3y+z+5}{2}, y, z \right).
\]

Otra manera de decir esto es que el conjunto de soluciones para el sistema de ecuaciones es el siguiente:

$$S:=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}.$$

Esto ahora sí resuelve el sistema, pues hemos encontrado una descripción para todas las posibles soluciones del sistema. Si tomas los valores que quieras para $y$ y $z$, podrás dar una solución. Por ejemplo, al tomar $y=1,z=2$ obtenemos la solución $(2,1,2)$, la cual puedes verificar que es una solución al sistema de ecuaciones de una ecuación con el que comenzamos. Toda posible solución está en $S$. Como $y$ y $z$ pueden valer lo que sea, las llamamos variables libres. A $x$, que queda totalmente determinada una vez fijas las variables libres, la llamamos variable pivote.

¿Qué sucede si tenemos más ecuaciones? Tratemos de encontrar todas las soluciones para el sistema de ecuaciones siguiente
\[
\begin{cases}
y+z =1 \\
3x+2y+5z&=1.
\end{cases}
\]

Podemos intentar lo mismo que arriba y fijar algún valor e intentar poner al resto en términos de ese. Pero hay que ser cuidadosos. Por ejemplo, al fijar el valor de $x$, no podremos despejar a $y$ (ni a $z$) en términos únicamente de $x$. Sin embargo, fijamos el valor de $z$, sí podemos determinar todo completamente.

Al fijar $z$, entonces $y$ queda determinado como $y = -z + 1$. Sustituyendo este valor de $y$ en la segunda ecuación, obtendremos $3x + 2(-z+1) + 5z = 1$, que equivale a $3x +3z = -1$, de donde tenemos que $x = -z -1/3 $. Entonces, podemos pensar a $z$ como la variable libre y como $y$ y $x$ dependen completamente de $z$, las pensamos como variables pivote. La descripción de las soluciones quedaría entonces como

$$R=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}.$$

Aunque ahora hemos tenido éxito con describir totalmente las soluciones de dos sistemas de ecuaciones y en ambos casos hemos tenido una infinidad de soluciones, lo cierto es que existen sistemas de ecuaciones sin solución. Por ejemplo, consideremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
4x + 3y = 8.
\end{cases}
\]
Podemos ver que cada una de las ecuaciones, de manera individual, tienen soluciones, y hasta podríamos encontrar todas las posibles soluciones (¿puedes dar un par de ejemplos de cada una?). Sin embargo, no existen valores de $x$ y $y$ que resuelvan ambas ecuaciones al mismo tiempo. Esto lo podemos observar porque, si multiplicamos la segunda ecuación por $3$, obtendremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
12x + 9y = 24.
\end{cases}
\]
Si hubiera alguna solución, podríamos igualar ambas ecuaciones y llegar a que $7=24$, una contradicción.

Interpretación geométrica

El primer conjunto solución que encontramos arriba se puede reescribir en términos de cada variable $y$ y $z$ usando la suma y producto escalar que estudiamos en entradas anteriores de la siguiente manera:

\begin{align*}
S&=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}\\
&=\left\{y(-3/2,1,0) + z(1/2,0,1) + (5/2,0,0):y,z\in \mathbb{R}\right\}.
\end{align*}

Posiblemente hayas visto expresiones en algún curso de geometría analítica. Lo anterior es un plano en $\mathbb{R}^3$ que pasa por el punto $(5/2,0,0)$ y generado a partir de ese punto por los vectores $(-3/2,1,0)$ y $(1/2,0,1)$.

Del mismo modo, en el segundo ejemplo que vimos arriba el sistema de ecuaciones puede reescribirse como:

\begin{align*}
R&=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}\\
&=\{(-1/3,1,0)+z(-1,-1,1):z\in \mathbb{R}\},
\end{align*}

que posiblemente identifiques como la recta en $\mathbb{R}^3$ que parte del punto $(-1/3,1,0)$ y tiene dirección $(-1,-1,1)$.

Forma matricial de un sistema de ecuaciones

Como vimos en una entrada previa, dos vectores del mismo tamaño son iguales si y sólo si sus respectivas entradas son iguales. Una consecuencia de esta definición es que el sistema de ecuaciones
\[
\begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n & = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n & = b_2 \\
& \vdotswithin{\mspace{15mu}} \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m
\end{cases}
\]
se cumple si y sólo si
\[
\begin{pmatrix}
a_{11}x_1 + a_{12}x_2 + \cdots a_{1n}x_n \\
a_{21}x_1 + a_{22}x_2 + \cdots a_{2n}x_n \\
\vdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots a_{mn}x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

Más aún, observemos que el lado izquierdo de esta igualdad lo podemos reescribir como un producto de matriz con vector de la siguiente manera
\[
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\begin{pmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix},
\]
lo cual podemos denotar como
\[
Ax = b.
\]

Entonces, podemos decir que nuestro sistema tiene solución si existe un vector $x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}$ tal que $Ax = b$, donde
\[
A
=
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\quad
\text{y}
\quad
b
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

A la expresión $Ax=b$ le llamamos la forma matricial del sistema de ecuaciones.

Ejemplo de la utilidad de la forma matricial

La forma matricial de un sistema de ecuaciones es sumamente útil, como veremos en las siguientes entradas. Pero veamos un pequeño ejemplo de una de sus aplicaciones. Supongamos que sabemos que la matriz $A$ es invertible con inversa $A^{-1}$. Recordemos que entonces se cumple que$A^{-1}A = \mathcal{I}$. Gracias a esto, podemos comenzar con la forma matricial del sistema de ecuaciones y deducir lo siguiente:
\begin{align*}
&Ax = b \\
\Rightarrow & A^{-1}Ax = A^{-1}b \\
\Rightarrow &x = A^{-1}b.
\end{align*}

Es decir, si conocemos la matriz inversa de $A$, ¡podemos obtener de manera única el vector que resuelve el sistema de ecuaciones mediante una multiplicación de matriz por vector!

Aún cuando no hemos visto el método general para saber si una matriz tiene inversa, ya vimos previamente qué sucede con una matriz de $2\times 2$
\[
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\]

Así, verifiquemos mediante un ejemplo que el método que mostramos sirve para encontrar soluciones de sistemas de ecuaciones. Consideremos el sistema de ecuaciones
\[
\begin{cases}
2x + 8y &= 9 \\
-3x + 4y &= 2.
\end{cases}
\]

Este sistema puede ser representado en forma matricial como
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix}.
\]

Como recordarás de entradas pasadas, la matriz inversa de $\begin{pmatrix} 2 & 8 \\ -3 & 4 \end{pmatrix}$ es
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}^{-1}
=
\frac{1}{2\cdot4 – 8\cdot(-3)}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\frac{1}{32}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}.
\]

Entonces si multiplicamos esta por matriz por la izquierda a ambos lados de la ecuación
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix},
\]
obtendremos
\begin{align*}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
5/8 \\
31/32
\end{pmatrix},
\end{align*}
lo que equivale a $x = 5/8$, $y = 31/32$; la solución del sistema. ¡Verifica que es solución!

Más adelante…

En esta entrada repasamos los conceptos y definiciones sobre sistemas de ecuaciones lineales, y nos adentramos a ver cómo existe una relación directa entre los sistemas de ecuaciones lineales y el producto de una matriz por un vector, así como que las matrices invertibles guardan relación con la solución del sistema.

Que la matriz asociada a un sistema de ecuaciones sea invertible en realidad no pasa tanto, y se tienen que desarrollar métodos más generales para resolver sistemas de ecuaciones. En la siguiente entrada conoceremos un algoritmo que nos permitirá resolver sistemas de ecuaciones con una cantidad arbitraria de variables y ecuaciones, y determinar exactamente cómo se ven todas las soluciones.

Tarea moral

  1. Usa el método de las variables libres y las variables pivote para describir al conjunto solución del siguiente sistema de ecuaciones y descríbelo geométricamente. Tendrás que elegir apropiadamente el orden en el que vas fijando las variables.
    \begin{cases}
    w+2x + 8y + 3z&= 0 \\
    -3x + 4y + z&= -1\\
    x+z&=2.\\
    \end{cases}
  2. Usa el método de la inversa para resolver los siguientes tres sistemas de ecuaciones:
    \[
    \begin{cases}
    2x + 8y &= 4 \\
    -3x + 4y &= 1,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 3 \\
    -3x + 4y &= -2,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 1 \\
    -3x + 4y &= -1.
    \end{cases}
    \]
  3. Intenta usar el método de las variables libres y pivote en el siguiente sistema de ecuaciones y explica qué dificultad tiene intentar usarlo directamente:
    \[
    \begin{cases}
    x + y &= 4 \\
    y+z &= 1\\
    z+x&=2.
    \end{cases}
    \]
    ¿Cómo describirías a un sistema de ecuaciones en el cuál se puede hacer el método de variables libres y pivote cómodamente?
  4. Considera un sistema de ecuaciones en forma matricial $Ax=b$. Demuestra que si $x$ y $x’$ son soluciones a este sistema, entonces $\frac{x+x’}{2}$ también lo es. Explica cómo puedes usar esto para a partir de dos soluciones $x$ y $x’$ distintas conseguir una infinidad de soluciones. Concluye que cualquier sistema de ecuaciones lineales o bien no tiene solución, o bien tiene una única solución, o bien tiene una infinidad de soluciones.
  5. Encuentra una matriz no invertible $A$ y un vector $b$ tales que el sistema de ecuaciones $Ax=b$ sí tenga solución. En ese sistema que diste, ¿la solución es única o puedes encontrar otra?

Entradas relacionadas

Álgebra Lineal II: El teorema de clasificación de transformaciones ortogonales

Por Ayax Calderón

Introducción

En la entrada anterior definimos las transformaciones ortogonales y probamos algunas de sus propiedades relacionadas con el producto interior, norma y la transformación adjunta. Vimos también que el conjunto de todas las transformaciones ortogonales de un espacio euclideano $V$ forma un grupo $O(V)$ bajo composición.

En esta entrada queremos entender mucho mejor dicho grupo. El resultado principal que probaremos nos dirá exactamente cómo son todas las posibles transformaciones ortogonales en un espacio euclideano (que podemos pensar que es $\mathbb{R}^n$). Para llegar a este punto, comenzaremos con algunos resultados auxiliares y luego con un lema que nos ayudará a entender a las transformaciones ortogonales en dimensión $2$. Aprovecharemos este lema para probar el resultado para cualquier dimensión.

El lema de los subespacios estables

Lo primero que veremos es que las transformaciones ortogonales preservan completamente los subespacios estables, así como sus espacios ortogonales. Este es el resultado que nos permitirá un poco más adelante trabajar inductivamente.

Lema. Sean $V$ un espacio euclidiano, $T\in O(V)$ y $W$ un subespacio de $V$ estable bajo $T$.

  1. Se tiene que $T(W)=W$ y $T(W^\bot)=W^\bot$.
  2. Se tiene que $T|_W\in O(W)$ y $T|_{W^\bot}\in W^\bot$.

Demostración. 1. Como $T(W)\subseteq W$ y $T|_W$ es inyectiva (pues $T$ es inyectiva en $V$), se sigue que $T|_W:W\to W$ es suprayectiva y por lo tanto $T(W)=W$. Veamos ahora que $W^\bot$ también es estable bajo $T$. Tomemos $x\in W^\bot$ y $y\in W$. Queremos demostrar que $T(x)\in W^\bot$, es decir, que $\langle T(x),y \rangle=0$. Como $T$ es ortogonal, entonces $T^*=T^{-1}$ y por lo tanto
$$\langle T(x),y \rangle=\langle x,T^{-1}(y) \rangle.$$

Como $T|_W:W\to W$ es biyectiva, se tiene que $W$ es estable bajo $T^{-1}$. Entonces $T^{-1}(y)\in W$, y como $x\in W^\bot$, entonces $\langle x,T^{-1}(y) \rangle=0$. Por lo tanto $\langle T(x),y \rangle=0$. Esto muestra que $W^\bot$ es estable bajo $T$ y por la primer parte de este inciso, llegamos a $T(W^\bot)=W^\bot$.

2. Para todo $x\in W$ se tiene que
$$||T|_W(x)||=||T(x)||=||x||,$$
lo que significa que $T|_W\in O(W)$. De manera análoga se tiene que $T_{W^\bot}\in O(W^\bot)$.

$\square$

El lema de la invarianza de una recta o un plano

Para poder aplicar el lema de la sección anterior, tendremos que poder encontrar subespacios estables. El siguiente lema nos dice que siempre podemos encontrar subespacios estables en espacios euclideanos.

Lema. Sea $V$ un espacio euclidiano y $T$ una transformación lineal sobre $V$. Entonces existe una recta (subespacio de dimensión $1$) o un plano (subespacio de dimensión $2$) en $V$ estable bajo $T$.

Demostración. El polinomio mínimo de $T$ es un polinomio $\mu_T(x)$ con coeficientes reales. Si tiene una raíz real, se sigue que $T$ tiene un eigenvalor y por consiguiente, la recta generada por un eigenvector es estable bajo $T$.

Ahora supongamos que $\mu_T(x)$ no tiene raíces reales. Sea $z$ una raíz compeja de $\mu_T(x)$, que existe por el teorema fundamental del álgebra. Como $\mu_T(x)$ tiene coeficientes reales, entonces $\overline{z}$ también es raíz de $\mu_T(x)$.Por lo tanto, $Q(x)=(x-z)(x-\overline{z})$ divide a $\mu_T(x)$.

Es imposible que $Q(T)$ sea una matriz invertible, pues de serlo, tendríamos que $\frac{\mu_T}{Q}(x)$ sería un polinomio de grado más chico que $\mu_T(x)$ y anularía a $T$. Esto nos dice que existe $x\in V$ distinto de $0$ tal que $Q(T)(x)=0$. Si $Q(x)=x^2+ax+b$, esto se traduce a $T^2(x)+aT(x)+bx=0$. De aquí, se tiene que $x$ y $T(x)$ generan un plano estable bajo $T$.

$\square$

Las transformaciones ortogonales en dimensión $2$

Los lemas de las secciones anteriores nos permitirán ir partiendo a un espacio euclideano $T$ en «cachitos estables» ya sea de dimensión $1$ o de dimensión $2$. En los de dimensión $1$ ya sabemos cómo debe verse una matriz que represente a $T$: simplemente corresponden a eigenvectores y entonces consistirán en reescalamientos (que deben de ser por factor $1$ ó $-1$ para tener ortogonalidad). Pero, ¿cómo se verá matricialmente la transformación $T$ en subespacios estables de dimensión $2$ que no se puedan descomponer más? Esto es lo que nos responde el siguiente lema.

Lema. Sea $V$ un espacio euclidiano de dimensión $2$ y $T\in O(V)$ sin eigenvalores reales. Entonces existe una base ortonormal de $V$ tal que la matriz asociada a $T$ en dicha base es de la forma
$$R_\theta=\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta\end{pmatrix}.$$

Demostración. Sea $\beta=\{e_1,e_2\}$ una base ortonormal de $V$ y escribimos $T(e_1)=ae_1+be_2$ para algunos números reales $a,b$. Como
$$a^2+b^2=||T(e_1)||^2=||e_1||^2=1,$$ entonces podemos encontrar un número real $\theta$ tal que $(a,b)=(\cos\theta,\sin\theta)$.

Para que $\langle T(e_1), T(e_2)\rangle = 0$, necesitamos que exista un $c$ tal que $T(e_2)=c(-\sin\theta e_1+\cos \theta e_2)$. Finalmente, ya que $$||T(e_2)||=||e_2||=1, $$ debemos tener $|c|=1$ y así $c\in \{-1,1\}$.

El caso $c=-1$ podemos descartarlo pues la matriz que representa a $T$ en la base $\beta$ sería
$$\begin{pmatrix}
\cos \theta & \sin \theta\\
\sin \theta & -\cos\theta\end{pmatrix},$$
cuyo polinomio caracterísitco es $x^2-1$ y por lo tanto tiene a $1$ como eigenvalor, lo cual no entra en nuestras hipótesis. Así, $c=1$ y por lo tanto la matriz que representa a $T$ en la base $\beta$ es
$$\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta\end{pmatrix},$$

como queríamos.

$\square$

El teorema de clasificación

Con lo visto hasta ahora, ya estamos listos para demostrar el teorema fundamental de clasificación de transformaciones lineales ortogonales de un espacio euclidiano.

Teorema (clasificación de ortogonales). Sea $V$ un espacio euclidiano y $T\in O(V)$. Entonces podemos encontrar una base ortonormal $\beta$ de $V$ tal que la matriz asociada a $T$ con respecto a la base $\beta$ es de la forma
\begin{equation}\label{forma}
A=\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix},\end{equation}
donde $\theta_1,\dots, \theta_k$ son números reales y
$$R_\theta=\begin{pmatrix}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta
\end{pmatrix}.$$

Demostración. Procederemos por inducción sobre $\dim V$. Si $\dim V=1$, entonces ya terminamos, pues se tendría que $T=\pm id$ (esto quedó de tarea moral en la entrada anterior).

Supongamos que el resultado se satisface para todos los espacios euclideanos de dimensión a lo más $n-1$. Tomemos $V$ un espacio euclideano de dimensión $n$ y $T$ una transformación ortogonal de $V$. Por el lema de la invarianza de una recta o un plano, o bien $V$ tiene una recta estable bajo $T$, o bien un plano estable bajo $T$.

El caso en que $T$ tiene una recta estable bajo $T$ corresponde a que $T$ tiene un eigenvalor real $t$ con eigenvector, digamos, $e_1$. Entonces $$|t|||e_1||=||te_1||=||T(e_1)||=||e_1||,$$
por lo cual $t\in\{-1,1\}$. Sea $W$ la recta generada por $e_1$.

Tenemos que $V=W\oplus W^\bot$. Por el lema de subespacios estables, $T(W)=W$ y $T|_{W^\bot}$ es ortogonal de $W^\bot$. Por hipótesis inductiva, $W^\bot$ tiene una base ortonormal $\{e_2,\dots , e_n\}$ tal que la matriz asociada a dicha base y restringida a $W^\bot$ es de la forma \eqref{forma}. Añadiendo el vector $\frac{e_1}{||e_1||}$ se añade un $1$ o $-1$ en la diagonal, así que, posiblemente permutando la base ortonormal resultante $\{\frac{e_1}{||e_1||},e_2,\dots ,e_n\}$ de $V$ obtenemos una base ortonormal tal que la matriz asociada a $T$ con respecto a esta base es de la forma \eqref{forma}.

Ahora supongamos que $T$ no tiene valores propios reales, es decir, que estamos en el caso de tener un plano estable bajo $T$. Como $T$ es ortogonal, el espacio $W^\bot$ también es estable bajo $T$, y las restricciones de $T$ a $W$ y $W^\bot$ son transformaciones otogonales sobre estos espacios. Por hipótesis inductiva, $W^\bot$ tiene una base ortonormal $\{e_3,\dots,e_n\}$ tal que la matriz asociada a $T|_{W^\bot}$ con respecto a esta base es una matriz diagonal de bloques de la forma $R_{\theta_i}$. Por el lema de transformaciones ortogonales en dimensión $2$, el subespacio $W$ tiene una base ortonormla $\{e_1,e_2\}$ tal que la matriz asociada a $T|_W$ con respecto a esta base es de la forma $R_\theta$. Como $V=W\oplus W^\bot$, entonces la matriz asociada a $T$ con respecto a la base $\{e_1,\dots, e_n\}$ es de la forma \eqref{forma}, con lo cual concluimos con la prueba deseada.

$\square$

También podemos enunciar el teorema anterior en términos de matrices:

Corolario. Sea $A\in M_n(\mathbb{R})$ una matriz ortogonal. Entonces existen enteros $p,q,k$ que satisfacen $p+q+2k=n$, una matriz ortogonal $P\in M_n(\mathbb{R})$ y números reales $\theta_1,\dots , \theta_n$ tales que
$$A=P^{-1}\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix}P.$$

Observación. El determinante de la matriz
$$\begin{pmatrix}
I_p & 0 & 0 & \dots & 0\\
0 & -I_q & 0 & \dots & 0\\
0 & 0 & R_{\theta_1} & \dots & 0\\
\vdots & \vdots & \vdots &\ddots & \vdots\\
0 & 0 & 0 &\dots & R_{\theta_k}
\end{pmatrix}$$
es $(-1)^q\in\{1,-1\}$ (estamos usando $\det R_{\theta_i}=1$ para $1\leq i\leq k$). Se sigue que $$\det T\in\{-1,1\}$$ para cualquier $T\in O(V)$.

Más adelante…

Por lo platicado en esta entrada, ya podemos decir cómo es cualquier transformación ortogonal, y no es tan complicado: simplemente en alguna base apropiada, se rota en pares de coordenadas, o bien se refleja en coordenadas, o bien no se hace nada en alguna coordenada (o una combinación de estas cosas). Todo esto intuitivamente deja fijas las normas y el teorema de clasificación nos dice que si se fijan normas entonces debe ser así. Por ello, podemos pensar a las transformaciones ortonormales como «sencillas» o por lo menos «entendibles».

Aprovecharemos esto en el siguiente tema, pues enunciaremos el teorema espectral real, que nos dice que las transformaciones simétricas se entienden muy bien a partir de las ortogonales y de las diagonales. Así, las transformaciones simétricas también serán «entendibles». Finalmente, con el teorema de descomposición polar llevaremos este entendimiento a todas, todas las matrices.

Tarea moral

  1. Verifica que, en efecto, las matrices $R_\theta$ de la entrada tienen determinante igual a $1$.
  2. Sea $V$ un espacio euclidiano y $T:V\to V$ una transformación lineal. Demuestra que $T$ es ortogonal si y sólo si $||T(x)||=||x||$ para los vectores $x$ de norma $1$.
  3. Encuentra la matriz de rotación de ángulo $\frac{\pi}{3}$ alrededor de la recta generada por el vector $(1,1,1)$.
  4. Describe todas las matrices en $M_3(\mathbb{R})$ que son simultaneamente ortogonales y diagonales.
  5. Describe todas las matrices en $M_3(\mathbb{R})$ que sean simultáneamente ortogonales y triangulares superiores.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Geometría Analítica I: Aplicaciones a más dimensiones

Por Elsa Fernanda Torres Feria

Introducción

Hasta ahora, describimos la recta de distintas maneras en el espacio $\mathbb{R}^2$. A partir de esto, es posible ampliar esas definiciones de recta al espacio $\mathbb{R}^n$, en especial a $\mathbb{R}^3$. Para este último caso, de manera escrita lo único que tendríamos que hacer sería establecer los puntos que definen a la recta dentro de $\mathbb{R}^3$; en la parte geométrica, estamos agregando una dimensión más al graficar, por lo que tenemos más opciones aún.

En esta entrada ampliaremos esas definiciones de recta al espacio vectorial $\mathbb{R}^3$ y el siguiente paso será definir el plano en este mismo espacio a partir de las definiciones mencionadas al inicio de este párrafo.

Rectas en $\mathbb{R}^3$

Comencemos esta entrada redefiniendo la recta en el espacio $\mathbb{R}^3$ a partir de las dos definiciones que tenemos de este elemento hasta ahora.

Definición. Una recta en forma paramétrica en $\mathbb{R}^3$ consiste de tomar un punto $P \in \mathbb{R}^3$ y otro punto (o vector) dirección $Q \in \mathbb{R}^3$ y considerar el conjunto

$L=\{ P+rQ : r \in \mathbb{R} \}$

Definición. Una recta en forma baricéntrica en $\mathbb{R}^3$ consta de tomar puntos distintos $P$ y $Q$ $\in \mathbb{R}^3$ y considerar al conjunto

$L=\{ rP+sQ : r,s \in \mathbb{R}, r+s=1 \}$

En el siguiente interactivo ponle Play a los delizadores para comprender mejor estas dos definiciones de recta en el espacio. Nota que $C$ es la definición paramétrica de la recta, cuyo parámetro es $a$; mientras que $F$ es la recta en forma baricéntrica que pasa por los puntos $A$ y $E$.

Si bien los deslizadores en este interactivo sólo corren de$-2$ a $2$, recuerda que tanto $a$ como $b$ $\in \mathbb{R}$.

En esta entrada comenzamos generalizando las definiciones de recta al espacio $\mathbb{R}^3. Por lo que (siguiendo esta lógica), el siguiente paso es plantear y trabajar la idea de un plano en el espacio.

Plano en forma paramétrica

Si el considerar un punto en $\mathbb{R}^3$ al cual se le suman múltiplos de un punto director (también en $\mathbb{R}^3$) obtenemos una recta en este espacio, ¿entonces qué necesitamos para describir un plano en el espacio?

Definición. Un plano en forma paramétrica en $\mathbb{R}^3$ consiste de tomar un punto $P \in \mathbb{R}^3$ y dos puntos dirección $Q, R \in \mathbb{R}^3$ y considerar el conjunto

$\Pi = \{ P+rQ+sR : r,s \in\mathbb{R} \}$

Para continuar, analicemos esta definición por partes con ayuda de lo que hemos descrito hasta ahora en esta entrada. Al tomar $r$ fijo en la parte de la definición dada por $rQ+sR$, obtenemos una recta que pasa por $rQ$ con dirección $R$; . De manera análoga, al tomar $s$ fijo, obtenemos una recta que para por $sR$ y tiene dirección $Q$.

Tomando a $Q=(-2,5,1)$ y a $R=(3,4,5)$ como ejemplo, usa los deslizadores en el siguiente interactivo para notar qué pasa cuando fusionas las dos ideas que acabamos de discutir, al establecer un punto $C=rQ+sR$ (con $r$ y $s$ en $\mathbb{R}$).

Ojalá hayas notado que al dejar correr ambos deslizadores, el rastro del punto $C$ describe un plano que claro pasa por $Q$ y $R$, pero pasa por otro punto definido más. Dentro del mismo interactivo, utiliza la herramienta Plano por tres puntos para definir el plano del que hablamos; deja correr los deslizadores y confirma con esto que el rastro de $C$ es este plano.

Para continuar con nuestro análisis, agreguemos la parte faltante al conjunto $\Pi$, el punto $P$. Ojalá recuerdes que en la descripción paramétrica de una recta, el punto que no tiene un parámetro multiplicando es el punto por el que pasa la recta, si ese punto no está, significa que la recta pasa por el origen. Esta idea se repite análogamente en el caso del plano.

En el análisis que acabamos de realizar, el plano descrito por $rQ+sR$, es el plano que tiene como dirección a $Q$ y a $R$ y además pasa por el origen. Al agregar $P$ a la expresión, lo que se obtiene es un plano paralelo al descrito anteriormente, pero esta vez pasa por $P$, es decir, a cada punto del plano $rQ+sR$ se le sumará el punto fijo $P$.

Plano en forma baricéntrica

Continuemos con la lógica que hemos seguido hasta ahora, con lo cual el siguiente paso es definir el plano en forma baricéntrica.

Definición. Un plano en forma baricéntrica en $\mathbb{R}^3$ consta de tomar los puntos $P$, $Q$, y $R$ y considerar el conjunto

$\Pi= \{ pP+qQ+rR : p,q,r \in \mathbb{R}$ y $p+q+r=1 \}$

Al definir el plano de esta manera, lo que debes imaginar es algo distinto a la primera definición que establecimos. Piensa a $\Pi$ como un plano que pasa por los puntos $P$, $Q$ y $R$.

El siguiente interactivo sólo es la ilustración de un plano en su forma baricéntrica.

Ahora que ya definimos de maneras distintas el plano en el espacio, lo más natural sería encontrar la equivalencia entre estas dos definiciones así como lo vimos al hablar de la recta, sólo que en este caso lo formalizaremos con una proposición.

Relación entre las expresiones de un plano

Proposición. Todo plano en forma paramétrica puede expresarse en forma baricéntrica y viceversa.

Lo que nos gustaría hacer para la demostración, sería mostrar que siempre se pueden encontrar $P’$, $Q’$ y $R’$ con los cuales se puede definir un plano en forma baricéntrica de tal manera que ese conjunto sea el mismo que el conjunto que define a un plano en forma paramétrica.

Demostración.

Parte 1: Partamos de un plano en su forma paramétrica al tomar $P,Q,R \in \mathbb{R}^3$ tal que

$\Pi=\{ P+rQ+sR :r,s \in \mathbb{R} \}$

En esta parte de la demostración, nuestro objetivo es encontrar tres puntos en $\Pi$ muy específicos con los cuales podemos describir el mismo plano pero en su forma baricéntrica.

Por lo anterior y yendo directo al grano, busquemos dos puntos en el plano. Si bien podemos escoger cualesquiera valores de $r$ y $s$ para determinar ciertos puntos en el plano, facilitaremos el álgebra al escoger casos particulares de valores para $r$ y $s$ y así obtener tres puntos «prácticos» en el plano que nos servirán para la forma baricéntrica de este. Los valores de los parámetros no serán tomados de manera aleatoria. Por lo que discutimos anteriormente, podemos definir ciertos puntos (en nuestra demostración $P$’, $Q$’ y $R$’) como combinaciones lineales puntuales de $P$, $Q$, $R$.

  1. El caso más sencillo es tomar $r=s=0$ y así obtener el punto $P$’$=P \in \Pi$.
  2. Si ahora $r=0$ y $s=1$, tenemos $R$’$=P+R$.
  3. Y si $r=1$ y $s=0$, obtenemos $Q$’$=P+Q$.

Ya que tenemos estos 3 puntos en $\Pi$, podemos definir el plano en su forma baricéntrica:

$\Pi$’$=\{pP$’$+qQ$’$+rR$’$ : p,q,r \in \mathbb{R}\}$

Para continuar, afirmamos que $\Pi=\Pi$’, y para comprobarlo, tenemos que checar que cada elemento en $\Pi$, está en $\Pi$’. La manera más sencilla de hacerlo, es tomar un elemento genérico de $\Pi$ (i.e. un elemento que «represente» a todos) y mostrar que está en $\Pi$’.

Tomemos un elemento de $\Pi$, es decir un vector de la forma $P+rQ+sR$.

Por Demostrar: Existen $a,b,c \in \mathbb{R}$, tales que $a+b+c=1$ y además

$P+rQ+sR=aP$’$+bQ$’$+cR$’

Encontremos entonces los valores de $a$,$b$, $c$.

Al sustituir los elementos primados, tenemos

\begin{align*}
P+rQ+sR&=aP+b(P+Q)+c(P+R) \\
&=aP+bP+bQ+cP+cR\\
&=(a+b+c)P+bQ+cR
\end{align*}

$\Rightarrow P+rQ+sR= (a+b+c)P+bQ+cR$

La igualdad nos lleva a un sistema de ecuaciones a partir del cual podremos obtener los valores de $a$, $b$, y $c$ para que esta se cumpla

\begin{align*}
a+b+c&=1 \\
b&=r \\
c&=s
\end{align*}

La primera condición ya cumple algo que queríamos y además, podemos despejar a $a=1-b-c$, que gracias a las otras igualdades que tenemos, conocemos su valor en términos de $r$ y $s$

$a=1-r-s$

Por lo que

$P+rQ+sR=(1-r-s)P+r(P+Q)+s(P+R)$

tal que $(1-r-s)+r+s=1$.

Hasta aquí, lo que hemos demostrado es que cualquier elemento en $\Pi$ lo podemos escribir como un elemento en $\Pi$’, esto es que $\Pi \subseteq Pi$’. Lo que sigue es realizar el camino contrario.

Ahora, lo que queremos es demostrar que $\Pi$’$\subseteq Pi$; para lo cual partiremos de un elemento en $\Pi$’ y buscaremos llegar a un elemento en $\Pi$.

Tomemos un elemento en $\Pi’$, esto es que es de la forma

$aP$’$+bQ$’$+cR$’$=aP+b(P+Q)+c(P+R)$

con $a+b+c=1$. Por medio de álgebra, queremos llegar a una expresión que represente un elemento de $\Pi$

\begin{align*}
aP+b(P+Q)+c(P+R) &= \\
&=aP+bP+bQ+cP+Cr \\
&=(a+b+c)P+bQ+cR \\
\end{align*}

Pero por hipótesis, $a+b+c=1$, por lo que

$=P+bQ+cR$

que efectivamente está en $\Pi$, pues es un elemento de la forma $P+rQ+sR$. Por lo que $\Pi$’ $\subseteq \Pi$.

$\therefore$ $\Pi \subseteq \Pi$’ y $\Pi$’ $\subseteq Pi$, entonces $\Pi=\Pi$’. Nota que concluimos esto partiendo de un plano en su forma paramétrica y al hacer el caso de la forma baricéntrica, utilizamos los puntos definidos a partir de la primera forma mencionada.

Parte 2. Para la parte 2, sólo te dare algunos consejos para que completes la demostración, pues es bastante parecida a lo que hicimos en la parte 1. Primero, tienes que partir del plano en su forma baricéntrica, es decir

$\Pi=\{ pP+qQ+rR : p+q+r=1 \text{ con }p,q,r \in \mathbb{R} \}$

Y buscar los puntos $P$’, $Q$’ y $R$’ tales que al tomar $P$’ como punto base y $Q$’ y $R$’ como direcciones, obtengas que $\Pi=\Pi’$.

Si realizas el procedimiento de la manera correcta, llegarás a que los puntos son :

\begin{align*}
P&=P’ \\
Q’&=Q-P \\
R’&=R-P
\end{align*}

Al completar esta segunda parte, entonces la demostración estará completa.

$\square$

Dimensiones mayores a 3

Para cerrar esta entrada, enunciaremos algunas definiciones que nos ayudarán en un futuro a definir cosas más complejas.

Definición. Sean $u_1$, $u_2$, $\dots$, $u_k$ puntos en $\mathbb{R}^n$. Sean $s_1$, $s_2$, $\dots$, $s_k$ números reales. A una expresión de la forma

$s_1u_2+s_2u_2+\dots+s_ku_k$

le llamamos una combinación lineal de $u_1$, $u_2$, $\dots$ $u_k$.

Ejemplo: Sea el espacio $\mathbb{R}^5$, una combinación lineal en este es

$-5(3,1,0,-2,7)+2(-3,6,8,1,9)+(-3)(3,9,0,-1,-2)$

Definición. A una combinación lineal en donde los coeficientes suman $1$, le llamamos una combinación afín. Esto es que

$s_1+s_2+\dots+s_k=1$

Ejemplo: La combinación del ejemplo anterior no es afín, pues

$-5+2+(-3)=-5+2-3=-8+2=-6 \neq 1$

Sin embargo, podemos obtener una combinación afín con los mismos vectores.

$-4(3,1,0,-2,7)+2(-3,6,8,1,9)+3(3,9,0,-1,-2)$

Es una combinación afín, pues

$-4+2+3=-4+5=1$

Definición. Al conjunto de todas las combinaciones lineales de ciertos vectores dados $u_1$, $u_2$, $\dots$ $u_k$ $\in \mathbb{R}^n$ se le conoce como el subespacio generado por $u_1$, $u_2$, $\dots$ $u_k$ y lo denotamos como

$\braket{u_1, u_2, \dots, u_k}$

esto es

$\braket{u_1, u_2, \dots, u_k}=\{ s_1u_2+s_2u_2+\dots+s_ku_k : s_1, \dots, s_k \in \mathbb{R} \}$

Veamos dos ejemplos de esta definición.

Ejemplo 1: Sea $v_1 \in \mathbb{R}^2$, $v_1 \neq 0$, el espacio generado por este vector es

$\braket{v_1}=\{ s_1v_1 : s_1 \in \mathbb{R} \}$

Ejemplo 2: Sea $v_1, v_2 \in \mathbb{R}^2$, $v_1 \neq 0$ y $v_2 \neq 0$, el espacio generado es

$\braket{v_1,v_2} = \{s_1v_1+s_2v_2 : s_1, s_2 \in \mathbb{R}\}$

Cerremos esta entrada con una última definición y su respectivo ejemplo.

Definición. Si $A$ es un subconjunto de $\mathbb{R}^n$y $p$ es un vector en $\mathbb{R}^n$, entonces el traslado de $A$ por el vector $p$ es el conjunto

$A+p=p+A= \{ x+p : x \in A \}$

Esta última definición nos es de utilidad para pasar de una recta o un plano que pasa por el origen a otro que pasa por cualquier punto $p$.

Ejemplo: Sea $\Pi=\{r(5,3,2)+s(-1,7,0): s,r \in mathbb{R}$ el plano que pasa por el origen y que tiene como vectores directores a $(5,3,2$ y $(-1,7,0)$. Entonces el traslado de $\Pi$ por $p=(-2,3,9)$ es el conjunto

\begin{align*}
p+\Pi&=\Pi+p=\Pi+(-2,3,9) \\
&=\{r(5,3,2)+s(-1,7,0)+(-2,3,9): s,r \in \mathbb{R}\}
\end{align*}

Más adelante

Con lo desarrollado en esta entrada seremos capaces de definir ciertos lugares geométricos ya no sólo en el plano, si no también en el espacio. Además, desarrollamos una intuición lógica para continuar construyendo lo que resta del curso.

Tarea moral

  • En el párrafo siguiente a la definición de un plano en el espacio:
    • ¿Cuál es el parámetro de la recta descrita al tomar $r$ fijo?
    • ¿Cuál es el parámetro de la recta descrita al tomar $s$ fijo?
  • Completa el interactivo de la sección Plano en el espacio al dibujar el plano definido por los puntos $Q$ y $R$ del interactivo y $P=(-3,2-6)$. Estarás en lo correcto si el plano que obtienes es paralelo al definido por $Q$, $R$ y el origen.
  • Completa la demostración de la proposición que trata la equivalencia entre las definiciones de plano en el espacio.
  • ¿Qué espacio geométrico define el primer ejemplo de subespacio generado? ¿y el ejemplo 2?
  • Da una expresión paramétrica para el plano que pasa por los puntos $P=(1,2,0)$, $Q=(1,0,1)$ y $R=(-1,0-2)$.

Geometría Analítica I: Las ideas de Euclides y Descartes

Por Elsa Fernanda Torres Feria

Introducción

En la primer parte del curso desarrollaremos los formalismos de conceptos geométricos de los cuales ya tenemos alguna noción como puntos, rectas, el espacio vectorial $\mathbb{R}^2$, ángulos, distancias, entre otras. Es probable que ya tengas muchas de estas nociones previas, y que hayas trabajado con ellas incluso desde el punto de vista analítico. Sin embargo, es importante ir siguiendo las ideas poco a poco pues, además de aprender a hacer las operaciones necesarias, también hay que desarrollar la intuición matemática y geométrica detrás de las cuentas. Así mismo, será importante darse cuenta del orden en el que vamos construyendo los objetos, pues en muchas ocasiones no sólo calcularemos sino que demostraremos y para ello es fundamental basarse únicamente en cosas que ya se hayan probado antes.

En esta entrada en particular, hablaremos de dos formas en las que se ha formalizado a la geometría: mediante una construcción sintética propuesta por los griegos, y mediante una construcción analítica desarrollada por Descartes. La presentación que hacemos de estos temas es más moderna que como fueron planteados originalmente.

Geometría griega

Antes de que la geometría fuera formalizada, en sus inicios era mucho más una herramienta. Estaba conformada por reglas comúnmente usadas para cosas de la vida cotidiana como medir terrenos, construir casas y ciudades, y navegar.

La formalización de este conocimiento se dio por primera vez en Elementos, un texto escrito en el siglo III a.C. por Euclides de Alejandría; durante este proceso, Euclides se percató de que todo razonamiento riguroso debe tener bases previamente establecidas que bien pueden haberse demostrado con anterioridad o que son válidas sin necesidad de demostración. Esta última opción hace referencia a principios básicos que están dados y son incontrovertibles, de tal manera que se puede construir sobre ellos el resto de la teoría.

Para formalizar una teoría, necesitamos objetos y principios básicos. En el caso de la geometría euclideana, los objetos son las nociones intuitivas que tenemos: puntos, rectas, planos, ángulos, etc. Los principios básicos, que se asumen como ciertos desde el inicio se les conoce como los cinco postulados de Euclides:

  1. Por cualesquiera dos puntos, se puede trazar el segmento de recta que los une.
  2. Dado un punto y una distancia, se puede trazar el círculo con centro en el punto y cuyo radio es la distancia.
  3. Un segmento de recta se puede extender en ambas direcciones indefinidamente.
  4. Todos los ángulos rectos son iguales.
  5. Dadas dos rectas y una tercera que las corta, si los ángulos internos de algún lado suman menos de dos ángulos rectos (180°), entonces las dos rectas se cortan y lo hacen de ese lado.

Este último postulado resulta tener dos versiones que son equivalentes y que enunciamos a continuación:

5.a. Dada una línea recta y un punto fuera de ella, existe una única recta que pasa por el punto y que es paralela a la línea.

5.b. Los ángulos interiores de un triángulo suman dos ángulos rectos.

El quinto postulado resultó ser muy controvertido y en el transcurso de la historia muchos geómetras intentaron mostrar que se desprendía de las definiciones y de los primeros cuatro. Pero esto resultó no ser cierto. Se descubrió que al tomar distintas negaciones del quinto postulado se podían obtener distintas geometrías, tan válidas y tan ricas como la geometría euclideana misma. Esto no lo trataremos en este curso, pero si te interesa conocer más, puedes investigar acerca de la geometría proyectiva o hiperbólica.

Del plano euclideano al plano cartesiano y viceversa

Continuando con la formalización de la geometría, el siguiente paso en este camino lo dio Descartes en su publicación Géométrie al introducir el álgebra en la solución de problemas de índole geométrica. Este camino inicia al buscar la forma de representar puntos en el plano por parejas de números. Para esto partimos del plano euclidiano que está bien definido por los cinco axiomas descritos por Euclides. Pensaremos que este plano consiste de puntos y que se extiende indefinidamente. Pensaremos también que en este plano los objetos que se mencionan en los postulados tienen sentido (punto, distancia, etc.). Llamaremos a este plano $\mathbb{E}^2$, donde el exponente en este caso hace referencia a la dimensión.

Notemos ahora que los puntos de una recta $l_1$ contenida en el plano ($l_1 \in \mathbb{E}^2$) representan a los números reales ($\mathbb{R}$) y que se vale lo contrario también (los reales pueden ser representados por una recta dentro de $\mathbb{E}^2$). Para ello, escogemos un punto $ O \in l_1$ al que denotaremos como origen y le asignaremos el valor real cero. Para que sea tangible la representación de los reales con esta recta, designamos que del lado derecho de $O$ se tienen los números positivos de acuerdo con su distancia al origen y del lado izquierdo los negativos. Así, a cada número real $x$ se le asocia un punto $P \in l_1$ (y a cada punto en $l_1$ le corresponde un número real).

El siguiente paso consiste en construir otra recta, digamos $l_2$, que también pase por $O$ y algún otro punto $Q$ (nótese que $l_1$ y $l_2$ fueron construidas utilizando los postulados 1 y 3 de Euclides). Orientemos a $l_2$ de la misma manera que a $l_1$ para que sus puntos representen a los números reales. Entonces, se tiene la correspondencia biunívoca entre puntos en $ \mathbb{E}^2$ y parejas de números reales gracias al postulado 5.a:

  • De punto en el plano a pareja de números: Existe una única recta $l_1’$ que pasa por $P$ y es paralela a $l_1$; análogamente existe una única recta $l_2’$ que pasa por $P$ y es paralela a $l_2$. Las intersecciones de las rectas $l_1 \cap l_2’$ y $l_2 \cap l_1’$ determinan los puntos $p_1 \in l_1$ y $q_1 \in l_2$ que definen dos números reales $x$ y $y$; esto es, una pareja ordenada $(x,y)$.
  • De pareja de números a punto en el plano: Para esta correspondencia se hace la construcción inversa, dada una pareja de números $(x,y)$, consideremos a $p_1 \in l_1$ como el punto sobre $l_1$ que se encuentra a distancia $x$ del origen y a $q_1 \in l_2$ como el punto a distancia $y$ de $O$. Sea $l_1’$ la recta que pasa por $q_1$ paralela a $l_1$ y sea $l_2’$ la recta que pasa por $p_1$ paralela a $l_2$; la intersección $l_1′ \cap l_2’$ es el punto $A$ que corresponde a la pareja $(x,y)$.

En el siguiente interactivo puedes jugar con la segunda parte de la construcción. Da clic para que se active y luego mueve los deslizadores para cambiar los valores de $X$ y $Y$. Al elegirlos, se realizará la construcción del punto $A$ de manera automática.

Así, hemos definido un sistema de coordenadas al elegir un punto $O$ (que corresponde al origen), una línea que conecta a este con un punto $P$ y otra línea que conecta a $O$ con un punto $Q$ (puntos distintos entre ellos) y al establecer las convenciones de signo.

La construcción que hicimos es muy general, y para nuestros propósitos será mejor centrarnos en el caso en el que las rectas $l_1$ y $l_2$ son ortogonales (forman un ángulo de 90°). Tradicionalmente, $l_1$ es conocida como el eje x y suele ser una línea horizontal cuya dirección positiva está hacia la derecha; $l_2$ (vertical y con dirección positiva hacia arriba) es conocida como el eje y. Este caso particular es conocido como los ejes cartesianos canónicos.

Plano cartesiano en 2 dimensiones.

Si resumimos lo que hemos desarrollado hasta ahora tenemos que, al fijar los ejes coordenados, a cada pareja de números $(x,y)$ le corresponde un punto $\textbf{a} \in \mathbb{E}^2$; además, esta relación también se vale en el otro sentido, por lo que podemos escribir que $\textbf{a}=(x,y)$. A este punto (o par de coordenadas) se le puede asignar una flecha (recta con dirección conocido como vector) que parte del origen y termina en el punto.

En el siguiente interactivo, puedes mover el punto $C$ para ver cómo cambia la flecha que une al origen con $C$.

Para concluir esta entrada, notemos que el procedimiento realizado lo podemos repetir para $n$ líneas; si bien en esta entrada construimos un sistema coordenado con $l_1$ y $l_2$, podemos agregar una $l_3$ que pase por el origen y que sea perpendicular a las otras dos líneas para llevar el plano al espacio (tri-dimensional).

Plano cartesiano en 3 dimensiones.

Más adelante…

En esta entrada construimos el puente entre el espacio descrito por Euclides y el álgebra que implementó Descartes obteniendo entonces el plano cartesiano en dos dimensiones. Esto servirá como base durante todo el curso y en especial para la siguiente entrada en la cual se hablará del espacio vectorial $\mathbb{R}^2$.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Demuestra (no muy formalmente) la equivalencia entre el postulado 5, 5.a y 5.b. Sugerencia: Hazlo meramente con dibujos, intenta llegar de la representación de un postulado al otro de manera gráfica.
  • Ubica en el plano cartesiano de dos dimensiones los siguientes puntos:
    • $(2,3)$, $(7,1)$, $(5,10)$
    • $(-1,-5)$, $(-6,-2)$, $(-5,-8)$
    • $(-2,7)$, $(-5,4)$, $(-2,7)$
    • $(4,-3)$, $(2,-1)$, $(4,-5)$
      ¿Notas algún patrón entre los vectores de cada renglón relacionado a dónde quedan con respecto al eje $x$ y al eje $y$?
  • A partir del ejercicio anterior, identifica los cuadrantes (regiones del plano cartesiano divididas por los ejes) en los que las parejas de números tienen signos determinados: $(+,+)$, $(-,-)$, $(-,+)$, $(+,-)$.
  • ¿Cómo son los puntos $(x,y)$ en el plano cartesiano que cumplen que $x=1$? ¿Aquellos que cumplen $y=2$? ¿Y si $y<3$? ¿Y si $1\leq x < 5$?
  • Describe cómo sería la construcción del plano cartesiano de tres dimensiones siguiendo el procedimiento visto en esta entrada.

Geometría Analítica I: Introducción al curso

Por Leonardo Ignacio Martínez Sandoval

Introducción

Bienvenido al curso de Geometría Analítica I. A través de esta serie de entradas cubriremos el temario oficial del programa de la materia tal y como se requiere en la Facultad de Ciencias de la UNAM. Esto incluye desarrollar no sólo habilidades para ejecutar procedimientos («hacer cuentitas»), sino también aquellas que nos permitan deducir los resultados que obtendremos a través de razonamientos lógicos («demostrar»).

Pre-requisitos del curso

En la mayoría de las entradas seguiremos un flujo matemático, en el cual escribiremos definiciones, proposiciones, ejemplos, teoremas y otro tipo de enunciados matemáticos. Siempre que digamos que algo sucede, es importante argumentar o justificar por qué es esto, es decir, que demos una demostración. Las demostraciones nos ayudarán a justificar que ciertos procedimientos (para encontrar distancias, ángulos, etc.) son válidos.

Para entender un poco más al respecto, te recomendamos leer las siguientes dos entradas, o incluso llevar a la par un curso de Álgebra Superior I:

Además de estos pre-requisitos de pensamiento lógico, también es importante que recuerdes algunos de los conceptos fundamentales de geometría (punto, línea, segmento, triángulo, distancia, etc.). Si bien todo lo construiremos «desde cero», el recordar estos conceptos te ayudará mucho en la intuición de por qué ciertas cosas las definimos como lo haremos, y por qué ciertos enunciados que planteamos «deben ser ciertos».

Finalmente, también supondremos que sabes manejar a buen nivel las operaciones y propiedades en $\mathbb{R}$, los números reales. Por ejemplo, que la suma es conmutativa ($a+b=b+a$), que se distribuye con el producto ($a(b+c)=ab+ac$), etc. Si bien en otros cursos se definen a los reales con toda formalidad, para este curso sólo será importante que sepas hacer estas operaciones.

La idea fundamental

La geometría se trata de figuras, de ver, de medir. El álgebra se trata de sumar, de operar, de comparar. La idea clave que subyace a la geometría analítica, como la veremos en este curso, es la siguiente:

La geometría y el álgebra son complementarias e inseparables, ninguna con más importancia sobre la otra. Podemos entender al álgebra a partir de la geometría, y viceversa.

Un ejemplo muy sencillo que se ve desde la educación básica es que la suma de reales se corresponde con «pegar segmentos». Si en la recta real tenemos un segmento de longitud $a$ y le pegamos un segmento de longitud $b$, entonces el segmento que se obtiene tiene longitud $a+b$. Si bien es obvio, cuando estemos estableciendo los fundamentos tendremos que preguntarnos, ¿por qué pasa? ¿qué es pegar segmentos?

Nuestro objetivo será entender a profundidad muchas de estas equivalencias.

Interactivos

En este curso procuraremos incluir interactivos para que explores las ideas que vayamos introduciendo. Si bien un interactivo no reemplaza a una demostración, lo cierto es que sí ayuda muchísimo a ver más casos en los cuales una proposición o teorema se cumple. Nuestros interactivos están hechos en GeoGebra y necesitarás tener activado JavaScript en tu navegador.

En el siguiente interactivo puedes mover los puntos $A$, $B$ y $C$. Observa como la suma de dos segmentos siempre es igual al tercero. ¿Qué pasa si $B$ «se pasa de $C$»? ¿Cuál segmento es la suma de los otros dos?

Te recomendamos fuertemente que dediques por lo menos un rato a jugar con los interactivos: intenta ver qué se puede mover, qué no, qué cosas piensas que suceden siempre y para cuales crees que haya ejemplos que fallen.

Más adelante…

En esta entrada platicamos de cómo son las notas del curso en general. Platicamos de pre-requisitos y de la idea fundamental que subyace al curso. A partir de la siguiente entrada comenzaremos con el tratamiento teórico de la materia. Hablaremos de dos visiones de geometría: la sintética y la analítica. Veremos un primer resultado que nos dice que, en realidad, ambas están muy relacionadas entre sí.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Escribe en una hoja de papel o en un documento digital qué significan para ti los siguientes términos: punto, línea, círculo, plano, semiplano, elipse, intersección, alineado, longitud, ángulo, dirección, vector. ¿En cuáles de estas palabras tuviste que usar las otras? ¿En cuáles no? Más adelante formalizaremos cada una de estas.
  2. Explora el inicio del siguiente libro digital: Euclides de Byrne.
  3. Si aprendes a manejar GeoGebra por tu cuenta, podrás hacer interactivos tú mismo. Si te interesa esto, revisa el siguiente curso de GeoGebra.
  4. ¿Cómo le harías para a cada punto del plano asociarle una pareja de números reales? ¿Cómo le harías para a cada pareja de números reales asociarle un punto en el plano?
  5. Si la suma de números corresponde a pegar segmentos, ¿a qué corresponde la multiplicación de números?

Entradas relacionadas