Archivo del Autor: Leo

Leo

Acerca de Leo

Hola. Soy Leonardo Martínez. Soy Profesor de Tiempo Completo en la Facultad de Ciencias de la UNAM. Hice un doctorado en Matemáticas en la UNAM, un postdoc en Israel y uno en Francia. Además, me gusta colaborar con proyectos de difusión de las matemáticas como la Olimpiada Mexicana de Matemáticas.

Álgebra Lineal I: Algunas aclaraciones sobre las formas lineales

Introducción

Uno de los momentos del curso de Álgebra Lineal I en el que se da un brinco de abstracción es cuando se introduce el espacio dual. En ese momento, empiezan a aparecer objetos que tratamos simultáneamente como funciones y como vectores: las formas lineales. De reprente puede volverse muy difícil trasladar incluso conceptos muy (como el de suma vectorial, o el de indepencia lineal) a este contexto. En esta entrada intentaremos dejar esto mucho más claro.

Igualdad de funciones

Para hablar del dual de un espacio vectorial $V$ sobre un campo $F$, necesitamos hablar de las funciones $l:V\to F$. Antes de cualquier cosa, debemos de ponernos de acuerdo en algo crucial. ¿Cuándo dos funciones son iguales?

Definición. Dos funciones $f:A\to B$ y $g:C\to D$ son iguales si y sólo si pasan las siguientes tres cosas:

  • $A=C$, es decir, tienen el mismo dominio.
  • $B=D$, es decir, tienen el mismo codominio
  • $f(a)=g(a)$ para todo $a\in A$, es decir, tienen la misma regla de asignación.

Los dos primeros puntos son importantes. El tercer punto es crucial, y justo es lo que nos permitirá trabajar y decir cosas acerca de las funciones. Implica dos cosas:

  • Que si queremos demostrar la igualdad de dos funciones, en parte necesitamos demostrar que se da la igualdad de las evaluaciones para todos los elementos del conjunto.
  • Que si ya nos dan la igualdad de las funciones, entonces nos están dando muchísima información, pues nos están diciendo la igualdad de todas las evaluaciones posibles.

Veamos algunos ejemplos.

Ejemplo. Tomemos las funciones $f:\mathbb{R}^2\to \mathbb{R}$ y $g:\mathbb{R}^2\to\mathbb{R}$ con las reglas de asignación $f(x,y)=2x+3y$ y $g(x,y)=6x-y$. ¿Son iguales? Los primeros dos puntos en la definición de igualdad se cumplen, pues tienen el mismo dominio y codominio. Entonces, debemos estudiar si tienen la misma regla de asignación.

Al evaluar en $(1,1)$ obtenemos que $f(1,1)=2+3=5$ y que $g(1,1)=6-1=5$. Al evaluar en $(2,2)$ obtenemos que $f(2,2)=4+6=10$ y que $g(2,2)=12-2=10$. Hasta aquí parecería que todo va bien, pero dos ejemplos no son suficientes para garantizar que $f=g$. Necesitaríamos la igualdad en todos los valores del dominio, es decir, en todas las parejas $(x,y)$.

Al evaluar en $(2,0)$ obtenemos que $f(2,0)=4+0=4$ y que $g(2,0)=12-0=12$. Los valores de las funciones fueron distintos, así que las funciones son distintas.

$\square$

Ejemplo. Imagina que $A$ y $B$ son dos números tales que las dos funciones $f:\mathbb{R}^2\to \mathbb{R}$ y $g:\mathbb{R}^2\to\mathbb{R}$ con las siguientes reglas de asignación son iguales:

\begin{align*}
f(x,y)&=2x-5y+A\\
g(x,y)&=Bx-5y+3.
\end{align*}

¿Cuáles tendrían que ser los valores de $A$ y $B$? Por supuesto, una exploración «a simple vista» sugiere que tendríamos que poner $B=2$ y $A=3$. Pero, ¿cómo vemos formalmente esto? ¿Cómo nos aseguramos de que sea la única posibilidad? Lo que tenemos que hacer es usar nuestra definición de igualdad de funciones. Para ello, podemos utilizar los valores $(x,y)$ que nosotros queremos pues la igualdad de funciones garantiza la igualdad en todas las evaluaciones. Así, podemos ponernos creativos y proponer $(3,5)$ para obtener que:

\begin{align*}
f(3,5)&=6-25+A=-19+A\\
g(3,5)&=3B-25+3=3B-22.
\end{align*}

Como las funciones son iguales, debe pasar que $f(3,5)=g(3,5)$, por lo que $-19+A=3B-22$. ¿Esto es suficiente para saber quién es $A$ y $B$? Todavía no, aún hay muchas posibiliades. Propongamos entonces otro valor de $(x,y)$ para evaluar. Veamos qué sucede con $(-2,1)$. Obtenemos:

\begin{align*}
f(-2,1)&=-4-5+A=-9+A\\
g(-2,1)&=-2B-5+3=-2B-2.
\end{align*}

Ahora tenemos más información de $A$ y $B$. Sabemos que $-9+A=-2B-2$. Reordenando ambas cosas que hemos obtenido hasta ahora, tenemos el siguiente sistema de ecuaciones:

\begin{align*}
A-3B=-3\\
A+2B=7.
\end{align*}

Restando la primera de la segunda obtenemos $5B=10$, de donde $B=2$. Sustituyendo en la segunda obtenemos $A+4=7$, de donde $A=3$, justo como queríamos.

$\square$

En el ejemplo anterior pudimos haber sido más astutos y evitarnos el sistema de ecuaciones. Recordemos que la igualdad $f(x,y)=g(x,y)$ se tiene para todas todas las parejas $(x,y)$, así que nos conviene usar parejas que 1) Sean sencillas de usar y 2) Nos den suficiente información.

Ejemplo. En el ejemplo anterior hicimos un par de sustituciones que finalmente sí nos llevaron a los valores que queríamos. Pero hay «mejores» sustituciones. Si hubiéramos usado la pareja $(0,0)$ obtendríamos inmediatemente $A$ pues: $$A=0-0+A=f(0,0)=g(0,0)=0-0+3=3,$$ de donde $A=3$. Ya sabiendo $A$, pudimos usar la pareja $(1,0)$ para obtener $$B+3=B-0+3=g(1,0)=2-0+3=5.$$ De aquí se obtene nuevamente $B=2$.

$\square$

Veamos un último ejemplo, en el que es imposible encontrar un valor fijo que haga que dos funciones que nos dan sean iguales.

Ejemplo. Veamos que es imposible encontrar un número real $A$ para el cual las dos funciones $f:\mathbb{R}^2\to\mathbb{R}$ y $g:\mathbb{R}^2\to \mathbb{R}$ con las siguientes reglas de asignación sean iguales:

\begin{align*}
f(x,y)&=x^2+Ay^2\\
g(x,y)&=Axy.
\end{align*}

Imaginemos, de momento, que esto sí es posible. Entonces, tendríamos la igualdad de funciones y por lo tanto tendríamos la igualdad para todas las evaluaciones. Evaluando en $(1,0)$ obtendríamos que $$0=A\cdot 1 \cdot 0 = g(1,0)=f(1,0)=1^2+A\cdot 0^2=1.$$ Esto nos lleva a la contradicción $0=1$, lo cual muestra que ningún valor de $A$ podría funcionar.

$\square$

La forma lineal cero

Otra noción básica, pero que es importante de entender, es la noción de la forma lineal cero.

Definición. Sea $V$ un espacio vectorial sobre un campo $F$. Sea $0$ el neutro aditivo del campo $F$. La forma lineal cero es la función $L_0:V\to F$ que manda a cualquier vector $v$ de $V$ a $0$, es decir, cuya regla de asignación es $L_0(v)=0$ para todo $v$ en $V$.

En álgebra lineal rápidamente nos queremos deshacer de notación estorbosa, pues muchas cosas son claras a partir del contexto. Pero esto tiene el problema de introducir amgüedades que pueden ser confusas para alguien que apenas está comenzando a estudiar la materia. Lo que prácticamente siempre se hace es que a la forma lineal cero le llamamos simplemente $0$, y dejamos que el contexto nos diga si nos estamos refiriendo al neutro aditivo de $F$, o a la forma lineal cero $L_0$.

En esta entrada intentaremos apegarnos a llamar a la forma lineal cero siempre como $L_0$, pero toma en cuenta que muy probablemente más adelante te la encuentres simplemente como un $0$. Combinemos esta noción con la de igualdad.

Ejemplo. ¿Cómo tienen que ser los valores de $A$, $B$ y $C$ para que la función $l:\mathbb{R}^3\to \mathbb{R}$ con la siguiente regla de asignación sea igual a la forma lineal cero $L_0$? $$f(x,y,z)=(A+1)x+(B+C)y+(A-C)z$$

Debemos aprovechar la definición de igualdad de funciones: sabemos que la igualdad se da para las ternas que nosotros queramos. Evaluando en $(1,0,0)$ obtenemos $$A+1 = f(1,0,0)=L_0(1,0,0)=0.$$

Aquí a la derecha estamos usando que la forma lineal cero siempre es igual a cero. De manera similar, evaluendo en $(0,1,0)$ y $(0,0,1)$ respectivamente obtenemos que \begin{align*}B+C&=f(0,1,0)=L_0(0,0,0)=0\\A-C&=f(0,0,1)=L_0(0,0,0)=0.\end{align*}

Ya tenemos información suficiente para encontrar $A$, $B$ y $C$. De la primer ecuación que obtuvimos, se tiene $A=-1$. De la tercera se tiene $C=A=-1$ y de la segunda se tiene $B=-C=1$.

Pero, ¡momento! Estos valores de $A$, $B$, $C$ funcionan para las tres ternas que dimos. ¿Funcionarán para cualquier otra terna? Si elebimos $A=-1$, $B=1$ y $C=-1$ entonces tendríamos $$f(x,y,z)=0\cdot x + 0\cdot y + 0\cdot z.$$ En efecto, sin importar qué valores de $(x,y,z)$ pongamos, la expresión anterior dará cero. Así, se daría la igualdad de reglas de correspondencia entre $f$ y $L_0$ y como tienen el mismo dominio y codominio concluiríamos que $f=L_0$.

$\square$

Suma y producto escalar de formas lineales

Otro aspecto que puede causar confusión es la suma de funciones y el producto escalar. En la duda, siempre hay que regresar a la definición. Enunciaremos los conceptos para formas lineales. Pero en realidad podemos definir la suma de funciones de manera similar siempre que el codominio sea un lugar en donde «se puede sumar». Similarmente, podríamos definir el producto escalar de un elemento con una función siempre que sepamos cómo multiplicar a ese elemento con cada elemento del codominio.

Definición. Sea $V$ un espacio vectorial sobre un campo $F$. Sean $l:V\to F$ y $m:V\to F$ formas lineales. Definimos la suma de $l$ con $m$, a la cual denotaremos por $l+m$, como la función $l+m:V\to F$ con la siguiente regla de asignación:$$(l+m)(v)=l(v)+m(v),$$ para cualquier $v$ en $V$.

De nuevo nos estamos enfrentando a un posible problema de ambigüedad de símbolos: por un lado estamos usando $+$ para referirnos a la suma en el campo $F$ y por otro lado para referirnos a la suma de funciones que acabamos de definir.

Definición. Sea $V$ un espacio vectorial sobre un campo $F$. Sea $l:V\to F$ una forma lineal y sea $r$ un elemento de $F$. Definimos el producto escalar de $r$ con $F$, al cual denotaremos por $r\cdot l$ como la función $r\cdot l:V\to F$ con la siguiente regla de asignación:$$(r\cdot l)(v)=r\cdot (l(v))$$ para cualquier $v$ en $V$.

Así, estamos usando tanto la suma en $F$ como el producto en $F$ para definir una nueva suma de funciones y un nuevo producto entre un real y una función. En el caso del producto escaler, como con muchos otros productos, usualmente quitamos el punto central y ponemos $rl$ en vez de $r\cdot l$.

Ejemplo. Tomemos las funciones $f:\mathbb{R}^3\to \mathbb{R}$ y $g:\mathbb{R}^3\to \mathbb{R}$ con las siguientes reglas de asignación:

\begin{align*}
f(x,y,z)&=2x-y+z\\
g(x,y,z)&=3x+y-5z.
\end{align*}

Mostraremos que la función $3f+(-2)g$ es igual a la función $h:\mathbb{R}^3\to \mathbb{R}$ con regla de asignación $h(x,y,z)=-5y+13z$. Lo haremos con todo el detalle posible. Primero, notamos que las dos funciones tienen dominio $\mathbb{R}^3$ y codominio $\mathbb{R}$ así que nos podemos enfocar en la regla de asignación. Debemos ver que ambas coinciden para todas las ternas $(x,y,z)$ en $\mathbb{R}^3$. Tomemos entonces una de estas ternas $(x,y,z)$.

Por definición de producto escalar de funciones, tenemos que $$(3f)(x,y,z)=3(f(x,y,z))=3(2x-y+z)=6x-3y+3z.$$. Aquí estamos usando la distributividad en los reales. Por definición de producto escalar de funciones, tenemos que $$ ((-2)g)(x,y,z)=(-2)(g(x,y,z))=(-2)(3x+y-5z)=-6x-2y+10z.$$ Una vez más estamos usando distributividad. Luego, por definición de suma de funciones obtenemos que

\begin{align*}
(3f+(-2)g)(x,y,z)&=(3f)(x,y,z)+(-2g)(x,y,z)\\
&= (6x-3y+3z)+(-6x-2y+10z)\\
& = -5y+13z\\
&= h(x,y,z).
\end{align*}

$\square$

Usualmente tomamos atajos para seguir simplificando la notación. Por ello, típicamente a veces vemos escrito todo lo anterior simplemente como: $$3(2x-y+z)-2(2x+y-5z)=-5y+13z.$$ De hecho esto es muy práctico, pues se puede mostrar que las funciones «sí podemos operarlas como si fueran expresiones en $x$, $y$, $z$ y usáramos las reglas usuales». Así, podemos «trabajar simbólicamente» y concluir rápidamente que $$(x+y)+(3x+2z)-3(x+y-z)$$ en verdad tiene la misma regla de asignación que $-2y+5z$.

Ahora sí, ¿quién es el espacio dual?

Si tenemos un espacio vectorial $V$ sobre un campo $F$ podemos construirnos otro espacio vectorial con otro conjunto base y otras operaciones que no son las del espacio original. Una forma de hacer esto es construir el espacio dual, al que llamaremos $V^\ast$. Los elementos de $V^\ast$ son las formas lineales de $V$, es decir, funciones lineales con dominio $V$ y codominio $F$. Debemos acostumbrarnos a pensar simultáneamente a un elemento de $V^\ast$ tanto como un vector (de $V^\ast$) como una función (de $V$ a $F$).

Para verdaderamente pensar a $V^\ast$ como un espacio vectorial, debemos establecer algunas cosas especiales:

  • La suma vectorial de $V^\ast$ será la suma de funciones que platicamos en la sección anterior.
  • El producto escalar vectorial de $V^\ast$ será el producto escalar que platicamos en la sección anterior.
  • El neutro aditivo vectorial de $V^\ast$ será la forma lineal $L_0$, y se puede verificar que en efecto $l+L_0=l$ para cualquier forma lineal $l$.

Por supuesto, típicamente a la suma vectorial le llamaremos simplemente «suma» y al producto escalar vectorial simplemente «producto escalar». Aquí estamos haciendo énfasis en lo de «vectorial» sólo para darnos cuenta de que nuestras operaciones de funciones se transformaron en operaciones para el espacio vectorial que estamos definiendo.

El espacio dual cumple muchas propiedades bonitas, pero ahorita no nos enfocaremos en enunciarlas y demostrarlas. Esto se puede encontrar en la página del curso de Álgebra Lineal I en el blog. Lo que sí haremos es irnos a los básicos y entender cómo se verían algunas definiciones básicas de álgebra lineal en términos de lo que hemos discutido hasta ahora.

Combinaciones lineales de formas lineales

Para hablar de las nociones de álgebra lineal para formas lineales, hay que pensarlas como vectores y como funciones. ¿Qué sería una combinación lineal de las formas lineales $l_1,\ldots,l_r$ del espacio vectorial, digamos, $\mathbb{R}^n$. Debemos tomar elementos $\alpha_1,\ldots,\alpha_r$ en $\mathbb{R}$ y construir la función $\ell=\alpha_1l_1+\ldots+\alpha_rl_r$. Aquí estamos usando la suma vectorial y el producto escalar vectorial que quedamos que serían la suma como funciones y el producto escalar como funciones. Así, obtenemos un elemento $\ell$ que por un lado es un vector del espacio dual, y por otro es una función $\ell:\mathbb{R}^n\to \mathbb{R}$. ¿Cuál es la regla de asignación? Es precisamente la dada por las definiciones de suma y producto escalar para funciones. Para ser muy precisos, se puede mostrar inductivamente que su regla de asignación es:

\begin{align*}
(\alpha_1l_1+&\ldots+\alpha_rl_r)(x_1,\ldots,x_n)=\\
&\alpha_1(l_1(x_1,\ldots,x_n))+\ldots+\alpha_r(l_r(x_1,\ldots,x_n)).
\end{align*}

Entendiendo esto, ahora sí podemos preguntarnos si una forma lineal es combinación lineal de otras.

Ejemplo. La forma lineal $h:\mathbb{R}^2\to\mathbb{R}$ con regla de asignación $h(x,y)=2x-y$ es combinación lineal de las formas lineales $f(x,y):\mathbb{R}^2\to\mathbb{R}$ y $g(x,y):\mathbb{R}^2\to\mathbb{R}$ con reglas de asignación

\begin{align*}
f(x,y)&=x+y\\
g(x,y)&=x-y.
\end{align*}

En efecto, tenemos que es igual a la combinación lineal $\frac{1}{2}f + \frac{3}{2} g$, pues su regla de asignación es:

$$\left(\frac{1}{2}f + \frac{3}{2} g\right)(x,y)=\left(\frac{x+y}{2}\right)+\left(\frac{3x-3y}{2}\right)=2x-y,$$

que es justo la regla de asignación de $h$. Así, $h=\frac{1}{2}f+\frac{3}{2}g$.

$\square$

Independencia lineal de formas lineales

Veamos un ejemplo más de cómo entender nociones de álgebra lineal cuando hablamos de formas lineales (o funciones en general). ¿Cómo sería el concepto de independencia lineal para formas lineales $l_1,\ldots,l_r$? A partir de una combinación lineal de ellas igualada a la forma lineal cero $L_0$, debemos mostrar que todos los coeficientes son iguales a cero. Es decir, a partir de $$\alpha_1l_1+\ldots+\alpha_rl_r=L_0,$$ debemos mostrar que $\alpha_1=\ldots=\alpha_r=0.$$ Usualmente el truco en estas situaciones es que ya nos están dando una igualdad de funciones. Entonces, podemos evaluar en los valores que nosotros queramos de ambos lados de la igualdad pues funciones iguales tienen todas sus evaluaciones iguales. Esto se parece a los ejemplos de la sección de igualdad de funciones.

Ejemplo. Vamos a demostrar que las formas lineales de $\mathbb{R}^4$ dadas por $f(w,x,y,z)=4w+2x+z$, $g(w,x,y,z)=4w+2z+y$, $h(w,x,y,z)=4w+2y+x$, $k(w,x,y,z)=w+x+y+z$ son linealmente independientes. Tomemos una combinación lineal de ellas igualda a cero (¡recordemos que en este espacio vectorial el cero es la forma lineal $L_0$!):

$$Af+Bg+Ch+Dk=L_0.$$

Debemos demostrar que $A=B=C=D=0$. ¿Cómo hacemos esto? Lo que haremos es evaluar: pondremos valores convenientes de $(w,x,y,z)$ en la igualdad anterior para obtener información de $A$, $B$, $C$, $D$. Poniendo $(1,0,0,0)$ obtenemos que:

\begin{align*}
0&=L_0(1,0,0,0)\\
&= (Af+Bg+Ch+Dk)\\
&=Af(1,0,0,0)+ Bg(1,0,0,0) +Ch(1,0,0,0) +Dk(1,0,0,0) \\
&=4A + 4B + 4C + D.
\end{align*}

Así, $4A+4B+4C+D=0$. Usando esta ecuación y las evaluaciones $(0,1,0,0)$, $(0,0,1,0)$ y $(0,0,0,1)$, obtenemos todo lo siguiente:

\begin{align*}
4A+4B+4C+D&=0\\
2A+C+D&=0\\
B+2C+D&=0\\
A+2B+D&=0.
\end{align*}

De aquí se puede mostrar (como puedes verificar como ejercicio) que la única solución posible es $A=B=C=D=0$. De este modo, las formas lineales $f,g,h,k$ son linealmente independientes.

$\square$

Más adelante

Esta es más una entrada auxiliar que una entrada que forma parte del flujo de la teoría principal. Sin embargo, espero que te haya servido para dejar más claros los conceptos de cuándo tenemos formas lineales iguales, cómo se operan, cuándo varias formas lineales son linealmente independientes, etc.

Tarea moral…

  1. Verifica que para cualquier forma lineal $l:\mathbb{R}^n\to \mathbb{R}$ y la forma lineal cero $L_0:\mathbb{R}^n\to\mathbb{R}$ en efecto se tiene que $l+L_0=l$. Usa las definiciones de la forma lineal cero, de la igualdad de funciones y de la suma de funciones.
  2. Verifica que $V^\ast$ con las operaciones de suma, producto escalar y el neutro aditivo que dimos en efecto es un espacio vectorial. ¿Cómo tendrían que ser los inversos aditivos?
  3. Considera las formas lineales $f:\mathbb{R}^3\to \mathbb{R}$ y $g:\mathbb{R}^3 \to \mathbb{R}$ dadas por $f(x,y,z)=x+3y+z$ y $g(x,y,z)=-x+5y-z$.
    1. Demuestra que es imposible encontrar reales $A$ y $B$ ambos distintos de cero tales que $Af+Bg$ sea la forma lineal cero.
    2. Encuentra reales $A$ y $B$ tales que $Af+Bg$ sea la forma lineal $h:\mathbb{R}^3\to \mathbb{R}$ con regla de asignación $h(x,y,z) = -x + 21 – z$.
    3. Demuestra que es imposible encontrar reales $A$ y $B$ tales que $Af+Bg$ sea la forma lineal $j:\mathbb{R}^3\to \mathbb{R}$ con regla de asignación $j(x,y,z)= -2x + 4y -3z$.
    4. ¿Será posible encontrar reales $A$ y $B$ tales que $Af+Bg$ sea la forma lineal $k:\mathbb{R}^3\to \mathbb{R}$ con regla de asignación $k(x,y,z)=5x+5y+5z$?
  4. Para cada uno de los siguientes casos, determina si las formas lineales son linealmente independientes:
    1. $f(x,y)=5x+3y$, $g(x,y)=x-3y$.
    2. $f(x,y,z)=5x+2y-z$, $g(x,y,z)=z$, $h(x,y,z)=x-y-z$.
    3. $f(w,x,y,z)=w+y$, $g(w,x,y,z)=3x-2z$, $h(w,x,y,z)=x+y+z$, $k=(w,x,y,z)=w+2x-3z$.
  5. Considera el espacio vectorial de polinomios con coeficientes reales $\mathbb{R}[x]$. Considera la función $\text{ev}_k:\mathbb{R}[x]\to \mathbb{R}$ que a cada polinomio lo manda a su evaluación en $k$, es decir, con regla de asignación $\text{ev}_k(p)=p(k)$.
    1. Demuestra que cualquier $\text{ev}_k$ es una forma lineal.
    2. Sean $k_1,\ldots,k_r$ reales distintos. Muestra que $\text{ev}_{k_1},\ldots,\text{ev}_{k_r}$ son formas lineales linealmente independientes.

Entradas relacionadas

Álgebra Lineal II: Unicidad de la forma de Jordan para nilpotentes

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan para matrices nilpotentes. Demostramos una parte: la existencia de la forma canónica de Jordan. Para ello, nos enfocamos en el teorema en su versión en términos de transformaciones lineales. En esta entrada nos enfocaremos en demostrar la unicidad de la forma canónica de Jordan. Curiosamente, en este caso será un poco más cómodo trabajar con la forma matricial del teorema. Para recordar lo que queremos probar, volvemos a poner el enunciado del teorema a continuación. Lo que buscamos es ver que los enteros $k_1,\ldots, k_d$ que menciona el teorema son únicos.

Teorema. Sea $A$ una matriz nilpotente en $M_n(F)$. Entonces existen únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} y para los cuales $A$ es similar a la siguiente matriz de bloques: $$\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

Nuestra estrategia para mostrar la unicidad será el estudio del rango de las potencias de $A$. Si $A$ es similar a $B$, entonces existe $P$ invertible tal que $A=P^{-1}BP$, de donde se puede mostrar indutivamente que $A^k=P^{-1}B^kP$, mostrando que $A^k$ y $B^k$ son similares. Además, matrices similares tienen el mismo rango. De modo que si $A$ es similar a $B$ entonces todas las potencias de $A$ tienen el mismo rango que todas las potencias de $B$. Con esta idea en mente, ¿cómo son las potencias de las matrices hechas por bloques de Jordan? Comenzaremos estudiando esto.

Rango de potencias de bloques de Jordan

Claramente el rango del bloque de Jordan $J_{0,n}$ es $n-1$, pues ya está en forma escalonada reducida y tiene $n-1$ vectores distintos de cero. El siguiente resultado generaliza esta observación.

Proposición. Sea $n$ un entero positivo, $F$ un campo y $J_{0,n}$ el bloque de Jordan de eigenvalor $0$ y tamaño $n$ en $M_n(F)$. Para $k=1,\ldots,n$ se tiene que el rango de $J_{0,n}^k$ es igual a $n-k$. Para $k$ más grandes, el rango es igual a cero.

Demostración. Si $e_1,\ldots,e_n$ es la base canónica de $F^n$, tenemos que $J_{0,n}e_i=e_{i-1}$ para $i=2,\ldots,n$ y $J_{0,n}e_1=0$. De manera intuitiva, la multiplicación matricial por $J_{0,n}$ va «desplazando los elementos de la base $e_1,\ldots,e_n$ a la izquierda, hasta sacarlos». De este modo, $J_{0,n}^k$ para $k=1,\ldots,n$ hace lo siguiente:

$$J_{0,n}^k e_i=\begin{cases} 0 & \text{para $i\leq k$}\\ e_{i-k} & \text{para $i\geq k+1$.}\end{cases}$$

Así, $J_{0,n}^k$ manda a la base $e_1,\ldots,e_n$ a los vectores $e_1,\ldots,e_{n-k}$ y a $k$ copias del vector cero. Como los primeros son $n-k$ vectores linealmente independientes, obtenemos que el rango de $J_{0,n}^k$ es $n-k$.

Para varlores de $k$ más grandes la potencia se hace la matriz cero, así que su rango es cero.

$\square$

Rango de potencias de matrices diagonales por bloques de Jordan

¿Qué sucede si ahora estudiamos el rango de las potencias de una matriz diagonal por bloques hecha por puros bloques de Jordan? Consideremos, por ejemplo, la siguiente matriz, con $k_1\leq \ldots \leq k_d$ de suma $n$:

$$J=\begin{pmatrix} J_{0,k_1} & 0 & \cdots & 0 \\ 0 & J_{0,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}\end{pmatrix}.$$

Por un lado, es sencillo elevar esta matriz a potencias, pues simplemente los bloques se elevan a las potencias correspondientes. En símbolos:

$$J^r=\begin{pmatrix} J_{0,k_1}^r& 0 & \cdots & 0 \\ 0 & J_{0,k_2}^r& \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{0,k_d}^r\end{pmatrix}.$$

¿Cuál es el rango de esta potencia? Nos conviene cambiar un poco de notación. En vez de considerar a los $k_i$ por separado, los agruparemos de acuerdo a su valor, que puede ir de $1$ a $n$. Así, para cada $j=1,\ldots,n$ definimos $m_j$ como la cantidad de valores $k_i$ iguales a $j$. Bajo esta notación, la igualdad $k_1+\ldots+k_d=n$ se puede reescribir como $$m_1+2m_2+3m_3+\ldots+nm_n=n.$$

Una primera observación es que el rango de $J$ es simplemente la suma de los rangos de cada una de las $J_{0,k_i}$. Cada una de estas contribuye con rango $k_i-1$. Así, en términos de las $m_i$ tenemos lo siguiente:

\begin{align*}
\text{rango}(J)&=\sum_{i=1}^d (k_i-1)\\
&=\sum_{j=1}^n (j-1) m_j \\
&=0\cdot m_1 + 1\cdot m_2 + 2 \cdot m_3 + \ldots + (n-1) \cdot m_n.
\end{align*}

De manera similar,

\begin{align*}
\text{rango}(J^r)&=\sum_{i=1}^d \text{rango}(J_{0,k_i}^r)\\
&=\sum_{j=1}^n m_j \text{rango}(J_{0,j}^r).
\end{align*}

El término $\text{rango}(J_{0,j}^r)$ lo podemos calcular con la proposición de la sección anterior, cuidando la restricción entre el tamaño y las potencias que queremos. De aquí y de la restricción original para la las $m_i$ salen todas las siguientes igualdades:

\begin{align*}
n&= 1\cdot m_1 + 2\cdot m_2 + 3 \cdot m_3 + \ldots + n \cdot m_n\\
\text{rango}(J)&=0\cdot m_1 + 1\cdot m_2 + 2 \cdot m_3 + \ldots + (n-1) \cdot m_n\\
\text{rango}(J^2)&= 0 \cdot m_1 + 0 \cdot m_2 + 1 \cdot m_3 + \ldots + (n-2)\cdot m_n\\
\text{rango}(J^3)&= 0 \cdot m_1 + 0 \cdot m_2 + 0 \cdot m_3 + \ldots + (n-3)\cdot m_n\\
&\vdots\\
\text{rango}(J^{n-1})&= 0\cdot m_1 + 0 \cdot m_2 + 0 \cdot m_3 + \ldots + 1 \cdot m_n.
\end{align*}

A partir de aquí el rango de $J^n$ es $0$. Esto nos da una manera de entender con mucha precisión el rango de cualquier potencia de una matriz diagonal por bloques hecha con bloques de Jordan.

Unicidad de la forma canónica de Jordan

Estamos listos para justificar la unicidad de la forma canónica de Jordan. Una matriz diagonal por bloques hecha por bloques de Jordan queda totalmente determinada por los valores de $m_j$ de la sección anterior. Supongamos que $A$ tiene como forma canónica de Jordan tanto a una matriz $J$ con valores $m_j$, como a otra matriz $J’$ con valores $m_j’$.

Como dos matrices similares cumplen que las sus potencias son todas del mismo rango, entonces para cualquier $r$ de $1$ a $n-1$ se cumple que $$\text{rango}(J^r)=\text{rango}(A^r)=\text{rango}(J’^r).$$ Así, tanto $(m_1,\ldots,m_n)$ como $(m_1′,\ldots,m_n’)$ son soluciones al siguiente sistema de ecuaciones en variables $x_1,\ldots,x_n$.

\begin{align*}
n&= 1\cdot x_1 + 2\cdot x_2 + 3 \cdot x_3 + \ldots + n \cdot x_n\\
\text{rango}(A)&=0\cdot x_1 + 1\cdot x_2 + 2 \cdot x_3 + \ldots + (n-1) \cdot x_n\\
\text{rango}(A^2)&= 0 \cdot x_1 + 0 \cdot x_2 + 1 \cdot x_3 + \ldots + (n-2)\cdot x_n\\
\text{rango}(A^3)&= 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + (n-3)\cdot x_n\\
&\vdots\\
\text{rango}(A^{n-1})&= 0\cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + 1 \cdot x_n.
\end{align*}

Pero este es un sistema de ecuaciones de determinante $1$, así que su solución es única. Esto muestra que $(m_1,\ldots,m_n)=(m’_1,\ldots,m’_n)$, con lo cual se deduce que $J=J’$.

Como consecuencia de toda esta discusión, obtenemos de hecho lo siguiente.

Corolario. Dos matrices nilpotentes son semejantes si y sólo si tienen la misma forma canónica de Jordan. Distintas formas canónicas de Jordan dan distintas clases de semejanza.

Una receta para encontrar la forma canónica de Jordan de nilpotentes

La demostración anterior no sólo demuestra la unicidad de la forma canónica de Jordan. Además, nos dice exactamente cómo obtenerla. Para ello:

  1. Calculamos todas las potencias de $A$ hasta $n-1$.
  2. Usando reducción gaussiana (o de otro modo), calculamos el rango de cada una de estas potencias.
  3. Resolvemos el sistema de ecuaciones en variables $x_i$ de la sección anterior.
  4. La forma canónica de Jordan de $A$ tiene $x_i$ bloques de tamaño $i$.

Ejemplo. Consideremos la siguiente matriz en $M_7(\mathbb{R})$: $$C=\begin{pmatrix}-27 & 266 & 1 & -37 & 135 & -125 & 53\\217 & -1563 & 118 & 33 & -1251 & 1020 & 361\\236 & -1784 & 188 & 16 & -1512 & 1234 & 585\\11 & -10 & -25 & 12 & 28 & -29 & -80\\-159 & 1133 & -114 & -98 & 878 & -690 & -232\\197 & -1409 & 88 & -19 & -1151 & 952 & 348\\-230 & 1605 & -179 & -100 & 1316 & -1031 & -440\end{pmatrix}$$

Sus números son muy complicados, sin embargo, nos podemos auxiliar de herramientas computacionales para encontrar sus potencias. Soprendenemente esta es una matriz nilpotente de índice $3$ pues:

$$C^2=\begin{pmatrix}0 & -10209 & -3403 & -6806 & -6806 & 10209 & 0\\0 & 14691 & 4897 & 9794 & 9794 & -14691 & 0\\0 & 2739 & 913 & 1826 & 1826 & -2739 & 0\\0 & 7221 & 2407 & 4814 & 4814 & -7221 & 0\\0 & -14193 & -4731 & -9462 & -9462 & 14193 & 0\\0 & 10956 & 3652 & 7304 & 7304 & -10956 & 0\\0 & -11952 & -3984 & -7968 & -7968 & 11952 & 0\end{pmatrix}$$

y

$$C^3=\begin{pmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\\0 & 0 & 0 & 0 & 0 & 0 & 0\end{pmatrix}.$$

Usando reducción gaussiana, o herramientas computacionales, obtenemos que el rango de $C$ es $4$ y que el rango de $C^2$ es $2$. A partir de $j\geq 3$ obtenemos que $\text{rango}(C^j)=0$. Si quieremos encontrar la forma canónica de Jordan de $C$, necesitamos entonces resolver el siguiente sistema de ecuaciones, que nos dirá cuántos bloques $x_i$ de tamaño $i$ hay:

\begin{align*}
7&= x_1+2x_2+3x_3+4x_4+5x_5+6x_6+7x_7\\
4&=x_2 + 2x_3 + 3x_4+4x_5+5x_6+6x_7\\
2&= x_3 + 2x_4+3x_5+4x_6+5x_7 \\
0&= x_4+2x_5+3x_6+4x_7\\
0&= x_5+2x_6+3x_7\\
0&= x_6+2x_7\\
0&= x_7
\end{align*}

Para resolverlo lo mejor es proceder «de abajo hacia arriba». Las últimas cuatro ecuaciones nos dicen que $x_7=x_6=x_5=x_4=0$. Así, el sistema queda un poco más simple, como:

\begin{align*}
7&= x_1+2x_2+3x_3\\
4&=x_2 + 2x_3\\
2&= x_3.
\end{align*}

De la última igualdad, tenemos $x_3=2$, lo que nos dice que la forma canónica de Jordan tendría dos bloques de tamaño $3$. Sustituyendo en la penúltima igualdad obtenemos que $4=x_2+4$, de donde $x_2=0$. Así, no tendremos ningún bloque de tamaño $2$. Finalmente, sustituyendo ambos valores en la primera igualdad obtenemos que $7=x_1+0+6$. De aquí obtenemos $x_1=1$, así que la forma canónica de Jordan tendrá un bloque de tamaño $1$. En resumen, la forma canónica de Jordan es la matriz $$\begin{pmatrix} J_{0,1} & 0 & 0 \\ 0 & J_{0,3} & 0 \\ 0 & 0 & J_{0,3}\end{pmatrix}.$$ Explícitamente, esta es la siguiente matriz:

$$\begin{pmatrix} 0& 0 & 0 & 0 & 0 & 0 & 0 \\ 0& 0 & 1 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 1 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 1 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 1 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix}.$$

Para verla un poco más «como de bloques» la podemos reescribir de la siguiente manera:

$$\left(\begin{array}{c|ccc|ccc} 0& 0 & 0 & 0 & 0 & 0 & 0 \\ \hline 0& 0 & 1 & 0 & 0 & 0 & 0 \\ 0& 0 & 0 & 1 & 0 & 0 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \\ \hline 0& 0 & 0 & 0 & 0 & 1 & 0 \\ 0& 0 & 0 & 0 & 0 & 0 & 1 \\ 0& 0 & 0 & 0 & 0 & 0 & 0 \end{array}\right).$$

$\square$

Más adelante…

Hemos demostrado la existencia y unicidad de la forma canónica de Jordan para matrices nilpotentes. Este es un resultado interesante por sí mismo. Sin embargo, también es un paso intermedio para un resultado más general. En las siguientes entradas hablaremos de una versión más general del teorema de Jordan, para matrices tales que su polinomio característico se descomponga totalmente en el campo en el que estemos trabajando.

Tarea moral

  1. Considera la siguiente matriz: $$M=\begin{pmatrix}11 & 11 & -11 & -11\\-1 & -1 & 1 & 1\\3 & 3 & -3 & -3\\7 & 7 & -7 & -7\end{pmatrix}.$$
    1. Muestra que $M$ es una matriz nilpotente y determina su índice.
    2. ¿Cuál es la forma canónica de Jordan de $M$?
  2. Describe las posibles formas canónicas de Jordan para una matriz nilpotente $A \in M_{5}(F)$ de índice $2$.
  3. Describe las posibles formas canónicas de Jordan para una matriz nilpotente $A \in M_{7}(F)$ de rango $5$.
  4. Encuentra de manera explícita la inversa de la siguiente matriz en $M_n(\mathbb{R})$ y usa esto para dar de manera explícita la solución al sistema de ecuación en las variables $x_i$ que aparece en la entrada: $$\begin{pmatrix} 1 & 2 & 3 & \cdots & n-1 & n \\ 0 & 1 & 2 & \cdots & n-2 & n-1 \\ 0 & 0 & 1 & \cdots & n-3 & n-2 \\ & \vdots & & \ddots & & \vdots\\ 0 & 0 & 0 & \cdots & 1 & 2 \\ 0 & 0 & 0 & \cdots & 0 & 1\end{pmatrix}.$$
  5. Sea $A$ una matriz nilpotente en $M_n(\mathbb{R})$. Muestra que las matrices $A$ y $5A$ son similares entre sí.

Entradas relacionadas

Geometría Analítica I: Teoremas de clasificación de polinomios cuadráticos y curvas cuadráticas

Introducción

Nos hemos estado preparando para enunciar formalmente los resultados de clasificación que nos dirán «cómo son todas las cónicas algebraicamente», o bien que nos dirán «cómo se ven conjuntos de ceros de cualquier polinomio cuadrático en dos variables». En una entrada anterior hablamos de qué es un resultado de clasificación en matemáticas. Después, definimos con toda precisión cuáles son los objetos que clasificaremos: los polinomios cuadráticos en dos variables y las curvas cuadráticas. Finalmente, establecimos las nociones de equivalencia afín y equivalencia isométrica que usaremos para dar nuestra clasificación.

En esta entrada finalmente enunciaremos con toda precisión los teoremas de clasificación que nos interesan. La demostración de estos teoremas no es directa, así que nos tomará algunas entradas más preparar la teoría necesaria para poder hacerlo.

Teoremas de clasificación isométrica

Los primeros teoremas que demostraremos serán bajo la equivalencia dada por las isometrías. Daremos teoremas para clasificar tanto polinomios cuadráticos en dos variables, como curvas cuadráticas.

El resultado para PCDVs es un poco más abstracto. La clasificación es un poco aparatosa, pues habrá muchos posibles parámetros involucrados. Pero tiene la ventaja de que es el que podremos demostrar a partir de las técnicas de matrices que ya conocemos y de algunas más que desarrollaremos sobre la marcha.

El resultado para curvas cuadráticas es muy intuitivo, pues lo podemos pensar en términos puramente geométricos: nos dirá que cualquier curva cuadrática se puede llevar, sin alterar su métrica, a una curva cuadrática mucho más fácil de describir, que viene de una «lista corta» de posibilidades. Como las transformaciones permitidas son las isometrías, esto es lo que más se parece a nuestro entendimiento de «ser la misma figura».

Veamos qué dice cada resultado. El primer teorema clasifica PCDVs a través de isometrías.

Teorema. Cualquier polinomio cuadrático en dos variables es isométricamente equivalente a exactamente alguno de los siguientes polinomios:

  1. A algún polinomio de la forma $\frac{x^2}{a^2}+\frac{y^2}{b^2}-1$ para $a\geq b$ reales distintos de cero
  2. A algún polinomio de la forma $\frac{x^2}{a^2}-\frac{y^2}{b^2}-1$ para $a\geq b$ reales distintos de cero
  3. A algún polinomio de la forma $y^2-cx$ para $c$ real distinto de cero
  4. A algún polinomio de la forma $c^2x^2-y^2$ para $c$ real distinto de cero
  5. A algún polinomio de la forma $c^2x^2-1$ para $c$ real disinto de cero
  6. Al polinomio $x^2$
  7. A algún polinomio de la forma $c^2x^2+y^2$ para $c$ real distinto de cero
  8. A algún polinomio de la forma $\frac{x^2}{a^2}+\frac{x^2}{b^2}+1$ para $a,b$ reales distintos de cero
  9. A algún polinomio de la forma $c^2x^2+1$ para $c$ real distinto de cero

El segundo teorema clasifica curvas cuadráticas bajo isometrías, y será un corolario del teorema anterior.

Teorema. Cualquier curva cuadrática del plano es isométricamente equivalente a exactamente una de las siguientes:

  1. A alguna elipse canónica con centro en $(0,0)$ y focos en el eje $x$
  2. A alguna hipérbola canónica con centro en $(0,0)$ y focos en el eje $x$
  3. A alguna parábola canónica de vértice $(c,0)$ y directriz $y=-c$
  4. A dos rectas que se intersectan en el origen
  5. A dos rectas paralelas de la forma $x=c$ y $x=-c$
  6. A la recta $x=0$
  7. Al origen $(0,0)$
  8. Al conjunto vacío

Teoremas de clasificación afín

Después de realizar la clasificación isométrica, agrandaremos un poco el conjunto de transformaciones que usaremos: permitiremos utilizar cualquier transformación afín. Al hacer esto, tenemos más transformaciones y por lo tanto deberíamos esperar que nuestra clasificación tenga menos posibilidades. En efecto este es el caso.

De hecho, la razón por la cual hacemos esto es que al permitir a todas las transformaciones afines nuestros polinomios cuadráticos en dos variables (o curvas cuadráticas) quedan clasificadas en muy muy pocos tipos: una cantidad finita. A continuación enunciamos los resultados concretos.

El primer teorema es para polinomios cuadráticos en dos variables.

Teorema. Cualquier polinomio cuadrático en dos variables es afínmente equivalente a exactamente uno de los siguientes polinomios:

  1. $x^2+y^2-1$
  2. $x^2-y^2-1$
  3. $y^2-x$
  4. $x^2-y^2$
  5. $x^2+1$
  6. $x^2$
  7. $x^2+y^2$
  8. $x^2+y^2+1$
  9. $x^2+1$

¡Este resultado es fantástico! Existen muchísimas expresiones de la forma $Ax^2+Bxy+Cy^2+Dx+Ey+F$ y el teorema anterior nos dice que, en realidad, podemos «resumirlas» únicamente en nueve posibilidades muy fáciles de enunciar.

Como corolario, obtendremos el segundo resultado para clasificación mediante transformaciones afines: el correspondiente a las curvas cuadráticas.

Teorema. Cualquier curva cuadrática del plano es afínmente equivalente a exactamente una de las siguientes posibilidades:

  1. La circunferencia unitaria
  2. La hipérbola unitaria
  3. La parábola unitaria
  4. Las rectas $y=x$ y $y=-x$
  5. Las rectas $x=1$ y $x=-1$
  6. La recta $x=0$
  7. El origen
  8. El conjunto vacío

Una vez más, es increible que existiendo tantísimas curvas cuadráticas en el plano, sea posible resumirlas a tan solo ocho posibilidades.

Y, ¿por qué sirve esta clasificación?

En el transcurso de las siguientes entradas nos encontraremos con muchas situaciones concretas en las que clasificar una cónica será de utilidad. Mientras tanto discutimos esto de manera un poco informal. Imagina que comenzamos con el siguiente polinomio cuadrático en dos variables: $$P((x,y))=x^2-5xy-y^2+2x-y+5.$$

Tras hacer una figura en el plano usando alguna herramienta computacional, obtenemos que la curva cuadrática definida por $P$ se ve como en la siguiente figura.

Parece ser que esta es una hipérbola. Una de las ventajas del teorema de clasificación isométrica de curvas cuadráticas es que nos dirá que, en efecto, esto es una hipérbola. De hecho, tendremos una manera práctica de encontrar de manera explícita la transformación $T$ que manda el polinomio $P$ que define esta hipérbola $\mathcal{H}$ a un polinomio isométricamente equivalente $P’$ de una hipérbola canónica $\mathcal{H}’$.

¿Cuáles son los focos de $\mathcal{H}$? ¿Cuál es el centro de $\mathcal{H}$? ¿Cuál es la longitud de sus ejes? Esto no se aprecia claramente a partir del polinomio $P$. Sin embargo, la hipérbola $\mathcal{H}’$ tiene ecuación canónica, así que en $P’$ podemos leer fácilmente los focos, ejes y centro de $\mathcal{H’}$. Y luego usando precisamente la transformación $T$ podemos transferir esta información que sabemos de $\mathcal{H}’$ a $\mathcal{H}$. Por ejemplo, usando que $T$ es isometría obtenemos que $\mathcal{H}$ y $\mathcal{H}’$ tienen la misma longitud de ejes.

Más adelante…

En las siguientes entradas nos enfocaremos en demostrar los teoremas de clasificación aquí enunciados. Antes de hacer esto, debemos desarrollar un poco más de teoría. Por un lado, necesitamos comprender cómo las traslaciones nos pueden ayudar a «eliminar los términos lineales» de algunos polinomios cuadráticos. Luego, necesitamos comprender cómo las rotaciones nos pueden ayudar a «eliminar el término cruzado $xy$».

Las traslaciones las podremos entender fácilmente. Sin embargo, las rotaciones que «eliminan el término cruzado» requierirán que entendamos un nuevo procedimiento para matrices simétricas: el de diagonalizarlas. Esto nos llevará a discutir los eigenvalores, eigenvectores y el polinomio característico de la matriz.

Tarea moral

  1. Demuestra que cualesquiera dos segmentos del plano son afínmente equivalentes.
  2. Demuestra que cualesquiera dos rectángulos del plano son afínmente equivalentes.
  3. Resuelve los siguientes incisos:
    1. Prueba que dos cuadrados del plano son isométricamente equivalentes si y sólo si tienen la misma longitud de lado.
    2. Demuestra que cualquier cuadrado es isométricamente equivalente a algún cuadrado de vértices $(0,0)$, $(c,0)$, $(0,c)$ y $(c,c)$ para $c>0$.
    3. Demuestra que el cuadrado de vértices $(0,0)$, $(c,0)$, $(0,c)$ y $(c,c)$ tiene diagonal de longitud $\sqrt{2}c$.
    4. Usa todo lo anterior para demostrar que en cualquier cuadrado de lado $c$ se tiene que la diagonal mide $\sqrt{2}c$.
  4. En el teorema de clasificación afín de PCDV tenemos que cualquier PCDV es afínmente equivalente a exactamente una de las posibilidades enunciadas. En particular, esto implica que de esos nueve polinomios, no hay dos de ellos que sean afínmente equivalentes entre sí. Demuestra esto.
  5. Enuncia y demuestra un teorema de clasificación isométrico y un teorema de clasificación afín para triángulos en el plano.

Entradas relacionadas

Geometría Analítica I: Introducción a resultados de clasificación

Introducción

En tu formación matemática muchas veces te encontrarás con resultados de clasificación. Pero, ¿qué es clasificar en este contexto? A grandes rasgos, consiste en poder decir de manera sencilla cómo son todos los objetos matemáticos que se estén estudiando en un contexto dado.

En esta entrada hablaremos un poco más del problema de clasificar ciertos objetos matemáticos. Iniciaremos con un ejemplo «de juguete» muy básico. Luego, hablaremos de cómo en las clasificaciones geométricas podemos usar transformaciones. Finalmente, daremos un ejemplo sencillo de cómo usar estas ideas en la clasificación de los segmentos del plano.

Ejemplo básico de clasificación

Cuando queremos hacer una clasificación, en el sentido matemático, lo que queremos hacer es tomar algunos objetos matemáticos y decir, bajo algún criterio cómo son todos los «tipos posibles» que existen para esos objetos. Esto puede ser respondido de muchas formas, así que es fundamental acordar dos cosas con precisión:

  1. ¿Cuáles son los objetos que queremos clasificar?
  2. ¿Bajo qué criterio diremos que dos de esos objetos son «del mismo tipo»?

Al final del proceso, nos gustaría tener una lista relativamente fácil de escribir de todas las posibilidades. Esto puede ayudar posteriormente a resolver otros problemas matemáticos o bien a desarrollar más teoría.

Comencemos con un ejemplo «de juguete». Será muy sencillo, pero nos permitirá hablar de algunas de las sutilezas que nos encontraremos en contextos más abstractos. Considera la siguiente figura en la que hay varias figuras geométricas.

Imagina que nos piden «clasificar todas las figuras que están aquí». Lo que nos gustaría obtener al final es una lista con la clasificación, es decir con «todas las posibilidades» de figuras que hay. Si sólo nos dan esta instrucción, entonces estaríamos en problemas: hay muchas forms de clasificar estos objetos.

Una posible clasificación es por forma. Si consideramos equivalentes a dos de estas figuras cuando tienen la misma forma, entonces nuestra lista de posibilidades se reduce a tres: triángulos, cuadrados y círculos. Nuestro teorema de clasificación se vería así:

Teorema. Cualquier figura de la imagen tiene alguna de las siguientes formas:

  1. Triángulo
  2. Cuadrado
  3. Círculo

Este teorema de clasificación está padre. Pero puede ser inútil en algunos contextos. Por ejemplo, imagina que las figuras son muestras que está regalando una tienda de pinturas para que puedas llevarlas a tu casa y usarlas para ver si te gustaría pintar una pared con el color dado. Para estos fines es (prácticamente) lo mismo que te den un cuadrado azul o un triángulo azul. Lo único que importa es el color.

Pensar de esta manera nos da otra manera de clasificar a las figuras: por color. Si usamos esta noción de equivalencia, entonces nuestro resultado de clasificación sería muy distinto.

Teorema. Cualquier figura de la imagen es de alguno de los siguientes colores:

  1. Rojo
  2. Naranja
  3. Amarillo
  4. Verde
  5. Azul

Pero podríamos querer ser mucho más estrictos y querer clasificar considerando ambos criterios: tanto la forma como el color. Quizás uno podría pensar que como hay tres figuras y cinco colores, entonces hay $3\cdot 5=15$ posibilidades en esta clasificación. Obtendríamos el siguiente resultado.

Teorema. Cualquier figura de la imagen es de alguno de los siguientes 15 tipos: triángulo rojo, triángulo naranja, triángulo amarillo, triángulo verde, triángulo azul, cuadrado rojo, cuadrado naranja, cuadrado amarillo, cuadrado verde, cuadrado azul, círculo rojo, círculo naranja, círculo amarillo, círculo verde, círculo azul.

Estrictamente hablando, este resultado es correcto: cualquier figura es de alguno de esos tipos. Pero el teorema tiene algo incómodo: nos está dando posibilidades que no suceden. Por ejemplo, no hay cuadrados amarillos, ni círculos azules.

Una clasificación con forma y color que nos dejaría más satisfecho sería la siguiente:

Teorema. Cualquier figura de la imagen es de alguno de los siguientes 11 tipos:

  1. Triángulo rojo
  2. Triángulo naranja
  3. Triángulo amarillo
  4. Triángulo azul
  5. Cuadrado rojo
  6. Cuadrado naranja
  7. Cuadrado azul
  8. Círculo rojo
  9. Círculo naranja
  10. Círculo amarillo
  11. Círculo verde

Más aún, cualquiera de estas posibilidades sucede.

Este resultado se siente mucho más satisfactorio. Por un lado, no está agregando a la lista «opciones de más». Por otro lado, a partir de él podemos demostrar proposiciones sin tener que volver a ver la figura. Algunos ejemplos son los siguientes:

  • Ningún círculo de nuestra figuras es azul.
  • Todas las figuras verdes son círculos.
  • Ninguna figura amarilla es un cuadrado.

Para mostrar cualquiera de estas, basta ver nuestra clasificación.

¿Podemos dar una clasificación mucho más estricta? Sí, por supuesto. Por ejemplo, podemos considerar dos figuras iguales sólo cuando tienen exactamente la misma figura, color y posición. En este caso nuestro teorema de clasificación tendría un tipo por cada una de las 19 figuras. Esta clasificación también se siente un poco insatisfactoria pues en realidad no estamos «agrupando» figuras, sino simplemente «poniendo a cada una en su propio grupo». Pero bueno, es una clasificación válida también.

Uso de relaciones de equivalencia y particiones

Una manera de formalizar una clasificación es a partir de relaciones de equivalencia y particiones. Recordemos las siguientes dos definiciones:

Definición. Una relación de equivalencia en un conjunto $X$ es una colección de parejas $(x,y)$ en $X\times X$ tales que:

  • (Reflexividad) Para cualquier $x$ en $X$ la pareja $(x,x)$ está en la colección.
  • (Simetría) Si para algunos $x,y$ en $X$ se cumple que la pareja $(x,y)$ está en la colección, entonces la pareja $(y,x)$ también está en la colección.
  • (Transitividad) Si para algunos $x,y,z$ en $X$ se cumple que tanto las parejas $(x,y)$ como $(y,z)$ están en la colección, entonces la pareja $(x,z)$ también está.

Las relaciones de equivalencia nos ayudan a decir cuándo dos objetos de $X$ «son iguales» o «son el mismo» bajo algún criterio usualmente más relajado que la igualdad.

Definición. Una partición de un conjunto $X$ es una colección de conjuntos $(A_i)_{i \in I}$ para algún conjunto de índices $I$ tal que ninguno de los $A_i$ es vacío, cualesquiera dos de ellos tienen intersección vacía y $X=\cup_{i\in I}A_i$.

Un resultado clásico de teoría de conjuntos dice que «una relación de equivalencia da una partición, y viceversa». Formalmente, dada una relación de equivalencia $R$ en un conjunto $X$, podemos crear la clase de equivalencia de un elemento $x$ en $X$ como sigue: $$\overline(x):=\{y \in X: (x,y)\in R\}.$$ El conjunto $\{\overline{x}:x\in X\}$ da una colección de conjuntos que es una partición de $X$. Y viceversa, si tenemos una partición $(A_i)_{i \in I}$, entonces podemos considerar las parejas $(x,y)$ de elementos tales que $x$ y $y$ están en un mismo $A_i$, de donde obtenemos una relación de equivalencia.

Regresando a la idea de clasificar, podemos realizar una clasificación a través de una relación de equivalencia o de una partición. Las clases de equivalencia son los «tipos» de objetos que tenemos. Podemos dar un representante «sencillo» dentro de cada clase de equivalencia para hacer nuestra lista de los posibles «tipos» que existen.

Ejemplo. En los números enteros podemos decir que dos enteros $x$ y $y$ están relacionados cuando $x-y$ es un número par. Es fácil mostrar que esto da una relación de equivalencia y que las clases de equivalencia en este caso son los conjuntos:

\begin{align*}
P&=\{\ldots,-4,-2,0,2,4,\ldots\},
Q&=\{\ldots,-3,-1,1,3,\ldots\}.
\end{align*}

Tenemos que $P$ y $Q$ forman una partición del conjunto $\mathbb{Z}$ de números enteros. Así, esta relación clasifica a los enteros en dos tipos: los pares y los impares. Otra forma de dar esta clasificación es diciendo que «Cualquier entero es equivalente al $0$ o al $1$», o más explícitamente, «Para cualquier entero $z$ se tiene que o bien $z$ es par, o bien $z-1$ es par».

$\square$

Clasificación de segmentos del plano con transformaciones

Hacia donde queremos ir es hacia una clasificación relacionada con la geometría. Por esta razón, las relaciones de equivalencia, particiones o «tipos» de objetos que obtendremos estarán relacionados con nociones geométricas. Una manera de hacer esto es mediante las transformaciones que estuvimos estudiando en la unidad anterior: transformaciones afines, traslaciones, isometrías, transformaciones ortogonales, etc.

Por ejemplo, pensemos en que estamos hablando de los segmentos cerrados y acotados en el plano cartesiano. Es decir, de acuerdo a lo que estudiamos en la primera unidad, para cualesquiera dos puntos distintos $P$ y $Q$ en el plano estamos considerando el conjunto $$\overline{PQ}=\{pP+qQ:0\leq p \leq 1, 0 \leq q \leq 1, p+q=1\}.$$ En la siguiente figura puedes ver algunos de los (muchos) segmentos que hay en el plano:

Familia de segmentos

¿Cómo podemos clasificar a todos los segmentos que hay en el plano? Antes de cualquier cosa, tenemos que ponernos de acuerdo en la clasificación. Una manera de hacer esto es mediante transformaciones del plano. Veamos un par de ejemplos.

Ejemplo. Una primer opción es que digamos que dos segmentos son del mismo tipo cuando podamos trasladar uno de ellos al otro. Si hacemos esto, casi todos los segmentos de la siguiente figura serían del mismo tipo.

Familia de segmentos

El único que no es del mismo tipo que los demás sería el segmento punteado que, aunque lo dibujamos intencionalmente de la misma longitud que los demás, no resulta ser equivalente pues es imposible trasladarlo a alguno de los otros segmentos. Con esta noción de segmentos equivalentes, ¿qué posibilidades tendríamos? Es más o menos fácil convencerse de que para que dos segmentos sean del mismo tipo con esta clasificación necesitamos que a) sean paralelos y b) tengan la misma longitud. Por ello mismo, no es tampoco difícil convencerse del siguiente teorema de clasificación.

Teorema. Cualquier segmento del plano es equivalente bajo traslaciones a un segmento tal que uno de sus extremos es el origen.

$\square$

Veamos otra manera de clasificar los segmentos del plano.

Ejemplo. Diremos que dos segmentos son del mismo tipo si podemos llevar uno al otro a través de una isometría. Si hacemos esto entonces ahora sí todos los segmentos de la siguiente figura son equivalentes (pensando en que el segmento punteado tiene la misma longitud que los otros).

De hecho, por lo que sabemos de las isometrías podemos afirmar que bajo este criterio dos segmentos son del mismo tipo si y sólo si tienen la misma longitud. Esto nos llevaría a un teorema de clasificación un poco distinto.

Teorema. Cualquier segmento se puede mediante isometrías a un segmento que sale del origen y termina en un punto del la forma $(x,0)$ con $x>0$. Más aún, todos estos segmentos son de distinto tipo.

$\square$

En los dos ejemplos anteriores hemos sido un poco informales, pues dejamos varias cosas sin demostrar. Seguramente podrás detectarlas e intentar completar los argumentos que faltan. Algunas de estas cosas faltantes están en los ejercicios.

Más adelante…

En esta entrada hablamos de la noción de «clasificar» de manera muy general, con el fin de entenderla y ver algunas de las sutilezas que nos encontraremos más adelante. A partir de ahora nos enfocaremos en probar resultados de clasificación muy específicos, relacionados con las cónicas.

Sin embargo, queremos ser muy precisos con respecto a la clasificación que daremos. Por esta razón, en las siguientes dos entradas hablaremos de los objetos específicos que queremos clasificar y de las nociones de equivalencia que permitiremos.

Tarea moral

  1. Verifica que en nuestro ejemplo de juguete la relación «tener el mismo color» es una relación de equivalencia.
  2. Para cada una de las clasificaciones que dimos en nuestro ejemplo de juguete encuentra cuántas de las figuras originales hay en cada una de las clases.
  3. Demuestra que la relación en $\mathbb{Z}$ en la cual tenemos a $(x,y)$ si y sólo si $x-y$ es un número par es una relación de equivalencia. Muestra que en este caso la partición consiste en el conjunto de los números pares, y el conjunto de los números impares.
  4. Sea $S$ el conjunto de segmentos en el plano. Diremos un elemento $s_1$ de $S$ es traslacionalmente equivalente a otro elemento $s_2$ de $S$ si existe una traslación $T$ de $\mathbb{R}^2$ tal que $T(s_1)=s_2$. Demuestra que «ser traslacionalmente eqivalente a» es una relación de equivalencia en $S$.
  5. Da teoremas de clasificación de las rectas en $\mathbb{R}$ usando transformaciones para cada una de las siguientes posibilidades:
    1. Dos rectas son del mismo tipo si se puede llevar una a otra mediante una traslación.
    2. Dos rectas son del mismo tipo si se puede llevar una a la otra mediante una rotación.
    3. Dos rectas son del mismo tipo si se puede llevar una a la otra mediante una isometría.

Entradas relacionadas

Geometría Analítica I: Equivalencias afines e isométricas

Introducción

En entradas anteriores hablamos de los objetos que nos interesa clasificar: los polinomios cuadráticos y las curvas cuadráticas. Ahora hablaremos de las nociones que usaremos para considerar a dos polinomios cuadráticos o curvas cuadráticas como «equivalentes». Para ello, definiremos las nociones de «afínmente equivalentes» e «isométricametne equivalentes».

Composición de un PCDV y una transformación afín

Antes de enunciar propiamente el problema de clasificación que queremos resolver, vamos a demostrar un resultado auxiliar fundamental. A grandes rasgos, lo que nos dice es que si combinamos un polinomio cuadrático en dos variables con una transformación afín, entonces de nuevo obtenemos un polinomio cuadrático en dos variables. La demostración hará evidente cómo a veces es más útil la forma matricial de un PCDV.

Teorema. Consideremos $P:\mathbb{R}^2\to \mathbb{R}$ un polinomio cuadrático en dos variables y $T:\mathbb{R}^2\to \mathbb{R}^2$ una transformación afín dados por

\begin{align*}
P(v)&=v^t M v + k^t v + F\\
T(v)&=Av+b
\end{align*}

para $A,M$ matrices de $2\times 2$, para $k,b$ vectores columna en $\mathbb{R}^2$ y $F$ un real. Entonces $P\circ T$ es nuevamente un polinomio cuadrático en dos variables y, explícitamente,

\begin{align*}
(P\circ T)(v)= v^t(A^tMA)v + (2b^t MA + k^t A) v + P(b) .
\end{align*}

Demostración. La expresión que queremos encontrar es $(P\circ T)(v)=P(T(v))=P(Av+b)$. Para evaluar $P$, hagamos cada término poco a poco. A continuación usaremos las propiedades de la multiplicación matricial y de la transposición de matrices. Recordemos que $M$ es una matriz simétrica.

Hagamos las operaciones término a término. En el primer sumando tenemos:

\begin{align*}
(Av+b)^t M (Av+b) &= (v^tA^t+b^t) M (Av+b)\\
&=v^tA^tMAv + v^t A^t M b + b^t M A v + b^t M b\\
&=v^t(A^tMA)v + (A^t M b)^t v + (b^t M A) v + b^t M b\\
&= v^t(A^tMA)v + (b^t M^t A) v + (b^t M A) v + b^t M b \\
&= v^t(A^tMA)v + 2 (b^t M A) v + b^t M b.
\end{align*}

En el segundo sumando tenemos:

\begin{align*}
k^t(Av+b)=k^tAv + k^t b.
\end{align*}

Y el último sumando es $F$. Al sumar todo notemos que aparece un término $b^t M b + k^t b + F=P(b)$. Así, concluimos que: $$(P\circ T)(v)= v^t(A^tMA)v + (2b^t MA + k^t A) v + P(b).$$

Esto muestra que $P\circ T$ es de nuevo un polinomio cuadrático en dos variables y que la fórmula es como se establece en el enunciado del teorema.

$\square$

Aunque parezca que se hiceron varias cuentas, son muchas menos a que si usáramos la expresión en coordenadas. Además, usaremos repetidamente el resultado para ahorrarnos cuentas posteriores. Veamos un pequeño ejemplo de lo que sucede al componer una transformación afín con un PCDV.

Ejemplo. Consideremos al polinomio cuadrático en dos variables $P((x,y))=2x^2-y^2+3x+2$ y a la transformación afín $T((x,y))=(2x,y+1)$. Al realizar la composición obtenemos lo siguiente:

\begin{align*}
(P\circ T)((x,y))&=P(T((x,y))\\
&=P((2x,y+1))\\
&=2(2x)^2-(y+1)^2+3(2x)+2\\
&=4x^2-y^2-2y-1+6x+2\\
&=4x^2-y^2+6x-2y+1.
\end{align*}

En efecto, como lo afirma el teorema, obtenemos nuevamente un polinomio cuadrático en dos variables.

$\square$

La imagen de una curva cuadrática bajo una transformación afín

La sección anterior nos dice qué pasa si «combinamos» un polinomio cuadrático en dos variables y una transformación afín. También podemos preguntarnos qué es lo que sucede si «combinamos» una transformación afín y una curva cuadrática. Aquí lo que estamos pensando es que la transformación afín se la aplicaremos a cada punto de la curva.

Ejemplo. Tomemos la curva cuadrática descrita por el polinomio cuadrático $y^2+3x-y+1=0$. Al trazarla en el plano obtenemos la siguiente figura.

Aparentemente, obtenemos una parábola. Tomemos ahora la transformación afín $T((x,y))=(y-1,x+y)$. Al aplicar esta transformación a cada punto de la curva cuadrática anterior obtenemos la curva roja de la siguiente figura.

Aparentemente estamos obteniendo nuevamente una parábola. Entonces, parece ser que la transformación afín envió una curva cuadrática a otra curva cuadrática.

$\square$

Lo que sucede en el ejemplo anterior de hecho es algo que sucede en general: cuando aplicamos una transformación afín a una curva cuadrática entonces de nuevo obtenemos una curva cuadrática. Esto es lo que afirma el siguiente resultado.

Teorema. Sea $\mathcal{C}$ la curva cuadrática descrita por el polinomio cuadrático en dos variables $P$. Sea $T$ una transformación afín. Entonces $$T(\mathcal{C})=\{T((x,y)): (x,y)\in \mathcal{C}\}$$ también es una curva cuadrática. Más específicamente, es la curva cuadrática descrita por el polinomio cuadrático en dos variables $P\circ Tˆ{-1}$.

Demostración. Como $T$ es transformación afín, entonces es invertible y su inversa $Tˆ{-1}$ también es una transformación afín. Por el teorema anterior, $P\circ Tˆ{-1}$ en efecto es una transformación afín.

Tenemos que un punto $(w,z)$ pertenece a $T\mathcal{C}$ si y sólo si es de la forma $T((x,y))$ con $(x,y)$ en $\mathcal{C}$ es decir, con $P((x,y))=0$. Aplicando $Tˆ{-1}$ en $(w,z)=T((x,y))$, obtenemos que $(x,y)=Tˆ{-1}((w,z))$. Así, $(w,z)$ está en $T(\mathcal{C})$ si y sólo si $P(Tˆ{-1})((x,y))=0$. De esta manera, $T\mathcal{C}$ es precisamente el conjunto de puntos en donde se anula el PCDV $P\circ Tˆ{-1}$.

$\square$

Podemos resumir el teorema anterior como sigue: las transformaciones afines mandan curvas cuadráticas en curvas cuadráticas.

Equivalencias de polinomios y curvas cuadráticas

Al aplicar una transformación afín a un polinomio cuadrático en dos variables, de nuevo obtenemos un polinomio cuadrático. Pero no podemos ir de un polinomio cuadrático a cualquier otro haciendo esto. De hecho, es especial que esto suceda.

Definición. Diremos un polinomio cuadrático en dos variables $P$ es afínmente equivalente a otro polinomio cuadrático en dos variables $Q$ si existe una transformación afín $T$ tal que $P=Q\circ T$.

Así mismo, no cualquier curva cuadrática puede ir a cualquier otra mediante transformaciones afines. ESsto es especial.

Definición Diremos que una curva cuadrática $\mathcal{C}$ es afínmente equivalente a otra curva cuadrática $\mathcal{D}$ si existe una transformación afín $T$ tal que $\mathcal{C}=D$.

Tanto en el caso de polinomios cuadráticos en dos variables, como en el caso de curvas cuadráticas, la relación de ser afínmente equivalente es una relación de equivalencia. Demostraremos esto para el caso de polinomios cuadráticos. El caso de curvas queda como tarea.

Proposición. La relación «ser afínmente equivalente a» es una relación de equivalencia para polinomios cuadráticos en dos variables.

Demostración. Debemos mostrar que la relación es reflexiva, simétrica y transitiva. La relación es reflexiva pues cualquier polinomio cuadrático en dos variables $P$ es afínmente equivalente a sí mismo a través de la transformación afín $$I((x,y))=\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}+ \begin{pmatrix} 0 \\ 0 \end{pmatrix},$$ pues como simplemente es la identidad, tenemos $P \circ I = P$.

Si un polinomio $P$ es afínmente equivalente a uno $Q$, es porque existe una transformación afín $T$ tal que $P=Q\circ T$. Como $T$ es afín, su inversa también lo es, de modo que la igualdad $Q=P\circ Tˆ{-1}$ nos dice que $Q$ es afínmente equivalente a $P$. Esto muestra la simetría de la relación.

Finalmente, para la transitividad tomemos polinomios $P$, $Q$ y $R$ con $P$ afínmente equivalente $Q$ mediante una transformacion afín $T$ y $Q$ afínmente equivalente a $R$ mediante una transformación afín $S$. Tenemos entonces las igualdades $P=Q\circ T$ y $Q=R\circ S$. De este modo $$P=Q\circ T = (R\circ S)\circ T=R\circ (S \circ T).$$

Como la composición de transformaciones afines es una transformación afín, entonces esto nos dice que $P$ es afínmente equivalente a $R$, como queríamos.

$\square$

Ambas nociones de equivalencia afín están muy relacionadas entre sí, aunque no son exactamente lo mismo. En la siguiente proposición veremos que la equivalencia afín de PCDVs implica la equivalencia afín de las curvas cuadráticas que describen. Sin embargo, en los ejercicios verás que hay que ser mucho más cuidadosos con el regreso.

Proposición. Si $\mathcal{C}$ y $\mathcal{D}$ son curvas curvas cuadráticas descritas por polinomios cuadráticos en dos variables $P$ y $Q$ afínmente equivalentes, entonces $\mathcal{C}$ y $\mathcal{D}$ son afínmente equivalentes.

Demostración. Como $P$ y $Q$ son afínmente equivalentes, existe una transformación afín $T$ tal que $P=Q\circ T$. Tenemos entonces que $(x,y)\in \mathcal{C}$ si y sólo si $P((x,y))=0$, lo cual sucede si y sólo si $Q(T((x,y)))=0$, si y sólo si $T((x,y))$ está en $\mathcal{D}$. Esto muestra que $\mathcal{D}=T(\mathcal{C})$.

$\square$

Con menos transformaciones es más difícil ser equivalente

Así como definimos la relación de «ser afínmente equivalente» también podríamos definir relaciones similares usando otros grupos de transformaciones. Por ejemplo:

Definición. Diremos un PCDV $P$ es isométricamente equivalente a otro PCDV $Q$ si existe una isometría $T$ tal que $P=Q\circ T$. Diremos que una curva cuadrática $\mathcal{C}$ es isométricamente equivalente a otra curva cuadrática $\mathcal{D}$ si existe una isometría $T$ tal que $\mathcal{C}=T(\mathcal{D})$

La noción de «ser isométricamente equivalentes» es, en cierto sentido «más fuerte» que la de ser «afínmente equivalentes». ¿Por qué? Porque todas las isometrías son transformaciones afines, pero lo contrario no es cierto. Así, «hay menos» isometrías que transformaciones afines. De esta forma, es «más difícil» que dos curvas cuadráticas sean isométricamente equivalentes, a que sean afínmente equivalentes. Veamos un ejemplo.

Ejemplo. Consideremos las curvas cuadráticas descritas por los siguientes polinomios:

\begin{align*}
P_1((x,y))&=x^2+2x+y^2\\
P_2((x,y))&=x^2+y^2-1\\
P_3((x,y))&=2x^2+y^2-1.
\end{align*}

Al graficarlas obtenemos respectivamente las curvas $\mathcal{C}_1, \mathcal{C}_2, \mathcal{C}_3$ en la siguiente figura. De lo que sabemos de circunferencias y elipses, tenemos que $\mathcal{C}_1$ y $\mathcal{C}_2$ son circunferencias de radio $1$ y que $\mathcal{C}_3$ es una elipse canónica con focos en el eje $y$ y centro en $(0,0)$.

Pensemos primero en equivalencia afín. Las tres curvas cuadráticas son afínmente equivalentes. Para ello, basta ver que los PCDVs que las describen son afínmente equivalentes. Para la equivalencia entre $P_1$ y $P_2$ tomamos la transformación afín $(x,y)\mapsto (x+1,y)$ y notamos que $$P_2((x+1,y))=(x+1)^2+y^2-1=x^2+2x+y^2=P_1((x,y)).$$ Para la equivalencia entre $P_2$ y $P_3$ tomamos la transformación afín $(x,y)\mapsto (\sqrt{2}x,y)$ y notamos que $$P_2((\sqrt{2}x,y))=(\sqrt{2}x)^2+y^2-1=2x^2+y^2-1=P_3((x,y)).$$ La equivalencia afín entre $P_1$ y $P_3$ se obtiene por transitividad.

Como la transformación afín $(x,y)\mapsto (x+1,y)$ es de hecho una traslación, entonces es una isometría. De esta manera, $P_1$ y $P_2$ no sólo son afínmente equivalentes, sino que también son isométricamente equivalentes. Sin embargo, es imposible encontrar una isometría que envíe $\mathcal{C}_2$ a $\mathcal{C}_3$, pues tendría que llevar a $(0,0)$ a un punto equidistante a todos los puntos de $\mathcal{C}_3$. Pero $\mathcal{C}_3$ no es una circunferencia.

En resumen:

  • $\mathcal{C}_1,\mathcal{C}_2,\mathcal{C}_3$ son todas ellas afínmente equivalentes.
  • $\mathcal{C}_1$ es isométricamente equivalente a $\mathcal{C}_2$.
  • $\mathcal{C}_3$ no es isométricamete equivalente a $\mathcal{C}_2$, y por lo tanto tampoco a $\mathcal{C}_1$.

$\square$

Más adelante…

Ya dijimos qué objetos nos interesa clasificar: los polinomios cuadráticos y las curvas cuadráticas. También ya dijimos qué noción de clasificación usaremos: la equivalencia afín o la equivalencia isométrica. Estamos listos para enunciar los teoremas de clasificación que queremos demostrar. Haremos esto en la siguiente entrada. Después, en entradas posteriores, nos enfocaremos a dar la demostración poco a poco. Esto a su ves nos permitirá resolver problemas prácticos de cónicas como poder encontrar su centro o qué tan rotadas están.

Tarea moral

  1. Demuestra que la relación «es afínmente equivalente a» es una relación de equivalencia para curvas cuadráticas.
  2. Encuentra de manera explícita una transformación afín que ayude a ver que los polinomios cuadráticos $x^2+6x+y^2+8$ y $x^2+y^2-4y+3$ son afínmente equivalentes. ¿Son isométricamente equivalentes?
  3. Demuestra que los polinomios cuadráticos en dos variables $P((x,y))=x^2+y^2+1$ y $Q((x,y))=x^2+1$ no pueden ser afínmente equivalentes. Luego, muestra que las curvas cuadráticas que defininen sí son afínmente equivalentes. Como sugerencia, para ver que los polinomios no son afínmente equivalentes procede por contradicción. Supón que sí y obtén una contradicción con el coeficiente de $y^2$.
  4. Muestra lo siguiente:
    1. Dos parábolas canónicas cualesquiera (i.e. descritas por ecuaciones de la forma $y=cx^2$) son afínmente equivalentes.
    2. Dos elipses canónicas cualesquiera (i.e. descritas por ecuaciones de la forma $\frac{x^2}{a^2}+\frac{y^2}{b^2}=1$) son afínmente equivalentes.
    3. Dos hipérbolas canónicas cualesquiera (i.e. descritas por ecuaciones de la forma $\frac{x^2}{a^2}-\frac{y^2}{b^2}=1$) son afínmente equivalentes.
  5. Usa como ejemplo las definiciones de la entrada para definir la noción de ser «traslacionalmente equivalente». Demuestra lo siguiente:
    1. La relación «es traslacionalmente equivalente a» es una relación de equivalencia.
    2. Dos rectas son traslacionalmente equivalentes si y sólo si son paralelas.
    3. Dos circunferencias son traslacionalmente equivalentes si y sólo si son del mismo radio.
    4. Existen elipses isométricamente equivalentes, pero que no son traslacionalmente equivalentes.

Entradas relacionadas