Archivo del Autor: Leonardo Ignacio Martínez Sandoval

Acerca de Leonardo Ignacio Martínez Sandoval

Hola. Soy Leonardo Martínez. Soy Profesor de Tiempo Completo en la Facultad de Ciencias de la UNAM. Hice un doctorado en Matemáticas en la UNAM, un postdoc en Israel y uno en Francia. Además, me gusta colaborar con proyectos de difusión de las matemáticas como la Olimpiada Mexicana de Matemáticas.

Geometría Analítica I: Repaso de conceptos geométricos elementales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada empezamos a hacer un repaso de algunos conceptos geométricos elementales que probablemente has encontrado a lo largo de tu formación. Por un lado, esto puede ayudarte a recordar objetos geométricos específicos y resultados con los que ya te has encontrado. Además, es importante revisar nuevamente estos conceptos pues a partir de ahora necesitamos ser muy precisos con el lenguaje. Por ejemplo, será necesario que distingamos apropiadamente los segmentos, rectas y rayos entre ellos. Finalmente, esta entrada te ayudará a acostumbrarte a la notación que usamos en geometría, es decir, qué tipos de etiquetas le ponemos a cada tipo de objeto geométrico.

Antes de comenzar, hay una aclaración importante por hacer. El repaso que haremos de geometría es un repaso intuitivo. Más adelante, cuando asignemos coordenadas al plano y comencemos a hablar de vectores, entonces ahora sí ya estaremos definiendo nuestros conceptos geométricos de manera formal y tendremos que ser más cuidadosos con la argumentación lógica.

Objetos geométricos básicos

Puedes pensar a un punto como lo que obtienes al colocar la punta del lapiz sobre el papel. Es una figura que tiene una única posición. A los puntos usualmente los denotaremos con letras mayúsculas: $A$, $B$, $C$, $P$, $Q$, $R$, etc.

Un segmento es lo que se obtiene al unir dos puntos directamente el uno al otro. Otra manera de pensarlo es que se tiene que ir de un punto al otro de la manera «más rápida» o «más derecha» posible. A los dos puntos les llamamos los extremos del segmento. Si los nombres de los extremos de un segmento son $A$ y $B$, entonces al segmento lo nombramos $\overline{AB}$. En caso de tener que referirnos al segmento sin usar sus extremos, le podemos dar nombre con letra minúscula, por ejemplo $r, s, t$, etc.

Cuando extendemos un segmento indefinidamente más allá de los dos puntos que lo definen, obtenemos una recta. Una recta queda definida por cualesquiera dos puntos distintos en ella. Si una recta tiene a los puntos distintos $A$ y $B$, entonces llamamos $AB$ a la recta. Aunque sea imposible de apreciarlo en el papel, en pizarrón o en la pantalla de una computadora, las rectas se extienden indefinidamente. Cuando no queremos usar puntos para referirnos a las rectas, las podemos llamar con letras minúsculas como $a,b,c,\ell$, etc.

Si sólo extendemos el segmento más allá de sólo uno de los puntos que lo definen, entonces a la figura que obtenemos le llamamos un rayo. Observa que si tenemos dos puntos $A$ y $B$, entonces es distinto el rayo que extiende al segmento más allá de $B$, que el que extiende al segmento más allá de $A$. Al primero le llamamos el rayo desde $A$ por $B$ (como el que se muestra en la figura). Al segundo le llamamos el rayo desde $B$ por $A$. A los rayos, como a los segmentos, los podemos llamar con letras minúsculas como $r,s,t$,etc.

Cuando dos rectas, segmentos o rayos pasan por un mismo punto, decimos que se intersectan en dicho punto. En la siguiente figura, las rectas $\ell$ y $m$ se intersectan en el punto $P$.

Si $P$ es un punto de intersección de dos rectas distintas $\ell$ y $m$, entonces alrededor de $P$ se forman cuatro regiones. A cada una de las $4$ aperturas entre ambas rectas les llamamos un ángulo entre ellas. De manera similar podemos definir ángulos entre segmentos o rayos que se intersecten, o cualquier mezcla de estos objetos. Los ángulos usualmente los denotamos con letras griegas, como $\alpha, \beta, \gamma, \theta$, etc. (alpha, beta, gamma, theta, etc.).

También podemos referirnos a ellos mediante un punto $A$ en $\ell$, el punto $B$ de intersección y un punto $C$ en $m$, en cuyo caso nos referiremos al ángulo como $\angle ABC$.

Triángulos

Es sumamente inusual que al colocar tres puntos $A$, $B$ y $C$ suceda que haya una misma recta que pase por los tres. Cuando esto pasa, decimos que los puntos están alineados o que son colineales.

Si tomamos tres puntos no alineados $A$, $B$ y $C$, entonces podemos dibujar tres segmentos $BC$, $CA$ y $AB$. A la figura conformada por los tres puntos y los tres segmentos le llamamos un triángulo y usualmente lo denotamos por $\triangle ABC$. A $A$, $B$ y $C$ les llamamos los vértices del triángulo. A los segmentos $BC$, $CA$ y $AB$ les llamamos los lados del triángulo. Usualmente nombramos a estos lados $a,b,c$ para que cada lado use la misma letra que el vértice opuesto (pero en minúscula). A los ángulos dentro del triángulo en $A$, $B$ y $C$ les llamamos usualmente $\alpha, \beta, \gamma$.

Si quisiéramos insistir en llamar triángulo al caso en el que $A$, $B$ y $C$ están una misma recta, insistiremos en llamarlo un triángulo degenerado. En este caso, el triángulo está «apachurrado» y los segmentos que definen los puntos se enciman entre sí.

Mediciones

Parte de la raiz etimológica de la palabra geometría está relacionada con medir. En geometría, nos interesan ciertas magnitudes geométricas asociadas a objetos geométricos. Por el momento, apelaremos a la intuición que has desarrollado con anterioridad para definir estos conceptos pero, como mencionamos arriba, más adelante los formalizaremos.

La distancia entre dos puntos $A$ y $B$ es una magnitud que mide qué tan alejados están los puntos entre sí. Mientras más alejados, mayor distancia entre ellos. Un punto $A$ está a distancia $0$ de sí mismo. Es lo que solías medir con una regla: si colocas un punto en el $0$ de la regla y el otro cae en el número $d$ de la regla, entonces la distancia entre ambos puntos será $d$. Podemos referirnos a la distancia con la letra $d$ y haciendo referencia a los puntos así: $d(A,B)$.

Una magnitud estrechamente relacionada con la distancia es la longitud de un segmento, y se puede pensar exactamente como la distancia entre sus extremos. Mientras más largo sea un segmento (intuitivamente, mientras más tengamos que dibujar para hacerlo), mayor será su longitud. Nos referiremos a la longitud de un segmento $AB$ con la expresión $|AB|$.

Otra medida importante es la de ángulo, que nos indica qué tan abierta la región del msimo nombre definida por dos rectas (o segmentos, o rayos), como la definimos arriba. A mayor apertura en el vértice del ángulo, mayor será la magnitud que le asociamos. Así, típicamente no hacemos distinción entre la región y su apertura, ni en nombre, ni en notación.

Finalmente, también nos interesa una medida de qué tan grande es la región contenida en una figura geométrica en el plano. A esta medida le llamamos el área de la región.

Transformaciones geométricas

Otra noción muy importante en la geometría analítica es la de «transformación». Esto se refiere a alterar nuestros objetos geométricos de alguna manera. Típicamente, esta manera es «amigable» en algún sentido, por ejemplo, respeta distancias o proporciones. Las siguientes son las transformaciones geométricas con las que debes estar más familiarizado de manera intuitiva.

Las traslaciones consisten en mover un objeto de lugar, pero simplemente desplazándolo, sin girarlo.

Las rotaciones consisten en girar un objeto geométrico alrededor de un punto que llamamos el centro de rotación. Para saber cuánto rotamos, usamos un ángulo de rotación. En la siguiente figura puedes ver una rotación con centro $O$ y ángulo $\alpha$.

Las reflexiones consisten en tomar una recta $\ell$ y usarla como espejo, para reflejar en él el objeto que nos interesa.

También consideraremos los reescalamientos, que pueden ser expansiones o contracciones. Tras aplicarlas, obtenemos un objeto geométrico más grande o más pequeño, pero que preserva las proporciones. Para definirlas, usualmente necesitamos un centro de reescalamiento $O$ y un factor de reescalamiento $r$. A continuación se muestran algunos ejemplos con con reescalamientos $2$, $1/2$ y $-1$, con la figura de sombreado claro como el objeto original. ¡El reescalamiento de $-1$ voltea la figura alrededor de $O$!

Hay más transformaciones geométricas, como las proyecciones o cizallamientos. Sin embargo, por ahora no hablaremos de ellas.

Aunque ahora hemos platicado lo que le hace una transformación a un objeto geométrico particular, usualmente nos interesará lo que le hace a todo el plano.

Más adelante…

En esta entrada repasamos varias nociones básicas de la geometría de una manera intuitiva. Es importante que tengas esta entrada como referencia, pues los nombres que usamos ahora para objetos geométricos, propiedades geométricas y transformaciones, serán los que usaremos más adelante. En las siguientes entradas continuaremos con un repaso de los resultados geométricos principales. Este repaso seguirá siendo intuitivo. Más adelante introduciremos formalidad en nuestro estudio de la geometría analítica.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Repasa la diferencia entre rectas, segmentos y rayos.
  2. Explora la interfaz de GeoGebra para asegurarte de que sepas trazar todo lo que hemos platicado. En caso de que no encuentres la funcionalidad, averigua cómo hacerlo mediante una búsqueda en línea o mediante algún video explicativo.
  3. Copia la siguiente figura en una hoja de papel. Luego, realiza manualmente una rotación de 90 grados alrededor del punto $O$.
  1. Copia la siguiente figura en una hoja de papel. Luego, realiza manualmente una reflexión de la figura con respecto a la recta $\ell$.
  1. Ahora vamos a trasladar al gato y a la casa. Pero tienes que hacerlo repetidamente. Haz la figura en tu cuaderno de modo que quede dentro de un cuadrado de 4cm de lado. Luego, repetidamente traslada ese cuadrado 5cm a la derecha para poner todas las copias que puedas de la figura hasta que se te acabe la hoja. Entonces, las transformaciones geométricas las podemos aplicar una y otra vez.

Entradas relacionadas

Matemáticas a Distancia: Una plataforma de aprendizaje

Por Leonardo Ignacio Martínez Sandoval

Introducción

Si has sido seguidor de El blog de Leo y has aprovechado el material de aprendizaje de matemáticas universitarias que tenemos, esta entrada te interesa.

Quizás desde hace años has visto cómo este espacio ha crecido bastante. De hecho, yo mismo lo he visto crecer de formas que no imaginaba al principio. Empezó como un blog personal, que luego se volvió algo así como un blog de «la vida de un matemático en formación», con pensamientos matemáticos varios y algunas anécdotas personales, de viajes y de la academia. Sin embargo, al ser uno de los primeros espacios digitales que empecé a mantener, lo convertí en el hogar de otros proyectos de gran alcance en los que he estado involucrado, por ejemplo el Concurso Universitario de Matemáticas Galois-Noether y el repositorio de videos de resolución de problemas. Y, más recientemente, de todo un ecosistema de notas de matemáticas para estudiantes universitarios. En esta entrada quiero hablar un poco más de lo segundo, y de su relación con un proyecto más amplio que se llama Matemáticas a Distancia.

Antes de comenzar, me gusta recordar que, aunque el sitio lleva mi nombre, mucho del contenido que encuentran aquí es en realidad el fruto del esfuerzo de muchas personas. Por favor, recuerden siempre revisar a los autores de cada entrada, pues este es un esfuerzo colectivo para generar material libre y de calidad. Bueno, sin decir más, quiero entonces empezarles a platicar acerca del proyecto que engloba todas notas de docencia que hemos trabajado aquí en el blog, de Matemáticas a Distancia.

¿Qué es Matemáticas a Distancia y cómo nació?

Matemáticas a Distancia es una iniciativa que se empezó a planear en 2020 en la Facultad de Ciencias de la UNAM. Cuando presenté mis papeles para concursar por una plaza de tiempo completo en la Facultad, puse en mi plan de docencia que sería bueno que los estudiantes tuvieran un portal «tipo Khan Academy«, pero con material para la Licenciatura en Matemáticas. En aquel momento, había varias ventajas fáciles de describir sobre tener algo así. Sin embargo, la pandemia que se desató ese año aceleró los planes de que dicho portal naciera. Al irnos a trabajar a casa, resultó importante tener material para compartir con mis estudiantes durante el tiempo de la emergencia. Y entonces surgieron las primeras notas tipo blog.

No fui el único al que se le ocurrió crear material para sus cursos. Muchos de mis colegas o bien ya contaban con algo de material, o bien la pandemia los orilló a crearlo. Así, entre varios profesores nos pusimos de acuerdo para solicitar un apoyo PAPIME de la UNAM, con el fin de trabajar en un proyecto mejor armado. El objetivo principal que compartimos desde ese entonces fue ofrecer un ecosistema digital unificado para la Licenciatura en Matemáticas. Desde el inicio hay tres principios fundamentales que perseguimos:

  • Que el material sea gratuito.
  • Que el material sea abierto.
  • Que el material sea de calidad.

Así, todo empezó como una respuesta a la necesidad de flexibilizar la educación. Pero desde entonces el proyecto ha crecido muchísimo. Tras el primer año abrimos nuestra página de internet en https://www.mdistancia.com. En años posteriores conseguimos más apoyo institucional para acercar a numerosos profesores y estudiantes para desarrollar más material. Además, hemos trabajado para que no se trate únicamente de subir archivos a la red, sino que haya también en el material cierto acompañamiento adicional, ya sea mediante la respuesta a comentarios de blog, interacciones en YouTube u ofreciendo cuestionarios para que quien revise el material pueda ir verificando su entendimiento.

Lo que tenemos para ti hoy

Actualmente, el portal ha consolidado una oferta muy robusta que el equipo ha ido puliendo con el tiempo. En la plataforma contamos con 27 COMALes (Curso Online de Matemáticas Abierto para licenciatura), que son cursos en línea que cubren la teoría completa de diversas asignaturas obligatorias y optativas de la licenciatura.

También tenemos material para las carreras de Actuaría y Ciencias de la Computación.

Además de los cursos largos, hacia 2023 surgió la idea de que contáramos con otros mini-cursos de habilidades complementarias. Introducimos esa funcionalidad en la plataforma y hemos creado 7 mini-COMALes, para poder desarrollar en una menor cantidad de tiempo alguna habilidad complementaria o profesionalizante:

  • Cimientos Matemáticos: Para contar con los fundamentos matemáticos correctos antes de empezar en la vía universitaria.
  • Computación Científica Introductoria con Python: Para una aproximación informal, pero útil a la programación, desde su utilidad en las matemáticas mismas.
  • Curso de LaTeX para Ciencias: Para conocer los fundamentos de trabajar en LaTeX y realizar colaboraciones matemáticas en Overleaf.
  • Geometría Interactiva: Para descubrir con software distintos resultados de geometría.
  • Introducción a Pandas en Python: Para un primer acercamiento al análisis de datos.
  • Los Elementos de Euclides: Para visualizar en video distintos resultados de la clásica obra de Euclides.
  • Notas de Apoyo para Teoría de Gráficas I: Para contar con una guía express para esta materia optativa de la licenciatura.

Todo este material es gratuito. Intentamos que sea compatible entre sí, en el sentido de que permita fácilmente saltar de una materia a otra.

Además, la última noticia es que el portal ya permite tener un aprendizaje más personalizado, pues desde febrero de 2026 ya es posible abrir una cuenta.

¿Por qué te conviene abrir una cuenta en Matemáticas a Distancia?

Si eres usuario frecuente de este blog, te darás cuenta de que aquí la experiencia es principalmente de lectura y quizás de interactuar mediante los comentarios. Sin embargo, hay algunas limitaciones en quedarse sólo en el blog:

  • Es difícil saber cuáles son todas las entradas de blog de aprendizaje de matemáticas que existen.
  • No es tan fácil recordar cuáles entradas ya has visto y cuáles no.
  • Para guardar tus entradas favoritas tienes que saturar los favoritos de tu navegador.

Al abrir una cuenta en Matemáticas a Distancia, lo cual es totalmente gratuito, podrás hacer lo siguiente:

  • Llevar un registro detallado de tus avances en cada curso para que sepas exactamente dónde te quedaste la última vez que estudiaste.
  • Encontrar en los COMALes correspondientes material auxiliar para cada nota.
  • Marcar materiales, notas o videos como favoritos para que los tengas a la mano en consultas rápidas.
  • Resolver los cuestionarios de autoevaluación integrados en los cursos y guardar tus puntuaciones para ver cómo vas mejorando.
  • Recibir actualizaciones directas sobre nuevos contenidos, guías de supervivencia académica o herramientas que integremos a la plataforma.
  • Estar al tanto de material que no está en formato notas de blog.

Conclusión

En fin, esta entrada era para hacerles saber de la existencia de Matemáticas a Distancia, pues es un proyecto grande que, en particular, abarca las notas de docencia de El blog de Leo. Si bien esto no incluye a todo el blog, me parece que una gran cantidad de los seguidores y personas que visitan este blog pueden beneficiarse de tener también ese otro portal en mente.

En general, me entusiasma mucho ver que el material que empezó como material de clase, ahora sirva a tantas personas en distintas partes del mundo hispanohablante. Esto siempre es inspiración para seguir trabajando tanto en El blog de Leo como en Matemáticas a Distancia, y para que el equipo siga ofreciendo material cada vez más útil y diverso.

Si ya conoces el blog, pero no Matemáticas a Distancia, te invito entonces a que explores el sitio en https://www.mdistancia.com. Explora un poco el Árbol de Recursos. Usa el Buscador. Intenta ver si hay algún COMAL o mini-COMAL que te interese seguir. Si te animas, abre una cuenta para poder llevar un registro del esfuerzo. Y si sí te animas, cuéntame también por acá en los comentarios qué tal fue la experiencia.

Geometría Analítica I: Intersección de rectas en forma normal

Por Leonardo Ignacio Martínez Sandoval

Introducción

Una pregunta geométrica muy natural es determinar cómo es la intersección de dos objetos geométricos, es decir, cuales son aquellos puntos que pertenecen a ambos. En el caso de las rectas, eso tiene una respuesta sencilla: la intersección de dos rectas puede ser vacía (cuando son paralelas), o bien un único punto, o bien una recta (cuando son la misma recta).

Como veremos a continuación, esto es sencillo de formalizar utilizando la forma normal de las rectas. Más aún, la forma normal nos ayudará a detectar mediante una cuenta sencilla exactamente en cuál de los casos anteriores nos encontramos. Así mismo, en caso de estar en la caso de que la intersección sea un único punto, también nos dará un procedimiento para encontrar sus coordenadas.

¿Cuándo dos vectores son paralelos?

Antes de estudiar concretamente la intersección de dos rectas, vamos a apoyarnos de la intuición que hemos desarrollado. Si tenemos rectas en forma normal correspondientes a vectores normales $u$ y $v$, entonces sabemos que las rectas son perpendiculares, respectivamente a los vectores $u$ y $v$. Si estos vectores están en la misma dirección, entonces las rectas también. Por ello, las rectas serán paralelas y entonces la intuición nos dice que o bien no se intersectarán, o bien serán la misma recta. Parece ser entonces importante encontar un criterio algebraico para saber cuándo dos vectores son paralelos o no.

Consideremos dos vectores no nulos $u=(u_1,u_2)$ y $v=(v_1,v_2)$. ¿Cuándo estos vectores son paralelos? Como los vectores están anclados en el origen, esto sucede únicamente cuando o bien $u$ es múltiplo escalar de $v$, o bien $v$ es múltiplo escalar de $u$. De esto sale el siguiente criterio algebraico:

Proposición. Tomemos dos vectores no nulos $u=(u_1,u_2)$ y $v=(v_1,v_2)$. Estos vectores son paralelos si y sólo si la expresión $u_1v_2-u_2v_1$ es igual a cero.

Demostración. Demostraremos la proposición en ambas direcciones.

$(\Rightarrow)$ Supongamos que los vectores $u=(u_1,u_2)$ y $v=(v_1,v_2)$ son paralelos. Si $u$ y $v$ son paralelos, entonces uno es un múltiplo escalar del otro. Sin pérdida de generalidad, supongamos que $u = k v$ para algún escalar $k \in \mathbb{R}$. Esto significa que:

$$u_1 = kv_1 \quad \text{y} \quad u_2 = kv_2.$$

Sustituyendo estas expresiones en $u_1v_2-u_2v_1$, obtenemos:

\begin{align*} u_1v_2-u_2v_1 &= (kv_1)v_2 – (kv_2)v_1 \\ &= kv_1v_2 – kv_2v_1 \\ &= 0. \end{align*}

Por lo tanto, si $u$ y $v$ son paralelos, entonces $u_1v_2-u_2v_1 = 0$.

$(\Leftarrow)$ Ahora supongamos que $u_1v_2-u_2v_1 = 0$. Queremos demostrar que $u$ y $v$ son paralelos. La condición $u_1v_2-u_2v_1 = 0$ se puede reescribir como $u_1v_2 = u_2v_1$.

Como $v$ no es el vector nulo, tenemos los siguientes casos:

  • Caso 1: $v_1 \neq 0$. De la igualdad $u_1v_2 = u_2v_1$, podemos despejar $u_2$ como $u_2 = \frac{u_1v_2}{v_1}$. Definamos $k = \frac{u_1}{v_1}$. Entonces, $u_1 = kv_1$. Sustituyendo $u_1$ en la expresión para $u_2$: $$u_2 = \frac{(kv_1)v_2}{v_1} = kv_2.$$ Así, tenemos $u_1 = kv_1$ y $u_2 = kv_2$, lo que implica que $$u = (u_1, u_2) = (kv_1, kv_2) = k(v_1, v_2) = kv.$$ Por lo tanto, $u$ es un múltiplo escalar de $v$, y son paralelos.
  • Caso 2: $v_1 = 0$. Dado que $v \neq (0,0)$, si $v_1 = 0$, entonces $v_2 \neq 0$. La condición $u_1v_2 = u_2v_1$ se convierte en $u_1v_2 = u_2 \cdot 0$, lo que implica $u_1v_2 = 0$. Como $v_2 \neq 0$, debemos tener $u_1 = 0$. En este subcaso, los vectores son $v=(0,v_2)$ y $u=(0,u_2)$. Estos vectores son paralelos pues ambos están en el eje $y$. Más concretamente, $u=\frac{u_2}{v_2} v$.

En ambos casos, si $u_1v_2-u_2v_1 = 0$, los vectores $u$ y $v$ son paralelos.

$\square$

Así, la expresión $u_1v_2-u_2v_1$ parece ser muy importante para nuestro problema de determinar la intersección de dos rectas. En efecto, en las siguientes secciones volverá a aparecer.

Intersección de rectas en forma normal

La siguiente proposición nos dice exactamente cómo es la intersección de dos rectas una vez que las tenemos en forma normal.

Proposición. Sean $a_1,a_2$ vectores no nulos de $\mathbb{R}^2$ y $b_1,b_2$ número reales. Consideremos las siguientes dos rectas en forma normal:

\begin{align*}
\ell_1 &= \{(x,y) \in \mathbb{R}^2: a_1 \cdot (x,y) = b_1\} \\
\ell_2 &= \{(x,y) \in \mathbb{R}^2: a_2 \cdot (x,y) = b_2\}.
\end{align*}

La intersección de estas rectas tiene las siguientes posibilidades:

  • Si $a_1$ y $a_2$ no son vectores paralelos, entonces la intersección de $\ell_1$ y $\ell_2$ es única.
  • Si $a_1$ y $a_2$ son vectores paralelos, entonces $a_1=ka_2$ para algún real $k$:
    • Si $b_1=kb_2$, entonces ambas ecuaciones representan la misma recta y entonces la intersección es ella misma.
    • Si $b_1\neq kb_2$, entonces las rectas son distintas y paralelas y por lo tanto tienen intersección vacía.

Demostración. Vayamos por casos. Nombremos $a_1=(a_{11},a_{12})$ y $a_2=(a_{21},a_{22})$.

Las ecuaciones de las rectas son:

$$
\begin{cases}
a_{11}x + a_{12}y = b_1 \\
a_{21}x + a_{22}y = b_2
\end{cases}
$$

Esto es un sistema de ecuaciones lineales. Analicemos las posibilidades:

  • Caso 1: $a_1$ y $a_2$ no son vectores paralelos. Según la proposición anterior, dos vectores $a_1=(a_{11},a_{12})$ y $a_2=(a_{21},a_{22})$ no son paralelos si y sólo si la expresión $a_{11}a_{22}-a_{12}a_{21}$ es distinta de cero. Multiplicando la primera ecuación por $a_{21}$ y la segunda ecuación por $a_{11}$ obtenemos lo siguiente:
    \begin{align*} a_{21}(a_{11}x + a_{12}y) &= a_{21}b_1 \\ a_{11}(a_{21}x + a_{22}y) &= a_{11}b_2 \end{align*}
    Lo que resulta en el sistema equivalente:
    \begin{align*} a_{11}a_{21}x + a_{12}a_{21}y &= a_{21}b_1 \\ a_{11}a_{21}x + a_{11}a_{22}y &= a_{11}b_2 \end{align*}
    Restando la primera ecuación de la segunda, eliminamos $x$ y obtenemos:
    \begin{align*} (a_{11}a_{21}x + a_{11}a_{22}y) – (a_{11}a_{21}x + a_{12}a_{21}y) &= a_{11}b_2 – a_{21}b_1 \\ (a_{11}a_{22} – a_{12}a_{21})y &= a_{11}b_2 – a_{21}b_1 \end{align*}
    Dado que $a_{11}a_{22}-a_{12}a_{21} \neq 0$, podemos despejar $y$ para obtener un valor único. De manera análoga, se puede encontrar un valor único para $x$. Esto demuestra que existe una única solución $(x,y)$ para el sistema, lo que significa que la intersección de $\ell_1$ y $\ell_2$ es única.
  • Caso 2: $a_1$ y $a_2$ son vectores paralelos, y $b_1=kb_2$ para algún $k \in \mathbb{R}$. Si $a_1$ y $a_2$ son paralelos, entonces $a_1 = ka_2$ para algún escalar $k \in \mathbb{R}$ (ya que $a_1$ y $a_2$ son vectores no nulos). Esto implica que $a_{11} = ka_{21}$ y $a_{12} = ka_{22}$. La ecuación de la recta $\ell_1$ es $a_{11}x + a_{12}y = b_1$. Sustituyendo las expresiones para $a_{11}$ y $a_{12}$ en esta ecuación, obtenemos: \begin{align*} (ka_{21})x + (ka_{22})y &= b_1 \\ k(a_{21}x + a_{22}y) &= b_1 \end{align*} Sabemos que para los puntos en $\ell_2$, se cumple $a_{21}x + a_{22}y = b_2$. Sustituyendo esto en la ecuación anterior, obtenemos $kb_2 = b_1$. Si se cumple la condición $b_1=kb_2$, entonces la ecuación de $\ell_1$ se convierte en $k(a_{21}x + a_{22}y) = kb_2$. Dado que $a_1$ es no nulo, $k$ no puede ser cero. Podemos dividir por $k$ para obtener $a_{21}x + a_{22}y = b_2$. Esta es exactamente la ecuación de la recta $\ell_2$. Por lo tanto, ambas ecuaciones representan la misma recta, y su intersección es la recta completa.
  • Caso 3: $a_1$ y $a_2$ son vectores paralelos, y $b_1 \neq kb_2$ para algún $k \in \mathbb{R}$. Similar al Caso 2, si $a_1$ y $a_2$ son paralelos, entonces $a_1 = ka_2$ para algún $k \in \mathbb{R}$. Esto lleva a que la ecuación de $\ell_1$ pueda escribirse como $k(a_{21}x + a_{22}y) = b_1$. Si existiera un punto $(x,y)$ en la intersección de $\ell_1$ y $\ell_2$, debería satisfacer ambas ecuaciones. Es decir, $a_{21}x + a_{22}y = b_2$ (por ser un punto de $\ell_2$) y $k(a_{21}x + a_{22}y) = b_1$ (por ser un punto de $\ell_1$). Sustituyendo la primera en la segunda, obtendríamos $kb_2 = b_1$. Sin embargo, la condición de este caso es que $b_1 \neq kb_2$. Esto significa que no puede haber ningún punto $(x,y)$ que satisfaga ambas ecuaciones simultáneamente. Por lo tanto, las rectas son paralelas y distintas, y su intersección es vacía.

$\square$

Ejemplo de rectas iguales

Veamos ahora ejemplos de cada una de estas posibilidades:

Ejemplo. Encuentra la intersección de las rectas dadas por las siguientes ecuaciones.

\begin{align*}
(1,-2)\cdot (x,y) = 3\\
(-2,4) \cdot (x,y) = -6.
\end{align*}

Solución. Identifiquemos los vectores normales $a_1$ y $a_2$, y los escalares $b_1$ y $b_2$:

$$a_1 = (1,-2), \quad b_1 = 3$$

$$a_2 = (-2,4), \quad b_2 = -6$$

Primero, verificamos si los vectores normales $a_1$ y $a_2$ son paralelos. Calculamos la expresión $a_{11}a_{22}-a_{12}a_{21}$:

\begin{align*} a_{11}a_{22}-a_{12}a_{21} &= (1)(4) – (-2)(-2) \\ &= 4 – 4 \\ &= 0. \end{align*}

Dado que la expresión es cero, los vectores $a_1$ y $a_2$ son paralelos. De hecho, por inspección notamos que $(1,-2) = -\frac{1}{2}(-2,4)$.

Notemos que también sucede que $b_1=3=-\frac{1}{2}6$. Según la proposición, las rectas son entonces la misma. Por lo tanto, la intersección de las dos rectas es la recta misma, $\ell_1$. Podemos escribir la solución como el conjunto de puntos $(x,y)$ que satisfacen $x – 2y = 3$.

$\triangle$

Ejemplo de rectas que no se intersectan

Ejemplo. Encuentra la intersección de las rectas dadas por las siguientes ecuaciones:

\begin{align*}
(3,-4)\cdot (x,y) = 3\\
(-6,8) \cdot (x,y) = -2.
\end{align*}

Solución. Identifiquemos los vectores normales $a_1$ y $a_2$, y los escalares $b_1$ y $b_2$:

$$a_1 = (3,-4), \quad b_1 = 3$$

$$a_2 = (-6,8), \quad b_2 = -2$$

Primero, verificamos si los vectores normales $a_1$ y $a_2$ son paralelos. Calculamos la expresión $a_{11}a_{22}-a_{12}a_{21}$:

\begin{align*} a_{11}a_{22}-a_{12}a_{21} &= (3)(8) – (-4)(-6) \\ &= 24 – 24 \\ &= 0 \end{align*}

Como obtenemos cero, los vectores $a_1$ y $a_2$ son paralelos. Esto significa que $a_1 = ka_2$ para algún escalar $k$. En efecto, $a_1= -\frac{1}{2} a_2$. Sin embargo, ahora $-\frac{1}{2} b_2 = 1 \neq 3 = b_1$. Esto significa que las rectas son paralelas y distintas.

Por lo tanto, la intersección de las dos rectas es vacía.

$\triangle$

La siguiente figura muestra ambas rectas. En efecto, las rectas parecen ser paralelas.

Ejemplo de rectas que se intersectan en un único punto

Ejemplo. Determina dónde se intersectan la recta paralela a $(3,1)$ que pasa por el punto $(1,1)$ y la recta perpendicular a $(2,2)$ que pasa por el punto $(5,-3)$.

Solución. Para poder usar los resultados de esta entrada, primero pasaremos cada una de estas ecuaciones a forma normal $a \cdot (x,y) = b$.

Recta 1: Paralela a $(3,1)$ y pasa por $(1,1)$.

Si la recta es paralela al vector $(3,1)$, su vector normal $a_1$ debe ser perpendicular a $(3,1)$. Un vector perpendicular a $(3,1)$ es, por ejemplo, $a_1 = (-1,3)$.

La ecuación de la recta es de la forma $-x + 3y = b_1$. Para encontrar $b_1$, sustituimos el punto $(1,1)$ por el que pasa la recta:

$$b_1= -(1) + 3(1) = 2.$$

Así, la primera recta en forma normal es $\ell_1 =\{(-1,3) \cdot (x,y) = 2\}$, correspondiente a la ecuación $-x+3y=2$.

Recta 2: Perpendicular a $(2,2)$ y pasa por $(5,-3)$.

Si la recta es perpendicular al vector $(2,2)$, entonces su vector normal $a_2$ es $(2,2)$.

La ecuación de la recta es de la forma $2x + 2y = b_2$. Para encontrar $b_2$, sustituimos el punto $(5,-3)$ por el que pasa la recta:

$$b_2 = 2(5)+2(-3)=4.$$

Así, la segunda recta en forma normal corresponde a la ecuación $2x+y=4$, que es equivalente a $x+y=2$. Así, podemos ponerle en forma normal como $\ell_2=\{(1,1) \cdot (x,y) = 2\}$.

De este modo, encontrar los puntos de intersección de las rectas corresponde a resolver el siguiente sistema de ecuaciones:

$$\begin{cases} -x + 3y = 2\\ x + y = 2. \end{cases}$$

Identificamos los vectores normales $a_1 = (-1,3)$ y $a_2 = (1,1)$. Veamos si $a_1$ y $a_2$ son paralelos. Para ello, calculamos la expresión $a_{11}a_{22}-a_{12}a_{21}$:

\begin{align*} a_{11}a_{22}-a_{12}a_{21} &= (-1)(1) – (3)(1) \\ &= -1 – 3 \\ &= -4. \end{align*}

Dado que el resultado no es cero, los vectores $a_1$ y $a_2$ no son paralelos. Según la proposición, esto significa que la intersección de las dos rectas es un punto único, que podemos encontrar resolviendo el sistema de ecuaciones. Sumando la primera ecuación con la segunda:

\begin{align*} (-x + 3y) + (x + y) &= 2 + 2 \\ 4y &= 4 \\ y &= 1. \end{align*}

Como $y$ es $1$, entonces de la segunda igualdad concluimos que $x=1$ también. Por lo tanto, las rectas se intersecan en el punto $(1,1)$.

$\triangle$

La siguiente figura muestra ambas rectas. La visualización coincide con lo que demostramos formalmente.

Más adelante…

Hemos entendido cómo se ve la intersección de rectas a partir de su forma normal. Pero la forma normal de una recta no sólo nos ayuda a hablar de la recta misma. Una pequeña variación nos permite hablar también de cada uno de los dos pedazos en los que queda dividido el plano por la recta. A cada uno de estos pedazos le llamamos semiplano. ¿Cómo se verá la intersección de semiplanos? Daremos una introducción a estas ideas en la siguiente entrada.

Tarea moral

  1. De la siguiente lista de vectores, identifica todos aquellos $u$ y $v$ que cumplan que $u$ es paralelo a $v$:
    \begin{align*}&(1,1), (3,3), (5,2), (2,5), (10,4), \\&(-5,-2), (-3,3), (2,-2), (4,0), (5,1).\end{align*}
  2. Encuentra la intersección de las siguientes parejas de rectas:
    • $2x+3y=1$ y $3x+2y=2$.
    • $15+20y=12$ y $-6x-8y=7$.
    • $x+y=1$ y $-x-y=-1$.
  3. En los resultados de esta entrada hemos pedido que los vectores $u$ y $v$ sean no nulos para que las rectas en forma normal estén bien definidas. Pero si alguno de estos vectores es cero, todavía se pueden plantear un sistema de dos ecuaciones. ¿Qué posibilidades hay para estos sistemas de ecuaciones?
  4. Si tenemos vectores $u$, $v$ y $w$ en el plano, muestra que están en una misma línea si y sólo si $u-v$ y $w-v$ son paralelos.
  5. Toma tres vectores $u$, $v$ y $w$ de modo que no estén en una misma línea. La altura desde $u$ es la recta por $u$, perpendicular a $v-w$. De manera análoga se definen las alturas por $v$ y $w$.
    • Encuentra la intersección de la altura por $u$ y la altura por $v$.
    • Encuentra la intersección de la altura por $u$ y la altura por $w$.
    • Demuestra analíticamente, con las técnicas que hemos platicado aquí, que las tres alturas pasan por un mismo punto.

Entradas relacionadas

Álgebra Lineal II: Aplicaciones de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que cualquier matriz (o transformación lineal) tiene una y sólo una forma canónica de Jordan. Además, explicamos cómo se puede obtener siguiendo un procedimiento específico. Para terminar nuestro curso, platicaremos de algunas de las consecuencias del teorema de Jordan.

Clasificación de matrices por similaridad

Una pregunta que aún no hemos podido responder es la siguiente: si nos dan dos matrices $A$ y $B$ en $M_n(F)$, ¿son similares? Con la maquinaria desarrollada hasta ahora podemos dar una muy buena respuesta.

Proposición. Sean $A$ y $B$ matrices en $M_n(F)$ tales que el polinomio característico de $A$ se divide en $F$. Entonces, $A$ y $B$ son similares si y sólo si se cumplen las siguientes dos cosas:

  • El polinomio característico de $B$ también se divide en $M_n(F)$ y
  • $A$ y $B$ tienen la misma forma canónica de Jordan.

Demostración. Sea $J$ la forma canónica de Jordan de $A$.

Si $A$ y $B$ son similares, como $A$ es similar a $J$, se tiene que $B$ es similar a $J$. Entonces, $B$ tiene el mismo polinomio característico que $A$ y por lo tanto se divide en $F$. Además, como $J$ es similar a $B$, entonces por la unicidad de la forma canónica de Jordan, precisamente $J$ es la forma canónica de Jordan de $B$. Esto es un lado de nuestra proposición.

Supongamos ahora que el polinomio característico de $B$ también se divide en $M_n(F)$ y que la forma canónica de Jordan de $B$ también es $J$. Por transitividad de similaridad, $A$ es similar a $B$.

$\square$

Veamos un ejemplo de cómo usar esto en un problema específico.

Problema. Encuentra dos matrices en $M_2(\mathbb{R})$ que tengan como polinomio característico a $x^2-3x+2$, pero que no sean similares.

Solución. Las matrices $A=\begin{pmatrix} 1 & 0 \\ 0 & 2 \end{pmatrix}$ y $B=\begin{pmatrix} 1 & 1 \\ 0 & 2 \end{pmatrix}$ ya están en forma canónica de Jordan y son distintas, así que por la proposición anterior no pueden ser similares. Además, por ser triangulares superiores, en ambos casos el polinomio característico es $$(X-1)(X-2)=X^2-3X+2.$$

$\triangle$

El problema anterior fue sumamente sencillo. Piensa en lo difícil que sería argumentar con cuentas de producto de matrices que no hay ninguna matriz $P\in M_2(\mathbb{R})$ tal que $A=P^{-1}B P$.

Forma canónica de Jordan «para cualquier matriz»

Como en $\mathbb{C}[X]$ todos los polinomios se dividen, entonces tenemos el siguiente corolario del teorema de Jordan.

Corolario. Toda matriz en $M_n(\mathbb{C})$ tiene una única forma canónica de Jordan.

Aquí $\mathbb{C}$ es muy especial pues es un campo completo, es decir, en el cual cualquier polinomio no constante tiene por lo menos una raíz. En general esto no es cierto, y es muy fácil dar ejemplos: $x^2-2$ no tiene raíces en $\mathbb{Q}$ y $x^2+1$ no tiene raíces en $\mathbb{R}$.

Sin embargo, existe toda un área del álgebra llamada teoría de campos en donde se puede hablar de extensiones de campos. Un ejemplo de extensión de campo es que $\mathbb{C}$ es una extensión de $\mathbb{R}$ pues podemos encontrar «una copia de» $\mathbb{R}$ dentro de $\mathbb{C}$ (fijando la parte imaginaria igual a cero).

Un resultado importante de teoría de campos es el siguiente:

Teorema. Sea $F$ un campo y $P(X)$ un polinomio en $F[X]$. Existe una extensión de campo $G$ de $F$ tal que $P(X)$ se divide en $G$.

¿Puedes notar la consecuencia que esto trae para nuestra teoría de álgebra lineal? Para cualquier matriz en $M_n(F)$, podemos considerar a su polinomio característico y encontrar campo $G$ que extiende a $F$ en donde el polinomio se divide. Por el teorema de Jordan, tendríamos entonces lo siguiente.

Corolario. Sea $A$ una matriz en $M_n(F)$. Entonces, $A$ tiene una forma canónica de Jordan en un campo $G$ que extiende a $F$.

Por supuesto, la matriz $P$ invertible que lleva $A$ a su forma canónica quizás sea una matriz en $M_n(G)$.

Toda matriz compleja es similar a su transpuesta

Ya demostramos que para cualquier matriz $A$ en $M_n(F)$ se cumple que $\chi_A(X)=\chi_(A^T)(X)$. Esto implica que $A$ y su transpuesta $A^T$ tienen los mismos eigenvalores, traza y determinante. También vimos que $\mu_A(X)=\mu_{A^T}(X)$. Las matrices $A$ y $A^T$ comparten muchas propiedades. ¿Será que siempre son similares? A continuación desarrollamos un poco de teoría para resolver esto en el caso de los complejos.

Proposición. Sea $J_{\lambda,n}$ un bloque de Jordan en $M_n(F)$. Entonces, $J_{\lambda,n}$ y $J_{\lambda,n}^T$ son similares.

Demostración. Para bloques de Jordan, podemos dar explícitamente la matriz de similitud. Es la siguiente matriz, con unos en la diagonal no principal:

$$P=\begin{pmatrix} 0 & 0 & \ldots & 0 & 1 \\ 0 & 0 & \ldots & 1 & 0 \\ \vdots & & \ddots & \vdots & \\ 0 & 1 & \ldots & 0 & 0 \\ 1 & 0 & \ldots & 0 & 0 \end{pmatrix}.$$

Esta matriz es invertible, su inversa es ella misma y cumple lo siguiente (ver ejercicios). Si $A$ es una matriz en $M_n(F)$, entonces:

  • Si $A$ tiene columnas $C_1,\ldots, C_n$, entonces $AP$ tiene columnas $C_n, \ldots, C_1$.
  • Si $A$ tiene filas $R_1,\ldots, R_n$, entonces $PA$ tiene filas $R_n, \ldots, R_1$.

Para los bloques de Jordan, si revertimos el orden de las filas y luego el de las columnas, llegamos a la transpuesta. Así, $J_{\lambda,n}^T=PJ_{\lambda,n}P$ es la similitud entre las matrices dadas.

$\square$

La prueba anterior no funciona en general pues para matrices arbitrarias no pasa que $A^T=PAP$ (hay un contraejemplo en los ejercicios). Para probar lo que buscamos, hay que usar la forma canónica de Jordan.

Teorema. En $M_n(\mathbb{C})$, toda matriz es similar a su transpuesta.

Demostración. Sea $A$ una matriz en $M_n(\mathbb{C})$. Como en $\mathbb{C}$ todo polinomio se divide, tanto $A$ como $A^T$ tienen forma canónica de Jordan. Digamos que la forma canónica de Jordan es

\begin{equation}J=\begin{pmatrix} J_{\lambda_1,k_1} & 0 & 0 & \ldots & 0 \\ 0 & J_{\lambda_2,k_2} & 0 & \ldots & 0 \\ 0 & 0 & J_{\lambda_3,k_3} & \ldots & 0 \\ & \vdots & & \ddots & \vdots \\ 0 & 0 & 0 & \ldots & J_{\lambda_d,k_d}\end{pmatrix}.\end{equation}

Si $P$ es la matriz de similitud, tenemos que $A=P^{-1}JP$ y al transponer obtenemos que:

$$A^T=P^T\begin{pmatrix} J_{\lambda_1,k_1}^T & 0 & 0 & \ldots & 0 \\ 0 & J_{\lambda_2,k_2}^T & 0 & \ldots & 0 \\ 0 & 0 & J_{\lambda_3,k_3}^T & \ldots & 0 \\ & \vdots & & \ddots & \vdots \\ 0 & 0 & 0 & \ldots & J_{\lambda_d,k_d}^T\end{pmatrix}(P^T)^{-1}.$$

Como por la proposición anterior cada bloque de Jordan es similar a su transpuesta, existen matrices invertibles $Q_1,\ldots,Q_d$ tales $J_{\lambda_i,k_i}^T=Q_i^{-1}J_{\lambda_i,k_i}Q_i$ para todo $i\in\{1,\ldots,d\}$. Pero entonces al definir $Q$ como la matriz de bloques

$$Q=\begin{pmatrix} Q_1 & 0 & \ldots & 0 \\ 0 & Q_2 & \ldots & 0 \\ 0 & \vdots & \ddots & \vdots \\ 0 & 0 & \ldots & Q_d \end{pmatrix},$$

obtenemos la similaridad

$$A^T=P^TQ^{-1} \begin{pmatrix} J_{\lambda_1,k_1} & 0 & 0 & \ldots & 0 \\ 0 & J_{\lambda_2,k_2} & 0 & \ldots & 0 \\ 0 & 0 & J_{\lambda_3,k_3} & \ldots & 0 \\ & \vdots & & \ddots & \vdots \\ 0 & 0 & 0 & \ldots & J_{\lambda_d,k_d}\end{pmatrix} Q (P^T)^{-1}.$$

Así, $A$ y $A^T$ tienen la misma forma canónica de Jordan y por lo tanto son matrices similares.

$\square$

Más adelante…

¡Hemos terminado el curso de Álgebra Lineal II! Por supuesto, hay muchos temas de Álgebra Lineal adicionales que uno podría estudiar.

Un tema conectado con lo que hemos platicado es qué hacer con las matrices cuyo polinomio característico no se divide en el campo con el que estamos trabajando. Por ejemplo si tenemos una matriz $A$ en $M_n(\mathbb{R})$ cuyo polinomio característico no se divide, una opción es pensarla como matriz en $M_n(\mathbb{C})$ y ahí encontrar su forma canónica de Jordan. ¿Pero si queremos quedarnos en $\mathbb{R}$? Sí hay resultados que llevan una matriz a algo así como una «forma canónica» en $\mathbb{R}$ muy cercana a la forma canónica de Jordan.

Otro posible camino es profundizar en la pregunta de cuándo dos matrices en $M_n(F)$ son similares. Si tienen forma canónica de Jordan, ya dimos una buena caracterización en esta entrada. En los ejercicios encontrarás otra. Pero, ¿y si no tienen forma canónica de Jordan? Podríamos extender el campo a otro campo $G$ y comprar las formas canónicas ahí, pero en caso de existir la similaridad, sólo la tendremos en $M_n(G)$. Existe otra manera de expresar a una matriz en forma canónica, que se llama la forma canónica de Frobenius y precisamente está pensada para determinar si dos matrices son similares sin que sea necesario encontrar las raíces del polinomio característico, ni extender el campo.

Estos son sólo dos ejemplos de que la teoría de álgebra lineal es muy extensa. En caso de que estés interesado, hay mucho más por aprender.

Tarea moral

  1. Sea $A$ una matriz en $M_n(F)$ y tomemos $P$ en $M_n(F)$ la matriz
    $$P=\begin{pmatrix} 0 & 0 & \ldots & 0 & 1 \\ 0 & 0 & \ldots & 1 & 0 \\ \vdots & & \ddots & \vdots & \\ 0 & 1 & \ldots & 0 & 0 \\ 1 & 0 & \ldots & 0 & 0 \end{pmatrix}.$$
    • Demuestra que si $A$ tiene columnas $C_1,\ldots, C_n$, entonces $AP$ tiene columnas $C_n, \ldots, C_1$.
    • Demuestra que si $A$ tiene filas $R_1,\ldots,R_1$, entonces $PA$ tiene filas $R_n,\ldots,R_n$.
    • Concluye con cualquiera de los incisos anteriores que $P$ es invertible y su inversa es ella misma.
    • Tomemos explicitamente $n=2$ y $A=\begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}$. Encuentra explícitamente $PAP$. ¿Es $A^T$?
  2. ¿Cuál es la máxima cantidad de matrices que se pueden dar en $M_5(\mathbb{C})$ de manera que cada una de ellas tenga polinomio característico $x^2(x^2+1)(x+3)$ y tales que no haya dos de ellas que sean similares entre sí.
  3. Sea $A$ una matriz en $M_n(\mathbb{R})$ tal que su polinomio característico se divide en $\mathbb{R}$, con forma canónica de Jordan $J$. Sea $P(X)$ un polinomio en $\mathbb{R}[X]$.
    • Demuestra que el polinomio característico de $P(A)$ se divide en $\mathbb{R}$.
    • La forma canónica de Jordan de $P(A)$ no necesariamente será $P(J)$ pues puede que el polinomio altere el orden de los eigenvalores pero, ¿cómo se obtiene la forma canónica de $P(A)$ a partir de $J$?
  4. Sean $A$ y $B$ matrices en $M_n(F)$ cuyo polinomio característico se divide en $F$. Muestra que $A$ y $B$ son similares si y sólo si para cualquier polinomio $P(X)$ en $F[X]$ se tiene que $\text{rango}(P(A))=\text{rango}(P(B))$.
  5. Investiga sobre la forma canónica de Frobenius y sobre la variante a la forma canónica de Jordan restringida a $\mathbb{R}$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Unicidad de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan y demostramos la existencia de dicha forma bajo ciertas hipótesis. Como corolario, quedó pensar cuál es la versión para matrices. En esta entrada enunciamos la versión para matrices (totalmente equivalente a la de transformaciones lineales) y nos enfocamos en mostrar la unicidad de la forma canónica de Jordan.

Unicidad de la forma canónica de Jordan

El siguiente teorema es totalmente análogo al enunciado en la entrada anterior. Recuerda que $\leq$ es un orden total fijo de $F$ (en $\mathbb{R}$, es el orden usual).

Teorema. Sea $A$ una matriz $M_n(F)$ cuyo polinomio característico $\chi_A(X)$ se divide en $F$. Entonces, existen únicos valores $\lambda_1\leq \ldots \leq \lambda_n$ en $F$ y únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} para los cuales $A$ es similar a la siguiente matriz de bloques de Jordan:

$$\begin{pmatrix} J_{\lambda_1,k_1} & 0 & \cdots & 0 \\ 0 & J_{\lambda_2,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{\lambda_d,k_d}\end{pmatrix}.$$

Usaremos esta versión para demostrar la unicidad, lo cual también implicará la unicidad para la versión de transformaciones lineales.

Mediante la demostración de existencia de la entrada anterior, llegamos a que si el polinomio característico de $A$ es

$$\chi_A(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r},$$

entonces $A$ es similar a una matriz conformada por matrices de bloques de Jordan $J_1,J_2,\ldots,J_r$, en donde cada $J_i$ es de tamaño $m_i$ y de bloques de Jordan de eigenvalor $\lambda_i$.

Si $A$ fuera similar a otra matriz $K$ de bloques de Jordan, podríamos agrupar por eigenvalores de los bloques $\kappa_1< \ldots < \kappa_s$ en matrices de bloques de Jordan tamaños $o_1,\ldots,o_s$, digamos $K_1,\ldots,K_s$. El polinomio característico de $K$ sería entonces

$$\chi_{K}(X)=(X-\kappa_1)^{o_1}(X-\kappa_2)^{o_2}\cdots(X-\kappa_s)^{o_s}.$$

Pero $K$ es similar a $A$, y entonces deben tener el mismo polinomio característico, así que conciden en raíces y multiplicidad. Esto demuestra que $r=s$ y como los $\lambda_i$ y los $\kappa_i$ están ordenados, también demuestra las igualdades $\lambda_i=\kappa_i$ y $m_i=o_i$ para todo $i\in\{1,\ldots,r\}.$

Sólo nos queda argumentar la igualdad entre cada $J_i$ y $K_i$ para $i\in\{1,\ldots,r\}$. Pero ambas una forma canónica de Jordan para la transformación nilpotente que se obtiene de restringir $T_{A-\lambda_i I}$ a $\ker(T_{A-\lambda_i I}^{m_i})$. Por la unicidad que demostramos para la forma canónica de Jordan para transformaciones nilpotentes, concluimos que $J_i=K_i$. Esto termina la demostración de la unicidad de la forma canónica de Jordan.

$\square$

Una receta para encontrar la forma canónica de Jordan

Ya con el teorema demostrado, ¿cómo juntamos todas las ideas para encontrar la forma canónica de Jordan de una matriz $A$ en $M_n(F)$ cuyo polinomio característico se divida en $F$? Podemos proceder como sigue.

  1. Encontramos el polinomio característico $\chi_A(X)$ y su factorización, digamos $$\chi_A(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r}.$$
  2. Nos enfocamos en encontrar las matrices de bloque de Jordan $J_i$ para cada eigenvalor $\lambda_i$. Sabemos que la matriz $J_i$ será de tamaño $m_i$.
  3. Para saber exactamente cuál matriz de bloques de Jordan es $J_i$, pensaremos en que tiene $b_1,b_2,\ldots,b_{m_i}$ bloques de Jordan de eigenvalor $\lambda_i$ de tamaños $1,2, \ldots,m_i$. Consideramos la matriz $A_i=A-\lambda_i I$. Los $b_1,\ldots,b_{m_i}$ son la solución al siguiente sistema de ecuaciones en las variables $x_1,\ldots,x_{m_i}$.
    \begin{align*}
    m_i&= 1\cdot x_1 + 2\cdot x_2 + 3 \cdot x_3 + \ldots + m_i \cdot x_{m_i}\\
    m_i-n+\text{rango}(A_i-\lambda_i I)&=0\cdot x_1 + 1\cdot x_2 + 2 \cdot x_3 + \ldots + (m_i-1) \cdot x_{m_i}\\
    m_i-n+\text{rango}({A_i-\lambda_i I}^2)&= 0 \cdot x_1 + 0 \cdot x_2 + 1 \cdot x_3 + \ldots + (m_i-2)\cdot x_{m_i}\\
    m_i-n+\text{rango}({A_i-\lambda_i I}^3)&= 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + (m_i-3)\cdot x_{m_i}\\
    &\vdots\\
    m_i-n+\text{rango}({A_i-\lambda_i I}^{m_i-1})&= 0\cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + 1 \cdot x_{m_i}.
    \end{align*}
  4. Juntamos todos los $J_i$ en una misma matriz y los ordenamos apropiadamente.

El paso número $3$ está motivado por lo que sabemos de las matrices nilpotentes, y es bueno que pienses por qué se estudia específicamente ese sistema de ecuaciones para cada eigenvalor $\lambda_i$ y multiplicidad $m_i$.

Ejemplo de obtener la forma canónica de Jordan

Veamos algunos ejemplos del procedimiento descrito en la sección anterior. Primero, tenemos que dicho procedimiento generaliza la noción de diagonalizar.

Ejemplo. Encontremos la forma canónica de Jordan de la matriz $$A=\begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}$$

Solución.

Primero, calculamos el polinomio característico de $A$:

$$\chi_A(X) = \det(A – XI) = \det \begin{pmatrix} 2-X & 1 \\ 1 & 2-X \end{pmatrix}$$

$$ = (2-X)(2-X) – 1 \cdot 1 = (2-X)^2 – 1 = X^2 – 4X + 4 – 1 = X^2 – 4X + 3.$$

Factorizamos el polinomio característico para encontrar los eigenvalores:

$$\chi_A(X) = (X-1)(X-3).$$

Tenemos dos eigenvalores distintos: $\lambda_1 = 1$ con multiplicidad algebraica $m_1 = 1$, y $\lambda_2 = 3$ con multiplicidad algebraica $m_2 = 1$.

Para cada eigenvalor, la matriz de bloques de Jordan correspondiente $J_i$ tendrá un tamaño igual a su multiplicidad algebraica. Como ambas multiplicidades son $1$, cada $J_i$ será una matriz de $1 \times 1$ con el eigenvalor en la entrada. La forma canónica de Jordan de $A$ se obtiene juntando estos bloques en una matriz diagonal por bloques:

$$J = \begin{pmatrix} J_1 & 0 \\ 0 & J_2 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}.$$

Dado que todos los bloques de Jordan son de tamaño $1 \times 1$, la matriz $A$ es diagonalizable. La forma canónica de Jordan es simplemente la matriz diagonal de eigenvalores.

$\square$

Veamos ahora un ejemplo más complicado.

Ejemplo. Encontraremos la forma canónica de Jordan de la siguiente matriz: $$A=\begin{pmatrix}-226 & -10 & -246 & 39 & 246\\234 & 23 & 236 & -46 & -236\\-198 & -20 & -192 & 41 & 195\\-93 & 10 & -122 & 10 & 122\\-385 & -30 & -393 & 74 & 396\end{pmatrix}.$$

Con herramientas computacionales, podemos darnos cuenta de que el polinomio característico de esta matriz es $$\chi_A(X)=X^{5} – 11 X^{4} + 46 X^{3} – 90 X^{2} + 81 X- 27.$$

Este polinomio se puede factorizar como $$(X-1)^2(X-3)^3.$$ Así, la submatriz de bloques de Jordan $J_1$ de eigenvalor $1$ tendrá tamaño $2$ y la $J_3$ de eigenvalor $3$ tendrá tamaño $3$. Pero, ¿de qué tamaño son cada uno de los bloques de Jordan en cada una de estas matrices?

Para respondernos esto para $J_1$, notamos que sus bloques son de tamaño $1$ y $2$ solamente. Si hay $b_1$ bloques de tamaño $1$ y $b_2$ bloques de tamaño $2$, por la teoría desarrollada arriba tendremos:

\begin{align*}
b_1+2b_2&=2\\
b_2&=2-5+\text{rango}(A-I)=2-5+4=1.
\end{align*}

El rango de $A-I$ lo obtuvimos computacionalmente, pero recuerda que también puede ser obtenido con reducción gaussiana. Resolviendo el sistema, $b_2=1$ y entonces $b_1=0$. Concluimos que en $J_1$ hay un bloque de Jordan de tamaño $2$.

Para $J_3$, reciclemos las variables $b_i$ (para no introducir nuevas). Los bloques pueden ser de tamaño $1,2,3$. Supongamos que de estos tamaños respectivamente hay $b_1,b_2,b_3$ bloques. Los $b_i$ cumplen:

\begin{align*}
b_1+2b_2+3b_3&=3\\
b_2+2b_3&=3-5+\text{rango}(A-3I)=3-5+3=1\\
b_3&=3-5+\text{rango}((A-3I)^2)=3-5+2=0.
\end{align*}

Así, $b_3=0$, y en consecuencia $b_2=1$ y entonces $b_1=1$. Concluimos que $J_3$ tiene un bloque de tamaño $1$ y uno de tamaño $3$. Por lo tanto, la forma canónica de Jordan de $A$ es:

$$\begin{pmatrix} J_1 & 0 \\ 0 & J_3 \end{pmatrix} = \begin{pmatrix} J_{1,2} & 0 & 0 \\ 0 & J_{3,1} & 0 \\ 0 & 0 & J_{3,2} \end{pmatrix} = \begin{pmatrix}1 & 1 & 0 & 0 & 0\\0 & 1 & 0 & 0 & 0\\0 & 0 & 3 & 0 & 0\\0 & 0 & 0 & 3 & 1\\0 & 0 & 0 & 0 & 3\end{pmatrix}$$

$\triangle$

Otro problema sobre forma canónica de Jordan

La receta anterior funciona en general y da la forma canónica de Jordan. Esto es algo que probablemente en la práctica en aplicaciones no tendrás que hacer manualmente nunca, pues hay herramientas computacionales que te pueden ayudar. Sin embargo, es importante entender con profundidad el teorema y la receta de manera teórica, pues hay problemas conceptuales en los que no podrás usar herramientas computacionales. A continuación veremos un ejemplo.

Problema. Sea $A$ una matriz en $M_6(\mathbb{R})$ con polinomio característico $$\chi_A(X)=X^6-2X^4+X^2.$$

  • ¿Cuántas posibilidades hay para la forma canónica de Jordan de $A$?
  • Demuestra que si el rango de $A$ es $5$, entonces $A$ no es diagonalizable.

Solución. Podemos factorizar el polinomio característico de $A$ como sigue:

$$\chi_A(X)=X^2(X+1)^2(X-1)^2.$$

Así, la forma canónica de Jordan está conformada por una matriz de bloques de Jordan $J_0$ de eigenvalor $0$ y tamaño $2$; una $J_1$ de eigenvalor $1$ y tamaño $2$; y una $J_{-1}$ de eigenvalor $-1$ y tamaño $2$.

Cada $J_i$ tiene dos chances: o es un bloque de Jordan de tamaño $2$, o son dos bloques de Jordan de tamaño $1$. Así, en total tenemos $2\cdot 2 \cdot 2=8$ posibilidades.

Si $A$ es de rango $5$, entonces tendríamos en las cuentas de cantidad de bloques $b_1$ y $b_2$ para eigenvalor $0$ que

\begin{align*}
b_1+2b_2&=2\\
b_2&=2-6+\text{rango}(A)=2-6+5=1,
\end{align*}

de donde en $J_0$ tendría $1$ bloque de tamaño $2$ y ninguno de tamaño $1$. Si $A$ fuera diagonalizable, su diagonalización sería una forma canónica de Jordan donde para eigenvalor $0$ se tendrían $2$ bloques de tamaño $1$ y ninguno de tamaño $2$. Así, $A$ tendría dos formas canónicas de Jordan distintas, lo cual es imposible.

$\square$

Más adelante…

Con esta entrada terminamos de demostrar el teorema de la forma canónica de Jordan, uno de los teoremas más bonitos de álgebra lineal. ¿Te das cuenta de todo lo que utilizamos en su demostración? Forma matricial de transformaciones lineales, el teorema de Cayley-Hamilton, polinomio característico, subespacios estables, teoría de dualidad, sistemas de ecuaciones lineales, resultados auxiliares de polinomios, etc. Es un resultado verdaderamente integrador.

En la siguiente entrada, la última del curso, hablaremos de algunas de las consecuencias del teorema de la forma canónica de Jordan. Discutiremos cómo lo podemos utilizar para clasificar a las matrices por similaridad. Veremos una aplicación con respecto a una matriz y su transpuesta. También, esbozaremos un poco de por qué en cierto sentido el resultado no sólo vale para las matrices cuyo polinomio se divide sobre el campo, sino que para cualquier matriz. Con ello terminaremos el curso.

Tarea moral

  1. Calcula la forma canónica de Jordan $J$ de la matriz $$A=\begin{pmatrix} 1 & 0 & -3 \\ 1 & -1 & -6 \\ -1 & 2 & 5 \end{pmatrix}.$$ Además de encontrar $J$, encuentra de manera explícita una matriz invertible $P$ tal que $A=P^{-1}JP$.
  2. Calcula la forma canónica de Jordan de la matriz $$\begin{pmatrix} 1 & 1 & 0 & 0 \\ 0 & 1 & 2 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 2 \end{pmatrix}$$
  3. Explica y demuestra cómo obtener lo siguiente para una matriz de bloques de Jordan:
    • Su polinomio característico.
    • Su polinomio mínimo.
    • Su determinante.
    • Su traza.
    • Sus eigenespacios.
  4. Justifica con más detalle por qué la receta que se propone para calcular la forma canónica de Jordan en efecto funciona. Necesitarás varios de los argumentos que dimos en la entrada anterior.
  5. Demuestra que una matriz $A\in M_n(F)$ para la cual su polinomio característico se divide en $F$ es diagonalizable si y sólo si cada bloque de cada matriz de bloques de la forma canónica de Jordan tiene tamaño $1$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»