Archivo de la etiqueta: transformaciones lineales

Álgebra Lineal II: Aplicaciones de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que cualquier matriz (o transformación lineal) tiene una y sólo una forma canónica de Jordan. Además, explicamos cómo se puede obtener siguiendo un procedimiento específico. Para terminar nuestro curso, platicaremos de algunas de las consecuencias del teorema de Jordan.

Clasificación de matrices por similaridad

Una pregunta que aún no hemos podido responder es la siguiente: si nos dan dos matrices $A$ y $B$ en $M_{n} (F)$ , ¿son similares? Con la maquinaria desarrollada hasta ahora podemos dar una muy buena respuesta.

Proposición. Sean $A$ y $B$ matrices en $M_{n} (F)$ tales que el polinomio característico de $A$ se divide en $F$ . Entonces, $A$ y $B$ son similares si y sólo si se cumplen las siguientes dos cosas:

El polinomio característico de $B$ también se divide en $M_{n} (F)$ y
$A$ y $B$ tienen la misma forma canónica de Jordan.

Demostración. Sea $J$ la forma canónica de Jordan de $A$ .

Si $A$ y $B$ son similares, como $A$ es similar a $J$ , se tiene que $B$ es similar a $J$ . Entonces, $B$ tiene el mismo polinomio característico que $A$ y por lo tanto se divide en $F$ . Además, como $J$ es similar a $B$ , entonces por la unicidad de la forma canónica de Jordan, precisamente $J$ es la forma canónica de Jordan de $B$ . Esto es un lado de nuestra proposición.

Supongamos ahora que el polinomio característico de $B$ también se divide en $M_{n} (F)$ y que la forma canónica de Jordan de $B$ también es $J$ . Por transitividad de similaridad, $A$ es similar a $B$ .

Veamos un ejemplo de cómo usar esto en un problema específico.

Problema. Encuentra dos matrices en $M_{2} (R)$ que tengan como polinomio característico a $x^{2} - 3 x + 2$ , pero que no sean similares.

Solución. Las matrices $A = (\begin{matrix} 1 & 0 \\ 0 & 2 \end{matrix})$ y $B = (\begin{matrix} 1 & 1 \\ 0 & 2 \end{matrix})$ ya están en forma canónica de Jordan y son distintas, así que por la proposición anterior no pueden ser similares. Además, por ser triangulares superiores, en ambos casos el polinomio característico es $(X - 1) (X - 2) = X^{2} - 3 X + 2.$

$△$

El problema anterior fue sumamente sencillo. Piensa en lo difícil que sería argumentar con cuentas de producto de matrices que no hay ninguna matriz $P \in M_{2} (R)$ tal que $A = P^{- 1} B P$ .

Forma canónica de Jordan «para cualquier matriz»

Como en $C [X]$ todos los polinomios se dividen, entonces tenemos el siguiente corolario del teorema de Jordan.

Corolario. Toda matriz en $M_{n} (C)$ tiene una única forma canónica de Jordan.

Aquí $C$ es muy especial pues es un campo completo, es decir, en el cual cualquier polinomio no constante tiene por lo menos una raíz. En general esto no es cierto, y es muy fácil dar ejemplos: $x^{2} - 2$ no tiene raíces en $Q$ y $x^{2} + 1$ no tiene raíces en $R$ .

Sin embargo, existe toda un área del álgebra llamada teoría de campos en donde se puede hablar de extensiones de campos. Un ejemplo de extensión de campo es que $C$ es una extensión de $R$ pues podemos encontrar «una copia de» $R$ dentro de $C$ (fijando la parte imaginaria igual a cero).

Un resultado importante de teoría de campos es el siguiente:

Teorema. Sea $F$ un campo y $P (X)$ un polinomio en $F [X]$ . Existe una extensión de campo $G$ de $F$ tal que $P (X)$ se divide en $G$ .

¿Puedes notar la consecuencia que esto trae para nuestra teoría de álgebra lineal? Para cualquier matriz en $M_{n} (F)$ , podemos considerar a su polinomio característico y encontrar campo $G$ que extiende a $F$ en donde el polinomio se divide. Por el teorema de Jordan, tendríamos entonces lo siguiente.

Corolario. Sea $A$ una matriz en $M_{n} (F)$ . Entonces, $A$ tiene una forma canónica de Jordan en un campo $G$ que extiende a $F$ .

Por supuesto, la matriz $P$ invertible que lleva $A$ a su forma canónica quizás sea una matriz en $M_{n} (G)$ .

Toda matriz compleja es similar a su transpuesta

Ya demostramos que para cualquier matriz $A$ en $M_{n} (F)$ se cumple que $χ_{A} (X) = χ_{(} A^{T}) (X)$ . Esto implica que $A$ y su transpuesta $A^{T}$ tienen los mismos eigenvalores, traza y determinante. También vimos que $μ_{A} (X) = μ_{A^{T}} (X)$ . Las matrices $A$ y $A^{T}$ comparten muchas propiedades. ¿Será que siempre son similares? A continuación desarrollamos un poco de teoría para resolver esto en el caso de los complejos.

Proposición. Sea $J_{λ, n}$ un bloque de Jordan en $M_{n} (F)$ . Entonces, $J_{λ, n}$ y $J_{λ, n}^{T}$ son similares.

Demostración. Para bloques de Jordan, podemos dar explícitamente la matriz de similitud. Es la siguiente matriz, con unos en la diagonal no principal:

$P = (\begin{matrix} 0 & 0 & \dots & 0 & 1 \\ 0 & 0 & \dots & 1 & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 1 & \dots & 0 & 0 \\ 1 & 0 & \dots & 0 & 0 \end{matrix}) .$

Esta matriz es invertible, su inversa es ella misma y cumple lo siguiente (ver ejercicios). Si $A$ es una matriz en $M_{n} (F)$ , entonces:

Si $A$ tiene columnas $C_{1}, \dots, C_{n}$ , entonces $A P$ tiene columnas $C_{n}, \dots, C_{1}$ .
Si $A$ tiene filas $R_{1}, \dots, R_{n}$ , entonces $P A$ tiene filas $R_{n}, \dots, R_{1}$ .

Para los bloques de Jordan, si revertimos el orden de las filas y luego el de las columnas, llegamos a la transpuesta. Así, $J_{λ, n}^{T} = P J_{λ, n} P$ es la similitud entre las matrices dadas.

La prueba anterior no funciona en general pues para matrices arbitrarias no pasa que $A^{T} = P A P$ (hay un contraejemplo en los ejercicios). Para probar lo que buscamos, hay que usar la forma canónica de Jordan.

Teorema. En $M_{n} (C)$ , toda matriz es similar a su transpuesta.

Demostración. Sea $A$ una matriz en $M_{n} (C)$ . Como en $C$ todo polinomio se divide, tanto $A$ como $A^{T}$ tienen forma canónica de Jordan. Digamos que la forma canónica de Jordan es

$\begin{matrix} (1) & J = (\begin{matrix} J_{λ_{1}, k_{1}} & 0 & 0 & \dots & 0 \\ 0 & J_{λ_{2}, k_{2}} & 0 & \dots & 0 \\ 0 & 0 & J_{λ_{3}, k_{3}} & \dots & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 0 & 0 & \dots & J_{λ_{d}, k_{d}} \end{matrix}) . \end{matrix}$

Si $P$ es la matriz de similitud, tenemos que $A = P^{- 1} J P$ y al transponer obtenemos que:

$A^{T} = P^{T} (\begin{matrix} J_{λ_{1}, k_{1}}^{T} & 0 & 0 & \dots & 0 \\ 0 & J_{λ_{2}, k_{2}}^{T} & 0 & \dots & 0 \\ 0 & 0 & J_{λ_{3}, k_{3}}^{T} & \dots & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 0 & 0 & \dots & J_{λ_{d}, k_{d}}^{T} \end{matrix}) (P^{T})^{- 1} .$

Como por la proposición anterior cada bloque de Jordan es similar a su transpuesta, existen matrices invertibles $Q_{1}, \dots, Q_{d}$ tales $J_{λ_{i}, k_{i}}^{T} = Q_{i}^{- 1} J_{λ_{i}, k_{i}} Q_{i}$ para todo $i \in {1, \dots, d}$ . Pero entonces al definir $Q$ como la matriz de bloques

$Q = (\begin{matrix} Q_{1} & 0 & \dots & 0 \\ 0 & Q_{2} & \dots & 0 \\ 0 & ⋮ & ⋱ & ⋮ \\ 0 & 0 & \dots & Q_{d} \end{matrix}),$

obtenemos la similaridad

$A^{T} = P^{T} Q^{- 1} (\begin{matrix} J_{λ_{1}, k_{1}} & 0 & 0 & \dots & 0 \\ 0 & J_{λ_{2}, k_{2}} & 0 & \dots & 0 \\ 0 & 0 & J_{λ_{3}, k_{3}} & \dots & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 0 & 0 & \dots & J_{λ_{d}, k_{d}} \end{matrix}) Q (P^{T})^{- 1} .$

Así, $A$ y $A^{T}$ tienen la misma forma canónica de Jordan y por lo tanto son matrices similares.

Más adelante…

¡Hemos terminado el curso de Álgebra Lineal II! Por supuesto, hay muchos temas de Álgebra Lineal adicionales que uno podría estudiar.

Un tema conectado con lo que hemos platicado es qué hacer con las matrices cuyo polinomio característico no se divide en el campo con el que estamos trabajando. Por ejemplo si tenemos una matriz $A$ en $M_{n} (R)$ cuyo polinomio característico no se divide, una opción es pensarla como matriz en $M_{n} (C)$ y ahí encontrar su forma canónica de Jordan. ¿Pero si queremos quedarnos en $R$ ? Sí hay resultados que llevan una matriz a algo así como una «forma canónica» en $R$ muy cercana a la forma canónica de Jordan.

Otro posible camino es profundizar en la pregunta de cuándo dos matrices en $M_{n} (F)$ son similares. Si tienen forma canónica de Jordan, ya dimos una buena caracterización en esta entrada. En los ejercicios encontrarás otra. Pero, ¿y si no tienen forma canónica de Jordan? Podríamos extender el campo a otro campo $G$ y comprar las formas canónicas ahí, pero en caso de existir la similaridad, sólo la tendremos en $M_{n} (G)$ . Existe otra manera de expresar a una matriz en forma canónica, que se llama la forma canónica de Frobenius y precisamente está pensada para determinar si dos matrices son similares sin que sea necesario encontrar las raíces del polinomio característico, ni extender el campo.

Estos son sólo dos ejemplos de que la teoría de álgebra lineal es muy extensa. En caso de que estés interesado, hay mucho más por aprender.

Tarea moral

Sea $A$ una matriz en $M_{n} (F)$ y tomemos $P$ en $M_{n} (F)$ la matriz
$P = (\begin{matrix} 0 & 0 & \dots & 0 & 1 \\ 0 & 0 & \dots & 1 & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 1 & \dots & 0 & 0 \\ 1 & 0 & \dots & 0 & 0 \end{matrix}) .$
- Demuestra que si $A$ tiene columnas $C_{1}, \dots, C_{n}$ , entonces $A P$ tiene columnas $C_{n}, \dots, C_{1}$ .
- Demuestra que si $A$ tiene filas $R_{1}, \dots, R_{1}$ , entonces $P A$ tiene filas $R_{n}, \dots, R_{n}$ .
- Concluye con cualquiera de los incisos anteriores que $P$ es invertible y su inversa es ella misma.
- Tomemos explicitamente $n = 2$ y $A = (\begin{matrix} 1 & 2 \\ 3 & 4 \end{matrix})$ . Encuentra explícitamente $P A P$ . ¿Es $A^{T}$ ?
¿Cuál es la máxima cantidad de matrices que se pueden dar en $M_{5} (C)$ de manera que cada una de ellas tenga polinomio característico $x^{2} (x^{2} + 1) (x + 3)$ y tales que no haya dos de ellas que sean similares entre sí.
Sea $A$ una matriz en $M_{n} (R)$ tal que su polinomio característico se divide en $R$ , con forma canónica de Jordan $J$ . Sea $P (X)$ un polinomio en $R [X]$ .
- Demuestra que el polinomio característico de $P (A)$ se divide en $R$ .
- La forma canónica de Jordan de $P (A)$ no necesariamente será $P (J)$ pues puede que el polinomio altere el orden de los eigenvalores pero, ¿cómo se obtiene la forma canónica de $P (A)$ a partir de $J$ ?
Sean $A$ y $B$ matrices en $M_{n} (F)$ cuyo polinomio característico se divide en $F$ . Muestra que $A$ y $B$ son similares si y sólo si para cualquier polinomio $P (X)$ en $F [X]$ se tiene que $rango (P (A)) = rango (P (B))$ .
Investiga sobre la forma canónica de Frobenius y sobre la variante a la forma canónica de Jordan restringida a $R$ .

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Unicidad de la forma canónica de Jordan

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Unicidad de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Deja un comentario

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan y demostramos la existencia de dicha forma bajo ciertas hipótesis. Como corolario, quedó pensar cuál es la versión para matrices. En esta entrada enunciamos la versión para matrices (totalmente equivalente a la de transformaciones lineales) y nos enfocamos en mostrar la unicidad de la forma canónica de Jordan.

Unicidad de la forma canónica de Jordan

El siguiente teorema es totalmente análogo al enunciado en la entrada anterior. Recuerda que $\leq$ es un orden total fijo de $F$ (en $R$ , es el orden usual).

Teorema. Sea $A$ una matriz $M_{n} (F)$ cuyo polinomio característico $χ_{A} (X)$ se divide en $F$ . Entonces, existen únicos valores $λ_{1} \leq \dots \leq λ_{n}$ en $F$ y únicos enteros $k_{1}, \dots, k_{d}$ tales que $\begin{aligned} k_{1} + k_{2} + \dots + k_{d} = n, \\ k_{1} \leq k_{2} \leq \dots \leq k_{d}, \end{aligned}$ para los cuales $A$ es similar a la siguiente matriz de bloques de Jordan:

$(\begin{matrix} J_{λ_{1}, k_{1}} & 0 & \dots & 0 \\ 0 & J_{λ_{2}, k_{2}} & \dots & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 0 & \dots & J_{λ_{d}, k_{d}} \end{matrix}) .$

Usaremos esta versión para demostrar la unicidad, lo cual también implicará la unicidad para la versión de transformaciones lineales.

Mediante la demostración de existencia de la entrada anterior, llegamos a que si el polinomio característico de $A$ es

$χ_{A} (X) = (X - λ_{1})^{m_{1}} (X - λ_{2})^{m_{2}} \dots (X - λ_{r})^{m_{r}},$

entonces $A$ es similar a una matriz conformada por matrices de bloques de Jordan $J_{1}, J_{2}, \dots, J_{r}$ , en donde cada $J_{i}$ es de tamaño $m_{i}$ y de bloques de Jordan de eigenvalor $λ_{i}$ .

Si $A$ fuera similar a otra matriz $K$ de bloques de Jordan, podríamos agrupar por eigenvalores de los bloques $κ_{1} < \dots < κ_{s}$ en matrices de bloques de Jordan tamaños $o_{1}, \dots, o_{s}$ , digamos $K_{1}, \dots, K_{s}$ . El polinomio característico de $K$ sería entonces

$χ_{K} (X) = (X - κ_{1})^{o_{1}} (X - κ_{2})^{o_{2}} \dots (X - κ_{s})^{o_{s}} .$

Pero $K$ es similar a $A$ , y entonces deben tener el mismo polinomio característico, así que conciden en raíces y multiplicidad. Esto demuestra que $r = s$ y como los $λ_{i}$ y los $κ_{i}$ están ordenados, también demuestra las igualdades $λ_{i} = κ_{i}$ y $m_{i} = o_{i}$ para todo $i \in {1, \dots, r} .$

Sólo nos queda argumentar la igualdad entre cada $J_{i}$ y $K_{i}$ para $i \in {1, \dots, r}$ . Pero ambas una forma canónica de Jordan para la transformación nilpotente que se obtiene de restringir $T_{A - λ_{i} I}$ a $\ker (T_{A - λ_{i} I}^{m_{i}})$ . Por la unicidad que demostramos para la forma canónica de Jordan para transformaciones nilpotentes, concluimos que $J_{i} = K_{i}$ . Esto termina la demostración de la unicidad de la forma canónica de Jordan.

Una receta para encontrar la forma canónica de Jordan

Ya con el teorema demostrado, ¿cómo juntamos todas las ideas para encontrar la forma canónica de Jordan de una matriz $A$ en $M_{n} (F)$ cuyo polinomio característico se divida en $F$ ? Podemos proceder como sigue.

Encontramos el polinomio característico $χ_{A} (X)$ y su factorización, digamos $χ_{A} (X) = (X - λ_{1})^{m_{1}} (X - λ_{2})^{m_{2}} \dots (X - λ_{r})^{m_{r}} .$
Nos enfocamos en encontrar las matrices de bloque de Jordan $J_{i}$ para cada eigenvalor $λ_{i}$ . Sabemos que la matriz $J_{i}$ será de tamaño $m_{i}$ .
Para saber exactamente cuál matriz de bloques de Jordan es $J_{i}$ , pensaremos en que tiene $b_{1}, b_{2}, \dots, b_{m_{i}}$ bloques de Jordan de eigenvalor $λ_{i}$ de tamaños $1, 2, \dots, m_{i}$ . Consideramos la matriz $A_{i} = A - λ_{i} I$ . Los $b_{1}, \dots, b_{m_{i}}$ son la solución al siguiente sistema de ecuaciones en las variables $x_{1}, \dots, x_{m_{i}}$ .
$\begin{aligned} m_{i} & = 1 \cdot x_{1} + 2 \cdot x_{2} + 3 \cdot x_{3} + \dots + m_{i} \cdot x_{m_{i}} \\ m_{i} - n + rango (A_{i} - λ_{i} I) & = 0 \cdot x_{1} + 1 \cdot x_{2} + 2 \cdot x_{3} + \dots + (m_{i} - 1) \cdot x_{m_{i}} \\ m_{i} - n + rango ({A_{i} - λ_{i} I}^{2}) & = 0 \cdot x_{1} + 0 \cdot x_{2} + 1 \cdot x_{3} + \dots + (m_{i} - 2) \cdot x_{m_{i}} \\ m_{i} - n + rango ({A_{i} - λ_{i} I}^{3}) & = 0 \cdot x_{1} + 0 \cdot x_{2} + 0 \cdot x_{3} + \dots + (m_{i} - 3) \cdot x_{m_{i}} \\ ⋮ \\ m_{i} - n + rango ({A_{i} - λ_{i} I}^{m_{i} - 1}) & = 0 \cdot x_{1} + 0 \cdot x_{2} + 0 \cdot x_{3} + \dots + 1 \cdot x_{m_{i}} . \end{aligned}$
Juntamos todos los $J_{i}$ en una misma matriz y los ordenamos apropiadamente.

El paso número $3$ está motivado por lo que sabemos de las matrices nilpotentes, y es bueno que pienses por qué se estudia específicamente ese sistema de ecuaciones para cada eigenvalor $λ_{i}$ y multiplicidad $m_{i}$ .

Ejemplo de obtener la forma canónica de Jordan

Veamos un ejemplo del procedimiento descrito en la sección anterior.

Ejemplo. Encontraremos la forma canónica de Jordan de la siguiente matriz: $A = (\begin{matrix} - 226 & - 10 & - 246 & 39 & 246 \\ 234 & 23 & 236 & - 46 & - 236 \\ - 198 & - 20 & - 192 & 41 & 195 \\ - 93 & 10 & - 122 & 10 & 122 \\ - 385 & - 30 & - 393 & 74 & 396 \end{matrix}) .$

Con herramientas computacionales, podemos darnos cuenta de que el polinomio característico de esta matriz es $χ_{A} (X) = X^{5} - 11 X^{4} + 46 X^{3} - 90 X^{2} + 81 X - 27.$

Este polinomio se puede factorizar como $(X - 1)^{2} (X - 3)^{3} .$ Así, la submatriz de bloques de Jordan $J_{1}$ de eigenvalor $1$ tendrá tamaño $2$ y la $J_{3}$ de eigenvalor $3$ tendrá tamaño $3$ . Pero, ¿de qué tamaño son cada uno de los bloques de Jordan en cada una de estas matrices?

Para respondernos esto para $J_{1}$ , notamos que sus bloques son de tamaño $1$ y $2$ solamente. Si hay $b_{1}$ bloques de tamaño $1$ y $b_{2}$ bloques de tamaño $2$ , por la teoría desarrollada arriba tendremos:

$\begin{aligned} b_{1} + 2 b_{2} & = 2 \\ b_{2} & = 2 - 5 + rango (A - I) = 2 - 5 + 4 = 1. \end{aligned}$

El rango de $A - I$ lo obtuvimos computacionalmente, pero recuerda que también puede ser obtenido con reducción gaussiana. Resolviendo el sistema, $b_{2} = 1$ y entonces $b_{1} = 0$ . Concluimos que en $J_{1}$ hay un bloque de Jordan de tamaño $2$ .

Para $J_{3}$ , reciclemos las variables $b_{i}$ (para no introducir nuevas). Los bloques pueden ser de tamaño $1, 2, 3$ . Supongamos que de estos tamaños respectivamente hay $b_{1}, b_{2}, b_{3}$ bloques. Los $b_{i}$ cumplen:

$\begin{aligned} b_{1} + 2 b_{2} + 3 b_{3} & = 3 \\ b_{2} + 2 b_{3} & = 3 - 5 + rango (A - 3 I) = 3 - 5 + 3 = 1 \\ b_{3} & = 3 - 5 + rango ((A - 3 I)^{2}) = 3 - 5 + 2 = 0. \end{aligned}$

Así, $b_{3} = 0$ , y en consecuencia $b_{2} = 1$ y entonces $b_{1} = 1$ . Concluimos que $J_{3}$ tiene un bloque de tamaño $1$ y uno de tamaño $3$ . Por lo tanto, la forma canónica de Jordan de $A$ es:

$(\begin{matrix} J_{1} & 0 \\ 0 & J_{3} \end{matrix}) = (\begin{matrix} J_{1, 2} & 0 & 0 \\ 0 & J_{3, 1} & 0 \\ 0 & 0 & J_{3, 2} \end{matrix}) = (\begin{matrix} 1 & 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 3 & 0 & 0 \\ 0 & 0 & 0 & 3 & 1 \\ 0 & 0 & 0 & 0 & 3 \end{matrix})$

$△$

Otro problema sobre forma canónica de Jordan

La receta anterior funciona en general y da la forma canónica de Jordan. Esto es algo que probablemente en la práctica en aplicaciones no tendrás que hacer manualmente nunca, pues hay herramientas computacionales que te pueden ayudar. Sin embargo, es importante entender con profundidad el teorema y la receta de manera teórica, pues hay problemas conceptuales en los que no podrás usar herramientas computacionales. A continuación veremos un ejemplo.

Problema. Sea $A$ una matriz en $M_{6} (R)$ con polinomio característico $χ_{A} (X) = X^{6} - 2 X^{4} + X^{2} .$

¿Cuántas posibilidades hay para la forma canónica de Jordan de $A$ ?
Demuestra que si el rango de $A$ es $5$ , entonces $A$ no es diagonalizable.

Solución. Podemos factorizar el polinomio característico de $A$ como sigue:

$χ_{A} (X) = X^{2} (X + 1)^{2} (X - 1)^{2} .$

Así, la forma canónica de Jordan está conformada por una matriz de bloques de Jordan $J_{0}$ de eigenvalor $0$ y tamaño $2$ ; una $J_{1}$ de eigenvalor $1$ y tamaño $2$ ; y una $J_{- 1}$ de eigenvalor $- 1$ y tamaño $2$ .

Cada $J_{i}$ tiene dos chances: o es un bloque de Jordan de tamaño $2$ , o son dos bloques de Jordan de tamaño $1$ . Así, en total tenemos $2 \cdot 2 \cdot 2 = 8$ posibilidades.

Si $A$ es de rango $5$ , entonces tendríamos en las cuentas de cantidad de bloques $b_{1}$ y $b_{2}$ para eigenvalor $0$ que

$\begin{aligned} b_{1} + 2 b_{2} & = 2 \\ b_{2} & = 2 - 6 + rango (A) = 2 - 6 + 5 = 1, \end{aligned}$

de donde en $J_{0}$ tendría $1$ bloque de tamaño $2$ y ninguno de tamaño $1$ . Si $A$ fuera diagonalizable, su diagonalización sería una forma canónica de Jordan donde para eigenvalor $0$ se tendrían $2$ bloques de tamaño $1$ y ninguno de tamaño $2$ . Así, $A$ tendría dos formas canónicas de Jordan distintas, lo cual es imposible.

Más adelante…

Con esta entrada terminamos de demostrar el teorema de la forma canónica de Jordan, uno de los teoremas más bonitos de álgebra lineal. ¿Te das cuenta de todo lo que utilizamos en su demostración? Forma matricial de transformaciones lineales, el teorema de Cayley-Hamilton, polinomio característico, subespacios estables, teoría de dualidad, sistemas de ecuaciones lineales, resultados auxiliares de polinomios, etc. Es un resultado verdaderamente integrador.

En la siguiente entrada, la última del curso, hablaremos de algunas de las consecuencias del teorema de la forma canónica de Jordan. Discutiremos cómo lo podemos utilizar para clasificar a las matrices por similaridad. Veremos una aplicación con respecto a una matriz y su transpuesta. También, esbozaremos un poco de por qué en cierto sentido el resultado no sólo vale para las matrices cuyo polinomio se divide sobre el campo, sino que para cualquier matriz. Con ello terminaremos el curso.

Tarea moral

Calcula la forma canónica de Jordan $J$ de la matriz $A = (\begin{matrix} 1 & 0 & - 3 \\ 1 & - 1 & - 6 \\ - 1 & 2 & 5 \end{matrix}) .$ Además de encontrar $J$ , encuentra de manera explícita una matriz invertible $P$ tal que $A = P^{- 1} J P$ .
Calcula la forma canónica de Jordan de la matriz $(\begin{matrix} 1 & 1 & 0 & 0 \\ 0 & 1 & 2 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 2 \end{matrix})$
Explica y demuestra cómo obtener lo siguiente para una matriz de bloques de Jordan:
- Su polinomio característico.
- Su polinomio mínimo.
- Su determinante.
- Su traza.
- Sus eigenespacios.
Justifica con más detalle por qué la receta que se propone para calcular la forma canónica de Jordan en efecto funciona. Necesitarás varios de los argumentos que dimos en la entrada anterior.
Demuestra que una matriz $A \in M_{n} (F)$ para la cual su polinomio característico se divide en $F$ es diagonalizable si y sólo si cada bloque de cada matriz de bloques de la forma canónica de Jordan tiene tamaño $1$ .

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Existencia de la forma canónica de Jordan
Siguiente entrada del curso: Aplicaciones de la forma canónica de Jordan

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Existencia de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Deja un comentario

Introducción

En las entradas anteriores demostramos que para cualquier matriz nilpotente existe (y es única) una matriz similar muy sencilla, hecha por lo que llamamos bloques de Jordan de eigenvalor cero. Lo que haremos ahora es mostrar una versión análoga de este resultado para una familia mucho más grande de matrices. De hecho, en cierto sentido tendremos un resultado análogo para todas las matrices.

Pensando en ello, lo que haremos en esta entrada es lo siguiente. Primero, generalizaremos nuestra noción de bloques de Jordan para contemplar cualquier eigenvalor. Estudiaremos un poco de los bloques de Jordan. Luego, enunciaremos el teorema que esperamos probar. Finalmente, daremos el primer paso hacia su demostración. En la siguiente entrada terminaremos la demostración y hablaremos de aspectos prácticos para encontrar formas canónicas de Jordan.

Enunciado del teorema de la forma canónica de Jordan

A continuación definimos a los bloques de Jordan para cualquier eigenvalor y tamaño.

Definición. Sea $F$ un campo. El bloque de Jordan de eigenvalor $λ$ y tamaño $k$ es la matriz $J_{λ, k}$ en $M_{k} (F)$ cuyas entradas son todas $λ$ , a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, $J_{λ, k} = [a_{i j}]$ con $a_{i j} = {\begin{cases} 1 & si j = i + 1 \\ λ & si i = j \\ 0 & en otro caso. \end{cases}$

También podemos expresarlo de la siguiente manera:

$J_{λ, k} = (\begin{matrix} λ & 1 & 0 & \dots & 0 & 0 \\ 0 & λ & 1 & \dots & 0 & 0 \\ 0 & 0 & λ & \dots & 0 & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 0 & 0 & \dots & λ & 1 \\ 0 & 0 & 0 & \dots & 0 & λ \end{matrix}),$ en donde estamos pensando que la matriz es de $k \times k$ .

Una última manera en la que nos convendrá pensar a $J_{λ, k}$ es en términos de los bloques de Jordan de eigenvalor cero: $J_{λ, k} = λ I_{k} + J_{0, k}$ .

Definición. Una matriz de bloques de Jordan en $M_{n} (F)$ es una matriz diagonal por bloques en la que cada bloque en la diagonal es un bloque de Jordan.

Lo que nos gustaría demostrar es el siguiente resultado. En él, piensa en $\leq$ como algún orden total fijo de $F$ (para $R$ es el orden usual, pero otros campos no necesariamente tienen un orden natural asociado).

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ sobre el campo $F$ y $T : V \to V$ una transformación lineal tal que $χ_{T} (X)$ se divide sobre $F$ . Entonces, existen únicos valores $λ_{1} \leq \dots \leq λ_{n}$ en $F$ y únicos enteros $k_{1}, \dots, k_{d}$ tales que $\begin{aligned} k_{1} + k_{2} + \dots + k_{d} = n, \\ k_{1} \leq k_{2} \leq \dots \leq k_{d}, \end{aligned}$ para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques de Jordan:

$(\begin{matrix} J_{λ_{1}, k_{1}} & 0 & \dots & 0 \\ 0 & J_{λ_{2}, k_{2}} & \dots & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 0 & \dots & J_{λ_{d}, k_{d}} \end{matrix}) .$

Por supuesto, este teorema también tiene una versión matricial, la cuál tendrás que pensar cómo escribir.

Un teorema de descomposición de kernels

Ya tenemos uno de los ingredientes que necesitamos para dar la demostración de la existencia de la forma canónica de Jordan: su existencia para las transformaciones nilpotentes. Otro de los ingredientes que usaremos es el teorema de Cayley-Hamilton. El tercer ingrediente es un resultado de descoposición de kernels de transformaciones evaluadas en polinomios.

Proposición. Sea $V$ un espacio vectorial sobre $F$ . Sea $T : V \to V$ una transformación lineal. Y sean $P_{1} (X), \dots, P_{r} (X)$ polinomios en $F [x]$ cuyo máximo común divisor de cualesquiera dos de ellos es el polinomio $1$ . Entonces, $\ker ((P_{1} P_{2} \dots P_{r}) (T)) = ⨁_{i = 1}^{r} \ker (P_{i} (T)) .$

Demostración. Para cada $i \in {1, 2, \dots, r}$ consideraremos a $Q_{i} (X)$ como el polinomio que se obtiene de multiplicar a todos los polinomios dados, excepto $P_{i} (X)$ . Y por comodidad, escribiremos $P (X) = (P_{1} \dots P_{r}) (X)$ . Notemos que entonces $P (X) = (Q_{i} P_{i}) (X)$ para cualquier $i \in {1, 2, \dots, r}$ .

Primero probaremos un resultado polinomial auxiliar. Veremos que $Q_{1} (X), \dots, Q_{r} (X)$ tienen como máximo común divisor al polinomio $1$ . En caso de no ser así, un polinomio $D (X)$ no constante dividiría a todos ellos. Sin pérdida de generalidad, $D$ es irreducible (tomando, por ejemplo $D (X)$ de grado mínimo con esta propiedad). Como $D (X)$ es irreducible y divide a $Q_{r} (X)$ , entonces debe dividir a alguno de los factores de $Q_{r} (X)$ , que sin pérdida de generalidad (por ejemplo, reetiquetando), es $P_{1} (X)$ . Pero $D (X)$ también divide a $Q_{1} (X)$ , así que debe dividir a alguno de sus factores $P_{2} (X), \dots, P_{r} (X)$ , sin pérdida de generalidad a $P_{2} (X)$ . Pero entonces $D (X)$ divide a $P_{1} (X)$ y $P_{2} (X)$ , lo cual contradice las hipótesis. Así, $Q_{1} (X), \dots, Q_{r} (X)$ tienen como máximo común divisor al polinomio $1$ . Por el lema de Bézout para polinomios (ver tarea moral), existen entonces polinomios $R_{1} (X), \dots, R_{r} (X)$ tales que

$\begin{matrix} (2) & (R_{1} Q_{1} + R_{2} Q_{2} + \dots + R_{r} Q_{r}) (X) = 1. \end{matrix}$

Estamos listos para pasar a los argumentos de álgebra lineal. Veamos primero que cualquier elemento en la suma de la derecha está en el kernel de $P (T)$ . Tomemos $v = v_{1} + \dots + v_{r}$ con $v_{i} \in \ker (P_{i} (T))$ . Al aplicar $P$ obtenemos

$\begin{aligned} P (v) & = P (v_{1}) + \dots + P (v_{r}) \\ = Q_{1} (P_{1} (v_{1})) + \dots + Q_{r} (P_{r} (v_{r})) \\ = 0 + \dots + 0 = 0. \end{aligned}$

Esto muestra que $v \in \ker (P (T))$ , de donde se obtiene la primera contención que nos interesa.

Veamos ahora la segunda contención, que $\ker (P (T)) = ⨁_{i = 1}^{r} \ker (P_{i} (T))$ . Tomemos $v \in \ker (P (T))$ . Al aplicar $(2)$ en $T$ y evaluar en $v$ obtenemos que

$\begin{aligned} v & = Id (v) = (1) (T) (v) \\ = (R_{1} Q_{1} + R_{2} Q_{2} + \dots + R_{r} Q_{r}) (T) (v) \\ = (R_{1} Q_{1}) (T) (v) + \dots + (R_{r} Q_{r}) (T) (v) . \end{aligned}$

Pero esto justo expresa a $v$ como elemento de $\ker (P_{i} (T))$ pues para cada $i$ tenemos

$\begin{aligned} P_{i} (T) ((R_{i} Q_{i}) (T) (v)) & = (P_{i} R_{i} Q_{i}) (T) (v) \\ = (R_{i} Q_{i} P_{i}) (T) (v) \\ = R_{i} (T) P (T) (v) \\ = R_{i} (0) = 0, \end{aligned}$

de modo que expresamos a $v$ como suma de vectores en $\ker (P_{1} (T)), \dots, \ker (P_{r} (T))$ .

Ya demostramos la igualdad de conjuntos, pero recordemos que en la igualdad de suma directa hay otra cosa que hay que probar: que el cero tiene una forma única de expresarse como suma de elementos de cada subespacio (aquella en donde cada elemento es cero). Supongamos entonces que $0 = v_{1} + \dots + v_{r}$ con $v_{i} \in \ker (P_{i} (T))$ para cada $i$ . Si aplicamos $Q_{i}$ en esta igualdad, como tiene todos los factores $P_{j}$ con $j \neq i$ obtenemos $0 = Q_{i} (0) = Q_{i} (v_{i}) .$

Por otro lado, al aplicar nuevamente $(2)$ en $T$ y evaluar en $v_{i}$

$\begin{aligned} v_{i} & = Id (v_{i}) = (1) (T) (v_{i}) \\ = (R_{1} Q_{1} + R_{2} Q_{2} + \dots + R_{r} Q_{r}) (T) (v_{i}) \\ = (R_{1} Q_{1}) (T) (v_{1}) + \dots + (R_{r} Q_{r}) (T) (v_{i}) \\ = (R_{i} Q_{i}) (T) (v_{i}) \\ = 0. \end{aligned}$

De esta forma, en efecto tenemos que los espacios están en posición de suma directa, que era lo último que nos faltaba verificar.

Existencia de la forma canónica de Jordan

Estamos listos para demostrar la existencia de la forma canónica de Jordan. Supongamos que $V$ es un espacio vectorial de dimensión finita $n$ sobre $F$ y que $T : V \to V$ es una transformación lineal cuyo polinomio característico se divide en $F [x]$ . Sabemos entonces que es de la siguiente forma:

$χ_{T} (X) = (X - λ_{1})^{m_{1}} (X - λ_{2})^{m_{2}} \dots (X - λ_{r})^{m_{r}},$

donde $λ_{1}, \dots, λ_{r}$ son eigenvalores distintos de $T$ y $m_{1}, \dots, m_{r}$ son las multiplicidades algebraicas respectivas de estos eigenvalores como raíces de $χ_{T} (X)$ .

Por el teorema de Cayley-Hamilton, sabemos que $χ_{T} (T) = 0$ , de modo que $\ker (χ_{T} (T)) = V$ . Por la proposición de descomposición de la sección anterior aplicada a los polinomios $P_{i} (X) = (X - λ_{i})^{m_{i}}$ (verifica que son primos relativos dos a dos) para $i \in {1, \dots, r}$ tenemos entonces que $V = ⨁_{i = 1}^{r} \ker ((T - λ_{i} id)^{m_{i}}) .$

Pero, ¿cómo es la transformación $T - λ_{i} id$ restringida a cada $\ker ((T - λ_{i} id)^{m_{i}})$ ? ¡Es nilpotente! Precisamente por construcción, $(T - λ_{i} id)^{m_{i}}$ se anula totalmente en este kernel. Así, por la existencia de la forma canónica de Jordan para matrices nilpotentes, hay una base $β_{i}$ para cada $\ker ((T - λ_{i} id)^{m_{i}})$ tal que $T - λ_{i} id$ restringida a ese kernel tiene como forma matricial una matriz $J_{i}$ de bloques de Jordan de eigenvalor cero. Pero entonces $T$ (restringida a dicho kernel) tiene como forma matricial a $J_{i} + λ_{i} I_{m_{i}}$ , que es una matriz de bloques de Jordan de eigenvalor $λ$ .

Con esto terminamos: como $V$ es la suma directa de todos esos kernel, la unión de bases $β_{1}, \dots, β_{r}$ es una base para la cual $T$ tiene como forma matricial a una matriz de bloques de Jordan.

Más adelante…

Hemos demostrado la existencia de la forma canónica de Jordan, pero aún nos falta demostrar su unicidad. Además de esto, también necesitaremos un mejor procedimiento para encontrarla. Haremos eso en la siguiente entrada.

Tarea moral

Enuncia el teorema de la forma canónica de Jordan versión matrices.
Investiga más sobre el lema de Bézout para polinomios y cómo se demuestra. Después de esto, expresa al polinomio $1$ como combinación lineal de los polinomios $x^{2} - 1, x^{3} + 1, x^{2} + 5 x + 4$ .
Verifica que los polinomios $P_{i} (X) = (X - λ_{i})^{k_{i}}$ de la demostración de la existencia de la forma canónica de Jordan cumplen las hipótesis de la proposición de descomposición de kernels.
Sea $F$ un campo y $r, s$ elementos en $F$ . Sea $n$ un entero. Demuestra que los bloques de Jordan $J_{r, n}$ y $J_{s, n}$ en $M_{n} (F)$ conmutan.
Siguiendo las ideas de la demostración de existencia, encuentra la forma canónica de Jordan de la matriz $(\begin{matrix} 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & 2 & 2 \\ 0 & 0 & 0 & 2 \end{matrix}) .$

Entradas relacionadas

Ir a Álgebra Lineal II
Entrada anterior del curso: Unicidad de la forma canónica de Jordan para nilpotentes
Siguiente entrada del curso: Unicidad de la forma canónica de Jordan

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Variable Compleja I: Funciones complejas como transformaciones. Técnicas de graficación

Por Pedro Rivera Herrera

Deja un comentario

Introducción

Sabemos que la gráfica de una función de $R^{2}$ a $R^{2}$ es un subconjunto de $R^{4}$ , por lo que si quisiéramos visualizar la gráfica de una función compleja de variable compleja, como hacíamos usualmente con funciones cuyas gráficas tenían lugar en $R^{2}$ o en $R^{3}$ , nos será imposible.

Al trabajar en Cálculo con integrales dobles era de nuestro interés saber cómo se transformaban ciertas regiones $A \subset R^{2}$ del plano, bajo ciertas transformaciones $T : R^{2} \to R^{2}$ para poder entender de manera geométrica lo que sucedía al aplicar un cambio de variable con nuestras regiones de integración.

Una primera alternativa para poder estudiar la geometría de las funciones complejas, es analizar su comportamiento gráfico siguiendo esta idea de las transformaciones entre planos. Por lo que, resultará conveniente considerar a las funciones complejas como transformaciones del plano complejo, es decir, para darnos una idea de lo que hacen estas funciones las veremos como mapeos o transformaciones de un subconjunto de $C$ en un plano $z$ , que toman valores en un plano $w$ . Si escribimos a $z = x + i y \in C$ y a $w = u + i v \in C$ , tendremos al plano $z$ asociado con los ejes $x$ y $y$ , mientras que para el plano $w$ se tienen los ejes $u$ y $v$ , los cuales, en ambos casos, corresponden con los ejes real e imaginario, respectivamente.

Observación 26.1.
Debemos tener presente que esta alternativa no es la única forma para dar una interpretación del comportamiento geométrico de una función compleja, ya que también puede representarse a las funciones complejas mediante:

las gráficas de su parte real e imaginaria,
las gráficas del módulo complejo de la función,
superficies de Riemann.

Se puede consultar un poco sobre estás técnicas en las siguientes ligas:

Sin embargo, para los fines del curso bastará con esta alternativa de pensar a las funciones como transformaciones del plano en el plano.

Para plantear lo anterior consideremos la siguiente:

Definición 26.1.
Sea $S \subset C$ , se define a la imagen de $S$ bajo una función $f$ , denotada por $f (S)$ , como el conjunto:
$f (S) = {w \in C : w = f (z), z \in S} .$

Analicemos los siguientes ejemplos para comprender mejor esta idea de las transformaciones complejas.

Ejemplo 26.1.
Sea $S$ el disco unitario, es decir $S = \overset{―}{B} (0, 1)$ . Determinemos la imagen de $S$ bajo la transformación $f (z) = z + 2 + i$ .

Solución. Notemos que para cada $z \in S$ el valor de $w = f (z)$ está dado por la suma de $2 + i$ al valor de $z$ . Considerando a $z = x + i y$ , tenemos que:
$w = f (z) = (x + 2) + i (y + 1),$
por lo que la función $f$ transforma los puntos $(x, y)$ en los puntos $(u, v)$ , donde $u = x + 2$ y $v = y + 1$ . Es claro que $f$ simplemente traslada a cada elemento del disco unitario $S$ dos unidades a la derecha y una unidad hacia arriba, figura 98, es decir:
$\begin{aligned} f (S) & = {w \in C : | w - (2 + i) | \leq 1} \\ = \overset{―}{B} (2 + i, 1) . \end{aligned}$

Figura 98: Gráfica del conjunto $S$ en el plano $z$ y del conjunto $f (S)$ en el plano $w$ .

Esta transformación de la forma $f (z) = z + b$ , con $b \in C$ constante, nos determina una traslación. Consideremos ahora transformaciones de la forma $f (z) = a z$ , con $a \in C ∖ {0}$ . Veamos que dichas transformaciones nos determinan rotaciones y homotecias en el plano complejo.

Observación 26.2.
Recordemos que al multiplicar a los números complejos $a = ρ cis (α) \neq 0$ y $z = r cis (θ)$ tenemos:
$a z = r ρ cis (α + θ) = r ρ e^{i (α + θ)},$ de donde es claro que la transformación $f (z) = a z$ nos devuelve una homotecia desde que al módulo de $z$ se le multiplica por una constante $ρ > 0$ . Por otra parte, notemos que tenemos una rotación del número complejo $z$ desde que a su argumento $θ$ se le suma el argumento $α$ . Además, dado que el producto de números complejos es conmutativo, es claro que la homotecia y rotación que se le aplica a cada número complejo $z$ se puede realizar en cualquier orden. Notemos que tenemos los siguientes casos:

Si $a = ρ > 0$ , entonces tenemos que la transformación $f (z) = a z$ es simplemente una homotecia por un factor $a$ .
Si $ρ = 1$ , entonces tenemos que la transformación $f (z) = a z = e^{i α} z$ es simplemente una rotación por un ángulo $α$ .
Si $ρ > 0$ , entonces tenemos que la transformación $f (z) = a z = ρ e^{i α} z$ es una homotecia por un factor $ρ$ seguida de una rotación por un ángulo $α$ .

Ejemplo 26.2.
Sea $S$ el cuadrado cerrado con centro en el punto $z = 2$ , cuyos lados son paralelos a los ejes real e imaginario y tienen una longitud $2$ , figura 99.

a) ¿Cuál es la imagen de $S$ bajo la transformación $f (z) = 3 z$ ?
b) ¿Cuál es la imagen de $S$ bajo la transformación $f (z) = 2 i z$ ?

Figura 99: Gráfica del conjunto $S$ en el plano $z$ .Gráfica del conjunto $S$ en el plano $z$ .

Solución.

a) De acuerdo con la observación 26.2 tenemos que $a = 3 > 0$ es una constante, por lo que la transformación $f (z) = 3 z$ corresponde con una homotecia, ya que bajo $f$ la distancia de cada número complejo $w = f (z)$ , medida desde el origen, será tres veces la distancia de cada $z \in S$ , medida desde el origen, es decir, el módulo de cada número complejo $z \in S$ será triplicado, mientras que su argumento permanecerá sin cambios. Entonces la imagen de $S$ bajo la transformación $f$ , es decir, $f (S)$ será otro cuadrado cuyos vértices corresponden con las imágenes de los vértices del cuadrado $S$ , figura 100.

Entonces $f (S)$ en el plano $w$ es el cuadrado cerrado con centro en el punto $w = 6$ cuyos lados son paralelos a los ejes real e imaginario y tienen longitud 6.

Figura 100: Gráfica del conjunto $S$ en el plano $z$ y del conjunto $f (S)$ en el plano $w$ .

b) Considerando la observación 26.2, tenemos que $a = 2 i$ es un número complejo cuyo módulo es $r = 2$ y su argumento principal es $α = \frac{π}{2}$ , por lo que la transformación $f (z) = 2 i z$ corresponde con una homotecia por un factor $r = 2$ seguida de una rotación por un ángulo $α = \frac{π}{2}$ , en sentido contrario a las manecillas del reloj. Entonces, bajo $f$ a cada punto $z \in S$ se le duplicará su módulo y se le sumará $\frac{π}{2}$ a su argumento, entonces $f (S)$ será nuevamente un cuadrado cerrado para el cual la distancia del origen a cada $w = f (z)$ será dos veces la distancia del origen a cada $z \in S$ y sus vértices serán las imágenes de los vértices del cuadrado $S$ bajo $f$ , figura 101.

Tenemos que el centro del cuadrado $S$ es $z = 2$ , mientras que sus vértices son $A = 1 + i$ , $B = 3 + i$ , $C = 1 - i$ y $D = 3 - i$ , por lo que el centro y los vértices del nuevo cuadrado cerrado son:
$\begin{array}{r} f (2) = 2 (2) cis (\frac{π}{2} + 0) = 4 i, \\ f (A) = 2 \sqrt{2} cis (\frac{π}{2} + \frac{π}{4}) = - 2 + 2 i, \\ f (B) = 2 \sqrt{10} cis (\frac{π}{2} + arc \tan (\frac{1}{3})) = - 2 + 6 i, \\ f (C) = 2 \sqrt{2} cis (\frac{π}{2} - \frac{π}{4}) = 2 + 2 i, \\ f (D) = 2 \sqrt{10} cis (\frac{π}{2} + arc \tan (\frac{- 1}{3})) = 2 + 6 i . \end{array}$

Entonces $f (S)$ en el plano $w$ es el cuadrado cerrado con centro en el punto $w = 4 i$ cuyos lados son paralelos a los ejes real e imaginario y tienen longitud 4.

Figura 101: Gráfica del conjunto $S$ en el plano $z$ y del conjunto $f (S)$ en el plano $w$ .

Es posible visualizar las transformaciones de los ejemplos 26.1 y 26.2 en el siguiente applet de GeoGebra https://www.geogebra.org/m/pasmamyw.

Observación 26.3.
En conjunto, los ejemplos 26.1 y 26.2 corresponden con transformaciones del tipo $f (z) = a z + b$ , donde $a, b \in C$ son dos constantes, y $a \neq 0$ para no trabajar con transformaciones constantes, es decir, transformaciones afines lineales, definición 25.1.

Más aún, de acuerdo con dichos ejemplos, debe ser claro que las transformaciones afines lineales mapean regiones del plano a regiones geométricamente similares. En el caso en que $a = 1$ y $b = 0$ , entonces tenemos a la transformación identidad $I_{C} (z) = z$ .

Una pregunta interesante es ¿qué sucede con las transformaciones que no son lineales?, es decir ¿en qué se transforman los subconjuntos de $C$ bajo una transformación no lineal? Para responder a esta pregunta analicemos los siguientes ejemplos.

Ejemplo 26.3.
Determinemos la imagen de los siguientes conjuntos bajo la transformación inversión, $f (z) = \frac{1}{z}$ , con $z \neq 0$ , $w = f (z) \neq 0$ .

a) $S = {z \in C : 0 < | z | < 1, 0 \leq \arg z \leq \frac{π}{2}} .$
b) $S = {z \in C : 2 \leq | z |, 0 \leq \arg z \leq π} .$

Solución. De acuerdo con el corolario 4.1 (fórmula de De Moivre), para $z = r cis (θ) \neq 0$ , con $r = | z |$ y $θ = \arg z$ , tenemos que:
$f (z) = \frac{1}{z} = r^{- 1} cis (θ) = \frac{1}{r} [\cos (- θ) + i sen (- θ)] .$

Entonces, para cada $z \neq 0$ , se tiene que el módulo de $f (z)$ es el recíproco del módulo de $z$ , mientras que el argumento de $f (z)$ será el negativo del argumento de $z$ .

a) Notemos que si $z \in S$ , entonces $z$ cae en el primer cuadrante dentro de la circunferencia unitaria, incluyendo a los ejes real e imaginario, pero sin considerar a $z = 0$ , figura 102, ya que:

Si $0 < | z | < 1$ , entonces $z$ cae dentro del disco unitario perforado, es decir $z \in B^{*} (0, 1)$ .
Si $0 \leq θ \leq \frac{π}{2}$ , entonces tenemos a los $z$ en el primer cuadrante.

Por lo que bajo $f$ , los $z \in S$ serán mapeados, en el plano $w$ , fuera del disco unitario y en el cuarto cuadrante, incluyendo a los ejes real e imaginario, pero a partir de los $w$ tales que $| w | > 1$ , ya que $| f (z) | = \frac{1}{| z |} > 1$ y $- \frac{π}{2} \leq - θ \leq 0$ . Entonces:
$f (S) = {w \in C : 1 < | w |, - \frac{π}{2} \leq \arg w \leq 0} .$

b) Notemos que si $z \in S$ , entonces $z$ cae en el primer y segundo cuadrante fuera del disco de radio 2 con centro en el origen, incluyendo a la circunferencia de radio $2$ y a los ejes real e imaginario, figura 103, ya que:

Si $| z | \geq 2$ , entonces $z$ cae sobre la circunferencia de radio $2$ y fuera de la misma.
Si $0 \leq θ \leq π$ , entonces tenemos a los $z$ en el primer y segundo cuadrante.

Como el módulo de $z$ crece de $2$ a infinito, entonces bajo $f$ el módulo de $w = f (z)$ decrece de $\frac{1}{2}$ a $0$ , pero sin llegar a valer $0$ , ya que $| f (z) | = \frac{1}{| z |} \leq \frac{1}{2}$ y $| f (z) | > 0$ para $z \neq 0$ . Por otra parte, como $- π \leq - θ \leq 0$ , entonces bajo $f$ los $z$ serán mapeados, en el plano w, en el tercer y cuarto cuadrante en el disco cerrado con centro en el origen y radio $\frac{1}{2}$ , por lo que:
$f (S) = {w \in C : 0 < | w | \leq \frac{1}{2}, - π \leq \arg w \leq 0} .$

Figura 102: Gráfica del conjunto $S$ en el plano $z$ y del conjunto $f (S)$ en el plano $w$ .

Figura 103: Gráfica del conjunto $S$ en el plano $z$ y del conjunto $f (S)$ en el plano $w$ .

Ejemplo 26.4.
Sean $a, b \in R$ tales que $0 < a < b$ . Veamos cuál es la imagen de los siguientes conjuntos bajo la transformación inversión, $T (z) = \frac{1}{z}$ .
a) La recta vertical $x = x_{0} > 0$ en el plano $z$ , es decir $S = {z = x + i y \in C : x = x_{0} > 0, y \in R}$ .
b) La franja vertical $S = {z = x + i y \in C : a \leq x \leq b, y \in R}$ , en el plano $z$ .
\end{itemize}

Solución.

a) De acuerdo con la observación 25.8 como la recta vertical $x = x_{0} > 0$ no pasa por el origen, entonces la imagen de $S$ bajo $T$ será una circunferencia que pase por el origen en el plano $w$ .

Sea $z = x + i y \in S$ , entonces tenemos $x = x_{0} > 0$ y $y \in R$ . La imagen de $z$ bajo $T$ esta dada por:
$w = u + i v = \frac{1}{z} .$

De acuerdo con (25.7), proposición 25.6, tenemos que:
$u = \frac{x_{0}}{x_{0}^{2} + y^{2}}, v = - \frac{y}{x_{0}^{2} + y^{2}},$ de donde:
$u^{2} + v^{2} = \frac{x_{0}^{2} + y^{2}}{{(x_{0}^{2} + y^{2})}^{2}} = \frac{1}{x_{0}^{2} + y^{2}} = \frac{u}{x_{0}},$ por lo que:
$\begin{aligned} u^{2} - \frac{u}{x_{0}} + v^{2} = 0, \\ ⟺ u^{2} - \frac{u}{x_{0}} + {(- \frac{1}{2 x_{0}})}^{2} + v^{2} = {(- \frac{1}{2 x_{0}})}^{2}, \\ (26.1) & ⟺ {(u - \frac{1}{2 x_{0}})}^{2} + v^{2} = {(\frac{1}{2 x_{0}})}^{2}, \end{aligned}$ la cual corresponde con la ecuación de una circunferencia con centro en el punto $w_{0} = \frac{1}{2 x_{0}} + i 0$ y radio $r = \frac{1}{2 x_{0}}$ , en el plano $w$ . Además, notemos que mientras el punto $z = 0$ no cae en la recta $S$ , el punto $w = 0$ sí pertenece a $T (S)$ .

b) Considerando el inciso anterior y la observación 25.8, si $0 < a < x_{0} < b$ , entonces la recta vertical $x = x_{0}$ recorre la franja vertical $S$ en el plano $z$ , por lo que la imagen de cada recta vertical $x = x_{0}$ bajo la transformación inversión corresponderá con una circunferencia dada por (26.1), en el plano $w$ . De acuerdo con la figura 104 tenemos que $T (S)$ es la región anular acotada por fuera por la circunferencia centrada en $(\frac{1}{2 a}, 0)$ de radio $\frac{1}{2 a}$ y por dentro por la circunferencia centrada en $(\frac{1}{2 b}, 0)$ de radio $\frac{1}{2 b}$ .

Figura 104: Gráfica de la franja vertical $S$ bajo la transformación inversión.

Ejemplo 26.5.
Determinemos la imagen de la recta vertical $x = k$ , donde $k \in C$ es una constante, bajo la transformación $f (z) = z^{2}$ .

Solución. Sean $z = x + i y \in C$ y $w = u + i v = f (z)$ , entonces:
$u (x, y) = x^{2} - y^{2}, v (x, y) = 2 x y .$

Dado que $x = k$ , entonces los puntos sobre dicha recta vertical son de la forma:
$z = k + i y, y \in R,$ por lo que, la imagen de dicha recta, bajo $f$ , es:
$\begin{matrix} (26.2) & u = k^{2} - y^{2}, v = 2 k y, y \in R . \end{matrix}$

Si $k = 0$ , entonces la imagen de la recta vertical $x = 0$ , correspondiente con el eje imaginario, está dada por:
$u = - y^{2}, v = 0, y \in R .$

Es decir, la imagen del eje imaginario, bajo la función $f (z) = z^{2}$ , corresponde con el semieje real negativo.

Por otra parte, si $k \neq 0$ , entonces de (26.2) tenemos que:
$y = \frac{v}{2 k} ⟹ u = k^{2} - \frac{v^{2}}{4 k^{2}}, ⟹ v^{2} = - 4 k^{2} (u - k^{2}), v \in R .$

Por lo que, para $k \neq 0$ , la imagen de la recta $x = k$ corresponde con la familia de parábolas con eje paralelo al eje real $u$ , con vértice en el punto $(k^{2}, 0)$ , las cuales abren hacia la izquierda y cuya intersección con el eje imaginario $v$ son los puntos $(0, \pm 2 k^{2})$ . Dado que la imagen de las rectas $x = k$ y $x = - k$ es la misma, entonces ambas rectas, bajo $f$ , son mapeadas en la parábola $v^{2} = - 4 k^{2} (u - k^{2})$ .

Podemos visualizar lo anterior en el siguiente applet de GeoGebra https://www.geogebra.org/m/y75hxksq.

Observación 26.4.
De manera general, se puede hacer un análisis para la transformación $f (z) = z^{n}$ , con $n > 2$ . Si consideramos a $z \neq 0$ tal que $z = r e^{i θ}$ y $w = ρ e^{i ϕ}$ , entonces:
$w = f (z) ρ e^{i ϕ} = r^{n} e^{i n θ} .$

No es difícil verificar que dicha transformación mapea la región:
${z = r e^{i θ} \in C ∖ {0} : r \geq 0, 0 \leq θ \leq \frac{π}{n}},$ en el semiplano superior del plano $w$ .

Ejemplo 26.6.
Consideremos a la región rectangular:
$S = {z = x + i y \in C : - 1 \leq x \leq 1, 0 \leq y \leq π}$ y determinemos su imagen bajo la transformación $f (z) = e^{z}$ .

Solución. Fijemos a $x_{0} \in [- 1, 1]$ y consideremos al segmento de la recta vertical $x = x_{0}$ que está completamente contenido en $S$ . Los puntos de dicho segmento son de la forma $z = x_{0} + i y$ , con $0 \leq y \leq π$ . Para dichos puntos, por la proposición 20.2, tenemos que:
$w = f (z) = e^{x_{0} + i y} = e^{x_{0}} e^{i y} = e^{x_{0}} [\cos (y) + i sen (y)], 0 \leq y \leq π,$ de donde se sigue que los puntos $w = e^{x_{0}} cis (y)$ tienen módulo $e^{x_{0}}$ y argumento principal $y$ .

Notemos que los puntos $w = f (z)$ están sobre la circunferencia de radio $e^{x_{0}}$ y centro en el origen. Más aún, como $y \in [0, π]$ , entonces dichos puntos trazan la semicircunferencia ubicada en el semiplano superior del plano $w$ .

Dado que $x_{0} \in [- 1, 1]$ , entonces $e^{- 1} < e^{1}$ , por lo que, los segmentos de las rectas verticales $x = x_{0}$ , contenidos en $S$ , corresponden con circunferencias de radio creciente y en conjunto forman la región anular delimitada por las semicircunferencias de radio $e^{- 1}$ y $e^{1}$ , respectivamente, amabas centradas en el origen.

De manera análoga, podemos verificar que bajo la transformación $f (z) = e^{z}$ , la región rectangular:
${z = x + i y \in C : - 1 \leq x \leq 1, - π \leq y \leq 0},$ es mapeada en la región anular delimitada por las mismas semicircunferencias de radio $e^{- 1}$ y $e^{1}$ , con centro en el origen, ubicada en el semiplano inferior del plano $w$ .

En general, si consideramos a la región fundamental de la exponencial, figura 78 entrada 20, es decir, la banda infinita:
${z = x + i y \in C : - \infty < x < \infty, - π < y < π},$ entonces, dicho conjunto es mapeado bajo la transformación $f (z) = e^{z}$ en el conjunto:
$C ∖ L_{- π} = {z \in C : | z | > 0, - π < Arg (z) < π},$ ya que $lim_{x \to - \infty} e^{x} = 0$ y $lim_{x \to \infty} e^{x} = \infty$ .

Podemos visualizar lo anterior en el siguiente applet de GeoGebra https://www.geogebra.org/m/qqyhwmgv.

Ejemplo 26.7.
Sean $0 < a < b$ y $0 \leq θ_{1} < θ_{2} \leq π$ . Determinemos la imagen de la región circular:
$S = {z \in C : a \leq | z | \leq b, θ_{1} \leq Arg (z) \leq θ_{2}},$ bajo la transformación $Log (z)$ .

Solución. Notemos que la región $S$ está delimitada por las semirrectas que parten del origen y se forman por los ángulos $0 \leq θ_{1}$ , $θ_{2} \leq π$ y por los arcos de circunferencia de radio $a$ y $b$ con centro en el origen, como se puede ver en el siguiente applet de GeoGebra https://www.geogebra.org/m/qjzxhefv.

Consideremos a una semirrecta $L$ que parte del origen y está determinada por un ángulo $θ$ tal que $θ_{1} \leq θ \leq θ_{2}$ . Sea $z \in L \cap S$ , entonces:
$\begin{aligned} Log (z) & = \ln | z | + i Arg (z) \\ = \ln | z | + i θ . \end{aligned}$

Dado que $0 < a \leq | z | \leq b$ , tenemos que $\ln (a) \leq \ln | z | \leq \ln (b)$ , por lo que los puntos $w = Log (z)$ describen el segmento de la recta horizontal:
$w = u + i v, \ln (a) \leq u \leq \ln (b), v = θ .$

Como $v \in [θ_{1}, θ_{2}]$ , entonces el segmento de la semirrecta $L$ , que está completamente contenido en $S$ , cubre a $S$ conforme $v$ varía, por lo que bajo $f$ dicho segmento cubre a la región rectangular en el plano $w$ determinada por los vértices $(\ln (a), θ_{1})$ , $(\ln (b), θ_{1})$ , $(\ln (b), θ_{2})$ y $(\ln (a), θ_{2})$ .

Observación 26.5.
De acuerdo con los ejemplos 26.6 y 26.7, geométricamente debe ser claro que las funciones $Log (z)$ y $e^{z}$ biyectan una región anular en una región rectangular y viceversa. Además, la frontera de la región anular es mapeada en la frontera de la región rectangular y viceversa.

Cerraremos esta entrada con el siguiente ejemplo correspondiente con la transformación trigonométrica $sen (z)$ . Por simplicidad consideraremos solo una parte de una banda infinita, pues para la parte restante el planteamiento es el mismo, sin embargo no deja de ser de suma importancia pues en conjunto nos permiten concluir que la función compleja $sen (z)$ tiene como imagen a todo el plano complejo $C$ .

Ejemplo 26.8.
Determinemos la imagen de la semibanda infinita:
$S = {z = x + i y \in C : - \frac{π}{2} \leq x \leq \frac{π}{2}, y \geq 0},$ bajo la transformación $f (z) = sen (z)$ .

Solución. De manera análoga a los ejemplos anteriores, procedemos a cubrir la región del dominio de $f$ con alguna curva simple que bajo $f$ nos permita cubrir la imagen de $S$ y así determinar dicho conjunto.

Sea $0 \leq y_{0} < \infty$ fijo. Consideramos el segmento de recta horizontal contenido en $S$ dado por:
$y = y_{0}, - \frac{π}{2} \leq x \leq \frac{π}{2} .$

Sea $z = x + i y_{0}$ un punto sobre dicho segmento de recta, entonces, bajo $f$ , por la proposición 22.1(10) tenemos que:
$\begin{aligned} w = u + i v & = sen (x + i y_{0}) \\ = sen (x) \cosh (y_{0}) + i \cos (x) senh (y_{0}), \end{aligned}$ de donde:
$u (x, y) = sen (x) \cosh (y_{0}) y v (x, y) = \cos (x) senh (y_{0}) .$

Si $y_{0} = 0$ , tenemos que $\cosh (0) = 1$ y $senh (0) = 0$ , por lo que $v = 0$ y $u = sen (x)$ , entonces la imagen del intervalo $[- \frac{π}{2}, \frac{π}{2}]$ , bajo $f (z) = sen (z)$ , es el intervalo $[- 1, 1]$ .

Supongamos ahora que $y_{0} > 0$ . Tenemos que $\cosh (y_{0}) > 0$ y $senh (y_{0}) > 0$ , por lo que:
$\begin{matrix} (26.3) & sen (x) = \frac{u}{\cosh (y_{0})} y \cos (x) = \frac{v}{senh (y_{0})} . \end{matrix}$

Para $x \in [- \frac{π}{2}, \frac{π}{2}]$ tenemos que $\cos (x) \leq 0$ , por lo que $v \geq 0$ .

Elevando al cuadrado ambas igualdades en (26.3) y sumándolas tenemos que:
$\begin{matrix} (26.4) & 1 = {sen}^{2} (x) + \cos^{2} (x) = {(\frac{u}{\cosh (y_{0})})}^{2} + {(\frac{v}{senh (y_{0})})}^{2} . \end{matrix}$

De acuerdo con (26.4), como $x \in [- \frac{π}{2}, \frac{π}{2}]$ , entonces los puntos $w = u + i v$ trazan la semielipse superior:
${(\frac{u}{\cosh (y_{0})})}^{2} + {(\frac{v}{senh (y_{0})})}^{2} = 1, v \geq 0.$

Los puntos de intersección de dicha semielipse con el eje real $u$ son $(\pm \cosh (y_{0}), 0)$ , mientras que el punto intersección con el eje imaginario $v$ es $(0, senh (y_{0}))$ .

Dado que:
$\begin{aligned} lim_{y_{0} \to \infty} senh (y_{0}) = \infty, & lim_{y_{0} \to \infty} \cosh (y_{0}) = \infty, \\ lim_{y_{0} \to 0} senh (y_{0}) = 0, & lim_{y_{0} \to 0} \cosh (y_{0}) = 1, \end{aligned}$ y $y_{0} \in (0, \infty)$ , entonces la imagen de las semielipses se encuentra en el semiplano superior $v \geq 0$ , del plano $w$ , incluyendo el eje real $u$ .

Se puede verificar fácilmente, ejercicio 5, que la frontera de $S$ es mapeada en la frontera de $f (S)$ , correspondiente con el eje real $u$ .

Podemos visualizar lo anterior en el siguiente applet de GeoGebra https://www.geogebra.org/m/byzgzgzb.

Tarea moral

Determina la imagen $f (S)$ bajo la transformación lineal dada.
a) $f (z) = 4 z$ y $S = {z \in C : | z | < 1}$ .
b) $f (z) = i z + i$ y $S = {z \in C : Re (z) > 0}$ .
c) $f (z) = - z + 2 i$ y $S = {z \in C : Re (z) > 0, Im (z) > 0}$ .
d) $f (z) = i z + 2$ y $S = {z \in C : | z | \leq 2, 0 \leq Arg (z) \leq \frac{π}{2}}$ .
Sea $f (z) = \frac{1}{z}$ la transformación inversión. Para cada conjunto $S$ determina su imagen $f (S)$ .
a) $S = {z \in C : 0 < | z | \leq 1}$ .
b) $S = {z \in C : | z | \geq 1}$ .
c) $S = {z \in C : 0 < | z | \leq 3, \frac{π}{3} \leq Arg (z) \leq \frac{2 π}{3}}$ .
d) $S = {z \in C : z \neq 0, 0 \leq Arg (z) \leq \frac{π}{2}}$ .
Encuentra la imagen de $S = {z \in C : | z | < 1}$ bajo $f (z) = z + \overset{―}{z}$ .
Sea $f (z) = z^{2}$ . Determina la imagen $f (S)$ de cada conjunto $S$ .
a) $S$ es el cuadrado con vértices $(0, 0), (1, 0), (1, 1)$ y $(0, 1)$ .
b) $S = {z \in C : 0 \leq Im (z) \leq 1}$ .
c) $S = {z \in C : Re (z) > 0, Im (z) > 0}$ .
d) $S = {z \in C : - 2 \leq Re (z) \leq 0}$ .
Sea $f (z) = sen (z)$ .
a) Muestra que bajo $f$ la semirrecta $x = \frac{π}{2}$ , $y \geq 0$ es mapeada en la semirrecta $u \geq 1$ , $v = 0$ .
b) Muestra que bajo $f$ la semirrecta $x = - \frac{π}{2}$ , $y \geq 0$ es mapeada en la semirrecta $u \leq - 1$ , $v = 0$ .
c) Concluye que la frontera del conjunto $S$ en el ejemplo 26.8 es mapeada en la drontera del conjunto $f (S)$ .
d) Sabemos que la elipse:
$\frac{x^{2}}{a^{2}} + \frac{y^{2}}{b^{2}} = 1,$ con $0 < b < a$ , tiene focos en los puntos $(\pm \sqrt{a^{2} - b^{2}}, 0)$ . Muestra que todas las elipses del ejemplo 26.8 tienen los mismos focos en los puntos $(\pm 1, 0)$ .
Sea $S$ la semibanda horizontal:
${z = x + i y \in C : x \geq 0, - \frac{π}{2} \leq y \leq \frac{π}{2}} .$ Determina la imagen de $S$ bajo la función $f (z) = senh (z)$ .

Hint: Expresa a $senh (z)$ en términos de $sen (z)$ .
Sea $w = ρ e^{i ϕ}$ . Muestra que la transformación $w = \frac{i}{z}$ mapea la hipérbola $x^{2} - y^{2} = 1$ en la lemniscata $ρ^{2} = 2 \cos (2 ϕ)$ .
Determina una transformación que rote a la elipse $x^{2} + x y + y^{2} = 2$ , en el sentido de las manecillas del reloj, tal que su ecuación se reduzca a su forma canónica. Obtén la longitud de su semieje mayor y menor.

Hint: Supón que la transformación es de la forma $w = ρ e^{i ϕ}$ . Determina un ángulo $α$ tal que el coeficiente de $u v$ en la imagen de la curva es cero.

Más adelante…

En esta entrada hemos abordado, a manera de ejemplos, el estudio de las funciones complejas como transformaciones del plano complejo, esto con el objetivo de dar una interpretación geométrica del comportamiento de las funciones complejas, ya que como mencionamos antes, visualizar la gráfica de tales funciones resulta imposible. Debe ser claro que la propuesta de esta entrada es solo una de las distintas alternativas conocidas para el estudio de la parte gráfica de una función compleja, sin embargo hay otras alternativas que pueden ser de utilidad para la comprensión del comportamiento geométrico de estas funciones, por lo que se recomienda consultar estas otras propuestas.

Con esta entrada finalizamos la segunda unidad del curso. En la siguiente entrada es la primera de la tercera unidad del curso, correspondiente con el tema de series de números complejos, en la cual estudiaremos algunos de los conceptos básicos así como algunas de las propiedades más importantes de estos objetos matemáticos, mediante los cuales probaremos una serie de resultados que serán de utilidad para caracterizar a las funciones complejas a través de dichos objetos.

Entradas relacionadas

Ir a Variable Compleja I.
Entrada anterior del curso: Transformaciones lineales y transformaciones de Möbius.
Siguiente entrada del curso: Preliminares de series de números complejos.

Variable Compleja I: Transformaciones lineales y transformaciones de Möbius

Por Pedro Rivera Herrera

2 respuestas

Introducción

En la entrada anterior definimos el concepto de transformación compleja, como una función $T$ del plano complejo en sí mismo y probamos algunos resultados básicos sobre estas transformaciones al considerar a $C$ como un $R$ -espacio vectorial. Además, definimos algunas de las transformaciones del plano más elementales como la traslación, la homotecia, la reflexión y la rotación.

Nuestro objetivo en ésta entrada es trabajar con un tipo de transformación compleja muy particular, que nos permitirá entender mejor la geometría de las funciones complejas en la siguiente entrada.

Definición 25.1. (Transformaciones afines lineales.)
Sean $a, b \in C$ con $a \neq 0$ . A las transformaciones de la forma:
$\begin{matrix} (25.1) & T (z) = a z + b, \end{matrix}$ se les llama transformaciones afines lineales o simplemente transformaciones lineales, las cuales son transformaciones dadas por una homotecia, una rotación y una traslación.

Observación 25.1.
En nuestros cursos de Geometría a las transformaciones de la forma (25.1), comúnmente se les llama transformaciones afines, sin embargo, en la mayoría de textos referentes a transformaciones del plano complejo $C$ se les suele llamar transformaciones lineales puesto que geométricamente a una expresión de la forma (25.1) se le puede asociar una recta en el plano. Tener esto en cuenta es de suma importancia para no confundir las definiciones 24.2 y 24.3 con la definición 25.1, puesto que las primeras dos definiciones, vistas en nuestros cursos de Álgebra Lineal, corresponden a una propiedad entre $R$ -espacios vectoriales, mientras que la última definición está dada por una interpretación geométrica.

De hecho, es fácil verificar que no toda transformación lineal, definición 25.1, es $C$ -lineal, ya que $T (0) = b$ y $b \in C$ no necesariamente es la constante cero.

Ejemplo 25.1.
Las transformaciones elementales del plano complejo son una transformación lineal particular.
a) Si $a = 1$ y $b \in C$ , entonces tenemos la traslación por $b$ , $T_{b} (z) = z + b$ .
b) Si $a = e^{i θ} \in C$ , con $θ \in R$ y $b = 0$ , entonces tenemos una rotación, $R_{θ} (z) = e^{i θ} z$ .
c) Si $b = 0$ y $a = k \in R$ , entonces tenemos una homotecia, $T (z) = k z$ .
d) Si $a = e^{i θ} \in C$ , con $θ \in R$ y $b \in C$ , entonces tenemos una reflexión respecto a una recta $L$ , $r_{L} (z) = e^{i θ} \overset{―}{z} + b$ .

Procedemos ahora a establecer algunas propiedades sobre las transformaciones lineales.

Lema 25.1.
Sean $z_{1}, z_{2}, z_{3} \in C$ tres puntos no colineales. El ángulo $α$ , figura 95, formado entre los vectores $z_{2} - z_{1}$ y $z_{3} - z_{1}$ está dado por:
$α = \arg (\frac{z_{3} - z_{1}}{z_{2} - z_{1}}) .$

Demostración. Se deja como ejercicio al lector.

Figura 95: Ángulo $α$ formado entre los vectores $z_{2} - z_{1}$ y $z_{3} - z_{1}$ .

Proposición 25.1.
Sea $T : C \to C$ una transformación lineal, entonces:

$T$ envía rectas en rectas.
$T$ envía circunferencias en circunferencias.

Demostración. Sea $T (z) = a z + b$ , con $a, b \in C$ y $a \neq 0$ .

Sea $L$ una recta en $C$ con ecuación: $\begin{matrix} (25.2) & c \overset{―}{z} + \overset{―}{c} z + d = 0, \end{matrix}$ para algún $c \in C$ , $c \neq 0$ , y $d \in R$ .

Veamos que $T (L)$ es también una recta. Notemos que cualquier $z \in L$ , bajo $T$ es de la forma $w = a z + b$ . Dado que $a \neq 0$ , entonces: $z = \frac{1}{a} (w - b),$ por lo que, al ser $z$ un punto de $L$ satisface (25.2), es decir: $\begin{aligned} 0 & = c \overset{―}{(\frac{1}{a} (w - b))} + \overset{―}{c} (\frac{1}{a} (w - b)) + d \\ = c \overset{―}{(\frac{w}{a})} + \overset{―}{c} (\frac{w}{a}) + d - (c \overset{―}{(\frac{b}{a})} + \overset{―}{c} (\frac{b}{a})) . \end{aligned}$ Dado que: $c \overset{―}{(\frac{b}{a})} + \overset{―}{c} (\frac{b}{a}) = c \overset{―}{(\frac{b}{a})} + \overset{―}{c \overset{―}{(\frac{b}{a})}} = 2 Re (c \overset{―}{(\frac{b}{a})}),$ entonces: $d - (c \overset{―}{(\frac{b}{a})} + \overset{―}{c} (\frac{b}{a})) \in R,$ por lo que todos los puntos $w \in T (L)$ satisfacen la ecuación de una recta, es decir, $T (L)$ es una recta.
Se deja como ejercicio al lector.

Proposición 25.2.
Toda transformación lineal preserva ángulos.

Demostración. Sea $T$ una transformación lineal, es decir, $T (z) = a z + b$ , con $a, b \in C$ y $a \neq 0$ .

Dado que $T$ envía rectas en rectas, basta probar que el ángulo formado entre dos rectas que se cortan en un punto es igual al de sus imágenes bajo $T$ .

Sean $L_{1}$ y $L_{2}$ dos rectas que se cortan en un punto $z_{0} \in C$ . Sean $z_{1} \in L_{1}$ y $z_{2} \in L_{2}$ . Veamos que:
$∠ (L_{1}, L_{2}) = ∠ (T (L_{1}), T (L_{2})) .$

Por el lema 24.1 tenemos que:
$\begin{aligned} ∠ (T (L_{1}), T (L_{2})) & = \arg (\frac{T (z_{2}) - T (z_{0})}{T (z_{1}) - T (z_{0})}) \\ = \arg (\frac{a z_{2} + b - a z_{0} - b}{a z_{1} + b - a z_{0} - b}) \\ = \arg (\frac{z_{2} - z_{0}}{z_{1} - z_{0}}) \\ = ∠ (L_{1}, L_{2}) . \end{aligned}$

Observación 25.2.
En general, es posible definir a una transformación compleja para la cual las transformaciones lineales son un caso particular. Dichas transformaciones resultan de gran interés en el estudio de las funciones complejas pues nos dicen mucho sobre su comportamiento geométrico.

Definición 25.2. (Transformaciones fraccionarias lineales.)
Sean $a, b, c, d \in C$ , con al menos $c$ ó $d$ distinto de cero. Una transformación de la forma:
$\begin{matrix} (25.3) & T (z) = \frac{a z + b}{c z + d}, \end{matrix}$ recibe el nombre de transformación fraccionaria lineal.

Observación 25.3.
Debe ser claro que una función $T$ dada por (25.3) está bien definida para todo $z \in C$ tal que $c z + d \neq 0$ . De hecho $T$ es una función analítica en $C ∖ A$ , donde:
$A = {z \in C : c z + d = 0} .$

Más aún, bajo la condición $c \neq 0$ , la función $T$ se restringe de $C ∖ {- \frac{d}{c}}$ en $C ∖ {\frac{a}{c}}$ .

Definición 25.3. (Transformaciones de Möbius.)
Sean $a, b, c, d \in C$ . Una transformación de la forma (25.3) tal que $a d - b c \neq 0$ recibe el nombre de transformación de Möbius.

Observación 25.4.
La condición $a d - b c \neq 0$ , impuesta sobre las constantes $a, b, c, d \in C$ , nos permite garantizar lo siguiente:
1) Las expresiones $a z + b$ y $c z + d$ no se anulan para los mismos valores de $z$ .
2) La transformación $T$ no puede ser constante, ya que $a$ y $c$ no pueden ser ambas cero, al igual que $b$ y $d$ no pueden ser ambas cero.
3) En general, el denominador no puede ser un múltiplo constante del numerador, es decir que $a z + b$ y $c z + d$ no tienen un factor común.

Además, no es difícil verificar que $T$ es biyectiva si y solo si $a d - b c \neq 0$ , por lo que se deja como ejercicio al lector.

Observación 25.5.
Notemos que toda transformación de la forma:
$w = T (z) = \frac{a z + b}{c z + d}, con a d - b c \neq 0,$ es equivalente a una expresión de la forma:
$A z w + B z + C w + D = 0, con A D - B C \neq 0,$ donde $A = c$ , $B = - a$ , $C = d$ y $D = - b$ .

Dado que ésta última expresión es lineal en $z$ y es lineal en $w$ , entonces es bilineal en $z$ y $w$ , por lo que una transformación de Möbius también suele llamarse una transformación bilineal.

Ejemplo 25.2.
Notemos que algunas de las transformaciones definidas antes, son un una transformación de Möbius particular.
a) Si $a = 1 = d$ y $b = 0 = c$ , entonces tenemos la transformación identidad, $T (z) = z$ .
b) Si $c = 0$ y $d = 1$ , entonces tenemos una transformación lineal, $T (z) = a z + b$ .
c) Si $a = d = 0$ y $b = c$ , entonces tenemos la transformación inversión, $T (z) = \frac{1}{z}$ , dada en el ejemplo 24.1.

Es común trabajar con las transformaciones de Möbius como funciones sobre el plano complejo extendido, por lo que, considerando la observación 15.5 y el ejercicio 4 de la entrada 12, podemos definir a una transformación de Möbius como una función continua en $C_{\infty}$ , como sigue:

Definición 25.4. (Transformaciones de Möbius en $C_{\infty}$ .)
Sean $a, b, c, d \in C$ . Si $a d - b c \neq 0$ , entonces diremos que una función racional $T : C_{\infty} \to C_{\infty}$ dada como:
$T (z) = {\begin{array}{lcc} \frac{a z + b}{c z + d}, & si & z \neq - \frac{d}{c}, z \neq \infty, \\ \infty, & si & z = - \frac{d}{c}, \\ \frac{a}{c}, & si & z = \infty, \end{array}$ es una transformación de Möbius en el plano complejo extendido.

Observación 25.6.
Como hemos mencionado anteriormente, la condición $a d - b c \neq 0$ se impone para evitar que trabajemos con una transformación constante. Sin embargo, podemos utilizar dicha condición para plantear de una forma equivalente a la definición 25.4 considerando los siguientes casos:
1) Si $c = 0$ , entonces la condición $a d - b c \neq 0$ se reduce a $a d \neq 0$ , en dicho caso tenemos que $T (\infty) = \infty$ y:
$T (z) = \frac{a z + b}{d} = \frac{a}{d} z + \frac{b}{d} .$ 2) Si $c \neq 0$ , tenemos $a d - b c \neq 0$ , entonces $T (\infty) = a / c$ , $T (- d / c) = \infty$ y:
$T (z) = \frac{a z + b}{c z + d} = \frac{a}{c} + \frac{b c - a d}{c} \frac{1}{c z + d} .$

Ejemplo 25.3.
La transformación:
$f (z) = \frac{z - 1}{i z + i},$ es una transformación de Möbius desde que $a = 1$ , $b = - 1$ , $c = i = d$ y $a d - b c = i - (- i) = 2 i \neq 0$ .

Dado que $c = i \neq 0$ , entonces la transformación de Möbius $f$ es una función restringida, es decir:
$f : C ∖ {- 1} \to C ∖ {- i} .$

Podemos extender dicha transformación de Möbius al plano complejo extendido como sigue:
$f (z) = \frac{z - 1}{i z + i}, si z \neq - 1 y z \neq \infty,$

mientras que:
$f (- 1) = \infty y f (\infty) = - i .$

Proposición 25.3.
Sean $T_{1}$ y $T_{2}$ dos transformaciones de Möbius dadas por:
$T_{1} (z) = \frac{a_{1} z + b_{1}}{c_{1} z + d_{1}} y T_{2} (z) = \frac{a_{2} z + b_{2}}{c_{2} z + d_{2}}$
con $a_{1} d_{1} - b_{1} c_{1} \neq 0$ y $a_{2} d_{2} - b_{2} c_{2} \neq 0$ . Entonces su composición es también una transformación de Möbius.

Demostración. Se deja como ejercicio al lector.

Proposición 25.4.
Toda transformación de Möbius es una biyección de $C_{\infty}$ en $C_{\infty}$ . En particular la inversa de una transformación de Möbius es también una transformación de Möbius.

Demostración. Sea $T : C_{\infty} \to C_{\infty}$ una transformación de Möbius dada por:
$T (z) = \frac{a z + b}{c z + d}, con a d - b c \neq 0.$

De acuerdo con la observación 25.6 tenemos que si $c = 0$ , entonces $T (\infty) = \infty$ y si $c \neq 0$ , entonces $T (\infty) = a / c$ y $T (- d / c) = \infty$ .

Primeramente verifiquemos que $T$ es inyectiva. Supongamos que $T (z_{1}) = T (z_{2})$ . Notemos que si $c \neq 0$ , entonces tenemos la condición $a d - b c \neq 0$ , por lo que:
$\begin{aligned} \frac{a z_{1} + b}{c z_{1} + d} & = \frac{a z_{2} + b}{c z_{2} + d} \\ ⟺ a d z_{1} + b c z_{2} = a d z_{2} + b c z_{1} \\ ⟺ (a d - b c) (z_{1} - z_{2}) = 0 \\ ⟺ z_{1} = z_{2} . \end{aligned}$

Por otra parte, notemos que si $c = 0$ , entonces tenemos la condición $a d \neq 0$ , por lo que:
$\begin{aligned} \frac{a z_{1} + b}{d} & = \frac{a z_{2} + b}{d} \\ ⟺ a z_{1} + b = a z_{2} + b \\ ⟺ z_{1} = z_{2} . \end{aligned}$

Verifiquemos ahora que $T$ es suprayectiva. Sea $w \in C_{\infty}$ . Veamos que existe $z \in C_{\infty}$ tal que $T (z) = w$ . Notemos que si $w = \infty$ , entonces $z = - d / c$ corresponde con dicho valor si $c = 0$ . Sin pérdida de generalidad supongamos que $w \neq \infty$ , entonces tenemos que $c \neq 0$ y por tanto se cumple la condición $a d - b c \neq 0$ , por lo que planteamos la ecuación:
$w = \frac{a z + b}{c z + d} .$

Resolviendo para $z$ tenemos que:
$z = T^{- 1} (w) = \frac{- d w + b}{c w - a},$ por lo que $T$ es suprayectiva.

Dado que $T$ es biyectiva entonces existe $T^{- 1}$ tal que $T \circ T^{- 1} = T^{- 1} \circ T = I_{C}$ para todo $z \in C_{\infty}$ , la cual está dada por:
$T^{- 1} (z) = \frac{- d z + b}{c z - a}, con a d - b c \neq 0,$ tal que si $c = 0$ , entonces $T^{- 1} (\infty) = \infty$ y si $c \neq 0$ , entonces $T^{- 1} (a / c) = \infty$ y $T^{- 1} (\infty) = - d / c$ . Es claro que $T^{- 1}$ es también una transformación de Möbius.

Observación 25.7.
De acuerdo con las proposiciones 25.3 y 25.4 no es díficil verificar que el conjunto de todas las transformaciones de Möbius dotado con la operación de composición de funciones forma un grupo.

Proposición 25.5.
Toda transformación de Möbius $T : C_{\infty} \to C_{\infty}$ se puede expresar como la composición de transformaciones lineales (homotecias, rotaciones y traslaciones) y la inversión.

Demostración. Sea $T : C_{\infty} \to C_{\infty}$ una transformación de Möbius dada por:
$T (z) = \frac{a z + b}{c z + d}, con a d - b c \neq 0,$ tal que si $c = 0$ , entonces $T (\infty) = \infty$ y si $c \neq 0$ , entonces $T (\infty) = a / c$ y $T (- d / c) = \infty$ .\

Por la observación 25.6(1) tenemos que, para $c = 0$ la transformación $T$ se puede ver como la composición $T_{2} \circ T_{1}$ , donde:
$T_{1} (z) = \frac{a}{d} z, T_{2} (z) = z + \frac{b}{d},$ con $a d \neq 0$ , por lo que en dicho caso se cumple el resultado.

Por otra parte, por la observación 25.6(2), para $c \neq 0$ tenemos que la transformación $T$ se puede ver como la composición $T_{3} \circ T_{2} \circ T_{1}$ , donde:
$T_{1} (z) = c z + d, T_{2} (z) = \frac{1}{z}, T_{3} (z) = \frac{a}{c} + \frac{b c - a d}{c} z,$ con $a d - b c \neq 0$ , por lo que en dicho caso también se cumple el resultado.

Procedemos a analizar algunas propiedades geométricas importantes de las transformaciones de Möbius. Para ello nos apoyaremos de algunos resultados para la transformación inversión.

Tenemos que la transformación:
$\begin{matrix} (25.4) & w = T (z) = \frac{1}{z}, \end{matrix}$ establece una biyección entre los puntos distintos de cero de los planos $z$ y $w$ . Dado que $z \overset{―}{z} = | z |^{2}$ , entonces podemos reescribir a (25.4) mediante la composición de las siguientes transformaciones:
$\begin{matrix} (25.5) & T_{1} (z) = \frac{1}{\overset{―}{z}} = \frac{z}{| z |^{2}}, T_{2} (z) = \overset{―}{z}, \end{matrix}$ entonces es claro que $T (z) = (T_{2} \circ T_{1}) (z)$ .

Notemos que la primer transformación en (25.5) nos describe una inversión con respecto a la circunferencia unitaria $C (0, 1)$ , es decir, la imagen de un punto $z \neq 0$ es el punto $w_{1} = T_{1} (z)$ con las siguientes propiedades:
$| w_{1} | = \frac{1}{| z |}, \arg w_{1} = \arg z .$

Por lo que los puntos fuera de la circunferencia unitaria $| z | = 1$ serán mapeados, mediante $T_{1}$ , en los puntos $w_{1} \neq 0$ dentro de dicha circunferencia y viceversa. Mientras que los puntos que caigan sobre la circunferencia unitaria $| z | = 1$ , bajo $T_{1}$ , serán mapeados en ellos mismos. Por otra parte, la segunda transformación dada en (16.2) es simplemente una reflexión a través del eje real de cada $w_{1} = T_{1} (z) \neq 0$ , es decir $w = \overset{―}{w_{1}}$ , figura 96.

Figura 96: Gráfica de la transformación inversión vista como la composición de las transformaciones $T_{1}$ y $T_{2}$ dadas en (25.5).

Podemos visualizar lo anterior en el siguiente applet de GeoGebra: https://www.geogebra.org/m/z3cf2kyt.

Desde que:
$lim_{z \to 0} \frac{1}{z} = \infty, lim_{z \to \infty} \frac{1}{z} = 0,$ entonces podemos definir una biyección entre los planos $z$ y $w$ extendidos, es decir entre $C_{\infty}$ y $C_{\infty}$ , mediante:
$T (z) = {\begin{array}{lcc} \frac{1}{z}, & si & z \neq 0, z \neq \infty, \\ 0, & si & z = \infty, \\ \infty, & si & z = 0. \end{array}$

Es claro que la transformación $T$ , definida previamente, es una función continua en $C_{\infty}$ .

Considerando lo anterior, estamos listos para probar la siguiente:

Proposición 25.6.
La transformación inversión mapea el conjunto de circunferencias y rectas en el conjunto de circunferencias y rectas.

Demostración. Sea $T (z) = 1 / z$ la transformación inversión. De nuestros cursos de geometría analítica sabemos que para $A, D, E, F$ números reales tales que $D^{2} + E^{2} > 4 A F$ , la ecuación:
$\begin{matrix} (25.6) & A (x^{2} + y^{2}) + D x + E y + F = 0, \end{matrix}$ representa una circunferencia o una recta, si $A \neq 0$ ó $A = 0$ , respectivamente.

Dado que $z \overset{―}{z} = | z |^{2}$ , tenemos que si $w = u + i v$ es la imagen de $z = x + i y \neq 0$ bajo la transformación inversión, es decir:
$w = T (z) = \frac{1}{z} = \frac{\overset{―}{z}}{| z |^{2}},$ entonces:
$\begin{matrix} (25.7) & u = \frac{x}{x^{2} + y^{2}}, v = - \frac{y}{x^{2} + y^{2}} . \end{matrix}$

Considerando que la transformación inversión establece una biyección entre los planos $z$ y $w$ , entonces podemos plantear:
$z = T^{- 1} (w) = \frac{1}{w} = \frac{\overset{―}{w}}{| w |^{2}},$ de donde:
$\begin{matrix} (25.8) & x = \frac{u}{u^{2} + v^{2}}, y = - \frac{v}{u^{2} + v^{2}} . \end{matrix}$

Supongamos que $z = x + i y \neq 0$ satisface (25.6), veamos que $w = u + i v = T (z) \neq 0$ también satisface una ecuación similar. Sustituyendo las ecuaciones dadas en (25.8) tenemos que:
$\begin{aligned} 0 & = A [\frac{u^{2} + v^{2}}{(u^{2} + v^{2})^{2}}] + D (\frac{u}{u^{2} + v^{2}}) + E (- \frac{v}{u^{2} + v^{2}}) + F \\ = A (\frac{1}{u^{2} + v^{2}}) + D u (\frac{1}{u^{2} + v^{2}}) - E v (\frac{1}{u^{2} + v^{2}}) + F, \end{aligned}$ de donde se sigue que $w = u + i v$ satisface la ecuación:
$\begin{matrix} (25.9) & F (u^{2} + v^{2}) + D u - E v + A = 0, \end{matrix}$ la cual corresponde con la ecuación de una circunferencia o una recta, si $F \neq 0$ ó $F = 0$ , respectivamente.

De manera análoga se puede mostrar que si $w = u + i v$ satisface (25.9), entonces, utilizando (25.7), $z = x + i y$ satisface (25.6).

Observación 25.8.
Si consideramos a $T$ la transformación inversión, entonces de las ecuaciones (25.6) y (25.9) tenemos que:
1) Si $A \neq 0$ y $F \neq 0$ , en el plano $z$ se tiene una circunferencia que no pasa a través del origen, la cual, bajo $T$ , será mapeada en una circunferencia que tampoco pasa por el origen en el plano $w$ .
2) Si $A \neq 0$ y $F = 0$ , en el plano $z$ se tiene una circunferencia que pasa a través del origen, la cual, bajo $T$ , será mapeada en una recta que no pasa por el origen en el plano $w$ .
3) Si $A = 0$ y $F \neq 0$ , en el plano $z$ se tiene una recta que no pasa a través del origen, la cual, bajo $T$ , será mapeada en una circunferencia que pasa por el origen en el plano $w$ .
4) Si $A = 0$ y $F = 0$ , en el plano $z$ se tiene una recta que pasa a través del origen, la cual será mapeada, bajo $T$ , en una recta que pasa por el origen en el plano $w$ .

Podemos visualizar lo anterior en el siguiente applet de GeoGebra: https://www.geogebra.org/m/eqh4nbab.

De acuerdo con las proposiciones 25.1, 25.5 y 25.6 se tiene el siguiente:

Corolario 25.1.
Toda transformación de Möbius mapea el conjunto de rectas y circunferencias en el conjunto de rectas y circunferencias.

Demostración. Se deja como ejercicio al lector.

Ejemplo 25.4.
Muestra que la recta $L : 3 y = x$ , en el plano $z$ , es enviada en una circunferencia, en el plano $w$ , bajo la transformación de Möbius:
$\begin{matrix} (25.10) & w = T (z) = \frac{i z + 2}{4 z + i} . \end{matrix}$

Solución. Sean $z = x + i y$ y $w = u + i v$ . Para determinar la imagen de la recta $3 y = x$ bajo $T$ , debemos encontrar los valores de $x$ y de $y$ en términos de $u$ y de $v$ .

Resolvemos (25.10) para $z$ :
$\begin{aligned} w = \frac{i z + 2}{4 z + i} & ⟹ 4 z w + i w = i z + 2 \\ ⟹ z (4 w - i) = 2 - i w \\ ⟹ z = \frac{2 - i w}{4 w - i} . \end{aligned}$

Entonces:
$\begin{aligned} x + i y & = \frac{v + 2 - i u}{4 u + i (4 v - 1)} \frac{4 u - i (4 v - 1)}{4 u - i (4 v - 1)} \\ = \frac{(v + 2 - i u) [4 u + i (4 v - 1)]}{16 u^{2} + (4 v - 1)^{2}} \\ = \frac{9 u - i (4 u^{2} + 4 v^{2} + 7 v - 2)}{16 u^{2} + (4 v - 1)^{2}}, \end{aligned}$ de donde:
$x = \frac{9 u}{16 u^{2} + (4 v - 1)^{2}}, y = - \frac{4 u^{2} + 4 v^{2} + 7 v - 2}{16 u^{2} + (4 v - 1)^{2}} .$

Sustituyendo en la ecuación de la recta tenemos que:
$\frac{9 u}{16 u^{2} + (4 v - 1)^{2}} = \frac{- 3 (4 u^{2} + 4 v^{2} + 7 v - 2)}{16 u^{2} + (4 v - 1)^{2}},$ es decir:
$u^{2} + v^{2} + \frac{3}{4} u + \frac{7}{4} v - \frac{1}{2} = 0,$ la cual corresponde con la ecuación de una circunferencia, en el plano $w$ , con centro en $(- 3 / 8, - 7 / 8)$ y radio $r = (3 / 8) \sqrt{10}$ .

Figura 97: Imagen de la recta $3 y = x$ bajo la transformación de Möbius (25.10).

Podemos generalizar la definición 24.10, de punto fijo de una transformación, para las funciones complejas definidas sobre el plano complejo extendido.

Definición 25.5.(Punto fijo.)
Sea $S \subset C_{\infty}$ y sea $f : S \to C_{\infty}$ una función. Diremos que un punto $z_{0} \in S$ es un punto fijo de $f$ si y solo si $f (z_{0}) = z_{0}$ .

Ejemplo 25.5.
a) La función $f (z) = z^{2}$ fija a los puntos $0, 1$ e $\infty$ .
b) La función $f (z) = \frac{1}{z}$ fija a los puntos $1$ y $- 1$ .
c) La función $f (z) = z + i$ fija al $\infty$ .

Una pregunta interesante que podemos hacernos es ¿cuáles son los puntos fijos de una transformación de Möbius?

Para responder a esta pregunta consideremos los siguientes resultados.

Proposición 25.7.
Toda transformación de Möbius $T : C_{\infty} \to C_{\infty}$ deja fijo 1, 2 o todos los puntos de $C_{\infty}$ .

Demostración. Sea $T : C_{\infty} \to C_{\infty}$ una transformación de Möbius dada por:
$T (z) = \frac{a z + b}{c z + d}, con a d - b c \neq 0.$

Para encontrar los puntos fijos de $T$ planteamos la siguiente ecuación:
$T (z) = \frac{a z + b}{c z + d} = z,$ resolviendo para $z$ obtenemos la ecuación cuadrática:
$\begin{matrix} (25.11) & c z^{2} + (d - a) z - b = 0. \end{matrix}$

Caso 1. Si $c \neq 0$ , por la observación 25.6 tenemos que $T (\infty) = a / c$ y $T (- d / c) = \infty$ , es decir, $T$ no fija al punto $z = \infty$ . Por otra parte, es claro que la ecuación (25.11) tiene exactamente 1 ó 2 soluciones, por lo que en dicho caso tenemos que $T$ fija 1 ó 2 puntos de $C_{\infty}$ .

Caso 2. Si $c = 0$ , por la observación 25.6 tenemos que $T (\infty) = \infty$ , es decir, $T$ fija al punto $z = \infty$ . Por otra parte, para $c = 0$ tenemos la condición $a d \neq 0$ , por lo que $a \neq 0$ y $d \neq 0$ , entonces procedemos a analizar los siguientes casos:

Si $a \neq d$ , entonces la transformación $T$ es de la forma: $T (z) = \frac{a z + b}{d} .$ De (25.11) tenemos la solución: $z = \frac{b}{d - a} \neq \infty,$ la cual es otro punto fijo de $T$ , por lo que tenemos exactamente 2 puntos fijos, es decir, $T$ deja fijos a 2 puntos de $C_{\infty}$ .
Si $a = d$ , entonces la ecuación (25.11) se reduce a $b = 0$ , por lo que la transformación $T$ es de la forma: $T (z) = \frac{a z + 0}{0 z + a} = z,$ la cual es la transformación identidad, por lo que claramente $T$ fija a todo punto de $C_{\infty}$ .

Corolario 25.2.
Si $T$ es una transformación de Möbius que fija tres puntos distintos de $C_{\infty}$ , entonces $T$ es la identidad.

Demostración. Es inmediata del resultado anterior.

Corolario 25.3.
Si $T_{1}$ y $T_{2}$ son dos transformaciones de Möbius que fijan a tres puntos distintos de $C_{\infty}$ , entonces $T_{1} = T_{2}$ .

Demostración. Se sigue de las proposiciones 25.3, 25.4 y del corolario 25.3, por lo que los detalles se dejan como ejercicio al lector.

Observación 25.9.
El último resultado es de suma importancia pues nos dice que el comportamiento de una transformación de Möbius está completamente descrito por su acción sobre tres puntos distintos de $C_{\infty}$ .

Observación 25.10.
Notemos que si $T$ es una transformación de Möbius, digamos:
$T (z) = \frac{a z + b}{c z + d}, con a d - b c \neq 0,$ entonces para $λ \in C$ , tal que $λ \neq 0$ , se cumple que:
$S (z) = \frac{λ a z + λ b}{λ c z + λ d}$ también es una transformación de Möbius desde que $λ^{2} (a d - b c) \neq 0$ . Más aún, es claro que $T = S$ .

Ejemplo 25.6.
Determina la transformación de Möbius que envía los puntos del plano $z$ , en los puntos del plano $w$ , respectivamente.
a) $- 1 \mapsto - i$ , $0 \mapsto 1$ y $1 \mapsto i$ .
b) $1 \mapsto 0$ , $i \mapsto 1$ y $- 1 \mapsto \infty$ .
c) $1 \mapsto i$ , $0 \mapsto \infty$ y $- 1 \mapsto 1$ .

Solución. Sea $T$ una transformación de Möbius, es decir:
$w = T (z) = \frac{a z + b}{c z + d}, con a d - b c \neq 0.$

a) Dado que $T (0) = 1$ , tenemos que:
$1 = \frac{b}{d} ⟹ b = d,$ por lo que $b (a - c) \neq 0$ , es decir $b \neq 0$ y $a \neq c$ , entonces:
$T (z) = \frac{a z + b}{c z + b}, con b (a - c) \neq 0.$ Como $T (- 1) = - i$ y $T (1) = i$ , tenemos el siguiente sistema de ecuaciones:
${\begin{matrix} \frac{- a + b}{- c + b} = - i, \\ \frac{a + b}{c + b} = i . \end{matrix} ⟹ {\begin{matrix} - a + b = i c - i b, \\ a + b = i c + i b . \end{matrix}$ Resolviendo tenemos $a = i b$ y $c = - i b$ .

Como $b \neq 0$ , entonces:
$T (z) = \frac{b (i z + 1)}{b (- i z + 1)} = \frac{i z + 1}{- i z + 1} = \frac{i - z}{i + z} .$

b) Puesto que $T (- 1) = \infty$ , de la observación 25.6 tenemos que $c \neq 0$ y $- d / c = - 1$ , es decir, $c = d$ .

Como $T (1) = 0$ , entonces $a + b = 0$ , es decir $a = - b$ , entonces:
$T (z) = \frac{- b (z - 1)}{d (z + 1)}, - 2 b d \neq 0.$ Por último, como $T (i) = 1$ , entonces:
$\frac{- b (i - 1)}{d (i + 1)} = 1 ⟹ b = d (\frac{1 + i}{1 - i}) = i d .$ Por lo tanto, como $d \neq 0$ , tenemos que:
$T (z) = \frac{- i d (z - 1)}{d (z + 1)} = - i (\frac{z - 1}{z + 1}) .$

c) Dado que $T (0) = \infty$ , de la observación 25.6 tenemos que $c \neq 0$ y $d = 0$ , por lo que:
$T (z) = \frac{a z + b}{c z}, con b c \neq 0.$ Como $T (1) = i$ y $T (- 1) = 1$ , tenemos el siguiente sistema de ecuaciones:
${\begin{matrix} \frac{a + b}{c} = i, \\ \frac{- a + b}{- c} = 1. \end{matrix} ⟹ {\begin{matrix} a + b = i c, \\ - a + b = - c . \end{matrix}$ Resolviendo tenemos $2 a = c (1 + i)$ y $2 b = c (i - 1)$ .

De acuerdo con la observación 25.10 y considerando que $c \neq 0$ , entonces tenemos que:
$\begin{aligned} T (z) = \frac{a z + b}{c z} & = \frac{2 a z + 2 b}{2 c z} \\ = \frac{c [(1 + i) z + (i - 1)]}{2 c z} \\ = \frac{(1 + i) z + (i - 1)}{2 z} . \end{aligned}$

Proposición 25.8.
Sean $z_{1}, z_{2}, z_{3} \in C_{\infty}$ tres puntos distintos. Entonces existe una única transformación de Möbius tal que:
$\begin{matrix} (25.12) & T (z_{1}) = 0, T (z_{2}) = 1 y T (z_{3}) = \infty . \end{matrix}$

Demostración. Sean $z_{1}, z_{2}, z_{3} \in C_{\infty}$ tres puntos distintos. La unicidad se sigue del corolario 25.3.

Supongamos primeramente que los tres puntos son finitos, entonces para la existencia definimos a la transformación:
$\begin{matrix} (25.13) & T (z) = \frac{(z - z_{1}) (z_{2} - z_{3})}{(z - z_{3}) (z_{2} - z_{1})}, \forall z \in C . \end{matrix}$ Primero veamos que $T$ es una transformación de Möbius. Notemos que:
$\begin{aligned} T (z) & = \frac{(z - z_{1}) (z_{2} - z_{3})}{(z - z_{3}) (z_{2} - z_{1})} \\ = \frac{(z_{2} - z_{3}) z + z_{1} (z_{3} - z_{2})}{(z_{2} - z_{1}) z + z_{3} (z_{1} - z_{2})} \\ =: \frac{a z + b}{c z + d}, \end{aligned}$ de donde:
$\begin{aligned} a d - b c & = z_{3} (z_{2} - z_{3}) (z_{1} - z_{2}) + z_{1} (z_{3} - z_{2}) (z_{1} - z_{2}) \\ = (z_{2} - z_{3}) (z_{1} - z_{2}) (z_{3} - z_{1}) . \end{aligned}$ Dado que $z_{1}, z_{2}, z_{3}$ son distintos, entonces $z_{2} - z_{3} \neq 0$ , $z_{1} - z_{2} \neq 0$ y $z_{3} - z_{1} \neq 0$ , es decir, $a d - b c \neq 0$ , por lo que $T$ es una transformación de Möbius.

Veamos ahora que $T$ cumple (25.12). Es claro que:
$\begin{aligned} T (z_{1}) & = \frac{(z_{1} - z_{1}) (z_{2} - z_{3})}{(z_{1} - z_{3}) (z_{2} - z_{1})} = 0, \\ T (z_{2}) & = \frac{(z_{2} - z_{1}) (z_{2} - z_{3})}{(z_{2} - z_{3}) (z_{2} - z_{1})} = 1, \\ T (z_{3}) & = \frac{(z_{3} - z_{1}) (z_{2} - z_{3})}{(z_{3} - z_{3}) (z_{2} - z_{1})} = \infty . \end{aligned}$

Por otra parte, si alguno de los $z_{k}$ ’s es $\infty$ , definimos a $T (z)$ de modo que $z_{k}$ tienda a $\infty$ en (25.13). Sin pérdida de generalidad, supongamos que $z_{1} = \infty$ , entonces reescribimos el lado derecho de la igualdad en (25.13) como sigue:
$\frac{\frac{z}{z_{1}} - 1}{z - z_{3}} \frac{z_{2} - z_{3}}{\frac{z_{2}}{z_{1}} - 1},$ entonces:
$T (z) := lim_{z_{1} \to \infty} \frac{\frac{z}{z_{1}} - 1}{z - z_{3}} \frac{z_{2} - z_{3}}{\frac{z_{2}}{z_{1}} - 1} = \frac{z_{2} - z_{3}}{z - z_{3}} .$ Claramente $T$ es una transformación de Möbius pues $z_{3} - z_{2} \neq 0$ . Notemos que:
$T (\infty) = 0, T (z_{2}) = 1 y T (z_{3}) = \infty .$ Análogamente, si $z_{2} = \infty$ podemos definir:
$T (z) = \frac{z - z_{1}}{z - z_{3}},$ mientras que si $z_{3} = \infty$ definimos:
$T (z) = \frac{z - z_{1}}{z_{2} - z_{1}} .$ En ambos casos $T$ es una transformación de Möbius y se cumple (25.12).

El resultado anterior nos motiva a dar la siguiente:

Definición 25.6. (Razón cruzada.)
Sean $z_{1}, z_{2}, z_{3} \in C_{\infty}$ tres puntos distintos y sea $z \in C_{\infty}$ . La {\bf razón cruzada} de $z, z_{1}, z_{2}$ y $z_{3}$ , denotada como $(z; z_{1}, z_{2}, z_{3})$ , es el valor $T (z) \in C_{\infty}$ , donde $T$ es la única transformación de Möbius tal que $T (z_{1}) = 0$ , $T (z_{2}) = 1$ y $T (z_{3}) = \infty$ .

Observación 25.11.
De acuerdo con la proposición 25.8 es claro que:
$(z; z_{1}, z_{2}, z_{3}) = T (z) = {\begin{array}{lcc} \frac{(z - z_{1}) (z_{2} - z_{3})}{(z - z_{3}) (z_{2} - z_{1})} & si & z_{1}, z_{2}, z_{3} \in C, \\ \frac{z_{2} - z_{3}}{z - z_{3}} & si & z_{1} = \infty, \\ \frac{z - z_{1}}{z - z_{3}} & si & z_{2} = \infty, \\ \frac{z - z_{1}}{z_{2} - z_{1}} & si & z_{3} = \infty . \end{array}$

Ejemplo 25.7.
Determina el valor de las siguientes razones cruzadas.
a) $(z; 0, 1, \infty)$ .
b) $(z; 1, \infty, 0)$ .
c) $(z_{2}; z_{1}, z_{2}, z_{3})$ .
d) $(2; \infty, i, - 1)$ .

Solución. Tenemos que:
a) $(z; 0, 1, \infty) = \frac{z - 0}{1 - 0} = z .$ b)
$(z; 1, \infty, 0) = \frac{z - 1}{z - 0} = \frac{z - 1}{z} .$ c)
$(z_{2}; z_{1}, z_{2}, z_{3}) = \frac{(z_{2} - z_{1}) (z_{2} - z_{3})}{(z_{2} - z_{3}) (z_{2} - z_{1})} = 1.$ d)
$(2; \infty, i, - 1) = \frac{i - (- 1)}{2 - (- 1)} = \frac{1 + i}{3} .$

Ejemplo 25.8.
De acuerdo con la definición 25.6, la transformación de Möbius del ejemplo 25.6(b) puede escribirse como $T (z) = (z; 1, i, - 1)$ .

Corolario 25.4.
Sean $z_{1}, z_{2}, z_{3} \in C_{\infty}$ tres puntos distintos y $w_{1}, w_{2}, w_{3} \in C_{\infty}$ tres puntos distintos. Entonces, existe una única transformación de Möbius tal que:
$H (z_{1}) = w_{1}, H (z_{2}) = w_{2} y H (z_{3}) = w_{3} .$

Demostración. Dadas las hipótesis, sean $T (z) = (z; z_{1}, z_{2}, z_{3})$ y $S (w) = (w; w_{1}, w_{2}, w_{3})$ . Definimos $H = S^{- 1} \circ T$ , entonces es claro que:
$\begin{aligned} H (z_{1}) & = (S^{- 1} \circ T) (z_{1}) = S^{- 1} (T (z_{1})) = S^{- 1} (0) = w_{1}, \\ H (z_{2}) & = (S^{- 1} \circ T) (z_{2}) = S^{- 1} (T (z_{2})) = S^{- 1} (1) = w_{2}, \\ H (z_{3}) & = (S^{- 1} \circ T) (z_{3}) = S^{- 1} (T (z_{3})) = S^{- 1} (\infty) = w_{3} . \end{aligned}$ La unicidad se sigue del corolario 25.3.

Proposición 25.9.
Toda transformación de Möbius preserva la razón cruzada.

Demostración. Sea $T$ una transformación de Möbius y sean $z_{1}, z_{2}, z_{3} \in C_{\infty}$ tres puntos distintos. Veamos que:
$(z; z_{1}, z_{2}, z_{3}) = (T (z); T (z_{1}), T (z_{2}), T (z_{3})) .$

Sea $S (z) = (z; z_{1}, z_{2}, z_{3})$ . Definimos $H = S \circ T^{- 1}$ , la cual claramente es una transformación de Möbius. Tenemos que:
$\begin{aligned} H (T (z_{1})) & = S (z_{1}) = 0, \\ H (T (z_{2})) & = S (z_{2}) = 1, \\ H (T (z_{3})) & = S (z_{3}) = \infty, \end{aligned}$ por lo que, por la unicidad de la razón cruzada:
$H (z) = (z; T (z_{1}), T (z_{2}), T (z_{3})), \forall z \in C_{\infty} .$ Entonces:
$S (z) = H (T (z)) = (T (z); T (z_{1}), T (z_{2}), T (z_{3})), \forall z \in C_{\infty} .$

Observación 25.12.
Podemos reescribir el resultado anterior como:
$\frac{(z - z_{1}) (z_{2} - z_{3})}{(z - z_{3}) (z_{2} - z_{1})} = \frac{(w - w_{1}) (w_{2} - w_{3})}{(w - w_{3}) (w_{2} - w_{1})},$ donde $w = T (z)$ y $T$ es una transformación de Möbius. En caso de que algún $z_{k}$ ó algún $w_{k}$ , con $k = 1, 2, 3$ , sea igual a $\infty$ , entonces consideramos la definición de la observación 25.11.

Obtener una transformación de Möbius resulta sencillo mediante la razón cruzada.

Ejemplo 25.9.
Consideremos los incisos a) y c) del ejemplo 25.6.

Para el inciso a) queremos una transformación de Möbius tal que:
$- 1 \mapsto - i, 0 \mapsto 1 y 1 \mapsto i .$ Considerando la observación 25.12 tenemos que:
$\frac{(z - (- 1)) (0 - 1)}{(z - 1) (0 - (- 1))} = \frac{(w - (- i)) (1 - i)}{(w - i) (1 - (- i))},$ es decir:
$\frac{- (z + 1)}{z - 1} = \frac{(w + i) (1 - i)}{(w - i) (1 + i)},$ de donde:
$- 2 (z + i) = 2 w (z + i) ⟹ w = T (z) = \frac{i - z}{i + z} .$

Por otra parte, para el inciso c) queremos una transformación de Möbius tal que:
$1 \mapsto i, 0 \mapsto \infty y - 1 \mapsto 1.$ Considerando la observación 25.12 tenemos que:
$\frac{(z - 1) (0 - (- 1))}{(z - (- 1)) (0 - 1)} = \frac{w - i}{w - 1},$ es decir:
$\frac{z - 1}{- (z + 1)} = \frac{w - i}{w - 1},$ de donde:
$z (1 + i) + i - 1 = 2 z w ⟹ w = T (z) = \frac{(1 + i) z + (i - 1)}{2 z} .$

Ejemplo 25.10.
Determina la transformación de Möbius tal que:
$0 \mapsto i, 1 \mapsto 2 y - 1 \mapsto 4.$

Solución. Tenemos que:
$(z; 0, 1, - 1) = \frac{(z - 0) (1 - (- 1)}{(z - (- 1)) (1 - 0)} = \frac{2 z}{z + 1},$ mientras que:
$(w; i, 2, 4) = \frac{(w - i) (2 - 4)}{(w - 4) (2 - i)} = \frac{- 2 (w - i)}{(w - 4) (2 - i)},$ por lo que:
$\frac{2 z}{z + 1} = \frac{- 2 (w - i)}{(w - 4) (2 - i)},$ de donde, al resolver para $w$ tenemos:
$w [(6 - 2 i) z + 2] = [(16 - 6 i) z + 2 i] ⟹ w = T (z) = \frac{(16 - 6 i) z + 2 i}{(6 - 2 i) z + 2} .$

Corolario 25.5.
Sea $C \subset C_{\infty}$ una circunferencia (o una recta), sean $z_{1}, z_{2}, z_{3} \in C$ tres puntos distintos y $z \in C_{\infty}$ . Entonces $(z; z_{1}, z_{2}, z_{3}) \in R$ si y solo si $z \in C$ .

Demostración. Dadas las hipótesis, consideremos a $T (z) = (z; z_{1}, z_{2}, z_{3})$ . Dado que $T$ es una transformación de Möbius, del corolario 25.1 se sigue que $T$ mapea a $C$ en una circunferencia (o en una recta) en $C_{\infty}$ que pasa por $0, 1$ e $\infty$ , entonces $T (C) = R \cup {\infty}$ .

Por lo que:
$\begin{aligned} T (z) = (z; z_{1}, z_{2}, z_{3}) \in R & ⟺ T (z) \in R \cup {\infty} = T (C) \\ ⟺ z \in C . \end{aligned}$

Tarea moral

Completa la demostración de la proposición 25.1.
Realiza la demostración de la proposición 25.3.
Prueba la observación 25.7.
Demuestra los corolarios 25.1 y 25.3.
a) Muestra que la ecuación (25.6) se puede escribir de la forma: $2 A z \overset{―}{z} + (D - E i) z + (D + E i) \overset{―}{z} + 2 F = 0,$ donde $z = x + i y$ . b) Muestra que bajo la transformación inversión, $f (z) = 1 / z$ , la ecuación del inciso anterior se convierte en: $2 F w \overset{―}{w} + (D + E i) w + (D - E i) \overset{―}{w} + 2 A = 0.$ Después prueba que si $w = u + i v$ , entonces la ecuación anterior es la misma que la ecuación (25.9).
Hint: Utiliza coordenadas complejas conjugadas.
Determina de forma explícita la transformación de Möbius determinada por las siguientes correspondencias de puntos. Verifica tu resultado utilizando la razón cruzada.
a) $1 + i \mapsto 0$ , $2 \mapsto \infty$ , $0 \mapsto i - 1$ .
b) $0 \mapsto 1$ , $1 \mapsto 1 + i$ , $\infty \mapsto 2$ .
c) $\infty \mapsto 0$ , $1 + i \mapsto 1$ , $2 \mapsto \infty$ .
d) $- 2 \mapsto 1 - 2 i$ , $i \mapsto 0$ , $2 \mapsto 1 + 2 i$ .
e) $1 \mapsto 1$ , $i \mapsto 0$ , $- 1 \mapsto - 1$ .
Obtén los puntos fijos de las siguientes transformaciones.
a) $T (z) = \frac{i z + 2}{z + 1}$ .
b) $T (z) = i (\frac{z - i}{z + i})$ .
c) $T (z) = \frac{z}{z + 1}$ .
d) $T (z) = \frac{1 + i}{z + 1}$ .
a) Determina la transformación de Möbius tal que: $1 \mapsto 0, i \mapsto - 1 y 0 \mapsto - i .$
b) Considera la transformación $T$ del inciso anterior. ¿Cuál es la imagen de la circunferencia, en el plano $z$ , que pasa por los puntos $z_{1} = 1, z_{2} = i$ y $z_{3} = 0$ , bajo $T$ ? ¿Cuál es la imagen del interior de dicha circunferencia bajo $T$ ?
Prueba que si el origen es un punto fijo de una transformación de Möbius $T$ , entonces dicha transformación es de la forma: $w = T (z) = \frac{z}{c z + d}, d \neq 0.$
Muestra que la transformación: $w = T (z) = \frac{i z + 2}{4 z + i},$ envía el eje real, en el plano $z$ , en una circunferencia en el plano $w$ . Determina el centro y el radio de dicha circunferencia. ¿Cuál es el punto en el plano $z$ que es enviado en el centro de la circunferencia?
Determina la transformación de Möbius tal que envía el punto $i$ en el punto $- i$ y que fija el punto $1 + 2 i$ .

Más adelante…

En esta entrada hemos definido el concepto de transformación de Möbius o bilineal y establecimos algunos resultados elementales, en el estudio de estas transformaciones del plano complejo (extendido), las cuales resultan de suma importancia para entender de manera clara la geometría de algunas de las funciones complejas más elementales, como veremos en la siguiente entrada.

En general, las transformaciones de Möbius tienen muchas aplicaciones en el análisis complejo. Dejando de lado la aparente simplicidad en su definición, éstas transformaciones son el corazón de algunas áreas matemáticas modernas de investigación, por su conexión con las geometrías no Euclidianas como la geometría hiperbólica. De hecho, éstas transformaciones están estrechamente ligadas con la teoría de la relatividad de Einstein.

La siguiente entrada es la última de ésta segunda unidad y en ella abordaremos una alternativa básica para poder estudiar el comportamiento geométrico de las funciones complejas más elementales.

Entradas relacionadas

Ir a Variable Compleja I.
Entrada anterior del curso: Transformaciones del plano complejo $C$ .
Siguiente entrada del curso: Funciones complejas como transformaciones. Técnicas de graficación.