Álgebra Lineal II: Unicidad de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan y demostramos la existencia de dicha forma bajo ciertas hipótesis. Como corolario, quedó pensar cuál es la versión para matrices. En esta entrada enunciamos la versión para matrices (totalmente equivalente a la de transformaciones lineales) y nos enfocamos en mostrar la unicidad de la forma canónica de Jordan.

Unicidad de la forma canónica de Jordan

El siguiente teorema es totalmente análogo al enunciado en la entrada anterior. Recuerda que $\leq$ es un orden total fijo de $F$ (en $\mathbb{R}$, es el orden usual).

Teorema. Sea $A$ una matriz $M_n(F)$ cuyo polinomio característico $\chi_A(X)$ se divide en $F$. Entonces, existen únicos valores $\lambda_1\leq \ldots \leq \lambda_n$ en $F$ y únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} para los cuales $A$ es similar a la siguiente matriz de bloques de Jordan:

$$\begin{pmatrix} J_{\lambda_1,k_1} & 0 & \cdots & 0 \\ 0 & J_{\lambda_2,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{\lambda_d,k_d}\end{pmatrix}.$$

Usaremos esta versión para demostrar la unicidad, lo cual también implicará la unicidad para la versión de transformaciones lineales.

Mediante la demostración de existencia de la entrada anterior, llegamos a que si el polinomio característico de $A$ es

$$\chi_A(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r},$$

entonces $A$ es similar a una matriz conformada por matrices de bloques de Jordan $J_1,J_2,\ldots,J_r$, en donde cada $J_i$ es de tamaño $m_i$ y de bloques de Jordan de eigenvalor $\lambda_i$.

Si $A$ fuera similar a otra matriz $K$ de bloques de Jordan, podríamos agrupar por eigenvalores de los bloques $\kappa_1< \ldots < \kappa_s$ en matrices de bloques de Jordan tamaños $o_1,\ldots,o_s$, digamos $K_1,\ldots,K_s$. El polinomio característico de $K$ sería entonces

$$\chi_{K}(X)=(X-\kappa_1)^{o_1}(X-\kappa_2)^{o_2}\cdots(X-\kappa_s)^{o_s}.$$

Pero $K$ es similar a $A$, y entonces deben tener el mismo polinomio característico, así que conciden en raíces y multiplicidad. Esto demuestra que $r=s$ y como los $\lambda_i$ y los $\kappa_i$ están ordenados, también demuestra las igualdades $\lambda_i=\kappa_i$ y $m_i=o_i$ para todo $i\in\{1,\ldots,r\}.$

Sólo nos queda argumentar la igualdad entre cada $J_i$ y $K_i$ para $i\in\{1,\ldots,r\}$. Pero ambas una forma canónica de Jordan para la transformación nilpotente que se obtiene de restringir $T_{A-\lambda_i I}$ a $\ker(T_{A-\lambda_i I}^{m_i})$. Por la unicidad que demostramos para la forma canónica de Jordan para transformaciones nilpotentes, concluimos que $J_i=K_i$. Esto termina la demostración de la unicidad de la forma canónica de Jordan.

$\square$

Una receta para encontrar la forma canónica de Jordan

Ya con el teorema demostrado, ¿cómo juntamos todas las ideas para encontrar la forma canónica de Jordan de una matriz $A$ en $M_n(F)$ cuyo polinomio característico se divida en $F$? Podemos proceder como sigue.

  1. Encontramos el polinomio característico $\chi_A(X)$ y su factorización, digamos $$\chi_A(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r}.$$
  2. Nos enfocamos en encontrar las matrices de bloque de Jordan $J_i$ para cada eigenvalor $\lambda_i$. Sabemos que la matriz $J_i$ será de tamaño $m_i$.
  3. Para saber exactamente cuál matriz de bloques de Jordan es $J_i$, pensaremos en que tiene $b_1,b_2,\ldots,b_{m_i}$ bloques de Jordan de eigenvalor $\lambda_i$ de tamaños $1,2, \ldots,m_i$. Consideramos la matriz $A_i=A-\lambda_i I$. Los $b_1,\ldots,b_{m_i}$ son la solución al siguiente sistema de ecuaciones en las variables $x_1,\ldots,x_{m_i}$.
    \begin{align*}
    m_i&= 1\cdot x_1 + 2\cdot x_2 + 3 \cdot x_3 + \ldots + m_i \cdot x_{m_i}\\
    m_i-n+\text{rango}(A_i-\lambda_i I)&=0\cdot x_1 + 1\cdot x_2 + 2 \cdot x_3 + \ldots + (m_i-1) \cdot x_{m_i}\\
    m_i-n+\text{rango}({A_i-\lambda_i I}^2)&= 0 \cdot x_1 + 0 \cdot x_2 + 1 \cdot x_3 + \ldots + (m_i-2)\cdot x_{m_i}\\
    m_i-n+\text{rango}({A_i-\lambda_i I}^3)&= 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + (m_i-3)\cdot x_{m_i}\\
    &\vdots\\
    m_i-n+\text{rango}({A_i-\lambda_i I}^{m_i-1})&= 0\cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 + \ldots + 1 \cdot x_{m_i}.
    \end{align*}
  4. Juntamos todos los $J_i$ en una misma matriz y los ordenamos apropiadamente.

El paso número $3$ está motivado por lo que sabemos de las matrices nilpotentes, y es bueno que pienses por qué se estudia específicamente ese sistema de ecuaciones para cada eigenvalor $\lambda_i$ y multiplicidad $m_i$.

Ejemplo de obtener la forma canónica de Jordan

Veamos un ejemplo del procedimiento descrito en la sección anterior.

Ejemplo. Encontraremos la forma canónica de Jordan de la siguiente matriz: $$A=\begin{pmatrix}-226 & -10 & -246 & 39 & 246\\234 & 23 & 236 & -46 & -236\\-198 & -20 & -192 & 41 & 195\\-93 & 10 & -122 & 10 & 122\\-385 & -30 & -393 & 74 & 396\end{pmatrix}.$$

Con herramientas computacionales, podemos darnos cuenta de que el polinomio característico de esta matriz es $$\chi_A(X)=X^{5} – 11 X^{4} + 46 X^{3} – 90 X^{2} + 81 X- 27.$$

Este polinomio se puede factorizar como $$(X-1)^2(X-3)^3.$$ Así, la submatriz de bloques de Jordan $J_1$ de eigenvalor $1$ tendrá tamaño $2$ y la $J_3$ de eigenvalor $3$ tendrá tamaño $3$. Pero, ¿de qué tamaño son cada uno de los bloques de Jordan en cada una de estas matrices?

Para respondernos esto para $J_1$, notamos que sus bloques son de tamaño $1$ y $2$ solamente. Si hay $b_1$ bloques de tamaño $1$ y $b_2$ bloques de tamaño $2$, por la teoría desarrollada arriba tendremos:

\begin{align*}
b_1+2b_2&=2\\
b_2&=2-5+\text{rango}(A-I)=2-5+4=1.
\end{align*}

El rango de $A-I$ lo obtuvimos computacionalmente, pero recuerda que también puede ser obtenido con reducción gaussiana. Resolviendo el sistema, $b_2=1$ y entonces $b_1=0$. Concluimos que en $J_1$ hay un bloque de Jordan de tamaño $2$.

Para $J_3$, reciclemos las variables $b_i$ (para no introducir nuevas). Los bloques pueden ser de tamaño $1,2,3$. Supongamos que de estos tamaños respectivamente hay $b_1,b_2,b_3$ bloques. Los $b_i$ cumplen:

\begin{align*}
b_1+2b_2+3b_3&=3\\
b_2+2b_3&=3-5+\text{rango}(A-3I)=3-5+3=1\\
b_3&=3-5+\text{rango}((A-3I)^2)=3-5+2=0.
\end{align*}

Así, $b_3=0$, y en consecuencia $b_2=1$ y entonces $b_1=1$. Concluimos que $J_3$ tiene un bloque de tamaño $1$ y uno de tamaño $3$. Por lo tanto, la forma canónica de Jordan de $A$ es:

$$\begin{pmatrix} J_1 & 0 \\ 0 & J_3 \end{pmatrix} = \begin{pmatrix} J_{1,2} & 0 & 0 \\ 0 & J_{3,1} & 0 \\ 0 & 0 & J_{3,2} \end{pmatrix} = \begin{pmatrix}1 & 1 & 0 & 0 & 0\\0 & 1 & 0 & 0 & 0\\0 & 0 & 3 & 0 & 0\\0 & 0 & 0 & 3 & 1\\0 & 0 & 0 & 0 & 3\end{pmatrix}$$

$\triangle$

Otro problema sobre forma canónica de Jordan

La receta anterior funciona en general y da la forma canónica de Jordan. Esto es algo que probablemente en la práctica en aplicaciones no tendrás que hacer manualmente nunca, pues hay herramientas computacionales que te pueden ayudar. Sin embargo, es importante entender con profundidad el teorema y la receta de manera teórica, pues hay problemas conceptuales en los que no podrás usar herramientas computacionales. A continuación veremos un ejemplo.

Problema. Sea $A$ una matriz en $M_6(\mathbb{R})$ con polinomio característico $$\chi_A(X)=X^6-2X^4+X^2.$$

  • ¿Cuántas posibilidades hay para la forma canónica de Jordan de $A$?
  • Demuestra que si el rango de $A$ es $5$, entonces $A$ no es diagonalizable.

Solución. Podemos factorizar el polinomio característico de $A$ como sigue:

$$\chi_A(X)=X^2(X+1)^2(X-1)^2.$$

Así, la forma canónica de Jordan está conformada por una matriz de bloques de Jordan $J_0$ de eigenvalor $0$ y tamaño $2$; una $J_1$ de eigenvalor $1$ y tamaño $2$; y una $J_{-1}$ de eigenvalor $-1$ y tamaño $2$.

Cada $J_i$ tiene dos chances: o es un bloque de Jordan de tamaño $2$, o son dos bloques de Jordan de tamaño $1$. Así, en total tenemos $2\cdot 2 \cdot 2=8$ posibilidades.

Si $A$ es de rango $5$, entonces tendríamos en las cuentas de cantidad de bloques $b_1$ y $b_2$ para eigenvalor $0$ que

\begin{align*}
b_1+2b_2&=2\\
b_2&=2-6+\text{rango}(A)=2-6+5=1,
\end{align*}

de donde en $J_0$ tendría $1$ bloque de tamaño $2$ y ninguno de tamaño $1$. Si $A$ fuera diagonalizable, su diagonalización sería una forma canónica de Jordan donde para eigenvalor $0$ se tendrían $2$ bloques de tamaño $1$ y ninguno de tamaño $2$. Así, $A$ tendría dos formas canónicas de Jordan distintas, lo cual es imposible.

$\square$

Más adelante…

Con esta entrada terminamos de demostrar el teorema de la forma canónica de Jordan, uno de los teoremas más bonitos de álgebra lineal. ¿Te das cuenta de todo lo que utilizamos en su demostración? Forma matricial de transformaciones lineales, el teorema de Cayley-Hamilton, polinomio característico, subespacios estables, teoría de dualidad, sistemas de ecuaciones lineales, resultados auxiliares de polinomios, etc. Es un resultado verdaderamente integrador.

En la siguiente entrada, la última del curso, hablaremos de algunas de las consecuencias del teorema de la forma canónica de Jordan. Discutiremos cómo lo podemos utilizar para clasificar a las matrices por similaridad. Veremos una aplicación con respecto a una matriz y su transpuesta. También, esbozaremos un poco de por qué en cierto sentido el resultado no sólo vale para las matrices cuyo polinomio se divide sobre el campo, sino que para cualquier matriz. Con ello terminaremos el curso.

Tarea moral

  1. Calcula la forma canónica de Jordan $J$ de la matriz $$A=\begin{pmatrix} 1 & 0 & -3 \\ 1 & -1 & -6 \\ -1 & 2 & 5 \end{pmatrix}.$$ Además de encontrar $J$, encuentra de manera explícita una matriz invertible $P$ tal que $A=P^{-1}JP$.
  2. Calcula la forma canónica de Jordan de la matriz $$\begin{pmatrix} 1 & 1 & 0 & 0 \\ 0 & 1 & 2 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 2 \end{pmatrix}$$
  3. Explica y demuestra cómo obtener lo siguiente para una matriz de bloques de Jordan:
    • Su polinomio característico.
    • Su polinomio mínimo.
    • Su determinante.
    • Su traza.
    • Sus eigenespacios.
  4. Justifica con más detalle por qué la receta que se propone para calcular la forma canónica de Jordan en efecto funciona. Necesitarás varios de los argumentos que dimos en la entrada anterior.
  5. Demuestra que una matriz $A\in M_n(F)$ para la cual su polinomio característico se divide en $F$ es diagonalizable si y sólo si cada bloque de cada matriz de bloques de la forma canónica de Jordan tiene tamaño $1$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Existencia de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que para cualquier matriz nilpotente existe (y es única) una matriz similar muy sencilla, hecha por lo que llamamos bloques de Jordan de eigenvalor cero. Lo que haremos ahora es mostrar una versión análoga de este resultado para una familia mucho más grande de matrices. De hecho, en cierto sentido tendremos un resultado análogo para todas las matrices.

Pensando en ello, lo que haremos en esta entrada es lo siguiente. Primero, generalizaremos nuestra noción de bloques de Jordan para contemplar cualquier eigenvalor. Estudiaremos un poco de los bloques de Jordan. Luego, enunciaremos el teorema que esperamos probar. Finalmente, daremos el primer paso hacia su demostración. En la siguiente entrada terminaremos la demostración y hablaremos de aspectos prácticos para encontrar formas canónicas de Jordan.

Enunciado del teorema de la forma canónica de Jordan

A continuación definimos a los bloques de Jordan para cualquier eigenvalor y tamaño.

Definición. Sea $F$ un campo. El bloque de Jordan de eigenvalor $\lambda$ y tamaño $k$ es la matriz $J_{\lambda,k}$ en $M_k(F)$ cuyas entradas son todas $\lambda$, a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, $J_{\lambda,k}=[a_{ij}]$ con $$a_{ij}=\begin{cases} 1 & \text{si $j=i+1$}\\ \lambda & \text{si $i=j$} \\ 0 & \text{en otro caso.} \end{cases}$$

También podemos expresarlo de la siguiente manera:

$$J_{\lambda,k}=\begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 & 0 \\ 0 & \lambda & 1 & \cdots & 0 & 0 \\ 0 & 0 & \lambda & \cdots & 0 & 0 \\ & \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \cdots & \lambda & 1 \\ 0 & 0 & 0 & \cdots & 0 & \lambda \end{pmatrix},$$ en donde estamos pensando que la matriz es de $k\times k$.

Una última manera en la que nos convendrá pensar a $J_{\lambda,k}$ es en términos de los bloques de Jordan de eigenvalor cero: $J_{\lambda,k}=\lambda I_k + J_{0,k}$.

Definición. Una matriz de bloques de Jordan en $M_n(F)$ es una matriz diagonal por bloques en la que cada bloque en la diagonal es un bloque de Jordan.

Lo que nos gustaría demostrar es el siguiente resultado. En él, piensa en $\leq$ como algún orden total fijo de $F$ (para $\mathbb{R}$ es el orden usual, pero otros campos no necesariamente tienen un orden natural asociado).

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ sobre el campo $F$ y $T:V\to V$ una transformación lineal tal que $\chi_T(X)$ se divide sobre $F$. Entonces, existen únicos valores $\lambda_1\leq \ldots \leq \lambda_n$ en $F$ y únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques de Jordan:

$$\begin{pmatrix} J_{\lambda_1,k_1} & 0 & \cdots & 0 \\ 0 & J_{\lambda_2,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{\lambda_d,k_d}\end{pmatrix}.$$

Por supuesto, este teorema también tiene una versión matricial, la cuál tendrás que pensar cómo escribir.

Un teorema de descomposición de kernels

Ya tenemos uno de los ingredientes que necesitamos para dar la demostración de la existencia de la forma canónica de Jordan: su existencia para las transformaciones nilpotentes. Otro de los ingredientes que usaremos es el teorema de Cayley-Hamilton. El tercer ingrediente es un resultado de descoposición de kernels de transformaciones evaluadas en polinomios.

Proposición. Sea $V$ un espacio vectorial sobre $F$. Sea $T:V\to V$ una transformación lineal. Y sean $P_1(X),\ldots,P_r(X)$ polinomios en $F[x]$ cuyo máximo común divisor de cualesquiera dos de ellos es el polinomio $1$. Entonces, $$\ker((P_1P_2\cdots P_r)(T))=\bigoplus_{i=1}^r \ker(P_i(T)).$$

Demostración. Para cada $i\in \{1,2,\ldots,r\}$ consideraremos a $Q_i(X)$ como el polinomio que se obtiene de multiplicar a todos los polinomios dados, excepto $P_i(X)$. Y por comodidad, escribiremos $P(X)=(P_1\cdots P_r)(X)$. Notemos que entonces $P(X)=(Q_iP_i)(X)$ para cualquier $i\in\{1,2,\ldots,r\}$.

Primero probaremos un resultado polinomial auxiliar. Veremos que $Q_1(X),\ldots,Q_r(X)$ tienen como máximo común divisor al polinomio $1$. En caso de no ser así, un polinomio $D(X)$ no constante dividiría a todos ellos. Sin pérdida de generalidad, $D$ es irreducible (tomando, por ejemplo $D(X)$ de grado mínimo con esta propiedad). Como $D(X)$ es irreducible y divide a $Q_r(X)$, entonces debe dividir a alguno de los factores de $Q_r(X)$, que sin pérdida de generalidad (por ejemplo, reetiquetando), es $P_1(X)$. Pero $D(X)$ también divide a $Q_1(X)$, así que debe dividir a alguno de sus factores $P_2(X),\ldots,P_r(X)$, sin pérdida de generalidad a $P_2(X)$. Pero entonces $D(X)$ divide a $P_1(X)$ y $P_2(X)$, lo cual contradice las hipótesis. Así, $Q_1(X),\ldots,Q_r(X)$ tienen como máximo común divisor al polinomio $1$. Por el lema de Bézout para polinomios (ver tarea moral), existen entonces polinomios $R_1(X),\ldots,R_r(X)$ tales que

\begin{equation}
\label{eq:bezout}(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(X)=1.
\end{equation}

Estamos listos para pasar a los argumentos de álgebra lineal. Veamos primero que cualquier elemento en la suma de la derecha está en el kernel de $P(T)$. Tomemos $v=v_1+\ldots+v_r$ con $v_i\in \ker(P_i(T))$. Al aplicar $P$ obtenemos

\begin{align*}
P(v)&=P(v_1)+\ldots+P(v_r)\\
&=Q_1(P_1(v_1))+\ldots+Q_r(P_r(v_r))\\
&=0+\ldots+0=0.
\end{align*}

Esto muestra que $v\in \ker(P(T))$, de donde se obtiene la primera contención que nos interesa.

Veamos ahora la segunda contención, que $\ker(P(T))=\bigoplus_{i=1}^r \ker(P_i(T))$. Tomemos $v\in \ker(P(T))$. Al aplicar \eqref{eq:bezout} en $T$ y evaluar en $v$ obtenemos que

\begin{align*}
v&=\text{Id}(v)=(1)(T)(v)\\
&=(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(T)(v)\\
&=(R_1Q_1)(T)(v)+\ldots+(R_rQ_r)(T)(v).
\end{align*}

Pero esto justo expresa a $v$ como elemento de $\ker(P_i(T))$ pues para cada $i$ tenemos

\begin{align*}
P_i(T)((R_iQ_i)(T)(v))&=(P_iR_i Q_i )(T)(v)\\
&=(R_i Q_i P_i)(T)(v)\\
&=R_i(T)P(T)(v)\\
&=R_i(0)=0,
\end{align*}

de modo que expresamos a $v$ como suma de vectores en $\ker(P_1(T)),\ldots,\ker(P_r(T))$.

Ya demostramos la igualdad de conjuntos, pero recordemos que en la igualdad de suma directa hay otra cosa que hay que probar: que el cero tiene una forma única de expresarse como suma de elementos de cada subespacio (aquella en donde cada elemento es cero). Supongamos entonces que $$0=v_1+\ldots+v_r$$ con $v_i\in \ker(P_i(T))$ para cada $i$. Si aplicamos $Q_i$ en esta igualdad, como tiene todos los factores $P_j$ con $j\neq i$ obtenemos $$0=Q_i(0)=Q_i(v_i).$$

Por otro lado, al aplicar nuevamente \eqref{eq:bezout} en $T$ y evaluar en $v_i$

\begin{align*}
v_i&=\text{Id}(v_i)=(1)(T)(v_i)\\
&=(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(T)(v_i)\\
&=(R_1Q_1)(T)(v_1)+\ldots+(R_rQ_r)(T)(v_i)\\
&=(R_iQ_i)(T)(v_i)\\
&=0.
\end{align*}

De esta forma, en efecto tenemos que los espacios están en posición de suma directa, que era lo último que nos faltaba verificar.

$\square$

Existencia de la forma canónica de Jordan

Estamos listos para demostrar la existencia de la forma canónica de Jordan. Supongamos que $V$ es un espacio vectorial de dimensión finita $n$ sobre $F$ y que $T:V\to V$ es una transformación lineal cuyo polinomio característico se divide en $F[x]$. Sabemos entonces que es de la siguiente forma:

$$\chi_T(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r},$$

donde $\lambda_1,\ldots,\lambda_r$ son eigenvalores distintos de $T$ y $m_1,\ldots,m_r$ son las multiplicidades algebraicas respectivas de estos eigenvalores como raíces de $\chi_T(X)$.

Por el teorema de Cayley-Hamilton, sabemos que $\chi_T(T)=0$, de modo que $\ker(\chi_T(T))=V$. Por la proposición de descomposición de la sección anterior aplicada a los polinomios $P_i(X)=(X-\lambda_i)^{m_i}$ (verifica que son primos relativos dos a dos) para $i\in\{1,\ldots,r\}$ tenemos entonces que $$V=\bigoplus_{i=1}^r \ker((T-\lambda_i \text{id})^{m_i}).$$

Pero, ¿cómo es la transformación $T-\lambda_i \text{id}$ restringida a cada $\ker((T-\lambda_i \text{id})^{m_i})$? ¡Es nilpotente! Precisamente por construcción, $(T-\lambda_i \text{id})^{m_i}$ se anula totalmente en este kernel. Así, por la existencia de la forma canónica de Jordan para matrices nilpotentes, hay una base $\beta_i$ para cada $\ker((T-\lambda_i \text{id})^{m_i})$ tal que $T-\lambda_i \text{id}$ restringida a ese kernel tiene como forma matricial una matriz $J_i$ de bloques de Jordan de eigenvalor cero. Pero entonces $T$ (restringida a dicho kernel) tiene como forma matricial a $J_i+\lambda_i I_{m_i}$, que es una matriz de bloques de Jordan de eigenvalor $\lambda$.

Con esto terminamos: como $V$ es la suma directa de todos esos kernel, la unión de bases $\beta_1,\ldots,\beta_r$ es una base para la cual $T$ tiene como forma matricial a una matriz de bloques de Jordan.

$\square$

Más adelante…

Hemos demostrado la existencia de la forma canónica de Jordan, pero aún nos falta demostrar su unicidad. Además de esto, también necesitaremos un mejor procedimiento para encontrarla. Haremos eso en la siguiente entrada.

Tarea moral

  1. Enuncia el teorema de la forma canónica de Jordan versión matrices.
  2. Investiga más sobre el lema de Bézout para polinomios y cómo se demuestra. Después de esto, expresa al polinomio $1$ como combinación lineal de los polinomios $x^2-1, x^3+1, x^2+5x+4$.
  3. Verifica que los polinomios $P_i(X)=(X-\lambda_i)^{k_i}$ de la demostración de la existencia de la forma canónica de Jordan cumplen las hipótesis de la proposición de descomposición de kernels.
  4. Sea $F$ un campo y $r,s$ elementos en $F$. Sea $n$ un entero. Demuestra que los bloques de Jordan $J_{r,n}$ y $J_{s,n}$ en $M_n(F)$ conmutan.
  5. Siguiendo las ideas de la demostración de existencia, encuentra la forma canónica de Jordan de la matriz $$\begin{pmatrix} 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & 2 & 2 \\ 0 & 0 & 0 & 2 \end{pmatrix}.$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Espacios métricos de caminos

Por Lizbeth Fernández Villegas

Introducción

En las ideas más abstractas de espacios métricos, se relacionan dos puntos con un número mayor o igual que cero en los reales. Si bien, este número representa la distancia entre dos puntos, puede que en principio no esté muy claro cómo se originó esa distancia, o bien, qué camino se recorrió para llegar de un punto al otro y entonces sí, justificar de alguna forma, qué tan cerca o lejos están los puntos entre sí.
No obstante, hemos visto ejemplos de espacios métricos en los que sí fue un desplazamiento lo que inspiró la métrica definida, (como en la métrica del taxista, la del ascensor o la de las piezas de ajedrez). En esta sección observaremos que es posible definir una métrica en un conjunto a partir de la existencia de caminos que «conecten» a sus puntos. Comenzamos presentando una definición más general que la de los abiertos generados por una métrica:

Definición topología: Sea $X$ un conjunto, diremos que $\tau$ es una topología de $X$ si es una familia de subconjuntos de $X$ (que llamaremos abiertos) que satisface lo siguiente:
1) Los conjuntos $X$ y $\emptyset$ son abiertos.
2) La unión arbitraria de conjuntos abiertos $\underset{\alpha \in \mathbb{A}} {\cup} \, U_{\alpha}$ es un conjunto abierto.
3) La intersección finita de conjuntos abiertos $\underset{1\leq i \leq n}{\cap}U_i$ es un conjunto abierto.
Al conjunto $(X,\tau)$ lo llamaremos espacio topológico.
Ya que los abiertos de un espacio métrico satisfacen las condiciones anteriores, se puede concluir que un espacio métrico es también un espacio topológico.

Definición camino: Un camino en un espacio topológico $(X, \tau)$ es una función continua $\gamma: I \to X$ donde $I=[a,b] \subset \mathbb{R}$.

$\gamma$ es una función continua que conecta a $\gamma(a)$ con $\gamma(b)$

Definición estructura por caminos: Sea $(X, \tau)$ un espacio topológico. Una estructura por caminos $(\mathcal{C},L)$ en $X$ es una clase $\mathcal{C}$ de caminos en $X$, que llamaremos admisibles. Se les asocia una función $L: \mathcal{C} \to [0, \infty]$ que llamaremos longitud de caminos.

Cada camino $\gamma_0$ tiene una longitud $L(\gamma_0)$

La clase $\mathcal{C}$ satisface las siguientes condiciones:

1. $\mathcal{C}$ es cerrado bajo restricciones: Si $\gamma: [a,b] \to X$ es un camino admisible y $a \leq c \leq d \leq b,$ entonces la restricción de $\gamma$ en $[c,d]$, denotada como $\gamma |_{[c,d]} \,$ también es un camino admisible.

2. $\mathcal{C}$ es cerrado bajo concatenaciones de caminos: Si $\gamma: [a,c] \to X$ y $\gamma: [c,b] \to X$ son caminos admisibles, entonces también lo es $\gamma:[a,b] \to X =: \gamma |_{[a,c]} \cdot \gamma |_{[c,b]}$

3. $A$ es cerrado bajo reparametrizaciones lineales. Si $\gamma:[a,b] \to X$ es un camino admisible, una reparametrización $\psi:[c,d] \to X$ que represente la curva de la misma forma, también será un camino admisible.

Mientras que la función $L$ cumple que:

1. La longitud de caminos es aditiva: $$L(\gamma|[a,b])=L(\gamma|[a,c])+L(\gamma|[c,b])$$ para cualquier $c \in [a,b].$

2. Para un camino de longitud finita $\gamma:[a,b] \to X$ definimos $L(\gamma,a,t):= L(\gamma|[a,t])$. Entonces esta función es continua en $[a,b].$

3. Si $\gamma:[a,b] \to X$ es un camino admisible y $\phi:[c,d] \to X$ es una reparametrización de $\gamma$ entonces $L(\gamma)=L(\psi).$

Ahora definamos una distancia en el conjunto $X$ a partir de una estructura por caminos $(\mathcal{C},L)$. Para cualesquiera dos puntos $x,y \in X$ consideremos la longitud de todos los caminos que conectan a $x$ con $y$. El ínfimo de esas longitudes será la distancia entre ambos puntos, es decir:
$$d_L(x,y):=inf\{L(\gamma): \gamma:[a,b] \to X, \gamma \in \mathcal{C}, \gamma (a)=x , \gamma (b) =y \}$$
Si no existe un camino que conecte a $x$ con $y$ se define $d_L(x,y) = \infty$

Entonces $(X,d_L)$ es un espacio métrico, siendo $d_L$ la métrica inducida por la estructura por caminos $(\mathcal{C},L)$.

Definición espacio métrico de caminos: Un espacio métrico cuya métrica puede ser obtenida como la función distancia de una estructura por caminos es llamado espacio métrico de caminos. La distancia asociada recibe el nombre de métrica intrínseca.

Ejemplos

En el conjunto $\mathbb{R}^2$ considera los caminos que unen a cualesquiera dos puntos $x,y \in \mathbb{R}^2$ a través de la concatenación de segmentos que son paralelos a los ejes coordenados. Como ejemplo presentamos la siguiente imagen:

Caminos entre $x$ y $y$

Eso significa que la distancia $d_L(x,y)$ corresponderá al ínfimo de las longitudes de estos caminos. En este caso, el valor del ínfimo coincide con la longitud de los caminos que son de este estilo:

Caminos de longitud mínima

En la entrada Otros ejemplos de espacios métricos vimos que esta métrica es conocida como métrica del taxista.

No todos los espacios métricos de caminos tendrán siempre un camino cuya longitud coincida con la distancia de los puntos que une. Por ejemplo, considera el espacio $\mathbb{R}^2 \setminus \{(0,0)\}$ Si los caminos que conectan a los puntos $(-1,0)$ y $(1,0)$ están dados por la unión de los segmentos $\overline{(-1,0),(0,b)}$ y $\overline{(0,b),(1,0)}$ como muestra la siguiente imagen:

Es posible probar que el ínfimo de estas longitudes es $2$, sin embargo, no existe un camino que tenga a $2$ como longitud. La justificación de esta conclusión se deja como ejercicio al final de esta sección.

Definición estructura por caminos completa: Cuando para cualesquiera puntos $x,y \in X$ sí existe un camino admisible cuya longitud coincide con $d_L(x,y)$ diremos que tenemos una estructura por caminos completa. La métrica que induce recibe el nombre de métrica estrictamente intrínseca.

Un subespacio que es posible deducir de un espacio métrico de caminos es uno restringido a los caminos en un conjunto. Lo expresamos en la siguiente:

Definición estructura restringida: Sea $(\mathcal{C},L)$ una estructura por caminos de $X,$ entonces induce una estructura por caminos $(\mathcal{C}|_A,L|_A)$ en un conjunto $A \subset X$ donde $\mathcal{C}|_A$ consiste de todos los caminos de $\mathcal{C}$ cuya imagen está totalmente contenida en $A$ y la función $L|_A$ es la restricción de de $L$ en $\mathcal{C}|_A$.

Es posible que en la estructura restringida las distancias entre dos puntos no se preserven.

Ejemplo
La distancia usual $\mathbb{R}^3$ puede verse como un espacio métrico de caminos donde la distancia entre dos puntos $p$ y $q$ está dada por la longitud del segmento que los une.

La longitud del segmento $\overline{p,q}$ es el ínfimo.

Si restringimos este espacio al conjunto $A= \partial([0,1]\times [0,1] \times [0,1])$ representado por las caras de un cubo de aristas de medida $1$, podemos verificar que cuando dos puntos $p,q \in A$ están en la misma cara del cubo, la distancia restringida coincide con la de la métrica usual.

$p$ y $q$ en la misma cara del cubo

Pero cuando no es así, el segmento que los conecta no pertenece a $\mathcal{C}|_A$. En esta situación el “camino más corto” en $\mathbb{R}^3$ está dentro de las caras del cubo. Un camino que conecte a $p$ con $q$ tendrá distancia mayor. Se concluye que $d_{L_A}(x,y) \geq d_{L}(x,y).$

Puede haber caminos más cortos que no se heredan

Más adelante…

Conoceremos un tipo de funciones que, aunque no sean continuas, sí aproximan sus resultados a un número, ya sea superior o inferiormente. Este será el concepto de las funciones semicontinuas. Los espacios conocidos en esta sección serán útiles como ejemplos.

Tarea moral

  1. En el espacio $\mathbb{R}^2 \setminus \{(0,0)\}$ del ejemplo anterior, donde los caminos que conectan a los puntos $(-1,0)$ y $(1,0)$ están dados por la unión de los segmentos $\overline{(-1,0),(0,b)}$ y $\overline{(0,b),(1,0)}$. Prueba que el ínfimo de las longitudes de estos caminos es $2$ y que no existe un camino que cuya longitud sea $2.$
  2. Demuestra que las piezas de ajedrez vista en la entrada Otros ejemplos de espacios métricos inducen una métrica de caminos.
  3. ¿Es la métrica del ascensor, vista en Otros ejemplos de espacios métricos, una métrica de caminos?

Enlaces

Más conceptos de continuidad

Por Lizbeth Fernández Villegas

Introducción

Las funciones continuas resultan muy útiles al relacionar espacios métricos. Propiedades identificadas en el dominio pueden conservarse también en el contradominio y viceversa.

En esta sección presentaremos definiciones más específicas para funciones continuas que reúnen ciertas características. Si una función es aplicada a dos puntos, ¿qué ocurre con la distancia en los puntos del espacio en el que caen? Ya sabemos que podemos hacer la distancia muy cercana si se toma como referencia un punto donde la función es continua pero, ¿habrá casos donde existan funciones que restrinjan la distancia de un modo más general, para todos los puntos? Comencemos con la siguiente:

Definición homeomorfismo: Sea $\phi: X \to Y$ una función continua. Si además $\phi$ es biyectiva y su inversa $\phi^{-1}: Y \to X$ es continua, diremos que $\phi$ es un homeomorfismo. Dos espacios métricos $X$ y $Y$ son homeomorfos si existe un homeomorfismo entre ellos.

$X$ y $Y$ son homeomorfos

Dos espacios homeomorfos tienen, en principio, la misma cardinalidad. Como existe una función continua y de inversa continua, puntos que están cerca en un espacio métrico se conservarán cerca en el otro. Podemos pensar que los espacios homeomorfos tienen la misma forma, en el sentido de que es posible modificar continuamente uno para convertirlo en el otro.

Ejemplos:

Una circunferencia y el perímetro de un rectángulo son homeomorfos. Un homeomorfismo entre estos espacios está dado por la proyección (que es una función continua) de los puntos de la circunferencia en el rectángulo.

Una taza de café y una dona son homeomorfos en $\mathbb{R}^3.$ La siguiente imagen nos muestra la transformación de un espacio al otro a través de la aplicación de homeomorfismos.

Imagen: © Jonathan Gerhard

Proposición: Sean $(X,d_X), (Y,d_Y), (Z,d_Z)$ espacios métricos con $\phi: X \to Y$ y $\, \psi: Y \to Z$ funciones entre ellos. Las siguientes son propiedades de la composición de funciones:
a) Si $\phi$ y $\psi$ son continuas, entonces la composición $\psi \circ \phi: X \to Z$ es una función continua.


b) Si $\phi$ es un homeomorfismo, entonces $\psi$ es continua si y solo si la composición $\psi \circ \phi$ es continua.


c) Si $\psi$ es un homeomorfismo, entonces $\phi$ es continua si y solo si la composición $\psi \circ \phi$ es continua.

Demostración:
La prueba de a) se dejará como ejercicio al final de esta sección. Por lo pronto ya lo asumiremos válido.
Para probar b) nota que si $\phi$ es homeomorfismo entonces es continua y su función inversa $\phi^{-1}$ también lo es. A partir de a) concluimos que $\psi \circ \phi$ es continua si y solo si $(\psi \circ \phi)\circ\phi^{-1}= \psi$ es continua.
Para probar c) nota que si $\psi$ es homeomorfismo entonces es continua y su función inversa $\psi^{-1}$ también lo es. A partir de a) concluimos que $\psi \circ \phi$ es continua si y solo si $\psi^{-1}\circ(\psi \circ \phi)= \phi$ es continua.

Definición isometría. Sean $(X,d_X)$ y $(Y,d_Y)$ dos espacios métricos. Decimos que $\phi: X \to Y$ es una isometría si preserva distancias entre espacios, es decir, para toda $x,y \in X:$
$$d_X(x,y) = d_Y(\phi(x), \phi(y))$$

$\phi$ es una isometría

¿Puede una isometría ser un homeomorfismo? En principio sería necesario que sea biyectiva.

Proposición: Una isometría es una función inyectiva.
Demostración:
Sea $\phi: X \to Y$ una isometría y $x,y \in X$ tales que $\phi(x) = \phi(y)$ entonces $d_Y(\phi(x),\phi(y)) = 0$. Como $\phi$ es isometría, $d_X(x,y) = d_Y(\phi(x),\phi(y)) = 0$ por lo tanto $x = y.$
Se deja como ejercicio argumentar que si una isometría es suprayectiva, entonces es un homeomorfismo. Particularmente, en este caso diremos que los espacios son isométricos.

En la siguiente función las distancias en el espacio del contradominio estarán limitadas por las distancias del espacio del dominio y una constante $c \in \mathbb{R}:$

Definición función Lipschitz continua: Sea $\phi: X \to Y$. Si existe $c>0$ tal que para todo $x,y \in X, \,$ $d_Y(\phi(x), \phi(y)) \leq c \, d_X(x,y)$ diremos que $\phi$ es Lipschitz continua y que $c$ es constante de Lipschitz para $\phi$.

$\phi$ es Lipschitz continua

Proposición: Si la función $\phi$ es Lipschitz continua, entonces es continua.
Demostración:
Sea $\phi :X \to Y$ Lipschitz continua con constante de Lipschitz $c$, $x_0 \in X$ y $\varepsilon >0$. Si $\delta = \frac{\varepsilon}{c}$ entonces si $x$ es tal que $d_X(x,x_0) \leq \frac{\varepsilon}{c}$ se sigue que $d_Y(\phi(x_0), \phi(x)) \leq c \, d_X(x,x_0) \leq c \frac{\varepsilon}{c} = \varepsilon .$

El recíproco no es cierto. Se deja como ejercicio.

Definición equivalencia: Diremos que $\phi: X \to Y$ es una equivalencia si es Lipschitz continua y biyectiva y su inversa $\phi^{-1}:Y \to X$ también es Lipschitz continua.

$\phi$ es una equivalencia

Definición métricas equivalentes: Sean $d_1$ y $d_2$ dos métricas en el espacio métrico $X$. Diremos que $d_1$ y $d_2$ son equivalentes si la función identidad $I:(X,d_1) \to (X,d_2)$ es una equivalencia.

La métricas $d_1$ y $d_2$ son equivalentes

Asímismo, dos normas son equivalentes si las métricas inducidas por ellas son equivalentes. Podemos concluir también que si dos métricas son equivalentes, entonces ambas métricas generan los mismos conjuntos abiertos en el conjunto $X$, esto es, $A$ es abierto en $(X,d_1)$ si y solo si $A$ es abierto en $(X,d_2).$ ¿Por qué?

Ejemplos

En el conjunto $\mathbb{R}^n$ considera los puntos $x,y,z \in \mathbb R^n$, con $x=(x_{1},…,x_{n})$ y $y=(y_{1},…,y_{n}).$ Las siguientes métricas son equivalentes:

a) $d_{2}(x,y) = \sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2}$
b) $d_{\infty}(x,y) = max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}$
c) $d_{1}(x,y) = |x_{1}-y_{1}|+…+|x_{n}-y_{n}|$

Demostración:
Demostremos que $d_{2}$ y $d_{\infty}$ son métricas equivalentes.

\begin{align*}
(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2 &\leq n^2(max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\})^2\\
\sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2} &\leq n \, max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}\\
d_{2}(x,y) &\leq n \, d_{\infty}(x,y)
\end{align*}

Por otro lado

\begin{align*}
(max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\})^2 &\leq (x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2\\
max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\} &\leq \sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2}\\
d_{\infty}(x,y) &\leq d_{2}(x,y)
\end{align*}

Por lo tanto $d_{2}$ y $d_{\infty}$ son métricas equivalentes.

Ahora demostraremos que las métricas $d_{1}$ y $d_{\infty}$ son equivalentes.

\begin{align*}
d_1(x,y) &= |x_{1}-y_{1}|+…+|x_{n}-y_{n}| \\
&\leq n \, max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}\\
&= n \, d_{\infty}
\end{align*}

Por otro lado

\begin{align*}
d_{\infty} &= max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}\\
&\leq |x_{1}-y_{1}|+…+|x_{n}-y_{n}| \\
&= d_{1}(x,y)
\end{align*}

Por lo tanto las métricas $d_{1}$ y $d_{\infty}$ son equivalentes. Queda como ejercicio al lector demostrar que las métricas $d_1$ y $d_2$ son equivalentes. Nota que es posible concluirlo a partir de las equivalencias demostradas y la composición de funciones.

Para finalizar esta sección, presentamos dos normas no equivalentes:
Considera el espacio de funciones continuas $C^0[0,1]$, (que van del intervalo $[0,1] \subset \mathbb{R} \to \mathbb{R})$ con las normas:
\begin{align*}
\norm{f}_1&:= (\int_{0}^{1} |f(x)| \,dx), \\
\norm{f}_\infty&:= máx\{|f(x)|:0\leq x \leq 1 \}
\end{align*}

Veremos que no existe una función Lipschitz continua $\phi:(C^0[0,1],\norm{f}_\infty) \to (C^0[0,1],\norm{f}_1).$

El máximo siempre es $1$. El área bajo la curva, disminuye

Para cada $n \in \mathbb{N}$ considera la función $f_n(x) \in C^0[0,1]$ que a cada $x \in [0,1]$ asigna el punto $f_n(x) = x^{n-1}.$ La distancia que hay entre estas funciones y la función constante $0$ está dada por:
\begin{align*}
\norm{f_n}_1&:= (\int_{0}^{1} |f_n| \,dx) = \frac{1}{n}, \\
\norm{f_n}_\infty&:= máx\{|f_n|:0\leq x \leq 1 \} = 1
\end{align*}
No existe $c>0$ que satisfaga que para toda $n \in \mathbb{N}, \, \norm{f_n}_1 \leq c\norm{f_n}_\infty$ pues no es cierto que $\frac{1}{n}\leq c(1) =c$ para toda $n$. Por lo tanto no existe una función Lipschitz continua $\phi:(C^0[0,1],\norm{f}_\infty) \to (C^0[0,1],\norm{f}_1)$ y en conclusión, estas normas no son equivalentes

Más adelante…

Veremos que es posible definir un espacio métrico a partir de una familia de caminos que conecte puntos y de la longitud que estos caminos tienen. Observaremos la posibilidad de que varios caminos distintos conecten a los mismos dos puntos y si es posible rescatar alguna aproximación en funciones no continuas a través de un nuevo concepto: la semicontinuidad.

Tarea moral

  1. Demuestra que si $\phi$ y $\psi$ son continuas, entonces la composición $\psi \circ \phi: X \to Z$ es una función continua.
  2. Sea $\phi$ una isometría tal que es suprayectiva. Prueba que es también un homeomorfismo.
  3. Da un ejemplo de una función continua que no sea Lipschitz continua.
  4. Demuestra que una isometría es una equivalencia.
  5. Demuestra que las métricas $d_1(x,y) = |x_{1}-y_{1}|+…+|x_{n}-y_{n}|$ y $d_{2}(x,y) = \sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2}$ son equivalentes.

Enlaces

Funciones continuas en espacios métricos

Por Lizbeth Fernández Villegas

Introducción

Probablemente estés familiarizado con las funciones continuas de los cursos de cálculo. Esta noción se retoma para funciones entre espacios métricos. Diremos que una función entre espacios métricos $X$ y $Y,$ $f:X \to Y$ es continua en un punto $x_0$ de $X$ si para puntos que están «junto a» $x_0$ en $X$, los puntos correspondientes bajo la función $f$ también están junto a $f(x_0).$ Este tipo de funciones nos permite identificar propiedades entre los espacios métricos que relaciona. En esta entrada comenzaremos a explorar algunos resultados. Comencemos con la definición:

Definición función continua: Sean $(X,d_X)$ y $(Y,d_Y)$ dos espacios métricos. Diremos que una función $\phi: X \to Y$ es continua en el punto $x_0 \in X$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que para todo $x \in X$ si $d_X(x,x_0) < \delta$ entonces $d_Y(\phi(x), \phi(x_0))<\varepsilon$. Si $\phi:X \to Y$ es continua en cada punto de $A \subset X$, diremos que $\phi$ es continua en $A$.

$\phi$ es continua en $x_0$

Si comparas esta definición con la de la entrada anterior, Límite de una función, estarás de acuerdo en que una funcíon $\phi: X \to Y$ es continua en $x_0 \in X$ si
$$\underset{x \to x_0}{lim} \,\phi (x) \,=\phi(x_0)$$

Esta definición se puede expresar en términos de bolas abiertas como sigue: La función $\phi: X \to Y$ es continua en $x_0 \in X$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que $\phi(B_X(x_0,\delta)) \subset B_Y(\phi(x_0),\varepsilon)$. Observa que en la definición de continuidad, a diferencia de la de límite, no se excluye al punto de continuidad $x_0$.

La imagen de $B_X(x_0,\delta)$ cae dentro de la bola $B_Y(\phi(x_0), \varepsilon)$

Ejemplos

La función constante
Para cualesquiera dos espacios métricos $(X,d_X)$ y $(Y,d_Y)$ la función constante $\phi :X \to Y$ tal que para todo $x \in X, \, \phi (x) = c$ para algún $c \in Y$, es continua en cualquier punto de $X.$

Función constante

Demostración:
Sea $\varepsilon >0$ y $\delta =1$ (cualquier valor para delta funciona). Sea $x_0 \in X$. Entonces si $d_X(x_0,x)<1$ se cumple que $d_Y (\phi(x_0),\phi(x))=d_Y (c,c)=0< \varepsilon.$ Por lo tanto, $f$ es continua en $X.$

Cualquier función que tenga como dominio al espacio discreto es continua.

Demostración:
Sea $(X,d_{disc})$ el espacio discreto, $(Y,d_Y)$ espacio métrico y $\phi :X \to Y$. Sea $\varepsilon > 0$ y sea $x_0 \in X$. Entonces, si $\delta = 1$ (cualquier delta mayor que cero pero menor igual que $1$ funciona) tenemos:
$d_{disc}(x_0,x)< \delta$ entonces $x_0 = x\, $ así $\, d_Y(\phi (x_0),\phi(x))=d_Y(\phi(x_0),\phi(x_0))=0< \varepsilon.$ Por lo tanto, $\phi$ es continua en el espacio discreto $X$.

Si el dominio es el espacio discreto, $\phi$ es continua

La siguiente proposición expresa la continuidad en términos de sucesiones.
Proposición: La función $\phi: X \to Y$ es continua en $x_0 \in X$ si y solo si para toda sucesión $(x_n)_{n \in \mathbb{N}} \,$ que converge en $X$ se cumple que:
$$\underset{n \to \infty}{lim} \, \phi(x_n) \, =\,\phi(\underset{n \to \infty}{lim} \, x_n).$$ La demostración se deja como ejercicio. Te sugerimos comparar esta proposición con la que concluye el límite de una función a partir de sucesiones vista en Límite de una función.

Si $x_n \to x_0$ entonces $\phi(x_n) \to \phi(x_0)$

Las siguientes son propiedades de las funciones continuas:

Proposición: Sean $\phi, \psi: A \subset X \to \mathbb{C}$ funciones continuas en $x_0 \in X$, entonces:

a) $\phi(x) \pm \psi(x)$ es continua en $x_0$.
b) $\phi(x) \psi(x)$ es continua en $x_0$.
c) $\phi(x) / \psi(x)$ es continua en $x_0$ cuando $\psi(x_0) \neq 0$

La demostración se deja como ejercicio.

Proposición: Sean $\phi,\psi : A \subset X \to \mathbb{R}^n$ dos funciones continuas en $x_0 \in X$, entonces:
a)$(\phi \pm \psi)(x)$ es continua en $x_0$.
b)$(\phi \cdot \psi)(x)$ es continua en $x_0$.
c) $\lambda \phi (x)$ con $\lambda \in \mathbb{R}$ es continua en $x_0$.

La demostración se deja como ejercicio.

Antes de continuar, veamos con detenimiento la siguiente:
Definición imagen inversa: Sean $X$ y $Y$ dos conjuntos y $f:X \to Y$ una función entre ellos. Si $\, U \subset Y,$ diremos que la imagen inversa del subconjunto $U$, es el conjunto de todos los elementos de $X$ que bajo la función $f$ están en $U$. Se denota como $f^{-1}(U).$ Formalmente tenemos:
$$f^{-1}(U)=: \{x \in X : f(x) \in U\}$$

Nota: Ten cuidado de no confundir el concepto de imagen inversa $f^{-1}(U)$ (que es una forma de definir conjuntos en $X$ a partir de un conjunto en $Y$) con el concepto de la función inversa de $f$ que, aunque también se denota como $f^{-1},$ hace referencia a una función que se evalúa en puntos de $Y$ y solo existe cuando $f$ es biyectiva.

Ahora consideremos un conjunto $U_1 \subset X.$ La función $f$ define en $Y$ el conjunto $f(U_1)$. Si renombramos a este conjunto como $\, U_2 \,$ y buscamos identificar ahora la imagen inversa de este nuevo conjunto, ¿regresaremos al mismo conjunto $\, U_1$ del cual partimos? Observa que, dependiendo la naturaleza de la función, es posible que la imagen inversa nos arroje un conjunto más grande que el $\, U_1 \,$ inicial, sin embargo $\, U_1 \,$ estará contenido.

Los conjuntos $U_1$ y $f^{-1}(U_2)$ pueden ser diferentes

Esto ocurre porque es posible que haya puntos en $\, U_2 \,$ que son igualmente asignados por la función $f$ para puntos fuera de $\, U_1 \,$.

¿Bajo qué condiciones no pasaría esto?

Para finalizar esta sección, veamos las siguientes propiedades de las funciones continuas:

Proposición: Sean $X$ y $Y$ espacios métricos y $\phi:X \to Y$ una función. Las siguientes afirmaciones son equivalentes:

a) $\phi: X \to Y$ es continua.
b) Para todo subconjunto abierto $U \subset Y$, $\phi^{-1}(U)$ es un conjunto abierto en $X.$
c) Para todo subconjunto cerrado $V \subset Y$, $\phi^{-1}(V)$ es un conjunto cerrado en $X.$

Demostración:
Para probar a) $\Rightarrow$ b) considera $U \subset Y$ abierto y $\, x \in \phi^{-1}(U).$ Entonces existe $\varepsilon >0$ tal que $B_Y(\phi(x), \varepsilon) \subset U$, pues $U$ es abierto. Como $\phi$ es continua en $x$, entonces existe $\, \delta >0$ tal que $\phi (B_X(x, \delta)) \subset B_Y(\phi(x), \varepsilon) \subset U.$ Por lo tanto $B_X(x, \delta)) \subset \phi^{-1}(U) \,$ lo que demuestra que $\phi^{-1}(U)$ es un conjunto abierto en $X.$

Para probar b) $\Rightarrow$ c) considera $V \subset Y$ cerrado. Entonces $Y \setminus V$ es abierto en $Y$. Así $\phi ^{-1}(Y \setminus V)$ es abierto en $X$ de modo que $X \setminus \phi ^{-1}(Y \setminus V)$ es cerrado en $X$.
Nota que $\phi^{-1}(V)=X \setminus \phi ^{-1}(Y \setminus V)$ pues $x \in \phi^{-1}(V) \,$ $\Leftrightarrow$ $\phi(x) \in V$ $\Leftrightarrow$ $\phi(x) \notin (Y \setminus V)$ $\Leftrightarrow$ $x \notin \phi ^{-1}(Y \setminus V)$ $\Leftrightarrow$ $x \in X \setminus \phi ^{-1}(Y \setminus V)$. Por lo tanto $\phi^{-1}(V)$ es cerrado en $X.$

Para probar c) $\Rightarrow$ a) considera $x \in X$. Sea $\varepsilon>0$ entonces la bola $B_Y(\phi(x),\varepsilon)$ es abierto por lo tanto su complemento $Y \setminus B_Y(\phi(x),\varepsilon)$ es cerrado. Por hipótesis, la imagen inversa dada por $\phi^{-1}(B_Y(\phi(x),\varepsilon))$ es un conjunto cerrado en $X$. En consecuencia el complemento de $\phi^{-1}(B_Y(\phi(x),\varepsilon))$ es un conjunto abierto en $X$ que tiene a $x$ como elemento. Llamemos $U$ a este conjunto.

Como $U$ es abierto, existe $\delta>0$ tal que $B_X(x,\delta) \subset U$. Por lo tanto la imagen $f(B_X(x,\delta)) \subset B_Y(\phi(x),\varepsilon)$ lo que prueba que la función $\phi$ es continua en $x$. Como $x$ fue arbitrario, se concluye que $\phi$ es continua en el espacio $X$.

Más adelante…

Veremos cómo la existencia de funciones continuas entre dos espacios muestra propiedades que se conservan en ambos. Ya no hablaremos solo de la cercanía a los puntos, sino que haremos esa distancia más específica y comparable a la registrada en el espacio del dominio. Conoceremos así a los espacios isomorfos y homeomorfos.

Tarea moral

  1. Demuestra que la función $\phi: X \to Y$ es continua en $x_0 \in X$ si y solo si para toda sucesión $(x_n)_{n \in \mathbb{N}}$ que converge en $X$ se cumple que:
    $$\underset{n \to \infty}{lim} \, f(x_n) \, =\,f(\underset{n \to \infty}{lim} \, x_n)$$.
  2. Demuestra que si $\phi, \psi: A \subset X \to \mathbb{C}$ son funciones continuas en $x_0 \in X$, entonces:
    a) $\phi(x) \pm \psi(x)$ es continua en $x_0$.
    b) $\phi(x) \psi(x)$ es continua en $x_0$.
    c) $\phi(x) / \psi(x)$ es continua en $x_0$ cuando $\psi(x_0) \neq 0$
  3. Demuestra que si $\phi,\psi : A \subset X \to \mathbb{R}^n$ son dos funciones continuas en $x_0 \in X$, entonces:
    a)$(\phi \pm \psi)(x)$ es continua en $x_0$.
    b)$(\phi \cdot \psi)(x)$ es continua en $x_0$.
    c) $\lambda \phi (x)$ con $\lambda \in \mathbb{R}$ es continua en $x_0$.
  4. Usa la última proposición de esta sección para probar que cualquier función que tenga como dominio al espacio discreto es continua.
  5. ¿Es posible concluir que cualquier función que tenga como contradominio al espacio discreto es continua?

Enlaces