Álgebra Lineal II: Existencia de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que para cualquier matriz nilpotente existe (y es única) una matriz similar muy sencilla, hecha por lo que llamamos bloques de Jordan de eigenvalor cero. Lo que haremos ahora es mostrar una versión análoga de este resultado para una familia mucho más grande de matrices. De hecho, en cierto sentido tendremos un resultado análogo para todas las matrices.

Pensando en ello, lo que haremos en esta entrada es lo siguiente. Primero, generalizaremos nuestra noción de bloques de Jordan para contemplar cualquier eigenvalor. Estudiaremos un poco de los bloques de Jordan. Luego, enunciaremos el teorema que esperamos probar. Finalmente, daremos el primer paso hacia su demostración. En la siguiente entrada terminaremos la demostración y hablaremos de aspectos prácticos para encontrar formas canónicas de Jordan.

Enunciado del teorema de la forma canónica de Jordan

A continuación definimos a los bloques de Jordan para cualquier eigenvalor y tamaño.

Definición. Sea $F$ un campo. El bloque de Jordan de eigenvalor $\lambda$ y tamaño $k$ es la matriz $J_{\lambda,k}$ en $M_k(F)$ cuyas entradas son todas $\lambda$, a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, $J_{\lambda,k}=[a_{ij}]$ con $$a_{ij}=\begin{cases} 1 & \text{si $j=i+1$}\\ \lambda & \text{si $i=j$} \\ 0 & \text{en otro caso.} \end{cases}$$

También podemos expresarlo de la siguiente manera:

$$J_{\lambda,k}=\begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 & 0 \\ 0 & \lambda & 1 & \cdots & 0 & 0 \\ 0 & 0 & \lambda & \cdots & 0 & 0 \\ & \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \cdots & \lambda & 1 \\ 0 & 0 & 0 & \cdots & 0 & \lambda \end{pmatrix},$$ en donde estamos pensando que la matriz es de $k\times k$.

Una última manera en la que nos convendrá pensar a $J_{\lambda,k}$ es en términos de los bloques de Jordan de eigenvalor cero: $J_{\lambda,k}=\lambda I_k + J_{0,k}$.

Definición. Una matriz de bloques de Jordan en $M_n(F)$ es una matriz diagonal por bloques en la que cada bloque en la diagonal es un bloque de Jordan.

Lo que nos gustaría demostrar es el siguiente resultado. En él, piensa en $\leq$ como algún orden total fijo de $F$ (para $\mathbb{R}$ es el orden usual, pero otros campos no necesariamente tienen un orden natural asociado).

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ sobre el campo $F$ y $T:V\to V$ una transformación lineal tal que $\chi_T(X)$ se divide sobre $F$. Entonces, existen únicos valores $\lambda_1\leq \ldots \leq \lambda_n$ en $F$ y únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques de Jordan:

$$\begin{pmatrix} J_{\lambda_1,k_1} & 0 & \cdots & 0 \\ 0 & J_{\lambda_2,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{\lambda_d,k_d}\end{pmatrix}.$$

Por supuesto, este teorema también tiene una versión matricial, la cuál tendrás que pensar cómo escribir.

Un teorema de descomposición de kernels

Ya tenemos uno de los ingredientes que necesitamos para dar la demostración de la existencia de la forma canónica de Jordan: su existencia para las transformaciones nilpotentes. Otro de los ingredientes que usaremos es el teorema de Cayley-Hamilton. El tercer ingrediente es un resultado de descoposición de kernels de transformaciones evaluadas en polinomios.

Proposición. Sea $V$ un espacio vectorial sobre $F$. Sea $T:V\to V$ una transformación lineal. Y sean $P_1(X),\ldots,P_r(X)$ polinomios en $F[x]$ cuyo máximo común divisor de cualesquiera dos de ellos es el polinomio $1$. Entonces, $$\ker((P_1P_2\cdots P_r)(T))=\bigoplus_{i=1}^r \ker(P_i(T)).$$

Demostración. Para cada $i\in \{1,2,\ldots,r\}$ consideraremos a $Q_i(X)$ como el polinomio que se obtiene de multiplicar a todos los polinomios dados, excepto $P_i(X)$. Y por comodidad, escribiremos $P(X)=(P_1\cdots P_r)(X)$. Notemos que entonces $P(X)=(Q_iP_i)(X)$ para cualquier $i\in\{1,2,\ldots,r\}$.

Primero probaremos un resultado polinomial auxiliar. Veremos que $Q_1(X),\ldots,Q_r(X)$ tienen como máximo común divisor al polinomio $1$. En caso de no ser así, un polinomio $D(X)$ no constante dividiría a todos ellos. Sin pérdida de generalidad, $D$ es irreducible (tomando, por ejemplo $D(X)$ de grado mínimo con esta propiedad). Como $D(X)$ es irreducible y divide a $Q_r(X)$, entonces debe dividir a alguno de los factores de $Q_r(X)$, que sin pérdida de generalidad (por ejemplo, reetiquetando), es $P_1(X)$. Pero $D(X)$ también divide a $Q_1(X)$, así que debe dividir a alguno de sus factores $P_2(X),\ldots,P_r(X)$, sin pérdida de generalidad a $P_2(X)$. Pero entonces $D(X)$ divide a $P_1(X)$ y $P_2(X)$, lo cual contradice las hipótesis. Así, $Q_1(X),\ldots,Q_r(X)$ tienen como máximo común divisor al polinomio $1$. Por el lema de Bézout para polinomios (ver tarea moral), existen entonces polinomios $R_1(X),\ldots,R_r(X)$ tales que

\begin{equation}
\label{eq:bezout}(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(X)=1.
\end{equation}

Estamos listos para pasar a los argumentos de álgebra lineal. Veamos primero que cualquier elemento en la suma de la derecha está en el kernel de $P(T)$. Tomemos $v=v_1+\ldots+v_r$ con $v_i\in \ker(P_i(T))$. Al aplicar $P$ obtenemos

\begin{align*}
P(v)&=P(v_1)+\ldots+P(v_r)\\
&=Q_1(P_1(v_1))+\ldots+Q_r(P_r(v_r))\\
&=0+\ldots+0=0.
\end{align*}

Esto muestra que $v\in \ker(P(T))$, de donde se obtiene la primera contención que nos interesa.

Veamos ahora la segunda contención, que $\ker(P(T))=\bigoplus_{i=1}^r \ker(P_i(T))$. Tomemos $v\in \ker(P(T))$. Al aplicar \eqref{eq:bezout} en $T$ y evaluar en $v$ obtenemos que

\begin{align*}
v&=\text{Id}(v)=(1)(T)(v)\\
&=(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(T)(v)\\
&=(R_1Q_1)(T)(v)+\ldots+(R_rQ_r)(T)(v).
\end{align*}

Pero esto justo expresa a $v$ como elemento de $\ker(P_i(T))$ pues para cada $i$ tenemos

\begin{align*}
P_i(T)((R_iQ_i)(T)(v))&=(P_iR_i Q_i )(T)(v)\\
&=(R_i Q_i P_i)(T)(v)\\
&=R_i(T)P(T)(v)\\
&=R_i(0)=0,
\end{align*}

de modo que expresamos a $v$ como suma de vectores en $\ker(P_1(T)),\ldots,\ker(P_r(T))$.

Ya demostramos la igualdad de conjuntos, pero recordemos que en la igualdad de suma directa hay otra cosa que hay que probar: que el cero tiene una forma única de expresarse como suma de elementos de cada subespacio (aquella en donde cada elemento es cero). Supongamos entonces que $$0=v_1+\ldots+v_r$$ con $v_i\in \ker(P_i(T))$ para cada $i$. Si aplicamos $Q_i$ en esta igualdad, como tiene todos los factores $P_j$ con $j\neq i$ obtenemos $$0=Q_i(0)=Q_i(v_i).$$

Por otro lado, al aplicar nuevamente \eqref{eq:bezout} en $T$ y evaluar en $v_i$

\begin{align*}
v_i&=\text{Id}(v_i)=(1)(T)(v_i)\\
&=(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(T)(v_i)\\
&=(R_1Q_1)(T)(v_1)+\ldots+(R_rQ_r)(T)(v_i)\\
&=(R_iQ_i)(T)(v_i)\\
&=0.
\end{align*}

De esta forma, en efecto tenemos que los espacios están en posición de suma directa, que era lo último que nos faltaba verificar.

$\square$

Existencia de la forma canónica de Jordan

Estamos listos para demostrar la existencia de la forma canónica de Jordan. Supongamos que $V$ es un espacio vectorial de dimensión finita $n$ sobre $F$ y que $T:V\to V$ es una transformación lineal cuyo polinomio característico se divide en $F[x]$. Sabemos entonces que es de la siguiente forma:

$$\chi_T(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r},$$

donde $\lambda_1,\ldots,\lambda_r$ son eigenvalores distintos de $T$ y $m_1,\ldots,m_r$ son las multiplicidades algebraicas respectivas de estos eigenvalores como raíces de $\chi_T(X)$.

Por el teorema de Cayley-Hamilton, sabemos que $\chi_T(T)=0$, de modo que $\ker(\chi_T(T))=V$. Por la proposición de descomposición de la sección anterior aplicada a los polinomios $P_i(X)=(X-\lambda_i)^{m_i}$ (verifica que son primos relativos dos a dos) para $i\in\{1,\ldots,r\}$ tenemos entonces que $$V=\bigoplus_{i=1}^r \ker((T-\lambda_i \text{id})^{m_i}).$$

Pero, ¿cómo es la transformación $T-\lambda_i \text{id}$ restringida a cada $\ker((T-\lambda_i \text{id})^{m_i})$? ¡Es nilpotente! Precisamente por construcción, $(T-\lambda_i \text{id})^{m_i}$ se anula totalmente en este kernel. Así, por la existencia de la forma canónica de Jordan para matrices nilpotentes, hay una base $\beta_i$ para cada $\ker((T-\lambda_i \text{id})^{m_i})$ tal que $T-\lambda_i \text{id}$ restringida a ese kernel tiene como forma matricial una matriz $J_i$ de bloques de Jordan de eigenvalor cero. Pero entonces $T$ (restringida a dicho kernel) tiene como forma matricial a $J_i+\lambda_i I_{m_i}$, que es una matriz de bloques de Jordan de eigenvalor $\lambda$.

Con esto terminamos: como $V$ es la suma directa de todos esos kernel, la unión de bases $\beta_1,\ldots,\beta_r$ es una base para la cual $T$ tiene como forma matricial a una matriz de bloques de Jordan.

$\square$

Más adelante…

Hemos demostrado la existencia de la forma canónica de Jordan, pero aún nos falta demostrar su unicidad. Además de esto, también necesitaremos un mejor procedimiento para encontrarla. Haremos eso en la siguiente entrada.

Tarea moral

  1. Enuncia el teorema de la forma canónica de Jordan versión matrices.
  2. Investiga más sobre el lema de Bézout para polinomios y cómo se demuestra. Después de esto, expresa al polinomio $1$ como combinación lineal de los polinomios $x^2-1, x^3+1, x^2+5x+4$.
  3. Verifica que los polinomios $P_i(X)=(X-\lambda_i)^{k_i}$ de la demostración de la existencia de la forma canónica de Jordan cumplen las hipótesis de la proposición de descomposición de kernels.
  4. Sea $F$ un campo y $r,s$ elementos en $F$. Sea $n$ un entero. Demuestra que los bloques de Jordan $J_{r,n}$ y $J_{s,n}$ en $M_n(F)$ conmutan.
  5. Siguiendo las ideas de la demostración de existencia, encuentra la forma canónica de Jordan de la matriz $$\begin{pmatrix} 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & 2 & 2 \\ 0 & 0 & 0 & 2 \end{pmatrix}.$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Espacios métricos de caminos

Por Lizbeth Fernández Villegas

$ \textit{ MATERIAL EN REVISIÓN}$

El contenido de esta sección corresponde al artículo

Solís, DA, et.al, Abstraction and Application de la Universidad Autónoma de Yucatán, De la Geometría Riemanniana a los Espacios de Alexandrov I. Estructuras por Caminos y Métricas Inducidas: UADY, Mérida, 2015, págs 18-41.

Introducción

En las ideas más abstractas de espacios métricos, se relacionan dos puntos con un número mayor o igual que cero en los reales. Si bien, este número representa la distancia entre dos puntos, puede que en principio no esté muy claro cómo se originó esa distancia, o bien, qué camino se recorrió para llegar de un punto al otro y entonces sí, justificar de alguna forma, qué tan cerca o lejos están los puntos entre sí.
No obstante, hemos visto ejemplos de espacios métricos en los que sí fue un desplazamiento lo que inspiró la métrica definida, (como en la métrica del taxista, la del ascensor o la de las piezas de ajedrez). En esta sección observaremos que es posible definir una métrica en un conjunto a partir de la existencia de caminos que «conecten» a sus puntos. Comenzamos presentando una definición más general que la de los abiertos generados por una métrica:

Definición. Topología. Sea $X$ un conjunto, diremos que $\tau$ es una topología de $X$ si es una familia de subconjuntos de $X$ (que llamaremos abiertos) que satisface lo siguiente:
1) Los conjuntos $X$ y $\emptyset$ son abiertos.
2) La unión arbitraria de conjuntos abiertos $\underset{\alpha \in \mathbb{A}} {\cup} \, U_{\alpha}$ es un conjunto abierto.
3) La intersección finita de conjuntos abiertos $\underset{1\leq i \leq n}{\cap}U_i$ es un conjunto abierto.
Al conjunto $(X,\tau)$ lo llamaremos espacio topológico.
Ya que los abiertos de un espacio métrico satisfacen las condiciones anteriores, se puede concluir que un espacio métrico es también un espacio topológico.

Definición. Camino. Un camino en un espacio topológico $(X, \tau)$ es una función continua $\gamma: I \to X$ donde $I=[a,b] \subset \mathbb{R}$.

$\gamma$ es una función continua que conecta a $\gamma(a)$ con $\gamma(b)$

Definición. Estructura por caminos. Sea $(X, \tau)$ un espacio topológico. Una estructura por caminos $(\mathcal{C},L)$ en $X$ es una clase $\mathcal{C}$ de caminos en $X$, que llamaremos admisibles. Se les asocia una función $L: \mathcal{C} \to [0, \infty]$ que llamaremos longitud de caminos.

Cada camino $\gamma_0$ tiene una longitud $L(\gamma_0)$

La clase $\mathcal{C}$ satisface las siguientes condiciones:

1. $\mathcal{C}$ es cerrado bajo restricciones: Si $\gamma: [a,b] \to X$ es un camino admisible y $a \leq c \leq d \leq b,$ entonces la restricción de $\gamma$ en $[c,d]$, denotada como $\gamma |_{[c,d]} \,$ también es un camino admisible.

2. $\mathcal{C}$ es cerrado bajo concatenaciones de caminos: Si $\gamma: [a,c] \to X$ y $\gamma: [c,b] \to X$ son caminos admisibles, entonces también lo es $\gamma:[a,b] \to X =: \gamma |_{[a,c]} \cdot \gamma |_{[c,b]}$

3. $A$ es cerrado bajo reparametrizaciones lineales. Si $\gamma:[a,b] \to X$ es un camino admisible, una reparametrización $\psi:[c,d] \to X$ que represente la curva de la misma forma, también será un camino admisible.

Mientras que la función $L$ cumple que:

1. La longitud de caminos es aditiva: $$L(\gamma|[a,b])=L(\gamma|[a,c])+L(\gamma|[c,b])$$ para cualquier $c \in [a,b].$

2. Para un camino de longitud finita $\gamma:[a,b] \to X$ definimos $L(\gamma,a,t):= L(\gamma|[a,t])$. Entonces esta función es continua en $[a,b].$

3. Si $\gamma:[a,b] \to X$ es un camino admisible y $\phi:[c,d] \to X$ es una reparametrización de $\gamma$ entonces $L(\gamma)=L(\psi).$

Ahora definamos una distancia en el conjunto $X$ a partir de una estructura por caminos $(\mathcal{C},L)$. Para cualesquiera dos puntos $x,y \in X$ consideremos la longitud de todos los caminos que conectan a $x$ con $y$. El ínfimo de esas longitudes será la distancia entre ambos puntos, es decir:
$$d_L(x,y):=inf\{L(\gamma): \gamma:[a,b] \to X, \gamma \in \mathcal{C}, \gamma (a)=x , \gamma (b) =y \}$$
Si no existe un camino que conecte a $x$ con $y$ se define $d_L(x,y) = \infty$

Entonces $(X,d_L)$ es un espacio métrico, siendo $d_L$ la métrica inducida por la estructura por caminos $(\mathcal{C},L)$.

Definición. Espacio métrico de caminos. Un espacio métrico cuya métrica puede ser obtenida como la función distancia de una estructura por caminos es llamado espacio métrico de caminos. La distancia asociada recibe el nombre de métrica intrínseca.

Ejemplos

En el conjunto $\mathbb{R}^2$ considera los caminos que unen a cualesquiera dos puntos $x,y \in \mathbb{R}^2$ a través de la concatenación de segmentos que son paralelos a los ejes coordenados. Como ejemplo presentamos la siguiente imagen:

Caminos entre $x$ y $y$

Eso significa que la distancia $d_L(x,y)$ corresponderá al ínfimo de las longitudes de estos caminos. En este caso, el valor del ínfimo coincide con la longitud de los caminos que son de este estilo:

Caminos de longitud mínima

En la entrada Otros ejemplos de espacios métricos vimos que esta métrica es conocida como métrica del taxista.

No todos los espacios métricos de caminos tendrán siempre un camino cuya longitud coincida con la distancia de los puntos que une. Por ejemplo, considera el espacio $\mathbb{R}^2 \setminus \{(0,0)\}$ Si los caminos que conectan a los puntos $(-1,0)$ y $(1,0)$ están dados por la unión de los segmentos $\overline{(-1,0),(0,b)}$ y $\overline{(0,b),(1,0)}$ como muestra la siguiente imagen:

Es posible probar que el ínfimo de estas longitudes es $2$, sin embargo, no existe un camino que tenga a $2$ como longitud. La justificación de esta conclusión se deja como ejercicio al final de esta sección.

Definición. Estructura por caminos completa. Cuando para cualesquiera puntos $x,y \in X$ sí existe un camino admisible cuya longitud coincide con $d_L(x,y)$ diremos que tenemos una estructura por caminos completa. La métrica que induce recibe el nombre de métrica estrictamente intrínseca.

Un subespacio que es posible deducir de un espacio métrico de caminos es uno restringido a los caminos en un conjunto. Lo expresamos en la siguiente:

Definición. Estructura restringida. Sea $(\mathcal{C},L)$ una estructura por caminos de $X,$ entonces induce una estructura por caminos $(\mathcal{C}|_A,L|_A)$ en un conjunto $A \subset X$ donde $\mathcal{C}|_A$ consiste de todos los caminos de $\mathcal{C}$ cuya imagen está totalmente contenida en $A$ y la función $L|_A$ es la restricción de de $L$ en $\mathcal{C}|_A$.

Es posible que en la estructura restringida las distancias entre dos puntos no se preserven.

Ejemplo
La distancia usual $\mathbb{R}^3$ puede verse como un espacio métrico de caminos donde la distancia entre dos puntos $p$ y $q$ está dada por la longitud del segmento que los une.

La longitud del segmento $\overline{p,q}$ es el ínfimo.

Si restringimos este espacio al conjunto $A= \partial([0,1]\times [0,1] \times [0,1])$ representado por las caras de un cubo de aristas de medida $1$, podemos verificar que cuando dos puntos $p,q \in A$ están en la misma cara del cubo, la distancia restringida coincide con la de la métrica usual.

$p$ y $q$ en la misma cara del cubo

Pero cuando no es así, el segmento que los conecta no pertenece a $\mathcal{C}|_A$. En esta situación el “camino más corto” en $\mathbb{R}^3$ está dentro de las caras del cubo. Un camino que conecte a $p$ con $q$ tendrá distancia mayor. Se concluye que $d_{L_A}(x,y) \geq d_{L}(x,y).$

Puede haber caminos más cortos que no se heredan

Más adelante…

Conoceremos sucesiones cuyos elementos se van aproximando de manera arbitraria pero que no necesariamente convergen. Veremos bajo qué condiciones sí se puede asegurar la convergencia. Esto incentivará un nuevo concepto, el de los espacios métricos completos.

Tarea moral

  1. En el espacio $\mathbb{R}^2 \setminus \{(0,0)\}$ del ejemplo anterior, donde los caminos que conectan a los puntos $(-1,0)$ y $(1,0)$ están dados por la unión de los segmentos $\overline{(-1,0),(0,b)}$ y $\overline{(0,b),(1,0)}$. Prueba que el ínfimo de las longitudes de estos caminos es $2$ y que no existe un camino que cuya longitud sea $2.$
  2. Demuestra que las piezas de ajedrez vista en la entrada Otros ejemplos de espacios métricos inducen una métrica de caminos.
  3. ¿Es la métrica del ascensor, vista en Otros ejemplos de espacios métricos, una métrica de caminos?

Enlaces

Más conceptos de continuidad

Por Lizbeth Fernández Villegas

$ \textit{ MATERIAL EN REVISIÓN}$

Introducción

Las funciones continuas resultan muy útiles al relacionar espacios métricos. Propiedades identificadas en el dominio pueden conservarse también en el contradominio y viceversa.

En esta sección presentaremos definiciones más específicas para funciones continuas que reúnen ciertas características. Si una función es aplicada a dos puntos, ¿qué ocurre con la distancia en los puntos del espacio en el que caen? Ya sabemos que podemos hacer la distancia muy cercana si se toma como referencia un punto donde la función es continua pero, ¿habrá casos donde existan funciones que restrinjan la distancia de un modo más general, para todos los puntos? Comencemos con la siguiente:

Definición. Homeomorfismo. Sea $\phi: X \to Y$ una función continua. Si además $\phi$ es biyectiva y su inversa $\phi^{-1}: Y \to X$ es continua, diremos que $\phi$ es un homeomorfismo. Dos espacios métricos $X$ y $Y$ son homeomorfos si existe un homeomorfismo entre ellos.

$X$ y $Y$ son homeomorfos

Dos espacios homeomorfos tienen, en principio, la misma cardinalidad. Como existe una función continua y de inversa continua, puntos que están cerca en un espacio métrico se conservarán cerca en el otro. Podemos pensar que los espacios homeomorfos tienen la misma forma, en el sentido de que es posible modificar continuamente uno para convertirlo en el otro.

Ejemplos:

Una circunferencia y el perímetro de un rectángulo son homeomorfos. Nota que cada radial -rayo que parte del centro del círculo- conecta un único punto de la circunferencia con un único punto de la frontera del rectángulo, definiendo así una proyección, que es una función continua y es también un homeomorfismo entre estos espacios.

Una taza de café y una dona son homeomorfos en $\mathbb{R}^3.$ La siguiente imagen nos muestra la transformación de un espacio al otro a través de la aplicación de homeomorfismos.

Imagen: © Jonathan Gerhard

Proposición. Sean $(X,d_X), (Y,d_Y), (Z,d_Z)$ espacios métricos con $\phi: X \to Y$ y $\, \psi: Y \to Z$ funciones entre ellos. Las siguientes son propiedades de la composición de funciones:
a) Si $\phi$ y $\psi$ son continuas, entonces la composición $\psi \circ \phi: X \to Z$ es una función continua.


b) Si $\phi$ es un homeomorfismo, entonces $\psi$ es continua si y solo si la composición $\psi \circ \phi$ es continua.


c) Si $\psi$ es un homeomorfismo, entonces $\phi$ es continua si y solo si la composición $\psi \circ \phi$ es continua.

Demostración:
La prueba de a) se dejará como ejercicio al final de esta sección. Por lo pronto ya lo asumiremos válido.
Para probar b) nota que si $\phi$ es homeomorfismo entonces es continua y su función inversa $\phi^{-1}$ también lo es. A partir de a) concluimos que $\psi \circ \phi$ es continua si y solo si $(\psi \circ \phi)\circ\phi^{-1}= \psi$ es continua.
Para probar c) nota que si $\psi$ es homeomorfismo entonces es continua y su función inversa $\psi^{-1}$ también lo es. A partir de a) concluimos que $\psi \circ \phi$ es continua si y solo si $\psi^{-1}\circ(\psi \circ \phi)= \phi$ es continua.

Definición. Isometría. Sean $(X,d_X)$ y $(Y,d_Y)$ dos espacios métricos. Decimos que $\phi: X \to Y$ es una isometría si preserva distancias entre espacios, es decir, para toda $x,y \in X:$
$$d_X(x,y) = d_Y(\phi(x), \phi(y))$$

$\phi$ es una isometría

¿Puede una isometría ser un homeomorfismo? En principio sería necesario que sea biyectiva.

Proposición. Una isometría es una función inyectiva.
Demostración:
Sea $\phi: X \to Y$ una isometría y $x,y \in X$ tales que $\phi(x) = \phi(y)$ entonces $d_Y(\phi(x),\phi(y)) = 0$. Como $\phi$ es isometría, $d_X(x,y) = d_Y(\phi(x),\phi(y)) = 0$ por lo tanto $x = y.$
Se deja como ejercicio argumentar que si una isometría es suprayectiva, entonces es un homeomorfismo. Particularmente, en este caso diremos que los espacios son isométricos.

En la siguiente función las distancias en el espacio del contradominio estarán limitadas por las distancias del espacio del dominio y una constante $c \in \mathbb{R}:$

Definición. Función Lipschitz continua. Sea $\phi: X \to Y$. Si existe $c>0$ tal que para todo $x,y \in X, \,$ $d_Y(\phi(x), \phi(y)) \leq c \, d_X(x,y)$ diremos que $\phi$ es Lipschitz continua y que $c$ es constante de Lipschitz para $\phi$.

$\phi$ es Lipschitz continua

Proposición. Si la función $\phi$ es Lipschitz continua, entonces es continua.
Demostración:
Sea $\phi :X \to Y$ Lipschitz continua con constante de Lipschitz $c$, $x_0 \in X$ y $\varepsilon >0$. Si $\delta = \frac{\varepsilon}{c}$ entonces si $x$ es tal que $d_X(x,x_0) \leq \frac{\varepsilon}{c}$ se sigue que $d_Y(\phi(x_0), \phi(x)) \leq c \, d_X(x,x_0) \leq c \frac{\varepsilon}{c} = \varepsilon .$

El recíproco no es cierto. Se deja como ejercicio.

Definición. Equivalencia. Diremos que $\phi: X \to Y$ es una equivalencia si es Lipschitz continua y biyectiva y su inversa $\phi^{-1}:Y \to X$ también es Lipschitz continua.

$\phi$ es una equivalencia

Definición. Métricas equivalentes. Sean $d_1$ y $d_2$ dos métricas en el espacio métrico $X$. Diremos que $d_1$ y $d_2$ son equivalentes si la función identidad $I:(X,d_1) \to (X,d_2)$ es una equivalencia.

La métricas $d_1$ y $d_2$ son equivalentes

Asímismo, dos normas son equivalentes si las métricas inducidas por ellas son equivalentes. Podemos concluir también que si dos métricas son equivalentes, entonces ambas métricas generan los mismos conjuntos abiertos en el conjunto $X$, esto es, $A$ es abierto en $(X,d_1)$ si y solo si $A$ es abierto en $(X,d_2).$ ¿Por qué?

Ejemplos

En el conjunto $\mathbb{R}^n$ considera los puntos $x,y,z \in \mathbb R^n$, con $x=(x_{1},…,x_{n})$ y $y=(y_{1},…,y_{n}).$ Las siguientes métricas son equivalentes:

a) $d_{2}(x,y) = \sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2}$
b) $d_{\infty}(x,y) = max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}$
c) $d_{1}(x,y) = |x_{1}-y_{1}|+…+|x_{n}-y_{n}|$

Demostración:
Demostremos que $d_{2}$ y $d_{\infty}$ son métricas equivalentes.

\begin{align*}
(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2 &\leq n^2(max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\})^2\\
\sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2} &\leq n \, max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}\\
d_{2}(x,y) &\leq n \, d_{\infty}(x,y)
\end{align*}

Por otro lado

\begin{align*}
(max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\})^2 &\leq (x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2\\
max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\} &\leq \sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2}\\
d_{\infty}(x,y) &\leq d_{2}(x,y)
\end{align*}

Por lo tanto $d_{2}$ y $d_{\infty}$ son métricas equivalentes.

Ahora demostraremos que las métricas $d_{1}$ y $d_{\infty}$ son equivalentes.

\begin{align*}
d_1(x,y) &= |x_{1}-y_{1}|+…+|x_{n}-y_{n}| \\
&\leq n \, max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}\\
&= n \, d_{\infty}
\end{align*}

Por otro lado

\begin{align*}
d_{\infty} &= max \{|x_{1}-y_{1}|,…,|x_{n}-y_{n}|\}\\
&\leq |x_{1}-y_{1}|+…+|x_{n}-y_{n}| \\
&= d_{1}(x,y)
\end{align*}

Por lo tanto las métricas $d_{1}$ y $d_{\infty}$ son equivalentes. Queda como ejercicio al lector demostrar que las métricas $d_1$ y $d_2$ son equivalentes. Nota que es posible concluirlo a partir de las equivalencias demostradas y la composición de funciones.

Para finalizar esta sección, presentamos dos normas no equivalentes:
Considera el espacio de funciones continuas $C^0[0,1]$, (que van del intervalo $[0,1] \subset \mathbb{R} \to \mathbb{R})$ con las normas:
\begin{align*}
\norm{f}_1&:= (\int_{0}^{1} |f(x)| \,dx), \\
\norm{f}_\infty&:= máx\{|f(x)|:0\leq x \leq 1 \}
\end{align*}

Veremos que no existe una función Lipschitz continua $\phi:(C^0[0,1],\norm{f}_\infty) \to (C^0[0,1],\norm{f}_1).$

El máximo siempre es $1$. El área bajo la curva, disminuye

Para cada $n \in \mathbb{N}$ considera la función $f_n(x) \in C^0[0,1]$ que a cada $x \in [0,1]$ asigna el punto $f_n(x) = x^{n-1}.$ La distancia que hay entre estas funciones y la función constante $0$ está dada por:
\begin{align*}
\norm{f_n}_1&:= (\int_{0}^{1} |f_n| \,dx) = \frac{1}{n}, \\
\norm{f_n}_\infty&:= máx\{|f_n|:0\leq x \leq 1 \} = 1
\end{align*}
No existe $c>0$ que satisfaga que para toda $n \in \mathbb{N}, \, \norm{f_n}_1 \leq c\norm{f_n}_\infty$ pues no es cierto que $\frac{1}{n}\leq c(1) =c$ para toda $n$. Por lo tanto no existe una función Lipschitz continua $\phi:(C^0[0,1],\norm{f}_\infty) \to (C^0[0,1],\norm{f}_1)$ y en conclusión, estas normas no son equivalentes

Más adelante…

Veremos que es posible definir un espacio métrico a partir de una familia de caminos que conecte puntos y de la longitud que estos caminos tienen. Observaremos la posibilidad de que varios caminos distintos conecten a los mismos dos puntos y si es posible rescatar alguna aproximación en funciones no continuas a través de un nuevo concepto: la semicontinuidad.

Tarea moral

  1. Demuestra que si $\phi$ y $\psi$ son continuas, entonces la composición $\psi \circ \phi: X \to Z$ es una función continua.
  2. Sea $\phi$ una isometría tal que es suprayectiva. Prueba que es también un homeomorfismo.
  3. Da un ejemplo de una función continua que no sea Lipschitz continua.
  4. Demuestra que una isometría es una equivalencia.
  5. Demuestra que las métricas $d_1(x,y) = |x_{1}-y_{1}|+…+|x_{n}-y_{n}|$ y $d_{2}(x,y) = \sqrt{(x_{1}-y_{1})^2+…+(x_{n}-y_{n})^2}$ son equivalentes.

Enlaces

Funciones continuas en espacios métricos

Por Lizbeth Fernández Villegas

$ \textit{ MATERIAL EN REVISIÓN}$

Introducción

Probablemente estés familiarizado con las funciones continuas de los cursos de cálculo. Esta noción se retoma para funciones entre espacios métricos. Diremos que una función entre espacios métricos $X$ y $Y,$ $f:X \to Y$ es continua en un punto $x_0$ de $X$ si para puntos que están «junto a» $x_0$ en $X$, los puntos correspondientes bajo la función $f$ también están junto a $f(x_0).$ Este tipo de funciones nos permite identificar propiedades entre los espacios métricos que relaciona. En esta entrada comenzaremos a explorar algunos resultados. Comencemos con la definición:

Definición. Función continua. Sean $(X,d_X)$ y $(Y,d_Y)$ dos espacios métricos. Diremos que una función $\phi: X \to Y$ es continua en el punto $x_0 \in X$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que para todo $x \in X$ si $d_X(x,x_0) < \delta$ entonces $d_Y(\phi(x), \phi(x_0))<\varepsilon$. Si $\phi:X \to Y$ es continua en cada punto de $A \subset X$, diremos que $\phi$ es continua en $A$.

$\phi$ es continua en $x_0$

Si comparas esta definición con la de la entrada anterior, Límite de una función, estarás de acuerdo en que una funcíon $\phi: X \to Y$ es continua en $x_0 \in X$ si
$$\underset{x \to x_0}{lim} \,\phi (x) \,=\phi(x_0)$$

Esta definición se puede expresar en términos de bolas abiertas como sigue: La función $\phi: X \to Y$ es continua en $x_0 \in X$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que $\phi(B_X(x_0,\delta)) \subset B_Y(\phi(x_0),\varepsilon)$. Observa que en la definición de continuidad, a diferencia de la de límite, no se excluye al punto de continuidad $x_0$.

La imagen de $B_X(x_0,\delta)$ cae dentro de la bola $B_Y(\phi(x_0), \varepsilon)$

Ejemplos

La función constante
Para cualesquiera dos espacios métricos $(X,d_X)$ y $(Y,d_Y)$ la función constante $\phi :X \to Y$ tal que para todo $x \in X, \, \phi (x) = c$ para algún $c \in Y$, es continua en cualquier punto de $X.$

Función constante

Demostración:
Sea $\varepsilon >0$ y $\delta =1$ (cualquier valor para delta funciona). Sea $x_0 \in X$. Entonces si $d_X(x_0,x)<1$ se cumple que $d_Y (\phi(x_0),\phi(x))=d_Y (c,c)=0< \varepsilon.$ Por lo tanto, $f$ es continua en $X.$

Cualquier función que tenga como dominio al espacio discreto es continua.

Demostración:
Sea $(X,d_{disc})$ el espacio discreto, $(Y,d_Y)$ espacio métrico y $\phi :X \to Y$. Sea $\varepsilon > 0$ y sea $x_0 \in X$. Entonces, si $\delta = 1$ (cualquier delta mayor que cero pero menor igual que $1$ funciona) tenemos:
$d_{disc}(x_0,x)< \delta$ entonces $x_0 = x\, $ así $\, d_Y(\phi (x_0),\phi(x))=d_Y(\phi(x_0),\phi(x_0))=0< \varepsilon.$ Por lo tanto, $\phi$ es continua en el espacio discreto $X$.

Si el dominio es el espacio discreto, $\phi$ es continua

La siguiente proposición expresa la continuidad en términos de sucesiones.
Proposición. La función $\phi: X \to Y$ es continua en $x_0 \in X$ si y solo si para toda sucesión $(x_n)_{n \in \mathbb{N}} \,$ que converge en $X$ se cumple que:
$$\underset{n \to \infty}{lim} \, \phi(x_n) \, =\,\phi(\underset{n \to \infty}{lim} \, x_n).$$ La demostración se deja como ejercicio. Te sugerimos comparar esta proposición con la que concluye el límite de una función a partir de sucesiones vista en Límite de una función.

Si $x_n \to x_0$ entonces $\phi(x_n) \to \phi(x_0)$

Las siguientes son propiedades de las funciones continuas:

Proposición. Sean $\phi, \psi: A \subset X \to \mathbb{C}$ funciones continuas en $x_0 \in X$, entonces:

a) $\phi(x) \pm \psi(x)$ es continua en $x_0$.
b) $\phi(x) \psi(x)$ es continua en $x_0$.
c) $\phi(x) / \psi(x)$ es continua en $x_0$ cuando $\psi(x_0) \neq 0$

La demostración se deja como ejercicio.

Proposición. Sean $\phi,\psi : A \subset X \to \mathbb{R}^n$ dos funciones continuas en $x_0 \in X$, entonces:
a)$(\phi \pm \psi)(x)$ es continua en $x_0$.
b)$(\phi \cdot \psi)(x)$ es continua en $x_0$.
c) $\lambda \phi (x)$ con $\lambda \in \mathbb{R}$ es continua en $x_0$.

La demostración se deja como ejercicio.

Antes de continuar, veamos con detenimiento la siguiente:
Definición. Imagen inversa. Sean $X$ y $Y$ dos conjuntos y $f:X \to Y$ una función entre ellos. Si $\, U \subset Y,$ diremos que la imagen inversa del subconjunto $U$, es el conjunto de todos los elementos de $X$ que bajo la función $f$ están en $U$. Se denota como $f^{-1}(U).$ Formalmente tenemos:
$$f^{-1}(U)=: \{x \in X : f(x) \in U\}$$

Nota: Ten cuidado de no confundir el concepto de imagen inversa $f^{-1}(U)$ (que es una forma de definir conjuntos en $X$ a partir de un conjunto en $Y$) con el concepto de la función inversa de $f$ que, aunque también se denota como $f^{-1},$ hace referencia a una función que se evalúa en puntos de $Y$ y solo existe cuando $f$ es biyectiva.

Ahora consideremos un conjunto $U_1 \subset X.$ La función $f$ define en $Y$ el conjunto $f(U_1)$. Si renombramos a este conjunto como $\, U_2 \,$ y buscamos identificar ahora la imagen inversa de este nuevo conjunto, ¿regresaremos al mismo conjunto $\, U_1$ del cual partimos? Observa que, dependiendo la naturaleza de la función, es posible que la imagen inversa nos arroje un conjunto más grande que el $\, U_1 \,$ inicial, sin embargo $\, U_1 \,$ estará contenido.

Los conjuntos $U_1$ y $f^{-1}(U_2)$ pueden ser diferentes

Esto ocurre porque es posible que haya puntos en $\, U_2 \,$ que son igualmente asignados por la función $f$ para puntos fuera de $\, U_1 \,$.

¿Bajo qué condiciones no pasaría esto?

Para finalizar esta sección, veamos las siguientes propiedades de las funciones continuas:

Proposición. Sean $X$ y $Y$ espacios métricos y $\phi:X \to Y$ una función. Las siguientes afirmaciones son equivalentes:

a) $\phi: X \to Y$ es continua.
b) Para todo subconjunto abierto $U \subset Y$, $\phi^{-1}(U)$ es un conjunto abierto en $X.$
c) Para todo subconjunto cerrado $V \subset Y$, $\phi^{-1}(V)$ es un conjunto cerrado en $X.$

Demostración:
Para probar a) $\Rightarrow$ b) considera $U \subset Y$ abierto y $\, x \in \phi^{-1}(U).$ Entonces existe $\varepsilon >0$ tal que $B_Y(\phi(x), \varepsilon) \subset U$, pues $U$ es abierto. Como $\phi$ es continua en $x$, entonces existe $\, \delta >0$ tal que $\phi (B_X(x, \delta)) \subset B_Y(\phi(x), \varepsilon) \subset U.$ Por lo tanto $B_X(x, \delta)) \subset \phi^{-1}(U) \,$ lo que demuestra que $\phi^{-1}(U)$ es un conjunto abierto en $X.$

Para probar b) $\Rightarrow$ c) considera $V \subset Y$ cerrado. Entonces $Y \setminus V$ es abierto en $Y$. Así $\phi ^{-1}(Y \setminus V)$ es abierto en $X$ de modo que $X \setminus \phi ^{-1}(Y \setminus V)$ es cerrado en $X$.
Nota que $\phi^{-1}(V)=X \setminus \phi ^{-1}(Y \setminus V)$ pues $x \in \phi^{-1}(V) \,$ $\Leftrightarrow$ $\phi(x) \in V$ $\Leftrightarrow$ $\phi(x) \notin (Y \setminus V)$ $\Leftrightarrow$ $x \notin \phi ^{-1}(Y \setminus V)$ $\Leftrightarrow$ $x \in X \setminus \phi ^{-1}(Y \setminus V)$. Por lo tanto $\phi^{-1}(V)$ es cerrado en $X.$

Para probar c) $\Rightarrow$ a) considera $x \in X$. Sea $\varepsilon>0$ entonces la bola $B_Y(\phi(x),\varepsilon)$ es abierto por lo tanto su complemento $Y \setminus B_Y(\phi(x),\varepsilon)$ es cerrado. Por hipótesis, la imagen inversa dada por $\phi^{-1}(B_Y(\phi(x),\varepsilon))$ es un conjunto cerrado en $X$. En consecuencia el complemento de $\phi^{-1}(B_Y(\phi(x),\varepsilon))$ es un conjunto abierto en $X$ que tiene a $x$ como elemento. Llamemos $U$ a este conjunto.

Como $U$ es abierto, existe $\delta>0$ tal que $B_X(x,\delta) \subset U$. Por lo tanto la imagen $f(B_X(x,\delta)) \subset B_Y(\phi(x),\varepsilon)$ lo que prueba que la función $\phi$ es continua en $x$. Como $x$ fue arbitrario, se concluye que $\phi$ es continua en el espacio $X$.

Más adelante…

Veremos cómo la existencia de funciones continuas entre dos espacios muestra propiedades que se conservan en ambos. Ya no hablaremos solo de la cercanía a los puntos, sino que haremos esa distancia más específica y comparable a la registrada en el espacio del dominio. Conoceremos así a los espacios isomorfos y homeomorfos.

Tarea moral

  1. Demuestra que la función $\phi: X \to Y$ es continua en $x_0 \in X$ si y solo si para toda sucesión $(x_n)_{n \in \mathbb{N}}$ que converge en $X$ se cumple que:
    $$\underset{n \to \infty}{lim} \, f(x_n) \, =\,f(\underset{n \to \infty}{lim} \, x_n)$$.
  2. Demuestra que si $\phi, \psi: A \subset X \to \mathbb{C}$ son funciones continuas en $x_0 \in X$, entonces:
    a) $\phi(x) \pm \psi(x)$ es continua en $x_0$.
    b) $\phi(x) \psi(x)$ es continua en $x_0$.
    c) $\phi(x) / \psi(x)$ es continua en $x_0$ cuando $\psi(x_0) \neq 0$
  3. Demuestra que si $\phi,\psi : A \subset X \to \mathbb{R}^n$ son dos funciones continuas en $x_0 \in X$, entonces:
    a)$(\phi \pm \psi)(x)$ es continua en $x_0$.
    b)$(\phi \cdot \psi)(x)$ es continua en $x_0$.
    c) $\lambda \phi (x)$ con $\lambda \in \mathbb{R}$ es continua en $x_0$.
  4. Usa la última proposición de esta sección para probar que cualquier función que tenga como dominio al espacio discreto es continua.
  5. ¿Es posible concluir que cualquier función que tenga como contradominio al espacio discreto es continua?

Enlaces

Nota 39. Ejemplos de sistemas de ecuaciones

Por Julio César Soria Ramírez

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

En la nota anterior comenzamos el estudio de los sistemas de ecuaciones, ahora veremos cómo determinar si un sistema de ecuaciones lineales tiene o no solución. y cómo encontrar sus soluciones en caso de que existan.

La resolución de sistemas de ecuaciones lineales es un problema fundamental en matemáticas y en diversas áreas de la ingeniería y las ciencias aplicadas. Una técnica comúnmente utilizada para resolver estos sistemas es la eliminación de Gauss-Jordan, que consiste en aplicar operaciones elementales a la matriz aumentada asociada al sistema, que como vimos en la nota anterior no modifica las soluciones del sistema, para obtener una matriz equivalente que sea escalonada reducida por renglones. En esta nueva matriz la solución del sistema asociado se puede obtener fácilmente. En esta nota se explicará paso a paso cómo realizar este proceso, a partir de ejemplos concretos.

Ejemplos

$1.$

ExpresiónExplicación
$\begin{array}{rl} 4x-8y &=12\\ 3x-6y &=9\\-2x+4y &=-6 \end{array}$Inicia con un sistema de ecuaciones lineales.
$\begin{equation*} \left(\begin{array}{rr|r} 4 & -8 & 12 \\ 3 & -6 & 9 \\ -2 & 4 & -6 \end{array}\right) \end{equation*}\sim$Considera la matriz aumentada asociada al sistema
y efectúa las operaciones elementales:
$\frac{1}{4}R_1,\,\frac{1}{3}R_2,\,\frac{1}{2}R_3$
$\begin{equation*} \left(\begin{array}{rr|r} 1 & -2 & 3 \\ 1 & -2 & 3 \\ -1 & 2 & -3 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$R_2\to R_2-R_1$
$R_3\to R_3+R_1$
$\begin{equation*} \left(\begin{array}{rr|r} 1 & -2 & 3 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array}\right) \end{equation*}$

El sistema se reduce a la ecuación $x-2y=3$ y dos ecuaciones iguales a $0x+0y=0$, pero esto último se cumple para todas $x,y\in\mathbb{R}$, así que debemos analizar sólo qué valores $x$ y $y$ cumplen la ecuación $x-2y=3$.

Observemos que $x-2y=3$ si y sólo si $x=3+2y$. En este caso podemos dar a $y$ cualquier valor real $\lambda$ y entonces $x$ queda determinado por el valor que dimos a $y$. Decimos entonces que $y$ está funcionando como un parámetro.

Las soluciones son:

$x=3+2\lambda,\,y=\lambda$ con $\lambda\in \mathbb R .$

El conjunto de soluciones es :

$\begin{array}{l}\set{(x,y)\in \mathbb R^2\mid x=3+2\lambda,y=\lambda,\,\lambda\in\mathbb R} \\ = \set{(3+2\lambda,\lambda) \mid \lambda\in\mathbb R)} \\ =\set{(2\lambda,\lambda)+(3,0) \mid \lambda\in\mathbb R)} \\ = \set{\lambda(2,1)+(3,0) \mid \lambda\in\mathbb R)} \end{array}$

$2.$

ExpresiónExplicación
$\begin{array}{rlr}5x+2y-19z+0w-32t &=&-24\\ 6x+30y-21z+30w-21t &=&-21 \\x+5y-4z+0w-7t &=&5 \\ 3x+15y-11z+w-14t &=&-12 \end{array}$Inicia con un sistema de ecuaciones lineales.
$\begin{equation*} \left(\begin{array}{ccccc|r} 5 & 25 & -19 & 0 & -32 & -24\\ 6 & 30 & -21 & 3 & -21 & -21 \\ 1 & 5 & -4 & 0 & -7 & -5 \\ 3 & 15 & -11 & 1 & -14 &-12 \end{array}\right) \end{equation*}\sim$Considera la matriz aumentada asociada al sistema
y efectúa las operaciones elementales:
$R_1\leftrightarrow R_3$
$\frac{1}{3}R_2$
$\begin{equation*} \left(\begin{array}{ccccc|r} 1 & 5 & -4 & 0 & -7 & -5\\ 2 & 10 & -7 & 1 & -7 & -7 \\ 5 & 25 & -19 & 0 & -32 & -24 \\ 3 & 15 & -11 & 1 & -14 &-12 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$R_2\to R_2-2R_1$
$R_3\to R_3-5R_1$
$R_4\to R_4-3R_1$
$\begin{equation*} \left(\begin{array}{ccccc|r} 1 & 5 & -4 & 0 & -7 & -5\\ 0 & 0 & 1 & 1 & 7 & 3 \\ 0 & 0 & 1 & 0 & 3 & 1 \\ 0 & 0 & 1 & 1 & 7 &3 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$R_3\to R_3-2R_2$
$R_4\to R_4-R_2$
$\begin{equation*} \left(\begin{array}{ccccc|r} 1 & 5 & -4 & 0 & -7 & -5\\ 0 & 0 & 1 & 1 & 7 & 3 \\ 0 & 0 & 0 & -1 & -4 & -2 \\ 0 & 0 & 0 & 0 & 0 &0 \end{array}\right) \end{equation*}\sim$Efectúa la operación elemental:
$R_2\to R_2+R_3$
$\begin{equation*} \left(\begin{array}{ccccc|r} 1 & 5 & -4 & 0 & -7 & -5\\ 0 & 0 & 1 & 0 & 3 & 1 \\ 0 & 0 & 0 & -1 & -4 & -2 \\ 0 & 0 & 0 & 0 & 0 &0 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$R_1\to R_1+4R_2$
$(-1)R_3$
$\begin{equation*} \left(\begin{array}{ccccc|r} 1 & 5 & 0 & 0 & 5 & -1\\ 0 & 0 & 1 & 0 & 3 & 1 \\ 0 & 0 & 0 & 1 & 4 & 2 \\ 0 & 0 & 0 & 0 & 0 &0 \end{array}\right) \end{equation*}$
$\begin{array}{rlr}x+5y+0z+0w+5t &=&-1\\ 0x+0y+z+0w+3t &=&1 \\0x+0y+0z+w+4t &=&2 \end{array}$Este sistema es equivalente al sistema con el que empezamos, por lo tanto sus soluciones son las mismas.
$\begin{array}{llllllr}x&+5y+&&&+5t &=&-1\\ &&+z&&+3t &=&1 \\&&&w&+4t &=&2 \end{array}$El sistema se puede simplificar omitiendo los términos con coeficiente cero.

Observemos que en el sistema anterior, debido a la forma que tiene, es muy sencillo despejar a $x$, a $z$ y a $w$, y al hacerlo quedan en términos de $y$ y de $t$ (las indeterminadas que no tienen como coeficiente al primer elemento no nulo de algún renglón en la matriz escalonada reducida por renglones). Éstas nos servirán entonces como parámetros, ya que eligiendo $y$ y $t$ como cualesquiera números reales, $x$, $z$ y $w$ quedan determinados por ellos.

Sean entonces $\alpha,\beta\in \mathbb R$, si $t=\alpha$ y $y=\beta$, tenemos que:

$x=-5\beta-5\alpha-1$

$z=1-3\alpha$

$w=-4\alpha +2.$

Así, el conjunto solución es:

$\begin{align*}\phantom{=}&\set{(-5\beta-5\alpha-1,\beta,-3\alpha+1,-4\alpha+2,\alpha)\mid \alpha,\beta \in\mathbb R} \\ =& \set{\beta(-5,1,0,0,0)+\alpha(-5,0,-3,-4,1)+(-1,0,1,2,0)\mid \alpha,\beta \in\mathbb R } .\end{align*}$

$3.$

ExpresiónExplicación
$\begin{array}{rlr} x+y+z &=-3\\ 2x-3y+4z &=1 \\3x+2y+5z &=8 \end{array}$Inicia con un sistema de ecuaciones lineales.
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 1 & 1 & 3\\ 2 & -3 & 4 & 1 \\ 3 & 2 & 5 & 8 \end{array}\right) \end{equation*}\sim$Considera la matriz aumentada asociada al sistema
y efectúa las operaciones elementales:
$R_2\to R_2-2R_1$
$R_3\to R_3-3R_1$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 1 & 1 & 3\\ 0 & -5 & 2 & -5 \\ 0 & -1 & 2 & -1 \end{array}\right) \end{equation*}\sim$Efectúa la operación elemental:
$R_2\leftrightarrow R_3$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 1 & 1 & 3\\ 0 & -1 & 2 & -1\\ 0 & -5 & 2 & -5 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$R_1\to R_1+R_2$
$R_3\to R_3-5R_2$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 0 & 3 & 2\\ 0 & -1 & 2 & -1\\ 0 & 0 & -8 & 0 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$\frac{1}{8} R_3$
$(-1) R_2$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 0 & 3 & 2\\ 0 & 1 & -2 & 1\\ 0 & 0 & 1 & 0 \end{array}\right) \end{equation*}\sim$Efectúa las operaciones elementales:
$R_1\to R_1-3R_3$
$R_2\to R_2+2 R_3$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 0 & 0 & 2\\ 0 & 1 & 0 & 1\\ 0 & 0 & 1 & 0 \end{array}\right) \end{equation*}$
$\begin{array}{rrrr} x& &&=2\\&y &&=1 \\&&z &=0 \end{array}$Este sistema es equivalente al inicial, por tanto su solución es la misma. Hay una única solución:
$\set{(2,1,0)}.$

$4.$

ExpresiónExplicación
$\begin{array}{rlr}6x+12y-6z &=24\\ 3x+9y-2z &=14 \\5x+4y-7z &=21 \end{array}$Inicia con un sistema de ecuaciones lineales.
$\begin{equation*} \left(\begin{array}{ccc|c} 6 & 12 & -6 & 24\\ 3 & 9 & -2 & 14 \\ 5 & 4 & -7 & 21 \end{array}\right) \end{equation*}\sim$Considera la matriz aumentada asociada al sistema
y efectúa la operación elemental:
$\frac{1}{6}R_1$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 2 & -1 & 4\\ 3 & 9 & -2 & 14 \\ 5 & 4 & -7 & 21 \end{array}\right) \end{equation*}\sim$Efectúa la operaciones elementales:
$R_2\to R_2-3R_1$
$R_3\to R_3-5R_1$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 2 & -1 & 4\\ 0 & 3 & 1 & 2\\ 0 & -6 & -2 & 1 \end{array}\right) \end{equation*}\sim$Efectúa la operación elemental:
$R_3\to R_3+2 R_2$
$\begin{equation*} \left(\begin{array}{ccc|c} 1 & 2 & -1 & 4\\ 0 & 3 & 1 & 2\\ 0 & 0 & 0 & 5 \end{array}\right) \end{equation*}\sim$La última ecuación es:
$0x+0y+0z=5$ que no tiene solución. Por lo tanto el sistema no tiene solución.

Definición

Decimos que un sistema es incompatible si no tiene solución. Decimos que un sistema es compatible si tiene solución; en este caso decimos que es compatible determinado si tiene una única solución, si hay más de una solución decimos que es compatible indeterminado.

Como se comentó en la nota anterior, el rango de una matriz es la dimensión del espacio generado por sus renglones, pero también coincide con la dimensión del espacio generado por sus columnas. No probaremos este resultado porque va más allá de los objetivos de este curso pero lo enunciaremos y usaremos:

Nota

Sean $n$ y $m$ naturales positivos y $A\in \mathscr M_{m\times n}(\mathbb R)$ con $A^1,\dotsc,A^n$ sus columnas. Tenemos que $rk\, A=dim\langle A^1,\dotsc,A^n \rangle = rk\,A^t.$

Teorema

Un sistema de ecuaciones lineales tiene solución si y sólo si el rango de la matriz de coeficientes coincide con el rango de la matriz aumentada.

Demostración

Sean $n$ y $m$ naturales positivos, $A\in \mathscr M_{m\times n}(\mathbb R)$ y $B\in \mathscr M_{m\times 1}(\mathbb R)$.

$AX=B$ tiene solución $\Longleftrightarrow $ $\exists S\in \mathbb R^n$ tal que $AS=B$

$\Longleftrightarrow $ $B\in \langle A^1,\dotsc,A^n \rangle$

$\Longleftrightarrow $ $\langle B,A^1,\dotsc,A^n \rangle=\langle A^1,\dotsc,A^n \rangle$

$\Longleftrightarrow $ $dim\langle B,A^1,\dotsc,A^n \rangle=dim\langle A^1,\dotsc,A^n \rangle$

$\Longleftrightarrow $ El rango de la matriz aumentada es igual al rango de la matriz de coeficientes.

Tarea Moral

$1.$ En cada inciso encuentra el conjunto solución del sistema

$i)$

$\begin{align*} 5x+2y-3z &=-25\\ 3x+y+4z &=7 \\2x+3y+2z &=16 \end{align*}$

$ii)$

$\begin{align*} 3x+2y+4z &=-1\\ 2x-y+5z &=8 \\5x+y+9z &=11 \end{align*}$

$iii)$

$\begin{align*} 2x_1+x_2+x_3+x_4 &=0\\x_1+2x_2+x_3+x_4&=0 \\x_1+x_2+2x_3+x_4 &=16\\ x_1+x_2+x_3+2x_4&=0 \end{align*}$

$iv)$

$\begin{align*} x+2y-z+3w &=7\\ 3x+6y-14z+11w &=20 \end{align*}$

$2.$ ¿Qué ocurre con la última columna de la matriz aumentada de un sistema homogéneo al escalonar la matriz? ¿Es necesario escribir esa última columna al realizar el procedimiento que estudiamos para resolver un sistema homogéneo?

$3.$ En una tienda se venden $23$ baterías eléctricas por un total de $\$79.2$. Si el tipo $A$ cuesta $\$5$ el tipo $B$ $\$2.80$ y el tipo $C$ $\$1.60$ por pieza. ¿Cuántas baterías de cada tipo se vendieron?

Más adelante

En la siguiente nota definiremos lo que es el determinante de una matriz.

Enlaces relacionados

Página principal del curso.

Enlace a la nota anterior. Nota 38. Sistemas de ecuaciones.

Enlace a la nota siguiente. Nota 40. Determinantes.