Introducción
En esta entrada tratamos la forma escalonada reducida de una matriz, que es básicamente una forma «bonita» de expresar una matriz que nos permite resolver sistemas de ecuaciones lineales. Luego nos adentramos en la parte de operaciones elementales, que es el primer paso para desarrollar un algoritmo (que luego veremos es la reducción gaussiana) que nos permite llevar a cualquier matriz a su forma escalonada reducida.
En otras palabras, en esta entrada vemos cómo resolver un caso fácil de un sistema de ecuaciones. Más adelante veremos que en realidad cualquier caso puede llevarse al caso fácil con un algoritmo relativamente fácil.
¿Qué es la forma escalonada reducida?
Sea una matriz $A$ con entradas en un campo $F$. Si $R$ es un renglón de $A$, diremos que $R$ es una fila cero si todas sus entradas son cero. Si $R$ no es una fila cero, el término principal de $R$ o bien el pivote de $R$ es la primera entrada distinta de cero de la fila. Diremos que $A$ está en forma escalonada reducida si $A$ tiene las siguientes propiedades:
- Todas las filas cero de $A$ están hasta abajo de $A$ (es decir, no puede seguirse una fila distinta de cero después de una cero).
- El término principal de una fila no-cero está estrictamente a la derecha del término principal de la fila de encima.
- En cualquier fila distinta de cero, el término principal es $1$ y es el único elemento distinto de cero en su columna.
Ejemplo. La matriz $I_n$ está en forma escalonada reducida, así como la matriz cero $O_n$. La matriz
\begin{align*}
A= \begin{pmatrix} 1 &-1 & 0 &2\\ 0 & 0 & 1 & -1\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{align*}
está en forma escalonada reducida. El término principal de la primer fila es $1$ y está en la primer columna. El término principal de la segunda fila también es $1$, y se encuentra más a la derecha que el término principal de la fila anterior. Además, es la única entrada distinta de cero en su columna.
Sin embargo, la matriz ligeramente distinta
\begin{align*}
B= \begin{pmatrix} 1 &-1 & 5 &2\\ 0 & 0 & 1 & -1\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{align*}
no está en forma escalonada reducida ya que el término principal del segundo renglón no es la única entrada distinta de cero en su columna.
$\triangle$
¿Cómo la forma escalonada reducida nos permite resolver sistemas de ecuaciones?
¿Cual es la importancia de la forma escalonada con respecto al problema de resolver sistemas de ecuaciones? Veremos que cualquier matriz se puede poner (de manera algorítmica) en forma escalonada reducida y que esta forma es única. También veremos que si $A_{red}$ es la forma escalonada reducida de una matriz, entonces los sistemas $AX=0$ y $A_{red}X=0$ son equivalentes. Además, veremos que resolver el sistema $A_{red} X=0$ es muy fácil de resolver precisamente por estar en forma escalonada reducida.
Ejemplo. Resolvamos el sistema $AX=0$ donde $A$ es la matriz que dimos anteriormente, que está en forma escalonada reducida. El sistema asociado es
\begin{align*}
\begin{cases}
x_1 -x_2+2x_4&=0\\
x_3-x_4&=0
\end{cases}.
\end{align*}
De la segunda igualdad podemos expresar $x_3=x_4$ y de la primera $x_1=x_2-2x_4$. Así, podemos escoger $x_2$ y $x_4$ «libremente» y obtener $x_3$ y $x_1$ con estas ecuaciones (tenemos, de cierta manera, dos «parámetros libres»), por lo que nuestras soluciones se ven de la forma
\begin{align*}
(a-2b, a, b,b )
\end{align*}
con $a,b\in F$.
$\triangle$
En general si $A$ es una matriz en forma escalonada reducida, veamos cómo resolver el sistema $AX=0$. Las únicas ecuaciones importantes son las que resultan de renglones distintos de cero (pues las otras solo son $0=0$) y al estar en forma escalonada reducida, todos los renglones cero están hasta el final. Supongamos que el $i$-ésimo renglón de $A$ es distinto de cero y su término principal está en la $j$-ésima columna, así el término principal es $a_{ij}=1$. La $i$-ésima ecuación del sistema lineal entonces es de la forma
\begin{align*}
x_j +\sum_{k=j+1}^{n} a_{ik} x_k =0.
\end{align*}
Llamamos a $x_j$ la variable pivote del renglón $L_i$. Así, a cada renglón distinto de cero le podemos asociar una única variable pivote. Todas las demás variables del sistema son llamadas variables libres. Uno resuelve el sistema empezando desde abajo, expresando sucesivamente las variables pivote en términos de las variables libres. Esto nos da la solución general del sistema, en términos de las variables libres, que pueden tomar cualquier valor en $F$.
Si $y_1, \dots, y_s$ son las variables libres, entonces las soluciones del sistema son de la forma
\begin{align*}
X= \begin{pmatrix}
b_{11} y_1 + b_{12} y_2 + \dots+ b_{1s} y_s\\
b_{21} y_1+ b_{22} y_2 +\dots+b_{2s} y_s\\
\vdots\\
b_{n1} y_1 +b_{n2} y_2+ \dots + b_{ns} y_s\end{pmatrix}
\end{align*}
para algunos escalares $b_{ij}$. Esto también se puede escribir como
\begin{align*}
X= y_1 \begin{pmatrix} b_{11} \\ b_{21} \\ \vdots \\ b_{n1}\end{pmatrix}+\dots + y_s \begin{pmatrix} b_{1s} \\ b_{2s}\\ \vdots \\ b_{ns} \end{pmatrix} .
\end{align*}
Llamamos a
\begin{align*}
Y_1= \begin{pmatrix} b_{11}\\ b_{21}\\ \vdots \\ b_{n1}\end{pmatrix}, \dots, Y_s= \begin{pmatrix} b_{1s} \\ b_{2s} \\ \vdots \\ b_{ns}\end{pmatrix}
\end{align*}
las soluciones fundamentales del sistema $AX=0$. La motivación para su nombre es fácil de entender: $Y_1, \dots, Y_s$ son soluciones del sistema $AX=0$ que ‘generan’ todas las otras soluciones, en el sentido que todas las soluciones del sistema $AX=0$ se obtienen a través de todas las combinaciones lineales de $Y_1, \dots, Y_s$ (correspondiendo a todos los valores posibles de $y_1, \dots, y_s$).
Un ejemplo para aterrizar los conceptos
Sea $A$ la matriz en forma escalonada reducida dada como sigue
\begin{align*}
A= \begin{pmatrix}
1 & 1 & 0 & 0 &-1 & 0 & 2\\ 0 & 0 & 1 & 0 & 3 & 0 & 1\\ 0 & 0 & 0 & 1& 0 & 0 &-1\\ 0 & 0 &0 & 0 & 0 & 1 & 0 \\ 0 & 0 &0 & 0 & 0 & 0 & 0 \end{pmatrix}
\end{align*}
y consideremos el sistema homogéneo asociado $AX=0$. Este se puede escribir como
\begin{align*}
\begin{cases}
x_1+x_2-x_5+2x_7&=0\\
x_3+3x_5+x_7&=0\\
x_4-x_7&=0\\
x_6&=0
\end{cases}.
\end{align*}
Las variables pivote son $x_1, x_3, x_4$ y $x_6$, ya que los términos principales aparecen en las columnas $1,3,4$ y $6$. Eso nos deja a $x_2, x_5$ y $x_7$ como variables libres.
Para resolver el sistema, empezamos con la última ecuación y vamos «subiendo», expresando en cada paso las variables pivote en términos de las variables libres. La última ecuación nos da $x_6=0$. Después, obtenemos $x_4=x_7$, posteriormente $x_3=-3x_5-x_7$ y $x_1= -x_2+x_5-2x_7$. Nunca nos va a pasar que tengamos que expresar a una variable pivote en términos de otra variable pivote, por la condición de que cada pivote es la única entrada no cero en su columna.
Para expresar las soluciones en términos vectoriales, hacemos lo siguiente.
\begin{align*}
X&=\begin{pmatrix}
-x_2+x_5 -2x_7\\
x_2\\
-3x_5-x_7\\
x_7\\
x_5\\
0 \\
x_7
\end{pmatrix}\\ &= x_2\cdot \begin{pmatrix}-1 \\ 1 \\ 0 \\ 0\\ 0 \\ 0 \\ 0 \end{pmatrix} +x_5\cdot \begin{pmatrix} 1 \\ 0 \\ -3 \\ 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}+x_7 \cdot \begin{pmatrix} -2\\ 0 \\ -1\\ 1 \\ 0 \\ 0 \\1 \end{pmatrix}.
\end{align*}
Los tres vectores columna que aparecen del lado derecho de la igualdad son entonces las soluciones fundamentales del sistema $AX=0$. Todas las soluciones están entonces dadas por la expresión de la derecha, donde $x_2, x_5$ y $x_7$ pueden tomar cualquier valor en $F$.
Una moraleja sobre el número de soluciones
El número de soluciones fundamentales del sistema $AX=0$ es igual al número total de variables menos el número de variables pivote. Deducimos que el sistema $AX=0$ tiene como única solución a $X=0$ si no hay variables libres. Esto es lo mismo que decir que el número de variables pivote es igual al número de columnas de $A$.
Combinando las observaciones anteriores con el principio de superposición obtenemos el siguiente y muy importante resultado.
Teorema.
- Un sistema lineal homogéneo que tiene más variables que ecuaciones tiene soluciones no triviales. Si el campo de coeficientes es infinito (como por ejemplo $\mathbb{R}$ o $\mathbb{C}$), entonces el sistema tiene infinitas soluciones.
- Un sistema lineal consistente $AX=b$ que tiene más variables que ecuaciones tiene al menos dos soluciones, y si el campo es infinito, tiene infinitas soluciones.
¿Cómo llevar una matriz a su forma escalonada reducida? Operaciones elementales
Ahora regresamos al problema de transformar una matriz dada en una matriz con forma escalonada reducida. Para resolver este problema introducimos tres tipos de operaciones que pueden aplicarse a las filas de una matriz. Veremos que gracias a estas operaciones, uno puede transformar cualquier matriz en una en forma escalonada reducida.
Estas operaciones surgen de las manipulaciones cuando resolvemos sistemas lineales: las operaciones más naturales que hacemos cuando resolvemos un sistema de ecuaciones lineales son:
- multiplicar una ecuación por un escalar distinto de cero;
- añadir una ecuación (o mejor aún, un múltiplo de una ecuación) a otra ecuación diferente;
- intercambiar dos ecuaciones.
Observamos que estas operaciones son reversibles: si por ejemplo, multiplicamos una ecuación por un escalar $a\neq 0$, podemos multiplicar la misma ecuación por $\frac{1}{a}$ para recuperar la ecuación original. Queda claro que realizando una cantidad finita de estas operaciones en un sistema obtenemos un sistema con el mismo conjunto de soluciones que el sistema original (en nuestra terminología más barroca, un sistema nuevo equivalente al original). Estas operaciones en el sistema pueden verse como operaciones directamente en la matriz. Más precisamente:
Definición. Una operación elemental en las filas de una matriz $A$ en $M_{m,n}(F)$ es una operación de uno de los siguientes tipos:
- cambio de filas: intercambiar dos renglones de la matriz $A$,
- reescalar una fila: multiplicar una fila de la matriz $A$ por un escalar $c$ en $F$ distinto de cero,
- transvección: reemplazar una fila $L$ por $L+cL’$ para algún escalar $c$ en $F$ y otra fila $L’$ de $A$ diferente a $L$.
La discusión previa muestra que si $A$ es una matriz y $B$ se obtiene a partir de $A$ al aplicar una sucesión finita de operaciones elementales entonces $A\sim B$ (recordamos que esa notación solo nos dice que los sistemas $AX=0$ y $BX=0$ son equivalentes).
Correspondiendo a estas operaciones definimos las matrices elementales:
Definición. Una matriz $A\in M_n(F)$ es una matriz elemental si se obtiene de $I_n$ al realizar una operación elemental.
Ejemplo 1. La matriz
\begin{align*}
B= \begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 1\end{pmatrix}
\end{align*}
es una matriz elemental, pues se obtiene al intercambiar el primer y segundo renglón de $I_3$.
Observamos que las matrices elementales son cuadradas. Tenemos entonces tres tipos de matrices elementales:
- Matrices de transposición: aquellas que resultan de intercambiar dos renglones de $I_n$.
- Matrices de dilatación: aquellas obtenidas de $I_n$ multiplicando uno de sus renglones por un escalar distinto de cero.
- Matrices de transvección: son las que obtenemos de $I_n$ al añadir el múltiplo de un renglón a otro renglón.
Una sencilla, pero crucial observación es la siguiente:
Proposición. Sea $A\in M_{m,n}(F)$ una matriz. Realizar una operación elemental en $A$ es equivalente a multiplicar a $A$ por la izquierda por la matriz elemental en $M_{m}(F)$ correspondiente a la operación.
Demostración: Si $E$ es una matriz de $m\times m$ y $A\in M_{m,n}(F)$, entonces la $i$-ésima fila de $EA$ es $e_{i1} L_1+ e_{i2} L_2+\dots + e_{im} L_m$ donde $L_1, \dots, L_m$ son las filas de $A$ y $e_{ij}$ es la $(i,j)-$ésima entrada de $E$. El resultado se sigue de las definiciones y haciendo caso por caso, de acuerdo al tipo de operación elemental que se trate.
Por ejemplo, si la operación es un intercambio de filas, entonces $E$ es una matriz de transposición en donde, digamos, se intercambiaron la fila $k$ y la fila $l$. Por lo que mencionamos arriba, las filas $L_i$ con $i\neq k$ y $i\neq l$ permanecen intactas, pues $e_{ij}=1$ si $i=j$ y $0$ en otro caso, de modo que la $i$-ésima fila de $EA$ es simplemente $L_i$. Para la fila $k$ de $EA$, tenemos que $e_{kl}=1$ y si $i\neq k$, entonces $e_{ki}=0$. De esta forma, tendríamos que dicha fila es $L_l$. El análisis de la $l$-ésima fila de $EA$ es análogo.
Los detalles de la demostración anterior, así como las demostraciones para operaciones de reescalamiento y transvección, quedan como tarea moral.
$\square$
Ejemplo 2. Consideremos la matriz $A=\begin{pmatrix} 1 & -2 & 3 & 0\\ 0 & 1 & 0 & 1 \\ -1 & 0 & 3 & 0 \end{pmatrix}$. Vamos a efectuar la transvección que suma $2$ veces la primer fila a la última.
Si la aplicamos a la matriz $A$ nos queda $$A’=\begin{pmatrix} 1 & -2 & 3 & 0 \\ 0 & 1 & 0 & 1 \\ 1 & -4 & 9 & 0 \end{pmatrix}.$$
Para obtener la matriz elemental correspondiente a la transvección, tenemos que aplicársela a la identidad $I_3$. Tras hacer esto nos queda $$\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 2 & 0 &1 \end{pmatrix}.$$
Y en efecto, como afirma la proposición, tenemos que esta matriz que obtuvimos sirve para «aplicar» la transvección pues puedes verificar que si la multiplicamos por la izquierda, tenemos que:
$$\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 2 & 0 &1 \end{pmatrix} \begin{pmatrix} 1 & -2 & 3 & 0\\ 0 & 1 & 0 & 1 \\ -1 & 0 & 3 & 0 \end{pmatrix} = \begin{pmatrix} 1 & -2 & 3 & 0 \\ 0 & 1 & 0 & 1 \\ 1 & -4 & 9 & 0 \end{pmatrix}.$$
$\triangle$
Más adelante…
En la entrada de reducción gaussiana terminaremos de probar que toda matriz puede llevarse mediante operaciones elementales a una matriz en forma escalonada reducida. Más aún, obtendremos un algoritmo sencillo que siempre nos permitirá hacerlo. En el transcurso de este algoritmo siempre tendremos matrices equivalentes entre sí, de modo que esta será una herramienta fundamental para resolver sistemas de ecuaciones lineales.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
- En el ejemplo concreto que hicimos, verifica que en efecto las soluciones fundamentales que obtuvimos son solución al sistema. Verifica también que la suma de las tres también es una solución al sistema. Luego, elige los valores que tú quieras para $x_2,x_5,x_7$ y verifica que esa también es una solución
- ¿Será cierto que la transpuesta de una matriz en forma escalonada reducida también está en forma escalonada reducida? ¿Será cierto que la suma de dos matrices en forma escalonada reducida también es de esta forma?
- Termina los detalles de la demostración de la última proposición.
- Demuestra que toda matriz elemental es invertible, y que su inversa también es una matriz elemental.
- ¿Es cierto que la transpuesta de una matriz elemental es una matriz elemental?
Entradas relacionadas
- Ir a Álgebra Lineal I
- Entrada anterior del curso: Sistemas de ecuaciones lineales y sistemas homogéneos asociados
- Siguiente entrada del curso: Problemas de sistemas de ecuaciones y forma escalonada reducida
Agradecimientos
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»
¡Hola! En la última proposición me parece que hay una errata puesto que el enunciado menciona que A es una matriz cuadrada n, y en la demostración aparece como una matriz de m x n.
Hola Luis Ángel. Gracias, ya realizamos la corrección. También agregamos un ejemplo para que se vea que se vale incluso cuando no son cuadrados.
Hola!
En el ejemplo de la matriz escalonada reducida, aparece una de las ecuaciones del sistema como x3+3×5+x7=0 y en realidad es x3+3×4+x7=0, entonces a partir de ahí los cálculos están mal.
My mistake!
Está todo bien. Disculpen 🙂
Hola Sara. De cualquier forma, gracias por leer atentamente.
Se sabe que en un sistema no homogéneo hay una ecuación que no es independiente porque el detA=0.
Es posible saber cuál es la ec. no independiente sin realizar el procedimiento de matriz escalonada con operaciones elementales ?
Gracias.
Usualmente lo que pasa no es que una ecuación sea la culpable de que el sistema no sea independiente. Más bien, la combinación de ellas es lo que hace que el sistema en total no sea independiente. Por ejemplo, si tienes las ecuaciones $x+y=1$, $2x+y=2$ y $x+2y=3$, no es que ninguna en específico tenga la culpa de que el sistema sea dependiente. Quitando cualquiera de ellas, el sistema se vuelve independiente.
Lo que sí puedes hacer en un sistema dependiente es que por lo menos una (pero quizás más) ecuación se puede escribir como combinación lineal de las otras. Para lograr esto sí hay que pasar de un modo u otro por reducción gaussiana. Justo es el algoritmo que permite «volver concretas» muchas de las tareas de álgebra lineal.
Toda la razón:
Intenté varios conjuntos de 6×6 y solo uno de ellos tenía detAo. Incluyendo la ec. Que sospechaba como no-independiente, resolviendo así el sistema.
Gracias.
Hola Leo gusto en saludarte, queria preguntarte, si me mandaran a determinar la matriz escalonada reducida de una matriz A cualquiera en Z6 (sabemos que Z6 no es un cuerpo) probablemente no pueda hacer todos los pivotes iguales a uno, en ese caso simplemente no existe la matriz escalonada?
Hola. Así es. Es muy importante para que exista la forma escalonada reducida (en el sentido que mencionamos aquí) que se esté trabajando en un campo (cuerpo). Como ejemplo, puedes pensar en la matriz de 2×2 obtenida como 3I, en Z6 (con I la identidad). Como 3 no tiene inverso multiplicativo en Z6, no hay manera de deshacerte de esos 3. Depende de qué estes estudiando exactamente, quizás te interese averiguar sobre la forma normal de Hermite. ¡Saludos!