Archivo de la etiqueta: forma escalonada reducida

Álgebra Lineal I: Forma escalonada reducida

Introducción

En esta entrada tratamos la forma escalonada reducida de una matriz, que es básicamente una forma «bonita» de expresar una matriz que nos permite resolver sistemas de ecuaciones lineales. Luego nos adentramos en la parte de operaciones elementales, que es el primer paso para desarrollar un algoritmo (que luego veremos es la reducción gaussiana) que nos permite llevar a cualquier matriz a su forma escalonada reducida.

En otras palabras, en esta entrada vemos cómo resolver un caso fácil de un sistema de ecuaciones. Más adelante veremos que en realidad cualquier caso puede llevarse al caso fácil con un algoritmo relativamente fácil.

¿Qué es la forma escalonada reducida?

Sea una matriz A con entradas en un campo F. Si R es un renglón de A, diremos que R es una fila cero si todas sus entradas son cero. Si R no es una fila cero, el término principal de R o bien el pivote de R es la primera entrada distinta de cero de la fila. Diremos que A está en forma escalonada reducida si A tiene las siguientes propiedades:

  1. Todas las filas cero de A están hasta abajo de A (es decir, no puede seguirse una fila distina de cero después de una cero).
  2. El término principal de una fila no-cero está estrictamente a la derecha del término principal de la fila de encima.
  3. En cualquier fila distinta de cero, el término principal es 1 y es el único elemento distinto de cero en su columna.

Ejemplo. La matriz I_n está en forma escalonada reducida, así como la matriz cero O_n. La matriz

    \begin{align*}A= \begin{pmatrix} 1 &-1 & 0 &2\\  0 & 0 & 1 & -1\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{align*}

está en forma escalonada reducida. El término principal de la primer fila es 1 y está en la primer columna. El término principal de la segunda fila también es 1, y se encuentra más a la derecha que el término principal de la fila anterior. Además, es la única entrada distinta de cero en su columna.

Sin embargo, la matriz ligeramente distinta

    \begin{align*}B= \begin{pmatrix} 1 &-1 & 5 &2\\ 0 & 0 & 1 & -1\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{align*}

no está en forma escalonada reducida ya que el término principal del segundo renglón no es la única entrada distinta de cero en su columna.

\square

¿Cómo la forma escalonada reducida nos permite resolver sistemas de ecuaciones?

¿Cual es la importancia de la forma escalonada con respecto al problema de resolver sistemas de ecuaciones? Veremos que cualquier matriz se puede poner (de manera algorítmica) en forma escalonada reducida y que esta forma es única. También veremos que si A_{red} es la forma escalonada reducida de una matriz, entonces los sistemas AX=0 y A_{red}X=0 son equivalentes. Además, veremos que resolver el sistema A_{red} X=0 es muy fácil de resolver precisamente por estar en forma escalonada reducida.

Ejemplo. Resolvamos el sistema AX=0 donde A es la matriz que dimos anteriormente, que está en forma escalonada reducida. El sistema asociado es

    \begin{align*}\begin{cases}x_1 -x_2+2x_4&=0\\x_3-x_4&=0\end{cases}.\end{align*}

De la segunda igualdad podemos expresar x_3=x_4 y de la primera x_1=x_2-2x_4. Así, podemos escoger x_2 y x_4 «libremente» y obtener x_3 y x_1 con estas ecuaciones (tenemos, de cierta manera, dos «parámetros libres»), por lo que nuestras soluciones se ven de la forma

    \begin{align*}(a-2b, a, b,b )\end{align*}

con a,b\in F.

\square

En general si A es una matriz en forma escalonada reducida, veamos cómo resolver el sistema AX=0. Las únicas ecuaciones importantes son las que resultan de renglones distintos de cero (pues las otras solo son 0=0) y al estar en forma escalonada reducida, todos los renglones cero están hasta el final. Supongamos que el i-ésimo renglón de A es distinto de cero y su término principal está en la j-ésima columna, así el término principal es a_{ij}=1. La i-ésima ecuación del sistema lineal entonces es de la forma

    \begin{align*}x_j +\sum_{k=j+1}^{n} a_{ik} x_k =0.\end{align*}

Llamamos a x_j la variable pivote del renglón L_i. Así, a cada renglón distinto de cero le podemos asociar una única variable pivote. Todas las demás variables del sistema son llamadas variables libres. Uno resuelve el sistema empezando desde abajo, expresando sucesivamente las variables pivote en términos de las variables libres. Esto nos da la solución general del sistema, en términos de las variables libres, que pueden tomar cualquier valor en F.

Si y_1, \dots, y_s son las variables libres, entonces las soluciones del sistema son de la forma

    \begin{align*}X= \begin{pmatrix}b_{11} y_1 + b_{12} y_2 + \dots+ b_{1s} y_s\\b_{21} y_1+ b_{22} y_2 +\dots+b_{2s} y_s\\\vdots\\b_{n1} y_1 +b_{n2} y_2+ \dots + b_{ns} y_s\end{pmatrix}\end{align*}

para algunos escalares b_{ij}. Esto también se puede escribir como

    \begin{align*}X= y_1 \begin{pmatrix} b_{11} \\ b_{21} \\ \vdots \\ b_{n1}\end{pmatrix}+\dots + y_s \begin{pmatrix} b_{1s} \\ b_{2s}\\ \vdots \\ b_{ns} \end{pmatrix} .\end{align*}

Llamamos a

    \begin{align*} Y_1= \begin{pmatrix} b_{11}\\ b_{21}\\ \vdots \\ b_{n1}\end{pmatrix}, \dots, Y_s= \begin{pmatrix} b_{1s} \\ b_{2s} \\ \vdots \\ b_{ns}\end{pmatrix}\end{align*}

las soluciones fundamentales del sistema AX=0. La motivación para su nombre es fácil de entender: Y_1, \dots, Y_s son soluciones del sistema AX=0 que ‘generan’ todas las otras soluciones, en el sentido que todas las soluciones del sistema AX=0 se obtienen a través de todas las combinaciones lineales de Y_1, \dots, Y_s (correspondiendo a todos los valores posibles de y_1, \dots, y_s).

Un ejemplo para aterrizar los conceptos

Sea A la matriz en forma escalonada reducida dada como sigue

    \begin{align*}A= \begin{pmatrix}1 & 1 & 0 & 0  &-1 & 0 & 2\\ 0 & 0 & 1 & 0 & 3 & 0 & 1\\ 0 & 0 & 0 & 1& 0 & 0 &-1\\ 0 & 0 &0 & 0 & 0 & 1 & 0 \\ 0 & 0 &0 & 0 & 0 & 0 & 0 \end{pmatrix}\end{align*}

y consideremos el sistema homogéneo asociado AX=0. Este se puede escribir como

    \begin{align*}\begin{cases} x_1+x_2-x_5+2x_7&=0\\x_3+3x_5+x_7&=0\\x_4-x_7&=0\\x_6&=0\end{cases}.\end{align*}

Las variables pivote son x_1, x_3, x_4 y x_6, ya que los términos principales aparecen en las columnas 1,3,4 y 6. Eso nos deja a x_2, x_5 y x_7 como variables libres.

Para resolver el sistema, empezamos con la última ecuación y vamos «subiendo», expresando en cada paso las variables pivote en términos de las variables libres. La última ecuación nos da x_6=0. Después, obtenemos x_4=x_7, posteriormente x_3=-3x_5-x_7 y x_1= -x_2+x_5-2x_7. Nunca nos va a pasar que tengamos que expresar a una variable pivote en términos de otra variable pivote, por la condición de que cada pivote es la única entrada no cero en su columna.

Para expresar las soluciones en términos vectoriales, hacemos lo siguiente.

    \begin{align*}X&=\begin{pmatrix}-x_2+x_5 -2x_7\\x_2\\-3x_5-x_7\\x_7\\x_5\\0 \\x_7\end{pmatrix}\\ &= x_2\cdot \begin{pmatrix}-1 \\ 1 \\ 0 \\ 0\\ 0 \\ 0 \\ 0 \end{pmatrix} +x_5\cdot \begin{pmatrix} 1 \\ 0 \\ -3 \\ 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}+x_7 \cdot \begin{pmatrix} -2\\ 0 \\ -1\\ 1 \\ 0 \\ 0 \\1 \end{pmatrix}.\end{align*}

Los tres vectores columna que aparecen del lado derecho de la igualdad son entonces las soluciones fundamentales del sistema AX=0. Todas las soluciones están entonces dadas por la expresión de la derecha, donde x_2, x_5 y x_7 pueden tomar cualquier valor en F.

Una moraleja sobre el número de soluciones

El número de soluciones fundamentales del sistema AX=0 es igual al número total de variables menos el número de variables pivote. Deducimos que el sistema AX=0 tiene como única solución a X=0 si no hay variables libres. Esto es lo mismo que decir que el número de variables pivote es igual al número de columnas de A.

Combinando las observaciones anteriores con el principio de superposición obtenemos el siguiente y muy importante resultado.

Teorema.

  1. Un sistema lineal homogéneo que tiene más variables que ecuaciones tiene soluciones no triviales. Si el campo de coeficientes es infinito (como por ejemplo \mathbb{R} o \mathbb{C}), entonces el sistema tiene infinitas soluciones.
  2. Un sistema lineal consistente AX=b que tiene más variables que ecuaciones tiene al menos dos soluciones, y si el campo es infinito, tiene infinitas soluciones.

¿Cómo llevar una matriz a su forma escalonada reducida? Operaciones elementales

Ahora regresamos al problema de transformar una matriz dada en una matriz con forma escalonada reducida. Para resolver este problema introducimos tres tipos de operaciones que pueden aplicarse a las filas de una matriz. Veremos que gracias a estas operaciones, uno puede transformar cualquier matriz en una en forma escalonada reducida.

Estas operaciones surgen de las manipulaciones cuando resolvemos sistemas lineales: las operaciones más naturales que hacemos cuando resolvemos un sistema de ecuaciones lineales son:

  1. multiplicar una ecuación por un escalar distinto de cero;
  2. añadir una ecuación (o mejor aún, un múltiplo de una ecuación) a otra ecuación diferente;
  3. intercambiar dos ecuaciones.

Observamos que estas operaciones son reversibles: si por ejemplo, multiplicamos una ecuación por un escalar a\neq 0, podemos multiplicar la misma ecuación por \frac{1}{a} para recuperar la ecuación original. Queda claro que realizando una cantidad finita de estas operaciones en un sistema obtenemos un sistema con el mismo conjunto de soluciones que el sistema original (en nuestra terminología más barroca, un sistema nuevo equivalente al original). Estas operaciones en el sistema pueden verse como operaciones directamente en la matriz. Más precisamente:

Definición. Una operación elemental en las filas de una matriz A en M_{m,n}(F) es una operación de uno de los siguientes tipos:

  1. cambio de filas: intercambiar dos renglones de la matriz A,
  2. reescalar una fila: multiplicar una fila de la matriz A por un escalar c en F distinto de cero,
  3. transvección: reemplazar una fila L por L+cL' para algún escalar c en F y otra fila L' de A diferente a L.

La discusión previa muestra que si A es una matriz y B se obtiene a partir de A al aplicar una sucesión finita de operaciones elementales entonces A\sim B (recordamos que esa notación solo nos dice que los sistemas AX=0 y BX=0 son equivalentes).

Correspondiendo a estas operaciones definimos las matrices elementales:

Definición. Una matriz A\in M_n(F) es una matriz elemental si se obtiene de I_n al realizar una operación elemental.

Ejemplo. La matriz

    \begin{align*}B= \begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 1\end{pmatrix}\end{align*}

es una matriz elemental, pues se obtiene al intercambiar el primer y segundo renglón de I_3.

Observamos que las matrices elementales son cuadradas. Tenemos entonces tres tipos de matrices elementales:

  1. Matrices de transposición: aquellas que resultan de intercambiar dos renglones de I_n.
  2. Matrices de dilatación: aquellas obtenidas de I_n multiplicando uno de sus renglones por un escalar distinto de cero.
  3. Matrices de transvección: son las que obtenemos de I_n al añadir el múltiplo de un renglón a otro renglón.

Una sencilla, pero crucial observación es la siguiente:

Proposición. Sea A\in M_n(F) una matriz. Realizar una operación elemental en A es equivalente a multiplicar a A por la izquierda por la matriz elemental correspondiente a la operación.

Demostración: Si E es una matriz de m\times m y A\in M_{m,n}(F), entonces la i-ésima fila de EA es e_{i1} L_1+ e_{i2} L_2+\dots + e_{im} L_m donde L_1, \dots, L_m son las filas de A y e_{ij} es la (i,j)-ésima entrada de E. El resultado se sigue de las definiciones y haciendo caso por caso, de acuerdo al tipo de operación elemental que se trate.

Por ejemplo, si la operación es un intercambio de filas, entonces E es una matriz de transposición en donde, digamos, se intercambiaron la fila k y la fila l. Por lo que mencionamos arriba, las filas L_i con i\neq k y i\neq l permanecen intactas, pues e_{ij}=1 si i=j y 0 en otro caso, de modo que la i-ésima fila de EA es simplemente L_i. Para la fila k de EA, tenemos que e_{kl}=1 y si i\neq k, entonces e_{ki}=0. De esta forma, tendríamos que dicha fila es L_l. El análisis de la l-ésima fila de EA es análogo.

Los detalles de la demostración anterior, así como las demostraciones para operaciones de reescalamiento y transvección, quedan como tarea moral.

\square

Más adelante…

En la entrada de reducción gaussiana terminaremos de probar que toda matriz puede llevarse mediante operaciones elementales a una matriz en forma escalonada reducida. Más aún, obtendremos un algoritmo sencillo que siempre nos permitirá hacerlo. En el transcurso de este algoritmo siempre tendremos matrices equivalentes entre sí, de modo que esta será una herramienta fundamental para resolver sistemas de ecuaciones lineales.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • En el ejemplo concreto que hicimos, verifica que en efecto las soluciones fundamentales que obtuvimos son solución al sistema. Verifica también que la suma de las tres también es una solución al sistema. Luego, elige los valores que tú quieras para x_2,x_5,x_7 y verifica que esa también es una solución
  • ¿Será cierto que la transpuesta de una matriz en forma escalonada reducida también está en forma escalonada reducida? ¿Será cierto que la suma de dos matrices en forma escalonada reducida también es de esta forma?
  • Termina los detalles de la demostración de la última proposición.
  • Demuestra que toda matriz elemental es invertible, y que su inversa también es una matriz elemental.
  • ¿Es cierto que la transpuesta de una matriz elemental es una matriz elemental?