Archivo de la etiqueta: matrices elementales

Cálculo Diferencial e Integral III: Sistemas de ecuaciones lineales

Por Alejandro Antonio Estrada Franco

Introducción

En esta entrada daremos un repaso a la teoría de sistemas de ecuaciones lineales. En caso de que quieras leer una versión detallada, puedes comenzar con la entrada de Sistemas de ecuaciones lineales y sistemas homogéneos asociados que forma parte del curso Álgebra Lineal I aquí en el blog.

Nuestra motivación para este repaso comienza como sigue. Supongamos que $T:\mathbb{R}^n \rightarrow \mathbb{R}^m$ es una transformación lineal. Tomemos un vector $\bar{w}\in \mathbb{R}^m$. Es muy natural preguntarse qué vectores $\bar{v}$ hay en $\mathbb{R}^n$ tales que $T(\bar{v})=\bar{w}$, en otras palabras, preguntarse cuál es la preimagen de $\bar{w}$.

Sistemas de ecuaciones lineales

Continuando con la situación planteada en la introducción, si $A$ es la representación matricial de $T$ en una cierta base $\beta$, podemos contestar la pregunta planteada resolviendo la ecuación matricial $AX=B$ donde $X$, $B$ son las representaciones de los vectores $\bar{v}$, $\bar{w}$ en la base $\beta$, respectivamente. Una vez llegado a este punto, la ecuación $AX=B$ nos conduce a que se deban cumplir varias igualdades. Veamos cuáles son en términos de las entradas de $A$, $X$ y $Y$. Pensemos que $$A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix}.$$

Pensemos también que $X$ es el vector columna con entradas (incógnitas) $x_1,\ldots,x_n$, y que $B$ es el vector columna con entradas $b_1,\ldots,b_m$.

Al realizar las operaciones, la igualdad $AX=B$ se traduce en que se deban cumplir todas las siguientes ecuaciones simultáneamente:

\begin{equation}\left\{
\begin{matrix} a_{11}x_{1} + & \dots & + a_{1n}x_{n} & = b_{1} \\
\vdots & \ddots & \vdots & \vdots \\
a_{m1}x_{1} + & \dots & + a_{mn}x_{n} & = b_{m}
\end{matrix}\right.
\label{eq:sistema}
\end{equation}

Definición. Un sistema de $m$ ecuaciones lineales con $n$ incógnitas es un sistema de ecuaciones de la forma \eqref{eq:sistema}. Como discutimos arriba, al sistema también lo podemos escribir de la forma $AX=B$. A la matriz $A$ le llamamos la matriz de coeficientes. Al vector $X$ le llamamos el vector de incógnitas.

Resolver el sistema \eqref{eq:sistema} se refiere a determinar todos los posibles valores que pueden tomar las incógnitas $x_1,\ldots,x_n$ de manera que se cumplan todas las ecuaciones dadas.

Definición. Diremos que dos sistemas de ecuaciones son equivalentes si tienen las mismas soluciones.

Un resultado importante que relaciona a los sistemas de ecuaciones con las operaciones elementales que discutimos con anterioridad es el siguiente.

Proposición. Sea $A\in M_{m,n}(\mathbb{R})$ y $e$ una operación elemental cualquiera (intercambio de renglones, reescalamiento de renglón, o transvección). Entonces el sistema de ecuaciones $AX=B$ es equivalente al sistema de ecuaciones $e(A)X=e(B)$.

En otras palabras, si comenzamos con un sistema de ecuaciones $AX=B$ y aplicamos la misma operación elemental a $A$ y a $B$, entonces obtenemos un sistema equivalente. Veamos como ejemplo un esbozo de la demostración en el caso del reescalamiento de vectores. Los detalles y las demostraciones para las otras operaciones elementales quedan como ejercicio.

Demostración. Consideremos el rescalamiento $e$ de la $j$-ésima columna de una matriz por un factor $r$. Veremos que $e(A)X=e(B)$. Tomemos

\[ A=\begin{pmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \dots & a_{mn} \end{pmatrix}, B= \begin{pmatrix} b_{1} \\ \vdots \\ b_{m} \end{pmatrix}, X=\begin{pmatrix} x_{1} \\ \vdots \\ x_{n} \end{pmatrix} \]

Entonces la ecuación matricial $AX=B$ nos produce el siguiente sistema de ecuaciones lineales:
\[ \left\{\begin{matrix} a_{11}x_{1}+ & \dots & +a_{1n}x_{n}=b_{1} \\ \vdots & \ddots & \vdots \\ a_{m1}x_{1}+ & \dots & +a_{mn}x_{n}=b_{m}. \end{matrix} \right.\]

Tomemos una solución del sistema: \[ X’= \begin{pmatrix} x_{1}’\\ \vdots \\ x_{n}’ \end{pmatrix} \]

La ecuación matricial $e(A)X=e(B)$ nos produce el siguiente sistema de ecuaciones: \[ \left\{\begin{matrix} a_{11}x_{1}+ & \dots & +a_{1n}x_{n}=b_{1} \\ \vdots & \ddots & \vdots \\ ra_{j1}x_{1}+ & \dots & +ra_{jn}x_{n}=rb_{j} \\ \vdots & \ddots \ & \vdots \\ a_{m1}x_{1}+ & \dots & +a_{mn}x_{n}=b_{m}. \end{matrix}\right. \]

Ahora, de cada una de las $n$ ecuaciones, excepto la $j$-ésima, sabemos que se solucionan al sustituir $x_{1}’, \dots ,x_{m}’$, resta revisar la $j$-ésima ecuación. Lo que sí sabemos de que $X’$ sea solución es que $$a_{j1}x_{1}’+ \dots +a_{jn}x_{n}’=b_{j}.$$ Así, al multiplicar por $r$ de ambos lados $ra_{j1}x_{1}’+ \dots + ra_{jn}x_{n}’=rb_{j}$. Así obtenemos que $X’$ satisface también a $e(A)X=e(B)$. Inversamente si una solución satisface al sistema $e(A)X=e(B)$ también lo hace para $AX=Y$. Te recomendamos revisar los detalles por tu cuenta.

$\square$

Soluciones a sistemas de ecuaciones lineales

La teoría de sistemas de ecuaciones lineales nos dice que tenemos tres posibles situaciones que se pueden presentar cuando estamos resolviendo un sistema de ecuaciones lineales en $\mathbb{R}$: no hay solución, hay una única solución, o tenemos infinidad de soluciones. Por ejemplo, se puede descartar que haya exactamente dos soluciones. En cuanto sucede esto, la cantidad de soluciones se dispara a una infinidad

Haremos una discusión de cuándo se presenta cada caso. De acuerdo con la sección anterior, cualquier operación elemental pasa un sistema de ecuaciones a uno equivalente. Además, de acuerdo con el teorema de reducción gaussiana, cualquier matriz puede ser llevada a la forma escalonada reducida. Así, al aplicar tanto a $A$ como a $B$ las operaciones elementales que llevan $A$ a su forma escalonada reducida $A_{red}$, llegamos a un sistema equivalente $A_{red}X=C$. El comportamiento del conjunto solución de $AX=B$ se puede leer en este otro sistema equivalente como sigue:

  1. Sin solución. El sistema $AX=B$ no tiene solución si en $A_{red}X=C$ hay una igualdad lineal del estilo $0x_{j1}+\dots +0x_{jn}=c_j$, con $c_j\neq 0$. En otras palabras, si en $A_{red}$ hay una fila $j$ de ceros y la entrada $c_j$ es distinta de cero.
  2. Infinidad de soluciones. El sistema $AX=B$ tiene una infinidad de soluciones si tiene solución, y además hay por lo menos una columna $k$ de $A_{red}$ en la que no haya pivote de ninguna fila. Esta columna $k$ corresponde a una variable libre $x_k$ que puede tomar cualquier valor, y el sistema tiene soluciones sin importar el valor que se le de a esta variable.
  3. Solución única. Un sistema de ecuaciones con solución, pero sin variables libres tiene una única solución. Esto se puede leer en la matriz $A_{red}$, pues se necesita que todas las columnas tengan un pivote de alguna fila.

Pensemos un poco a qué se deben los comportamientos anteriores. Pensemos en que ya llegamos a $A_{red}X=C$. Iremos determinando los posibles valores de las entradas de $X$ de abajo hacia arriba, es decir, en el orden $x_n, x_{n-1},\ldots, x_1$. Si $x_k$ es variable libre, pongamos el valor que sea. Si $x_k$ tiene el pivote de, digamos, la fila $j$, entonces la ecuación $j$ nos dice \[0+\dots + 0 + x_{k}+\dots +a_{jn}x_{n}=b_{j}.\] Esto nos diría que \[x_{k}=b_{j}-a_{j(k+1)}x_{k+1}-\dots -a_{jn}x_{n},\] así que hemos logrado expresar a $x_k$ en términos de las variables ya determinadas $x_{k+1},\dots x_{n}$.

Matrices equivalentes por filas

Definición. Consideremos $I\in M_{m}(\mathbb{R})$ la matriz identidad de tamaño $m$. Una matriz elemental será una matriz que se obtenga de la identidad tras aplicar una operación elemental.

Definición. Sean $A, B\in M_{m,n}(\mathbb{R})$. Diremos que $A$ es equivalente por filas a $B$ si $A$ se puede obtener al aplicar una sucesión finita de operaciones elementales a $B$.

Se puede demostrar que «ser equivalente por filas» es una relación de equivalencia en $M_{m,n}(\mathbb{R})$. Así mismo, se puede demostrar en general que si $e$ es una operación elemental, entonces $e(A)$ es exactamente la misma matriz que multiplicar la matriz elemental $e(I)$ por la izquierda por $A$, es decir, $e(A)=e(I)A$. Como tarea moral, convéncete de ambas afirmaciones.

Para realizar la demostración, quizás quieras auxiliarte de la siguiente observación. Tomemos una matriz $B\in M_{m,n}(\mathbb{R})$ y pensemos en cada columna de $B$ como un vector columna:

\[ B_{1} =\begin{pmatrix} B_{11} \\ \vdots \\ B_{m1} \end{pmatrix} \hspace{1cm} \cdots \hspace{1cm} B_{n} =\begin{pmatrix} B_{1n} \\ \vdots \\ B_{mn} \end{pmatrix}. \]

Tomemos ahora una matriz $A\in M_{p,m}$. Tras realizar las operaciones, se puede verificar que la matriz $AB$ tiene como columnas a los vectores columna $AB_1, AB_2,\ldots,AB_n$.

El siguiente teorema nos da una manera alternativa de saber si dos matrices son equivalentes por filas.

Teorema. Sean $A, B\in M_{m\times n}(\mathbb{R})$. Se tiene que $B$ es equivalente por filas a $A$ si y sólo si $B=PA$, donde $P$ es una matriz en $M_m(\mathbb{R})$ obtenida como producto de matrices elementales.

Demostración. Por la discusión anterior, si $B$ es equivalente por filas a $A$, $A$ resulta de la aplicación de una sucesión finita de operaciones elementales a $B$ o, lo que es lo mismo, resulta de una aplicación finita de productos de matrices elementales por la izquierda. Por otro lado, si $B=PA$, con $P=E_{k}\cdot … \cdot E_{1}$ producto de matrices elementales, tenemos que $E_{1}A$ es equivalente por filas a $A$, que $E_{2}(E_{1}A)$ es equivalente por filas a $E_{1}A$, que $E_{3}(E_2(E_1(A)))$ equivalente por filas a $E_2(E_1(A))$, y así sucesivamente. Usando que ser equivalente por filas es transitivo (por ser relación de equivalencia), concluimos que $B$ es equivalente por filas a $A$.

$\square$

¿Qué sucede con los determinantes y las operaciones elementales? La siguiente proposición lo resume.

Proposición. Sea $A$ una matriz en $M_n(\mathbb{R})$ con determinante $\det(A)$.

  • Si se intercambian dos filas, el determinante se vuelve $-\det(A)$.
  • Si se reescala una fila por un real $r\neq 0$, el determinante se vuelve $r\det(A)$.
  • Si se hace una transvección, el determinante no cambia.

Observa que, en particular, si $\det(A)\neq 0$, entonces sigue siendo distinto de cero al aplicar operaciones elementales.

Matrices invertibles y sistemas de ecuaciones lineales

En muchas ocasiones nos encontramos en cálculo de varias variables con funciones que van de $\mathbb{R}^n$ a sí mismo. Si la función que estamos estudiando es una transformación lineal, entonces corresponde a una matriz cuadrada en $M_n(\mathbb{R})$. En estos casos hay otro concepto fundamental que ayuda, entre otras cosas, para resolver sistemas de ecuaciones lineales: el de matriz invertible. Veremos a continuación que esto interrelaciona a las matrices, las matrices elementales, los sistemas de ecuaciones lineales y a los determinantes.

Definición. Una matriz $A$ cuadrada es invertible por la izquierda (resp. derecha) si existe una matriz $B$ tal que $BA=I$ (resp. $AB=I$). A $B$ le llamamos la inversa izquierda (resp. derecha) de $A$. A una matriz invertible por la derecha y por la izquierda, donde la inversa izquierda sea igual a la derecha, simplemente se le llama invertible.

Se puede demostrar que, cuando existe, la matriz izquierda (o derecha) es única. Esto es sencillo. Se puede demostrar también que si $B$ es inversa izquierda y $B’$ es inversa derecha, entonces $B=B’$, lo cual no es tan sencillo. Además, se cumplen las siguientes propiedades de matrices invertibles.

Proposición. Sean $A, B\in M_n(\mathbb{R})$

  1. Si $A$ es invertible, también lo es $A^{-1}$ y $(A^{-1})^{-1}=A$.
  2. Si $A$ y $B$ son invertibles, también lo es $AB$ y $(AB)^{-1}=B^{-1} A^{-1}$.

Demostración. El inciso 1 es claro; para el inciso 2 tenemos \[ (AB)(B^{-1} A^{-1})=A(BB^{-1})A^{-1}=A(I)A^{-1}=AA^{-1}=I\] \[=B^{-1}(I)B=B^{-1}(A^{-1}A)B=(B^{-1}A^{-1})(AB) \].

$\square$

Veamos ahora cómo se conecta la noción de invertibilidad con la de matrices elementales. Como parte de la tarea moral, cerciórate de que cualquiera de las tres operaciones elementales para matrices son invertibles. Es decir, para cada operación elemental, piensa en otra operación elemental que aplicada sucesivamente a la primera nos de la matriz original. Con más detalle; si denotamos con $e$ a una operación elemental (puede ser cualquiera) denotamos como $e^{-1}$ a la segunda a la cual llamaremos inversa de $e$; y estas cumplen $e(e^{-1})(A)=A=e^{-1}(e(A))$ para cualquier matriz $A$ a la que se le pueda aplicar $e$.

Proposición. Toda matriz elemental es invertible.

Demostración. Supongamos que $E$ una matriz elemental correspondiente a la operación unitaria $e$. Si $e^{-1}$ es la operación inversa de $e$ y $E_{1}=e^{-1}(I)$ tenemos: \[ EE_{1}=e(E_{1})=e(e^{-1}(I))=I,\] y así mismo tenemos \[E_{1}E=e_{1}(E)=e_{1}(e(I))=I.\] De esta manera $E$ es invertible y su inversa es $E_{1}$.

$\square$

El resultado anterior habla sólo de la invertibilidad de matrices elementales, pero podemos usar a estas para caracterizar a las matrices invertibles.

Teorema. Sea $A\in M_n(\mathbb{R})$, los siguientes enunciados son equivalentes:

  1. $A$ es invertible
  2. $A$ es equivalente por filas a la matriz identidad
  3. $A$ es producto de matrices elementales

Demostración. $1\Rightarrow 2)$. Supongamos que $A$ invertible, y usemos el teorema de reducción Gaussiana para encontrar la forma escalonada reducida $A_{red}$ de $A$ mediante una sucesión de operaciones elementales. Por el teorema de la sección de matrices equivalentes por filas, tenemos que $R=E_{k}\cdots E_{1}A$, donde $E_{k},\dots ,E_{1}$ son matrices elementales. Cada $E_{i}$ es invertible, y $A$ es invertible. Por la proposición anterior, tenemos entonces que $A_{red}$ es invertible. Se puede mostrar que entonces ninguna fila de $A_{red}$ puede consistir de puros ceros (verifícalo de tarea moral), de modo que toda fila de $A$ tiene pivote (que es igual a $1$). Como hay $n$ filas y $n$ columnas, entonces hay exactamente un $1$ en cada fila y en cada columna. A $A_{red}$ no le queda otra opción que ser la matriz identidad.

$2\Rightarrow 3)$. Si $A$ es equivalente por filas a $I$, entonces hay operaciones elementales que la llevan a $I$. Como ser equivalente por filas es relación de equivalencia, existen entonces operaciones elementales que llevan $I$ a $A$. Pero entonces justo $A$ se obtiene de $I$ tras aplicar un producto (por la izquierda) de matrices elementales. Por supuesto, en este producto podemos ignorar a $I$ (o pensarla como un reescalamiento por $1$).

$3\Rightarrow 1)$. Finalmente como cada matriz elemental es invertible y todo producto de matrices invertibles es invertible tenemos que 3 implica 1.

$\square$

Ya que entendemos mejor la invertibilidad, la podemos conectar también con la existencia y unicidad de soluciones en sistemas de ecuaciones lineales.

Teorema. Sea $A\in M_{n}(\mathbb{R})$; las siguientes afirmaciones son equivalentes:

  1. $A$ es invertible.
  2. Para todo $Y$, el sistema $AX=Y$ tiene exactamente una solución $X$.
  3. Para todo $Y$, el sistema $AX=Y$ tiene al menos una solución $X$.

Demostración. $1\Rightarrow 2)$. Supongamos $A$ invertible. Tenemos que $X=A^{-1}Y$ es solución pues $AX=A(A^{-1})Y=IY=Y$. Veamos que la solución es única. Si $X$ y $X’$ son soluciones, tendríamos $AX=Y=AX’$. Multiplicando por $A^{-1}$ por la izquierda en ambos lados de la igualdad obtenemos $X=X’$.

$2\Rightarrow 3)$. Es claro pues la única solución es, en particular, una solución.

$3\Rightarrow 1)$. Tomemos los vectores canónicos $\hat{e}_1,\hat{e}_2,\ldots,\hat{e}_n$ de $\mathbb{R}^n$. Por $(3)$ tenemos que todos los sistemas $AX=\hat{e}_1, \ldots, AX=\hat{e}_n$ tienen solución. Tomemos soluciones $B_1,\ldots,B_n$ para cada uno de ellos y tomemos $B$ como la matriz con columnas $B_1,\ldots, B_n$. Por el truco de hacer el producto de matrices por columnas, se tiene que las columnas de $AB$ son $AB_1=\hat{e}_1,\ldots, AB_n=\hat{e}_n$, es decir, $AB$ es la matriz identidad.

$\square$

En la demostración anterior falta un detalle importante. ¿Puedes encontrar cuál es? Está en la demostración $3\Rightarrow 1)$. Si quieres saber cuál es y cómo arreglarlo, puedes consultar la entrada Mariposa de 7 equivalencias de matrices invertibles.

Terminamos la teoría de esta entrada con un resultado que conecta invertibilidad y determinantes.

Proposición. Sea $A\in M_{n}(\mathbb{R})$. $A$ es invertible, si y sólo si, $det(A)\neq 0$.

Demostración. Si $A$ es invertible, entonces se cumple la ecuación $I=AA^{-1}$. Aplicando determinante de ambos lados y usando que es multiplicativo: $$1=det(I)=det(AA^{-1})=det(A)det(A^{-1}).$$ Como al lado izquierdo tenemos un $1$, entonces $\det(A)\neq 0$.

Si $det(A)\neq 0$, llevemos $A$ a su forma escalonada reducida $A_{red}$. Por la observación hecha al final de la sección de matrices elementales, se tiene que $\det(A_{red})\neq 0$. Así, en cada fila tenemos por lo menos un elemento no cero. Como argumentamos anteriormente, esto implica $A_{red}=I$. Como $A$ es equivalente por filas a $I$, entonces es invertible.

$\square$

Mas adelante…

Continuaremos estableciendo herramientas de Álgebra lineal que usaremos en el desarrollo de los temas subsiguientes. En la siguiente entrada hablaremos de eigenvalores y eigenvectores. Con ellos, expondremos un método que proporciona una representación matricial sencilla simple para cierto tipos de transformaciones lineales.

Tarea moral

  1. Demuestra que la relación «es equivalente por filas» es una relación de equivalencia en $M_{m,n}(\mathbb{R})$.
  2. Sea $A\in M_{m,n}\mathbb{R}$. Verifica que para cualquier operación elemental $e$ de cualquiera de los tres tipos se cumple que $e(A)X=e(B)$ es equivalente a $AX=B$. Deberás ver que cualquier solución de uno es solución del otro y viceversa.
  3. Demuestra que si $A$ es invertible, también lo es $A^{-1}$ y que $(A^{-1})^{-1}=A$. Verifica la invertibilidad izquierda y derecha.
  4. Demuestra que cualquiera de las tres operaciones elementales para matrices son invertibles. Es decir, para cada operación elemental, hay otra que al aplicarla sucesivamente nos regresa a la matriz original.
  5. Prueba que una matriz invertible tiene por lo menos un elemento distinto de cero en cada fila, y por lo menos un elemento distinto de cero en cada columna.

Entradas relacionadas

Álgebra Lineal I: Teorema de reducción gaussiana

Por Julio Sampietro

Introducción

Llegamos a uno de los resultados más importantes del álgebra lineal: el teorema de reducción gaussiana. Como mencionamos en una entrada previa, el teorema nos proporcionará un algoritmo que nos permitirá resolver muchos problemas prácticos: resolver sistemas lineales, invertir matrices, así como temas que veremos más adelante, como determinar la independencia lineal de vectores.

El teorema nos dice que cualquier matriz puede llevarse a una en forma escalonada reducida con solo una cantidad finita de operaciones elementales. La prueba además nos dice cómo hacerlo de una manera más o menos sencilla. Aparte de la demostración, damos una receta un poco más coloquial de cómo trabajar con el algoritmo y finalmente damos un ejemplo, muy importante para aclarar el procedimiento.

Sugerencia antes de empezar

El algoritmo que veremos es uno de esos resultados que es fácil de seguir para una matriz en concreto, pero que requiere de un buen grado de abstracción para entender cómo se demuestra en general. Una fuerte recomendación es que mientras estés leyendo la demostración del siguiente teorema, tengas en mente alguna matriz muy específica, y que vayas realizando los pasos sobre ella. Puedes usar, por ejemplo, a la matriz $$A=\begin{pmatrix} 0 & 0 & 4 & -2 \\ 0 & 3 & -1 & 0 \\ 0& -3 & 5 & -2 \end{pmatrix}.$$

El teorema de reducción gaussiana

Teorema. Cualquier matriz $A\in M_{m,n}(F)$ puede llevarse a una en forma escalonada reducida realizando una cantidad finita de operaciones elementales en sus filas.

Demostración: Daremos una demostración algorítmica. Sea $A\in M_{m,n}(F)$ cualquier matriz. Para auxiliarnos en el algoritmo, vamos a tener registro todo el tiempo de las siguientes dos variables:

  • $X$ es la columna que «nos toca revisar».
  • $Y$ es la cantidad de «filas no triviales» que hemos encontrado.

La variable $X$ empieza siendo $1$ y la variable $Y$ empieza siendo $0$.

Haremos los siguientes pasos:

Paso 1. Revisaremos la columna $X$ a partir de la fila $Y+1$ (osea, al inicio $Y=0$, así que revisamos toda la columna). Si todas estas entradas son iguales a $0$, entonces le sumamos $1$ a $X$ (avanzamos hacia la derecha) y si $X<n$, volvemos a hacer este Paso 1. Si $X=n$, vamos al paso 7.

Paso 2. En otro caso, existe alguna entrada distinta de cero en la columna $X$, a partir de la fila $Y+1$. Tomemos la primera de estas entradas. Supongamos que sucede en la fila $i$, es decir, que es la entrada $a_{iX}$. Al número en esta entrada $a_{iX}$ le llamamos $x$.

Paso 3. Hacemos un intercambio entre la fila $i$ y la fila $Y+1$. Puede pasar que $i=Y+1$, en cuyo caso no estamos haciendo nada. Independientemente del caso, ahora el número en la entrada $(X,Y+1)$ es $x\neq 0$.

Paso 4. Tomamos la fila $Y+1$ y la multiplicamos por el escalar $1/x$. Esto hace que ahora sea la primer entrada en su fila distinta de cero, y además que sea igual a $1$.

Paso 5. De ser necesario, hacemos transvecciones para hacer el resto de las entradas de la columna $X$ iguales a $0$. Esto lo podemos hacer pues, si por ejemplo la entrada $a_{iX}\neq 0$, entonces la transvección que a la $i$-ésima fila le resta $a_{iX}$ veces la $(Y+1)$-ésima fila hace que la entrada $(i,X)$ se anule.

Paso 6. Le sumamos $1$ a $Y$ (para registrar que encontramos una nueva fila no trivial) y le sumamos $1$ a $X$ (para avanzar a la columna de la derecha). Si $X<n$, vamos al Paso 1. Si $X=n$, vamos al Paso 7.

Paso 7. Reportamos la matriz obtenida como $A_{red}$, la forma escalonada reducida de $A$.

Mostremos que en efecto obtenemos una matriz escalonada reducida. El Paso 3 garantiza que las únicas filas cero están hasta abajo. El Paso 4 garantiza que todos los pivotes son iguales a 1. El ir recorriendo las columnas de izquierda a derecha garantiza que los pivotes quedan «escalonados», es decir de abajo hacia arriba quedan de izquierda a derecha. El Paso 5 garantiza que cada pivote es la única entrada no cero de su columna.

$\square$

El procedimiento descrito en el teorema se llama reducción gaussiana.

Como vimos en la entrada anterior realizar una operación elemental es sinónimo de multiplicar por una matriz elemental. Como el teorema nos dice que podemos obtener una matriz en forma escalonada reducida realizando una cantidad finita de operaciones elementales, se sigue que podemos obtener una matriz en forma escalonada reducida multiplicando por la izquierda por un número finito de matrices elementales. Al asociar todas estas matrices elementales en un único producto, obtenemos la demostración del siguiente corolario.

Corolario. Para cualquier matriz $A\in M_{m,n}(F)$ podemos encontrar una matriz $B\in M_{m}(F)$ que es un producto finito de matrices elementales y que satisface qu $A_{red}=BA$.

Un tutorial de reducción gaussiana más relajado

Si bien el teorema nos da la manera formal de hacer el algoritmo, el proceso es en realidad bastante intuitivo una vez que se entiende. Para esto explicamos en unos cuantos pasos en términos más sencillos como hacer la reducción:

  1. Buscamos la primer columna de la matriz que no tenga puros ceros.
  2. Una vez encontrada, buscamos la primer entrada (de arriba hacia abajo) que no sea cero.
  3. Pasamos el renglón con esa entrada hasta arriba haciendo un cambio de renglones.
  4. Multiplicamos por el inverso de esa entrada a todo el renglón, para quedarnos así con un $1$ hasta arriba.
  5. Sustraemos múltiplos del primer renglón a todos los otros renglones para que todo lo que esté abajo del $1$ sea cero.
  6. Buscamos la siguiente columna tal que no sea cero abajo del primer renglón.
  7. Repetimos los pasos anteriores, solo que en lugar de pasar nuestro renglón «hasta arriba» solo lo colocamos en el segundo lugar, y así sucesivamente.

Un ejemplo de reducción gaussiana

La mejor manera de entender el algoritmo de reducción gaussiana es con un ejemplo. Usemos el algoritmo para reducir la matriz

\begin{align*}
A=\begin{pmatrix} 0 & 1 & 2 & 3 &4\\ -1 & 0 &1 & 2 &3 \\ 0 & 1 & 1 & 1 &1\\ 3 & 1 &-1 & 0 & 2\end{pmatrix}\in M_{4,5}(\mathbb{R}).
\end{align*}

Aplicando los pasos en orden: Primero identificamos la primer columna que no sea idénticamente cero, y vemos que la primera columna no tiene puros ceros. La primer entrada que no es cero está en el segundo renglón. Así cambiamos el primer y segundo renglón de lugar para subir esa entrada y obtener

\begin{align*}
A_1=\begin{pmatrix} -1 & 0 &1 & 2 &3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 3 & 1 &-1 & 0 & 2\end{pmatrix}.
\end{align*}

Ahora que la primer entrada del primer renglón es distinta de cero, multiplicamos el primer renglón por $\frac{1}{-1}=-1$ y obtenemos

\begin{align*}
A_2=\begin{pmatrix} 1 & 0 &-1 & -2 &-3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 3 & 1 &-1 & 0 & 2\end{pmatrix}.
\end{align*}

Ahora queremos quitar el $3$ del último renglón. Para esto, multiplicamos por $-3$ el primer renglón y lo sumamos al último y nos queda

\begin{align*}
A_3&=\begin{pmatrix} 1 & 0 &-1 & -2 &-3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 3-3 & 1-3\cdot 0 &-1-3\cdot (-1) & 0-3\cdot (-2) & 2-3\cdot (-3)\end{pmatrix}\\ &=\begin{pmatrix} 1 & 0 &-1 & -2 &-3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 0 & 1&2 & 6 & 11\end{pmatrix}.
\end{align*}

Ya tenemos entonces nuestra primera columna en forma escalonada reducida, pasemos a la segunda. Ya tenemos un $1$ en la segunda entrada de la segunda columna, por lo que no hace falta hacer un cambio de renglón o multiplicar por un inverso. Basta entonces con cancelar las otras entradas de la columna, para eso sustraemos el segundo renglón del tercero y cuarto, para obtener

\begin{align*}
A_4&= \begin{pmatrix} 1 & 0 & -1 & -2 & -3 \\ 0 & 1 & 2 & 3 &4 \\ 0-0 & 1-1 & 1-2 & 1-3 & 1-4\\ 0 -0 & 1-1& 2-2 & 6-3 & 11-4\end{pmatrix}\\
&= \begin{pmatrix}
1 & 0 &-1 & -2 &-3\\ 0 & 1 & 2 & 3 &4 \\ 0 & 0 & -1 & -2 & -3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}.
\end{align*}

Seguimos entonces con la tercera columna, y observamos que la entrada $(3,3)$ es $-1$, entonces la transformamos en un $1$ multiplicando el tercer renglón por $\frac{1}{-1}=-1$.

\begin{align*}
A_5=\begin{pmatrix}
1 & 0 &-1 & -2 &-3\\ 0 & 1 & 2 & 3 &4 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}.
\end{align*}

Ahora tenemos que cancelar las entradas de la tercer columna, para eso sumamos $-2$ veces el tercer renglón al segundo y una vez el tercer renglón al primero:

\begin{align*}
A_6&=\begin{pmatrix}
1+0 & 0+0 &-1+1 & -2+2 &-3+3\\ 0-2\cdot 0 & 1-2\cdot 0 & 2-2\cdot 1 & 3-2\cdot2 &4-2\cdot3 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}\\
&= \begin{pmatrix}
1 & 0 &0 & 0 &0\\ 0 & 1 & 0 & -1 &-2 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}.
\end{align*}

Ahora pasamos a la siguiente columna. En la entrada $(4,4)$ tenemos un $3$, pero queremos un $1$, entonces multiplicamos el último renglón por $\frac{1}{3}$:

\begin{align*}
A_7= \begin{pmatrix}
1 & 0 &0 & 0 &0\\ 0 & 1 & 0 & -1 &-2 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &1 & \frac{7}{3}\end{pmatrix}.\end{align*}

Finalmente, cancelamos las entradas restantes de los otros renglones sustrayendo dos veces el último renglón del penúltimo y sumándolo una vez al segundo para obtener

\begin{align*}
A_8=\begin{pmatrix}1 & 0 &0 &0 &0 \\ 0 & 1& 0 & 0 & \frac{1}{3}\\ 0 & 0 &1 & 0 &-\frac{5}{3}\\ 0 & 0 & 0 & 1 & \frac{7}{3} \end{pmatrix}.
\end{align*}

Y así termina nuestro algoritmo, y nuestra matriz está en forma escalonada reducida. Las dos cosas más importantes de $A_8$ son que

  • Está en forma escalonada reducida y
  • es equivalente a $A$, es decir, el sistema de ecuaciones $AX=0$ y el sistema de ecuaciones $A_8 X =0$ tienen exactamente las mismas soluciones.

De hecho, todas las matrices $A,A_1, A_2, \ldots, A_8$ son equivalentes entre sí, pues difieren únicamente en operaciones elementales. Esta propiedad es muy importante, y precisamente es la que nos permite aplicar el algoritmo de reducción gaussiana a la resolución de sistemas lineales.

Una aplicación a un sistema de ecuaciones

Usemos el ejemplo anterior para resolver un sistema de ecuaciones:

Problema. Resolver en los reales el sistema lineal homogéneo $AX=0$ donde $A$ es la matriz ejemplo de la sección anterior.

Solución: Los sistemas $AX=0$ y $A_{red}X=0$ son equivalentes, por lo que basta resolver $A_{red}X=0$ con $A_{red}$ la matriz en forma escalonada reducida que encontramos (es decir, $A_8$). Este sistema queda planteado por las siguientes ecuaciones lineales:

\begin{align*}
\begin{cases}
x_1=0\\
x_2+\frac{x_5}{3}=0\\
x_{3}-\frac{5}{3}x_5=0\\
x_4+\frac{7}{3}x_5=0.
\end{cases}.
\end{align*}

Ya hemos resuelto sistemas de este estilo. Aquí $x_5$ es la variable libre y $x_1,x_2,x_3,x_4$ son variables pivote. Fijando $x_5$ igual a cualquier número real $t$, obtenemos que las soluciones son de la forma

\begin{align*}
\left(0, -\frac{1}{3}t, \frac{5}{3} t, – \frac{7}{3}t, t\right), \hspace{2mm} t\in \mathbb{R}.
\end{align*}

$\triangle$

Más adelante…

El algoritmo de reducción gaussiana es crucial para muchos de los problemas que nos encontramos en álgebra lineal. Por ahora, las aplicaciones principales que veremos es cómo nos permite resolver sistemas de ecuaciones lineales de la forma $AX=b$ y cómo nos permite encontrar inversas de matrices. Sin embargo, más adelante usaremos reducción gaussiana para determinar la dimensión de espacios vectoriales, conjuntos generados, para determinar si ciertos vectores son linealmente independientes, para determinar el rango de una matriz y varias otras cosas más.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Aplica el algoritmo de reducción gaussiana a la matriz $$\begin{pmatrix} 1 & 1 & 2 & 2 & 3 & 3 \\ 0 & 0 & 4 & 4 & 5 & 5 \\ 0 & 0 & 0 & 0 & 6 & 6 \end{pmatrix}.$$ Para su sistema lineal asociado, encuentra todas las variables pivote y libres y resuélvelo por completo.
  • Aplica el algoritmo de reducción gaussiana a la matriz $$\begin{pmatrix} 0 & 8 \\ 0 & 2 \\ -1 & 5 \\ 2 & 3 \\ 5 & 0 \\ 3 & 1\end{pmatrix}.$$
  • Considera las matrices $A_1$, $A_4$ y $A_8$ de la sección con el ejemplo del algoritmo de reducción gaussiana. Toma una solución no trivial de $A_8X=0$ y verifica manualmente que también es solución de los sistemas lineales $A_1X=0$ y de $A_4X=0$.
  • Encuentra la matriz $B$, producto de matrices elementales tal que $BA=A_{red}$ con $A$ la matriz que usamos en el ejemplo. Para ello, tendrás que multiplicar todas las matrices correspondientes a las operaciones elementales que usamos.
  • Explica qué es lo que garantiza que el algoritmo de reducción gaussiana en efecto hace una cantidad finita de operaciones elementales.
  • Aplica el algoritmo de reducción gaussiana a la matriz $$A=\begin{pmatrix} 0 & 2 & 1 & 0 \\ 1 & 1 & 0 & 1\end{pmatrix}.$$ Si haces los pasos correctamente, llegarás a una matriz del estilo $$A_{red}=\begin{pmatrix} 1 & 0 & a & b \\ 0 & 1 & c & d \end{pmatrix}.$$ Toma el bloque $B$ de $2\times 2$ de la izquierda de $A$, es decir $B=\begin{pmatrix} 0 & 2 \\ 1 & 1\end{pmatrix}$. Toma el bloque $C$ de $2\times 2$ de la derecha de $A_{red}$, es decir, $C=\begin{pmatrix} a & b \\ c & d \end{pmatrix}.$ ¿Qué matriz obtienes al hacer el producto $BC$? ¿Y el producto $CB$? ¿Por qué crees que pasa esto?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»