Archivo de la etiqueta: álgebra lineal

Álgebra Lineal I: Espacios vectoriales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la primer unidad de este curso de álgebra lineal estudiamos a profundidad al conjunto $F^n$ con sus operaciones de suma y multiplicación por escalar. Luego, hablamos de las matrices en $M_{m,n}(F)$ y vimos cómo pensarlas como transformaciones lineales. Les dimos una operación de producto que en términos de transformaciones lineales se puede pensar como la composición. Luego, hablamos de la forma escalonada reducida de una matriz y cómo llevar cualquier matriz a esta forma usando reducción gaussiana. Esto nos permitió resolver sistemas de ecuaciones lineales homogéneos y no homogeneos, así como encontrar inversas de matrices. Las habilidades desarrolladas en la primer parte del curso serán de mucha utilidad para la segunda, en donde hablaremos de espacios vectoriales.

En esta entrada definiremos el concepto de espacio vectorial y vectores. Para hacer esto, tomaremos como motivación el espacio $F^n$, que ya conocemos bien. Sin embargo, hay muchos otros ejemplos de objetos matemáticos que satisfacen la definición que daremos. Hablaremos de algunos de ellos.

En el transcurso de la unidad también hablaremos de otros conceptos básicos, incluido el de subespacio. Hablaremos de conjuntos linealmente independientes, de generadores y de bases. Esto nos llevará a establecer una teoría de la dimensión de un espacio vectorial. Las bases son de fundamental importancia pues en el caso de dimensión finita, nos permitirán pensar a cualquier espacio vectorial «como si fuera $F^n$ «. Más adelante precisaremos en qué sentido es esto.

Después, veremos cómo pasar de un espacio vectorial a otro mediante transformaciones lineales. Veremos que las transformaciones entre espacios vectoriales de dimensión finita las podemos pensar prácticamente como matrices, siempre y cuando hayamos elegido una base para cada espacio involucrado. Para ver que estamos haciendo todo bien, debemos verificar que hay una forma sencilla de cambiar esta matriz si usamos una base distinta, y por ello estudiaremos a las matrices de cambio de base.

Esta fuerte relación que existe entre transformaciones lineales y y matrices nos permitirá llevar información de un contexto a otro. Además, nos permitirá definir el concepto de rango para una matriz (y transformación vectorial). Hasta ahora, sólo hemos distinguido entre matrices invertibles y no invertibles. Las matrices invertibles corresponden a transformaciones lineales que «guardan toda la información». El concepto de rango nos permitirá entender de manera más precisa cuánta información guardan las transformaciones lineales no invertibles.

Recordando a $F^n$

Antes de definir el concepto de espacio vectorial en toda su generalidad, recordemos algunas de las cosas que suceden con $F^n$. De hecho, puedes pensar en algo mucho más concreto como $\mathbb{R}^4$.

Como recordatorio, comenzamos tomando un campo $F$ y dijimos que, para fines prácticos, podemos pensar que se trata de $\mathbb{R}$ y $\mathbb{C}$. A los elementos de $F$ les llamamos escalares.

Luego, consideramos todas las $n$-adas de elementos de $F$ y a cada una de ellas le llamamos un vector. A $F^n$ le pusimos una operación de suma, que tomaba dos vectores en $F^n$ y nos daba otro. Además, le pusimos una operación de producto por escalar, la cual tomaba un escalar en $F$ y un vector en $F^n$ y nos daba como resultado un vector. Para hacer estas operaciones procedíamos entrada a entrada.

Sin embargo, hay varias propiedades que demostramos para la suma y producto por escalar, para las cuales ya no es necesario hablar de las entradas de los vectores. Mostramos que todo lo siguiente pasa:

  1. (Asociatividad de la suma) Para cualesquiera vectores $u,v,w$ en $F^n$ se cumple que $(u+v)+w=u+(v+w)$.
  2. (Conmutatividad de la suma) Para cualesquiera vectores $u,v$ en $F^n$ se cumple que $u+v=v+u$.
  3. (Identidad para la suma) Existe un vector $0$ en $F^n$ tal que $u+0=u=0+u$.
  4. (Inversos para la suma) Para cualquier vector $u$ en $F^n$ existe un vector $v$ en $F^n$ tal que $u+v=0=v+u$.
  5. (Distributividad para la suma escalar) Para cualesquiera escalares $a,b$ en $F$ y cualquier vector $v$ en $F^n$ se cumple que $(a+b)v=av+bv$.
  6. (Distributividad para la suma vectorial) Para cualquier escalar $a$ en $F$ y cualesquiera vectores $v,w$ en $F^n$ se cumple que $a(v+w)=av+aw$.
  7. (Identidad de producto escalar) Para la identidad multiplicativa $1$ del campo $F$ y cualquier vector $v$ en $F^n$ se cumple que $1v=v$.
  8. (Compatibilidad de producto escalar) Para cualesquiera dos escalares $a,b$ en $F$ y cualquier vector $v$ en $F^n$ se cumple que $(ab)v=a(bv)$.

Los primeros cuatro puntos son equivalentes a decir que la operación suma en $F^n$ es un grupo conmutativo. Resulta que hay varios objetos matemáticos que satisfacen todas estas ocho propiedades o axiomas de espacio vectorial, y cuando esto pasa hay muchas consecuencias útiles que podemos deducir. La esencia del álgebra lineal precisamente consiste en deducir todo lo posible en estructuras que tienen las ocho propiedades anteriores. Estas estructuras son tan especiales, que tienen su propio nombre: espacio vectorial.

Definición de espacio vectorial

Estamos listos para la definición crucial del curso.

Definición. Sea $F$ un campo. Un espacio vectorial sobre el campo $F$ es un conjunto $V$ con operaciones de suma y producto por escalar, que denotaremos por \begin{align*}
+:& V\times V \to V \quad \text{y}\\
\cdot:& F\times V \to V,
\end{align*}

para las cuales se cumplen las ocho propiedades de la sección anterior. En otras palabras:

  • El conjunto $V$ es un grupo conmutativo con la suma.
  • Se tiene asociatividad para la suma escalar y la suma vectorial
  • Se tiene identidad y compatibilidad de la mulltiplicación escalar.

A los elementos de $F$ les llamamos escalares. A los elementos de $F^n$ les llamamos vectores. Para hacer restas, las definimos como $u-v=u+(-v)$, donde $-v$ es el inverso aditivo de $v$ con la suma vectorial. Usualmente omitiremos el signo de producto escalar, así que escribiremos $av$ en vez de $a\cdot v$ para $a$ escalar y $v$ vector.

La definición da la impresión de que hay que verificar muchas cosas. De manera estricta, esto es cierto. Sin embargo, de manera intuitiva hay que pensar que a grandes rasgos los espacios vectoriales son estructuras en donde podemos sumar elementos entre sí y multiplicar vectores por escalares (externos) sin que sea muy complicado.

Como ya mencionamos, el conjunto $F^n$ con las operaciones de suma y multiplicación por escalar que se hacen entrada por entrada es un espacio vectorial sobre $F$. En lo que resta de la entrada, hablaremos de otros ejemplos de espacios vectoriales que nos encontraremos frecuentemente.

Espacios vectoriales de matrices

Otros ejemplos de espacios vectoriales con los que ya nos encontramos son los espacios de matrices. Dado un campo $F$ y enteros positivos $m$ y $n$, el conjunto de matrices en $M_{m,n}(F)$ es un espacio vectorial en donde la suma se hace entrada a entrada y la multiplicación escalar también.

¿Qué es lo que tenemos que hacer para mostrar que en efecto esto es un espacio vectorial? Se tendrían que verificar las 8 condiciones en la definición de espacio vectorial. Esto lo hicimos desde la primer entrada del curso, en el primer teorema de la sección «Operaciones de vectores y matrices». Vuelve a leer ese teorema y verifica que en efecto se enuncian todas las propiedades necesarias.

Aquí hay que tener cuidado entonces con los términos que se usan. Si estamos hablando del espacio vectorial $F^n$, las matrices no forman parte de él, y las matrices no son vectores. Sin embargo, si estamos hablando del espacio vectorial $M_{m,n}(F)$, entonces las matrices son sus elementos, y en este contexto las matrices sí serían vectores.

Ejemplo. Sea $\mathbb{F}_2$ el campo con $2$ elementos. Consideremos $M_{2}(\mathbb{F}_2)$. Este es un espacio vectorial. Tiene $16$ vectores de la forma $\begin{pmatrix} a & b \\ c & d \end{pmatrix}$, en donde cada entrada es $0$ o $1$. La suma y la multiplicación por escalar se hacen entrada a entrada y con las reglas de $\mathbb{F}_2$. Por ejemplo, tenemos $$\begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix} + \begin{pmatrix} 0 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}.$$

$\triangle$

Espacios vectoriales de funciones

Ahora veremos algunos ejemplos de espacios vectoriales cuyos elementos son funciones. Esto puede parecer algo abstracto, pero en unos momentos veremos algunos ejemplos concretos que nos pueden ayudar a entender mejor.

Sea $F$ un campo y consideremos cualquier conjunto $X$. Consideremos el conjunto $V$ de todas las posibles funciones de $X$ a $F$. A este conjunto queremos ponerle operaciones de suma y de multiplicación por escalar.

Para definir la suma, tomemos dos funciones que van de $X$ a $F$, digamos $f:X\to F$ y $g:X\to F$. Definiremos a la función $f+g$ como la función que a cada $x$ en $X$ lo manda a $f(x)+g(x)$. Aquí estamos usando la suma del campo $F$. En símbolos, $(f+g):X\to F$ tiene regla de asignación $$(f+g)(x)=f(x)+g(x).$$

Para definir el producto por escalar, tomamos una función $f:X\to F$ y un escalar $c$ en el campo $F$. La función $cf$ será la función $cf:X\to F$ con regla de asignación $$(cf)(x)=cf(x)$$ para todo $x$ en $X$.

Resulta que el conjunto $V$ de funciones de $X$ a $F$ con estas operaciones de suma y producto, es un espacio vectorial. Podemos probar, por ejemplo, la asociatividad de la suma. Para ello, la primer cosa que necesitamos mostrar es la asociatividad de la suma. Es decir, que si tenemos $f:X\to F$, $g:X\to F$ y $h:X\to F$, entonces $$(f+g)+h = f+ (g+h).$$

Esta es una igualdad de funciones. Para que sea cierta, tenemos que verificarla en todo el dominio, así que debemos mostrar que para todo $x$ en $X$ tenemos que $$((f+g)+h)(x)=(f+(g+h))(x).$$

Para demostrar esto, usemos la definición de suma de funciones y la asociatividad de la suma del campo $F$. Con ello, podemos realizar la siguiente cadena de igualdades:

\begin{align*}
((f+g)+h)(x)&=(f+g)(x)+h(x)\\
&=(f(x)+g(x)) + h(x) \\
&=f(x) + (g(x)+h(x)) \\
&=f(x) + (g+h)(x)\\
&=(f+(g+h))(x).
\end{align*}

Así, la suma en $V$ es asociativa. El resto de las propiedades se pueden demostrar con la misma receta:

  • Se enuncia la igualdad de funciones que se quiere mostrar.
  • Para que dicha igualdad sea cierta, se tiene que dar en cada elemento del dominio, así que se evalúa en cierta $x$.
  • Se prueba la igualdad usando las definiciones de suma y producto por escalar, y las propiedades de campo de $F$.

Ejemplo. El ejemplo anterior es muy abstracto, pues $X$ puede ser cualquier cosa. Sin embargo, hay muchos espacios de funciones con los cuales se trabaja constantemente. Por ejemplo, si el campo es el conjunto $\mathbb{R}$ de reales y $X$ es el intervalo $[0,1]$, entonces simplemente estamos hablando de las funciones que van de $[0,1]$ a los reales.

Si tomamos $f:[0,1]\to \mathbb{R}$ y $g:[0,1]\to \mathbb{R}$ dadas por \begin{align*}f(x)&= \sin x – \cos x\\ g(x) &= \cos x + x^2,\end{align*} entonces su suma simplemente es la función $f+g:[0,1]\to \mathbb{R}$ definida por $(f+g)(x)=\sin x + x^2$. Si tomamos, por ejemplo, el escalar $2$, entonces la función $2f:[0,1]\to \mathbb{R}$ no es nada más que aquella dada por
$$(2f)(x)= 2\sin x – 2\cos x.$$

Así como usamos el intervalo $[0,1]$, pudimos también haber usado al intervalo $[-2,2)$, al $(-5,\infty]$, o a cualquier otro.

$\triangle$

Espacios vectoriales de polinomios

Otro ejemplo de espacios vectoriales que nos encontraremos frecuentemente son los espacios de polinomios. Si no recuerdas con precisión cómo se construyen los polinomios y sus operaciones, te recomendamos repasar este tema con material disponible aquí en el blog.

Dado un campo $F$ y un entero positivo $n$ usaremos $F[x]$ para referirnos a todos los polinomios con coeficientes en $F$ y usaremos $F_n[x]$ para referirnos a aquellos polinomios con coeficientes en $F$ y grado a lo más $n$. Aunque el polinomio cero no tiene grado, también lo incluiremos en $F_n[x]$.

Ejemplo. Si $F$ es $\mathbb{C}$, el campo de los números complejos, entonces todos los siguientes son polinomios en $\mathbb{C}[x]$: \begin{align*}p(x)&=(2+i)x^6 + (1+i),\\ q(x)&=3x^2+2x+1,\\ r(x)&=5x^7+(1-3i)x^5-1.\end{align*}

Tanto $p(x)$ como $q(x)$ están en $\mathbb{C}_6[x]$, pues su grado es a lo más $6$. Sin embargo, $r(x)$ no está en $\mathbb{C}_6[x]$ pues su grado es $7$.

El polinomio $q(x)$ también es un elemento de $\mathbb{R}[x]$, pues tiene coeficientes reales. Pero no es un elemento de $\mathbb{R}_1[x]$ pues su grado es demasiado grande.

$\triangle$

Recuerda que para sumar polinomios se tienen que sumar los coeficientes de grados correspondientes. Al hacer multiplicación por escalar se tienen que multiplicar cada uno de los coeficientes. De esta forma, si $f(x)=x^2+1$ y $g(x)=x^3+\frac{x^2}{2}-3x-1$, entonces $$(f+g)(x)=x^3+\frac{3x^2}{2}-3x,$$ y $$(6g)(x)=6x^3+3x^2-18x-6.$$

Resulta que $F[x]$ con la suma de polinomios y con el producto escalar es un espacio vectorial. Puedes verificar cada uno de los axiomas por tu cuenta.

Observa que la suma de dos polinomios de grado a lo más $n$ tiene grado a lo más $n$, pues no se introducen términos con grado mayor que $n$. Del mismo modo, si tenemos un polinomio con grado a lo más $n$ y lo multiplicamos por un escalar, entonces su grado no aumenta. De esta forma, podemos pensar a estas operaciones como sigue:
\begin{align*}
+:& F_n[x] \times F_n[x] \to F_n[x]\\
\cdot: & F\times F_n[x] \to F_n[x].
\end{align*}

De esta forma, $F_n[x]$ con la suma de polinomios y producto escalar de polinomios también es un espacio vectorial.

Más adelante…

Ya dimos la definición de espacio vectorial y vimos varios ejemplos. Dentro de algunas entradas veremos como conseguir muchos más espacios vectoriales.

En el último ejemplo pasa algo curioso: el espacio $F_n[x]$ es un subconjunto del espacio $F[x]$ y además es un espacio vectorial con las mismas operaciones que $F[x]$. Este es un fenómeno muy importante en álgebra lineal. Decimos que $F_n[x]$ es un subespacio de $F[x]$. En la siguiente entrada definiremos en general qué es un subespacio de un espacio vectorial y veremos algunas propiedades que tienen los subespacios.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • A partir de los axiomas de espacio vectorial, muestra lo siguiente para un espacio vectorial $V$:
    • La identidad de la suma vectorial es única, es decir, que si existe otro elemento $e$ en $V$ tal que $u+e=u=e+u$ para todo $u$ en $V$, entonces $e=0$.
    • Que si $0$ es la identidad aditiva del campo $F$ y $v$ es cualquier vector en $V$, entonces $0v$ es la identidad de la suma vectorial. En símbolos, $0v=0$, donde el primer $0$ es el de $F$ y el segundo el de $V$.
    • Se vale la regla de cancelación para la suma vectorial, es decir, que si $u,v,w$ son vectores en $V$ y $u+v=u+w$, entonces $v=w$.
    • Se vale la regla de cancelación para el producto escalar, es decir, que si $a$ es un escalar no cero del campo $F$ y $u,v$ son vectores de $V$ para los cuales $au=av$, entonces $u=v$.
    • Que el inverso aditivo de un vector $v$ para la suma vectorial en $V$ es precisamente $(-1)v$, es decir, el resultado de hacer la multiplicación escalar de $v$ con el inverso aditivo del $1$ del campo $F$.
  • Sea $V$ un espacio vectorial sobre $\mathbb{R}$. Sean $u$, $v$ y $w$ vectores en $V$. Justifica la siguiente igualdad enunciando de manera explícita todos los axiomas de espacio vectorial que uses $$u+5v-3w+2u-8v= -3(w+v-u).$$
  • Termina de demostrar que en efecto los espacios de funciones con la suma y producto escalar que dimos son espacios de funciones.
  • Enlista todos los polinomios de $(\mathbb{F}_2)_3[x]$. A continuación hay algunos: $$0, x+1, x^2+x, x^3+1.$$ Para cada uno de ellos, encuentra quien es su inverso aditivo para la suma vectorial de $(\mathbb{F}_2)_3[x]$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Reducción gaussiana en sistemas lineales AX=b

Por Julio Sampietro

Introducción

Ya usamos el algoritmo de reducción gaussiana para estudiar sistemas de ecuaciones homogéneos. En esta entrada aplicamos lo que hemos aprendido de este método para resolver sistemas de ecuaciones no homogéneos.

Para hacer esto, adaptaremos la técnica para sistemas homogéneos (que en realidad, no es muy diferente) y la usamos para probar un resultado muy importante, llamado el teorema de existencia y unicidad. Damos unos cuantos ejemplos y concluimos con la prometida demostración de la unicidad de la forma escalonada reducida.

Adaptando el vocabulario

Consideramos un sistema lineal $AX=b$ con $A\in M_{m,n}(F)$ y $b\in F^{m}$, con variables $x_1, \dots, x_n$ que son las coordenadas de $X\in F^{n}$. Para resolver el sistema consideramos la matriz aumentada $\left(A\vert b\right)$ obtenida de $A$ al añadir al vector $b$ como columna hasta la derecha.

Ejemplo. Si

\begin{align*}
A= \begin{pmatrix} 0 & 1 & 2\\
-1 & 0 &1 \end{pmatrix} \text{ y } b= \begin{pmatrix} 12 \\ 14 \end{pmatrix}
\end{align*}

entonces

\begin{align*}
\left(A\vert b\right)= \begin{pmatrix} 0 & 1 & 2 & 12\\ -1 & 0 & 1 & 14\end{pmatrix}\end{align*}

$\triangle$

Las operaciones elementales del sistema se traducen entonces en operaciones elementales en la matriz aumentada, por lo que para resolver el sistema podemos primero llevar a la matriz aumentada a su forma escalonada y reducida y después resolver el sistema más sencillo. Esto lo podríamos hacer siempre y cuando al realizar operaciones elementales en la matriz aumentada no se modifique el conjunto de soluciones del sistema. Esto lo garantiza la siguiente proposición.

Proposición. Sea el sistema lineal $AX=b$. Supongamos que la matriz $\left(A’\vert b’\right)$ se obtiene a partir de la matriz $\left( A\vert b\right)$ realizando una sucesión finita de operaciones elementales. Entonces los sistemas $AX=b$ y $A’X=b’$ son equivalentes, es decir, tienen el mismo conjunto de soluciones.

Demostración: Como ya hemos visto anteriormente, realizar operaciones elementales en $\left(A \vert b\right)$ es equivalente a realizar operaciones elementales en las ecuaciones del sistema $AX=b$, pero ya sabemos que estas no alteran el conjunto de soluciones, pues son reversibles (es decir, podemos siempre deshacer los cambios).

$\square$

El teorema de existencia y unicidad

Llegamos ahora a otro resultado clave de nuestro estudio de ecuaciones. Es una caracterización que responde a nuestras preguntas: ¿Hay soluciones? ¿Son únicas? Además, nos puede sugerir cómo encontrarlas.

Teorema. (De existencia y unicidad) Supongamos que la matriz $\left(A\vert b\right)$ ha sido llevada a su forma escalonada reducida $\left(A’\vert b’\right)$ por operaciones elementales.

  1. (Existencia de soluciones) El sistema $AX=b$ es consistente si y sólo si $\left(A’\vert b’\right)$ no tiene ningún pivote (de filas) en su última columna.
  2. (Unicidad de soluciones) Si el sistema es consistente, entonces tiene una única solución si y sólo si $A’$ tiene pivotes (de filas) en cada columna.

Demostración:

  1. Supongamos que $\left(A’\vert b’\right)$ tiene un pivote en su última columna. Debemos ver que el sistema $AX=b$ no tiene solución. Para esto, basta ver que el sistema $A’X=b’$ no tiene solución, pues es un sistema equivalente.

    Si el pivote aparece en el $i$-ésimo renglón entonces este es de la forma $(0, \dots, 0, 1)$, pues recordemos que los pivotes son iguales a $1$ en la forma escalonada reducida. Entonces entre las ecuaciones del sistema $A’X=b’$ tenemos una de la forma $0 x_1′ +\dots +0 x_n’=1$, que no tiene solución alguna. Así el sistema $A’X=b’$ no es consistente, y por tanto $AX=b$ tampoco lo es.

    Conversamente, supongamos que $\left(A’ \vert b’\right)$ no tiene un pivote en su última columna. Digamos que $A’$ tiene pivotes en las columnas $j_1<\dots <j_k \leq n$ y sean $x_{j_1}, \dots, x_{j_k}$ las correspondientes variables pivote y todas las demás variables son libres. Dando el valor cero a todas las variables libres obtenemos un sistema en las variables $x_{j_1}, \dots, x_{j_k}$. Este sistema es triangular superior y se puede resolver empezando por la última ecuación, encontrando $x_{j_k}$, luego $x_{j_{k-1}}$ y así sucesivamente. Así encontramos una solución, por lo que el sistema es consistente. Esta solución encontrada también es una solución a $AX=b$, pues es un sistema equivalente.
  2. Como le podemos dar cualquier valor escalar a las variables libres, el argumento del párrafo anterior nos dice que la solución es única si y sólo si no tenemos variables libres, pero esto pasa si y sólo si los pivotes llegan hasta la última columna de $A’$.

$\square$

Ten cuidado. En la primer parte, la condición se verifica con $(A’|b)$. En la segunda parte, la condición se verifica con $A’$.

Encontrando y contando soluciones

Por simplicidad, asumamos que $F=\mathbb{R}$, es decir que nuestro campo de coeficientes del sistema $AX=b$ es el de los números reales. Procedemos como sigue para encontrar el número de soluciones del sistema:

  1. Consideramos la matriz aumentada $\left(A\vert b\right)$.
  2. Llevamos esta matriz a su forma escalonada reducida $\left(A’\vert b’\right)$.
  3. Si esta matriz tiene un renglón de la forma $(0, \dots, 0, 1)$, entonces el sistema es inconsistente.
  4. Si no tiene ningún renglón de esa forma, vemos si todas las columnas de $A’$ tienen al pivote de alguna fila:
    • Si en efecto todas tienen pivote, entonces el sistema tiene una única solución.
    • Si no todas tienen pivote, entonces nuestro sistema tiene una infinidad de soluciones.

En el caso en el que hay una o una infinidad de soluciones, además podemos decir exactamente cómo se ven esas soluciones:

  • Haciendo las variables libres iguales a cero (si es que hay), obtenemos una solución $X’$ al sistema $AX=b$.
  • Usamos reducción gaussiana para encontrar todas las soluciones al sistema homogéneo $AX=0$.
  • Finalmente, usamos el principio de superposición. Todas las soluciones a $AX=b$ son de la forma $X’$ más una solución a $AX=0$.

Problema. Consideremos la matriz

\begin{align*}
A= \begin{pmatrix} 1 & 2 & 2\\ 0 & 1 & 1\\ 2 & 4 &4 \end{pmatrix}.
\end{align*}

Dado $b\in \mathbb{R}^3$, encuentra condiciones necesarias y suficientes en términos de las coordenadas de $b$ para que el sistema $AX=b$ sea consistente.

Solución: Dado $b$ con coordenadas $b_1, b_2$ y $b_3$, la matriz aumentada es

\begin{align*}
\left( A\vert b\right) = \begin{pmatrix} 1 & 2 & 2 & b_1 \\ 0 & 1 & 1 & b_2 \\ 2 & 4 & 4 & b_3\end{pmatrix}.
\end{align*}

Para obtener su forma escalonada reducida sustraemos dos veces el primer renglón del tercero y luego dos veces el segundo del primero, obteniendo así:

\begin{align*}
\left( A\vert b\right) \sim \begin{pmatrix} 1 & 0 & 0 &b_1-2b_2\\ 0 & 1 & 1 & b_2\\ 0 & 0 & 0 &b_3-2b_1\end{pmatrix}.
\end{align*}

Por el teorema anterior, el sistema $AX=b$ es consistente si y sólo si esta matriz no tiene pivotes en la última columna, es decir, necesitamos que la entrada de hasta abajo a la derecha sea cero. Así, el sistema es consistente si y sólo si $b_3-2b_1=0$ o, dicho de otra manera, si y sólo si $b_3=2b_1$.

$\triangle$

Unicidad de la forma escalonada reducida

Concluimos esta entrada con una demostración de la unicidad de la forma escalonada reducida, usando que si dos matrices $A$ y $B$ que difieren por una sucesión finita de operaciones elementales entonces los sistemas $AX=0$ y $BX=0$ son equivalentes. La demostración que presentamos (corta y elegante) se debe a Thomas Yuster, publicada en el año 1983.

Teorema. La forma escalonada reducida es única.

Demostración: Procedemos por inducción sobre $n$, el número de columnas de $A\in M_{m,n}(F)$. El resultado es claro para $n=1$, pues solo tenemos una columna cero o una columna con un $1$ hasta arriba. Supongamos pues que el resultado se cumple para $n-1$, y demostremos que se cumple para $n$. Sea $A\in M_{m,n}(F)$ y sea $A’\in M_{m,n-1}(F)$ la matriz que se obtiene al quitarle la $n$-ésima columna.

Supongamos que $B$ y $C$ son ambas matrices distintas en forma escalonada reducida obtenidas de $A$. Dado que una sucesión de operaciones elementales que llevan a $A$ a una forma escalonada reducida también llevan a $A’$ a una forma escalonada reducida (si a una matriz escalonada reducida le cortamos una columna, sigue siendo escalonada reducida), podemos aplicar la hipótesis de inducción y concluir que si $B$ y $C$ son distintas entonces difieren en la columna que quitamos y solo en esa.

Sea $j$ tal que $b_{jn}\neq c_{jn}$ (por nuestra discusión previa, existe esta entrada, ya que asumimos que $B\neq C$). Si $X$ es un vector tal que $BX=0$ entonces $CX=0$, ya que $A,B$ y $C$ son matrices equivalentes. Luego $(B-C)X=0$. Como $B$ y $C$ difieren solo en la última columna, la $j$-ésima ecuación del sistema se lee $(b_{jn}-c_{jn})x_n=0$, pues los coeficientes previos son cero. Así, $x_n=0$ siempre que $BX=0$ o $CX=0$. Se sigue que $x_n$ no es una variable libre para $B$ y $C$, por lo que ambas tienen un pivote en la última columna. Como ambas están en forma escalonada reducida, entonces la última columna tiene necesariamente un $1$ en la entrada de hasta abajo y puros ceros en otras entradas, es decir, $B$ y $C$ tienen la misma última columna, una contradicción a nuestras suposiciones.

Se sigue que entonces $B=C$ y queda probado por contradicción el paso inductivo, lo que prueba el teorema.

$\square$

Más adelante…

El método que describimos en esta entrada es muy flexible y poderoso. Permite resolver sistemas de ecuaciones de la forma $AX=b$ de manera metódica. Esto no quiere decir que ya entendamos todo lo que hay que saber de sistemas lineales. Una vez que hayamos introducido los conceptos de espacio vectorial y subespacio, podremos describir con más precisión cómo son las soluciones a un sistema lineal. Además, más adelante, veremos otras formas en las que se pueden resolver sistemas de ecuaciones usando determinantes. En particular, veremos la regla de Cramer.

Por ahora, nos enfocaremos en una aplicación más de la reducción gaussiana: encontrar inversas de matrices. Veremos esto en la siguiente entrada.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Determina cuántas soluciones tiene el sistema $AX=b$ con
    \begin{align*} A=\begin{pmatrix} 0 & 1 &1\\ 2& -4 & 7\\ 0 & 0 & 1 \end{pmatrix}\text{ y } b=\begin{pmatrix} 1 \\ 6 \\-1\end{pmatrix}\end{align*}
  • Si $A$ tiene estrictamente más renglones que columnas y $b$ es un vector que no tiene ninguna entrada cero, ¿puede el sistema $AX=b$ ser consistente?
  • Si $A$ tiene estrictamente más columnas que renglones, ¿puede el sistema $AX=0$ tener una única solución?
  • Si $A\in M_{m,n}(F)$ es una matriz diagonal, ¿que puedes decir de la consistencia y la unicidad de soluciones del sistema $AX=b$?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Reducción gaussiana para determinar inversas de matrices

Por Ayax Calderón

Introducción

En entradas anteriores hablamos de las matrices en forma escalonada reducida y de cómo cualquier matriz puede ser llevada a esta forma usando el algoritmo de reducción gaussiana. Usamos esto para resolver sistemas de ecuaciones lineales arbitrarios, es decir, de la forma $AX=b$. en esta ocasión estudiaremos cómo ver si una matriz es invertible y cómo determinar inversas de matrices mediante el algoritmo de reducción gaussiana.

Inversas de matrices elementales

Recordemos que una matriz $A\in M_n(F)$ es invertible si existe una matriz $B$ tal que $AB=BA=I_n$. Dicha matriz $B$ es única, se conoce como la matriz inversa de $A$ y se denota por $A^{-1}$.

Es importante observar que las matrices elementales son invertibles, puesto que las operaciones elementales se pueden revertir (esto también nos dice que la inversa de una matriz elemental también es una matriz elemental). Por ejemplo, si la matriz $E$ se obtiene de $I_n$ intercambiando los renglones $i$ y $j$, entonces $E^{-1}$ se obtiene de $I_n$ haciendo la misma operación, por lo que $E^{-1}=E$. Por otro lado, si $E$ se obtiene de sumar $\lambda$ veces el renglón $j$ al renglón $i$ en $I_n$, entonces E^{-1} se obtiene de sumar $-\lambda$ veces el renglón $j$ al renglón $i$ en $I_n$. El argumento para reescalamientos queda como tarea moral.

Debido a su importancia, enunciaremos este resultado como una proposición.

Proposición. Las matrices elementales son invertibles y sus inversas también son matrices elementales. Como consecuencia, cualquier producto de matrices elementales es invertible.

Algunas equivalencias de matrices invertibles

Hasta el momento sólo tenemos la definición de matrices invertibles para verificar si una matriz es invertible o no. Esto es poco práctico, pues dada una matriz, tendríamos que sacar otra «de la nada».

El siguiente resultado empieza a decirnos cómo saber de manera práctica cuándo una matriz cuadrada es invertible. También habla de una propiedad importante que cumplen las matrices invertibles.

Teorema. Para una matriz $A\in M_n(F)$ las siguientes afirmaciones son equivalentes:
(a) $A$ es invertible.
(b) $A_{red}=I_n$.
(c) $A$ es producto de matrices elementales.

Demostración. Para empezar, notemos que el producto de matrices invertibles es invertible , pues cualquier matriz elemental es invertible y las matrices invertibles son estables bajo productos. Esto prueba que (c) implica (a).

Ahora, supongamos que (a) se satisface. Recordemos que para una matriz $A\in M_{m,n}(F)$ podemos encontrar una matriz $B\in M_m(F)$ que es producto de matrices elementales y tal que $A_{red}=BA$. Como $A$ es invertible (por hipótesis) y $B$ es invertible (por la proposición de la sección anterior), entonces $BA$ es invertible y por consiguiente $A_{red}$ también lo es. En particular, todos los renglones de $A_{red}$ son distintos de cero y por lo tanto $A_{red}$ tiene $n$ pivotes, uno en cada columna. Como $A_{red}$ está en forma escalonada reducida, necesariamente $A_{red}=I_n$. Esto prueba que (a) implica (b).

Finalmente, supongamos que $(b)$ se satisface. Entonces existe una matriz $B$, la cual es producto de matrices elementales y tal que $BA=I_n$. Por la proposición anterior $B$ es invertible y $B^{-1}$ es producto de matrices elementales. Como $BA=I_n$, tenemos que $A=B^{-1}BA=B^{-1}$ y así $A$ es producto de matrices elementales, de manera que (b) implica (c).

$\square$

Ya podemos responder de manera práctica la pregunta «¿$A$ es invertible?». Para ello, basta aplicarle reducción gaussiana a $A$. Por el teorema anterior, $A$ es invertible si y sólo si la forma escalonada reducida obtenida es $I_n$. Por supuesto, esto aún no nos dice exactamente quién es la inversa.

Invertibilidad y sistemas de ecuaciones

La siguiente proposición expresa las soluciones del sistema $AX=b$ cuando $A$ es una matriz cuadrada e invertible. Para facilitar las cosas hay que tener un algoritmo para encontrar la inversa de una matriz. Más adelante veremos uno de estos algoritmos basado en reducción gaussiana.

Proposición. Si $A\in M_n(F)$ es una matriz invertible, entonces para todo $b\in F^n$ el sistema $AX=b$ tiene una única solución, dada por $X=A^{-1}b$.

Demostración. Sea $X$ una solución del sistema. Multiplicando la igualdad $AX=b$ por la izquierda por $A^{-1}$ obtenemos $A^{-1}(AX)=A^{-1}b$. Como
\begin{align*}
A^{-1}(AX)=(A^{-1}A)X
=I_nX=X,
\end{align*}
concluimos que $X=A^{-1}b$, por lo tanto el sistema tiene a lo más una solución. Para ver que esta es en efecto una solución, calculamos
\begin{align*}
A(A^{-1}b)=(AA^{-1})b=I_nb=b.
\end{align*}

$\square$

A continuación presentamos un resultado más, que relaciona matrices invertibles con que sus sistemas lineales correspondientes tengan soluciones únicas.

Teorema. Sea $A\in M_n(F)$ una matriz. Las siguientes afirmaciones son equivalentes:
(a) $A$ es invertible.
(b) Para toda $b\in F^n$ el sistema $AX=b$ tiene una única solución $X\in F^n$.
(c) Para toda $b\in F^n$ el sistema $AX=b$ es consistente.

Demostración. Ya demostramos que (a) implica (b). Es claro que (b) implica (c) pues si el sistema tiene una única solución, en particular tiene una solución.

Así, supongamos que que (c) se satisface. Sea $A_{red}$ la forma escalonada reducida de $A$. Por una proposición ya antes mencionada en esta entrada sabemos que existe una matriz $B$ la cual es producto de matrices elementales (por lo tanto invertible) y tal que $A_{red}=BA$. Deducimos que el sistema $A_{red}X=Bb$ tiene al menos una solución para todo $b\in F^n$ (pues si $AX=b$, entonces $A_{red}X=BAX=Bb$).

Ahora, para cualquier $b’\in F^n$ podemos encontrar $b$ tal que $b’=Bb$, tomando $b=B^{-1}b’$. Aquí estamos usando que $B$ es invertible por ser producto de matrices elementales. Concluimos que el sistema $A_{red}X=b$ es consistente para cada $b\in F^n$, pero entonces cualquier renglón de $A_{red}$ debe ser distinto de cero (si la fila $i$ es cero, entonces escogiendo cada vector $b$ con la $i-$ésima coordenada igual a $1$ se obtiene un sistema inconsistente) y, como en la demostración del teorema anterior, se tiene que $A_{red}=I_n$. Usando el teorema anterior concluimos que $A$ es invertible.

$\square$

Hasta ahora, al tomar un matriz cuadrada $A$ y proponer una inversa $B$, la definición de invertibilidad nos exige mostrar ambas igualdades $AB=I_n$ y $BA=I_n$. Finalmente tenemos las herramientas necesarias para mostrar que basta mostrar una de estas igualdades para que ambas se cumplan.

Corolario. Sean $A,B\in M_n(F)$ matrices.
(a) Si $AB=I_n$, entonces $A$ es invertible y $B=A^{-1}$.
(b) Si $BA=I_n$, entonces $A$ es invertible y $B=A^{-1}$.

Demostración. (a) Para cada $b\in F^n$ el vector $X=Bb$ satisface
\begin{align*}
AX=A(Bb)
=(AB)b=b,
\end{align*}
por lo tanto el sistema $AX=b$ es consistente para cada $b\in M_n(F)$. Por el teorema anterior, $A$ es invertible. Multiplicando la igualdad $AB=I_n$ por la izquierda por $A^{-1}$ obtenemos $B=A^{-1}AB=A^{-1}$, y así $B=A^{-1}$.
(b) Por el inciso (a), sabemos que $B$ es invertible y $A=B^{-1}$, pero entonces $A$ es invertible y $A^{-1}=B$.

$\square$

Determinar inversas usando reducción gaussiana

El corolario anterior nos da una manera práctica de saber si una matriz es invertible y, en esos casos, determinar inversas de matrices. En efecto, $A$ es invertible si y sólo si podemos encontrar una matriz $X$ tal que $AX=I_n$ y de aquí $X=A^{-1}$.

La ecuación $AX=I_n$ es equivalente a los siguientes sistemas lineales:
\begin{align*}
AX_1=e_1, \hspace{2mm}, AX_2=e_2, \hspace{2mm} \dots , \hspace
{2mm} AX_n=e_n.
\end{align*}
donde $e_i$ es la $i-$ésima columna de $I_n$ y $X_i$ denota la $i-$ésima columna de $X$. Ya sabemos cómo resolver sistemas lineales usando reducción gaussiana. Esto nos da una manera práctica de calcular $X$: si al menos uno de estos sistemas es inconsistente, entonces $A$ no es invertible; si todos son consistentes, entonces las soluciones $X_1,\ldots,X_n$ son las columnas de la inversa.

En la práctica, uno puede evitar resolver $n$ sistemas lineales considerando el siguiente truco:

En lugar de tomar $n$ matrices aumentadas $[A| e_i]$ considera sólo la matriz aumentada $[A|I_n]$, en la cual agregamos la matriz $I_n$ a la derecha de $A$ (de manera que $[A|I_n]$ tiene $2n$ columnas). Finalmente sólo hay que encontrar la forma escalonada reducida $[A’|X]$ de la matriz de $n\times 2n \hspace{2mm} [A|I_n]$. Si $A’$ resulta ser distinto de $I_n$, entonces $A$ no es inverible. Si $A’=I_n$, entonces la inversa de $A$ es simplemente la matriz $X$.

Ejemplo de determinar inversas

Para ilustrar lo anterior resolveremos el siguiente ejemplo práctico.

Ejemplo. Calcula la inversa de la matriz
\begin{align*}
A= \begin{pmatrix}
1 & 5 & 1\\
2 & 11 & 5\\
9 & -3 & 0
\end{pmatrix}.
\end{align*}

Solución. Aplicamos reducción gaussiana a la matriz extendida
\begin{align*}
[A|I_3]= \begin{pmatrix}
1 & 5 & 1 & 1 & 0 &0\\
2 & 11 & 5 & 0 & 1 & 0\\
9 & -3 & 0 & 0 & 0 & 1
\end{pmatrix}
\end{align*}
\begin{align*}
R_2 -2R_1\begin{pmatrix}
1 & 5 & 1 & 1 & 0 &0\\
0 & 1 & 3 & -2 & 1 & 0\\
9 & -3 & 0 & 0 & 0 & 1
\end{pmatrix}
\end{align*}
\begin{align*}
R_3 -9R_1\begin{pmatrix}
1 & 5 & 1 & 1 & 0 &0\\
0 & 1 & 3 & -2 & 1 & 0\\
0 & -48 & -9 & -9 & 0 & 1
\end{pmatrix}
\end{align*}

\begin{align*}
R_1 -5R_2\begin{pmatrix}
1 & 0 & -14 & 11 & -5 &0\\
0 & 1 & 3 & -2 & 1 & 0\\
0 & -48 & -9 & -9 & 0 & 1
\end{pmatrix}
\end{align*}
\begin{align*}
R_3 +48R_2\begin{pmatrix}
1 & 0 & -14 & 11 & -5 &0\\
0 & 1 & 3 & -2 & 1 & 0\\
0 & 0 & 135 & -105 & 48 & 1
\end{pmatrix}
\end{align*}
\begin{align*}
\frac{1}{135}R_3\begin{pmatrix}
1 & 0 & -14 & 11 & -5 &0\\
0 & 1 & 3 & -2 & 1 & 0\\
0 & 0 & 1 & -\frac{7}{9} & \frac{16}{45} & \frac{1}{135}
\end{pmatrix}
\end{align*}
\begin{align*}
R_1+14R_3\begin{pmatrix}
1 & 0 & 0 & \frac{1}{9} & -\frac{1}{45} &\frac{14}{135}\\
0 & 1 & 3 & -2 & 1 & 0\\
0 & 0 & 1 & -\frac{7}{9} & \frac{16}{45} & \frac{1}{135}
\end{pmatrix}
\end{align*}
\begin{align*}
R_2-3R_3\begin{pmatrix}
1 & 0 & 0 & \frac{1}{9} & -\frac{1}{45} &\frac{14}{135}\\
0 & 1 & 0 & \frac{1}{3} & -\frac{1}{15} & -\frac{1}{45}\\
0 & 0 & 1 & -\frac{7}{9} & \frac{16}{45} & \frac{1}{135}
\end{pmatrix}
\end{align*}
De donde
\begin{align*}
A^{-1}=\begin{pmatrix}
\frac{1}{9} & -\frac{1}{45} &\frac{14}{135}\\
\frac{1}{3} & -\frac{1}{15} & -\frac{1}{45}\\
-\frac{7}{9} & \frac{16}{45} & \frac{1}{135}
\end{pmatrix}.
\end{align*}

$\triangle$

En el ejemplo anterior hicimos el algoritmo de reducción gaussiana «a mano», pero también pudimos haber usado una herramienta en línea, como la calculadora de forma escalonada reducida de eMathHelp.

Más adelante…

En esta entrada vimos cómo el algoritmo de reducción gaussiana nos permite saber si una matriz es invertible o no. También nos da una forma práctica de determinar inversas. Hay otras formas de hacer esto mediante determinantes. Sin embargo, el método que describimos es bastante rápido y flexible.

Ya que entendemos un poco mejor a las matrices invertibles, el siguiente paso es usarlas para desarrollar nuestra teoría de álgebra lineal. Las matrices invertibles se corresponden con transformaciones lineales que se llaman isomorfismos, las cuales detectan cuándo dos espacios vectoriales son «el mismo».

También más adelante refinaremos el concepto de ser invertible y no. Esta es una clasificación en sólo dos posibilidades. Cuando definamos y estudiamos el rango de matrices y transformaciones lineales tendremos una forma más precisa de decir «qué tanta información guarda una transformación».

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • ¿Cuál sería la operación elemental inversa a aplicar un reescalamiento por un factor $c\neq 0$ en el renglón de una matriz?
  • Encuentra la inversa de la matriz
    \begin{align*}
    \begin{pmatrix}
    1 & 2 & 1\\
    2 & 0 & 2\\
    1 & 2 & 0
    \end{pmatrix}.
    \end{align*}
    mediante reducción gaussiana.
  • Resuelve el sistema de ecuaciones
    \begin{align*}
    \begin{cases}
    x+2y+2z=1\\
    2x+y+2z=4\\
    2x+2y+z=5
    \end{cases}
    \end{align*}
  • Sea $A\in M_n(F)$ una matriz tal que $A_{red}\neq I_n$. Explica por qué $A$ no es invertible.
  • Cuando $A$ no es invertible, la matriz $[A|I_n]$ tiene forma escalonada reducida $[A_{red}|X]$, con $A_{red}\neq I_n$. ¿Qué sucede si en este caso haces la multiplicación $AX$? ¿Y la multiplicación $XA$?
  • Demuestra la primera proposición de esta entrada para operaciones elementales sobre las columnas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Teorema de reducción gaussiana

Por Julio Sampietro

Introducción

Llegamos a uno de los resultados más importantes del álgebra lineal: el teorema de reducción gaussiana. Como mencionamos en una entrada previa, el teorema nos proporcionará un algoritmo que nos permitirá resolver muchos problemas prácticos: resolver sistemas lineales, invertir matrices, así como temas que veremos más adelante, como determinar la independencia lineal de vectores.

El teorema nos dice que cualquier matriz puede llevarse a una en forma escalonada reducida con solo una cantidad finita de operaciones elementales. La prueba además nos dice cómo hacerlo de una manera más o menos sencilla. Aparte de la demostración, damos una receta un poco más coloquial de cómo trabajar con el algoritmo y finalmente damos un ejemplo, muy importante para aclarar el procedimiento.

Sugerencia antes de empezar

El algoritmo que veremos es uno de esos resultados que es fácil de seguir para una matriz en concreto, pero que requiere de un buen grado de abstracción para entender cómo se demuestra en general. Una fuerte recomendación es que mientras estés leyendo la demostración del siguiente teorema, tengas en mente alguna matriz muy específica, y que vayas realizando los pasos sobre ella. Puedes usar, por ejemplo, a la matriz $$A=\begin{pmatrix} 0 & 0 & 4 & -2 \\ 0 & 3 & -1 & 0 \\ 0& -3 & 5 & -2 \end{pmatrix}.$$

El teorema de reducción gaussiana

Teorema. Cualquier matriz $A\in M_{m,n}(F)$ puede llevarse a una en forma escalonada reducida realizando una cantidad finita de operaciones elementales en sus filas.

Demostración: Daremos una demostración algorítmica. Sea $A\in M_{m,n}(F)$ cualquier matriz. Para auxiliarnos en el algoritmo, vamos a tener registro todo el tiempo de las siguientes dos variables:

  • $X$ es la columna que «nos toca revisar».
  • $Y$ es la cantidad de «filas no triviales» que hemos encontrado.

La variable $X$ empieza siendo $1$ y la variable $Y$ empieza siendo $0$.

Haremos los siguientes pasos:

Paso 1. Revisaremos la columna $X$ a partir de la fila $Y+1$ (osea, al inicio $Y=0$, así que revisamos toda la columna). Si todas estas entradas son iguales a $0$, entonces le sumamos $1$ a $X$ (avanzamos hacia la derecha) y si $X<n$, volvemos a hacer este Paso 1. Si $X=n$, vamos al paso 7.

Paso 2. En otro caso, existe alguna entrada distinta de cero en la columna $X$, a partir de la fila $Y+1$. Tomemos la primera de estas entradas. Supongamos que sucede en la fila $i$, es decir, que es la entrada $a_{iX}$. Al número en esta entrada $a_{iX}$ le llamamos $x$.

Paso 3. Hacemos un intercambio entre la fila $i$ y la fila $Y+1$. Puede pasar que $i=Y+1$, en cuyo caso no estamos haciendo nada. Independientemente del caso, ahora el número en la entrada $(X,Y+1)$ es $x\neq 0$.

Paso 4. Tomamos la fila $Y+1$ y la multiplicamos por el escalar $1/x$. Esto hace que ahora sea la primer entrada en su fila distinta de cero, y además que sea igual a $1$.

Paso 5. De ser necesario, hacemos transvecciones para hacer el resto de las entradas de la columna $X$ iguales a $0$. Esto lo podemos hacer pues, si por ejemplo la entrada $a_{iX}\neq 0$, entonces la transvección que a la $i$-ésima fila le resta $a_{iX}$ veces la $(Y+1)$-ésima fila hace que la entrada $(i,X)$ se anule.

Paso 6. Le sumamos $1$ a $Y$ (para registrar que encontramos una nueva fila no trivial) y le sumamos $1$ a $X$ (para avanzar a la columna de la derecha). Si $X<n$, vamos al Paso 1. Si $X=n$, vamos al Paso 7.

Paso 7. Reportamos la matriz obtenida como $A_{red}$, la forma escalonada reducida de $A$.

Mostremos que en efecto obtenemos una matriz escalonada reducida. El Paso 3 garantiza que las únicas filas cero están hasta abajo. El Paso 4 garantiza que todos los pivotes son iguales a 1. El ir recorriendo las columnas de izquierda a derecha garantiza que los pivotes quedan «escalonados», es decir de abajo hacia arriba quedan de izquierda a derecha. El Paso 5 garantiza que cada pivote es la única entrada no cero de su columna.

$\square$

El procedimiento descrito en el teorema se llama reducción gaussiana.

Como vimos en la entrada anterior realizar una operación elemental es sinónimo de multiplicar por una matriz elemental. Como el teorema nos dice que podemos obtener una matriz en forma escalonada reducida realizando una cantidad finita de operaciones elementales, se sigue que podemos obtener una matriz en forma escalonada reducida multiplicando por la izquierda por un número finito de matrices elementales. Al asociar todas estas matrices elementales en un único producto, obtenemos la demostración del siguiente corolario.

Corolario. Para cualquier matriz $A\in M_{m,n}(F)$ podemos encontrar una matriz $B\in M_{m}(F)$ que es un producto finito de matrices elementales y que satisface qu $A_{red}=BA$.

Un tutorial de reducción gaussiana más relajado

Si bien el teorema nos da la manera formal de hacer el algoritmo, el proceso es en realidad bastante intuitivo una vez que se entiende. Para esto explicamos en unos cuantos pasos en términos más sencillos como hacer la reducción:

  1. Buscamos la primer columna de la matriz que no tenga puros ceros.
  2. Una vez encontrada, buscamos la primer entrada (de arriba hacia abajo) que no sea cero.
  3. Pasamos el renglón con esa entrada hasta arriba haciendo un cambio de renglones.
  4. Multiplicamos por el inverso de esa entrada a todo el renglón, para quedarnos así con un $1$ hasta arriba.
  5. Sustraemos múltiplos del primer renglón a todos los otros renglones para que todo lo que esté abajo del $1$ sea cero.
  6. Buscamos la siguiente columna tal que no sea cero abajo del primer renglón.
  7. Repetimos los pasos anteriores, solo que en lugar de pasar nuestro renglón «hasta arriba» solo lo colocamos en el segundo lugar, y así sucesivamente.

Un ejemplo de reducción gaussiana

La mejor manera de entender el algoritmo de reducción gaussiana es con un ejemplo. Usemos el algoritmo para reducir la matriz

\begin{align*}
A=\begin{pmatrix} 0 & 1 & 2 & 3 &4\\ -1 & 0 &1 & 2 &3 \\ 0 & 1 & 1 & 1 &1\\ 3 & 1 &-1 & 0 & 2\end{pmatrix}\in M_{4,5}(\mathbb{R}).
\end{align*}

Aplicando los pasos en orden: Primero identificamos la primer columna que no sea idénticamente cero, y vemos que la primera columna no tiene puros ceros. La primer entrada que no es cero está en el segundo renglón. Así cambiamos el primer y segundo renglón de lugar para subir esa entrada y obtener

\begin{align*}
A_1=\begin{pmatrix} -1 & 0 &1 & 2 &3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 3 & 1 &-1 & 0 & 2\end{pmatrix}.
\end{align*}

Ahora que la primer entrada del primer renglón es distinta de cero, multiplicamos el primer renglón por $\frac{1}{-1}=-1$ y obtenemos

\begin{align*}
A_2=\begin{pmatrix} 1 & 0 &-1 & -2 &-3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 3 & 1 &-1 & 0 & 2\end{pmatrix}.
\end{align*}

Ahora queremos quitar el $3$ del último renglón. Para esto, multiplicamos por $-3$ el primer renglón y lo sumamos al último y nos queda

\begin{align*}
A_3&=\begin{pmatrix} 1 & 0 &-1 & -2 &-3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 3-3 & 1-3\cdot 0 &-1-3\cdot (-1) & 0-3\cdot (-2) & 2-3\cdot (-3)\end{pmatrix}\\ &=\begin{pmatrix} 1 & 0 &-1 & -2 &-3 \\ 0 & 1 & 2 & 3 &4\\ 0 & 1 & 1 & 1 &1\\ 0 & 1&2 & 6 & 11\end{pmatrix}.
\end{align*}

Ya tenemos entonces nuestra primera columna en forma escalonada reducida, pasemos a la segunda. Ya tenemos un $1$ en la segunda entrada de la segunda columna, por lo que no hace falta hacer un cambio de renglón o multiplicar por un inverso. Basta entonces con cancelar las otras entradas de la columna, para eso sustraemos el segundo renglón del tercero y cuarto, para obtener

\begin{align*}
A_4&= \begin{pmatrix} 1 & 0 & -1 & -2 & -3 \\ 0 & 1 & 2 & 3 &4 \\ 0-0 & 1-1 & 1-2 & 1-3 & 1-4\\ 0 -0 & 1-1& 2-2 & 6-3 & 11-4\end{pmatrix}\\
&= \begin{pmatrix}
1 & 0 &-1 & -2 &-3\\ 0 & 1 & 2 & 3 &4 \\ 0 & 0 & -1 & -2 & -3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}.
\end{align*}

Seguimos entonces con la tercera columna, y observamos que la entrada $(3,3)$ es $-1$, entonces la transformamos en un $1$ multiplicando el tercer renglón por $\frac{1}{-1}=-1$.

\begin{align*}
A_5=\begin{pmatrix}
1 & 0 &-1 & -2 &-3\\ 0 & 1 & 2 & 3 &4 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}.
\end{align*}

Ahora tenemos que cancelar las entradas de la tercer columna, para eso sumamos $-2$ veces el tercer renglón al segundo y una vez el tercer renglón al primero:

\begin{align*}
A_6&=\begin{pmatrix}
1+0 & 0+0 &-1+1 & -2+2 &-3+3\\ 0-2\cdot 0 & 1-2\cdot 0 & 2-2\cdot 1 & 3-2\cdot2 &4-2\cdot3 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}\\
&= \begin{pmatrix}
1 & 0 &0 & 0 &0\\ 0 & 1 & 0 & -1 &-2 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &3 & 7\end{pmatrix}.
\end{align*}

Ahora pasamos a la siguiente columna. En la entrada $(4,4)$ tenemos un $3$, pero queremos un $1$, entonces multiplicamos el último renglón por $\frac{1}{3}$:

\begin{align*}
A_7= \begin{pmatrix}
1 & 0 &0 & 0 &0\\ 0 & 1 & 0 & -1 &-2 \\ 0 & 0 & 1 & 2 & 3\\ 0 & 0 & 0 &1 & \frac{7}{3}\end{pmatrix}.\end{align*}

Finalmente, cancelamos las entradas restantes de los otros renglones sustrayendo dos veces el último renglón del penúltimo y sumándolo una vez al segundo para obtener

\begin{align*}
A_8=\begin{pmatrix}1 & 0 &0 &0 &0 \\ 0 & 1& 0 & 0 & \frac{1}{3}\\ 0 & 0 &1 & 0 &-\frac{5}{3}\\ 0 & 0 & 0 & 1 & \frac{7}{3} \end{pmatrix}.
\end{align*}

Y así termina nuestro algoritmo, y nuestra matriz está en forma escalonada reducida. Las dos cosas más importantes de $A_8$ son que

  • Está en forma escalonada reducida y
  • es equivalente a $A$, es decir, el sistema de ecuaciones $AX=0$ y el sistema de ecuaciones $A_8 X =0$ tienen exactamente las mismas soluciones.

De hecho, todas las matrices $A,A_1, A_2, \ldots, A_8$ son equivalentes entre sí, pues difieren únicamente en operaciones elementales. Esta propiedad es muy importante, y precisamente es la que nos permite aplicar el algoritmo de reducción gaussiana a la resolución de sistemas lineales.

Una aplicación a un sistema de ecuaciones

Usemos el ejemplo anterior para resolver un sistema de ecuaciones:

Problema. Resolver en los reales el sistema lineal homogéneo $AX=0$ donde $A$ es la matriz ejemplo de la sección anterior.

Solución: Los sistemas $AX=0$ y $A_{red}X=0$ son equivalentes, por lo que basta resolver $A_{red}X=0$ con $A_{red}$ la matriz en forma escalonada reducida que encontramos (es decir, $A_8$). Este sistema queda planteado por las siguientes ecuaciones lineales:

\begin{align*}
\begin{cases}
x_1=0\\
x_2+\frac{x_5}{3}=0\\
x_{3}-\frac{5}{3}x_5=0\\
x_4+\frac{7}{3}x_5=0.
\end{cases}.
\end{align*}

Ya hemos resuelto sistemas de este estilo. Aquí $x_5$ es la variable libre y $x_1,x_2,x_3,x_4$ son variables pivote. Fijando $x_5$ igual a cualquier número real $t$, obtenemos que las soluciones son de la forma

\begin{align*}
\left(0, -\frac{1}{3}t, \frac{5}{3} t, – \frac{7}{3}t, t\right), \hspace{2mm} t\in \mathbb{R}.
\end{align*}

$\triangle$

Más adelante…

El algoritmo de reducción gaussiana es crucial para muchos de los problemas que nos encontramos en álgebra lineal. Por ahora, las aplicaciones principales que veremos es cómo nos permite resolver sistemas de ecuaciones lineales de la forma $AX=b$ y cómo nos permite encontrar inversas de matrices. Sin embargo, más adelante usaremos reducción gaussiana para determinar la dimensión de espacios vectoriales, conjuntos generados, para determinar si ciertos vectores son linealmente independientes, para determinar el rango de una matriz y varias otras cosas más.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Aplica el algoritmo de reducción gaussiana a la matriz $$\begin{pmatrix} 1 & 1 & 2 & 2 & 3 & 3 \\ 0 & 0 & 4 & 4 & 5 & 5 \\ 0 & 0 & 0 & 0 & 6 & 6 \end{pmatrix}.$$ Para su sistema lineal asociado, encuentra todas las variables pivote y libres y resuélvelo por completo.
  • Aplica el algoritmo de reducción gaussiana a la matriz $$\begin{pmatrix} 0 & 8 \\ 0 & 2 \\ -1 & 5 \\ 2 & 3 \\ 5 & 0 \\ 3 & 1\end{pmatrix}.$$
  • Considera las matrices $A_1$, $A_4$ y $A_8$ de la sección con el ejemplo del algoritmo de reducción gaussiana. Toma una solución no trivial de $A_8X=0$ y verifica manualmente que también es solución de los sistemas lineales $A_1X=0$ y de $A_4X=0$.
  • Encuentra la matriz $B$, producto de matrices elementales tal que $BA=A_{red}$ con $A$ la matriz que usamos en el ejemplo. Para ello, tendrás que multiplicar todas las matrices correspondientes a las operaciones elementales que usamos.
  • Explica qué es lo que garantiza que el algoritmo de reducción gaussiana en efecto hace una cantidad finita de operaciones elementales.
  • Aplica el algoritmo de reducción gaussiana a la matriz $$A=\begin{pmatrix} 0 & 2 & 1 & 0 \\ 1 & 1 & 0 & 1\end{pmatrix}.$$ Si haces los pasos correctamente, llegarás a una matriz del estilo $$A_{red}=\begin{pmatrix} 1 & 0 & a & b \\ 0 & 1 & c & d \end{pmatrix}.$$ Toma el bloque $B$ de $2\times 2$ de la izquierda de $A$, es decir $B=\begin{pmatrix} 0 & 2 \\ 1 & 1\end{pmatrix}$. Toma el bloque $C$ de $2\times 2$ de la derecha de $A_{red}$, es decir, $C=\begin{pmatrix} a & b \\ c & d \end{pmatrix}.$ ¿Qué matriz obtienes al hacer el producto $BC$? ¿Y el producto $CB$? ¿Por qué crees que pasa esto?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Forma escalonada reducida

Por Julio Sampietro

Introducción

En esta entrada tratamos la forma escalonada reducida de una matriz, que es básicamente una forma «bonita» de expresar una matriz que nos permite resolver sistemas de ecuaciones lineales. Luego nos adentramos en la parte de operaciones elementales, que es el primer paso para desarrollar un algoritmo (que luego veremos es la reducción gaussiana) que nos permite llevar a cualquier matriz a su forma escalonada reducida.

En otras palabras, en esta entrada vemos cómo resolver un caso fácil de un sistema de ecuaciones. Más adelante veremos que en realidad cualquier caso puede llevarse al caso fácil con un algoritmo relativamente fácil.

¿Qué es la forma escalonada reducida?

Sea una matriz $A$ con entradas en un campo $F$. Si $R$ es un renglón de $A$, diremos que $R$ es una fila cero si todas sus entradas son cero. Si $R$ no es una fila cero, el término principal de $R$ o bien el pivote de $R$ es la primera entrada distinta de cero de la fila. Diremos que $A$ está en forma escalonada reducida si $A$ tiene las siguientes propiedades:

  1. Todas las filas cero de $A$ están hasta abajo de $A$ (es decir, no puede seguirse una fila distinta de cero después de una cero).
  2. El término principal de una fila no-cero está estrictamente a la derecha del término principal de la fila de encima.
  3. En cualquier fila distinta de cero, el término principal es $1$ y es el único elemento distinto de cero en su columna.

Ejemplo. La matriz $I_n$ está en forma escalonada reducida, así como la matriz cero $O_n$. La matriz

\begin{align*}
A= \begin{pmatrix} 1 &-1 & 0 &2\\ 0 & 0 & 1 & -1\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{align*}

está en forma escalonada reducida. El término principal de la primer fila es $1$ y está en la primer columna. El término principal de la segunda fila también es $1$, y se encuentra más a la derecha que el término principal de la fila anterior. Además, es la única entrada distinta de cero en su columna.

Sin embargo, la matriz ligeramente distinta

\begin{align*}
B= \begin{pmatrix} 1 &-1 & 5 &2\\ 0 & 0 & 1 & -1\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{align*}

no está en forma escalonada reducida ya que el término principal del segundo renglón no es la única entrada distinta de cero en su columna.

$\triangle$

¿Cómo la forma escalonada reducida nos permite resolver sistemas de ecuaciones?

¿Cual es la importancia de la forma escalonada con respecto al problema de resolver sistemas de ecuaciones? Veremos que cualquier matriz se puede poner (de manera algorítmica) en forma escalonada reducida y que esta forma es única. También veremos que si $A_{red}$ es la forma escalonada reducida de una matriz, entonces los sistemas $AX=0$ y $A_{red}X=0$ son equivalentes. Además, veremos que resolver el sistema $A_{red} X=0$ es muy fácil de resolver precisamente por estar en forma escalonada reducida.

Ejemplo. Resolvamos el sistema $AX=0$ donde $A$ es la matriz que dimos anteriormente, que está en forma escalonada reducida. El sistema asociado es

\begin{align*}
\begin{cases}
x_1 -x_2+2x_4&=0\\
x_3-x_4&=0
\end{cases}.
\end{align*}

De la segunda igualdad podemos expresar $x_3=x_4$ y de la primera $x_1=x_2-2x_4$. Así, podemos escoger $x_2$ y $x_4$ «libremente» y obtener $x_3$ y $x_1$ con estas ecuaciones (tenemos, de cierta manera, dos «parámetros libres»), por lo que nuestras soluciones se ven de la forma

\begin{align*}
(a-2b, a, b,b )
\end{align*}

con $a,b\in F$.

$\triangle$

En general si $A$ es una matriz en forma escalonada reducida, veamos cómo resolver el sistema $AX=0$. Las únicas ecuaciones importantes son las que resultan de renglones distintos de cero (pues las otras solo son $0=0$) y al estar en forma escalonada reducida, todos los renglones cero están hasta el final. Supongamos que el $i$-ésimo renglón de $A$ es distinto de cero y su término principal está en la $j$-ésima columna, así el término principal es $a_{ij}=1$. La $i$-ésima ecuación del sistema lineal entonces es de la forma

\begin{align*}
x_j +\sum_{k=j+1}^{n} a_{ik} x_k =0.
\end{align*}

Llamamos a $x_j$ la variable pivote del renglón $L_i$. Así, a cada renglón distinto de cero le podemos asociar una única variable pivote. Todas las demás variables del sistema son llamadas variables libres. Uno resuelve el sistema empezando desde abajo, expresando sucesivamente las variables pivote en términos de las variables libres. Esto nos da la solución general del sistema, en términos de las variables libres, que pueden tomar cualquier valor en $F$.

Si $y_1, \dots, y_s$ son las variables libres, entonces las soluciones del sistema son de la forma

\begin{align*}
X= \begin{pmatrix}
b_{11} y_1 + b_{12} y_2 + \dots+ b_{1s} y_s\\
b_{21} y_1+ b_{22} y_2 +\dots+b_{2s} y_s\\
\vdots\\
b_{n1} y_1 +b_{n2} y_2+ \dots + b_{ns} y_s\end{pmatrix}
\end{align*}

para algunos escalares $b_{ij}$. Esto también se puede escribir como

\begin{align*}
X= y_1 \begin{pmatrix} b_{11} \\ b_{21} \\ \vdots \\ b_{n1}\end{pmatrix}+\dots + y_s \begin{pmatrix} b_{1s} \\ b_{2s}\\ \vdots \\ b_{ns} \end{pmatrix} .
\end{align*}

Llamamos a

\begin{align*}
Y_1= \begin{pmatrix} b_{11}\\ b_{21}\\ \vdots \\ b_{n1}\end{pmatrix}, \dots, Y_s= \begin{pmatrix} b_{1s} \\ b_{2s} \\ \vdots \\ b_{ns}\end{pmatrix}
\end{align*}

las soluciones fundamentales del sistema $AX=0$. La motivación para su nombre es fácil de entender: $Y_1, \dots, Y_s$ son soluciones del sistema $AX=0$ que ‘generan’ todas las otras soluciones, en el sentido que todas las soluciones del sistema $AX=0$ se obtienen a través de todas las combinaciones lineales de $Y_1, \dots, Y_s$ (correspondiendo a todos los valores posibles de $y_1, \dots, y_s$).

Un ejemplo para aterrizar los conceptos

Sea $A$ la matriz en forma escalonada reducida dada como sigue

\begin{align*}
A= \begin{pmatrix}
1 & 1 & 0 & 0 &-1 & 0 & 2\\ 0 & 0 & 1 & 0 & 3 & 0 & 1\\ 0 & 0 & 0 & 1& 0 & 0 &-1\\ 0 & 0 &0 & 0 & 0 & 1 & 0 \\ 0 & 0 &0 & 0 & 0 & 0 & 0 \end{pmatrix}
\end{align*}

y consideremos el sistema homogéneo asociado $AX=0$. Este se puede escribir como

\begin{align*}
\begin{cases}
x_1+x_2-x_5+2x_7&=0\\
x_3+3x_5+x_7&=0\\
x_4-x_7&=0\\
x_6&=0
\end{cases}.
\end{align*}

Las variables pivote son $x_1, x_3, x_4$ y $x_6$, ya que los términos principales aparecen en las columnas $1,3,4$ y $6$. Eso nos deja a $x_2, x_5$ y $x_7$ como variables libres.

Para resolver el sistema, empezamos con la última ecuación y vamos «subiendo», expresando en cada paso las variables pivote en términos de las variables libres. La última ecuación nos da $x_6=0$. Después, obtenemos $x_4=x_7$, posteriormente $x_3=-3x_5-x_7$ y $x_1= -x_2+x_5-2x_7$. Nunca nos va a pasar que tengamos que expresar a una variable pivote en términos de otra variable pivote, por la condición de que cada pivote es la única entrada no cero en su columna.

Para expresar las soluciones en términos vectoriales, hacemos lo siguiente.

\begin{align*}
X&=\begin{pmatrix}
-x_2+x_5 -2x_7\\
x_2\\
-3x_5-x_7\\
x_7\\
x_5\\
0 \\
x_7
\end{pmatrix}\\ &= x_2\cdot \begin{pmatrix}-1 \\ 1 \\ 0 \\ 0\\ 0 \\ 0 \\ 0 \end{pmatrix} +x_5\cdot \begin{pmatrix} 1 \\ 0 \\ -3 \\ 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}+x_7 \cdot \begin{pmatrix} -2\\ 0 \\ -1\\ 1 \\ 0 \\ 0 \\1 \end{pmatrix}.
\end{align*}

Los tres vectores columna que aparecen del lado derecho de la igualdad son entonces las soluciones fundamentales del sistema $AX=0$. Todas las soluciones están entonces dadas por la expresión de la derecha, donde $x_2, x_5$ y $x_7$ pueden tomar cualquier valor en $F$.

Una moraleja sobre el número de soluciones

El número de soluciones fundamentales del sistema $AX=0$ es igual al número total de variables menos el número de variables pivote. Deducimos que el sistema $AX=0$ tiene como única solución a $X=0$ si no hay variables libres. Esto es lo mismo que decir que el número de variables pivote es igual al número de columnas de $A$.

Combinando las observaciones anteriores con el principio de superposición obtenemos el siguiente y muy importante resultado.

Teorema.

  1. Un sistema lineal homogéneo que tiene más variables que ecuaciones tiene soluciones no triviales. Si el campo de coeficientes es infinito (como por ejemplo $\mathbb{R}$ o $\mathbb{C}$), entonces el sistema tiene infinitas soluciones.
  2. Un sistema lineal consistente $AX=b$ que tiene más variables que ecuaciones tiene al menos dos soluciones, y si el campo es infinito, tiene infinitas soluciones.

¿Cómo llevar una matriz a su forma escalonada reducida? Operaciones elementales

Ahora regresamos al problema de transformar una matriz dada en una matriz con forma escalonada reducida. Para resolver este problema introducimos tres tipos de operaciones que pueden aplicarse a las filas de una matriz. Veremos que gracias a estas operaciones, uno puede transformar cualquier matriz en una en forma escalonada reducida.

Estas operaciones surgen de las manipulaciones cuando resolvemos sistemas lineales: las operaciones más naturales que hacemos cuando resolvemos un sistema de ecuaciones lineales son:

  1. multiplicar una ecuación por un escalar distinto de cero;
  2. añadir una ecuación (o mejor aún, un múltiplo de una ecuación) a otra ecuación diferente;
  3. intercambiar dos ecuaciones.

Observamos que estas operaciones son reversibles: si por ejemplo, multiplicamos una ecuación por un escalar $a\neq 0$, podemos multiplicar la misma ecuación por $\frac{1}{a}$ para recuperar la ecuación original. Queda claro que realizando una cantidad finita de estas operaciones en un sistema obtenemos un sistema con el mismo conjunto de soluciones que el sistema original (en nuestra terminología más barroca, un sistema nuevo equivalente al original). Estas operaciones en el sistema pueden verse como operaciones directamente en la matriz. Más precisamente:

Definición. Una operación elemental en las filas de una matriz $A$ en $M_{m,n}(F)$ es una operación de uno de los siguientes tipos:

  1. cambio de filas: intercambiar dos renglones de la matriz $A$,
  2. reescalar una fila: multiplicar una fila de la matriz $A$ por un escalar $c$ en $F$ distinto de cero,
  3. transvección: reemplazar una fila $L$ por $L+cL’$ para algún escalar $c$ en $F$ y otra fila $L’$ de $A$ diferente a $L$.

La discusión previa muestra que si $A$ es una matriz y $B$ se obtiene a partir de $A$ al aplicar una sucesión finita de operaciones elementales entonces $A\sim B$ (recordamos que esa notación solo nos dice que los sistemas $AX=0$ y $BX=0$ son equivalentes).

Correspondiendo a estas operaciones definimos las matrices elementales:

Definición. Una matriz $A\in M_n(F)$ es una matriz elemental si se obtiene de $I_n$ al realizar una operación elemental.

Ejemplo 1. La matriz

\begin{align*}
B= \begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 1\end{pmatrix}
\end{align*}

es una matriz elemental, pues se obtiene al intercambiar el primer y segundo renglón de $I_3$.

Observamos que las matrices elementales son cuadradas. Tenemos entonces tres tipos de matrices elementales:

  1. Matrices de transposición: aquellas que resultan de intercambiar dos renglones de $I_n$.
  2. Matrices de dilatación: aquellas obtenidas de $I_n$ multiplicando uno de sus renglones por un escalar distinto de cero.
  3. Matrices de transvección: son las que obtenemos de $I_n$ al añadir el múltiplo de un renglón a otro renglón.

Una sencilla, pero crucial observación es la siguiente:

Proposición. Sea $A\in M_{m,n}(F)$ una matriz. Realizar una operación elemental en $A$ es equivalente a multiplicar a $A$ por la izquierda por la matriz elemental en $M_{m}(F)$ correspondiente a la operación.

Demostración: Si $E$ es una matriz de $m\times m$ y $A\in M_{m,n}(F)$, entonces la $i$-ésima fila de $EA$ es $e_{i1} L_1+ e_{i2} L_2+\dots + e_{im} L_m$ donde $L_1, \dots, L_m$ son las filas de $A$ y $e_{ij}$ es la $(i,j)-$ésima entrada de $E$. El resultado se sigue de las definiciones y haciendo caso por caso, de acuerdo al tipo de operación elemental que se trate.

Por ejemplo, si la operación es un intercambio de filas, entonces $E$ es una matriz de transposición en donde, digamos, se intercambiaron la fila $k$ y la fila $l$. Por lo que mencionamos arriba, las filas $L_i$ con $i\neq k$ y $i\neq l$ permanecen intactas, pues $e_{ij}=1$ si $i=j$ y $0$ en otro caso, de modo que la $i$-ésima fila de $EA$ es simplemente $L_i$. Para la fila $k$ de $EA$, tenemos que $e_{kl}=1$ y si $i\neq k$, entonces $e_{ki}=0$. De esta forma, tendríamos que dicha fila es $L_l$. El análisis de la $l$-ésima fila de $EA$ es análogo.

Los detalles de la demostración anterior, así como las demostraciones para operaciones de reescalamiento y transvección, quedan como tarea moral.

$\square$

Ejemplo 2. Consideremos la matriz $A=\begin{pmatrix} 1 & -2 & 3 & 0\\ 0 & 1 & 0 & 1 \\ -1 & 0 & 3 & 0 \end{pmatrix}$. Vamos a efectuar la transvección que suma $2$ veces la primer fila a la última.

Si la aplicamos a la matriz $A$ nos queda $$A’=\begin{pmatrix} 1 & -2 & 3 & 0 \\ 0 & 1 & 0 & 1 \\ 1 & -4 & 9 & 0 \end{pmatrix}.$$

Para obtener la matriz elemental correspondiente a la transvección, tenemos que aplicársela a la identidad $I_3$. Tras hacer esto nos queda $$\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 2 & 0 &1 \end{pmatrix}.$$

Y en efecto, como afirma la proposición, tenemos que esta matriz que obtuvimos sirve para «aplicar» la transvección pues puedes verificar que si la multiplicamos por la izquierda, tenemos que:

$$\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 2 & 0 &1 \end{pmatrix} \begin{pmatrix} 1 & -2 & 3 & 0\\ 0 & 1 & 0 & 1 \\ -1 & 0 & 3 & 0 \end{pmatrix} = \begin{pmatrix} 1 & -2 & 3 & 0 \\ 0 & 1 & 0 & 1 \\ 1 & -4 & 9 & 0 \end{pmatrix}.$$

$\triangle$

Más adelante…

En la entrada de reducción gaussiana terminaremos de probar que toda matriz puede llevarse mediante operaciones elementales a una matriz en forma escalonada reducida. Más aún, obtendremos un algoritmo sencillo que siempre nos permitirá hacerlo. En el transcurso de este algoritmo siempre tendremos matrices equivalentes entre sí, de modo que esta será una herramienta fundamental para resolver sistemas de ecuaciones lineales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • En el ejemplo concreto que hicimos, verifica que en efecto las soluciones fundamentales que obtuvimos son solución al sistema. Verifica también que la suma de las tres también es una solución al sistema. Luego, elige los valores que tú quieras para $x_2,x_5,x_7$ y verifica que esa también es una solución
  • ¿Será cierto que la transpuesta de una matriz en forma escalonada reducida también está en forma escalonada reducida? ¿Será cierto que la suma de dos matrices en forma escalonada reducida también es de esta forma?
  • Termina los detalles de la demostración de la última proposición.
  • Demuestra que toda matriz elemental es invertible, y que su inversa también es una matriz elemental.
  • ¿Es cierto que la transpuesta de una matriz elemental es una matriz elemental?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»