Archivo de la etiqueta: pivotes

Álgebra Lineal I: Reducción gaussiana en sistemas lineales AX=b

Por Julio Sampietro

Introducción

Ya usamos el algoritmo de reducción gaussiana para estudiar sistemas de ecuaciones homogéneos. En esta entrada aplicamos lo que hemos aprendido de este método para resolver sistemas de ecuaciones no homogéneos.

Para hacer esto, adaptaremos la técnica para sistemas homogéneos (que en realidad, no es muy diferente) y la usamos para probar un resultado muy importante, llamado el teorema de existencia y unicidad. Damos unos cuantos ejemplos y concluimos con la prometida demostración de la unicidad de la forma escalonada reducida.

Adaptando el vocabulario

Consideramos un sistema lineal AX=b con AMm,n(F) y bFm, con variables x1,,xn que son las coordenadas de XFn. Para resolver el sistema consideramos la matriz aumentada (A|b) obtenida de A al añadir al vector b como columna hasta la derecha.

Ejemplo. Si

A=(012101) y b=(1214)

entonces

(A|b)=(0121210114)

Las operaciones elementales del sistema se traducen entonces en operaciones elementales en la matriz aumentada, por lo que para resolver el sistema podemos primero llevar a la matriz aumentada a su forma escalonada y reducida y después resolver el sistema más sencillo. Esto lo podríamos hacer siempre y cuando al realizar operaciones elementales en la matriz aumentada no se modifique el conjunto de soluciones del sistema. Esto lo garantiza la siguiente proposición.

Proposición. Sea el sistema lineal AX=b. Supongamos que la matriz (A|b) se obtiene a partir de la matriz (A|b) realizando una sucesión finita de operaciones elementales. Entonces los sistemas AX=b y AX=b son equivalentes, es decir, tienen el mismo conjunto de soluciones.

Demostración: Como ya hemos visto anteriormente, realizar operaciones elementales en (A|b) es equivalente a realizar operaciones elementales en las ecuaciones del sistema AX=b, pero ya sabemos que estas no alteran el conjunto de soluciones, pues son reversibles (es decir, podemos siempre deshacer los cambios).

◻

El teorema de existencia y unicidad

Llegamos ahora a otro resultado clave de nuestro estudio de ecuaciones. Es una caracterización que responde a nuestras preguntas: ¿Hay soluciones? ¿Son únicas? Además, nos puede sugerir cómo encontrarlas.

Teorema. (De existencia y unicidad) Supongamos que la matriz (A|b) ha sido llevada a su forma escalonada reducida (A|b) por operaciones elementales.

  1. (Existencia de soluciones) El sistema AX=b es consistente si y sólo si (A|b) no tiene ningún pivote (de filas) en su última columna.
  2. (Unicidad de soluciones) Si el sistema es consistente, entonces tiene una única solución si y sólo si A tiene pivotes (de filas) en cada columna.

Demostración:

  1. Supongamos que (A|b) tiene un pivote en su última columna. Debemos ver que el sistema AX=b no tiene solución. Para esto, basta ver que el sistema AX=b no tiene solución, pues es un sistema equivalente.

    Si el pivote aparece en el i-ésimo renglón entonces este es de la forma (0,,0,1), pues recordemos que los pivotes son iguales a 1 en la forma escalonada reducida. Entonces entre las ecuaciones del sistema AX=b tenemos una de la forma 0x1++0xn=1, que no tiene solución alguna. Así el sistema AX=b no es consistente, y por tanto AX=b tampoco lo es.

    Conversamente, supongamos que (A|b) no tiene un pivote en su última columna. Digamos que A tiene pivotes en las columnas j1<<jkn y sean xj1,,xjk las correspondientes variables pivote y todas las demás variables son libres. Dando el valor cero a todas las variables libres obtenemos un sistema en las variables xj1,,xjk. Este sistema es triangular superior y se puede resolver empezando por la última ecuación, encontrando xjk, luego xjk1 y así sucesivamente. Así encontramos una solución, por lo que el sistema es consistente. Esta solución encontrada también es una solución a AX=b, pues es un sistema equivalente.
  2. Como le podemos dar cualquier valor escalar a las variables libres, el argumento del párrafo anterior nos dice que la solución es única si y sólo si no tenemos variables libres, pero esto pasa si y sólo si los pivotes llegan hasta la última columna de A.

◻

Ten cuidado. En la primer parte, la condición se verifica con (A|b). En la segunda parte, la condición se verifica con A.

Encontrando y contando soluciones

Por simplicidad, asumamos que F=R, es decir que nuestro campo de coeficientes del sistema AX=b es el de los números reales. Procedemos como sigue para encontrar el número de soluciones del sistema:

  1. Consideramos la matriz aumentada (A|b).
  2. Llevamos esta matriz a su forma escalonada reducida (A|b).
  3. Si esta matriz tiene un renglón de la forma (0,,0,1), entonces el sistema es inconsistente.
  4. Si no tiene ningún renglón de esa forma, vemos si todas las columnas de A tienen al pivote de alguna fila:
    • Si en efecto todas tienen pivote, entonces el sistema tiene una única solución.
    • Si no todas tienen pivote, entonces nuestro sistema tiene una infinidad de soluciones.

En el caso en el que hay una o una infinidad de soluciones, además podemos decir exactamente cómo se ven esas soluciones:

  • Haciendo las variables libres iguales a cero (si es que hay), obtenemos una solución X al sistema AX=b.
  • Usamos reducción gaussiana para encontrar todas las soluciones al sistema homogéneo AX=0.
  • Finalmente, usamos el principio de superposición. Todas las soluciones a AX=b son de la forma X más una solución a AX=0.

Problema. Consideremos la matriz

A=(122011244).

Dado bR3, encuentra condiciones necesarias y suficientes en términos de las coordenadas de b para que el sistema AX=b sea consistente.

Solución: Dado b con coordenadas b1,b2 y b3, la matriz aumentada es

(A|b)=(122b1011b2244b3).

Para obtener su forma escalonada reducida sustraemos dos veces el primer renglón del tercero y luego dos veces el segundo del primero, obteniendo así:

(A|b)(100b12b2011b2000b32b1).

Por el teorema anterior, el sistema AX=b es consistente si y sólo si esta matriz no tiene pivotes en la última columna, es decir, necesitamos que la entrada de hasta abajo a la derecha sea cero. Así, el sistema es consistente si y sólo si b32b1=0 o, dicho de otra manera, si y sólo si b3=2b1.

Unicidad de la forma escalonada reducida

Concluimos esta entrada con una demostración de la unicidad de la forma escalonada reducida, usando que si dos matrices A y B que difieren por una sucesión finita de operaciones elementales entonces los sistemas AX=0 y BX=0 son equivalentes. La demostración que presentamos (corta y elegante) se debe a Thomas Yuster, publicada en el año 1983.

Teorema. La forma escalonada reducida es única.

Demostración: Procedemos por inducción sobre n, el número de columnas de AMm,n(F). El resultado es claro para n=1, pues solo tenemos una columna cero o una columna con un 1 hasta arriba. Supongamos pues que el resultado se cumple para n1, y demostremos que se cumple para n. Sea AMm,n(F) y sea AMm,n1(F) la matriz que se obtiene al quitarle la n-ésima columna.

Supongamos que B y C son ambas matrices distintas en forma escalonada reducida obtenidas de A. Dado que una sucesión de operaciones elementales que llevan a A a una forma escalonada reducida también llevan a A a una forma escalonada reducida (si a una matriz escalonada reducida le cortamos una columna, sigue siendo escalonada reducida), podemos aplicar la hipótesis de inducción y concluir que si B y C son distintas entonces difieren en la columna que quitamos y solo en esa.

Sea j tal que bjncjn (por nuestra discusión previa, existe esta entrada, ya que asumimos que BC). Si X es un vector tal que BX=0 entonces CX=0, ya que A,B y C son matrices equivalentes. Luego (BC)X=0. Como B y C difieren solo en la última columna, la j-ésima ecuación del sistema se lee (bjncjn)xn=0, pues los coeficientes previos son cero. Así, xn=0 siempre que BX=0 o CX=0. Se sigue que xn no es una variable libre para B y C, por lo que ambas tienen un pivote en la última columna. Como ambas están en forma escalonada reducida, entonces la última columna tiene necesariamente un 1 en la entrada de hasta abajo y puros ceros en otras entradas, es decir, B y C tienen la misma última columna, una contradicción a nuestras suposiciones.

Se sigue que entonces B=C y queda probado por contradicción el paso inductivo, lo que prueba el teorema.

◻

Más adelante…

El método que describimos en esta entrada es muy flexible y poderoso. Permite resolver sistemas de ecuaciones de la forma AX=b de manera metódica. Esto no quiere decir que ya entendamos todo lo que hay que saber de sistemas lineales. Una vez que hayamos introducido los conceptos de espacio vectorial y subespacio, podremos describir con más precisión cómo son las soluciones a un sistema lineal. Además, más adelante, veremos otras formas en las que se pueden resolver sistemas de ecuaciones usando determinantes. En particular, veremos la regla de Cramer.

Por ahora, nos enfocaremos en una aplicación más de la reducción gaussiana: encontrar inversas de matrices. Veremos esto en la siguiente entrada.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Determina cuántas soluciones tiene el sistema AX=b con
    A=(011247001) y b=(161)
  • Si A tiene estrictamente más renglones que columnas y b es un vector que no tiene ninguna entrada cero, ¿puede el sistema AX=b ser consistente?
  • Si A tiene estrictamente más columnas que renglones, ¿puede el sistema AX=0 tener una única solución?
  • Si AMm,n(F) es una matriz diagonal, ¿que puedes decir de la consistencia y la unicidad de soluciones del sistema AX=b?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Forma escalonada reducida

Por Julio Sampietro

Introducción

En esta entrada tratamos la forma escalonada reducida de una matriz, que es básicamente una forma «bonita» de expresar una matriz que nos permite resolver sistemas de ecuaciones lineales. Luego nos adentramos en la parte de operaciones elementales, que es el primer paso para desarrollar un algoritmo (que luego veremos es la reducción gaussiana) que nos permite llevar a cualquier matriz a su forma escalonada reducida.

En otras palabras, en esta entrada vemos cómo resolver un caso fácil de un sistema de ecuaciones. Más adelante veremos que en realidad cualquier caso puede llevarse al caso fácil con un algoritmo relativamente fácil.

¿Qué es la forma escalonada reducida?

Sea una matriz A con entradas en un campo F. Si R es un renglón de A, diremos que R es una fila cero si todas sus entradas son cero. Si R no es una fila cero, el término principal de R o bien el pivote de R es la primera entrada distinta de cero de la fila. Diremos que A está en forma escalonada reducida si A tiene las siguientes propiedades:

  1. Todas las filas cero de A están hasta abajo de A (es decir, no puede seguirse una fila distinta de cero después de una cero).
  2. El término principal de una fila no-cero está estrictamente a la derecha del término principal de la fila de encima.
  3. En cualquier fila distinta de cero, el término principal es 1 y es el único elemento distinto de cero en su columna.

Ejemplo. La matriz In está en forma escalonada reducida, así como la matriz cero On. La matriz

A=(110200110000)

está en forma escalonada reducida. El término principal de la primer fila es 1 y está en la primer columna. El término principal de la segunda fila también es 1, y se encuentra más a la derecha que el término principal de la fila anterior. Además, es la única entrada distinta de cero en su columna.

Sin embargo, la matriz ligeramente distinta

B=(115200110000)

no está en forma escalonada reducida ya que el término principal del segundo renglón no es la única entrada distinta de cero en su columna.

¿Cómo la forma escalonada reducida nos permite resolver sistemas de ecuaciones?

¿Cual es la importancia de la forma escalonada con respecto al problema de resolver sistemas de ecuaciones? Veremos que cualquier matriz se puede poner (de manera algorítmica) en forma escalonada reducida y que esta forma es única. También veremos que si Ared es la forma escalonada reducida de una matriz, entonces los sistemas AX=0 y AredX=0 son equivalentes. Además, veremos que resolver el sistema AredX=0 es muy fácil de resolver precisamente por estar en forma escalonada reducida.

Ejemplo. Resolvamos el sistema AX=0 donde A es la matriz que dimos anteriormente, que está en forma escalonada reducida. El sistema asociado es

{x1x2+2x4=0x3x4=0.

De la segunda igualdad podemos expresar x3=x4 y de la primera x1=x22x4. Así, podemos escoger x2 y x4 «libremente» y obtener x3 y x1 con estas ecuaciones (tenemos, de cierta manera, dos «parámetros libres»), por lo que nuestras soluciones se ven de la forma

(a2b,a,b,b)

con a,bF.

En general si A es una matriz en forma escalonada reducida, veamos cómo resolver el sistema AX=0. Las únicas ecuaciones importantes son las que resultan de renglones distintos de cero (pues las otras solo son 0=0) y al estar en forma escalonada reducida, todos los renglones cero están hasta el final. Supongamos que el i-ésimo renglón de A es distinto de cero y su término principal está en la j-ésima columna, así el término principal es aij=1. La i-ésima ecuación del sistema lineal entonces es de la forma

xj+k=j+1naikxk=0.

Llamamos a xj la variable pivote del renglón Li. Así, a cada renglón distinto de cero le podemos asociar una única variable pivote. Todas las demás variables del sistema son llamadas variables libres. Uno resuelve el sistema empezando desde abajo, expresando sucesivamente las variables pivote en términos de las variables libres. Esto nos da la solución general del sistema, en términos de las variables libres, que pueden tomar cualquier valor en F.

Si y1,,ys son las variables libres, entonces las soluciones del sistema son de la forma

X=(b11y1+b12y2++b1sysb21y1+b22y2++b2sysbn1y1+bn2y2++bnsys)

para algunos escalares bij. Esto también se puede escribir como

X=y1(b11b21bn1)++ys(b1sb2sbns).

Llamamos a

Y1=(b11b21bn1),,Ys=(b1sb2sbns)

las soluciones fundamentales del sistema AX=0. La motivación para su nombre es fácil de entender: Y1,,Ys son soluciones del sistema AX=0 que ‘generan’ todas las otras soluciones, en el sentido que todas las soluciones del sistema AX=0 se obtienen a través de todas las combinaciones lineales de Y1,,Ys (correspondiendo a todos los valores posibles de y1,,ys).

Un ejemplo para aterrizar los conceptos

Sea A la matriz en forma escalonada reducida dada como sigue

A=(11001020010301000100100000100000000)

y consideremos el sistema homogéneo asociado AX=0. Este se puede escribir como

{x1+x2x5+2x7=0x3+3x5+x7=0x4x7=0x6=0.

Las variables pivote son x1,x3,x4 y x6, ya que los términos principales aparecen en las columnas 1,3,4 y 6. Eso nos deja a x2,x5 y x7 como variables libres.

Para resolver el sistema, empezamos con la última ecuación y vamos «subiendo», expresando en cada paso las variables pivote en términos de las variables libres. La última ecuación nos da x6=0. Después, obtenemos x4=x7, posteriormente x3=3x5x7 y x1=x2+x52x7. Nunca nos va a pasar que tengamos que expresar a una variable pivote en términos de otra variable pivote, por la condición de que cada pivote es la única entrada no cero en su columna.

Para expresar las soluciones en términos vectoriales, hacemos lo siguiente.

X=(x2+x52x7x23x5x7x7x50x7)=x2(1100000)+x5(1030100)+x7(2011001).

Los tres vectores columna que aparecen del lado derecho de la igualdad son entonces las soluciones fundamentales del sistema AX=0. Todas las soluciones están entonces dadas por la expresión de la derecha, donde x2,x5 y x7 pueden tomar cualquier valor en F.

Una moraleja sobre el número de soluciones

El número de soluciones fundamentales del sistema AX=0 es igual al número total de variables menos el número de variables pivote. Deducimos que el sistema AX=0 tiene como única solución a X=0 si no hay variables libres. Esto es lo mismo que decir que el número de variables pivote es igual al número de columnas de A.

Combinando las observaciones anteriores con el principio de superposición obtenemos el siguiente y muy importante resultado.

Teorema.

  1. Un sistema lineal homogéneo que tiene más variables que ecuaciones tiene soluciones no triviales. Si el campo de coeficientes es infinito (como por ejemplo R o C), entonces el sistema tiene infinitas soluciones.
  2. Un sistema lineal consistente AX=b que tiene más variables que ecuaciones tiene al menos dos soluciones, y si el campo es infinito, tiene infinitas soluciones.

¿Cómo llevar una matriz a su forma escalonada reducida? Operaciones elementales

Ahora regresamos al problema de transformar una matriz dada en una matriz con forma escalonada reducida. Para resolver este problema introducimos tres tipos de operaciones que pueden aplicarse a las filas de una matriz. Veremos que gracias a estas operaciones, uno puede transformar cualquier matriz en una en forma escalonada reducida.

Estas operaciones surgen de las manipulaciones cuando resolvemos sistemas lineales: las operaciones más naturales que hacemos cuando resolvemos un sistema de ecuaciones lineales son:

  1. multiplicar una ecuación por un escalar distinto de cero;
  2. añadir una ecuación (o mejor aún, un múltiplo de una ecuación) a otra ecuación diferente;
  3. intercambiar dos ecuaciones.

Observamos que estas operaciones son reversibles: si por ejemplo, multiplicamos una ecuación por un escalar a0, podemos multiplicar la misma ecuación por 1a para recuperar la ecuación original. Queda claro que realizando una cantidad finita de estas operaciones en un sistema obtenemos un sistema con el mismo conjunto de soluciones que el sistema original (en nuestra terminología más barroca, un sistema nuevo equivalente al original). Estas operaciones en el sistema pueden verse como operaciones directamente en la matriz. Más precisamente:

Definición. Una operación elemental en las filas de una matriz A en Mm,n(F) es una operación de uno de los siguientes tipos:

  1. cambio de filas: intercambiar dos renglones de la matriz A,
  2. reescalar una fila: multiplicar una fila de la matriz A por un escalar c en F distinto de cero,
  3. transvección: reemplazar una fila L por L+cL para algún escalar c en F y otra fila L de A diferente a L.

La discusión previa muestra que si A es una matriz y B se obtiene a partir de A al aplicar una sucesión finita de operaciones elementales entonces AB (recordamos que esa notación solo nos dice que los sistemas AX=0 y BX=0 son equivalentes).

Correspondiendo a estas operaciones definimos las matrices elementales:

Definición. Una matriz AMn(F) es una matriz elemental si se obtiene de In al realizar una operación elemental.

Ejemplo 1. La matriz

B=(010100001)

es una matriz elemental, pues se obtiene al intercambiar el primer y segundo renglón de I3.

Observamos que las matrices elementales son cuadradas. Tenemos entonces tres tipos de matrices elementales:

  1. Matrices de transposición: aquellas que resultan de intercambiar dos renglones de In.
  2. Matrices de dilatación: aquellas obtenidas de In multiplicando uno de sus renglones por un escalar distinto de cero.
  3. Matrices de transvección: son las que obtenemos de In al añadir el múltiplo de un renglón a otro renglón.

Una sencilla, pero crucial observación es la siguiente:

Proposición. Sea AMm,n(F) una matriz. Realizar una operación elemental en A es equivalente a multiplicar a A por la izquierda por la matriz elemental en Mm(F) correspondiente a la operación.

Demostración: Si E es una matriz de m×m y AMm,n(F), entonces la i-ésima fila de EA es ei1L1+ei2L2++eimLm donde L1,,Lm son las filas de A y eij es la (i,j)ésima entrada de E. El resultado se sigue de las definiciones y haciendo caso por caso, de acuerdo al tipo de operación elemental que se trate.

Por ejemplo, si la operación es un intercambio de filas, entonces E es una matriz de transposición en donde, digamos, se intercambiaron la fila k y la fila l. Por lo que mencionamos arriba, las filas Li con ik y il permanecen intactas, pues eij=1 si i=j y 0 en otro caso, de modo que la i-ésima fila de EA es simplemente Li. Para la fila k de EA, tenemos que ekl=1 y si ik, entonces eki=0. De esta forma, tendríamos que dicha fila es Ll. El análisis de la l-ésima fila de EA es análogo.

Los detalles de la demostración anterior, así como las demostraciones para operaciones de reescalamiento y transvección, quedan como tarea moral.

◻

Ejemplo 2. Consideremos la matriz A=(123001011030). Vamos a efectuar la transvección que suma 2 veces la primer fila a la última.

Si la aplicamos a la matriz A nos queda A=(123001011490).

Para obtener la matriz elemental correspondiente a la transvección, tenemos que aplicársela a la identidad I3. Tras hacer esto nos queda (100010201).

Y en efecto, como afirma la proposición, tenemos que esta matriz que obtuvimos sirve para «aplicar» la transvección pues puedes verificar que si la multiplicamos por la izquierda, tenemos que:

(100010201)(123001011030)=(123001011490).

Más adelante…

En la entrada de reducción gaussiana terminaremos de probar que toda matriz puede llevarse mediante operaciones elementales a una matriz en forma escalonada reducida. Más aún, obtendremos un algoritmo sencillo que siempre nos permitirá hacerlo. En el transcurso de este algoritmo siempre tendremos matrices equivalentes entre sí, de modo que esta será una herramienta fundamental para resolver sistemas de ecuaciones lineales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • En el ejemplo concreto que hicimos, verifica que en efecto las soluciones fundamentales que obtuvimos son solución al sistema. Verifica también que la suma de las tres también es una solución al sistema. Luego, elige los valores que tú quieras para x2,x5,x7 y verifica que esa también es una solución
  • ¿Será cierto que la transpuesta de una matriz en forma escalonada reducida también está en forma escalonada reducida? ¿Será cierto que la suma de dos matrices en forma escalonada reducida también es de esta forma?
  • Termina los detalles de la demostración de la última proposición.
  • Demuestra que toda matriz elemental es invertible, y que su inversa también es una matriz elemental.
  • ¿Es cierto que la transpuesta de una matriz elemental es una matriz elemental?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»