Archivo de la etiqueta: matrices

Álgebra Lineal II: Existencia de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que para cualquier matriz nilpotente existe (y es única) una matriz similar muy sencilla, hecha por lo que llamamos bloques de Jordan de eigenvalor cero. Lo que haremos ahora es mostrar una versión análoga de este resultado para una familia mucho más grande de matrices. De hecho, en cierto sentido tendremos un resultado análogo para todas las matrices.

Pensando en ello, lo que haremos en esta entrada es lo siguiente. Primero, generalizaremos nuestra noción de bloques de Jordan para contemplar cualquier eigenvalor. Estudiaremos un poco de los bloques de Jordan. Luego, enunciaremos el teorema que esperamos probar. Finalmente, daremos el primer paso hacia su demostración. En la siguiente entrada terminaremos la demostración y hablaremos de aspectos prácticos para encontrar formas canónicas de Jordan.

Enunciado del teorema de la forma canónica de Jordan

A continuación definimos a los bloques de Jordan para cualquier eigenvalor y tamaño.

Definición. Sea $F$ un campo. El bloque de Jordan de eigenvalor $\lambda$ y tamaño $k$ es la matriz $J_{\lambda,k}$ en $M_k(F)$ cuyas entradas son todas $\lambda$, a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, $J_{\lambda,k}=[a_{ij}]$ con $$a_{ij}=\begin{cases} 1 & \text{si $j=i+1$}\\ \lambda & \text{si $i=j$} \\ 0 & \text{en otro caso.} \end{cases}$$

También podemos expresarlo de la siguiente manera:

$$J_{\lambda,k}=\begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 & 0 \\ 0 & \lambda & 1 & \cdots & 0 & 0 \\ 0 & 0 & \lambda & \cdots & 0 & 0 \\ & \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \cdots & \lambda & 1 \\ 0 & 0 & 0 & \cdots & 0 & \lambda \end{pmatrix},$$ en donde estamos pensando que la matriz es de $k\times k$.

Una última manera en la que nos convendrá pensar a $J_{\lambda,k}$ es en términos de los bloques de Jordan de eigenvalor cero: $J_{\lambda,k}=\lambda I_k + J_{0,k}$.

Definición. Una matriz de bloques de Jordan en $M_n(F)$ es una matriz diagonal por bloques en la que cada bloque en la diagonal es un bloque de Jordan.

Lo que nos gustaría demostrar es el siguiente resultado. En él, piensa en $\leq$ como algún orden total fijo de $F$ (para $\mathbb{R}$ es el orden usual, pero otros campos no necesariamente tienen un orden natural asociado).

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ sobre el campo $F$ y $T:V\to V$ una transformación lineal tal que $\chi_T(X)$ se divide sobre $F$. Entonces, existen únicos valores $\lambda_1\leq \ldots \leq \lambda_n$ en $F$ y únicos enteros $k_1,\ldots,k_d$ tales que \begin{align*} &k_1+k_2+\ldots+k_d = n,\\ &k_1\leq k_2 \leq \ldots \leq k_d,\end{align*} para los cuales existe una base de $V$ en la cual $T$ tiene como forma matricial a la siguiente matriz de bloques de Jordan:

$$\begin{pmatrix} J_{\lambda_1,k_1} & 0 & \cdots & 0 \\ 0 & J_{\lambda_2,k_2} & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & J_{\lambda_d,k_d}\end{pmatrix}.$$

Por supuesto, este teorema también tiene una versión matricial, la cuál tendrás que pensar cómo escribir.

Un teorema de descomposición de kernels

Ya tenemos uno de los ingredientes que necesitamos para dar la demostración de la existencia de la forma canónica de Jordan: su existencia para las transformaciones nilpotentes. Otro de los ingredientes que usaremos es el teorema de Cayley-Hamilton. El tercer ingrediente es un resultado de descoposición de kernels de transformaciones evaluadas en polinomios.

Proposición. Sea $V$ un espacio vectorial sobre $F$. Sea $T:V\to V$ una transformación lineal. Y sean $P_1(X),\ldots,P_r(X)$ polinomios en $F[x]$ cuyo máximo común divisor de cualesquiera dos de ellos es el polinomio $1$. Entonces, $$\ker((P_1P_2\cdots P_r)(T))=\bigoplus_{i=1}^r \ker(P_i(T)).$$

Demostración. Para cada $i\in \{1,2,\ldots,r\}$ consideraremos a $Q_i(X)$ como el polinomio que se obtiene de multiplicar a todos los polinomios dados, excepto $P_i(X)$. Y por comodidad, escribiremos $P(X)=(P_1\cdots P_r)(X)$. Notemos que entonces $P(X)=(Q_iP_i)(X)$ para cualquier $i\in\{1,2,\ldots,r\}$.

Primero probaremos un resultado polinomial auxiliar. Veremos que $Q_1(X),\ldots,Q_r(X)$ tienen como máximo común divisor al polinomio $1$. En caso de no ser así, un polinomio $D(X)$ no constante dividiría a todos ellos. Sin pérdida de generalidad, $D$ es irreducible (tomando, por ejemplo $D(X)$ de grado mínimo con esta propiedad). Como $D(X)$ es irreducible y divide a $Q_r(X)$, entonces debe dividir a alguno de los factores de $Q_r(X)$, que sin pérdida de generalidad (por ejemplo, reetiquetando), es $P_1(X)$. Pero $D(X)$ también divide a $Q_1(X)$, así que debe dividir a alguno de sus factores $P_2(X),\ldots,P_r(X)$, sin pérdida de generalidad a $P_2(X)$. Pero entonces $D(X)$ divide a $P_1(X)$ y $P_2(X)$, lo cual contradice las hipótesis. Así, $Q_1(X),\ldots,Q_r(X)$ tienen como máximo común divisor al polinomio $1$. Por el lema de Bézout para polinomios (ver tarea moral), existen entonces polinomios $R_1(X),\ldots,R_r(X)$ tales que

\begin{equation}
\label{eq:bezout}(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(X)=1.
\end{equation}

Estamos listos para pasar a los argumentos de álgebra lineal. Veamos primero que cualquier elemento en la suma de la derecha está en el kernel de $P(T)$. Tomemos $v=v_1+\ldots+v_r$ con $v_i\in \ker(P_i(T))$. Al aplicar $P$ obtenemos

\begin{align*}
P(v)&=P(v_1)+\ldots+P(v_r)\\
&=Q_1(P_1(v_1))+\ldots+Q_r(P_r(v_r))\\
&=0+\ldots+0=0.
\end{align*}

Esto muestra que $v\in \ker(P(T))$, de donde se obtiene la primera contención que nos interesa.

Veamos ahora la segunda contención, que $\ker(P(T))=\bigoplus_{i=1}^r \ker(P_i(T))$. Tomemos $v\in \ker(P(T))$. Al aplicar \eqref{eq:bezout} en $T$ y evaluar en $v$ obtenemos que

\begin{align*}
v&=\text{Id}(v)=(1)(T)(v)\\
&=(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(T)(v)\\
&=(R_1Q_1)(T)(v)+\ldots+(R_rQ_r)(T)(v).
\end{align*}

Pero esto justo expresa a $v$ como elemento de $\ker(P_i(T))$ pues para cada $i$ tenemos

\begin{align*}
P_i(T)((R_iQ_i)(T)(v))&=(P_iR_i Q_i )(T)(v)\\
&=(R_i Q_i P_i)(T)(v)\\
&=R_i(T)P(T)(v)\\
&=R_i(0)=0,
\end{align*}

de modo que expresamos a $v$ como suma de vectores en $\ker(P_1(T)),\ldots,\ker(P_r(T))$.

Ya demostramos la igualdad de conjuntos, pero recordemos que en la igualdad de suma directa hay otra cosa que hay que probar: que el cero tiene una forma única de expresarse como suma de elementos de cada subespacio (aquella en donde cada elemento es cero). Supongamos entonces que $$0=v_1+\ldots+v_r$$ con $v_i\in \ker(P_i(T))$ para cada $i$. Si aplicamos $Q_i$ en esta igualdad, como tiene todos los factores $P_j$ con $j\neq i$ obtenemos $$0=Q_i(0)=Q_i(v_i).$$

Por otro lado, al aplicar nuevamente \eqref{eq:bezout} en $T$ y evaluar en $v_i$

\begin{align*}
v_i&=\text{Id}(v_i)=(1)(T)(v_i)\\
&=(R_1Q_1 + R_2Q_2 + \ldots + R_rQ_r)(T)(v_i)\\
&=(R_1Q_1)(T)(v_1)+\ldots+(R_rQ_r)(T)(v_i)\\
&=(R_iQ_i)(T)(v_i)\\
&=0.
\end{align*}

De esta forma, en efecto tenemos que los espacios están en posición de suma directa, que era lo último que nos faltaba verificar.

$\square$

Existencia de la forma canónica de Jordan

Estamos listos para demostrar la existencia de la forma canónica de Jordan. Supongamos que $V$ es un espacio vectorial de dimensión finita $n$ sobre $F$ y que $T:V\to V$ es una transformación lineal cuyo polinomio característico se divide en $F[x]$. Sabemos entonces que es de la siguiente forma:

$$\chi_T(X)=(X-\lambda_1)^{m_1}(X-\lambda_2)^{m_2}\cdots(X-\lambda_r)^{m_r},$$

donde $\lambda_1,\ldots,\lambda_r$ son eigenvalores distintos de $T$ y $m_1,\ldots,m_r$ son las multiplicidades algebraicas respectivas de estos eigenvalores como raíces de $\chi_T(X)$.

Por el teorema de Cayley-Hamilton, sabemos que $\chi_T(T)=0$, de modo que $\ker(\chi_T(T))=V$. Por la proposición de descomposición de la sección anterior aplicada a los polinomios $P_i(X)=(X-\lambda_i)^{m_i}$ (verifica que son primos relativos dos a dos) para $i\in\{1,\ldots,r\}$ tenemos entonces que $$V=\bigoplus_{i=1}^r \ker((T-\lambda_i \text{id})^{m_i}).$$

Pero, ¿cómo es la transformación $T-\lambda_i \text{id}$ restringida a cada $\ker((T-\lambda_i \text{id})^{m_i})$? ¡Es nilpotente! Precisamente por construcción, $(T-\lambda_i \text{id})^{m_i}$ se anula totalmente en este kernel. Así, por la existencia de la forma canónica de Jordan para matrices nilpotentes, hay una base $\beta_i$ para cada $\ker((T-\lambda_i \text{id})^{m_i})$ tal que $T-\lambda_i \text{id}$ restringida a ese kernel tiene como forma matricial una matriz $J_i$ de bloques de Jordan de eigenvalor cero. Pero entonces $T$ (restringida a dicho kernel) tiene como forma matricial a $J_i+\lambda_i I_{m_i}$, que es una matriz de bloques de Jordan de eigenvalor $\lambda$.

Con esto terminamos: como $V$ es la suma directa de todos esos kernel, la unión de bases $\beta_1,\ldots,\beta_r$ es una base para la cual $T$ tiene como forma matricial a una matriz de bloques de Jordan.

$\square$

Más adelante…

Hemos demostrado la existencia de la forma canónica de Jordan, pero aún nos falta demostrar su unicidad. Además de esto, también necesitaremos un mejor procedimiento para encontrarla. Haremos eso en la siguiente entrada.

Tarea moral

  1. Enuncia el teorema de la forma canónica de Jordan versión matrices.
  2. Investiga más sobre el lema de Bézout para polinomios y cómo se demuestra. Después de esto, expresa al polinomio $1$ como combinación lineal de los polinomios $x^2-1, x^3+1, x^2+5x+4$.
  3. Verifica que los polinomios $P_i(X)=(X-\lambda_i)^{k_i}$ de la demostración de la existencia de la forma canónica de Jordan cumplen las hipótesis de la proposición de descomposición de kernels.
  4. Sea $F$ un campo y $r,s$ elementos en $F$. Sea $n$ un entero. Demuestra que los bloques de Jordan $J_{r,n}$ y $J_{s,n}$ en $M_n(F)$ conmutan.
  5. Siguiendo las ideas de la demostración de existencia, encuentra la forma canónica de Jordan de la matriz $$\begin{pmatrix} 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & 2 & 2 \\ 0 & 0 & 0 & 2 \end{pmatrix}.$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior I: Producto de matrices con matrices

Por Eduardo García Caballero

Introducción

Hasta ahora hemos conocido varias operaciones que involucran escalares, vectores y matrices. En esta entrada aprenderemos sobre una de las operaciones más importantes en el álgebra lineal: el producto de matrices con matrices.

Definición de producto de matrices

Para poder efectuar el producto de dos matrices, hay que asegurarnos de que el número de columnas de la primera matriz sea igual al número de filas de la segunda matriz.

El resultado de una matriz $A$ de tamaño $m \times n$ por una matriz $B$ de tamaño $n \times \ell$ será la matriz $C = AB$ de tamaño $m \times \ell$, donde la entrada $c_{ij}$ de $C$ está dada por la fórmula
\[
c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{in}b_{nj}.
\]

A primera vista esta fórmula puede parecer complicada, sin embargo, practicando con algunos ejemplos verás que es muy fácil de implementar.

  • Producto de matrices de tamaño $2 \times 2$:

Sean
\[
A
=
\begin{pmatrix}
1 & 3 \\
5 & 7
\end{pmatrix}
\qquad
\text{y}
\qquad
B
=
\begin{pmatrix}
2 & 4 \\
6 & 8
\end{pmatrix}.
\]

Como estamos multiplicando una matriz de tamaño $2 \times 2$ por una matriz de tamaño $2 \times 2$, sabemos que el resultado será otra matriz de tamaño $2 \times 2$. Ahora, iremos calculando una por una sus entradas.

Sea $C = AB$. Para calcular la entrada $c_{11}$ observamos la primera fila de $A$ y la primera columna de $B$, las cuales son
\[
A
=
\begin{pmatrix}
1 & 3\\
\phantom{5} & \phantom{7}
\end{pmatrix}
\qquad
\text{y}
\qquad
B
=
\begin{pmatrix}
2 & \phantom{4} \\
6 & \phantom{8}
\end{pmatrix},
\]
de modo que $c_{11} = (1)(2)+(3)(6) = 20$:
\[
AB
=
\begin{pmatrix}
20 & \phantom{28} \\
\phantom{52} & \phantom{76}
\end{pmatrix}.
\]

Para la entrada $c_{12}$, nos fijamos en la primera columna de $A$ y en la segunda columna de $B$, que son
\[
A
=
\begin{pmatrix}
1 & 3\\
\phantom{5} & \phantom{7}
\end{pmatrix}
\qquad
\text{y}
\qquad
B
=
\begin{pmatrix}
\phantom{2} & 4 \\
\phantom{6} & 8
\end{pmatrix},
\]
obteniendo $c_{12} = (1)(4) + (3)(8) = 28$:
\[
AB
=
\begin{pmatrix}
20 & 28 \\
\phantom{52} & \phantom{76}
\end{pmatrix}.
\]

De manera similar, observemos la segunda fila de $A$ y la primera columna de $B$,
\[
A
=
\begin{pmatrix}
\phantom{1} & \phantom{3} \\
5 &7
\end{pmatrix},
\qquad
B
=
\begin{pmatrix}
2 & \phantom{4} \\
6 & \phantom{8}
\end{pmatrix},
\]
obteniendo $c_{21} = (5)(2) + (7)(6) = 52$, mientras que la segunda fila de $A$ y la segunda columna de $B$ son
\[
A
=
\begin{pmatrix}
\phantom{1} & \phantom{3} \\
5 &7
\end{pmatrix},
\qquad
B
=
\begin{pmatrix}
\phantom{2} & 4 \\
\phantom{6} & 8
\end{pmatrix},
\]
obteniendo $c_{22} = (5)(4) + (7)(8) = 76$.

Por lo tanto,
\[
AB
=
\begin{pmatrix}
20 & 28 \\
52 & 76
\end{pmatrix}.
\]

En general, el resultado del producto de las matrices
\[
A
=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{pmatrix}
\qquad
\text{y}
\qquad
B
=
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
\]
es
\[
AB
=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{pmatrix}
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22}
\end{pmatrix}.
\]

  • Producto de matriz de $3 \times 2$ por matriz de $2 \times 2$:

Supongamos que
\[
A
=
\begin{pmatrix}
3 & 5 \\
1 & 0 \\
4 & 3
\end{pmatrix}
\qquad
\text{y}
\qquad
B
=
\begin{pmatrix}
7 & 8 \\
5 & 2
\end{pmatrix}.
\]

En este caso, como estamos multiplicando una matriz de tamaño $3 \times 2$ por una matriz de tamaño $2 \times 2$, la matriz resultante tendrá tamaño $3 \times 2$.

Podemos obtener sus entradas de manera similar al caso anterior. Si $C = AB$, entonces la entrada $c_{12}$ la podemos encontrar revisando la primera fila de $A$ y la segunda columna de $B$,
\[
A
=
\begin{pmatrix}
3 & 5 \\
\phantom{1} & \phantom{0} \\
\phantom{4} & \phantom{3}
\end{pmatrix},
\qquad
B
=
\begin{pmatrix}
\phantom{7} & 8 \\
\phantom{5} & 2
\end{pmatrix}.
\]
de modo que $c_{12} = (3)(8) + (5)(2) = 34$. Por su parte, para obtener la entrada $c_{31}$ nos fijamos en la tercera fila de $A$ y la primera columna de $B$,
\[
A
=
\begin{pmatrix}
\phantom{3} & \phantom{5} \\
\phantom{1} & \phantom{0} \\
4 & 3
\end{pmatrix},
\qquad
B
=
\begin{pmatrix}
7 & \phantom{8} \\
5 & \phantom{2}
\end{pmatrix}.
\]
obteniendo $c_{31} = (4)(7) + (3)(5) = 43$.

¿Podrías comprobar que
\[
AB
=
\begin{pmatrix}
46 & 34 \\
7 & 8 \\
43 & 38
\end{pmatrix}?
\]

Así, para el caso general de matrices de $3 \times 2$ por $2 \times 2$, obtendremos
\[
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \\
a_{31}b_{11} + a_{32}b_{21} & a_{31}b_{12} + a_{32}b_{22}
\end{pmatrix}.
\]

  • Producto de matriz de $4 \times 2$ por matriz de $2 \times 3$:

¿Podrías verificar que la siguiente fórmula es correcta?
\[
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32} \\
a_{41} & a_{42}
\end{pmatrix}
\begin{pmatrix}
b_{11} & b_{12} & b_{13} \\
b_{21} & b_{22} & b_{23}
\end{pmatrix}
=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} & a_{11}b_{13} + a_{12}b_{23} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} & a_{21}b_{13} + a_{22}b_{23} \\
a_{31}b_{11} + a_{32}b_{21} & a_{31}b_{12} + a_{32}b_{22} & a_{31}b_{13} + a_{32}b_{23} \\
a_{41}b_{11} + a_{42}b_{21} & a_{41}b_{12} + a_{42}b_{22} & a_{41}b_{13} + a_{42}b_{23}
\end{pmatrix}.
\]

Propiedades del producto de matrices

A continuación revisaremos algunas de las propiedades que cumple la multiplicación de matrices. Para demostrar las siguientes propiedades, consideraremos la matriz $A$ de tamaño $3 \times 2$ y las matrices $B$ y $C$ de tamaño $2 \times 2$, aunque se pueden probar para matrices de cualesquier otro tamaño entre las cuales se puedan efectuar las operaciones.

Veamos que si efectuamos la multiplicación de una matriz de tamaño $m \times n$ por una matriz de tamaño $n \times 1$ siguiendo el algoritmo descrito anteriormente, el resultado coincide con el de multiplicar la matriz de tamaño $m \times n$ por un vector de tamaño $n$. Por ejemplo, si multiplicamos $A$ por una matriz $U$ de tamaño $2 \times 1$, obtendremos
\[
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
u_{11} \\
u_{12}
\end{pmatrix}
=
\begin{pmatrix}
a_{11}u_{11} + a_{12}u_{21} \\
a_{21}u_{11} + a_{22}u_{21} \\
a_{31}u_{11} + a_{32}u_{21}
\end{pmatrix}.
\]

Esta es una observación importante pues todo lo que demostremos para el producto de matrices también lo tendremos para el producto de matriz por vector.

Veamos que la multiplicación de matrices es asociativa:

\begin{align*}
(AB)C
&=
\left(
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
\right)
\begin{pmatrix}
c_{11} & c_{12} \\
c_{21} & c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \\
a_{31}b_{11} + a_{32}b_{21} & a_{31}b_{12} + a_{32}b_{22} \\
\end{pmatrix}
\begin{pmatrix}
c_{11} & c_{12} \\
c_{21} & c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
(a_{11}b_{11} + a_{12}b_{21})c_{11} + (a_{11}b_{12} + a_{12}b_{22})c_{21}
& (a_{11}b_{11} + a_{12}b_{21})c_{12} + (a_{11}b_{12} + a_{12}b_{22})c_{22} \\
(a_{21}b_{11} + a_{22}b_{21})c_{11} + (a_{21}b_{12} + a_{22}b_{22})c_{21}
& (a_{21}b_{11} + a_{22}b_{21})c_{12} + (a_{21}b_{12} + a_{22}b_{22})c_{22} \\
(a_{31}b_{11} + a_{32}b_{21})c_{11} + (a_{31}b_{12} + a_{32}b_{22})c_{21}
& (a_{31}b_{11} + a_{32}b_{21})c_{12} + (a_{31}b_{12} + a_{32}b_{22})c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11}(b_{11}c_{11} + b_{12}c_{21}) + a_{12}(b_{21}c_{11} + b_{22}c_{21})
& a_{11}(b_{11}c_{12} + b_{12}c_{22}) + a_{12}(b_{21}c_{12} + b_{22}c_{22}) \\
a_{21}(b_{11}c_{11} + b_{12}c_{21}) + a_{22}(b_{21}c_{11} + b_{22}c_{21})
& a_{21}(b_{11}c_{12} + b_{12}c_{22}) + a_{22}(b_{21}c_{12} + b_{22}c_{22}) \\
a_{31}(b_{11}c_{11} + b_{12}c_{21}) + a_{32}(b_{21}c_{11} + b_{22}c_{21})
& a_{31}(b_{11}c_{12} + b_{12}c_{22}) + a_{32}(b_{21}c_{12} + b_{22}c_{22})
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
b_{11}c_{11} + b_{12}c_{21} & b_{11}c_{12} + b_{12}c_{22} \\
b_{21}c_{11} + b_{22}c_{21} & b_{21}c_{12} + b_{22}c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\left(
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
\begin{pmatrix}
c_{11} & c_{12} \\
c_{21} & c_{22}
\end{pmatrix}
\right)
\\[5pt]
&=
A(BC).
\end{align*}

De manera muy similar, si $u$ es un vector de tamaño 2, podemos ver que se cumple que $A(Bu) = (AB)u$. ¿Puedes demostrarlo? Hazlo por lo menos para matrices $A$ y $B$ ambas de $2\times 2$.

Quizás tengas la impresión de que hay que hacer demasiadas cuentas y que sería sumamente difícil demostrar estas propiedades para matrices más grandes. Sin embargo, en cursos posteriores verás cómo trabajar apropiadamente con la notación para poder hacer estas demostraciones más fácilmente.

El producto de matrices es asociativo. Sin embargo, no es conmutativo. Por ejemplo, consideremos las matrices
\[
E=
\begin{pmatrix}
5 & 7 \\
-3 & 0
\end{pmatrix}
\qquad
\text{y}
\qquad
F=
\begin{pmatrix}
1 & 2 \\
9 & -1
\end{pmatrix}.
\]


Veamos que
\[
EF =
\begin{pmatrix}
68 & 3 \\
-3 & -6
\end{pmatrix}
\ne
\begin{pmatrix}
-1 & 7 \\
48 & 63
\end{pmatrix}
=
FE.
\]

En términos de combinar el producto de matrices con otras operaciones, tenemos que el producto de matrices por la izquierda se distribuye sobre la suma de matrices:
\begin{align*}
A(B+C)
&=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\left(
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
+
\begin{pmatrix}
c_{11} & c_{12} \\
c_{21} & c_{22}
\end{pmatrix}
\right)
\\[5pt]
&=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
b_{11}+c_{11} & b_{12}+c_{12} \\
b_{21}+c_{21} & b_{22}+c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11}(b_{11}+c_{11}) + a_{12}(b_{21}+c_{21})
& a_{11}(b_{12}+c_{21}) + a_{12}(b_{22}+c_{22}) \\
a_{21}(b_{11}+c_{11}) + a_{22}(b_{21}+c_{21})
& a_{21}(b_{12}+c_{21}) + a_{22}(b_{22}+c_{22}) \\
a_{31}(b_{11}+c_{11}) + a_{32}(b_{21}+c_{21})
& a_{31}(b_{12}+c_{21}) + a_{32}(b_{22}+c_{22}) \\
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11}b_{11}+a_{11}c_{11} + a_{12}b_{21}+a_{12}c_{21}
& a_{11}b_{12}+a_{11}c_{11} + a_{12}b_{22}+a_{12}c_{22} \\
a_{21}b_{11}+a_{21}c_{11}+ a_{22}b_{21}+a_{22}c_{21}
& a_{21}b_{12}+a_{21}c_{12}+ a_{22}b_{22}+a_{22}c_{22} \\
a_{31}b_{11}+a_{31}c_{11} + a_{32}b_{21}+a_{32}c_{21}
& a_{31}b_{12}+a_{31}c_{12} + a_{32}b_{22}+a_{32}c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \\
a_{31}b_{11} + a_{32}b_{21} & a_{31}b_{12} + a_{32}b_{22}
\end{pmatrix}
+
\begin{pmatrix}
a_{11}c_{11} + a_{12}c_{21} & a_{11}c_{12} + a_{12}c_{22} \\
a_{21}c_{11} + a_{22}c_{21} & a_{21}c_{12} + a_{22}c_{22} \\
a_{31}c_{11} + a_{32}c_{21} & a_{31}c_{12} + a_{32}c_{22}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
+
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\begin{pmatrix}
c_{11} & c_{12} \\
c_{21} & c_{22}
\end{pmatrix}
\\[5pt]
&=
AB + AC.
\end{align*}

El producto también se distribuye sobre la suma cuando la suma aparece a la izquierda. ¿Podrías probar que si $D$ es una matriz de tamaño $3 \times 2$, entonces se cumple $(A+D)B = AB + DB$?

En entradas anteriores vimos que $\mathcal{I}_n$ tiene la propiedad de ser neutro al multiplicarla por un vector de tamaño $n$. Resulta que $\mathcal{I}_n$ también tiene esta propiedad al multiplicarla por la izquierda por una matriz de tamaño $n\times m$. Por ejemplo, veamos que al multiplicar $\mathcal{I}_3$ por la izquierda por $A$, obtenemos
\begin{align*}
\mathcal{I}_3 A
&=
\begin{pmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix}
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
1a_{11} + 0a_{21} + 0a_{31} & 1a_{12} + 0a_{22} + 0a_{32} \\
0a_{11} + 1a_{21} + 0a_{31} & 0a_{12} + 1a_{22} + 0a_{32} \\
0a_{11} + 0a_{21} + 1a_{31} & 0a_{12} + 0a_{22} + 1a_{32}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\\[5pt]
&=
A.
\end{align*}

¿Podrías probar que $A\mathcal{I}_2 = A$ (es decir, que $\mathcal{I}_2$ es neutro por la derecha para $A$)?

Habiendo visto que el producto de matrices es asociativo, conmutativo y tiene neutros, probablemente te estarás preguntando si existen inversos en la multiplicación de matrices. Este cuestionamiento lo dejaremos para la siguiente entrada.

Relación con la composición de transformaciones

Como vimos en la entrada anterior, una forma de visualzar el producto de una matriz $A$ por un vector $u$ es como una transformación que envía el vector $u$ a un único vector $Au$.

Teniendo en mente esto, veamos que la propiedad de que $A(Bu) = (AB)u$ resulta aún más interesante. Para esto, veamos que el siguiente ejemplo: sean
\[
A
=
\begin{pmatrix}
0 & 2 \\
1 & 1
\end{pmatrix},
\qquad
B
=
\begin{pmatrix}
1 & 2 \\
3 & 0
\end{pmatrix},
\qquad
\text{y}
\qquad
u
=
\begin{pmatrix}
1 \\
2
\end{pmatrix}.
\]

Si multiplicamos $B$ por $u$, vemos que corresponde a la transformación que envía $u = \begin{pmatrix} 1 \\ 2 \end{pmatrix}$ al vector $Bu = \begin{pmatrix} 5 \\ 3 \end{pmatrix}$.

Ahora, si multiplicamos $A$ por el vector $Bu$, vemos que corresponde a la transformación que envía $Bu$ al vector $A(Bu) = \begin{pmatrix} 6 \\ 8 \end{pmatrix}$ (Acabamos de obtener el resultado de aplicar a $u$ la composición de las transformaciones $B$ y $A$).

Por otra parte, si realizamos la multiplicación
\[
AB
=
\begin{pmatrix}
0 & 2 \\
1 & 1
\end{pmatrix}
\begin{pmatrix}
1 & 2 \\
3 & 0
\end{pmatrix}
=
\begin{pmatrix}
6 & 0 \\
4 & 2
\end{pmatrix},
\]
la transformación asociada a $AB$ envía $u$ al vector $(AB)u = \begin{pmatrix} 6 \\ 8 \end{pmatrix}$.

¡La composición de las transformaciones asociadas a $B$ y $A$ aplicada al vector $u$ coincide con la transformación asociada a la matriz $AB$ aplicada al mismo vector!

Si probamos esto para un vector arbitrario, nos daremos cuenta de que en todos los casos se cumple lo mismo. En realidad, esto no es una coincidencia: como aprenderás en tus cursos de álgebra lineal, la composición de transformaciones lineales está directamente asociada al producto de matrices.

Potencias de matrices

Podemos ver que si una matriz $A$ es cuadrada, al tener el mismo número de filas que de columnas, entonces podemos realizar la multiplicaciones $AA$, $AAA$, $AAAA$, etc., que por asociatividad no importa en qué orden multipliquemos. Esto nos sugiere que podemos cacular potencias de matrices.

Para una matriz cuadrada $A$, definiremos de manera recursiva la potencia $A^n$:

  • Definimos $A^0 = \mathcal{I}$.
  • Dada $A^n$, con $n$ un número natural, definimos $A^{n+1} = A^n A$.

Por ejemplo, si
\[
A
=
\begin{pmatrix}
2 & 1 \\
3 & 4
\end{pmatrix},
\]
calculemos $A^3$ empleando la definición recursiva. Para esto, iremos calculando una por una las potencias de $A$, hasta llegar a $A^3$:
\begin{align*}
A^0
&=
\mathcal{I}
=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix},
\\[5pt]
A^1
&=
A^0A
=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
2 & 1 \\
3 & 4
\end{pmatrix}
=
\begin{pmatrix}
2 & 1 \\
3 & 4
\end{pmatrix},
\\[5pt]
A^2
&=
A^1 A
=
\begin{pmatrix}
2 & 1 \\
3 & 4
\end{pmatrix}
\begin{pmatrix}
2 & 1 \\
3 & 4
\end{pmatrix}
=
\begin{pmatrix}
(2)(2) + (1)(3) & (2)(1) + (1)(4) \\
(3)(2) + (4)(3) & (3)(1) + (4)(4)
\end{pmatrix}
=
\begin{pmatrix}
7 & 6 \\
18 & 19
\end{pmatrix},
\\[5pt]
A^3
&=
A^2A
=
\begin{pmatrix}
7 & 6 \\
18 & 19
\end{pmatrix}
\begin{pmatrix}
2 & 1 \\
3 & 4
\end{pmatrix}
=
\begin{pmatrix}
(7)(2) + (6)(3) & (7)(1) + (6)(4) \\
(18)(2) + (19)(3) & (18)(1) + (19)(4)
\end{pmatrix}
=
\begin{pmatrix}
32 & 31 \\
93 & 94
\end{pmatrix}.
\end{align*}

Prueba calcular algunas potencias de la matriz \(
\begin{pmatrix}
2 & 0 \\
0 & 3
\end{pmatrix}.
\) ¿Notas algún patrón especial?

Más adelante…

En esta entrada aprendimos sobre el producto de matrices con matrices y conocimos algunas de sus propiedades. En la siguiente entrada abordaremos la pregunta sobre si existen los inversos en la multiplicación de matrices.

Tarea moral

  1. Realiza el producto de matrices $$\begin{pmatrix} -1 & -2 & -3 \\ 0 & 1 & 2 \\ 1 & -1 & 3 \end{pmatrix}\begin{pmatrix} 1 & -1 & 1 \\ -1 & 1 & -1 \\ 1 & -1 & 1 \end{pmatrix}.$$
  2. Considera la matriz $A=\begin{pmatrix} 3 & -4 \\ 4 & -5 \end{pmatrix}$. Realiza las siguientes operaciones por separado, sin usar la asociatividad del producto de matrices. ¿Cuál de las dos operaciones te resultó más fácil de hacer?
    • $$A\left(A\left(A\left(A\begin{pmatrix} 2 \\ 3 \end{pmatrix}\right)\right)\right).$$
    • $$(((AA)A)A)\begin{pmatrix} 2 \\ 3 \end{pmatrix}.$$
  3. Completa las pruebas faltantes de las propiedades de la multiplicación de matrices.
  4. Demuestra la siguiente ley de exponentes para matrices: $A^mA^n=A^{m+n}$.
  5. Prueba que si
    \[
    A =
    \begin{pmatrix}
    a_{11} & 0 \\
    0 & a_{22}
    \end{pmatrix},
    \]
    y $k$ es un entero mayor o igual que $0$, entonces
    \[
    A^k
    =
    \begin{pmatrix}
    {a_{11}}^k & 0 \\
    0 & {a_{22}}^k
    \end{pmatrix}
    \]
    (Sugerencia: realizarlo por inducción sobre $k$, utilizando la definición recursiva).
  6. Encuentra matrices $A$ y $B$ de $2\times 2$ para las cuales $A^2-B^2\neq (A+B)(A-B)$.

Entradas relacionadas

Álgebra Superior I: Matrices invertibles

Por Eduardo García Caballero

Introducción

En la entrada anterior definimos el producto de matrices con matrices y exploramos algunas de sus propiedades, siendo varias de estas familiares: el producto de matrices es asociativo, conmutativo y tiene elemento neutro. En esta entrada exploraremos una pregunta que quedó abierta: ¿el producto de matrices cumple con tener inversos?

Definición de matrices invertibles

Diremos que una matriz cuadrada $A$ es invertible si y sólo si tiene inverso multiplicativo; es decir, si existe una matriz $B$ tal que $AB = BA = \mathcal{I}$.

Observemos para que la definción anterior tenga sentido, es indispensable que $A$ sea cuadrada, pues veamos que si $A$ es de tamaño $m \times n$, entonces para que los productos $AB$ y $BA$ estén definidos, $B$ tendrá que ser de tamaño $n \times m$. Así, $AB$ será de tamaño $m\times n$ y $BA$ de tamaño $n\times n$, y como $AB = BA$, entonces $m = n$, y, por tanto, $AB = BA = \mathcal{I}_n$ (y con ello también observamos que $B$ tiene que ser cuadrada de tamaño $n \times n$).

Un ejemplo de una matriz de $2 \times 2$ que es invertible es
\[
A
=
\begin{pmatrix}
1 & -2 \\
-3 & 5
\end{pmatrix}
\]
que tiene como inversa a la matriz
\[
B
=
\begin{pmatrix}
-5 & -2 \\
-3 & -1
\end{pmatrix},
\]
pues
\begin{align*}
AB
&=
\begin{pmatrix}
1 & -2 \\
-3 & 5
\end{pmatrix}
\begin{pmatrix}
-5 & -2 \\
-3 & -1
\end{pmatrix}\\
&=
\begin{pmatrix}
(1)(-5) + (-2)(-3) & (1)(-2) + (-2)(-1) \\
(-3)(-5) + (5)(-3) & (-3)(-2) + (5)(-1)
\end{pmatrix}\\
&=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}\\
&=
\mathcal{I}_2
\end{align*}
y
\begin{align*}
BA
&=
\begin{pmatrix}
-5 & -2 \\
-3 & -1
\end{pmatrix}
\begin{pmatrix}
1 & -2 \\
-3 & 5
\end{pmatrix}\\
&=
\begin{pmatrix}
(-5)(1) + (-2)(-3) & (-5)(-2) + (-2)(5) \\
(-3)(1) + (-1)(-3) & (-3)(-2) + (-1)(5)
\end{pmatrix}\\
&=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}\\
&=
\mathcal{I}_2.
\end{align*}
Por lo tanto,
\[
AB = BA = \mathcal{I}_2.
\]

Algo que seguramente te preguntarás es si cualquier matriz cuadrada tiene un inverso multiplicativo. A diferencia de otros tipos de operaciones con inversos, el producto de matrices no siempre cumple con tenerlos: un ejemplo de esto es la matriz
\[
A=
\begin{pmatrix}
2 & 1 \\
0 & 0
\end{pmatrix}
\]
la cual, al multiplicarla por cualquier matriz
\[
B
=
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\]
por la derecha, nos da como resultado
\[
AB
=
\begin{pmatrix}
2 & 1 \\
0 & 0
\end{pmatrix}
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
=
\begin{pmatrix}
2a + c & 2b + ,d \\
0 & 0
\end{pmatrix},
\]
y como en cualquier caso obtenemos que su entrada en la posición $(2,2)$ es $0$, tenemos que $AB$ es distinta a $\mathcal{I}_2$, pues la entrada en la posición $(2,2)$ de esta última es $1$.

Propiedades de matrices invertibles

A continuación exploraremos algunas de las propiedades que cumplen las matrices invertibles.

Primeramente, veamos que si una matriz $A$ de $n \times n$ es invertible, entonces su inversa será única. Para demostrar esto, supongamos que $B$ y $C$ son ambas inversas multiplicativas de $A$; es decir, $AB = BA = \mathcal{I}_n$ y $AC = CA = \mathcal{I}_n$. Entonces,
\begin{align*}
AB &= AC \\[5pt]
B(AB) &= B(AC) \\[5pt]
(BA)B &= (BA)C \\[5pt]
\mathcal{I}_n B &= \mathcal{I}_n C \\[5pt]
B &= C.
\end{align*}

Como la matriz inversa de $A$ es única, usualmente la denotamos como $A^{-1}$.

Por otra parte, veamos que si $A$ y $B$ son matrices invertibles, con inversas $A^{-1}$ y $B^{-1}$, respectivamente, entonces, si podemos multiplicar $A$ y $B$ (es decir, si $A$ y $B$ son del mismo tamaño), entonces $AB$ es invertible, pues se cumple que
\[
(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\mathcal{I}_nA^{-1} = AA^{-1} = \mathcal{I}_n,
\]
y también que
\[
(B^{-1}A^{-1})(AB) = B^{-1}(A^{-1}A)B = B^{-1}\mathcal{I}_nB = B^{-1}B = \mathcal{I}_n,
\]
es decir, $B^{-1}A^{-1}$ es la matriz inversa de $AB$, lo cual denotamos como $(AB)^{-1} = B^{-1}A^{-1}$.

Finalmente, recordando la interpretación geométrica que dimos a la multiplicación de matrices por vectores, y la propiedad de que $A(Bu) = (AB)u$, entonces notamos que
\[
A^{-1}(Au) = (A^{-1}A)u = \mathcal{I}u = u.
\]

Como la transformación correspondiente a $A$ envía el vector $u$ al vector $Au$, y como el resultado de aplicar $(A^{-1}A)u$ deja al vector $u$ en su lugar, esto nos dice que la transformación correspondiente a $A^{-1}$ es aquella que regresa el vector $Au$ a su posición original.

En la siguiente imagen se visualiza esta propiedad para el caso en el que
\[
A
=
\begin{pmatrix}
3 & 1 \\
4 & 2
\end{pmatrix}
\qquad
\text{y}
\qquad
u
=
\begin{pmatrix}
1 \\
2
\end{pmatrix}.
\]

Formula para inversa de matrices de $2 \times 2$

Más arriba vimos que hay matrices que sí tienen inversa, mientras que otras no tienen. Para el caso de matrices de $2 \times 2$, tendremos que
\[
A
=
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\]
es invertible si y sólo si se cumple que $ad-bc \ne 0$.

En dado caso, la inversa de $A$ será la matriz
\[
A^{-1}
=
\frac{1}{ad-bc}
\begin{pmatrix}
d & -b \\
-c & a
\end{pmatrix}
=
\begin{pmatrix}
\frac{d}{ad-bc} & \frac{-b}{ad-bc} \\
\frac{-c}{ad-bc} & \frac{a}{ad-bc}
\end{pmatrix}.
\]

Por ejemplo, veamos que si
\[
A =
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
=
\begin{pmatrix}
1 & 2 \\
-2 & 3
\end{pmatrix},
\]
entonces $ad – bc = (1)(3) – (2)(-2) = 3 – (-4) = 7 \ne 0$, por lo que podemos garantizar que $A$ tiene matriz inversa, la cual es
\[
A^{-1}
=
\frac{1}{ad-bc}
\begin{pmatrix}
d & -b \\
-c & a
\end{pmatrix}
=
\frac{1}{7}
\begin{pmatrix}
3 & -2 \\
2 & 1
\end{pmatrix}
=
\begin{pmatrix}
3/7 & -2/7 \\
2/7 & 1/7
\end{pmatrix}.
\]

Verificamos que
\begin{align*}
AA^{-1}
&=
\begin{pmatrix}
1 & 2 \\
-2 & 3
\end{pmatrix}
\begin{pmatrix}
3/7 & -2/7 \\
2/7 & 1/7
\end{pmatrix}\\
&=
\begin{pmatrix}
(1)(3/7) + (2)(2/7) & (1)(-2/7) + (2)(1/7) \\
(-2)(3/7) + (3)(2/7) & (-2)(-2/7) + (3)(1/7)
\end{pmatrix}\\
&=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}\\
&=
\mathcal{I}_2
\end{align*}
y
\begin{align*}
A^{-1}A
&=
\begin{pmatrix}
3/7 & -2/7 \\
2/7 & 1/7
\end{pmatrix}
\begin{pmatrix}
1 & 2 \\
-2 & 3
\end{pmatrix}\\
&=
\begin{pmatrix}
(3/7)(1) + (-2/7)(-2) & (3/7)(2) + (-2/7)(3) \\
(2/7)(1) + (1/7)(-2) & (2/7)(2) + (1/7)(3)
\end{pmatrix}\\
&=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}\\
&=
\mathcal{I}_2.
\end{align*}

De manera similar, veamos que la matriz
\[
\begin{pmatrix}
3 & 4 \\
1 & 2
\end{pmatrix}
\]
es invertible pues $(3)(2) – (4)(1) = 2 \ne 0$. ¿Puedes calcular su inversa?

Por el contrario, veamos que en la matriz
\[
\begin{pmatrix}
6 & 4 \\
3 & 2
\end{pmatrix}
\]
tenemos que $(6)(2) – (4)(3) = 12 -12 = 0$, y, por tanto, no es invertible.

Para el caso de matrices de mayor tamaño, también existen condiciones y fórmulas para calcular sus inversas, sin embargo, estas no resultan tan sencillas. Será necesario que comprendamos más propiedades de las matrices para poder obtenerlas.

Más adelante…

En esta entrada conocimos una propiedad más que cumplen las matrices respecto a su producto, que es la de tener inverso multiplicativas; también vimos las condiciones bajo las cuales una matriz de $2 \times 2$ puede tener inverso, y revisamos su fórmula.

En la siguiente entrada, conoceremos una nueva operación, la cual se distinguirá de todas las que hemos visto hasta ahora, pues esta operación involucra a una única matriz a la vez.

Tarea moral

  1. ¿Para qué valores de $a$ se cumple que
    \[
    \begin{pmatrix}
    5 & a \\
    2 & 2-a
    \end{pmatrix}
    \]
    es invertible?
  2. Muestra que si $A$, $B$ y $C$ son matrices invertibles del mismo tamaño, entonces
    \[
    (ABC)^{-1} = C^{-1}B^{-1}A^{-1}.
    \]
  3. Muestra que si $A$ es una matriz invertible y $k$ es un entero positivo, entonces $A^k$ también es invertible y $(A^k)^{-1}=(A^{-1})^k$.
  4. ¿Por qué la matriz
    \[
    \begin{pmatrix}
    3 & 4 & 0 \\
    7 & 2 & 0 \\
    0 & 0 & 0
    \end{pmatrix}
    \]
    no es invertible?
  5. Muestra que en efecto el criterio que dimos para que una matriz $A=\begin{pmatrix} a & b \\ c & d \end{pmatrix}$ tenga inversa es suficiente y necesario. Para la parte de que es suficiente, tendrás que ver que si $ad-bc\neq 0$, la matriz propuesta en la entrada siempre funciona como inversa. Para ver que es necesario, supón que $ad-bc=0$. En este caso, $ad=bc$ y podrás encontrar a partir de $a,b,c,d$ a dos vectores distintos $u$ y $v$ tales que $Au=Av$. Esto mostrará que la transformación asociada a $A$ no es inyectiva y por tanto no podrá tener inversa, así que $A$ tampoco tendrá inversa.

Entradas relacionadas

Álgebra Superior I: Transposición de matrices, matrices simétricas y antisimétricas

Por Eduardo García Caballero

Introducción

Hasta ahora hemos conocido operaciones involucran a dos objetos a la vez, entre los que pueden estar escalares, vectores, o matrices. En esta entrada, exploraremos una operación que se aplica a una matriz a la vez: la transposición de matrices. Esta operación preserva el contenido de la matriz, pero modifica sus dimensiones y el orden de sus entradas de una manera particular. Además, exploraremos algunas matrices que cumplen propiedades especiales bajo esta operación.

Definición de transposición de matrices

Una forma intuitiva de comprender en concepto de transposición de una matriz es como aquella operación que refleja a una matriz por su diagonal. Por ejemplo, consideremos la matriz
\[
A=
\begin{pmatrix}
\fbox{7} & \sqrt{2} \\
-\tfrac{1}{2} & \fbox{3}
\end{pmatrix}
\]
en la cual hemos destacado los elementos de su diagonal. Su matriz transpuesta, la cual denotaremos como $A^T$, será
\[
A^T =
\begin{pmatrix}
\fbox{7} & -\tfrac{1}{2} \\
\sqrt{2} & \fbox{3}
\end{pmatrix}.
\]

En el caso de una matriz que no sea cuadrada, la transposición también intercambia el número de filas y el de columnas. Por ejemplo,
\[
B=
\begin{pmatrix}
\fbox{3} & 4 & \pi \\
0 & \fbox{-1} & 6
\end{pmatrix}
\]
es una matriz de $2 \times 3$, mientras que su matriz transpuesta
\[
B^T=
\begin{pmatrix}
\fbox{3} & 0 \\
4 & \fbox{-1} \\
\pi & 6
\end{pmatrix}
\]
es de tamaño $3 \times 2$.

Para dar una definición formal de la propiedad de transposición, consideremos a la matriz $A$ de tamaño $m \times n$. Diremos que la matriz traspuesta de $A$ es la matriz $A^T$ de tamaño $n \times m$, donde la entrada de $A^T$ en la posición $(i,j)$ es
\[
(A^T)_{ij} = a_{ji},
\]
para todo $1 \le i \le n$ y $1 \le j \le m$.

Por ejemplo, para el caso de
\[
C =
\begin{pmatrix}
\fbox{$c_{11}$} & c_{12} \\
c_{21} & \fbox{$c_{22}$} \\
c_{31} & c_{32}
\end{pmatrix},
\]
su matriz traspuesta es
\[
C^T =
\begin{pmatrix}
(C^T)_{11} & (C^T)_{12} & (C^T)_{13} \\
(C^T)_{21} & (C^T)_{22} & (C^T)_{23} \\
\end{pmatrix}
=
\begin{pmatrix}
\fbox{$c_{11}$} & c_{21} & c_{31} \\
c_{12} & \fbox{$c_{22}$} & c_{32}
\end{pmatrix},
\]
mientras que la matriz transpuesta de
\[
D =
\begin{pmatrix}
\fbox{$d_{11}$} & d_{12} & d_{13} \\
d_{21} & \fbox{$d_{22}$} & d_{23} \\
d_{31} & d_{32} & \fbox{$d_{33}$}
\end{pmatrix}
\]
es
\[
D^T =
\begin{pmatrix}
(D^T)_{11} & (D^T)_{12} & (D^T)_{13} \\
(D^T)_{21} & (D^T)_{22} & (D^T)_{23} \\
(D^T)_{31} & (D^T)_{32} & (D^T)_{33}
\end{pmatrix}
=
\begin{pmatrix}
\fbox{$d_{11}$} & d_{21} & d_{31} \\
d_{12} & \fbox{$d_{22}$} & d_{32} \\
d_{13} & d_{23} & \fbox{$d_{33}$}
\end{pmatrix}.
\]

Como puedes observar, empleando la definición de matriz traspuesta, se sigue cumpliendo que la transposición se puede ver como la operación de reflejar una matriz con respecto a su diagonal.

Propiedades de transposición de matrices

A continuación, demostraremos algunas propiedades que cumplen las matrices
\[
A=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\qquad
\text{y}
\qquad
B=
\begin{pmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{pmatrix}
\]
(Las demostraciones para cualesquiera otros tamaños de matrices se desarrollan de manera análoga).

Veamos qué sucede al realizar dos veces seguidas la trasposición de $A$. Observamos que
\[
A^T =
\begin{pmatrix}
(A^T)_{11} & (A^T)_{12} & (A^T)_{13} \\
(A^T)_{11} & (A^T)_{22} & (A^T)_{23}
\end{pmatrix}
=
\begin{pmatrix}
a_{11} & a_{21} & a_{31} \\
a_{12} & a_{22} & a_{32}
\end{pmatrix},
\]
y, entonces,
\[
(A^T)^T
=
\begin{pmatrix}
((A^T)^T)_{11} & ((A^T)^T)_{12} \\
((A^T)^T)_{21} & ((A^T)^T)_{22} \\
((A^T)^T)_{31} & ((A^T)^T)_{32}
\end{pmatrix}
=
\begin{pmatrix}
(A^T)_{11} & (A^T)_{21} \\
(A^T)_{12} & (A^T)_{22} \\
(A^T)_{13} & (A^T)_{23}
\end{pmatrix}
=
\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
=
A.
\]

En general, al transponer dos veces seguidas una matriz obtendremos como resultado la matriz original: $(A^T)^T = A$.

Por otra parte, observemos que
\[
AB
=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \\
a_{31}b_{11} + a_{32}b_{21} & a_{31}b_{12} + a_{32}b_{22}
\end{pmatrix},
\]
de modo que
\[
(AB)^T =
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{21}b_{11} + a_{22}b_{21} & a_{31}b_{11} + a_{32}b_{21} \\
a_{11}b_{12} + a_{12}b_{22} & a_{21}b_{12} + a_{22}b_{22} & a_{31}b_{12} + a_{32}b_{22}
\end{pmatrix}.
\]
Por su parte, veamos que
\begin{align*}
B^T A^T
&=
\begin{pmatrix}
b_{11} & b_{21} \\
b_{12} & b_{22}
\end{pmatrix}
\begin{pmatrix}
a_{11} & a_{21} & a_{31} \\
a_{12} & a_{22} & a_{32}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
b_{11}a_{11} + b_{21}a_{12} & b_{11}a_{21} + b_{21}a_{22} & b_{11}a_{31} + b_{21}a_{32} \\
b_{12}a_{11} + b_{22}a_{12} & b_{12}a_{21} + b_{22}a_{22} & b_{12}a_{31} + b_{22}a_{32}
\end{pmatrix}
\\[5pt]
&=
\begin{pmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{21}b_{11} + a_{22}b_{21} & a_{31}b_{11} + a_{32}b_{21} \\
a_{11}b_{12} + a_{12}b_{22} & a_{21}b_{12} + a_{22}b_{22} & a_{31}b_{12} + a_{32}b_{22}
\end{pmatrix}.
\end{align*}
Por lo tanto,
\[
(AB)^T = B^T A^T.
\]

Finalmente, supongamos que $C = \begin{pmatrix} a & b \\ c & d \end{pmatrix}$ es invertible. Entonces se cumple que $ad – bc \ne 0$, y $C$ tiene como inversa a
\[
C^{-1} =
\begin{pmatrix}
\tfrac{d}{ad – bc} & \tfrac{-b}{ad – bc} \\
\tfrac{-c}{ad – bc} & \tfrac{a}{ad – bc}
\end{pmatrix},
\]
Por lo tanto,
\[
(C^{-1})^T =
\begin{pmatrix}
\tfrac{d}{ad – bc} & \tfrac{-c}{ad – bc} \\
\tfrac{-b}{ad – bc} & \tfrac{a}{ad – bc}
\end{pmatrix}.
\]

Por su parte, observemos que $C^T = \begin{pmatrix} a & c \\ b & d \end{pmatrix}$ cumple que $ad – cb = ad – bc \ne 0$, con lo cual garantizamos que es también invertible —la transpuesta de una matriz invertible es también invertible—. Más aún, veamos que
\begin{align*}
(C^T)^{-1}&= \frac{1}{ad-bc} \begin{pmatrix} d & -c \\ -b & a \end{pmatrix} \\[5pt]
&= \begin{pmatrix}
\tfrac{d}{ad – bc} & \tfrac{-c}{ad – bc} \\
\tfrac{-b}{ad – bc} & \tfrac{a}{ad – bc}
\end{pmatrix}.
\end{align*}
Por lo tanto, $(C^{-1})^T = (C^T)^{-1}$ —la inversa de una matriz traspuesta corresponde a la traspuesta de la inversa de la orginal—.

Matrices simétricas y antisimétricas

Ahora que conocemos la definición de matriz transpuesta y algunas de sus propiedades, observemos que existen matrices que se comportan de manera especial bajo esta operación.

Por ejemplo, veamos que si
\[
A =
\begin{pmatrix}
4 & 9 & 0 \\
9 & \frac{1}{2} & -1 \\
0 & -1 & \sqrt{2}
\end{pmatrix},
\]
entonces,
\[
A^T=
\begin{pmatrix}
4 & 9 & 0 \\
9 & \frac{1}{2} & -1 \\
0 & -1 & \sqrt{2}
\end{pmatrix}
= A.
\]

A una matriz $A$ que cumple que $A^T = A$ se le denomina matriz simétrica. Otros ejemplos de matrices simétricas son
\[
\begin{pmatrix}
4 & 0 \\
0 & -5
\end{pmatrix}
\qquad
\text{y}
\qquad
\begin{pmatrix}
-8 & 1 & 2 \\
1 & 0 & 3 \\
2 & 3 & -\pi
\end{pmatrix}.
\]
Una observación importante es que las matrices simétricas únicamente pueden ser cuadradas.

Por otra parte, veamos que la matriz
\[
B=
\begin{pmatrix}
0 & 5 & 5 \\
-5 & 0 & 5 \\
-5 & -5 & 0
\end{pmatrix}
\]
tiene como transpuesta a
\[
B^T =
\begin{pmatrix}
0 & -5 & -5 \\
5 & 0 & -5 \\
5 & 5 & 0
\end{pmatrix}
=
-B.
\]

A una matriz $A$ que cumple que $A^T = -A$ se le denomina matriz antisimétrica. Otros ejemplos de matrices antisimétricas son
\[
\begin{pmatrix}
0 & -2 \\
2 & 0
\end{pmatrix}
\qquad
\text{y}
\qquad
\begin{pmatrix}
0 & 1 & -2 \\
-1 & 0 & 3 \\
2 & -3 & 0
\end{pmatrix}.
\]
Al igual que sucede con las matrices simétricas, las matrices antisimétricas sólo pueden ser cuadradas.

Otra propiedad importante de las matrices antisimétricas es que todos los elementos de su diagonal tienen valor 0. ¿Puedes probar por qué sucede esto?

Más adelante…

Con las operaciones entre vectores y matrices que hemos visto hasta ahora podemos obtener varios resultados aplicables a distintas áreas de las matemáticas. En la siguiente entrada abordaremos un tema que, a primera vista, parece no relacionarse mucho con los conceptos que hemos aprendido hasta ahora, pero que, en realidad, resulta ser uno de los temas con mayor aplicación de los conceptos de vectores y matrices: los sistemas de ecuaciones lineales.

Tarea moral

  1. Sea $A$ una matriz de $2\times 2$ con entradas reales. Muestra $AA^T$ siempre es una matriz simétrica y que las entradas en la diagonal de $AA^T$ siempre son números mayores o iguales a cero.
  2. Prueba que los elementos de la diagonal de una matriz antisimétrica tienen valor 0.
  3. Muestra que si una matriz es simétrica e invertible, entonces su inversa también es simétrica. ¿Es cierto lo mismo para las antisimétricas?
  4. ¿Existe alguna matriz que sea al mismo tiempo simétrica y antisimétrica?
  5. Prueba que cualquier matriz $A$ se puede escribir como $A = B+C$, con $B$ simétrica y $C$ antisimétrica.

Entradas relacionadas

Álgebra Superior I: Sistemas de ecuaciones lineales

Por Eduardo García Caballero

Introducción

Una de las aplicaciones más importantes de los vectores y matrices tiene que ver con un tema que conociste desde la secundaria y preparatoria: los sistemas de ecuaciones.

Más específicamente, los vectores y matrices nos serán de gran utilidad para resolver sistemas de ecuaciones lineales, determinar cuándo un sistema sí tiene soluciones, y cuáles son todas sus soluciones.

Pero antes, repasemos un poco los conceptos de sistemas de ecuaciones lineales.

Sistemas de ecuaciones lineales

Recordemos que una ecuación es una expresión en la que hay variables o valores que no conocemos. En el caso de una ecuación lineal, se trata de ecuaciones en las que todas sus variables se encuentran elevadas a la primera potencia y acompañadas únicamente por coeficientes constantes. Por ejemplo, podemos ver que las expresiones
\[
2x + 9y – z = 3,
\qquad
4w + 3000a = y + \tfrac{1}{2}x
\]
son ecuaciones lineales, mientras que las expresiones
\[
ax^2 + bx + c = 0,
\qquad
2xz = 9y
\]
no lo son, pues contienen al menos una variable elevada a exponentes distintos de $1$, o bien hay variables multiplicándose entre sí.

De manera más formal, una ecuación de lineal es una ecuación que se puede escribir de la forma
\[
a_1x_2 + a_2x_2 + \cdots + a_nx_n = b,
\]
donde $x_1, \ldots, x_n$ son variables y $a_1, \ldots, a_n, b$ son coeficientes, todos del mismo tipo (en este curso trabajaremos con coeficientes reales, pero en otros cursos podrás encontrar coeficientes de otros tipos, como son números enteros, racionales, y complejos, entre otros).

Por su parte, un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales. Por ejemplo, los siguientes son sistemas de ecuaciones lineales:
\[
\begin{cases}
2x -\tfrac{3}{2}y + 8z = 1 \\
9z + 2w + 5y = 3,
\end{cases}
\qquad
\begin{cases}
2 + 9a = 46b -5c \\
2d + 8x = \sqrt{3} \\
x + y + z = a + b + c \\
x = -y
\end{cases}
\]
Bajo esta definición, una única ecuación se puede considerar un sistema de ecuaciones lineales (con una ecuación).

Notemos que no es necesario que todas las ecuaciones compartan variables, sin embargo, generalmente esto sí sucederá. De hecho, podemos pensar que todas las variables aparecen en todas las ecuaciones. En caso de que esto no suceda, podemos considerar que las variables que no aparecen en una ecuación tienen coeficiente cero. Además, siempre podemos reordenar las variables en las ecuaciones para que en todas ellas aparezcan en el mimo orden. Por ejemplo, a continuación el sistema de ecuaciones a la izquierda lo podemos escribir como el de la derecha, sin alterarlo.

\[
\begin{cases}
2x -\tfrac{3}{2}z + 8y = 11 \\
9z + 2w + 5k = -3,
\end{cases}
\qquad
\begin{cases}
0k+0w+2x + 8y – \tfrac{3}{2}z = 11 \\
5k+2w+0x+0y+9z = -3.
\end{cases}
\]

¿Qué quiere decir resolver un sistema de ecuaciones lineales?

Como recordarás, encontrar una solución de una ecuación corresponde a encontrar valores que, al sustituirlos en las variables, hagan que la expresión sea verdadera. Por ejemplo, si tenemos la ecuación $2x-3y=0$, una solución está dada por $x=3$ y $y=2$, ya que al sustituir en efecto tenemos $(2)(3)-(3)(2)=0$. En ocasiones, una ecuación puede tener más de una solución. Por ejemplo, en este caso otra posible solución es $x=6$ y $y=4$, ya que al sustituir en efecto tenemos $(2)(6)-(3)(4)=0$. Para esta ecuación hemos encontrado entonces dos posibles soluciones. Pero aún no la hemos resuelto. Como veremos un poco más abajo, para resolverla tenemos que alcanzar una meta más grande.

Para el caso de sistemas de ecuaciones lineales, encontrar una solución consiste en dar una asignación de valores a las variables que hagan que todas las ecuaciones sean ciertas simultáneamente. Por ejemplo, podemos verificar que los valores
\[
x = 3 \quad y =5 \quad z = -2
\]
hacen que cada una de las ecuaciones en el sistema
\[
\begin{cases}
x + 2y – z = 15 \\
4x – y + z = 5
\end{cases}
\]
se cumplan simultáneamente. Otra posible solución está dada por la asignación
\[
x = 1 \quad y =15 \quad z = 16.
\]

Cuando hablamos de resolver una ecuación o un sistema de ecuaciones no nos bastará encontrar unas cuantas soluciones que funcionen. Queremos encontrar todas las posibles soluciones.

Como ejemplo más sencillo, tratemos de encontrar todas las soluciones del sigueinte sistema con una única ecuación
\[
\begin{cases}
2x + 3y – z = 5.
\end{cases}
\]

Si despejamos $x$ en la ecuación, obtenemos
\[
x = \frac{-3y+z+5}{2}.
\]
Esto nos indica que podemos escoger valores arbitrarios de $y$ y $z$, y el valor de $x$ quedará determinado por estos valores.

Entonces, la solución de la ecuación son todas las $(x,y,z)$ tales que $x = \frac{-3y+z+5}{2}$; es decir, todas las soluciones del sistema de ecuaciones son de la forma
\[
\left( \frac{-3y+z+5}{2}, y, z \right).
\]

Otra manera de decir esto es que el conjunto de soluciones para el sistema de ecuaciones es el siguiente:

$$S:=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}.$$

Esto ahora sí resuelve el sistema, pues hemos encontrado una descripción para todas las posibles soluciones del sistema. Si tomas los valores que quieras para $y$ y $z$, podrás dar una solución. Por ejemplo, al tomar $y=1,z=2$ obtenemos la solución $(2,1,2)$, la cual puedes verificar que es una solución al sistema de ecuaciones de una ecuación con el que comenzamos. Toda posible solución está en $S$. Como $y$ y $z$ pueden valer lo que sea, las llamamos variables libres. A $x$, que queda totalmente determinada una vez fijas las variables libres, la llamamos variable pivote.

¿Qué sucede si tenemos más ecuaciones? Tratemos de encontrar todas las soluciones para el sistema de ecuaciones siguiente
\[
\begin{cases}
y+z =1 \\
3x+2y+5z&=1.
\end{cases}
\]

Podemos intentar lo mismo que arriba y fijar algún valor e intentar poner al resto en términos de ese. Pero hay que ser cuidadosos. Por ejemplo, al fijar el valor de $x$, no podremos despejar a $y$ (ni a $z$) en términos únicamente de $x$. Sin embargo, fijamos el valor de $z$, sí podemos determinar todo completamente.

Al fijar $z$, entonces $y$ queda determinado como $y = -z + 1$. Sustituyendo este valor de $y$ en la segunda ecuación, obtendremos $3x + 2(-z+1) + 5z = 1$, que equivale a $3x +3z = -1$, de donde tenemos que $x = -z -1/3 $. Entonces, podemos pensar a $z$ como la variable libre y como $y$ y $x$ dependen completamente de $z$, las pensamos como variables pivote. La descripción de las soluciones quedaría entonces como

$$R=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}.$$

Aunque ahora hemos tenido éxito con describir totalmente las soluciones de dos sistemas de ecuaciones y en ambos casos hemos tenido una infinidad de soluciones, lo cierto es que existen sistemas de ecuaciones sin solución. Por ejemplo, consideremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
4x + 3y = 8.
\end{cases}
\]
Podemos ver que cada una de las ecuaciones, de manera individual, tienen soluciones, y hasta podríamos encontrar todas las posibles soluciones (¿puedes dar un par de ejemplos de cada una?). Sin embargo, no existen valores de $x$ y $y$ que resuelvan ambas ecuaciones al mismo tiempo. Esto lo podemos observar porque, si multiplicamos la segunda ecuación por $3$, obtendremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
12x + 9y = 24.
\end{cases}
\]
Si hubiera alguna solución, podríamos igualar ambas ecuaciones y llegar a que $7=24$, una contradicción.

Interpretación geométrica

El primer conjunto solución que encontramos arriba se puede reescribir en términos de cada variable $y$ y $z$ usando la suma y producto escalar que estudiamos en entradas anteriores de la siguiente manera:

\begin{align*}
S&=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}\\
&=\left\{y(-3/2,1,0) + z(1/2,0,1) + (5/2,0,0):y,z\in \mathbb{R}\right\}.
\end{align*}

Posiblemente hayas visto expresiones en algún curso de geometría analítica. Lo anterior es un plano en $\mathbb{R}^3$ que pasa por el punto $(5/2,0,0)$ y generado a partir de ese punto por los vectores $(-3/2,1,0)$ y $(1/2,0,1)$.

Del mismo modo, en el segundo ejemplo que vimos arriba el sistema de ecuaciones puede reescribirse como:

\begin{align*}
R&=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}\\
&=\{(-1/3,1,0)+z(-1,-1,1):z\in \mathbb{R}\},
\end{align*}

que posiblemente identifiques como la recta en $\mathbb{R}^3$ que parte del punto $(-1/3,1,0)$ y tiene dirección $(-1,-1,1)$.

Forma matricial de un sistema de ecuaciones

Como vimos en una entrada previa, dos vectores del mismo tamaño son iguales si y sólo si sus respectivas entradas son iguales. Una consecuencia de esta definición es que el sistema de ecuaciones
\[
\begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n & = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n & = b_2 \\
& \vdotswithin{\mspace{15mu}} \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m
\end{cases}
\]
se cumple si y sólo si
\[
\begin{pmatrix}
a_{11}x_1 + a_{12}x_2 + \cdots a_{1n}x_n \\
a_{21}x_1 + a_{22}x_2 + \cdots a_{2n}x_n \\
\vdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots a_{mn}x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

Más aún, observemos que el lado izquierdo de esta igualdad lo podemos reescribir como un producto de matriz con vector de la siguiente manera
\[
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\begin{pmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix},
\]
lo cual podemos denotar como
\[
Ax = b.
\]

Entonces, podemos decir que nuestro sistema tiene solución si existe un vector $x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}$ tal que $Ax = b$, donde
\[
A
=
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\quad
\text{y}
\quad
b
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

A la expresión $Ax=b$ le llamamos la forma matricial del sistema de ecuaciones.

Ejemplo de la utilidad de la forma matricial

La forma matricial de un sistema de ecuaciones es sumamente útil, como veremos en las siguientes entradas. Pero veamos un pequeño ejemplo de una de sus aplicaciones. Supongamos que sabemos que la matriz $A$ es invertible con inversa $A^{-1}$. Recordemos que entonces se cumple que$A^{-1}A = \mathcal{I}$. Gracias a esto, podemos comenzar con la forma matricial del sistema de ecuaciones y deducir lo siguiente:
\begin{align*}
&Ax = b \\
\Rightarrow & A^{-1}Ax = A^{-1}b \\
\Rightarrow &x = A^{-1}b.
\end{align*}

Es decir, si conocemos la matriz inversa de $A$, ¡podemos obtener de manera única el vector que resuelve el sistema de ecuaciones mediante una multiplicación de matriz por vector!

Aún cuando no hemos visto el método general para saber si una matriz tiene inversa, ya vimos previamente qué sucede con una matriz de $2\times 2$
\[
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\]

Así, verifiquemos mediante un ejemplo que el método que mostramos sirve para encontrar soluciones de sistemas de ecuaciones. Consideremos el sistema de ecuaciones
\[
\begin{cases}
2x + 8y &= 9 \\
-3x + 4y &= 2.
\end{cases}
\]

Este sistema puede ser representado en forma matricial como
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix}.
\]

Como recordarás de entradas pasadas, la matriz inversa de $\begin{pmatrix} 2 & 8 \\ -3 & 4 \end{pmatrix}$ es
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}^{-1}
=
\frac{1}{2\cdot4 – 8\cdot(-3)}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\frac{1}{32}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}.
\]

Entonces si multiplicamos esta por matriz por la izquierda a ambos lados de la ecuación
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix},
\]
obtendremos
\begin{align*}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
5/8 \\
31/32
\end{pmatrix},
\end{align*}
lo que equivale a $x = 5/8$, $y = 31/32$; la solución del sistema. ¡Verifica que es solución!

Más adelante…

En esta entrada repasamos los conceptos y definiciones sobre sistemas de ecuaciones lineales, y nos adentramos a ver cómo existe una relación directa entre los sistemas de ecuaciones lineales y el producto de una matriz por un vector, así como que las matrices invertibles guardan relación con la solución del sistema.

Que la matriz asociada a un sistema de ecuaciones sea invertible en realidad no pasa tanto, y se tienen que desarrollar métodos más generales para resolver sistemas de ecuaciones. En la siguiente entrada conoceremos un algoritmo que nos permitirá resolver sistemas de ecuaciones con una cantidad arbitraria de variables y ecuaciones, y determinar exactamente cómo se ven todas las soluciones.

Tarea moral

  1. Usa el método de las variables libres y las variables pivote para describir al conjunto solución del siguiente sistema de ecuaciones y descríbelo geométricamente. Tendrás que elegir apropiadamente el orden en el que vas fijando las variables.
    \begin{cases}
    w+2x + 8y + 3z&= 0 \\
    -3x + 4y + z&= -1\\
    x+z&=2.\\
    \end{cases}
  2. Usa el método de la inversa para resolver los siguientes tres sistemas de ecuaciones:
    \[
    \begin{cases}
    2x + 8y &= 4 \\
    -3x + 4y &= 1,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 3 \\
    -3x + 4y &= -2,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 1 \\
    -3x + 4y &= -1.
    \end{cases}
    \]
  3. Intenta usar el método de las variables libres y pivote en el siguiente sistema de ecuaciones y explica qué dificultad tiene intentar usarlo directamente:
    \[
    \begin{cases}
    x + y &= 4 \\
    y+z &= 1\\
    z+x&=2.
    \end{cases}
    \]
    ¿Cómo describirías a un sistema de ecuaciones en el cuál se puede hacer el método de variables libres y pivote cómodamente?
  4. Considera un sistema de ecuaciones en forma matricial $Ax=b$. Demuestra que si $x$ y $x’$ son soluciones a este sistema, entonces $\frac{x+x’}{2}$ también lo es. Explica cómo puedes usar esto para a partir de dos soluciones $x$ y $x’$ distintas conseguir una infinidad de soluciones. Concluye que cualquier sistema de ecuaciones lineales o bien no tiene solución, o bien tiene una única solución, o bien tiene una infinidad de soluciones.
  5. Encuentra una matriz no invertible $A$ y un vector $b$ tales que el sistema de ecuaciones $Ax=b$ sí tenga solución. En ese sistema que diste, ¿la solución es única o puedes encontrar otra?

Entradas relacionadas