Archivo de la etiqueta: producto de matrices

Álgebra Lineal II: Aplicaciones del teorema de Cayley-Hamilton

Introducción

En entradas anteriores ya enunciamos y demostramos el teorema de Cayley-Hamilton. Veremos ahora algunas aplicaciones de este resultado.

Encontrar inversas de matrices

El teorema de Cayley-Hamilton nos puede ayudar a encontrar la inversa de una matriz haciendo únicamente combinaciones lineales de potencias de la matriz. Procedemos como sigue. Supongamos que una matriz $A$ en $M_n(F)$ tiene polinomio característico $$\chi_A(x)=x^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0.$$ Como $a_0=\det(A)$, si $a_0=0$ entonces la matriz no es invertible. Supongamos entonces que $a_0\neq 0$. Por el teorema de Cayley-Hamilton tenemos que $$A^n+a_{n-1}A^{n-1}+\ldots+a_1A+a_0I_n=O_n.$$ De aquí podemos despejar la matriz identidad como sigue:

\begin{align*}
I_n&=-\frac{1}{a_0}\left( A^n+a_{n-1}A^{n-1}+\ldots+a_1A \right)\\
&=-\frac{1}{a_0}\left(A^{n-1}+a_{n-1}A^{n-2}+\ldots+a_1 I\right) A.
\end{align*}

Estos cálculos muestran que la inversa de $A$ es la matriz $$ -\frac{1}{a_0}\left(A^{n-1}+a_{n-1}A^{n-1}+\ldots+a_1 I\right).$$

Ejemplo. Supongamos que queremos encontrar la inversa de la siguiente matriz $$A=\begin{pmatrix} 2 & 2 & 0 \\ 0 & -1 & 0 \\ 1 & 1 & 1 \end{pmatrix}.$$ Su polinomio característico es $\lambda^3-2\lambda^2 – \lambda +2$. Usando la fórmula de arriba, tenemos que

$$A^{-1}=-\frac{1}{2}(A^2-2A-I).$$

Necesitamos entonces $A^2$, que es:

$$A^2=\begin{pmatrix} 4 & 2 & 0 \\ 0 & 1 & 0 \\ 3 & 2 & 1 \end{pmatrix}.$$

De aquí, tras hacer las cuentas correspondientes, obtenemos que:

$$A^{-1}=\begin{pmatrix} \frac{1}{2} & 1 & 0 \\ 0 & -1 & 0 \\ -\frac{1}{2} & 0 & 1\end{pmatrix}.$$

Puedes verificar que en efecto esta es la inversa de $A$ realizando la multiplicación correspondiente.

$\square$

El método anterior tiene ciertas ventajas y desventajas. Es práctico cuando es sencillo calcular el polinomio característico, pero puede llevar a varias cuentas. En términos de cálculos, en general reducción gaussiana funciona mejor para matrices grandes. Como ventaja, el resultado anterior tiene corolarios teóricos interesantes. Un ejemplo es el siguiente resultado.

Corolario. Si $A$ es una matriz con entradas en los enteros y determinante $1$ ó $-1$, entonces $A^{-1}$ tiene entradas enteras.

Encontrar el polinomio mínimo de una matriz

Otra de las consecuencias teóricas del teorema de Cayley-Hamilton con aplicaciones prácticas ya la discutimos en la entrada anterior.

Proposición. El polinomio mínimo de una matriz (o transformación lineal) divide a su polinomio característico.

Esto nos ayuda a encontrar el polinomio mínimo de una matriz: calculamos el polinomio característico y de ahí intentamos varios de sus divisores polinomiales para ver cuál de ellos es el de grado menor y que anule a la matriz. Algunas consideraciones prácticas son las siguientes:

  • Si el polinomio característico se factoriza totalmente sobre el campo y conocemos los eigenvalores, entonces conocemos todos los factores lineales. Basta hacer las combinaciones posibles de factores lineales para encontrar el polinomio característico (considerando posibles multiplicidades).
  • Además, para cada eigenvalor $\lambda$ ya vimos que $\lambda$ debe ser raíz no sólo del polinomio característico, sino también del polinomio mínimo. Así, debe aparecer un factor $x-\lambda$ en el polinomio mínimo para cada eigenvalor $\lambda$.

Ejemplo. Encontramos el polinomio mínimo de la siguiente matriz:

$$B=\begin{pmatrix} 2 & 0 & 4 \\ 3 & -1 & -1 \\0 & 0 & 2 \end{pmatrix}.$$

Una cuenta estándar muestra que el polinomio característico es $(x-2)^2(x+1)$. El polinomio mínimo debe ser mónico, dividir al polinomio característico y debe contener forzosamente a un factor $(x-2)$ y un factor $(x+1)$. Sólo hay dos polinomios con esas condiciones: $(x-2)(x+1)$ y $(x-2)^2(x+1)$. Si $(x-2)(x+1)$ anula a $B$, entonces es el polinomio mínimo. Si no, es el otro. Haciendo las cuentas:

\begin{align*}
(B-2I_3)(B+I_3)&=\begin{pmatrix}0 & 0 & 4 \\ 3 & -3 & -1 \\ 0 & 0 & 0 \end{pmatrix} \begin{pmatrix} 3 & 0 & 4 \\ 3 & 0 & -1 \\ 0 & 0 & 3 \end{pmatrix}\\
&=\begin{pmatrix} 0 & 0 & 12 \\ 0 & 0 & 12 \\ 0 & 0 & 0 \end{pmatrix}.
\end{align*}

Así, $(x-2)(x+1)$ no anula a la matriz y por lo tanto el polinomio mínimo es justo el polinomio característico $(x-2)^2(x+1)$.

$\square$

Ejemplo. Consideremos la matriz $C=\begin{pmatrix} 3 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 3 \end{pmatrix}$. Su polinomio característico es $(x-3)^3$. Así, su polinomio mínimo es $x-3$, $(x-3)^2$ ó $(x-3)^3$. Nos damos cuenta rápidamente que $x-3$ sí anula a la matriz pues $A-3I_3=O_3$. De este modo, el polinomio mínimo es $x-3$.

$\square$

Clasificación de matrices con alguna condición algebraica

Si sabemos que una matriz cumple una cierta condición algebraica, entonces el teorema de Cayley-Hamilton puede ayudarnos a entender cómo debe ser esa matriz, es decir, a caracterizar a todas las matrices que cumplan la condición.

Por ejemplo, ¿quienes son todas las matrices en $M_n(\mathbb{R})$ que son su propia inversa? La condición algebraica es $A^2=I_2$. Si el polinomio característico de $A$ es $x^2+bx+c$, entonces por el teorema de Cayley-Hamilton y la hipótesis tenemos que $O_2=A^2+bA+cI_2=bA+(c+1)I_2$. De aquí tenemos un par de casos:

  • Si $b\neq 0$, podemos despejar a $A$ como $A=-\frac{c+1}{b}I_2$, es decir $A$ debe ser un múltiplo de la identidad. Simplificando la notación, $A=xI_2$. Así, la condición $A^2=I_2$ se convierte en $x^2I_2=I_2$, de donde $x^2=1$ y por lo tanto $x=\pm 1$. Esto nos da las soluciones $A=I_2$ y $A=-I_2$.
  • Si $b=0$, entonces $O_2=(c+1)I_2$, de donde $c=-1$. De este modo, el polinomio característico es $x^2-1=(x+1)(x-1)$. Se puede demostrar que aquí las soluciones son las matices semejantes a la matriz $\begin{pmatrix}1 & 0 \\ 0 & -1 \end{pmatrix}$, y sólo esas.

Más adelante…

El teorema de Cayley-Hamilton es un resultado fundamental en álgebra lineal. Vimos dos demostraciones, pero existen varias más. Discutimos brevemente algunas de sus aplicaciones, pero tiene otras tantas. De hecho, más adelante en el curso lo retomaremos para aplicarlo nuevamente.

Por ahora cambiaremos ligeramente de tema. De manera muy general, veremos cómo llevar matrices a otras matrices que sean más simples. En las siguientes entradas haremos esto mediante similaridades de matrices. Más adelante haremos esto mediante congruencias de matrices. Hacia la tercer unidad del curso encontraremos un resultado aún más restrictivo, en el que veremos que cualquier matriz simétrica real puede ser llevada a una matriz diagonal mediante una matriz que simultáneamente da una similaridad y una congruencia.

Tarea moral

  1. Encuentra el polinomio mínimo de la matriz $\begin{pmatrix}-3 & 1 & 0 & 0 \\ 0 & -3 & 0 & 0 \\ 0 & 0 & 2 & 1 \\ 0 & 0 & 0 & 2\end{pmatrix}$
  2. Encuentra la inversa de la siguiente matriz usando las técnica usada en esta entrada: $$\begin{pmatrix} 0 & 1 & 1 \\ 1 & -1 & 2\\ 2 & 2 & 1 \end{pmatrix}.$$
  3. Demuestra el corolario de matrices con entradas enteras. De hecho, muestra que es un si y sólo si: una matriz invertibles con entradas enteras cumple que su inversa tiene únicamente entradas enteras si y sólo si su determinante es $1$ ó $-1$.
  4. ¿Cómo son todas las matrices en $M_2(\mathbb{R})$ tales que $A^2=A$?
  5. ¿Cómo son todas las matrices en $M_3(\mathbb{R})$ de determinante $0$ tales que $A^3=O_3$?

Entradas relacionadas

Geometría Analítica I: Producto de matrices

Introducción

En la entrada anterior definimos a un vector y a una matriz de una función lineal, podemos proceder a definir su producto. En esta entrada primero veremos cómo se realiza el producto de una matriz con un vector. Después trataremos la fuerte relación entre la composición de funciones y el producto de matrices. Con dicha relación, por último definiremos el producto de matrices cualesquiera.

Producto de una matriz con un vector

Si tenemos un matriz $A$ de $m\times n$, sabemos que una forma de ver a nuestra matriz es como un conjunto ordenado de $n$ vectores en $\mathbb{R}^n$ y entonces se escribe $A=(u_1, u_2, \cdots, u_n)$, con $u_{i} \in \mathbb{R}^n$, donde $i=1,2,\cdots,n$. También sabemos que cada vector al que haremos referencia tiene la notación $x=(x_1, x_2, \cdots, x_n )^T$.

Vamos a definir con estos conceptos al producto de una matriz $A$ por un vector $x$:

Definición. El producto de una matriz $A$ de dimensión $m\times n$ de la forma

\begin{equation*}
A = (u_1,u_2, \cdots, u_n),
\end{equation*}

por un vector de la forma

\[ x=(x_1, x_2, \cdots, x_n )^T = \left(\begin{array}{c}
x_1\\
x_2\\
\vdots\\
x_n
\end{array} \right);\]

se define por

\[ Ax = (u_1, u_2, \cdots, u_n )\left(\begin{array}{c}
x_1\\
x_2\\
\vdots\\
x_n
\end{array} \right) = x_1 u_1 + x_2 u_2 + \cdots + x_n u_n. \]

Veamos un ejemplo que nos apoye con la definición:

Ejemplo. Sean la matriz $A$ y el vector $x$ como sigue

\[ A = \left(\begin{array}{ccc}
4&7&-1\\
2&-3&1\\
5&4&-2
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} x=(x,y,z)^T , \]

entonces el producto de la matriz $A$ con el vector $x$ será:

\[ Ax = \left(\begin{array}{ccc}
4&7&-1\\
2&-3&1\\
5&4&-2
\end{array} \right) \left(\begin{array}{c}
x\\
y\\
z
\end{array} \right) = x \left(\begin{array}{c}
4\\
2\\
5
\end{array} \right) + y \left(\begin{array}{c}
7\\
-3\\
4
\end{array} \right) + z \left(\begin{array}{c}
-1\\
1\\
-2
\end{array} \right) = \left(\begin{array}{c}
4x+7y-z\\
2x-3y+z\\
5x+4y-2z
\end{array} \right).\]

Ahora, para comprender mejor la definición del producto de matrices, que es el tema principal de esta entrada; es mejor hablar de su origen, el cual proviene de los sistemas lineales. Arthur Cayley (1821-1895) fue un matemático británico que analizaba los sistemas con dos ecuaciones y dos incógnitas:

\begin{align*}
ax + by &= x’ \\
cx + dy &= y’
\end{align*}

como transformación del plano donde a cada punto $(x,y)$ le corresponde el punto $(x’,y’)$.

A la función de $\mathbb{R}^2$ en $\mathbb{R}^2$ donde

\[ p(x) = \left(\begin{array}{c}
ax + by\\
cx + dy
\end{array} \right), \]

se le asocia la matriz

\[ \left(\begin{array}{cc}
a & b\\
c & d
\end{array} \right), \]

que es quien transforma el plano, moviendo cada punto $(x,y)$ a la posición $(x’,y’)$.

Ahora vamos a considerar otra matriz

\[ \left(\begin{array}{cc}
e & f\\
g & h
\end{array} \right), \]

quien también transformará al plano, pero el punto $(x’,y’)$ se moverá a la posición $(x´´,y´´)$ mediante el sistema:

\begin{align*}
ex’ + fy’ &= x´´ \\
gx’ + hy’ &= y´´.
\end{align*}

Si lo que deseamos es que las dos transformaciones se ejecuten una detrás de la otra, es decir, que el punto $(x,y)$ vaya a la posición $(x´´,y´´)$; entonces para la primera ecuación se tendrá:

\begin{align*}
x´´ &= ex’ + fy’\\
&= e(ax+by) + f(cx+dy)\\
&= (ae+cf)x +(be+df)y,
\end{align*}

y para la segunda ecuación tenemos:

\begin{align*}
y´´ &= gx’ + hy’\\
&= g(ax+by) + h(cx+dy)\\
&= (ag+ch)x +(bg+dh)y.
\end{align*}

En consecuencia, la composición de las dos transformaciones tiene por sistema a:

\begin{align*}
(ae+cf)x +(be+df)y &= x´´\\
(ag+ch)x +(bg+dh)y &= y´´.
\end{align*}

De hecho las definiciones de Cayley se generalizaron a cualquier dimensión. Con esta motivación vamos a definir el producto de matrices.

Multiplicación de matrices

Definición. Sean $f: \mathbb{R}^n \longrightarrow \mathbb{R}^m$ y $g: \mathbb{R}^m \longrightarrow \mathbb{R}^k$ dos funciones lineales, la composición $g \circ f: \mathbb{R}^n \longrightarrow \mathbb{R}^k$ también será lineal. Sean las matrices $A$ de tamaño $m\times n$ y $B$ de tamaño $k\times m$ que corresponden a $f$ y a $g$ respectivamente. Definimos al producto de matrices $BA$ como la matriz $k\times n$ que corresponde a la función lineal $g \circ f$.

Entonces $BA$ es la única matriz de $k\times n$ que cumple:

\begin{equation*}
(g\circ f)(x) = (BA) x, \hspace{0.25cm} \text{para todo} \hspace{0.25cm} x \in \mathbb{R}^n .
\end{equation*}

Para comprender la definición, recordemos que la matriz $A$ con tamaño $m\times n$ está asociada a la función lineal $f: \mathbb{R}^n \longrightarrow \mathbb{R}^m$ y la matriz $B$ con tamaño $k\times m$ está asociada a la función lineal $g: \mathbb{R}^m \longrightarrow \mathbb{R}^k$. La conversión se da por la convención existente en el orden en que se realiza la composición de funciones (hacia atrás).

La definición no nos indica cómo realizar la multiplicación de matrices, para lo cual conviene que recordemos primeramente que las columnas de una matriz son las imágenes de la base canónica bajo la función asociada. Entonces si $A=(u_1, u_2, \cdots, u_n )$ donde $u_i = f(e_i ) \in \mathbb{R}^m$, entonces $(g \circ f)(e_i) =g(f(e_i)) = g(u_i) = Bu_i$. Por tanto

\begin{equation*}
BA = B (u_1,u_2, \cdots, u_n) = (Bu_1, Bu_2, \cdots, Bu_n).
\end{equation*}

Ahora, para obtener las columnas de la nueva matriz, usaremos la multiplicación de $B$ por los vectores columna de $A$, que es la multiplicación que ya definimos en la primer parte de esta entrada.

Expresaremos cada una de las entradas de la matriz $BA$, pero nos conviene ver a la matriz $B$ como una columna de vectores renglón, obteniendo

\[ BA = \left(\begin{array}{c}
w_{1}^{T}\\
w_{2}^{T}\\
\vdots\\
w_{k}^{T}
\end{array} \right) \left(\begin{array}{c}
u_1, u_2, \cdots, u_n
\end{array} \right) = \left(\begin{array}{cccc}
w_1 \cdot u_1 & w_1 \cdot u_2 & \cdots & w_1 \cdot u_n\\
w_2 \cdot u_1 & w_2 \cdot u_2 & \cdots & w_2 \cdot u_n\\
\vdots& \vdots & \ddots &\vdots\\
w_k \cdot u_1 & w_k \cdot u_2 & \cdots & w_k \cdot u_n
\end{array} \right), \]

Con esta fórmula podemos ver porqué es importante que el número de filas de $B$ (los transpuestos de los vectores $w_i$) debe ser el mismo número de columnas de $A$ (los vectores $u_j$) y comprender la mecánica para obtener las entradas de una matriz $k \times n$ a partir de una matriz $B$ con tamaño $k \times m$ y una matriz $A$ con tamaño $m \times n$.

Ejemplo. Sean

\[ B = \left(\begin{array}{ccc}
2&-1&0\\
1&3&1
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} A= \left(\begin{array}{cccc}
1&0&2&4\\
-1&-2&1&0\\
3&5&6&1
\end{array} \right), \]

El producto $BA$ está bien definido porque $B$ es de tamaño $3\times 4$ y $A$ es de tamaño $2\times 3$, por tanto $BA$ es una matriz de $2\times 4$. Las filas de $B$ serán $w_1$ y $w_2$ y las columnas de $A$ serán $u_1, u_2, u_3$ y $u_4$, es decir:

Por tanto, $BA$ es la matriz:

\[ BA = \left(\begin{array}{cccc}
3&2&3&8\\
1&-1&11&5
\end{array} \right). \]

Ejemplo. Tomemos las matrices $A$ y $B$ del ejemplo anterior, observemos que no podemos realizar el producto $AB$, ya que el número de columnas de $B$ es $4$ y el número de filas de $A$ es $2$ y éstos números no coinciden.

En conclusión, el producto de matrices no es conmutativo, de hecho, aunque existan ambos $AB$ y $BA$, éstos no tienen porqué coincidir.

Ejemplo. Sean \[ A = \left(\begin{array}{cc}
7&0\\
-1&0
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} B= \left(\begin{array}{cc}
0&2\\
0&-5
\end{array} \right), \]

podemos calcular $AB$ y $BA$, obtenemos

\[ AB = \left(\begin{array}{cc}
0&14\\
0&-2
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} BA= \left(\begin{array}{cc}
-2&0\\
5&0
\end{array} \right), \]

y vemos que $AB \neq BA.$

Tarea moral

  1. Aunque $A$ y $B$ no sean las matrices cero (cuyas entradas son todas cero), su producto sí puede serlo. Den un ejemplo de 2 matrices tales que $AB=0$, pero $A\neq 0$ y $B \neq 0$, donde $0$ es la matriz cero.
  2. Demuestra que si $A, B, C$ son matrices $2\times 2$, entonces $A(B+C) = AB +AC$ y $(A+B)C= AC +BC$.
  3. Demuestra que si $A,B, C$ son matrices de $3\times 3$, entonces $A(BC) = (AB)C$, es decir que el producto de matrices es asociativo. Por tanto, podemos escribir al producto simplemente como $ABC$.
  4. Sean

\[ A = \left(\begin{array}{ccc}
3&-1&4\\
2&5&-2\\
1&3&2
\end{array} \right), \hspace{0.5cm} B= \left(\begin{array}{cc}
1&3\\
-1&4\\
5&2
\end{array} \right), \hspace{0.5cm} C= \left(\begin{array}{cccc}
1&3&-1&2\\
-2&4&1&5\\
5&2&-3&1
\end{array} \right), \]

Realizar el producto de matrices $AB, BC, AC$ y justificar en caso de que no pueda efectuarse alguno de los productos.

Más adelante

En la primera parte de la unidad 3 vimos distintos tipos de transformación de funciones. Para la segunda parte definimos matrices de tamaño $m\times n$, matrices asociadas a funciones lineales y en esta entrada vimos la operación del producto de matrices.

A continuación vamos a ver algunas de las familias de matrices más representativas que están asociadas a funciones. Nos serán familiares dichas funciones porque las trabajamos en la primera parte de esta Unidad 3.

Enlaces relacionados

  • Página principal del curso:
  • Entrada anterior del curso:
  • Siguiente entrada del curso:

Álgebra Lineal I: Problemas de producto de matrices y matrices invertibles

Introducción

Esta sección consta de puros problemas para practicar los conceptos vistos en entradas previas. Las entradas anteriores correspondientes son la de producto de matrices y la de matrices invertibles.

Problemas resueltos

Problema. Encuentra todas las matrices $B\in M_3(\mathbb{C})$ que conmutan con la matriz

\begin{align*}
A=\begin{pmatrix}
1 & 0 & 0\\
0 & 0 & 0\\
0 & 0 &2
\end{pmatrix}.
\end{align*}

Solución. Sea

\begin{align*}
B=\begin{pmatrix} a & b & c\\ d & e & f \\ g & h & i \end{pmatrix}\in M_3(\mathbb{C}).
\end{align*}

Calculamos usando la regla del producto:

\begin{align*}
AB=\begin{pmatrix}
a & b & c\\ 0 & 0 & 0\\ 2 g & 2h & 2i \end{pmatrix}
\end{align*}

y

\begin{align*}
BA= \begin{pmatrix} a & 0 & 2c\\ d & 0 & 2f\\ g & 0 & 2i\end{pmatrix}.
\end{align*}

Igualando ambas matrices obtenemos que $A$ y $B$ conmutan si y sólo si se satisfacen las condiciones

\begin{align*}
\begin{cases}
b=d=f=h=0\\
2c=c\\
2g=g\end{cases}.
\end{align*}

Las últimas dos condiciones son equivalentes a que $c=g=0$. Cualquier matriz que conmuta con $A$ satisface estas condiciones y conversamente (por nuestro cálculo) si satisface estas ecuaciones conmuta con $A$. Esto nos deja como parámetros libres a $a,e,i$, es decir $B$ puede ser cualquier matriz diagonal.

$\square$

Problema. Considerando las matrices

\begin{align*}
A=\begin{pmatrix} 1 & 1 & 1\\ 0& 4 &-1\\ 9& 6 & 0 \end{pmatrix}, \hspace{2mm} B= \begin{pmatrix} -1 & 1\\ 0 & -2 \\ 1 &0 \end{pmatrix},
\end{align*}

¿cuáles de los productos $A^2, AB, BA, B^2$ tienen sentido? Calcula los que si lo tienen.

Solución. Recordamos que los productos tienen sentido si el número de columnas de la matriz de la izquierda sea el mismo que el número de filas de la matriz de la derecha. Entonces no podemos realizar los productos $BA$ o $B^2$ pues esta condición no se cumple (por ejemplo, $B$ tiene $3$ columnas, $A$ tiene $2$ filas, y estos números difieren). Calculamos entonces usando la regla del producto:

\begin{align*}
A^2 = \begin{pmatrix}
10 & 11 & 0\\
-9 & 10 & -4\\
9 & 33 & 3\end{pmatrix}, \hspace{2mm} AB= \begin{pmatrix} 0 & -1\\ -1 & -8\\ -9 &-3\end{pmatrix}.
\end{align*}

$\square$

Problema. Considera la matriz \begin{align*}
A=\begin{pmatrix} 1 & 1& 0 \\ 0 & 1 &1\\ 0 &0 & 1 \end{pmatrix}
\end{align*}

  • Demuestra que $A$ satisface que $(A-I_3)^3=O_3$
  • Calcula $A^{n}$ para cualquier entero positivo $n$.

Solución.

  • Hacemos el cálculo directamente:
    \begin{align*}
    (A-I_3)^3&= \begin{pmatrix} 0 & 1 & 0\\0 & 0 &1\\ 0 & 0 &0 \end{pmatrix}^{2} \cdot \begin{pmatrix} 0 & 1 &0 \\ 0 & 0 & 1\\ 0 & 0 &0 \end{pmatrix} \\&= \begin{pmatrix} 0 & 0 & 1\\ 0 & 0 & 0\\ 0 &0 &0\end{pmatrix}\cdot \begin{pmatrix} 0 & 1 &0 \\ 0 & 0 & 1\\ 0 & 0 &0 \end{pmatrix}\\&=O_3. \end{align*}
  • Para este tipo de problemas, una estrategia que funciona es hacer casos pequeños para hacer una conjetura, y luego demostrarla por inducción. Probando para algunos valores de $n$ conjeturamos que
    \begin{align*}
    A^{n}=\begin{pmatrix} 1 & n & \frac{n(n-1)}{2}\\ 0 & 1 & n\\ 0 & 0 &1 \end{pmatrix}.
    \end{align*}
    Lo demostramos por inducción sobre $n$, dando por cierto el caso base con $n=1$.
    Hagamos ahora el paso inductivo. Para esto usamos que $1+\dots + (n-1)= \frac{n(n-1)}{2}$.
    Nuestra hipótesis de inducción nos dice entonces que para cierto $n$ se tiene que $A^{n}=\begin{pmatrix} 1 & n & 1+\dots +(n-1) \\ 0 & 1 & n\\ 0 & 0 & 1\end{pmatrix}$. Usando que $A^{n+1}=A^{n}\cdot A$ con nuestra hipótesis de inducción se sigue:
    \begin{align*}
    A^{n+1}= A^{n}\cdot A&= \begin{pmatrix} 1 & n & 1+\dots +(n-1)\\ 0 & 1 &n\\ 0 & 0 &1\end{pmatrix} \cdot \begin{pmatrix} 1 & 1 & 0\\ 0 & 1 & 1\\ 0 & 0 & 1\end{pmatrix}\\ &= \begin{pmatrix} 1 & 1+n & 1+\dots + (n-1)+n\\ 0 & 1 & n+1\\ 0 & 0 &1\end{pmatrix}.\end{align*}
    Luego el resultado es cierto para $n+1$ y así queda demostrado el resultado.

$\square$

El siguiente problema combina temas de números complejos y de matrices invertibles. Para que lo entiendas a profundidad, es útil recordar la teoría de raíces $n$-ésimas de la unidad. Puedes revisar esta entrada del blog. El ejemplo puede parecer un poco artificial. Sin embargo, las matrices que se definen en él tienen muchas aplicaciones, por ejemplo, en procesamiento de señales.

Problema. Sea $n>1$ un natural y sea

\begin{align*}
\zeta= e^{\frac{2\pi i}{n}}= \cos \left( \frac{2\pi}{n}\right)+i\sin \left( \frac{2\pi}{n}\right).
\end{align*}

Este número puede parecer muy feo, pero es simplemente la raíz $n$-ésima de la unidad de menor argumento.

Definimos la matriz de Fourier de orden $n$, denotada por $\mathcal{F}_n$ como la matriz tal que su $(j,k)-$ésima entrada es $\zeta^{(j-1)(k-1)}$ para $1\leq j,k\leq n$.

  • a) Sea $\overline{\mathcal{F}_n}$ la matriz cuya $(j,k)-$ésima entrada es el conjugado complejo de la $(j,k)-$ésima entrada de $\mathcal{F}_n$. Demuestra que
    \begin{align*}
    \mathcal{F}_n\cdot \overline{\mathcal{F}_n} = \overline{\mathcal{F}_n}\cdot \mathcal{F}_n= nI_n.
    \end{align*}
  • b) Deduce que $\mathcal{F}_n$ es invertible y calcule su inversa.

Solución.

  • a) Sean $1\leq j,k\leq n$. Usando la regla del producto, podemos encontrar la entrada $(j,k)$ como sigue:
    \begin{align*}
    \left( \mathcal{F}_n \cdot \overline{\mathcal{F}_n} \right)_{jk} &= \sum_{l=1}^{n} \left(\mathcal{F}_n\right)_{jl} \cdot \left(\overline{\mathcal{F}_n}\right)_{lk}\\
    &= \sum_{l=1}^{n} \zeta^{(j-1)(l-1)} \cdot \overline{\zeta^{(l-1)(k-1)}}\\
    &= \sum_{l=1}^{n} \zeta^{(j-1)(l-1)-(l-1)(k-1)},
    \end{align*}
    la última igualdad se debe a que $\overline{\zeta}= \zeta^{-1}$. Así
    \begin{align*}
    \left( \mathcal{F}_n \cdot \overline{\mathcal{F}_n}\right)_{jk}=\sum_{l=1}^{n}\zeta^{(l-1)(j-k)}=\sum_{l=0}^{n-1}\left( \zeta^{j-k}\right)^{l}.
    \end{align*}
    Y la suma de la derecha es la suma de una sucesión geométrica con razón $\zeta^{j-k}$. Si $j=k$, entonces $\zeta^{j-k}=1$, así que la suma es igual a $n$ ya que cada termino es $1$ y lo sumamos $n$ veces. Si $j\neq k$ entonces $\zeta^{j-k}\neq 1$ y usamos la fórmula para una suma geométrica:
    \begin{align*}
    \sum_{l=0}^{n-1} \left( \zeta^{j-k}\right)^{l}= \frac{1-\left(\zeta^{j-k}\right)^{n}}{1-\zeta^{j-k}}=\frac{1-(\zeta^{n})^{j-k}}{1-\zeta^{j-k}}=0.\end{align*}
    Usamos en la última igualdad que $\zeta^{n}=1$. Se sigue que $\left( \mathcal{F}_n \cdot \overline{\mathcal{F}_n}\right)_{jk}$ es $n$ si $j=k$ y $0$ de otra manera, es decir
    \begin{align*}
    \mathcal{F}_n\cdot\overline{\mathcal{F}_n}=n\cdot I_n.
    \end{align*}
    La igualdad simétrica $\overline{\mathcal{F}_n}\cdot \mathcal{F}_n=n \cdot I_n$ se prueba de la misma manera y omitimos los detalles.
  • b) Por el inciso anterior, sugerimos $\frac{1}{n} \overline{\mathcal{F}_n}$, y esta satisface

    \begin{align*}
    \mathcal{F}_n \cdot \frac{1}{n} \overline{\mathcal{F}_n} = \frac{1}{n} \cdot n I_n= I_n
    \end{align*}
    y la otra igualdad se verifica de la misma manera. Por lo tanto, $\mathcal{F}_n$ es invertible y su inversa es $\frac{1}{n} \overline{\mathcal{F}_n}$.

$\square$

Problema. Sean $A,B\in M_n(\mathbb{R})$ matrices tales que

\begin{align*}
A+B=I_n \hspace{5mm} A^2+B^2=O_n
\end{align*}

Demuestra que $A$ y $B$ son invertibles y que satisfacen

\begin{align*}
(A^{-1}+B^{-1})^{n}=2^{n} I_n
\end{align*}

Solución. Observamos que las propiedades dadas nos permiten calcular

\begin{align*}
A(I_n+B-A)&= (I_n-B) (I_n+B-A)\\&=I_n+B-A-B-B^2+BA\\
&= I_n -A-B^2+BA \\&=I_n+(B-I_n)A-B^2\\ &=I_n-A^2-B^2\\&= I_n.
\end{align*}

Es decir $A^{-1}=I_n+B-A$ (falta demostrar que con esta propuesta, también se cumple $A^{-1}A=I_n$, omitimos los cálculos). Similarmente $B^{-1}= I_n+A-B$ y por tanto $A^{-1}+B^{-1}= 2\cdot I_n$ y de esta igualdad se sigue la segunda parte del problema, pues

\begin{align*}
\left(A^{-1}+B^{-1}\right)^{n}= \left( 2\cdot I_n\right)^{n}=2^{n} \cdot I_n.\end{align*}

$\square$

Entradas relacionadas

Álgebra Lineal I: Matrices invertibles

Introducción

Siguiendo el hilo de la entrada pasada, por la correspondencia entre transformaciones lineales y matrices así como la composición y su producto, podemos traducir el problema de invertibilidad de transformaciones lineales en términos de matrices, a las que llamaremos matrices invertibles. Es decir, si tenemos $\varphi: F^n\to F^n$, $\psi: F^n\to F^n$ transformaciones lineales tales que

\begin{align*}
\varphi\circ \psi= Id_{F^n}, \hspace{2mm} \psi \circ \varphi=Id_{F^n}
\end{align*}

¿cómo se traduce esto en términos de sus matrices asociadas?

Veremos que la respuesta yace en matrices que tienen inverso multiplicativo, a diferencia de un campo $F$, donde todo $x$ tiene un $x^{-1}$, cuando trabajamos con matrices no todas tienen una matriz inversa y las que si son de especial importancia.

Definición de matrices invertibles

Definición. Decimos que una matriz $A\in M_n (F)$ es invertible o bien no singular si existe una matriz $B\in M_n(F)$ tal que

\begin{align*}
AB=BA=I_n
\end{align*}

Ejemplo. Veamos que la matriz $A=\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$ es invertible. Para ello, tenemos que exhibir una matriz $B$ tal que $AB=I_2=BA$. Proponemos a la matriz $B=\begin{pmatrix} 1 & -1 \\ 0 & 1 \end{pmatrix}$. Haciendo la multiplicación con la regla del producto, tenemos que

\begin{align*}
AB&=\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & -1 \\ 0 & 1 \end{pmatrix}\\
&=\begin{pmatrix} 1 \cdot 1 + 1 \cdot 0 & 1 \cdot (-1) + 1\cdot 1\\ 0 \cdot 1 + 1 \cdot 0 & 0\cdot (-1)+ 1\cdot 1\end{pmatrix}\\
&=\begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}\\
&=I_2.
\end{align*}

¡Aún no hemos terminado! Para satisfacer la definición, también tenemos que mostrar que $BA=I_2$:

\begin{align*}
BA&=\begin{pmatrix} 1 & -1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}\\
&=\begin{pmatrix} 1 \cdot 1 + (-1) \cdot 0 & 1 \cdot 1 + (-1)\cdot 1\\ 0 \cdot 1 + 1 \cdot 0 & 0\cdot 1+ 1\cdot 1\end{pmatrix}\\
&=\begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}\\
&=I_2.
\end{align*}

Ahora sí, podemos concluir que la matriz $A$ es invertible.

$\square$

Observación. Una primera cosa que hay que notar es que en la definición se pide que tanto $AB$ como $BA$ sean la matriz identidad $I_n$. Es importante verificar ambas, pues como sabemos, el producto de matrices no siempre conmuta.

Otra observación importante es que si la matriz $B$ como en la definición existe, entonces es necesariamente única: En efecto, si $C\in M_n(F)$ es otra matriz tal que

\begin{align*}
AC=CA=I_n,
\end{align*}

entonces manipulando las expresiones en juego:

\begin{align*}
C&= I_n C \\&= (BA)C\\
&=B(AC)\\&= B I_n \\&=B.
\end{align*}

Entonces no hay ambigüedad al hablar de la matriz inversa de $A$. Ya no tiene mucho sentido usar una letra diferente para ella. Simplemente la denotaremos por $A^{-1}$.

Primeras propiedades de matrices invertibles

Resumimos algunas propiedades de las matrices invertibles en la siguiente proposición.

Proposición.

  1. Para $c\in F$ es un escalar distinto de cero, se tiene que $c I_n$ es invertible.
  2. Si $A$ es invertible, entonces $A^{-1}$ también lo es, y $\left(A^{-1}\right)^{-1}=A$
  3. Si $A,B\in M_n(F)$ son invertibles, entonces $AB$ también lo es y

    \begin{align*}
    \left(AB\right)^{-1}= B^{-1}A^{-1}.
    \end{align*}

Demostración:

  1. Como $c\neq 0$ y $F$ es un campo, entonces existe $c^{-1}$ en $F$ y así $c^{-1} I_n$ satisface (por la compatibilidad del producto por escalares de esta entrada)

    \begin{align*}
    (cI_n)\cdot (c^{-1}I_n)&= (cc^{-1})\cdot (I_n I_n)\\&= I_n\\
    &= (c^{-1} c) \cdot(I_n)\\&= (c^{-1} I_n) \cdot (c I_n).
    \end{align*}
    Luego $c^{-1}I_n$ es la matriz inversa de $c I_n$.
  2. Para evitar alguna confusión con la notación, denotemos a $A^{-1}$ por $B$. Así

    \begin{align*}
    AB=BA=I_n.
    \end{align*}
    Luego $B$ es invertible y su inversa es $A$.
  3. Si $A,B\in M_n(F)$ son invertibles entonces existen $A^{-1}$ y $B^{-1}$. Sea $C= B^{-1} A^{-1}$. Así

    \begin{align*}
    (AB)C=ABB^{-1}A^{-1}= A I_n A^{-1}= AA^{-1} =I_n.
    \end{align*}
    Y análogamente

    \begin{align*}
    C(AB)= B^{-1}A^{-1} A B= B^{-1} I_n B= B^{-1} B=I_n.
    \end{align*}
    Mostrando así que $AB$ es invertible con inversa $C$.

$\square$

Observación. Es importante notar que el ‘sacar inverso’ invierte el orden de los productos. Es decir, en el producto $AB$ aparece primero $A$ y luego $B$, mientras que el inverso $(AB)^{-1}$ es $B^{-1}A^{-1}$, en donde aparece primero $B^{-1}$ y luego $A^{-1}$. Esto es muy importante en vista de que la multiplicación de matrices no es conmutativa y por lo tanto en general

\begin{align*}
(AB)^{-1}\neq A^{-1} B^{-1}.
\end{align*}

También es importante notar que si bien la invertibilidad se preserva bajo productos (el producto de matrices invertibles es invertible) ésta no se preserva bajo sumas. Por ejemplo, tanto $I_n$ como $-I_n$ son invertibles en virtud del teorema, sin embargo su suma es $I_n+(-I_n)=O_n$, que no es invertible.

Ya hablamos de cuándo una matriz $A$ en $M_n(F)$ es invertible. ¿Qué sucede si consideramos a todas las matrices invertibles en $M_n(F)$? Introducimos el siguiente objeto de importancia fundamental en muchas áreas de las matemáticas:

Definición. El conjunto de matrices invertibles $A\in M_n(F)$ es llamado el grupo lineal general y es denotado por $GL_n(F)$.

En la tarea moral hay un ejercicio en el que se pide mostrar que $GL_n(F)$ es un grupo bajo la operación de producto de matrices. En realidad en este curso no hablaremos mucho de $GL_n(F)$ como grupo. Pero es importante que sepas de su existencia y que conozcas su notación, pues será importante en tu preparación matemática futura.

Invirtiendo matrices

Si bien el concepto de invertibilidad es sencillo de introducir, gran parte de la herramienta para determinar (irónicamente, a través de los determinantes) la invertibilidad de una matriz o propiedades relacionadas (por ejemplo, una computación efectiva de matrices inversas) todavía no está a nuestra disposición. Por tanto, lo único que podemos hacer es uso de ‘fuerza bruta’ para encontrar las inversas de matrices invertibles, y eso haremos en los siguientes ejemplos para al menos familiarizarnos con los cálculos.

Problema. Sea la matriz $A=\begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0\\ 0 & 0 & 1\end{pmatrix}$. ¿Es $A$ invertible? De serlo, calcula su inversa.

Solución. Como mencionamos, con la teoría que hemos desarrollado hasta ahora solo podemos atacar el problema directamente. Buscamos una matriz

\begin{align*}
B= \begin{pmatrix} a & b & c\\ x & y & z\\ u & v & w\end{pmatrix}
\end{align*}

tal que $AB=I_3=BA$. Usando la regla del producto, calculamos

\begin{align*}
AB=\begin{pmatrix} x & y & z\\ a & b &c \\ u & v & w \end{pmatrix}.
\end{align*}

Igualando esta matriz a $I_3$ obtenemos las condiciones

\begin{align*}
\begin{cases} x=b=w=1\\ y=z=a=c=u=v=0. \end{cases}
\end{align*}

Esto muestra que una buena candidata a ser la inversa de $A$ es la matriz

\begin{align*}
A^{-1}= \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0\\ 0 & 0 & 1\end{pmatrix}.
\end{align*}

Falta un paso más: hay que verificar que $BA=I_3$. Afortunadamente esto es cierto. Su verificación queda como tarea moral.

$\square$

Resaltamos que el método usado no es eficiente, y tampoco es general (pues funcionó solo por la particularidad de la matriz $A$). Dicho esto, exhibimos un método que puede ser útil cuando la matriz por invertir es suficientemente ‘bonita’ (por ejemplo si tiene muchos ceros).

Sea $A\in M_n(F)$ una matriz y $b\in F^n$ un vector. Supongamos que el sistema $AX=b$ en el vector variable $X$ tiene una única solución $X\in F^n$. Un resultado que probaremos más adelante nos dice que entonces $A$ es invertible y que la solución es $X=A^{-1}b$ (es decir, que podemos ‘despejar’ $X$ multiplicando por $A^{-1}$ del lado izquierdo ambos lados). Así, si el sistema resulta fácil de resolver, podemos obtener una expresión de $A^{-1}$ en términos de cualquier vector $b$, y ésto basta para determinar a $A^{-1}$. En la práctica, la resolución del sistema mostrará que

\begin{align*}
A^{-1} b = \begin{pmatrix}
c_{11}b_1 + c_{12} b_2 +\dots + c_{1n}b_n\\
c_{21}b_1+c_{22}b_2 + \dots + c_{2n} b_n\\
\vdots\\
c_{n1} b_1 + c_{n2} b_2 +\dots + c_{nn}b_n
\end{pmatrix}
\end{align*}

para algunos escalares $c_{ij}$ independientes de $b$. Escogiendo $b=e_i$ el $i-$ésimo vector de la base canónica, el lado izquierdo es simplemente la $i-$ésima columna de $A^{-1}$ y el lado derecho es la $i-$ésima columna de $[c_{ij}]$. Como ambas matrices son iguales columna a columna, deducimos que

\begin{align*}
A^{-1}=[c_{ij}]
\end{align*}

Subrayamos que, una vez el sistema resuelto, el resto es relativamente sencillo pues solo es fijarnos en los coeficientes. La dificultad reside entonces en resolver el sistema $AX=b$, y la dificultad de este sistema depende fuertemente de la matriz $A$, por lo que nos limitaremos por lo pronto a ejemplos sencillos.

Retomemos el problema anterior para ver cómo funciona este método recién expuesto.

Problema. Resuelve el problema anterior usando el método que acabamos de describir.

Solución. Sea $b=\begin{pmatrix} b_1 \\ b_2 \\ b3 \end{pmatrix}\in F^3$, tratemos de resolver $AX=b$ para $X=\begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}$. El sistema se escribe entonces

\begin{align*}
\begin{pmatrix} b_1 \\ b_2 \\ b_3\end{pmatrix}=AX= \begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 1\end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3\end{pmatrix}= \begin{pmatrix} x_2 \\ x_1 \\ x_3\end{pmatrix}.
\end{align*}

O equivalentemente

\begin{align*}
\begin{cases} x_1=b_2\\ x_2= b_1 \\ x_3=b_3.\end{cases}
\end{align*}

Como el sistema siempre se puede resolver dado $b\in F^3$, podemos afirmar que $A$ es invertible, y tenemos que

\begin{align*}
A^{-1}b= X= \begin{pmatrix} x_1\\ x_2 \\ x_3\end{pmatrix}= \begin{pmatrix} b_2\\ b_1 \\ b_3\end{pmatrix}= \begin{pmatrix} 0\cdot b_1 + 1\cdot b_2 + 0 \cdot b_3\\ 1\cdot b_1 +0\cdot b_2 +0\cdot b_3\\ 0\cdot b_1 + 0\cdot b_2 +1\cdot b_3\end{pmatrix}. \end{align*}

Fijándonos en los coeficientes del lado derecho, vemos que la primera fila de $A^{-1}$ es $(0 \ 1 \ 0)$, la segunda $(1\ 0 \ 0)$ y la tercera $(0\ 0\ 1)$. Luego

\begin{align*}
A^{-1}=\begin{pmatrix}
0 & 1& 0\\
1 & 0&0\\
0 & 0 & 1\end{pmatrix}\end{align*}

$\square$

Problema. Sea la matriz

\begin{align*}
A= \begin{pmatrix} 1 & 1 & 1 & 1\\ 0 & 1 & 1 &1 \\ 0 & 0 & 1 & 1\\ 0 & 0 & 0 & 1\end{pmatrix} \end{align*}

Demuestre que $A$ es invertible y encuentre su inversa.

Solución. Usamos el mismo método. Sea $b= \begin{pmatrix} b_1\\ b_2 \\ b_3 \\ b_4 \end{pmatrix}\in F^4$ y resolvemos $AX=b$ con $X=\begin{pmatrix} x_1\\ x_2 \\ x_3 \\ x_4\end{pmatrix}$. Esta vez el sistema asociado es el siguiente (omitimos los cálculos de la regla del producto):

\begin{align*}
\begin{cases}
x_1+x_2+x_3+x_4=b_1\\
x_2+x_3+x_4=b_2\\
x_3+x_4=b_3\\
x_4=b_4
\end{cases}.
\end{align*}

Este sistema lo podemos resolver de manera más o menos sencilla: De la última ecuación tenemos que $x_4=b_4$, luego sustituyendo en la penúltima obtenemos $x_3+b_4=b_3$ o bien $x_3=b_3-b_4$. Sustituyendo esto a su vez en la segunda ecuación obtenemos que $x_2+b_3=b_2$, es decir $x_2=b_2-b_3$ y finalmente $x_1= b_1-b_2$. Así el sistema siempre tiene solución y estas están dadas por

\begin{align*}
A^{-1}b= X= \begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ x_4\end{pmatrix} = \begin{pmatrix} b_1-b_2\\ b_2-b_3\\ b_3-b_4\\ b_4 \end{pmatrix}.
\end{align*}

De esto se sigue que (fijándonos en los coeficientes) la primera fila de $A^{-1}$ es $(1\ -1 \ 0 \ 0)$, y análogamente obtenemos las demás, de manera que

\begin{align*}
A^{-1}=\begin{pmatrix}
1 & -1 & 0 &0\\
0 & 1 & -1 & 0\\
0&0 &1 &-1\\
0 & 0 & 0 &1
\end{pmatrix}.
\end{align*}

Un buen ejercicio es verificar que en efecto con esta inversa propuesta se cumple que $AA^{-1}=I_4=A^{-1}A$.

$\square$

Matrices invertibles diagonales

Concluimos esta sección con un último problema de matrices invertibles. Para resolverlo no usamos el método expuesto, sino un argumento particular para las matrices diagonales.

Problema. Demuestre que una matriz diagonal $A\in M_n(F)$ es invertible si y sólo si todas sus entradas en la diagonal son distintas de cero. Más aún, de ser el caso, $A^{-1}$ también es diagonal.

Solución. Sea $A=[a_{ij}]\in M_n(F)$ una matriz diagonal y $B=[b_{ij}]\in M_n(F)$ cualquier matriz. Usando la regla del producto tenemos que

\begin{align*}
(AB)_{ij}= \sum_{k=1}^{n} a_{ik} b_{kj}.
\end{align*}

Como $a_{ik}=0$ para $k\neq i$ (por ser $A$ diagonal) muchos de los términos en la suma desaparecen y nos quedamos con

\begin{align*}
(AB)_{ij}= a_{ii} b_{ij}
\end{align*}

y de manera similar se puede verificar que

\begin{align*}
(BA)_{ij}=a_{jj}b_{ij}.
\end{align*}

Aprovechemos estas observaciones para proponer a la inversa de $A$.

Si $a_{ii}\neq 0$ para todo $i\in \{1,\dots, n\}$ entonces podemos considerar a $B$ como la matriz diagonal con entradas $b_{ii}=\frac{1}{a_{ii}}$. Las fórmulas que acabamos de calcular nos dan que $AB=BA=I_n$ y así $A$ es invertible y su inversa $B$ es diagonal.

Conversamente, supongamos que $A$ es invertible y diagonal. Así, existe una matriz $B$ tal que $AB=BA=I_n$. Luego para toda $i\in \{1, \dots, n\}$ se cumple

\begin{align*}
1= (I_n)_{ii}= (AB)_{ii}= a_{ii}b_{ii}
\end{align*}

Así $a_{ii}\neq 0$ para $i\in \{1, \dots, n\}$ y así todas las entradas en la diagonal son distintas de cero.

$\square$

Tarea moral

  • Aunque para determinar inversos de matrices generales necesitamos desarrollar más teoría, las matrices invertibles de $2\times 2$ son fáciles de entender. Muestra que si se tiene una matriz $A$ en $M_2(F)$ con entradas $$A=\begin{pmatrix} a & b \\ c & d \end{pmatrix}$$ y $ad-bc\neq 0$, entonces la matriz $$B=\frac{1}{ad-bc} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}$$ es la inversa de $A$. Para ello verifica explícitamente usando la regla del producto que tanto $AB=I_2$, como que $BA=I_2$.
  • En el primer problema de invertir matrices, muestra que $BA$ también es $I_3$.
  • La matriz $$A=\begin{pmatrix} \frac{1}{2} & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & \sqrt{2}\end{pmatrix}$$ es invertible. Encuentra su inversa.
  • Verifica que $GL_n(F)$ es en efecto un grupo bajo la operación de multiplicación de matrices. Debes mostrar que:
    • El producto de dos matrices invertibles es invertible.
    • Existe un neutro multiplicativo $E$ (¿quién sería?).
    • Para matriz $A$ en $GL_n(F)$ existe una matriz $B$ en $GL_n(F)$ tal que $AB=BA=E$.
  • Explica por qué la matriz $O_n$ no es invertible. Explica por que si una matriz en $M_n(F)$ tiene una columna (o fila) tal que todas sus entradas sen iguales a $0$, entonces la matriz no es invertible. Este ejercicio lo puedes hacer directamente de la definición, sin tener que recurrir a herramientas más fuertes.
  • Generaliza el penúltimo problema a una matriz de tamaño $n\times n$ con puros unos sobre y por encima de la diagonal, es decir, para la cual $[a_{ij}]=1$ si $j\geq i$ y $0$ en otro caso.

Más adelante…

En esta entrada hablamos del concepto de matrices invertibles, vimos algunas de sus propiedades y esbozamos un método para encontrar la inversa de una matriz. Hay mejores métodos para encontrar dicha inversa. Uno de ellos, que es muy rápido, es el método de reducción gaussiana, que sirve para mucho más que invertir matrices. Para llegar a él, aún tenemos que desarrollar algo de teoría. Pero antes de eso, hablaremos de otros tipos particulares de matrices.

Entradas relacionadas

Álgebra Lineal I: Producto de matrices y composición de sus transformaciones

Introducción

En una entrada previa estudiamos el vínculo entre las matrices y las transformaciones lineales. Más precisamente vimos que existe una biyección entre ambos conjuntos, de manera que tener una matriz de $m\times n$ con entradas en algún campo $F$ es lo mismo que tener una transformación lineal $\varphi: F^n \to F^m$. En esta entrada, estudiaremos cómo esta correspondencia se comporta respecto a las dos operaciones ‘naturales’ en ambos: el producto de matrices y la composición de funciones.

Veremos que multiplicar matrices se corresponde con componer sus transformaciones lineales y vice versa. Esto puede explicar algunos fenómenos de la multiplicación de matrices que pueden ser extraños al principio, como la falta de conmutatividad ($AB\neq BA$) entre otros.

El producto de matrices

Sean $m,n,p$ números naturales positivos y sean $A\in M_{m,n}(F), B\in M_{n,p}(F)$ dos matrices. Es importante observar que el número de columnas de $A$ es el mismo que el de renglones de $B$. Esto es fundamental para que el producto de matrices esté definida.

Por nuestra correspondencia previa, sabemos que tanto a $A$ como a $B$ les corresponden transformaciones lineales

\begin{align*}
\varphi_{A}: F^n\to F^m \hspace{3mm} \varphi_B: F^p\to F^n
\end{align*}

Recuerda que $\varphi_A$ es la transformación que manda a $X\in F^n$ en $AX\in F^m$ y $\varphi_B$ es la transformación que manda a $Y\in F^p$ en $BY\in F^n$.

Podemos entonces preguntarnos por la composición

\begin{align*}
\varphi_A\circ \varphi_B: F^{p}\to F^m \hspace{5mm} (\varphi_A\circ \varphi_B)(X)= \varphi_A\left(\varphi_B(X)\right),
\end{align*}

la cual primero manda a un $X$ de $F^{p}$ a $BX$, y luego a este lo manda a $A(BX)$.

Como $\varphi_A$ y $\varphi_B$ son lineales, podemos verificar que la composición también lo es. Para verificar esto, si $X,Y\in F^{p}$ son arbitrarios así como $\alpha, \beta\in F$, entonces

\begin{align*}
(\varphi_A\circ \varphi_B)\left(\alpha X+\beta Y\right) &= \varphi_A\left(\varphi_B\left(\alpha X+\beta Y\right) \right)\\
&= \varphi_A\left( \alpha \varphi_B(X)+\beta \varphi_B(Y)\right)\\
&=\alpha\varphi_A\left(\varphi_B(X)\right) +\beta \varphi_A\left(\varphi_B(Y)\right)\\
&= \alpha \cdot (\varphi_A\circ \varphi_B) (X) +\beta\cdot (\varphi_A\circ \varphi_B)(Y) .
\end{align*}

Aqui la segunda igualdad se debe a que $\varphi_B$ es lineal y la tercera porque $\varphi_A$ lo es. En el resto de las igualdades estamos usando la definición de la composición.

Como $\varphi_A\circ \varphi_B$ es una transformación lineal, por el teorema de correspondencia entre matrices y transformaciones lineales, debe existir una única matriz $C\in M_{m,p}(F)$ tal que

\begin{align*}
\varphi_A\circ \varphi_B = \varphi_C.
\end{align*}

Esto motiva la siguiente (importante) definición:

Definición. El producto de dos matrices $A\in M_{m,n}(F)$ y $B\in M_{n,p}(F)$ (de nuevo, observamos que el número de renglones de $B$ y el número de columnas de $A$ deben coincidir) es la única matriz $AB\in M_{m,p}(F)$ tal que

\begin{align*}
A(B(X))=(AB)(X)
\end{align*}

Para todo $X\in F^p$.

Un truco para acordarse de la condición de compatibilidad en renglones y columnas es pensar en términos de transformaciones lineales: Sabemos que dos funciones $f$ y $g$ se pueden componer solo si el codominio de una es el dominio de la otra.

Observación. Como mencionamos previamente, podemos identificar a $F^n$ con el espacio $M_{n,1}(F)$ (esto es especialmente claro cuando escribimos un vector en columna: Tenemos $n$ renglones y una sola columna). Así, si a un vector $X\in F^n$ lo identificamos con su matriz $\widetilde{X}\in M_{n,1}(F)$ entonces podemos considerar el producto $A\widetilde{X}\in M_{m,1}(F)$, que resulta (al identificar de vuelta con $F^m$) coincide con $AX$. Es decir, pensar la aplicación $AX$ como una transformación o como un producto de matrices no afecta el resultado, aunque es recomendable (para nuestros propósitos) pensarlo como una transformación lineal.

Calculando el producto de matrices

Si bien la definición que dimos del producto tiene sentido desde una perspectiva un poco más abstracta, queremos poder calcular explícitamente el producto $AB$ sabiendo las entradas de $A$ y de $B$.

Para esto, sean $A=[a_{ij}]$ y $B=[b_{ij}]$ con tamaños como en la definición. Sea $e_1, \dots, e_p$ la base canónica de $F^p$. Entonces $(AB) e_j$ es la $j$-ésima columna de $AB$ (por una observación que hicimos aquí). Denotaremos por $C_1(A), \dots, C_n(A)$ y $C_1(B), \dots, C_p(B)$ a las columnas de $A$ y las de $B$ respectivamente. Usando la misma observación, podemos escribir

\begin{align*}
A(Be_j)&=AC_j(B)\\
&= b_{1j}C_1(A)+b_{2j}C_2(A)+\dots + b_{nj} C_n(A).
\end{align*}

Para la segunda igualdad, estamos usando la segunda parte de la observación de esta entrada. Por definición del producto, tenemos que $A(Be_j)=(AB)e_j=C_j(AB)$. Juntando esto con la igualdad anterior, tenemos

\begin{align*}
C_j(AB)= b_{1j} C_1(A)+b_{2j} C_2(A)+\dots + b_{nj} C_n(A).
\end{align*}

Estamos muy cerca de encontrar cualquier entrada $(i,j)$ del producto. Notamos que esta entrada está en la fila $i$ de $C_j(AB)$. Haciendo las operaciones entrada a entrada, obtenemos entonces que

\begin{align*}
(AB)_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j} +\dots +a_{in}b_{nj}.
\end{align*}

La discusión anterior prueba el siguiente resultado.

Teorema. (Regla del producto) Sean $A=[a_{ij}]\in M_{m,n}(F)$ y $B=[b_{ij}]\in M_{n,p}(F)$. Entonces la $(i,j)$-ésima entrada de $AB$ está dada por

\begin{align*}
(AB)_{ij}= \sum_{k=1}^{n} a_{ik} b_{kj} .
\end{align*}

Hubiéramos podido dar como definición de $AB$ a la matriz con las entradas que especifica el teorema, pero esto hubiera escondido la motivación detrás de la definición: A ojos del álgebra lineal, las matrices «son» transformaciones lineales y el producto, su composición.

Lo más importante a recuperar de lo que hemos platicado hasta ahora es que el producto $AB$ se puede pensar de cualquiera de las dos formas siguientes:

  • Como la transformación lineal que corresponde a la composición de las transformaciones de $A$ y $B$.
  • Como la matriz cuyas entradas están dadas por la regla del producto.

Ambas formas de ver al producto tienen ventajas y desventajas. Usaremos una o la otra según nos convenga.

Ejemplos de producto de matrices

Ejemplo. Si $A=\begin{pmatrix} a_{11} & a_{12}\\ a_{21} & a_{22} \end{pmatrix}$ y $B=\begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{pmatrix}$ son matrices en $M_2(F)$, entonces el producto existe y por el teorema tenemos que

\begin{align*}
AB= \begin{pmatrix}
a_{11}b_{11}+a_{12}b_{21} & a_{11} b_{12}+ a_{12}b_{22}\\
a_{21}b_{11}+a_{22}b_{21} & a_{21}b_{12} +a_{22}b_{22}
\end{pmatrix}.
\end{align*}

Observa que si $C_1$ y $C_2$ son las dos columnas de $B$, entonces las dos columnas de $AB$ son $AC_1$ y $AC_2$. Esta es una buena forma de recordar cómo hacer el producto.

$\square$

Ejemplo. Si $A=\begin{pmatrix} a_{11} & a_{12}\\ a_{21} & a_{22}\\ a_{31} & a_{32} \end{pmatrix}$ y $B=\begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{pmatrix}$ entonces el producto $AB$ es una matriz de tamaño $3\times 2$, y está dada por

\begin{align*}
AB=\begin{pmatrix} a_{11} b_{11} + a_{12} b_{21} & a_{11} b_{12}+ a_{12} b_{22}\\
a_{21} b_{11} + a_{22} b_{21} & a_{21} b_{12} + a_{22} b_{22}\\
a_{31}b_{11}+a_{32}b_{21} & a_{31} b_{12} +a_{32} b_{22}
\end{pmatrix}.
\end{align*}

$\square$

Ejemplo. Tomando en cuenta el ejemplo anterior con las matrices $A=\begin{pmatrix} 1 &2 \\ 3 & 4\\ 5& 6\end{pmatrix}$ y $B=\begin{pmatrix} 1& -1\\ 0 & 2\end{pmatrix}$ entonces

\begin{align*}
AB=\begin{pmatrix} 1 & 3\\ 3 & 5 \\ 5 &7 \end{pmatrix}.
\end{align*}

$\square$

Observa que no podemos hacer el producto $BA$, pues la cantidad de columnas de $B$ es $2$, la cantidad de filas de $A$ es $3$, y estos números no coinciden.

Ejemplo. Si $A=\begin{pmatrix} 1& 0\\ 0 & 0\end{pmatrix}$ y $B=\begin{pmatrix} 0 & 0 \\ 2& 0\end{pmatrix}$ entonces podemos calcular tanto $AB$ como $BA$ y obtenemos

\begin{align*}
AB=\begin{pmatrix} 0 & 0\\
0 & 0 \end{pmatrix}=O_2 \hspace{5mm} \text{ y } \hspace{5mm} BA=\begin{pmatrix} 0 & 0 \\ 2 & 0\end{pmatrix}.
\end{align*}

$\square$

Propiedades básicas del producto

El último ejemplo de la sección pasada refleja dos cosas importantes del producto de matrices:

  • El producto no es conmutativo. Es decir, aunque existan ambos $AB$ y $BA$, estos no tienen por qué coincidir.
  • Aunque $A$ y $B$ no sean cero, su producto si puede serlo. En el ejemplo $A$ y $B$ eran distintas de cero pero $AB=O_2$.

Definición. Dos matrices $A,B\in M_n(F)$ conmutan si $AB=BA$.

Entonces uno tiene que tener cuidado cuando realiza manipulaciones algebraicas con matrices, pues muchas propiedades a las que estamos acostumbrados en campos dejan de ser ciertas.

Ejemplo. En un campo, uno generalmente usa las reglas para desarrollar cuadrados:

\begin{align*}
(a+b)^2&=a^2+2ab+b^2, \\
(a+b)(a-b)&=a^2-b^2 .
\end{align*}

Sin embargo, trabajando con matrices estas identidades dejan de ser ciertas, y son reemplazadas por una versión menos sencilla:

\begin{align*}
(A+B)^2&= A^2+AB+BA+B^2,
\\(A+B)(A-B)&=A^2-AB+BA-B^2.
\end{align*}

Estas coinciden con las correspondientes en el campo solo si $A$ y $B$ conmutan.

$\square$

Sin embargo, hay buenas noticias. Aparte de la conmutatividad, muchas otras propiedades algebraicas deseables se preservan, y las resumimos en la siguiente proposición:

Proposición. La multiplicación de matrices satisface las siguientes:

  1. Asociatividad: Se cumple que $(AB)C=A(BC)$ para cualesquiera matrices $A\in M_{m,n}(F), B\in M_{n,p}(F), C\in M_{p,q}(F)$.
  2. Compatibilidad con el producto por escalares: Se cumple que $\alpha(AB)=(\alpha A)B= A(\alpha B)$ para cualesquiera $\alpha \in F, A\in M_{m,n}(F), B\in M_{n,p}(F)$.
  3. Distributividad con respecto a la suma: Se cumplen

\begin{align*}
(A+B)C&=AC+BC\\
D(A+B)&= DA+DB
\end{align*}

para cualesquiera $A,B\in M_{m,n}(F)$, $C\in M_{n,p}(F)$ y $D\in M_{p,m}(F).$

Demostración: La demostración de estas propiedades se sigue directamente de la definición, o bien haciendo los cálculos a través de la regla del producto. Probaremos la asociatividad usando la definición, para mostrar las ventajas que tiene pensar al producto como la matriz correspondiente a la composición. Tras ver la demostración, piensa en lo tedioso que sería hacer la prueba usando la regla del producto.

Para verificar la asociatividad, basta ver que las transformaciones lineales de $(AB)C$ y $A(BC)$ son iguales (vimos en ésta entrada que si dos matrices tienen la misma transformación asociada, entonces son iguales). Es decir, que para todo $X\in F^q$ se cumple que

\begin{align*}
((AB)C)X=(A(BC))X.
\end{align*}

Por definición del producto, tenemos que

\begin{align*}
((AB)C)X= (AB)(CX)= A(B(C(X)),
\end{align*}

y desarrollando análogamente $A(BC)X$ tenemos

\begin{align*}
A(BC)X= A((BC)X)= A(B(C(X)).
\end{align*}

Comparando ambas expresiones se sigue el resultado. Como mencionamos, esto se pudo haber probado usando la regla del producto, comparando la $(i,j)$-ésima entrada de $(AB)C$ y la de $A(BC)$, verificando que ambas son iguales a

\begin{align*}
\sum_{k,l} a_{ik}b_{kl} c_{lj}.
\end{align*}

$\square$

Observación. Gracias a la asociatividad del producto, podemos escribir $ABC$ en lugar de $(AB)C$ o de $A(BC)$, aligerando la notación. Esto es más útil con más factores, por ejemplo el poder escribir $ABCD$ en lugar de $(A(BC))D$ o $A(B(CD))$. Así mismo, tampoco tenemos ambigüedad al definir el producto de cualquier número de matrices. Usaremos la notación

\begin{align*}
A^n= A\cdot A\cdot \ddots \cdot A,
\end{align*}

donde el lado derecho tiene $n$ factores. Esta es la $n$-ésima potencia de una matriz cuadrada $A$. Por construcción

\begin{align*}
A^n= A\cdot A^{n-1}.
\end{align*}

Y tomaremos como convención que $A^0=I_n$ para cualquier $A\in M_n(F)$. Dejamos como tarea moral el verificar que $I_n$ actúa como un neutro para la multiplicación, es decir que para cualquier matriz $A$ de tamaño $m\times n$ se tiene

\begin{align*}
A\cdot I_n=A \hspace{2mm} \text{ y } \hspace{2mm} I_m \cdot A=A.
\end{align*}

Acabamos esta sección con un problema para practicar los conceptos vistos.

Problema. Sea $A(x)\in M_3(\mathbb{R})$ la matriz definida por

\begin{align*}
A(x)=\begin{pmatrix} 1 & x& x^2\\ 0 & 1 & 2x\\ 0 & 0 & 1\end{pmatrix}.
\end{align*}

Demuestra que $A(x_1)A(x_2)=A(x_1+x_2)$ para cualesquiera $x_1,x_2\in \mathbb{R}$.

Solución. En este problema es más conveniente usar la regla del producto, que pensar a la composición de transformaciones. En todo problema es recomendable pensar en cuál de las formas del producto conviene más usar.

Usando la regla del producto, tenemos que

\begin{align*}
A(x_1)A(x_2)&= \begin{pmatrix} 1 & x_1 & x_1^2\\ 0 & 1 & 2x_1\\ 0 & 0 & 1 \end{pmatrix}\begin{pmatrix} 1 & x_2 & x_2^2\\ 0 & 1 & 2x_2\\ 0 & 0 & 1 \end{pmatrix}\\
&=\begin{pmatrix} 1 & x_2+x_1 & x_2^2+2x_1 x_2+x_1^2\\
0 & 1 & 2x_2+2x_1\\
0 & 0 & 1\end{pmatrix} \\
&= \begin{pmatrix} 1 & x_1+x_2 & (x_1+x_2)^2\\
0 & 1 & 2(x_1+x_2)\\
0 & 0 & 1 \end{pmatrix}.
\end{align*}

Y el lado derecho es simplemente $A(x_1+x_2)$.

$\square$

Tarea moral

  • Realiza la operación $$\begin{pmatrix}2 & 1 & 0 \\ 1 & 2 & 0 \\ 0 & -1 & 0\end{pmatrix}^4.$$
  • Toma al vector canónico $e_i$ de $F^n$ pensado como matriz en $M_{1n}(F)$ y al vector canónico $e_j$ de $F^n$ pensado como matriz en $M_{n1}(F)$. ¿Quién es el producto de matrices $e_ie_j$? ¿Quién es el producto de matrices $e_je_i$?
  • Verifica las propiedades de compatibilidad con el producto por escalares y distributividad con respecto a la suma del producto de matrices.
  • Verifica que las matrices identidad actúan como neutro para la multiplicación de matrices.
  • Recuerda (o investiga) los axiomas de un anillo con unidad y verifica que las matrices cuadradas de tamaño $n$ forman un anillo con unidad para cualquier $n$.

Más adelante…

Si bien en esta entrada definimos el producto de matrices y estudiamos su relación con la composición de matrices, esto no es más que el primer paso de un estudio más grande: Ahora nos podemos hacer preguntas sobre transformaciones lineales (por ejemplo, ¿será biyectiva o invertible?) y estudiarlas en términos de matrices y su producto. Más adelante en el curso entrará el concepto de determinante que jugará un papel fundamental para responder muchas de estas preguntas.

Entradas relacionadas