Introducción
En la entrada anterior definimos a un vector y a una matriz de una función lineal, podemos proceder a definir su producto. En esta entrada primero veremos cómo se realiza el producto de una matriz con un vector. Después trataremos la fuerte relación entre la composición de funciones y el producto de matrices. Con dicha relación, por último definiremos el producto de matrices cualesquiera.
Producto de una matriz con un vector
Si tenemos un matriz $A$ de $m\times n$, sabemos que una forma de ver a nuestra matriz es como un conjunto ordenado de $n$ vectores en $\mathbb{R}^n$ y entonces se escribe $A=(u_1, u_2, \cdots, u_n)$, con $u_{i} \in \mathbb{R}^n$, donde $i=1,2,\cdots,n$. También sabemos que cada vector al que haremos referencia tiene la notación $x=(x_1, x_2, \cdots, x_n )^T$.
Vamos a definir con estos conceptos al producto de una matriz $A$ por un vector $x$:
Definición. El producto de una matriz $A$ de dimensión $m\times n$ de la forma
\begin{equation*}
A = (u_1,u_2, \cdots, u_n),
\end{equation*}
por un vector de la forma
\[ x=(x_1, x_2, \cdots, x_n )^T = \left(\begin{array}{c}
x_1\\
x_2\\
\vdots\\
x_n
\end{array} \right);\]
se define por
\[ Ax = (u_1, u_2, \cdots, u_n )\left(\begin{array}{c}
x_1\\
x_2\\
\vdots\\
x_n
\end{array} \right) = x_1 u_1 + x_2 u_2 + \cdots + x_n u_n. \]
Veamos un ejemplo que nos apoye con la definición:
Ejemplo. Sean la matriz $A$ y el vector $x$ como sigue
\[ A = \left(\begin{array}{ccc}
4&7&-1\\
2&-3&1\\
5&4&-2
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} x=(x,y,z)^T , \]
entonces el producto de la matriz $A$ con el vector $x$ será:
\[ Ax = \left(\begin{array}{ccc}
4&7&-1\\
2&-3&1\\
5&4&-2
\end{array} \right) \left(\begin{array}{c}
x\\
y\\
z
\end{array} \right) = x \left(\begin{array}{c}
4\\
2\\
5
\end{array} \right) + y \left(\begin{array}{c}
7\\
-3\\
4
\end{array} \right) + z \left(\begin{array}{c}
-1\\
1\\
-2
\end{array} \right) = \left(\begin{array}{c}
4x+7y-z\\
2x-3y+z\\
5x+4y-2z
\end{array} \right).\]
Ahora, para comprender mejor la definición del producto de matrices, que es el tema principal de esta entrada; es mejor hablar de su origen, el cual proviene de los sistemas lineales. Arthur Cayley (1821-1895) fue un matemático británico que analizaba los sistemas con dos ecuaciones y dos incógnitas:
\begin{align*}
ax + by &= x’ \\
cx + dy &= y’
\end{align*}
como transformación del plano donde a cada punto $(x,y)$ le corresponde el punto $(x’,y’)$.
A la función de $\mathbb{R}^2$ en $\mathbb{R}^2$ donde
\[ p(x) = \left(\begin{array}{c}
ax + by\\
cx + dy
\end{array} \right), \]
se le asocia la matriz
\[ \left(\begin{array}{cc}
a & b\\
c & d
\end{array} \right), \]
que es quien transforma el plano, moviendo cada punto $(x,y)$ a la posición $(x’,y’)$.
Ahora vamos a considerar otra matriz
\[ \left(\begin{array}{cc}
e & f\\
g & h
\end{array} \right), \]
quien también transformará al plano, pero el punto $(x’,y’)$ se moverá a la posición $(x´´,y´´)$ mediante el sistema:
\begin{align*}
ex’ + fy’ &= x´´ \\
gx’ + hy’ &= y´´.
\end{align*}
Si lo que deseamos es que las dos transformaciones se ejecuten una detrás de la otra, es decir, que el punto $(x,y)$ vaya a la posición $(x´´,y´´)$; entonces para la primera ecuación se tendrá:
\begin{align*}
x´´ &= ex’ + fy’\\
&= e(ax+by) + f(cx+dy)\\
&= (ae+cf)x +(be+df)y,
\end{align*}
y para la segunda ecuación tenemos:
\begin{align*}
y´´ &= gx’ + hy’\\
&= g(ax+by) + h(cx+dy)\\
&= (ag+ch)x +(bg+dh)y.
\end{align*}
En consecuencia, la composición de las dos transformaciones tiene por sistema a:
\begin{align*}
(ae+cf)x +(be+df)y &= x´´\\
(ag+ch)x +(bg+dh)y &= y´´.
\end{align*}
De hecho las definiciones de Cayley se generalizaron a cualquier dimensión. Con esta motivación vamos a definir el producto de matrices.
Multiplicación de matrices
Definición. Sean $f: \mathbb{R}^n \longrightarrow \mathbb{R}^m$ y $g: \mathbb{R}^m \longrightarrow \mathbb{R}^k$ dos funciones lineales, la composición $g \circ f: \mathbb{R}^n \longrightarrow \mathbb{R}^k$ también será lineal. Sean las matrices $A$ de tamaño $m\times n$ y $B$ de tamaño $k\times m$ que corresponden a $f$ y a $g$ respectivamente. Definimos al producto de matrices $BA$ como la matriz $k\times n$ que corresponde a la función lineal $g \circ f$.
Entonces $BA$ es la única matriz de $k\times n$ que cumple:
\begin{equation*}
(g\circ f)(x) = (BA) x, \hspace{0.25cm} \text{para todo} \hspace{0.25cm} x \in \mathbb{R}^n .
\end{equation*}
Para comprender la definición, recordemos que la matriz $A$ con tamaño $m\times n$ está asociada a la función lineal $f: \mathbb{R}^n \longrightarrow \mathbb{R}^m$ y la matriz $B$ con tamaño $k\times m$ está asociada a la función lineal $g: \mathbb{R}^m \longrightarrow \mathbb{R}^k$. La conversión se da por la convención existente en el orden en que se realiza la composición de funciones (hacia atrás).
La definición no nos indica cómo realizar la multiplicación de matrices, para lo cual conviene que recordemos primeramente que las columnas de una matriz son las imágenes de la base canónica bajo la función asociada. Entonces si $A=(u_1, u_2, \cdots, u_n )$ donde $u_i = f(e_i ) \in \mathbb{R}^m$, entonces $(g \circ f)(e_i) =g(f(e_i)) = g(u_i) = Bu_i$. Por tanto
\begin{equation*}
BA = B (u_1,u_2, \cdots, u_n) = (Bu_1, Bu_2, \cdots, Bu_n).
\end{equation*}
Ahora, para obtener las columnas de la nueva matriz, usaremos la multiplicación de $B$ por los vectores columna de $A$, que es la multiplicación que ya definimos en la primer parte de esta entrada.
Expresaremos cada una de las entradas de la matriz $BA$, pero nos conviene ver a la matriz $B$ como una columna de vectores renglón, obteniendo
\[ BA = \left(\begin{array}{c}
w_{1}^{T}\\
w_{2}^{T}\\
\vdots\\
w_{k}^{T}
\end{array} \right) \left(\begin{array}{c}
u_1, u_2, \cdots, u_n
\end{array} \right) = \left(\begin{array}{cccc}
w_1 \cdot u_1 & w_1 \cdot u_2 & \cdots & w_1 \cdot u_n\\
w_2 \cdot u_1 & w_2 \cdot u_2 & \cdots & w_2 \cdot u_n\\
\vdots& \vdots & \ddots &\vdots\\
w_k \cdot u_1 & w_k \cdot u_2 & \cdots & w_k \cdot u_n
\end{array} \right), \]
Con esta fórmula podemos ver porqué es importante que el número de filas de $B$ (los transpuestos de los vectores $w_i$) debe ser el mismo número de columnas de $A$ (los vectores $u_j$) y comprender la mecánica para obtener las entradas de una matriz $k \times n$ a partir de una matriz $B$ con tamaño $k \times m$ y una matriz $A$ con tamaño $m \times n$.
Ejemplo. Sean
\[ B = \left(\begin{array}{ccc}
2&-1&0\\
1&3&1
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} A= \left(\begin{array}{cccc}
1&0&2&4\\
-1&-2&1&0\\
3&5&6&1
\end{array} \right), \]
El producto $BA$ está bien definido porque $B$ es de tamaño $3\times 4$ y $A$ es de tamaño $2\times 3$, por tanto $BA$ es una matriz de $2\times 4$. Las filas de $B$ serán $w_1$ y $w_2$ y las columnas de $A$ serán $u_1, u_2, u_3$ y $u_4$, es decir:
Por tanto, $BA$ es la matriz:
\[ BA = \left(\begin{array}{cccc}
3&2&3&8\\
1&-1&11&5
\end{array} \right). \]
Ejemplo. Tomemos las matrices $A$ y $B$ del ejemplo anterior, observemos que no podemos realizar el producto $AB$, ya que el número de columnas de $B$ es $4$ y el número de filas de $A$ es $2$ y éstos números no coinciden.
En conclusión, el producto de matrices no es conmutativo, de hecho, aunque existan ambos $AB$ y $BA$, éstos no tienen porqué coincidir.
Ejemplo. Sean \[ A = \left(\begin{array}{cc}
7&0\\
-1&0
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} B= \left(\begin{array}{cc}
0&2\\
0&-5
\end{array} \right), \]
podemos calcular $AB$ y $BA$, obtenemos
\[ AB = \left(\begin{array}{cc}
0&14\\
0&-2
\end{array} \right), \hspace{0.5cm} y \hspace{0.5cm} BA= \left(\begin{array}{cc}
-2&0\\
5&0
\end{array} \right), \]
y vemos que $AB \neq BA.$
Tarea moral
- Aunque $A$ y $B$ no sean las matrices cero (cuyas entradas son todas cero), su producto sí puede serlo. Den un ejemplo de 2 matrices tales que $AB=0$, pero $A\neq 0$ y $B \neq 0$, donde $0$ es la matriz cero.
- Demuestra que si $A, B, C$ son matrices $2\times 2$, entonces $A(B+C) = AB +AC$ y $(A+B)C= AC +BC$.
- Demuestra que si $A,B, C$ son matrices de $3\times 3$, entonces $A(BC) = (AB)C$, es decir que el producto de matrices es asociativo. Por tanto, podemos escribir al producto simplemente como $ABC$.
- Sean
\[ A = \left(\begin{array}{ccc}
3&-1&4\\
2&5&-2\\
1&3&2
\end{array} \right), \hspace{0.5cm} B= \left(\begin{array}{cc}
1&3\\
-1&4\\
5&2
\end{array} \right), \hspace{0.5cm} C= \left(\begin{array}{cccc}
1&3&-1&2\\
-2&4&1&5\\
5&2&-3&1
\end{array} \right), \]
Realizar el producto de matrices $AB, BC, AC$ y justificar en caso de que no pueda efectuarse alguno de los productos.
Más adelante
En la primera parte de la unidad 3 vimos distintos tipos de transformación de funciones. Para la segunda parte definimos matrices de tamaño $m\times n$, matrices asociadas a funciones lineales y en esta entrada vimos la operación del producto de matrices.
A continuación vamos a ver algunas de las familias de matrices más representativas que están asociadas a funciones. Nos serán familiares dichas funciones porque las trabajamos en la primera parte de esta Unidad 3.
Enlaces relacionados
- Página principal del curso:
- Entrada anterior del curso:
- Siguiente entrada del curso: