Álgebra Lineal I: Matrices como transformaciones lineales

Por Julio Sampietro

Introducción

En la entrada pasada introdujimos el concepto de vector en Fn y el concepto de matriz en Mm,n(F). También definimos las operaciones básicas de suma y producto escalar. En esta entrada exploraremos la relación que existe entre estos. Más precisamente, veremos cómo una matriz define una función que manda vectores en vectores, y cómo algunas de estas funciones (que resultarán ser las transformaciones lineales) nos dan una matriz. Más adelante hablaremos de espacios vectoriales en general y de transformaciones lineales entre ellos. Pero es muy importante entender estos conceptos primero en una situación concreta.

Procederemos construyendo primero la transformación asociada a una matriz. Luego, verificaremos algunas propiedades de la construcción realizada. Finalmente, veremos que hay una biyección entre matrices y transformaciones lineales.

Construir una transformación a partir de una matriz

Comencemos con un campo F y una matriz AMm,n(F) con entradas aij, es decir

A=(a11a12a1na21a22a2nam1am2amn)

A un vector X=(x1x2xn)Fn le podemos asociar un nuevo vector que denotaremos (de manera sugestiva) AXFm (observa el cambio de superíndice) y definimos como AX=(a11x1+a12x2++a1nxna21x1+a22x2++a2nx2am1x1+am2x2++amnxn).

Así, obtenemos una función de Fn a Fm que manda a cada vector X de Fn en el vector AX de Fm.

Ejemplo. A la matriz A=(101012340001)M3,4(R) le asociamos entonces la función f:R4R3 definida por f((xyzw))=A(xyzw)=(x+zx+2y+3z+4ww).

Observación. Si denotamos por e1,,en a la base canónica de Fn y AMm,n(F) tiene entradas aij entonces

Aei=(a110++a1i1++a1n0a210++a2i1++a2n0an10++ani1++ann0)=(a1ia2iami)=Ci.

Dónde, recordamos, Ci es la i-ésima columna de A. Más generalmente, si X=(x1x2xn)Fn es cualquier vector, entonces AX=x1C1++xnCn.

Las sutilezas de esta asignación matriz-transformación se resumen en el siguiente resultado:

Teorema: Para cualesquiera matrices A,BMm,n(F), cualesquiera vectores X,YFn cualesquiera escalares α,βF se cumple:

  1. A(αX+βY)=αAX+βAY
  2. (αA+βB)X=αAX+βBX
  3. Si AX=BX para toda XFn, entonces A=B.

Demostración: Escribimos A=[aij],B=[bij] y X=(x1x2xn) y Y=(y1y2yn). Así αA+βB=[αaij+βbij] y αX+βY=(αx1+βy1αx2+βy2αxn+βyn)

  1. Por definición, la i-ésima coordenada de A(αX+βY) es j=1naij(αxj+βyj)=αj=1naijxj+βj=1naijyj. Aquí estamos las propiedades distributivas en F. El lado derecho de la ecuación corresponde a la i-ésima coordenada de αAX+βAY, lo que prueba el resultado.
  2. El argumento es esencialmente el mismo, el cálculo esta vez se reduce a la igualdad j=1n(αaij+βbij)xj=αj=1naijxj+βj=1nbijxj. Esta sabemos es verdadera por las propiedades distributivas en F.
  3. Por hipótesis, tenemos Aei=Bei dónde ei denota el i-ésimo elemento de la base canónica de Fn. Por la observación anterior, esto implica que la i-ésima columna de A es igual a la i-ésima columna de B, para todo i. Luego A y B son iguales.

◻

Observa que en las demostraciones (1) y (2) anteriores estamos usando las propiedades del campo F para poder distribuir la suma y producto. A grandes rasgos, lo importante que estamos haciendo es ver que, gracias a que todo sucede entrada a entrada, entonces la distributividad también sucede para matrices y vectores.

La asignación que a cada matriz le asocia una función

La última condición del teorema nos dice que la asignación que manda a cada matriz A a su función φA=XAX (en símbolos, la asignación AφA) es inyectiva: si a dos matrices le asociamos la misma función, es porque eran la misma matriz para empezar. Esta asignación tiene como dominio el conjunto de matrices Mm,n(F) y como codominio el conjunto de funciones φ:FnFm que (por las parte (1) del último teorema) cumplen φ(αX+βY)=αφ(X)+βφ(Y) para cualesquiera α,βF y X,YFn.

A una función (o bien «transformación») φ:FnFm que cumple esta última condición se le llama lineal. Observamos que cualquier transformación lineal satisface φ(0)=0, ya que si en la condición ponemos α=β=0 tenemos que φ(0)=φ(0X+0Y)=0φ(X)+0φ(Y)=0. En otras áreas de las matemáticas el término «lineal» denota otro tipo de transformaciones, por ejemplo las de la forma ψ(X)=aX+b, que nosotros llamaremos afines. Más que «función lineal» usaremos el término transformación lineal.

El siguiente teorema nos dice que la asignación AφA discutida arriba no es sólo inyectiva, si no también suprayectiva. Es decir, cualquier transformación lineal φ:FnFm es la función asociada de alguna matriz AMm,n(F).

Teorema: Sea φ:FnFm una transformación lineal. Existe una única matriz AMm,n(F) tal que φ(X)=AX para toda XFn.

Demostración: La unicidad fue establecida en el último inciso del teorema anterior, basta con verificar existencia. Sea φ:FnFm lineal, y sea e1,,en la base canónica para Fn. Construimos la matriz A tal que la i-ésima columna Ci es el vector φ(ei)Fm. Así, por una observación previa, tenemos que Aei=Ci=φ(ei) para cualquier 1in.

Si X=[x1x2xn]Fn es cualquier vector, entonces X=x1e1+x2e2++xnen. Como φ es lineal, entonces

φ(X)=φ(x1e1+x2e2++xnen)=x1φ(e1)+x2φ(e2)++xnφ(en)=x1C1+x2C2++xnCn=AX.

La última igualdad es de nuevo una consecuencia de la observación que hicimos. Luego φ(X)=AX para toda XFn y queda así probado el teorema.

◻

Tenemos entonces una biyección entre matrices en Mm,n(F) y transformaciones lineales φ:FnFm. En símbolos Mm,n(F){φ:FnFmφ es lineal }.

Ejemplo. Ya vimos cómo obtener la transformación lineal asociada a una matriz, ahora queremos hacer el proceso inverso. Por ejemplo, si tenemos el mapeo f:R4R3 dado por f:(x,y,z,w)(x+yz,3zw,z+2y), entonces ¿cuál es la matriz A tal que f(X)=AX?

De acuerdo con nuestra demostración del teorema, las columnas de A corresponden a las imágenes f(ei). Hacemos entonces el cálculo directo:

  • f(e1)=f(1,0,0,0)=(1,0,0)
  • f(e2)=f(0,1,0,0)=(1,0,2)
  • f(e3)=f(0,0,1,0)=(1,3,1)
  • f(e4)=f(0,0,0,1)=(0,1,0)

Así A=(111000310210) En realidad, pudimos habernos saltado el cálculo y solo fijarnos en los coeficientes de cada coordenada: La primer coordenada de f(x,y,z,w) no es más que x+yz=1x+1y+(1)z+0w, acomodando estos coeficientes [1 1 1 0] en las columnas correspondientes nos da el primer renglón de A. De manera análoga, con la segunda coordenada recuperamos el segundo renglón y con la tercer coordenada el tercero, y así recuperamos A.

Más adelante…

La conclusión principal de esta entrada es que para entender transformaciones lineales basta con entender las matrices con entradas en el campo. Este fenómeno será muy recurrente en el álgebra lineal, y muchos problemas de transformaciones lineales se traducen en problemas de matrices y vice-versa. ¡A veces la traducción es tan inmediata que incluso se omite!

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra la matriz de la transformación lineal que manda al vector (x,y,z) de R3 al vector (x+y+z,xy+z,x+3y,2yz,8x+z) de R5.
  • Considera la matriz A=(111111111222). Si la pensamos como transformación lineal, ¿de dónde a dónde va? ¿cómo se escribe de manera explícita AX en términos de las coordenadas del vector X al que se le aplica?
  • Sea A la matriz del punto anterior. Sean X=(1,2,3) y Y=(3,1,4). Encuentra AX y AY. Realiza la suma AX+AY. Luego, por separado, realiza primero la suma X+Y y usando esto encuentra el valor de A(X+Y). Verifica en en efecto ambos procesos te dan el mismo resultado.
  • Explica por qué no es posible encontrar una matriz que represente a la función que manda al vector (x,y,z,w) de R4 al vector (x+y+z+w,xy+yz+zw+wx) de R2.
  • ¿Cuál es la matriz que representa a la transformación lineal que manda al vector (x1,x2,,xn) de Fn al vector (x2,x3,,xn,x1), también de Fn?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

10 comentarios en “Álgebra Lineal I: Matrices como transformaciones lineales

  1. Ivan Ortiz

    Hola! Buenos días, en la parte de la observación hay un error. Dado que la matriz A tiene m renglones y n columnas, entonces el producto A*e_i debe tener m renglones y 1 columna y no n renglones. Saludos!

    Responder
  2. Ivan Ortiz

    Otro comentario, jiji.
    En la parte donde mencionan que toda transformación lineal satisface que phi(0) = 0. En el punto donde lo muestran, me parece que hay una confusión, dado que lo que hay que mostrar no es phi(0) = phi(0*X +0*Y) sino en todo caso, phi(0) = phi(alpha*0 + beta*0). Aunque esto igual puede ser confusión mía.

    Responder
    1. Julio Sampietro Autor

      Dado que 0*X=0 para cualquier vector X, en particular se cumple que 0=0*X+0*Y para cualesquiera dos vectores. Luego phi(0)= phi(0*X+0*Y)= 0*phi(X)+0*phi(Y) pero nuevamente al multiplicar por cero un vector obtenemos cero, luego este último número es cero. Espero que esto aclare la duda.

      Responder
  3. Kevin Calderon Vazquez

    Hola ! Buena tarde , detecte un pequeño error de notación que hasta ahorita me di cuenta , en el primer apartado de esta entrada donde se muestra la multiplicación explicita : AX , en la segunda fila de la matriz en el ultimo sumando en vez de x_{2} , ¿Debería de ser x_{n} , no?

    Saludos.

    Responder
  4. David Gordillo Alaniz

    Hola, en la parte de Observación hay un error. En la notación explícita de la matriz A, todos los subíndices tienen «n», lo que la haría una matriz M_n(F), siendo que debería ser una matriz M_m,n(F). El vector resultante, que corresponde a C_i sí está correcto ya que tiene m renglones.

    Saludos.

    Responder
  5. Elva Ginón

    Hola, muy buenas semens tenga profesao, soy Santi gimenez, jugador del Cruz Azul, adoro a Arigameplays y las mates, sos imbecil viva el Madrid siu

    Responder

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.