Álgebra Lineal I: Rango de transformaciones lineales y matrices

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores hablamos de transformaciones lineales, cómo actúan en conjuntos especiales de vectores y de cómo se pueden representar con matrices. Hablamos también de cómo cambiar de una base a otra y cómo usar esto para entender transformaciones en varias bases. Estamos listos para introducir un concepto fundamental de álgebra lineal, el de rango de una transformación lineal y de una matriz.

Antes de entrar en las definiciones formales, vale la pena hablar un poco de rango de manera intuitiva. Supongamos que V es un espacio vectorial de dimensión n y que W es un espacio vectorial sobre el mismo campo que V. Una transformación lineal T:VW puede «guardar mucha independencia lineal» o «muy poquita». Si T es inyectiva, ya vimos antes que T manda linealmente independientes a linealmente independientes. Si T es la transformación 0, entonces se «pierde toda la independencia».

El rango mide algo intermedio entre estos dos extremos. Mientras mayor sea el rango, más independencia lineal se preserva y viceversa. Si mantienes esta intuición en mente, varias de las proposiciones te resultarán más naturales.

Otro buen ejemplo para tener en mente es tomar una transformación lineal T:R3R3. Si es la transformación identidad, la base canónica se preserva. Si es la proyección al plano xy, entonces «perdemos» al vector (0,0,1), pues se va al (0,0,0). Si es la proyección al eje x, «perdemos» al (0,1,0) y al (0,0,1) pues ambos se van a (0,0,0). Y si es la transformación 0, perdemos a todos. El rango precisamente va a medir esto, y para estos ejemplos tendremos rango 3, 2, 1 y 0 respectivamente.

Rango para transformaciones lineales

Como en otras ocasiones, cuando hablemos de transformaciones lineales entre espacios vectoriales, serán sobre un mismo campo F.

Definición. Sean V y W espacios de dimensión finita. El rango de una transformación lineal T:VW es la dimensión de la imagen de T, es decir, rank(T)=dimImT.

Si B es una base de V, entonces genera a V. La transformación T es suprayectiva de V a ImT, de modo que T(B) es generador de ImT. De esta forma, para encontrar el rango de una transformación lineal T:VW basta:

  • Tomar una base B de V.
  • Aplicar T a cada elemento de B.
  • Determinar un conjunto linealmente independiente máximo en T(B).

Para hacer este último paso, podemos poner a los vectores coordenada de T(B) con respecto a una base de W como los vectores fila de una matriz A y usar reducción gaussiana. Las operaciones elementales no cambian el espacio generado por las filas, así que el rango de T es el número de vectores fila no cero en la forma escalonada reducida Ared de A.

Ejemplo. Encuentra el rango de la transformación lineal T:R3M2(R) que manda (x,y,z) a (x+yz2x2y2zx+zy).

Solución. Tomemos e1,e2,e3 la base canónica de R3. Tenemos que T(e1)=(1201), T(e2)=(1021) y T(e3)=(1021).

Tomando la base canónica E11,E12,E21,E22 de M2(R), podemos entonces poner a las coordenadas de T(e1),T(e2),T(e2) como vectores fila de una matriz (120110211021). Sumando la segunda fila a la tercera, y después restando la primera a la segunda,obtenemos la matriz (120102220000). De aquí, sin necesidad de terminar la reducción gaussiana, podemos ver que habrá exactamente dos filas no cero. De este modo, el rango de la transformación es 2.

Propiedades del rango

Demostremos ahora algunas propiedades teóricas importantes acerca del rango de una transfromación lineal.

Proposición. Sean U, V y W espacios de dimensión finita. Sean S:UV, T:VW, T:VW transformaciones lineales. Entonces:

  1. rank(T)dimV
  2. rank(T)dimW
  3. rank(TS)rank(T)
  4. rank(TS)rank(S)
  5. rank(T+T)rank(T)+rank(T)

Demostración. (1) Pensemos a T como una transformación T:VIm(T). Haciendo esto, T resulta ser suprayectiva, y por un resultado anterior tenemos que dimVdimImT=rank(T).

(2) Sabemos que Im(T) es un subespacio de W, así que rank(T)=dimImTdimW.

(3) La imagen de T contiene a la imagen de TS, pues cada vector de la forma T(S(v)) es de la forma T(w) (para w=S(v)). Así, rank(T)=dimImTdimImTS=rank(TS).

(4) La función TS coincide con la restricción TImS de T a ImS. Por el inciso (1), rank(TImS)dimImS=rank(S), así que rank(TS)rank(S).

(5) Tenemos que Im(T+T)ImT+ImT. Además, por un corolario de la fórmula de Grassman, sabemos que
dim(ImT+ImT)dimImT+dimImT=rank(T)+rank(T).

Así,
rank(T+T)rank(ImT+ImT)rank(T)+rank(T).

◻

Proposición. Sean R:UV, T:VW y S:WZ transformaciones lineales con R suprayectiva y S inyectiva. Entonces rank(STR)=rank(T).

Dicho de otra forma «composición por la izquierda con transformaciones inyectivas no cambia el rango» y «composición por la derecha con transformaciones suprayectivas no cambia el rango». Un corolario es «composición con transformaciones invertibles no cambia el rango».

Demostración. De la proposición anterior, tenemos que rank(ST)rank(T). La restricción SImT de S a la imagen de T es una transformación lineal de ImT a Im(ST) que es inyectiva, de modo que dimImTdimIm(ST), que es justo rank(T)rank(ST), de modo que tenemos la igualdad rank(ST)=rank(T).

Como R es suprayectiva, ImR=V, de modo que Im(STR)=Im(ST). Así, rank(STR)=rank(ST)=rank(T).

◻

Teorema de rango-nulidad

Una transformación lineal T:VW determina automáticamente dos subespacios de manera natural: el kernel kerT y la imagen ImT. Resulta que las dimensiones de kerT, de ImT y de V están fuertemente relacionadas entre sí.

Teorema. Sean V y W espacios de dimensión finita. Sea T:VW una transformación lineal. Entonces dimkerT+rank(T)=dimV.

Demostración. Supongamos que dimV=n y dimkerT=k. Queremos mostrar que rank(T)=nk. Para ello, tomemos una base B de kerT y tomemos B={v1,,vnk} tal que BB sea base de V. Basta mostrar que T(B)={T(v1),,T(vnk)}ImT es base de ImT. Sea U el generado por B, de modo que V=UkerT.

Veamos que T(B) es generador de ImT. Tomemos T(v) en ImT. Podemos escribir v=z+u con zkerT y uU. Así, T(v)=T(z)+T(u)=T(u), y este último está en el generado por T(B).

Ahora veamos que T(B) es linealmente independiente. Si α1T(v1)++αnkT(vnk)=0, entonces T(α1v1++αnkvnk)=0, de modo que α1v1++αnkvnk está en U y en kerT, pero la intersección de estos espacios es {0}. Como esta combinación lineal es 0 y B es linealmente independiente, α1==αn=0.

De esta forma, T(B) es linealmente independiente y genera a ImT, de modo que rank(T)=|B|=nk.

◻

Ejemplo. Consideremos de nuevo la transformación lineal T:R3M2(R) que manda (x,y,z) a (x+yz2x2y2zx+zy). Muestra que T no es inyectiva.

Solución. Ya determinamos previamente que esta transformación tiene rango 2. Por el teorema de rango-nulidad, su kernel tiene dimensión 1. Así, hay un vector v(0,0,0) en el kernel, para el cual T(v)=0=T(0), de modo que T no es inyectiva.

◻

Problema. Demuestra que para cualquier entero n existe una terna (a,b,c)(0,0,0) con a+b+c=0 y tal que 01at2n+btn+cdt=0.

Solución. Podríamos hacer la integral y plantear dos ecuaciones lineales. Sin embargo, daremos argumentos dimensionales para evitar la integral. Consideremos las transformaciones lineales T:R3R y S:R3R dadas por
T(x,y,z)=01xt2n+ytn+zdtS(x,y,z)=x+y+z.
Notemos que T(0,0,1)=011dt=1=S(0,0,1), de modo que ni T ni S son la transformación 0. Como su rango puede ser a lo más dimR=1, entonces su rango es 1. Por el teorema de rango-nulidad, dimkerS=dimkerT=2. Como ambos son subespacios de R3, es imposible que kerSkerT={0}, de modo que existe (a,b,c) no cero tal que T(a,b,c)=S(a,b,c)=0. Esto es justo lo que buscábamos.

◻

Rango para matrices

Definición. El rango de una matriz A en Mm,n(F) es el rango de la transformación lineal asociada de Fn a Fm dada por XAX. Lo denotamos por rank(A).

A partir de esta definición y de las propiedades de rango para transformaciones lineales obtenemos directamente las siguientes propiedades para rango de matrices.

Proposición. Sean m, n y p enteros. Sea B una matriz en Mn,p(F) y A, A matrices en Mm,n(F). Sea P una matriz en Mn,p(F) cuya transformación lineal asociada es suprayectiva y Q una matriz en Mr,m(F) cuya transformación lineal asociada es inyectiva. Entonces:

  1. rank(A)min(m,n)
  2. rank(AB)min(rank(A),rank(B))
  3. rank(A+A)rank(A)+rank(A)
  4. rank(QAP)=rank(A)

Como discutimos anteriormente, el rango de una transformación se puede obtener aplicando la transformación a una base y viendo cuál es el máximo subconjunto de imágenes de elementos de la base que sea linealmente independiente. Si tomamos una matriz A en Mm,n(F), podemos aplicar esta idea con los vectores e1,,en de la base canónica de Fn. Como hemos visto con anterioridad, para cada i=1,,n tenemos que el vector Aei es exactamente la i-ésima columna de A. Esto nos permite determinar el rango de una matriz en términos de sus vectores columna.

Proposición. El rango de una matriz en Mm,n(F) es igual a la dimensión del subespacio de Fm generado por sus vectores columna.

Problema. Determina el rango de la matriz (310500829001042).

Solución. Como es una matriz con 3 filas, el rango es a lo más 3. Notemos que entre las columnas están los vectores (3,0,0), (0,2,0) y (0,0,2), que son linealmente independientes. De esta forma, el rango de la matriz es 3.

A veces queremos ver que el rango de un producto de matrices es grande. Una herramienta que puede servir en estos casos es la desigualdad de Sylvester.

Problema (Desigualdad de Sylvester). Muestra que para todas las matrices A, B en Mn(F) se tiene que rank(AB)rank(A)+rank(B)n.

Solución. Tomemos T1:FnFn y T2:FnFn tales que T1(X)=AX y T2(X)=BX. Lo que tenemos que probar es que rank(T1T2)rank(T1)+rank(T2)n.

Consideremos S1 como la restricción de T1 a ImT2. Tenemos que kerS1kerT1, así que dimkerS1dimkerT1. Por el teorema de rango-nulidad en S1, tenemos que
rank(T2)=dimImT2=dimkerS1+rank(S1)=dimkerS1+rank(T1T2)dimkerT1+rank(T1T2), así que rank(T2)dimkerT1+rank(T1T2).

Por el teorema de rango-nulidad en T1 tenemos que dimkerT1+rank(T1)=n.

Sumando la desigualdad anterior con esta igualdad obtenemos el resultado.

◻

El teorema PJQ (opcional)

El siguiente resultado no se encuentra en el temario usual de Álgebra Lineal I. Si bien no formará parte de la evaluación del curso, recomendamos fuertemente conocerlo y acostumbrarse a usarlo pues tiene amplias aplicaciones a través del álgebra lineal.

Teorema (Teorema PJQ). Sea A una matriz en Mm,n(F) y r un entero en {0,,min(m,n)}. El rango de A es igual a r si y sólo si existen matrices invertibles PMm(F) y QMn(F) tales que A=PJrQ, en donde Jr es la matriz en Mm,n cuyas primeras r entradas de su diagonal principal son 1 y todas las demás entradas son cero, es decir, en términos de matrices de bloque, Jr=(Ir000).

No damos la demostración aquí. Se puede encontrar en el libro de Titu Andreescu, Teorema 5.68. Veamos algunas aplicaciones de este teorema.

Problema 1. Muestra que una matriz tiene el mismo rango que su transpuesta.

Solución. Llamemos r al rango de A. Escribimos A=PJrQ usando el teorema PJQ, con P y Q matrices invertibles. Tenemos que tA=tQtJrtP, con tQ y tP matrices invertibles. Además, tJr es de nuevo de la forma de Jr. Así, por el teorema PJQ, tenemos que tA es de rango r.

Combinando el problema anterior con el resultado del rango de una matriz en términos de sus vectores columna obtenemos lo siguiente.

Proposición. El rango de una matriz en Mm,n(F) es igual a la dimensión del subespacio de Fn generado por sus vectores renglón.

Terminamos esta entrada con una aplicación más del teorema PJQ.

Problema 2. Muestra que una matriz A de rango r se puede escribir como suma de r matrices de rango 1. Muestra que es imposible hacerlo con menos matrices.

Solución. Expresamos A=PJrQ usando el teorema PJQ. Si definimos Ai=PEiiQ para i=1,,r, donde Eii es la matriz cuya entrada (i,i) es uno y las demás cero, claramente tenemos que Jr=E11+E22++Err, por lo que A=PJrQ=A1+A2++Ar. Además, como Eii es de rango 1, por el teorema PJQ cada matriz Ai es de rango 1.

Veamos que es imposible con menos. Si B1,,Bs son matrices de rango 1, como el rango es subaditivo tenemos que rank(B1++Bs)s. Así, si sumamos menos de r matrices, no podemos obtener a A.

◻

Más adelante…

Esta entrada es solamente una breve introducción al concepto de rango y a algunas propiedades que pueden ser de utilidad al momento de calcular el rango de una matriz o una transformación lineal. Más adelante, veremos que el rango de una matriz está también relacionado con las soluciones de su sistema lineal homogéneo asociado.

El teorema de rango-nulidad es fundamental para el álgebra lineal. Muchas veces necesitamos calcular el rango de la imagen de una transformación lineal, pero es mucho más fácil calcular la dimensión de su kernel. O viceversa. En estas situaciones es muy importante recordar la forma en la que dicho teorema las relaciona.

Con este tema termina la segunda unidad del curso. Ahora estudiaremos aspectos un poco más geométricos de espacios vectoriales. En la siguiente unidad, hablaremos de dualidad, ortogonalidad, formas bilineales y productos interiores.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Termina de hacer la reducción gaussiana del primer ejemplo.
  • Sea T una transformación de un espacio vectorial V de dimensión finita a si mismo. Usa el teorema de rango-nulidad para mostrar que si T es inyectiva o suprayectiva, entonces es biyectiva.
  • Determina el rango de la matriz (000837812031449).
  • Demuestra que aplicar operaciones elementales a una matriz no cambia su rango.
  • Demuestra que matrices similares tienen el mismo rango.
  • Demuestra por inducción que para matrices A1,,An del mismo tamaño tenemos que rank(A1++An)i=1nrank(Ai).
  • Escribe la demostración de la última proposición de la sección del teorema PJQ
  • Revisa la demostración del teorema de descomposición PJQ en el libro de Titu Andreescu.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

4 comentarios en “Álgebra Lineal I: Rango de transformaciones lineales y matrices

    1. Leonardo Ignacio Martínez SandovalLeo Autor

      Hola Lorna. El rango de una transformación lineal es un entero no negativo, es decir, puede ser 0,1,2,3,…. La notación min(m,n) se refiere al mínimo de m y n. Por ejemplo, min(1,3)=1, min(0,10)=0, min(7,7)=7.

      Responder

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.