Archivo de la etiqueta: kernel

Álgebra Moderna I: Núcleo e Imagen de un Homomorfismo

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Estamos trabajando con homomorfismos, que son funciones entre dos grupos que respetan sus operaciones. Entre las propiedades que vimos, está que el neutro del dominio siempre va al neutro del codominio. Es decir, al menos hay un elemento que, bajo el homomorfismo, cae en el neutro del codominio.

Para esta entrada consideraremos a la colección de todos los elementos del dominio que van al neutro del codominio. A este subconjunto, lo llamamos el núcleo de $\varphi$. Por otro lado, podemos tomar todos los elementos del dominio, aplicarles $\varphi$ y tomar el subconjunto que resulta en el codominio, a esto le llamamos la imagen de $\varphi$. Estos dos subconjuntos van a ser importantes en el estudio de los homomorfismos.

La imagen muestra que para $\varphi: G\to \bar{G}$ un homomorfismo, el núcleo $\text{Núc }\varphi \subseteq G$ y la imagen $\text{Im }\varphi \subseteq \bar{G}$.

El núcleo y la imagen de un homomorfismo

Comencemos definiendo formalmente los subconjuntos.

Definición. Sean $G, \bar{G}$ grupos, $\varphi: G \to \bar{G}$ un homomorfismo. Definimos al núcleo de $\varphi$ como
\begin{align*}
\text{Núc } \varphi = \{g\in G | \varphi(g) = e_{\bar{G}}\}.
\end{align*}

Es decir, es el conjunto de todos los elementos de $G$ que, bajo $\varphi$ van a dar al neutro de $\bar{G}$.

Notación. Es común, por el nombre en alemán, denotar al $\text{Núc } \varphi$ como $\text{Ker }\varphi$, es llamado el Kernel de $\varphi$.

Definición. La imagen de $\varphi$ es
\begin{align*}
\text{Im } \varphi = \{\varphi(g) | g \in G\}.
\end{align*}

Notemos que $\text{Núc }\varphi \subseteq G$ y $\text{Im }\varphi \subseteq \bar{G}$.

Ejemplos.

Ejemplo 1. Tomemos el homomorfismo $\varphi: S_n \to \{+1,-1\}$ con $\varphi(\alpha) = sgn\, \alpha$ para toda $\alpha\in S_n$. Veamos quién es el núcleo de $\varphi$:
\begin{align*}
\text{Núc }\varphi &= \{\alpha\in S_n | \varphi(\alpha) = +1\} \\
&= \{\alpha\in S_n | sgn\in\alpha = +1\} = A_n.
\end{align*}
Si tomamos el caso no trivial, con $n>1$,
\begin{align*}
\text{Im }\varphi = \{+1,-1\}.
\end{align*}
Ya que $\varphi((1)) = 1$ y $\varphi((1\,2)) = -1$.

Ejemplo 2. Sea $n \in \z^+$. Consideremos el homomorfismo $\varphi: \z \to \mathbb{C}^*$ con
\begin{align*}
\varphi(m) = \left(e^{\frac{2\pi i}{n}}\right)^m \quad \forall m\in \z.
\end{align*}
Buscamos describir su núcleo y su imagen.
\begin{align*}
\text{Núc }\varphi &= \{m\in \z| \varphi(m) =1\}\\
&= \{m\in\z | \left(e^{\frac{2\pi i}{n}}\right)^m = 1\} = n\z.
\end{align*}
La última igualdad se da porque ya sabemos que $e^{2\pi i} = 1$, más aún $e^{\theta i} = 1$ si y sólo si $\theta$ es un múltiplo de $2\pi$, entonces $ \left(e^{\frac{2\pi i}{n}}\right)^m = 1$ si y sólo si $m$ es un múltiplo de $n$.

Ahora la imagen:
\begin{align*}
\text{Im }\varphi &= \{\varphi(m)| m \in \z\} \\
&= \{\left(e^{\frac{2\pi i}{n}}\right)^m | m\in \z\} = \left< e^{\frac{2\pi i}{n}}\right>.
\end{align*}

El núcleo y la imagen son subgrupos

Ahora, probaremos que el núcleo y la imagen de un homomorfismo no son sólo subconjuntos del dominio y codominio respectivamente, si no que son subgrupos.

Teorema. Sean $G, \bar{G}$ grupos, $\varphi:G\to\bar{G}$ un homomorfismo.

  1. $\text{Núc }\varphi \unlhd G$.
  2. $\text{Im }\varphi \leq \bar{G}$.
  3. $\varphi$ es un monomorfismo si y sólo si $\text{Núc }\varphi = \{e_G\}$.

Demostración.
Sean $G,\bar{G}$ grupos, $\varphi: G \to \bar{G}$ un homomorfismo.

  1. P.D. $\text{Núc }\varphi \unlhd G$.
    Primero probaremos que $\text{Núc }\varphi \leq G$.

    Como $\varphi$ es un homomorfismo, $\varphi(e_G) = e_{\bar{G}}$. Entonces $e_G \in \text{Núc }\varphi$.

    Si $a,b\in\text{Núc }\varphi$.
    \begin{align*}
    \varphi(ab^{-1}) &= \varphi(a) \varphi(b^{-1}) &\varphi \text{ es un homomorfismo}\\
    &=\varphi(a)(\varphi(b))^{-1} & \text{Proposición de homomorfismo} \\
    &= e_{\bar{G}}e_{\bar{G}}^{-1} = e_{\bar{G}} & a,b \in \text{Núc }\varphi
    \end{align*}
    Entonces $ab^{-1} \in \text{Núc }\varphi$. Por lo tanto $\text{Núc }\varphi \leq G$.

    Además, si $a\in G$ y $n\in\text{Núc }\varphi$:
    \begin{align*}
    \varphi(ana^{-1}) &= \varphi(a)\varphi(n)\varphi(a^{-1}) &\varphi\text{ es un homomorfismo}\\
    &= \varphi(a)\varphi(n)(\varphi(a))^{-1} &\text{Proposición}\\
    & = \varphi(a) e_{\bar{G}}(\varphi(a))^{-1} &n \in \text{Núc }\varphi \\
    &= \varphi(a) (\varphi(a))^{-1} = e_{\bar{G}}
    \end{align*}
    Así, $ana^{-1}\in \text{Núc }\varphi$. Esto nos dice que el núcleo de $\varphi$ es cerrado bajo conjugación. Por lo tanto $\text{Núc } \varphi \unlhd G$.
    $\newline$
  2. P.D. $\text{Im }\varphi \leq \bar{G}$.
    Primero veamos que el neutro de $\bar{G}$ está en $\text{Im }\varphi$. Esto pasa porque
    $$e_{\bar{G}} = \varphi(e_{G}) \in \text{Im }\varphi.$$

    Ahora, si $c,d\in \text{Im }\varphi$, entonces $c = \varphi(a), d = \varphi(b)$ para algunos $a,b\in G$.
    \begin{align*}
    ad^{-1} = \varphi(a)(\varphi(b))^{-1} &= \varphi(a)\varphi(b^{–1}) &\text{Proposición}\\
    &= \varphi(ab^{-1}) \in \text{Im }\varphi &\varphi\text{ es un homomorfismo}
    \end{align*}
    Por lo tanto $\text{Im }\varphi \leq \bar{G}$.
    $\newline$
  3. P.D. $\varphi$ es un monomorfismo si y sólo si $\text{Núc }\varphi = \{e_G\}$.

    $|\Rightarrow]$ Supongamos que $\varphi$ es un monomorfismo (un homomorfismo inyectivo).
    Como $\text{Núc }\varphi \leq G$, entonces $\{e_G\}\subseteq \text{Núc }\varphi$.
    Ahora, si $g\in \text{Núc }\varphi$, por la proposición anterior,
    \begin{align*}
    \varphi(g) = e_{\bar{G}} = \varphi(e_G).
    \end{align*}
    Y como $\varphi$ es inyectiva, $g = e_G$. Por lo tanto, $\text{Núc }\varphi = \{e_G\}$.

    $[\Leftarrow|$ Supongamos que $\text{Núc }\varphi =\{e_G\} $.
    Sean $a,b\in G$ tales que $\varphi(a) = \varphi(b)$. Entonces
    \begin{align*}
    e_{\bar{G}} &= \varphi(b)(\varphi(a))^{-1} \\
    &= \varphi(b)\varphi(a^{-1}) &\text{Proposición}\\
    &= \varphi(ba^{-1}) &\varphi\text{ es un homomorfismo}
    \end{align*}
    Entonces $ba^{-1} \in \text{Núc }\varphi = \{e_G\}$, así $ba^{-1} = e_G$, esto implica que $b = a$.
    Por lo tanto $\varphi$ es un monomorfismo.

$\blacksquare$

Observemos que el inciso 3 del teorema nos da una herramienta para determinar si un homomorfismo es inyectivo o no usando el núcleo.

Proyección Canónica

Ahora, tomando un grupo y un subgrupo normal, definiremos un epimorfismo de un grupo al grupo cociente.

Proposición. Sea $G$ un grupo, $N$ un subgrupo normal de $G$. La función $\pi_:G\to G/N$ con $\pi(a) = aN$ para toda $a\in G$, es un epimorfismo tal que $\text{Núc }\pi = N$.

Esta función se conoce como la proyección canónica.

Demostración.
Sea $G$ un grupo, $N\unlhd G$, $\pi: G\to G/N$ con $\pi(a) = aN$ para cualquier $a\in G$.

Veamos que $\pi$ es un homomorfismo
Sean $a,b \in G$, entonces
\begin{align*}
\pi(ab) = abN = (aN)(bN) = \pi(a)\pi(b).
\end{align*}

Ahora veamos que es suprayectivo. Esto es debido a que dado $aN\in G/N$, $$aN = \pi(a).$$

Por lo tanto $\pi$ es un epimorfismo.

Finalmente,
\begin{align*}
\text{Núc }\pi = \{a\in G| \pi(a) = e_{G/N}\} = \{a\in G| aN = N\} = N.
\end{align*}

$\blacksquare$

Ahora veamos un corolario que se desprende directamente de lo que acabamos de ver.

Corolario. Todo subgrupo normal es el núcleo de un homomorfismo. De hecho, es el núcleo de un epimorfismo.

Ejemplos

Para terminar veamos unos ejemplos

Ejemplo 1. Tomemos $\varphi:(\r,+) \to (\mathbb{C}^*, \cdot)$ con $\varphi(x) = e^{xi}$ para toda $x\in\r$. Toma 2 min para pensar porqué es un homomorfismo.

Veamos el núcleo y la imágen de $\varphi$:
\begin{align*}
\text{Núc }\varphi &= \{x\in\r | \varphi(x) = 1\} \\
&= \{x\in\r | e^{xi} = 1\} \\
&= \{2\pi n | n \in \z\} = \left< 2\pi\right>.\\\\
\text{Im }\varphi &= \{\varphi(x) | x \in \r\} \\
& =\{e^{xi} | x\in\r\} \\
&= \{z\in \mathbb{C} | |z| = 1\} = \s^1.
\end{align*}
¿Cómo es $\r/\left<2\pi\right>$?
Tomemos $a,b\in \r$.
\begin{align*}
a + \left< 2\pi\right> = b + \left< 2\pi\right> &\Leftrightarrow a-b \in \left< 2\pi\right> \\
&\Leftrightarrow a-b= 2\pi n,\, n\in \z.
\end{align*}
Si lo anterior nos dice que dos números $a,b$ están en la misma clase si y sólo si difieren por un múltiplo de $2\pi$. Si lo pensamos en la recta numérica, nos dice que el $0$ y $2\pi$ quedan indentificados en la misma clase. Intuitivamente podríamos pensar que estamos doblando la recta numérica para obtener una circunferencia donde $0$ y $2\pi$ están en el mismo punto.

Así, $\r/\left< 2\pi\right> = \{a+\left< 2\pi\right> | a\in [0,2\pi)\}$.

Representación gráfica del ejemplo 1.

Ejemplo 2. Consideremos $\varphi: (\r^*,\cdot)\to (\r^*,\cdot)$ con $\varphi(x) = |x|$ para toda $x \in \r^*$ (recuerda que $\r^*=\r\setminus \{0\}$).
\begin{align*}
\text{Núc }\varphi &= \{x\in\r^* | \varphi(x) = 1\} \\
&= \{x\in\r^*| |x| = 1\} = \{+1,-1\}.\\\\
\text{Im }\varphi &= \{\varphi(x) | x \in \r^*\} \\
& =\{|x| | x\in\r^*\} = \r^+. \\
\end{align*}
¿Cómo es $\r^*/\{+1,-1\}$?
Tomemos $a,b\in \r^*$.
\begin{align*}
a\{+1,-1\}= b\{+1,-1\} &\Leftrightarrow a^{-1}b \in \{+1,-1\} \\
&\Leftrightarrow a^{–1}b=\pm 1 \Leftrightarrow b = \pm a.
\end{align*}
Entonces, dos clases laterales van a ser iguales si y sólo si sus representantes difieren a lo más sólo por el signo.

Lo que hicimos fue tomar a los reales sin el cero y estamos identificando a cada número real $a$ con su inverso aditivo. Entonces la imagen de $\varphi$ en realidad es como si dobláramos la recta por el 0 e identificamos a los reales negativos con su correspondiente positivo.

Así, $\r^*/ \{+1,-1\} = \{a \{+1,-1\} | a\in \r^+\}$.

Representación gráfica del ejemplo 2.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Sea $\varphi:GL(2,\r) \to \r^*$ el homomorfismo tal que $\varphi(A) = \text{det }A$. Encuentra el núcleo y la imagen de $\varphi$.
  2. Sean $G,\bar{G}$ grupos y $\varphi: G\to\bar{G}$ un homomorfismo. ¿Es $ \text{Im }\varphi$ normal en $\bar{G}$? Prueba o da un contraejemplo.
  3. Sean $G,\bar{G}$ grupos y $\varphi: G\to \bar{G}$ un homomorfismo. Sean también, $H\leq G, \bar{H}\leq \bar{G}$.
    • ¿Qué puedes decir de $\varphi[H] = \{\varphi(h) | h \in H\}$?¿Y si $H\unlhd G$?
    • ¿Qué puedes decir de $\varphi^{-1}[\bar{H}] = \{g\in G| \varphi(g) \in \bar{H}\}$? ¿Y si $\bar{H}\unlhd\bar{G}$?
  4. En cada inciso calcula $\text{Núc } \varphi, \text{Im }\varphi, G/\text{Núc}$ y analiza cómo se relacionan:
    • $G$ grupo, $\varphi: G \to G$, con $\varphi =\text{id}_G $.
    • $G$ grupo, $\varphi: G \to G$, con $\varphi(g) = e_G$ para toda $g\in G$.
    • $\varphi: (\mathbb{C}^*, \cdot) \to (\r^*, \cdot)$, con $\varphi(z) = |z|$ para toda $z\in\mathbb{C}^*$.
    • $\varphi: \z \times \z \to \z\times\z$, con $\varphi(x,y) = (x,0)$ para toda $(x,y)\in \z\times\z$.

Más adelante…

Ahora que ya tenemos muy claras las definiciones de núcleo e imagen de un homomorfismo, comenzaremos a ver teoremas que relacionan lo que vimos aquí con isomorfismos y grupo cociente.

Entradas relacionadas

Álgebra Lineal I: Problemas de formas cuadráticas y producto interior

Por Blanca Radillo

Introducción

En las últimas sesiones, hemos introducido el tema de formas bilineales y formas cuadráticas. Más adelante, hablamos de positividad de formas cuadráticas y de producto interior. Ahora veremos algunos problemas de formas cuadráticas y producto interior.

Problemas resueltos de formas cuadráticas

Sabemos que si $T:V\times V\rightarrow \mathbb{R}$ es una transformación lineal, $T$ no necesariamente es una forma bilineal (durante la clase del viernes se discutió un ejemplo), entonces una pregunta interesante es ¿qué información tenemos sobre el núcleo de una forma cuadrática? Es fácil ver que una forma cuadrática no es una transformación lineal, pero está asociada a una forma bilineal. Interesadas en esta pregunta, analizaremos algunas propiedades del núcleo de una forma bilineal y de una forma cuadrática.

Problema 1. a) Si $q$ es una forma cuadrática en $\mathbb{R}^n$, ¿el conjunto $\{ x\in \mathbb{R}^n: q(x)=0 \}$ es un subespacio de $\mathbb{R}^n$?
b) Describe ${ x\in \mathbb{R}^n:q(x)=0}$ si:
1) $q(x,y)=x^2+y^2$,
2) $q(x,y,z)=xy+yz+zx$
3) $q(x,y,z)=(x-y)^2+(y-z)^2+(z-x)^2$.

Solución. a) La respuesta es: no, el conjunto $\{ x\in \mathbb{R}^n: q(x)=0 \}$ no necesariamente es un subespacio, ya que no necesariamente es cerrado bajo la suma. Daremos un ejemplo.

Sea $q:\mathbb{R}^2\rightarrow \mathbb{R}$ definido como $q((x,y))=x^2-y^2$. Sabemos que ésta es una forma cuadrática. Notemos que para todo $x,y \in\mathbb{R}$, si $v_1=(x,x),v_2=(y,-y)$, entonces $q(v_1)=x^2-x^2=0$ y $q(v_2)=y^2-(-y)^2=0$, entonces $v_1,v_2 \in \{ x\in \mathbb{R}^n: q(x)=0 \}$. Pero $v_1+v_2=(x+y,x-y)$ no pertenecen al núcleo de $q$, ya que $q(v_1+v_2)=q((x+y,x-y))=(x+y)^2-(x-y)^2=4xy\neq 0$ si $x,y\neq 0$.

b.1) Sea $(x,y)\in\mathbb{R}^2$ tal que $q((x,y))=x^2+y^2=0$. Como $x,y\in\mathbb{R}$, sabemos que la única posibilidad en que la suma de dos cuadrados sea cero es que ambos sean cero, por lo tanto $\{ x\in \mathbb{R}^2: q(x)=0 \}=\{(0,0)\}$.

b.2) Sea $(x,y,z)\in\mathbb{R}^3$ tal que $q((x,y,z))=xy+yz+zx=0$. Si $x=0$ entonces $yz=0$, esto es posible sólo si $y=0$ o $z=0$. Entonces el núcleo contiene a los ejes $(x,0,0)$, $(0,y,0)$ y $(0,0,z)$. Ahora, si $x=-y$, entonces $xy+yz+zx=-x^2-xz+zx=-x^2=0$, por lo tanto $x=0=y$, obteniendo nuevamente a los ejes. Ahora suponemos que $x+y\neq 0$. Entonces $xy+yz+zx=xy+z(x+y)=0$, obteniendo que $z=-\frac{xy}{x+y}$ (el cono elíptico). Por lo tanto el núcleo de $q$ son los ejes y el cono elíptico.

b.3) Sea $(x,y,z)\in\mathbb{R}^3$ tal que $q((x,y,z))=(x-y)^2+(y-z)^2+(z-x)^2=0$. Al igual que en el inciso (b.1), esto sólo es posible si $x-y=y-z=z-x=0$, entonces $x=y=z$. Por lo tanto, $\{ x\in \mathbb{R}^n: q(x)=0 \}=\{(x,x,x):x\in\mathbb{R}\}$.

$\triangle$

Problema 2. Sea $V=P_2(\mathbb{R})$ el espacio de polinomios en $[-1,1]$ con coeficientes reales de grado a lo más 2 y considera el mapeo $b:V\times V\rightarrow \mathbb{R}$ definido como

$b(f,g)=\int_{-1}^1 tf(t)g(t) dt.$

Prueba que $b$ es una forma bilineal simétrica de $V$. Si $q$ es la forma cuadrática asociada, encuentra las $f$ en $V$ tales que $q(f)=0$.

Solución. Mostrar que $b$ es bilineal es sencillo, y queda como tarea moral. Es fácil ver que es simétrica, ya que

\begin{align*}
b(f,g)&=\int_{-1}^1 tf(t)g(t) dt \\
&=\int_{-1}^1 tg(t)f(t)dt=b(g,f).
\end{align*}

Ahora, queremos encontrar las funciones $f$ tales que $q(f)=b(f,f)=\int_{-1}^1 tf^2(t)dt=0$. Como $f$ es un polinomio de grado $2$, es de la forma $f(x)=ax^2+bx+c$ para reales $a,b,c$ y entonces

\begin{align*}
0&=q(f)\\
&=\int_{-1}^1 tf^2(t)dt \\
&=\int_{-1}^1 t(at^2+bt+c)^2dt \\
& = \int_{-1}^1 t(a^2t^4+2abt^3+(b^2+2ac)t^2+2bct+c^2)dt \\
&=\int_{-1}^1 (a^2t^5+2abt^4+(b^2+2ac)t^3+2bct^2+c^2t)dt \\
&=\frac{4ab}{5}+\frac{4bc}{3}=0
\end{align*}

Esto implica que $4b(3a+5c)=0$, entonces $b=0$ o $3a+5c=0$. Por lo tanto $$\{f\in V:q(f)=0\}=\{ax^2+c \}\cup \{ax^2+bx-\frac{3a}{5}\}.$$

$\square$

Problemas resueltos de producto interior

Ahora recordemos que en la clase de ayer, definimos formas bilineales y cuadráticas positivas y definidas positivas, y a partir de ello, definimos qué es un producto interior. Así, en los siguientes problemas, veremos algunos ejemplos de estas definiciones.

Problema 3. Determina cuáles de las siguientes formas cuadráticas son positivas. ¿Cuáles también son definidas positivas?

  1. $q(x,y,z)=xy+yz+zx$.
  2. $q(x,y,z)=(x-y)^2+(y-z)^2+(z-x)^2$.
  3. $q(x,y,z)=x^2-y^2+z^2-xy+2yz-3zx$.

Solución. Sea $v=(x,y,z)\in\mathbb{R}^3$, recordemos que para cada uno de los incisos $q$ es positiva si $q(v)\geq 0$ para toda $v$ y es definida positiva si es positiva y $q(v)=0$ si y sólo si $v=0$.

1) Si escogemos a $v$ como $v=(1,-2,1)$ tenemos que
\begin{align*}q(v)&=q(1,-2,1)\\&=1(-2)+(-2)(1)+1(1)\\&=-2-2+1\\&=-3.\end{align*} Por lo tanto no es positiva ni definida positiva.

2) Dado que para todo $x,y,z$, tenemos que $(x-y)^2,(y-z)^2,(z-x)^2\geq 0$, entonces $q(v)\geq 0$ para todo $v\in\mathbb{R}^3$. Pero si $q(v)=0$, entonces $x=y=z$, pero no necesariamente son iguales a cero. Por lo tanto, $q$ es positiva pero no es definida positiva.

3) Si tomamos $v=(3,0,3)$, obtenemos que \begin{align*}q(v)&=(3)^2+(3)^2-3(3)(3)\\&=9+9-27\\&=-9\\&<0.\end{align*} Por lo tanto no es positiva ni definida positiva.

$\triangle$

Problema 4. Sea $V=C([a,b],\mathbb{R})$. Prueba que el mapeo $\langle \cdot , \cdot \rangle$ definido por $$\langle f,g \rangle = \int_a^b f(x)g(x) dx$$ es un producto interior en $V$.

Solución. Por lo visto en la clase de ayer, tenemos que un producto interior es una forma bilineal simétrica y definida positiva.
Es fácil ver que es forma bilineal simétrica. Basta con probar que es una forma definida positiva. Entonces $\langle f,f\rangle=\int_0^1 f^2(x)dx \geq 0$ ya que $f^2(x)\geq 0$ para toda $x$. Por lo tanto $\langle \cdot, \cdot \rangle$ es positiva. Como $f^2$ es continua y positiva, si $\int_0^1 f^2(x)dx=0$, implica que $f^2=0$, entonces $f=0$. Por lo tanto, $\langle \cdot , \cdot \rangle$ es definida positiva, y por ende, es un producto interior.

$\triangle$

Para finalizar, el siguiente problema es un ejemplo que pareciera ser producto interior, pero resulta que no serlo.

Problema 5. Sea $C^\infty([0,1],\mathbb{R})$ es el espacio de funciones suaves (funciones continuas cuyas derivadas de cualquier orden existen y son continuas). Definimos el espacio $V={ f\in C^\infty([0,1],\mathbb{R}): f(0)=f(1)=0 }$. Si definimos $$\langle f,g \rangle:=\int_0^1 (f(x)g'(x)+f'(x)g(x))dx,$$ ¿es $\langle \cdot , \cdot \rangle$ un producto interior en $V$?

Solución. Es claro ver que $\langle \cdot, \cdot \rangle$ es bilineal y simétrica, entonces falta demostrar si es o no es una forma definida positiva. Para $f\in V$, tenemos que $\langle f,f \rangle=\int_0^1 2f(x)f'(x)dx.$

Notemos que, por la regla de la cadena, $\frac{d}{dx}f^2(x)=2f(x)f'(x)$, entonces \begin{align*}\langle f,f \rangle&=\int_0^1 \frac{d}{dx} f^2(x) dx\\&=f^2(1)-f^2(0)\\&=0.\end{align*}

Por lo tanto $\langle f,f\rangle=0$ para toda $f$. Esto implica que no es definida positiva, y como consecuencia, no es producto interior de $V$.

$\triangle$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Rango de transformaciones lineales y matrices

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores hablamos de transformaciones lineales, cómo actúan en conjuntos especiales de vectores y de cómo se pueden representar con matrices. Hablamos también de cómo cambiar de una base a otra y cómo usar esto para entender transformaciones en varias bases. Estamos listos para introducir un concepto fundamental de álgebra lineal, el de rango de una transformación lineal y de una matriz.

Antes de entrar en las definiciones formales, vale la pena hablar un poco de rango de manera intuitiva. Supongamos que $V$ es un espacio vectorial de dimensión $n$ y que $W$ es un espacio vectorial sobre el mismo campo que $V$. Una transformación lineal $T:V\to W$ puede «guardar mucha independencia lineal» o «muy poquita». Si $T$ es inyectiva, ya vimos antes que $T$ manda linealmente independientes a linealmente independientes. Si $T$ es la transformación $0$, entonces se «pierde toda la independencia».

El rango mide algo intermedio entre estos dos extremos. Mientras mayor sea el rango, más independencia lineal se preserva y viceversa. Si mantienes esta intuición en mente, varias de las proposiciones te resultarán más naturales.

Otro buen ejemplo para tener en mente es tomar una transformación lineal $T:\mathbb{R}^3\to \mathbb{R}^3$. Si es la transformación identidad, la base canónica se preserva. Si es la proyección al plano $xy$, entonces «perdemos» al vector $(0,0,1)$, pues se va al $(0,0,0)$. Si es la proyección al eje $x$, «perdemos» al $(0,1,0)$ y al $(0,0,1)$ pues ambos se van a $(0,0,0)$. Y si es la transformación $0$, perdemos a todos. El rango precisamente va a medir esto, y para estos ejemplos tendremos rango $3$, $2$, $1$ y $0$ respectivamente.

Rango para transformaciones lineales

Como en otras ocasiones, cuando hablemos de transformaciones lineales entre espacios vectoriales, serán sobre un mismo campo $F$.

Definición. Sean $V$ y $W$ espacios de dimensión finita. El rango de una transformación lineal $T:V\to W$ es la dimensión de la imagen de $T$, es decir, $$\rank(T)=\dim\Ima T.$$

Si $B$ es una base de $V$, entonces genera a $V$. La transformación $T$ es suprayectiva de $V$ a $\Ima T$, de modo que $T(B)$ es generador de $\Ima T$. De esta forma, para encontrar el rango de una transformación lineal $T:V\to W$ basta:

  • Tomar una base $B$ de $V$.
  • Aplicar $T$ a cada elemento de $B$.
  • Determinar un conjunto linealmente independiente máximo en $T(B)$.

Para hacer este último paso, podemos poner a los vectores coordenada de $T(B)$ con respecto a una base de $W$ como los vectores fila de una matriz $A$ y usar reducción gaussiana. Las operaciones elementales no cambian el espacio generado por las filas, así que el rango de $T$ es el número de vectores fila no cero en la forma escalonada reducida $A_{\text{red}}$ de $A$.

Ejemplo. Encuentra el rango de la transformación lineal $T:\mathbb{R}^3\to M_{2}(\mathbb{R})$ que manda $(x,y,z)$ a $$\begin{pmatrix}x+y-z & 2x \\ 2y-2z & x+z-y\end{pmatrix}.$$

Solución. Tomemos $e_1,e_2,e_3$ la base canónica de $\mathbb{R}^3$. Tenemos que $T(e_1)=\begin{pmatrix}1 & 2\\ 0 & 1\end{pmatrix}$, $T(e_2)=\begin{pmatrix} 1 & 0 \\ 2 & -1\end{pmatrix}$ y $T(e_3)=\begin{pmatrix}-1 & 0\\ -2 & 1\end{pmatrix}$.

Tomando la base canónica $E_{11},E_{12},E_{21},E_{22}$ de $M_2(\mathbb{R})$, podemos entonces poner a las coordenadas de $T(e_1),T(e_2),T(e_2)$ como vectores fila de una matriz $$\begin{pmatrix}1 & 2 & 0 & 1\\ 1 & 0 & 2 & -1\\ -1& 0 & -2 & 1\end{pmatrix}.$$ Sumando la segunda fila a la tercera, y después restando la primera a la segunda,obtenemos la matriz $$\begin{pmatrix}1 & 2 & 0 & 1\\ 0 & -2 & 2 & -2\\ 0& 0 & 0 & 0\end{pmatrix}.$$ De aquí, sin necesidad de terminar la reducción gaussiana, podemos ver que habrá exactamente dos filas no cero. De este modo, el rango de la transformación es $2$.

$\triangle$

Propiedades del rango

Demostremos ahora algunas propiedades teóricas importantes acerca del rango de una transfromación lineal.

Proposición. Sean $U$, $V$ y $W$ espacios de dimensión finita. Sean $S:U\to V$, $T:V\to W$, $T’:V\to W$ transformaciones lineales. Entonces:

  1. $\rank(T)\leq \dim V$
  2. $\rank(T)\leq \dim W$
  3. $\rank(T\circ S)\leq \rank(T)$
  4. $\rank(T\circ S)\leq \rank(S)$
  5. $\rank(T+T’)\leq \rank(T) + \rank(T’)$

Demostración. (1) Pensemos a $T$ como una transformación $T:V\to \Ima(T)$. Haciendo esto, $T$ resulta ser suprayectiva, y por un resultado anterior tenemos que $\dim V\geq \dim \Ima T = \rank (T)$.

(2) Sabemos que $\Ima (T)$ es un subespacio de $W$, así que $\rank(T)=\dim \Ima T \leq \dim W$.

(3) La imagen de $T$ contiene a la imagen de $T\circ S$, pues cada vector de la forma $T(S(v))$ es de la forma $T(w)$ (para $w=S(v)$). Así, \begin{align*}\rank(T) &=\dim \Ima T \geq \dim \Ima T\circ S\\ &= \rank (T\circ S).\end{align*}

(4) La función $T\circ S$ coincide con la restricción $T_{\Ima S}$ de $T$ a $\Ima S$. Por el inciso (1), $\rank(T_{\Ima S})\leq \dim \Ima S = \rank(S)$, así que $\rank (T\circ S) \leq \rank(S)$.

(5) Tenemos que $\Ima (T+T’) \subseteq \Ima T + \Ima T’$. Además, por un corolario de la fórmula de Grassman, sabemos que
\begin{align*}
\dim (\Ima T + \Ima T’)&\leq \dim \Ima T + \dim \Ima T’\\
&= \rank(T) + \rank(T’).
\end{align*}

Así,
\begin{align*}
\rank(T+T’)&\leq \rank(\Ima T + \Ima T’)\\
&\leq \rank(T)+\rank(T’).
\end{align*}

$\square$

Proposición. Sean $R:U\to V$, $T:V\to W$ y $S:W\to Z$ transformaciones lineales con $R$ suprayectiva y $S$ inyectiva. Entonces $$\rank(S\circ T\circ R)=\rank (T).$$

Dicho de otra forma «composición por la izquierda con transformaciones inyectivas no cambia el rango» y «composición por la derecha con transformaciones suprayectivas no cambia el rango». Un corolario es «composición con transformaciones invertibles no cambia el rango».

Demostración. De la proposición anterior, tenemos que $\rank(S\circ T)\leq \rank (T)$. La restricción $S_{\Ima T}$ de $S$ a la imagen de $T$ es una transformación lineal de $\Ima T$ a $\Ima (S\circ T)$ que es inyectiva, de modo que $\dim \Ima T \leq \dim \Ima (S\circ T)$, que es justo $\rank(T)\leq \rank(S\circ T)$, de modo que tenemos la igualdad $\rank(S\circ T)=\rank (T)$.

Como $R$ es suprayectiva, $\Ima R= V$, de modo que $\Ima(S\circ T \circ R)=\Ima(S\circ T)$. Así, \begin{align*}\rank (S\circ T \circ R) &= \rank (S\circ T)\\&=\rank(T).\end{align*}

$\square$

Teorema de rango-nulidad

Una transformación lineal $T:V\to W$ determina automáticamente dos subespacios de manera natural: el kernel $\ker T$ y la imagen $\Ima T$. Resulta que las dimensiones de $\ker T$, de $\Ima T$ y de $V$ están fuertemente relacionadas entre sí.

Teorema. Sean $V$ y $W$ espacios de dimensión finita. Sea $T:V\to W$ una transformación lineal. Entonces $$\dim\ker T + \rank(T) = \dim V.$$

Demostración. Supongamos que $\dim V=n$ y $\dim \ker T = k$. Queremos mostrar que $\rank(T)=n-k$. Para ello, tomemos una base $B$ de $\ker T$ y tomemos $B’=\{v_1,\ldots,v_{n-k}\}$ tal que $B\cup B’$ sea base de $V$. Basta mostrar que $T(B’)=\{T(v_1),\ldots,T(v_{n-k})\}\subset \Ima T$ es base de $\Ima T$. Sea $U$ el generado por $B’$, de modo que $V=U \oplus \ker T$.

Veamos que $T(B’)$ es generador de $\Ima T$. Tomemos $T(v)$ en $\Ima T$. Podemos escribir $v=z+u$ con $z\in \ker T$ y $u\in U$. Así, $T(v)=T(z)+T(u)=T(u)$, y este último está en el generado por $T(B’)$.

Ahora veamos que $T(B’)$ es linealmente independiente. Si $$\alpha_1T(v_1)+\ldots+\alpha_{n-k}T(v_{n-k})=0,$$ entonces $T(\alpha_1v_1+\ldots+\alpha_{n-k}v_{n-k})=0$, de modo que $\alpha_1v_1+\ldots+\alpha_{n-k}v_{n-k}$ está en $U$ y en $\ker T$, pero la intersección de estos espacios es $\{0\}$. Como esta combinación lineal es $0$ y $B’$ es linealmente independiente, $\alpha_1=\ldots=\alpha_n=0$.

De esta forma, $T(B’)$ es linealmente independiente y genera a $\Ima T$, de modo que $\rank(T) =|B’|=n-k$.

$\square$

Ejemplo. Consideremos de nuevo la transformación lineal $T:\mathbb{R}^3\to M_{2}(\mathbb{R})$ que manda $(x,y,z)$ a $$\begin{pmatrix}x+y-z & 2x \\ 2y-2z & x+z-y\end{pmatrix}.$$ Muestra que $T$ no es inyectiva.

Solución. Ya determinamos previamente que esta transformación tiene rango $2$. Por el teorema de rango-nulidad, su kernel tiene dimensión $1$. Así, hay un vector $v\neq (0,0,0)$ en el kernel, para el cual $T(v)=0=T(0)$, de modo que $T$ no es inyectiva.

$\square$

Problema. Demuestra que para cualquier entero $n$ existe una terna $(a,b,c)\neq (0,0,0)$ con $a+b+c=0$ y tal que $$\int_0^1 at^{2n}+bt^n+c \,dt = 0.$$

Solución. Podríamos hacer la integral y plantear dos ecuaciones lineales. Sin embargo, daremos argumentos dimensionales para evitar la integral. Consideremos las transformaciones lineales $T:\mathbb{R}^3\to \mathbb{R}$ y $S:\mathbb{R}^3\to \mathbb{R}$ dadas por
\begin{align*}
T(x,y,z)&=\int_0^1 xt^{2n}+yt^n+z \,dt\\
S(x,y,z)&=x+y+z.
\end{align*}
Notemos que $T(0,0,1)=\int_0^1 1\, dt = 1=S(0,0,1)$, de modo que ni $T$ ni $S$ son la transformación $0$. Como su rango puede ser a lo más $\dim\mathbb{R}=1$, entonces su rango es $1$. Por el teorema de rango-nulidad, $\dim \ker S= \dim \ker T = 2$. Como ambos son subespacios de $\mathbb{R}^3$, es imposible que $\ker S \cap \ker T=\{0\}$, de modo que existe $(a,b,c)$ no cero tal que $T(a,b,c)=S(a,b,c)=0$. Esto es justo lo que buscábamos.

$\square$

Rango para matrices

Definición. El rango de una matriz $A$ en $M_{m,n}(F)$ es el rango de la transformación lineal asociada de $F^n$ a $F^m$ dada por $X\mapsto AX$. Lo denotamos por $\rank(A)$.

A partir de esta definición y de las propiedades de rango para transformaciones lineales obtenemos directamente las siguientes propiedades para rango de matrices.

Proposición. Sean $m$, $n$ y $p$ enteros. Sea $B$ una matriz en $M_{n,p}(F)$ y $A$, $A’$ matrices en $M_{m,n}(F)$. Sea $P$ una matriz en $M_{n,p}(F)$ cuya transformación lineal asociada es suprayectiva y $Q$ una matriz en $M_{r,m}(F)$ cuya transformación lineal asociada es inyectiva. Entonces:

  1. $\rank(A)\leq \min(m,n)$
  2. $\rank(AB)\leq \min(\rank(A),\rank(B))$
  3. $\rank(A+A’)\leq \rank(A) + \rank(A’)$
  4. $\rank(QAP) = \rank(A)$

Como discutimos anteriormente, el rango de una transformación se puede obtener aplicando la transformación a una base y viendo cuál es el máximo subconjunto de imágenes de elementos de la base que sea linealmente independiente. Si tomamos una matriz $A$ en $M_{m,n}(F)$, podemos aplicar esta idea con los vectores $e_1,\ldots,e_n$ de la base canónica de $F^{n}$. Como hemos visto con anterioridad, para cada $i=1,\ldots, n$ tenemos que el vector $Ae_i$ es exactamente la $i$-ésima columna de $A$. Esto nos permite determinar el rango de una matriz en términos de sus vectores columna.

Proposición. El rango de una matriz en $M_{m,n}(F)$ es igual a la dimensión del subespacio de $F^m$ generado por sus vectores columna.

Problema. Determina el rango de la matriz $$\begin{pmatrix} 3 & 1 & 0 & 5 & 0\\ 0 & 8 & 2 & -9 & 0\\ 0 & -1 & 0 & 4 & -2\end{pmatrix}.$$

Solución. Como es una matriz con $3$ filas, el rango es a lo más $3$. Notemos que entre las columnas están los vectores $(3,0,0)$, $(0,2,0)$ y $(0,0,-2)$, que son linealmente independientes. De esta forma, el rango de la matriz es $3$.

$\triangle$

A veces queremos ver que el rango de un producto de matrices es grande. Una herramienta que puede servir en estos casos es la desigualdad de Sylvester.

Problema (Desigualdad de Sylvester). Muestra que para todas las matrices $A$, $B$ en $M_n(F)$ se tiene que $$\rank(AB)\geq \rank(A)+\rank(B)-n.$$

Solución. Tomemos $T_1:F^n\to F^n$ y $T_2:F^n\to F^n$ tales que $T_1(X)=AX$ y $T_2(X)=BX$. Lo que tenemos que probar es que $$\rank(T_1\circ T_2) \geq \rank(T_1) + \rank(T_2) – n.$$

Consideremos $S_1$ como la restricción de $T_1$ a $\Ima T_2$. Tenemos que $\ker S_1 \subset \ker T_1$, así que $\dim \ker S_1 \leq \dim \ker T_1$. Por el teorema de rango-nulidad en $S_1$, tenemos que
\begin{align*}
rank(T_2) &= \dim \Ima T_2 \\
&= \dim \ker S_1 + \rank(S_1) \\
&= \dim \ker S_1 + \rank(T_1\circ T_2)\\
&\leq \dim \ker T_1 + \rank(T_1\circ T_2),
\end{align*} así que $$\rank(T_2)\leq \dim \ker T_1 + \rank(T_1\circ T_2).$$

Por el teorema de rango-nulidad en $T_1$ tenemos que $$\dim \ker T_1 + \rank(T_1)=n.$$

Sumando la desigualdad anterior con esta igualdad obtenemos el resultado.

$\square$

El teorema $PJQ$ (opcional)

El siguiente resultado no se encuentra en el temario usual de Álgebra Lineal I. Si bien no formará parte de la evaluación del curso, recomendamos fuertemente conocerlo y acostumbrarse a usarlo pues tiene amplias aplicaciones a través del álgebra lineal.

Teorema (Teorema PJQ). Sea $A$ una matriz en $M_{m,n}(F)$ y $r$ un entero en $\{0,\ldots,\min(m,n)\}$. El rango de $A$ es igual a $r$ si y sólo si existen matrices invertibles $P\in M_m(F)$ y $Q\in M_n(F)$ tales que $A=PJ_rQ$, en donde $J_r$ es la matriz en $M_{m,n}$ cuyas primeras $r$ entradas de su diagonal principal son $1$ y todas las demás entradas son cero, es decir, en términos de matrices de bloque, $$J_r=\begin{pmatrix}
I_r & 0 \\
0 & 0
\end{pmatrix}.$$

No damos la demostración aquí. Se puede encontrar en el libro de Titu Andreescu, Teorema 5.68. Veamos algunas aplicaciones de este teorema.

Problema 1. Muestra que una matriz tiene el mismo rango que su transpuesta.

Solución. Llamemos $r$ al rango de $A$. Escribimos $A=PJ_rQ$ usando el teorema $PJQ$, con $P$ y $Q$ matrices invertibles. Tenemos que $^tA=^tQ\, ^tJ_r \,^tP$, con $^tQ$ y $^tP$ matrices invertibles. Además, $^t J_r$ es de nuevo de la forma de $J_r$. Así, por el teorema $PJQ$, tenemos que $^t A$ es de rango $r$.

Combinando el problema anterior con el resultado del rango de una matriz en términos de sus vectores columna obtenemos lo siguiente.

Proposición. El rango de una matriz en $M_{m,n}(F)$ es igual a la dimensión del subespacio de $F^n$ generado por sus vectores renglón.

Terminamos esta entrada con una aplicación más del teorema $PJQ$.

Problema 2. Muestra que una matriz $A$ de rango $r$ se puede escribir como suma de $r$ matrices de rango $1$. Muestra que es imposible hacerlo con menos matrices.

Solución. Expresamos $A=PJ_rQ$ usando el teorema $PJQ$. Si definimos $A_i=PE_{ii}Q$ para $i=1,\ldots,r$, donde $E_{ii}$ es la matriz cuya entrada $(i,i)$ es uno y las demás cero, claramente tenemos que $J_r=E_{11}+E_{22}+\ldots+E_{rr}$, por lo que $$A=PJ_rQ=A_1+A_2+\ldots+A_r.$$ Además, como $E_{ii}$ es de rango $1$, por el teorema $PJQ$ cada matriz $A_i$ es de rango $1$.

Veamos que es imposible con menos. Si $B_1,\ldots,B_s$ son matrices de rango $1$, como el rango es subaditivo tenemos que $\rank (B_1+\ldots+B_s)\leq s$. Así, si sumamos menos de $r$ matrices, no podemos obtener a $A$.

$\square$

Más adelante…

Esta entrada es solamente una breve introducción al concepto de rango y a algunas propiedades que pueden ser de utilidad al momento de calcular el rango de una matriz o una transformación lineal. Más adelante, veremos que el rango de una matriz está también relacionado con las soluciones de su sistema lineal homogéneo asociado.

El teorema de rango-nulidad es fundamental para el álgebra lineal. Muchas veces necesitamos calcular el rango de la imagen de una transformación lineal, pero es mucho más fácil calcular la dimensión de su kernel. O viceversa. En estas situaciones es muy importante recordar la forma en la que dicho teorema las relaciona.

Con este tema termina la segunda unidad del curso. Ahora estudiaremos aspectos un poco más geométricos de espacios vectoriales. En la siguiente unidad, hablaremos de dualidad, ortogonalidad, formas bilineales y productos interiores.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Termina de hacer la reducción gaussiana del primer ejemplo.
  • Sea $T$ una transformación de un espacio vectorial $V$ de dimensión finita a si mismo. Usa el teorema de rango-nulidad para mostrar que si $T$ es inyectiva o suprayectiva, entonces es biyectiva.
  • Determina el rango de la matriz $$\begin{pmatrix} 0 & 0 & 0 & 8 & 3\\ 7 & 8 & -1 & -2 & 0\\ 3 & -1 & 4 & 4 & -9\end{pmatrix}.$$
  • Demuestra que aplicar operaciones elementales a una matriz no cambia su rango.
  • Demuestra que matrices similares tienen el mismo rango.
  • Demuestra por inducción que para matrices $A_1,\ldots, A_n$ del mismo tamaño tenemos que $$\rank (A_1+\ldots+A_n)\leq \sum_{i=1}^n \rank(A_i).$$
  • Escribe la demostración de la última proposición de la sección del teorema $PJQ$
  • Revisa la demostración del teorema de descomposición $PJQ$ en el libro de Titu Andreescu.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Transformaciones lineales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas pasadas ya platicamos de espacios vectoriales y de subespacios. También desarrollamos teoría de dimensión para espacios vectoriales de dimensión finita. Para ello, hablamos de conjuntos generadores, de independientes y de bases. Esto nos ayuda a entender a los espacios vectoriales «uno por uno». Lo que queremos entender ahora es cómo interactúan los espacios vectoriales entre sí. Para ello, hablaremos de transformaciones lineales entre espacios vectoriales.

Ya platicamos un poco de transformaciones lineales cuando estudiamos $F^n$ a detalle. En esa parte del curso, vimos cómo cualquier matriz en $M_{m,n}(F)$ se podía ver como una transformación lineal de $F^n$ a $F^m$ y viceversa. Retomaremos varias de estas ideas, pues son fundamentales para esta unidad y las siguientes.

La idea de esta entrada es:

  • Dar la intuición y definición de transformaciones lineales en general.
  • Probar propiedades básicas de las transformaciones lineales.
  • Dar varios ejemplos de transformaciones lineales.
  • Dar las definiciones de kernel (o núcleo) y de imagen para una transformación lineal.
  • Ver un ejemplo que abarque ambas definiciones.
  • Finalmente, probar que el kernel y la imagen son subespacios vectoriales.

A grandes rasgos, las transformaciones lineales se pueden pensar como «funciones bonitas» entre espacios vectoriales que «preservan las operaciones de suma y multiplicación por escalar».

Definición de transformaciones lineales

Definición. Para $V$ y $W$ espacios vectoriales sobre un campo $F$, una transformación lineal entre $V$ y $W$ es una función $T:V\to W$ tal que:

  • Para todo $v_1$ y $v_2$ en $V$ se tiene que $T(v_1+v_2)=T(v_1)+T(v_2)$. Esto informalmente se le conoce como que «$T$ abre sumas».
  • Para todo $v$ en $V$ y $c$ en el campo $F$ se tiene que $T(cv)=cT(v)$. A esto se le conoce como que «$T$ saca escalares».

En la primer condición la suma de la izquierda (dentro del paréntesis) es «la suma de $V$» y la suma de la derecha es «la suma de $W$». De manera similar, en la segunda condición el producto por escalar de la izquierda (dentro del paréntesis) es el de $V$ y el de la derecha es el de $W$.

En lo que resta de esta entrada, supondremos que los espacios vectoriales son sobre un mismo campo $F$.

Ejemplos de tranformaciones lineales

Ejemplo 1. La función $T:\mathbb{R}^2 \to \mathbb{R}$ dada por $T(x,y)=x+y+1$ no es una transformación lineal. De hecho falla en ambas condiciones. Falla en abrir sumas pues, por ejemplo, $T(1,1)=3$, $T(2,2)=5$, pero $(1,1)+(2,2)=(3,3)$ y $$T(3,3)=7\neq 5 = T(1,1)+T(2,2.)$$ También falla en sacar escalares pues, por ejemplo $$T(4,2)=7\neq 8 = 2T(2,1).$$

$\triangle$

Ejemplo 2. La función $T:\mathbb{R}^3 \to \mathbb{R}^3$ dada por $T(x,y,z)=(2x,2y,2z)$ es una transformación lineal.

Para convencernos de que esto es cierto, notemos que si $v=(x,y,z)$ entonces la transformación está dada por $T(v)=2v$. Ahora, tomemos dos vectores $v_1$ y $v_2$ en $V$, y un real $c$. Tenemos por la asociatividad y conmutatividad de multiplicar por escalares en $\mathbb{R}^3$ que: \begin{align*}T(v_1+v_2)&=2(v_1+v_2)\\&=2v_1+2v_2\\&=T(v_1)+T(v_2),\end{align*} y que $$T(cv_1)=2(cv_1)=c(2v_1)=cT(v_1).$$ Esto muestra que $T$ es transformación lineal.

$\triangle$

Ejemplo 3. De hecho, para cualquier espacio vectorial $V$ sobre el campo $F$ y $c$ un escalar de $F$, la función $T:V\to V$ dada por $T(v)=cv$ es una transformación lineal. El argumento es similar.

$\triangle$

Recuerda que $F_n[x]$ es el espacio vectorial de polinomios con coeficientes en $F$ y grado a lo más $n$. Recuerda también que hemos visto muchos tipos de espacios vectoriales, los $F^n$, los de polinomios, los de matrices, etc. Entre cualesquiera de ellos se pueden tener transformaciones lineales. La única condición es que sean espacios vectoriales sobre el mismo campo $F$.

Ejemplo 4. La función $T:\mathbb{R}^2\to \mathbb{R}_2[x]$ que manda al vector $(a,b)$ al polinomio $x^2+(a-b)x+ab$ no es una transformación lineal. Esto lo podemos verificar viendo que falla la parte de sacar escalares. Por un lado $$2(T(1,1))=2(x^2+1)=2x^2+2,$$ mientras que por otro lado $$T(2,2)=x^2+4,$$ así que $2(T(1,1))\neq T(2,2)$, de modo que $T$ no saca escalares.

$\triangle$

En cambio, si tomamos la función que manda al vector $(a,b)$ al polinomio $ax^2+(a-b)x+a+b$, puedes verificar por tu cuenta que sí es una transformación lineal.

Ejemplo 5. La función $T:M_{2,3}(\mathbb{R})\to \mathbb{R}^3$ que manda a la matriz $$M=\begin{pmatrix}
a & b & c\\
d & e & f
\end{pmatrix}$$ al vector $$T(M):= (a-d, b-e, c-f)$$ es una transfomación lineal.

Veamos que $T$ abre sumas. Tomemos dos matrices $M_1=\begin{pmatrix}
a_1 & b_1 & c_1\\
d_1 & e_1 & f_1
\end{pmatrix}$ y $M_2=\begin{pmatrix}
a_2 & b_2 & c_2\\
d_2 & e_2 & f_2
\end{pmatrix}.$ Por un lado \begin{align*}T(M_1)&=(a_1-d_1,b_1-e_1,c_1-f_1)\\T(M_2)&=(a_2-d_2,b_2-e_2,c_2-f_2),\end{align*} de modo que sumando los vectores y reacomodando tenemos que $$T(M_1)+T(M_2)=((a_1+a_2)-(d_1+d_2),(b_1+b_2)-(e_1+e_2),(c_1+c_2)-(f_1+f_2)).$$

Por otro lado, si primero sumamos las matrices, obtenemos la matriz $$M_1+M_2=\begin{pmatrix}
a_1+a_2 & b_1+b_2 & c_1+c_2\\
d_1+d_2 & e_1+e_2 & f_1+f_2
\end{pmatrix}.$$

Así, $$T(M_1+M_2)=((a_1+a_2)-(d_1+d_2),(b_1+b_2)-(e_1+e_2),(c_1+c_2)-(f_1+f_2)).$$ Esto muestra que $T(M_1+M_2)=T(M_1)+T(M_2)$, es decir, que $T$ abre sumas. Con un argumento parecido se puede mostrar que saca escalares.

$\triangle$

Ejemplo 6. La función $T:\mathbb{R}^2\to \mathbb{R}_2[x]$ que manda al vector $(a,b)$ al polinomio $T(a,b)=(a+b)x^2+(a-b)x+b$ es una transformación lineal.

$\triangle$

Recuerda que $C[0,1]$ es el espacio vectorial de funciones $f:[0,1]\to \mathbb{R}$ continuas.

Ejemplo 7. La función $T:C[0,1]\to \mathbb{R}$ que manda a la función $f$ al real $$T(f):=\int_0^1 f(x)\, dx$$ es una transformación lineal. En efecto, para dos funciones $f$ y $g$ continuas en el $[0,1]$ y un real $c$ se tiene por definición de suma de funciones, de multiplicación por escalar y de propiedades de la integral que \begin{align*}\int_0^1 (f+g)(x)\, dx&=\int_0^1 f(x)+g(x)\, dx\\&=\int_0^1 f(x) \, dx+\int_0^1 g(x)\, dx\end{align*} y que \begin{align*}\int_0^1 (cf)(x)\, dx &= \int_0^1 cf(x)\, dx \\&=c \int_0^1 f(x)\, dx.\end{align*}

En otras palabras, $T(f+g)=T(f)+T(g)$ y $T(cf)=cT(f)$.

$\triangle$

Propiedades básicas de transformaciones lineales

La definición de «transformación lineal» pide dos cosas por separado: abrir sumar y sacar escalares. Es bueno tenerlas por separado para referirnos a ellas individualmente. Sin embargo, la siguiente proposición nos ayuda a probar de manera más práctica que $T$ es una transformación lineal.

Proposición (verificación abreviada). Sean $V$ y $W$ espacios vectoriales sobre un mismo campo $F$. $T:V\to W$ es una transformación lineal si y sólo si para todo $v_1,v_2$ en $V$ y $c$ en $F$ se tiene que $$T(cv_1+v_2)=cT(v_1)+T(v_2).$$

Demostración. En efecto, si $T$ es transformación lineal, entonces $T(cv_1)=cT(v_1)$ porque $T$ saca escalares y así \begin{align*}T(cv_1+v_2)&=T(cv_1)+T(v_2)\\&=cT(v_1)+T(v_2).\end{align*} Por otro lado, si se cumple $T(cv_1+v_2)=cT(v_1)+T(v_2)$ para todos $v_1$ y $v_2$ vectores en $V$ y $c$ escalar en $F$, entonces con $v_2=0$ recuperamos que $T$ saca escalares y con $c=1$ recuperamos que $T$ abre sumas.

$\square$

Las transformaciones lineales mandan al cero de un espacio vectorial al cero del otro.

Proposición (cero va a cero). Sean $V$ y $W$ espacios vectoriales sobre un mismo campo. Si $T:V\to W$ es una transformación lineal, entonces $T(0)=0$.

Demostración. El truco es encontrar $T(0+0)$ de dos formas distintas. Por un lado, como $0+0=0$, tenemos que $T(0+0)=T(0)$. Por otro lado, como $T$ abre sumas, tenemos que $T(0+0)=T(0)+T(0)$. Así, tenemos que $$T(0)+T(0)=T(0).$$ Restando $T(0)$ de ambos lados obtenemos $T(0)=0$.

$\square$

De hecho, hay otra forma de probar la proposición anterior usando que $T$ saca escalares: $T(0)=T(0\cdot 0)=0T(0)=0$. Piensa en por qué cada una de estas igualdades se vale y por qué adentro del paréntesis que hay dos ceros, uno de ellos es vector y el otro escalar.

Las transformaciones lineales también «respetan» inversos aditivos.

Proposición (inversos aditivos van a inversos aditivos). Sean $V$ y $W$ espacios vectoriales sobre un mismo campo. Si $T:V\to W$ es una transformación lineal, entonces $T(-v)=-T(v)$.

La demostración es sencilla y la puedes pensar por tu cuenta.

El haber enunciado estas proposiciones nos puede ayudar para decir, de golpe, que algunas funciones no son transformaciones lineales: si una función falla en tener alguna de las propiedades anteriores, entonces no es transformación lineal.

Ejemplo 1. Sea $V$ el espacio vectorial $\mathbb{R}^2$ y $W$ el espacio vectorial de matrices de $2\times 2$ con entradas complejas, pero visto como espacio vectorial sobre $\mathbb{R}$ (sólo se permite usar reales para la multiplicación escalar).

La transformación $T:V\to W$ que manda al vector real $(a,b)$ a la matriz de entradas complejas $T(a,b)=\begin{pmatrix}
a+ib & a-ib \\
a-ib & 1+abi\end{pmatrix}$ no es una transformación lineal pues manda al $(0,0)$ a la matriz $\begin{pmatrix}
0 & 0 \\
0 & 1\end{pmatrix},$ la cual no es la matriz $0$.

$\triangle$

Sin embargo, una pequeña advertencia. Es posible que $T$ sí mande el $0$ al $0$, pero que de cualquier forma no sea una transformación lineal, debido a que falle por otras razones.

Ejemplo 2. La transformación $T:\mathbb{R}^3 \to \mathbb{R}^3$ dada por $$T(x,y,z)=(x+y+z,xy+yz+zx,xyz)$$ cumple que $T(0,0,0)=(0,0,0)$, pero no es una transformación lineal pues no saca escalares. Por ejemplo, $$T(3,3,3)=(9,27,27)\neq 3(3,3,1)= 3T(1,1,1).$$

$\triangle$

Kernel e imagen de una transformación lineal

Tomemos $T:V\to W$ una transformación lineal. Hay dos conjuntos muy importantes relacionados con $T$.

El kernel (o núcleo) de $T$ es el conjunto de vectores en $V$ que se van al vector $0$ de $W$ cuando les aplicamos $T$. En símbolos, $$\ker(T)=\{v\in V: T(v)=0\}.$$

La imagen de $T$ son los vectores en $W$ que se pueden escribir de la forma $T(v)$ para algún $v$ en $V$, es decir, es la imagen en el sentido clásico de teoría de conjuntos o de cálculo. En símbolos, $$\Ima(T)=\{T(v): v\in V\}.$$

Haciendo énfasis de nuevo: $\ker(T)$ es un subconjunto de vectores de $V$ e $\Ima(T)$ es un subconjunto de vectores de $W$. Veamos un ejemplo que nos ayudará a repasar varios de los conceptos clave de esta entrada.

Problema. Consideremos la transformación $T:M_2(\mathbb{R})\to M_{2,3}(\mathbb{R})$ dada por $$T\begin{pmatrix}a & b \\ c & d\end{pmatrix}=\begin{pmatrix}a & b \\ c & d \end{pmatrix} \begin{pmatrix}
1 & 1 & 1\\
1 & 1 & 1\end{pmatrix}.$$

Muestra que $T$ es una transformación lineal y determina $\ker(T)$ e $\Ima(T)$.

Intenta resolver este problema por tu cuenta antes de seguir.

Solución. Sean $A$ y $B$ matrices de $2\times 2$ con entradas reales y $r$ un real. Nombremos $C=\begin{pmatrix}
1 & 1 & 1\\
1 & 1 & 1\end{pmatrix}$. Por propiedades de producto de matrices, tenemos que \begin{align*}T(rA+B)&=(rA+B)C \\ &=r(AC)+BC\\ &=rT(A)+T(B),\end{align*} así que por la proposición de verificación abreviada, tenemos que $T$ es una transformación lineal.

Ahora, tomemos una matriz $A=\begin{pmatrix}
a & b \\
c & d \end{pmatrix}$ y notemos al hacer la multiplicación de manera explícita, obtenemos que $T(A)$ es la matriz $$\begin{pmatrix}
a+b & a+b & a+b\\
c+d & c+d & c+d \end{pmatrix}.$$

Determinemos quién es $\Ima(T)$. Para que una matriz $M:=\begin{pmatrix}
e & f & g\\
h & i & j \end{pmatrix}$ esté en la imagen de $T$, se tiene que cumplir que $e=f=g$ y que $h=i=j$.

Y viceversa, si $e=f=g$ y $h=i=j$, entonces $M$ está en la imagen de $T$ pues, por ejemplo $$T\begin{pmatrix}
e & 0\\
h & 0 \end{pmatrix}=\begin{pmatrix}
e & e & e\\
h & h & h\end{pmatrix}=M.$$

Esto muestra que $$\Ima (T) = \left\{\begin{pmatrix}
e & e & e\\
h & h & h \end{pmatrix}: e,h \in \mathbb{R}\right\}.$$

Ahora determinemos quién es $\ker(T)$. Para que $A$ esté en el kernel de $T$, necesitamos que todas las entradas de $T(A)$ sean $0$. Para esto es suficiente y necesario que $a+b=0$ y que $c+d=0$, o dicho de otra forma, que $A$ sea de la forma $A=\begin{pmatrix}
a & -a \\
c & -c \end{pmatrix}$. Así, concluimos que $$\ker(T)=\left\{\begin{pmatrix}
a & -a \\
c & -c \end{pmatrix}: a,c \in \mathbb{R}\right\}.$$

$\square$

Con esto ya terminamos lo que pide el problema. Sin embargo, hagamos una observación clave. En el problema anterior, $\ker(T)$ e $\Ima(T)$ no solamente son subconjuntos de $M_2(\mathbb{R})$ y de $M_{2,3}(\mathbb{R})$ respectivamente, sino que además son subespacios. Esto no es casualidad.

Los kernels e imágenes de transformaciones lineales son subespacios

Teorema. Sean $V$ y $W$ espacios vectoriales sobre un mismo campo. Si $T:V\to W$ es una transformación lineal, entonces $\ker(T)$ es un subespacio de $V$ e $\Ima(T)$ es un subespacio de $W$.

Demostración. Demostraremos primero que $\ker(T)$ es un subespacio de $V$. Para ello basta con tomar $v_1,v_2$ en $\ker(T)$ y $c$ en el campo $F$ y mostrar que $cv_1+v_2$ también está en $\ker(T)$, es decir, que también sucede que $T(cv_1+v_2)=0$. Esto se debe a la siguiente cadena de igualdades, que justificamos abajo \begin{align*}
T(cv_1+v_2)&=T(cv_1)+T(v_2)\\
&=cT(v_1)+T(v_2)\\
&=c\cdot 0 + 0 \\
&= 0.
\end{align*}

La primera igualdad se debe a que $T$ abre sumas. La segunda a que $T$ saca escalares. La tercera a que $v_1$ y $v_2$ están en el kernel de $T$ y por lo tanto sabemos que $T(v_1)=T(v_2)=0$. La última es simplemente hacer la operación. Con esto mostramos que $\ker(T)$ es un subespacio de $V$.

Ahora, veremos que $\Ima(T)$ es un subespacio de $W$. Tomemos $w_1$ y $w_2$ en $\Ima(T)$, y un escalar $c$ en el campo $F$. De nuevo, basta mostrar que $cw_1+w_2$ está en $\Ima(T)$. Como $w_1$ y $w_2$ están en la imagen de $T$, esto quiere decir que existen vectores $v_1$ y $v_2$ en $V$ tales que $T(v_1)=w_1$ y $T(v_2)=w_2$. Notemos que entonces:
\begin{align*}
cw_1+w_2&=cT(v_1)+T(v_2)\\
&=T(cv_1)+T(v_2)\\
&=T(cv_1+v_2).
\end{align*}

La segunda y tercera igualdad vienen de que $T$ saca escalares y abre sumas respectivamente. Esta cadena de igualdades muestra que podemos poner a $cw_1+w_2$ como imagen de alguien en $V$ bajo $T$, es decir, que $cw_1+w_2$ pertenece a $\Ima(T)$. Esto es lo que queríamos mostrar.

$\square$

Más adelante…

En esta entrada definimos los conceptos de transformación lineal, de imagen y de kernel. También vimos que la imagen y kernel de transformaciones lineales son subespacios. Más adelante veremos que $\ker(T)$ e $\Ima(T)$ están de hecho relacionados más profundamente.

Por ahora, nota que en el ejemplo antes del teorema tenemos que $\begin{pmatrix}
1 & 1 & 1\\
0 & 0 & 0 \end{pmatrix}$ y $\begin{pmatrix}
0 & 0 & 0\\
1 & 1 & 1 \end{pmatrix}$ forman una base de $\Ima(T)$ pues son linealmente independientes y todo elemento en la imagen es combinación lineal de estas matrices. Además, nota que de manera similar $\begin{pmatrix}
1 & -1 \\
0 & 0 \end{pmatrix}$ y $\begin{pmatrix}
0 & 0 \\
1 & -1 \end{pmatrix}$ forman una base de $\ker(T)$.

Esto nos dice que $\dim(\Ima(T))=2$ y que $\dim(\ker(T))=2$. Si sumamos ambos, nos da la dimensión de $M_2(\mathbb{R})$. ¿Será casualidad?

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Verifica que las transformaciones lineales que se pusieron como ejemplo en efecto abren sumas y sacan escalares.
  • Asegúrate de entender los detalles de la prueba de la proposición de la verificación abreviada. Úsala para mostrar que la función que manda al vector $(a,b,c)$ a la matriz $$\begin{pmatrix} a & b & c \\ c & a & b \\ b & c & a \end{pmatrix}$$ es una transformación lineal de $\mathbb{R}^3$ a $M_3(\mathbb{R})$.
  • Muestra la proposición de que inversos aditivos van a inversos aditivos.
  • Determina el kernel y la imagen de las transformaciones lineales $T:V\to W$ que se dieron como ejemplo.
  • Para cada kernel e imagen que encuentres, convéncete de que son subespacios. Determina si tienen dimensión finita y, en ese caso, determina la dimensión. Para estos casos, ¿cómo están relacionados $\dim(\Ima(T)),\dim(\ker(T)),\dim(V)$?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»