Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Teoría de los Conjuntos I: Funciones suprayectivas y biyectivas

Por Gabriela Hernández Aguilar

Introducción

Si tenemos dos conjuntos $X$ y $Y$ y se nos pide definir una función $f:X\to Y$ lo que debemos hacer es relacionar a cada uno de los elementos de $X$ con un único elemento de $Y$. Esta forma de proceder no garantiza que cualquier elemento de $Y$ se encuentra relacionado con algún elemento de $X$. Aquellas funciones que sí cumplan esto último les llamaremos funciones suprayectivas y será el tema que trataremos en esta entrada.

Función suprayectiva

Definición. Sea $f:X\to Y$ una función. Si $f[X]=Y$, entonces decimos que $f$ es suprayectiva.

$\square$

Teorema. Sea $f:X\to Y$ una función. Entonces los siguientes enunciados son equivalentes:

  1. $f$ es suprayectiva.
  2. Para cualquier $y\in Y$, existe $x\in X$ tal que $f(x)=y$.
  3. Para cualesquiera $h,k:Y\to Z$ tales que $h\circ f= k\circ f$, se tiene que $h=k$.

Demostración.

$1)\rightarrow 2)$

Supongamos que $f$ es suprayectiva, es decir que $f[X]=Y$. Sea $y\in Y$, entonces $y\in f[X]$ por lo que existe $x\in X$ tal que $f(x)=y$. Por lo tanto, para cualquier $y\in Y$ existe $x\in X$ tal que $f(x)=y$.

$2)\rightarrow 3)$

Sean $h,k:Y\to Z$ tales que $h\circ f=k\circ f$. Veamos que $h=k$. Sea $y\in Y$, veamos que $h(y)=k(y)$. Dado que $y\in Y$, por hipótesis tenemos que existe $x\in X$ tal que $f(x)=y$, por lo que $h(y)= h(f(x))$ y $k(y)= k(f(x))$. Luego, como $(h\circ f)(x)= h(f(x))= k(f(x))= (k\circ f)(x)$, tenemos que $h(y)= k(y)$.

$3)\rightarrow 1)$

Observemos que $f[X]\subseteq Y$, por lo que resta probar que $Y\subseteq f[X]$. Definamos $h: Y\to \set{0,1}$ y $k: Y\to \set{0,1}$ funciones dadas por $h(y)=0$ para todo $y\in Y$ y

\begin{align*}
k(y) = \left\{ \begin{array}{lcc}
0 &  \text{si} & y\in f[X]\\
1 &  \text{si}  & y \notin f[X] \\
\end{array}
\right.
\end{align*}

respectivamente.

Sea $x\in X$, entonces $f(x)\in Y$ y así, $(h\circ f)(x)= h(f(x))=0$ y $(k\circ f)(x)= k(f(x))=0$. Por lo tanto, $h\circ f=k\circ f$ y, por hipótesis $h=k$.

Si tomamos $y\in Y$, $h(y)=k(y)$. Esto significa que $k(y)=0$, por lo tanto, debe ocurrir que $y\in f[X]$.

Algunas funciones suprayectivas

Ejemplo.

La función identidad es suprayectiva. En efecto, sea $Id_X:X\to X$ la función identidad y sea $y\in X$, entonces $y\in X$ satisface $Id_X(y)= y$.

Por lo tanto, $Id_X$ es suprayectiva.

$\square$

Ejemplo.

Sea $X$ un conjunto no vacío y $f:X\to \set{c}$ una función dada por $f(x)=c$ para todo $x\in X$. Tenemos que $f$ es suprayectiva.

Dado que $c$ es el único elemento de $\set{c}$, debemos encontrar que existe $x\in X$ tal que $f(x)=c$. Como $X$ no es vacío, existe $x\in X$ y es tal que que $f(x)=c$.

$\square$

Ejemplo.

Sea $X$ un conjunto y $A\subseteq X$ un subconjunto propio de $X$ (distinto de $X$ y no vacío). La función característica de $A$ es una función suprayectiva.

Deseamos ver que para cualquier $y\in \set{0,1}$ existe $x\in X$ tal que $\chi_A(x)=y$.

Caso 1: Si $y=0$, entonces tomemos $x\in X\setminus A$ de modo que $\chi_A(x)=0$.

Caso 2: Si $y=1$, entonces tomemos $x\in A$, de modo que $\chi_A(x)=1$.

Por lo tanto, $\chi_A$ es suprayectiva.

$\square$

Composición de funciones y suprayectividad

Así como lo hicimos en la entrada anterior con respecto a la inyectividad, también podemos averiguar qué pasa con la composición de funciones con respecto a la suprayectividad. Tenemos el siguiente teorema.

Teorema. Sean $f:X\to Y$ y $g:Y\to Z$ funciones suprayectivas, $g\circ f$ es suprayectiva.

Demostración.

Sea $z\in Z$, y veamos que existe $x\in X$ tal que $(g\circ f)(x)=z$.
Dado que $g$ es suprayectiva y $z\in Z$, entonces existe $y\in Y$ tal que $g(y)=z$. Luego, como $f$ es suprayectiva y $y\in Y$, entonces existe $x\in X$ tal que $f(x)=y$, así $z=g(y)=g(f(x))$. Por lo tanto, $g\circ f$ es suprayectiva.

$\square$

Funciones biyectivas

Definición. Decimos que $f:X\to Y$ es una función biyectiva si y sólo si $f$ es inyectiva y suprayectiva.

Ejemplo.

La función identidad es biyectiva.

Verificamos en la entrada de funciones inyectivas que la función identidad es una función inyectiva, además de que en esta entrada verificamos que es suprayectiva.

$\square$

Ejemplo.

Sean $X=\set{1,2,3}$ y $Y=\set{2,4,6}$ y sea $f:X\to Y$ la función dada por $f(x)=2x$. Tenemos que $f$ es inyectiva pues es una función uno a uno, es decir, elementos distintos van a dar a elementos distintos. Más explícitamente $1$ va a dar a $2$, $2$ a $4$ y $3$ a $6$.

Además $f$ es suprayectiva, pues para cualquier $y\in Y$, existe $x\in X$ tal que $f(x)=y$. En efecto, esto sucede ya que para $2\in Y$ existe $1\in X$ tal que $f(1)=2$; para $4\in Y$ existe $2\in X$ tal que $f(2)=4$ y por último para $6\in Y$ existe $3\in X$ tal que $f(3)=6$.

$\square$

Tarea moral

Realiza la siguiente lista de ejercicios que te ayudará a fortalecer los conceptos de función inyectiva, suprayectiva y biyectiva.

  1. Sean $f:X\to Y$ y $g:Y\to Z$ funciones. Demuestra que si $g\circ f$ es suprayectiva, entonces $g$ es suprayectiva.
  2. Demuestra o da un contraejemplo del siguiente enunciado: Si $f:X\to Y$ y $g:Y\to Z$ son funciones tales que $g\circ f$ es suprayectiva, entonces $f$ es suprayectiva.
  3. Sean $X=\set{1,2,3, \cdots}$ y $Y=\set{3,4,5,\cdots}$ y sea $f:X\to Y$ dada por $f(x)=2x+3$. ¿$f$ es suprayectiva? Argumenta tu respuesta. Quizás a estas alturas tengas que ser un poco informal en términos de teoría de conjuntos, pero usa lo que conoces de las operaciones de números.

Más adelante…

Ahora que aprendimos el concepto de función inyectiva y suprayectiva tenemos las bases suficientes para hablar de funciones invertibles. Veremos funciones invertibles por la derecha e invertibles por la izquierda, cuyos conceptos resultarán equivalentes al de función suprayectiva y función inyectiva respectivamente.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Teoría de los Conjuntos I: Funciones inyectivas

Por Gabriela Hernández Aguilar

Introducción

En esta entrada abordaremos el concepto de función inyectiva. Una función inyectiva será aquella que relacione elementos distintos del dominio con elementos distintos del codominio.

Función inyectiva

Definición. Sea $f: X \to Y$. Decimos que $f$ es una función inyectiva si para cualesquiera $x_1$, $x_2 \in X$ tales que $x_1\not=x_2$, se tiene que $f(x_1)\not= f(x_2)$.

Ejemplo.

Sean $X=\set{1,2,3,4}$ y $Y=\set{1,2,3,4,5}$ y sea $f:X\to Y$ una función dada por $f=\set{(1,2), (2,1), (3,3), (4,5)}$. Decimos que $f$ es inyectiva pues cada elemento de $X$ bajo la función va a dar a un elemento distinto de $Y$, como se muestra en la siguiente imagen:

Ejemplo.

La función identidad es una función inyectiva.

En efecto, dado que $Id_X:X\to X$ esta dada por $Id_X(x)=x$, entonces si $x_1,x_2\in X$ son tales que $Id_X(x_1)=Id_X(x_2)$, entonces tendríamos $x_1=Id_X(x_1)=Id_X(x_2)=x_2$. Así, $x_1=x_2$ y por lo tanto $Id_X$ es inyectiva.

$\square$

Ejemplo.

La función constante no es inyectiva.

Consideremos $X=\set{1,2,3}$ y $Y=\set{1}$. Sea $f:X\to Y$ la función dada por $f(x)=1$ para toda $x\in X$. Consideremos $x_1=1$ y $x_2=2$ elementos de $X$. Sabemos que $1\not=2$ por lo que para que nuestra función sea inyectiva esperamos que $f(x_1)\not=f(x_2)$, sin embargo, $f(1)=1=f(2)$. Esto demuestra que, en general, las funciones constantes no son inyectivas.

$\square$

Equivalencias de inyectividad

Aunque la definición de inyectividad es muy intuitiva («mandar elementos distintos a elementos distintos»), en la práctica nos conviene tener una serie de equivalencias de esta definición que podamos usar en situaciones variadas.

Teorema. Sea $f:X\to Y$ una función tal que $X\not=\emptyset$. Entonces los siguientes enunciados son equivalentes:

  1. $f$ es inyectiva.
  2. Para cualesquiera $x_1,x_2\in X$ si $f(x_1)=f(x_2)$, entonces $x_1=x_2$.
  3. Para cualesquiera $h,k:Z\to X$ si $f\circ h= f\circ k$, entonces $h=k$.
  4. Para cualesquiera $A,B$ subconjuntos de $X$, se cumple que $f[B\setminus A]= f[B]\setminus f[A]$.
  5. Para cualesquiera $A,B$ subconjuntos de $X$ se cumple que $f[A\cap B]= f[A]\cap f[B]$.

Demostración.

$1)\rightarrow 2)$
Supongamos que $f$ es inyectiva, esto es, para cualesquiera $x_1, x_2\in X$ tales que $x_1\not=x_2$ se tiene que $f(x_1)\not=f(x_2)$. Luego, sabemos que la implicación es equivalente a la contrapositiva por lo que podemos concluir que para cualesquiera $x_1, x_2\in X$, si $f(x_1)=f(x_2)$ entonces $x_1=x_2$.

$2)\rightarrow 3)$
Supongamos que para cualesquiera $x_1, x_2\in X$ si $f(x_1)=f(x_2)$, entonces $x_1= x_2$ y supongamos que $h,k:Z\to X$ son funciones tales que $f\circ h= f\circ k$ y veamos que $h=k$.

Sea $z\in Z$, entonces $h(z)\in X$ y $k(z)\in X$, luego como $f\circ h=f\circ k$ tenemos que $(f\circ h)(z)= (f\circ k)(z)$, de donde $f(h(z))= f(k(z))$ y como $f$ es inyectiva entonces $h(z)=k(z)$. Por lo tanto, $h(z)=k(z)$ para todo $z\in Z$. Para concluir que $h=k$ notemos lo siguiente: $(z,y)\in h$ si y sólo si $h(z)=y$, lo cual ocurre si y sólo si $k(z)=y$, es decir, si y sólo si $(z,y)\in k$.

$3)\rightarrow 4)$

Supongamos que para cualesquiera $h,k:Z\to X$ se cumple que si $f\circ h= f\circ k$, entonces $h=k$. Sean $A,B$ conjuntos tales que $A\subseteq B\subseteq X$ y veamos que $f[B\setminus A]= f[B]\setminus f[A]$.

En la entrada de funciones vimos que siempre ocurre que $f[B]\setminus f[A]\subseteq f[B\setminus A]$ por lo que basta ver la otra contención.

Sea $y\in f[B\setminus A]$, entonces existe $x\in B\setminus A$ tal que $f(x)=y$. Tenemos que $x\in B$ y $x\notin A$, de modo que $f(x)\in f[B]$. Resta ver que $f(x)\notin f[A]$. Supongamos que sí ocurre, es decir que $f(x)\in f[A]$. Entonces existe $z\in A$ tal que $f(z)=f(x)$.

Definamos $h:X\to X$ dada por $h(a)=x$ para todo $a\in X$ y $k:X\to X$ dada por $k(a)=z$ para todo $a\in X$. Notemos que $h\not=k$ pues $z\not=x$ ya que $z\in A$ y $x\notin A$. Luego, $(f\circ h)(a)=f(h(a))= f(x)$ y $(f\circ k)(a)= f(k(a))= f(z)=f(x)$ para cada $a\in A$, por lo que $f\circ h=f\circ k$. Así, por hipótesis se sigue que $h=k$ lo cuál es una contradicción, por lo tanto, no debe ocurrir que $f(x)\in f[A]$. Así, $f(x)\in f[B]\setminus f[A]$.

$4)\rightarrow 5)$

Supongamos que para cualesquiera $A, B$ subconjuntos de $X$, se cumple que $f[B\setminus A]=f[B]\setminus f[A]$. Veamos que $f[A\cap B]= f[A]\cap f[B]$.

En la entrada de funciones probamos que $f[A\cap B]\subseteq f[A]\cap f[B]$, por lo que basta ver que $f[A]\cap f[B]\subseteq f[A\cap B]$.

Sea $y\in f[A]\cap f[B]$, entonces $y\in f[A]$ y $y\in f[B]$, así existe $x\in A$ tal que $f(x)=y$. Queremos demostrar que $x\in B$. Supongamos que no es así, es decir $x\notin B$. Por lo tanto, $x\in A\setminus B$ y $y=f(x)\in f[A\setminus B]= f[A]\setminus f[B]$.

Se sigue que $y\in f[A]$ y $y\notin f[B]$ lo cual es una contradicción. Por lo tanto, debe ocurrir que $x\in B$, así existe $x\in A\cap B$ tal que $f(x)=y$.

Por lo tanto, $f[A]\cap f[B]= f[A\cap B]$.

$5)\rightarrow 1)$

Supongamos que para cualesquiera $A, B\subseteq X$ se cumple que $f[A]\cap f[B]= f[A\cap B]$.

Sean $x_1, x_2\in X$ tales que $x_1\not= x_2$, veamos que $f(x_1)\not= f(x_2)$.

Consideremos $\set{x_1}$ y $\set{x_2}$ subconjuntos de $X$. Luego,

\begin{align*}
\emptyset&=f[\emptyset]\\
&=f[\set{x_1}\cap \set{x_2}]\\
&=f[\set{x_1}]\cap f[\set{x_2}]\ \text{por hipótesis}\\
&=\set{f(x_1)}\cap \set{f(x_2)}.
\end{align*}

Luego, como $\set{f(x_1)}\cap \set{f(x_2)}=\emptyset$, se tiene $\set{f(x_1)}\not=\set{f(x_2)}$ y por lo tanto, $f(x_1)\not=f(x_2)$.

Por lo tanto, $f$ es inyectiva.

Por lo tanto, todos los enunciados anteriores son equivalentes.

$\square$

Aunque existen muchas equivalencias de función inyectiva, para estas notas usaremos con mayor frecuencia la equivalencia dos del resultado anterior.

¿Qué pasa con la composición y la inyectividad?

Anteriormente vimos que la composición de funciones (pensándolas como relaciones) resulta ser una función. Podemos preguntarnos qué ocurre si las funciones que conforman a la composición son inyectivas. ¿Será que eso implica que la composición es inyectiva? Esto lo responde el siguiente teorema.

Teorema. Sean $f:X\to Y$ y $g:Y\to Z$ funciones inyectivas. Se cumple que $g\circ f$ es inyectiva.

Demostración.

Sean $f$ y $g$ funciones inyectivas y sean $x_1, x_2\in X$ tales que $(g\circ f)(x_1)= g(f(x_1))=g(f(x_2))= (g\circ f)(x_2)$. Dado que $f(x_1), f(x_2)\in Y$ y $g$ es inyectiva, entonces $ g(f(x_1))=g(f(x_2)) $ implica que $f(x_1)=f(x_2)$. Por la inyectividad de $f$ podemos concluir que $x_1=x_2$. Por lo tanto, $g\circ f$ es una función inyectiva.

$\square$

Tarea moral

La siguiente lista de ejercicios te permitirá reforzar el tema de funciones inyectivas.

  • Demuestra que la función inclusión es inyectiva.
  • Sean $A=\set{1,2,3}$, $B=\set{1,2}$ y $C=\set{1,2}$ conjuntos. Sean $f:A\to B$ y $g:B\to C$ funciones dadas por $f=\set{(1,1), (2,1), (3,2)}$ y $g=\set{(1,2), (2,1)}$ respectivamente. Escribe al conjunto $g\circ f$ y ve si la función correspondiente es inyectiva. Argumenta tu respuesta.
  • Si $f\circ g$ es inyectiva, ¿es cierto que $f$ y $g$ son inyectivas? ¿Será cierto que por lo menos una de ellas siempre es inyectiva?
  • Demuestra que la función $\emptyset$ es inyectiva.
  • Demuestra que $f:X\to Y$ una función constante es inyectiva si y sólo si $X=\set{x}$ para algún conjunto $x$.

Más adelante…

En la siguiente entrada abordaremos el tema de funciones suprayectivas. Con este tema tendremos los conceptos necesarios para comenzar a hablar acerca de funciones biyectivas e invertibles.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Proceso de Gram-Schmidt en espacios euclideanos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior recordamos algunas de las aplicaciones que pueden tener las bases ortogonales y ortonormales. Esto nos da la pista de que siempre es bueno intentar conseguir una base ortonormal. ¿Es esto siempre posible? En el primer curso de Álgebra Lineal vimos que si tenemos en espacio euclideano, entonces sí. Esto está explicado a detalle en la entrada del Proceso de Gram-Schmidt.

Esta entrada está escrita únicamente en formato de recordatorio. Enunciamos los resultados principales, pero las demostraciones y más ejemplos se encuentran en otras entradas.

Teorema de Gram-Schmidt

El teorema de Gram-Schmidt asegura que dado un conjunto de vectores linealmente independientes en un espacio vectorial real con un producto interior dado, podemos encontrar otros vectores que ahora sean ortonormales, que generen lo mismo y que además «apunten hacia un lado similar» a los vectores originales. Además, asegura que estos vectores son únicos. El resultado concreto es el siguiente.

Teorema. Sea $V$ un espacio vectorial real con producto interior $\langle \cdot, \cdot \rangle$. Sean $v_1,\ldots,v_d$ vectores linealmente independientes. Entonces, existen únicos vectores ortonormales $e_1,\ldots,e_d$ tales que para toda $k\in\{1,2,\ldots,d\}$ se tiene que $$\text{span}(e_1,\ldots,e_k)= \text{span}(v_1,\ldots,v_k)$$ y $\langle e_k, v_k \rangle >0$.

Muy a grandes rasgos, esta forma de escribir el teorema permite hacer inducción en $d$. Al pasar a un nuevo $d$, podemos usar hipótesis inductiva para construir $e_1,\ldots,e_{d-1}$. Así, sólo hay que ver cómo construir $e_d$ para que sea ortogonal a todos los anteriores y para que tenga norma $1$. Para encontrar a un buen candidato, se debe poner a $e_d$ en términos de los $e_1,\ldots,e_{d-1}$ y $v_d$, y se debe suponer que cumple lo deseado. Al hacer algunos productos interiores esto nos dice que $e_d$ forzosamente se construye definiendo

$$f_d=v_d-\sum_{i=1}^{d-1}\langle v_d, e_i\rangle e_i$$

y tomando $e_d=\frac{f_d}{\norm{f_d}}$.

En los detalles de la prueba se ve que este $e_d$ en efecto cumple todo lo deseado.

Si estamos en un espacio euclideano, entonces tenemos una base finita. Podemos usar esta en la hipótesis del teorema de Gram-Schmidt para concluir lo siguiente.

Corolario. Todo espacio euclideano tiene una base ortonormal.

Algoritmo de Gram-Schmidt

La demostración del teorema de Gram-Schmidt a su vez da un algoritmo para encontrar de manera explícita la base ortonormal buscada. Es un algoritmo que poco a poco va construyendo los vectores. Supongamos que nos dan los vectores $v_1,\ldots,v_n$.

Para empezar, normalizamos $v_1$ para obtener $e_1=\frac{v_1}{\norm{v_1}}$. De aquí en adelante procedemos recursivamente. Si ya construimos $e_1,\ldots,e_k$, entonces podemos construir $e_{k+1}$ a través de la fórmula que pusimos, es decir, primero definimos

$$f_{k+1}=v_{k+1}-\sum_{i=1}^{k}\langle v_{k+1}, e_i\rangle e_i,$$

para luego tomar $e_{k+1}$ como la normalización de $f_{k+1}$, es decir, como $\frac{f_{k+1}}{\norm{f_{k+1}}}.$ Seguimos de esta manera hasta terminar.

El siguiente diagrama da una idea un poco más visual de cómo vamos haciendo las operaciones. Comenzamos con los vectores $v_1,\ldots,v_d$ de la fila superior. Luego, vamos construyendo a los $e_i$ y $f_i$ en el orden indicado por las flechas: $e_1,f_2,e_2,\ldots,f_{d-1},e_{d-1},f_d,e_d$. Para construir un $f_i$ usamos la fórmula con productos interiores. Para construir el $e_i$ correspondiente, normalizamos.

Intuición geométrica

Ya tenemos el lenguaje para entender mucho mejor el proceso de Gram-Schmidt. Si te das cuenta, cuando tomamos $$f_{k+1}=v_{k+1}-\sum_{i=1}^{k}\langle v_{k+1}, e_i\rangle e_i$$ justamente estamos aprovechando la descomposición

$$v_{k+1}= \left(\sum_{i=1}^{k}\langle v_{k+1}\right)+ f_{k+1}$$

de $v_{k+1}$ como suma de un elemento en espacio generado por $e_1,\ldots, e_k$ y uno en su ortogonal. El elemento del espacio generado lo obtenemos a través de la fórmula que sale de la descomposición de Fourier que vimos en la entrada anterior. El hecho de que $f_{k+1}$ esté en el ortogonal es lo que hace que cada nuevo vector sea ortogonal a los anteriores. Al final hay que normalizar $f_{k+1}$ para que la base sea ortonormal y no sólo ortogonal. Habría dos formas de hacerlo. Una es tomar $\frac{f_{k+1}}{\norm{f_{k+1}}}$. La otra es tomar $-\frac{f_{k+1}}{\norm{f_{k+1}}}$. El producto escalar positivo que pedimos es lo que nos da la unicidad.

Ejemplo de aplicación del algoritmo de Gram-Schmidt

Hagamos un ejemplo muy sencillo. Será sólo de práctica y como recordatorio. Hay ejemplos más interesantes en la entrada Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt.

Es sencillo verificar que $\langle (a,b,c), (x,y,z)\rangle =4ax+3by+2cz$ es un producto interior en $\mathbb{R}^3$. Vamos a ortonormalizar la base $(1,1,1)$, $(0,1,1)$, $(0,0,1)$.

En la notación del algoritmo, tenemos entonces $v_1=(1,1,1)$, $v_2=(0,1,1)$ y $v_3=(0,0,1)$. El primer paso es tomar $e_1=\frac{v_1}{\norm{v_1}}$. La norma de $v_1$ con este producto interior es $\sqrt{4+3+2}=3$. De este modo, $e_1=\left(\frac{1}{3}, \frac{1}{3} , \frac{1}{3} \right)$.

Teniendo $e_1$, podemos definir $f_2$ con la fórmula dada:

\begin{align*}
f_2&=v_2-\langle v_2, e_1 \rangle e_1\\
&=(0,1,1)-\left(4\cdot 0\cdot \frac{1}{3}+3\cdot 1 \cdot \frac{1}{3} + 2 \cdot 1 \cdot \frac{1}{3}\right)\left(\frac{1}{3},\frac{1}{3},\frac{1}{3} \right)\\
&=(0,1,1)-\frac{5}{3} \left(\frac{1}{3},\frac{1}{3},\frac{1}{3} \right)\\
&=\left(-\frac{5}{9},\frac{4}{9},\frac{4}{9}\right).
\end{align*}

De aquí, debemos normalizar $f_2$. Su norma es $$\sqrt{ \frac{100}{81}+\frac{48}{81}+\frac{32}{81} } = \frac{\sqrt{180}}{9}=\frac{2\sqrt{5}}{3}=\frac{10}{3\sqrt{5}}.$$ De este modo, $$e_2=\left(-\frac{\sqrt{5}}{6},\frac{2\sqrt{5}}{15},\frac{2\sqrt{5}}{15}\right)$$

Teniendo $e_1$ y $e_2$, podemos definir $f_3$ con la fórmula dada:

\begin{align*}
f_3&=v_3-\langle v_3, e_1 \rangle e_1 – \langle v_3, e_2 \rangle e_2\\
&=(0,0,1)-\frac{2}{3} \left(\frac{1}{3}, \frac{1}{3} , \frac{1}{3} \right) – \frac{4\sqrt{5}}{15} \left(-\frac{\sqrt{5}}{6},\frac{2\sqrt{5}}{15},\frac{2\sqrt{5}}{15}\right)\\
&=(0,0,1)-\left(\frac{2}{9}, \frac{2}{9} , \frac{2}{9} \right)-\left(-\frac{2}{9},\frac{8}{45},\frac{8}{45}\right)\\
&=\left(0, -\frac{2}{5},\frac{3}{5}\right).
\end{align*}

De aquí, debemos normalizar $f_3$. Su norma es $$\sqrt{\frac{12}{25}+\frac{18}{25}}=\frac{\sqrt{6}}{\sqrt{5}}=\frac{6}{\sqrt{30}}.$$ De este modo, $$e_3=\left( 0, -\frac{\sqrt{30}}{15}, \frac{\sqrt{30}}{10}\right).$$

Hemos encontrado la base ortonormal buscada $e_1,e_2,e_3$.

$\triangle$

Más adelante…

Con esta entrada-recordatorio terminamos la segunda unidad del curso. A partir de ahora es importante que recuerdes que todo espacio euclideano tiene una base ortonormal. También es útil que recuerdes cómo se obtiene, así que asegúrate de practicar el proceso de Gram-Schmidt.

Todo lo que hemos mencionado tiene su análogo en espacios vectoriales sobre los complejos con un producto interior hermitiano. Asegúrate de entender las diferencias y de realizar los ejercicios que te permitirán entender los resultados correspondientes.

En la siguiente unidad desarrollaremos la teoría necesaria para poder enunciar y demostrar tanto el teorema espectral real, como el teorema espectral complejo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Haz la demostración del teorema de Gram-Schmidt a partir del esquema comentado en la entrada. En caso de que se te dificulte, revisa los detalles en la entrada de blog correspondiente.
  2. Para verificar que todo esté en orden, verifica que los vectores $e_1,e_2,e_3$ del ejemplo en efecto son una base ortonormal con el producto interior dado.
  3. En el teorema de Gram-Schmidt, ¿es importante el orden en el que elijamos $v_1$ hasta $v_n$? ¿Cambia el conjunto resultante si cambiamos el orden? ¿Es conveniente tomar algún otro orden para simplificar las cuentas?
  4. Aplica el proceso de Gram-Schmidt a los vectores \begin{align*}(1,1,1,1)\\ (0,1,1,1)\\ (0,0,1,1)\\ (0,0,0,1)\end{align*} en $\mathbb{R}^4$ con el producto interior canónico (el producto punto).
  5. Enuncia y demuestra un teorema de Gram-Schmidt para espacios vectoriales sobre $\mathbb{C}$ con un producto interior hermitiano. Obtén el corolario correspondiente para los espacios hermitianos. Aplica este proceso a los vectores $(1+i,1+i,1+i),(0,1+i,1+i),(0,0,1+i)$ de $\mathbb{C}^3$ con el producto hermitiano canónico para obtener una base ortonormal.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Ortogonalidad en espacios euclideanos

Por Leonardo Ignacio Martínez Sandoval

Introducción

Anteriormente, cuando hablamos del espacio dual de un espacio vectorial, definimos qué quería decir que una forma lineal y un vector fueran ortogonales. Esa noción de ortogonalidad nos ayudó a definir qué era un hiperplano de un espacio vectorial y a demuestra que cualquier subespacio de dimensión $k$ de un espacio de dimensión $n$ podía ponerse como intersección de $n-k$ hiperplanos.

Hay otra noción de ortogonalidad en álgebra lineal que también ya discutimos en el primer curso: la ortogonalidad de parejas de vectores con respecto a un producto interior. En el primer curso vimos esta noción muy brevemente. Lo que haremos ahora es profundizar en esta noción de ortogonalidad. De hecho, gracias a las herramientas que hemos desarrollado podemos conectar ambas nociones de ortogonalidad.

Esta teoría la veremos de manera explícita en el caso real en la entrada. El caso en $\mathbb{C}$ queda esbozado en los ejercicios.

Definición de ortogonalidad

Comenzamos con las siguientes definiciones.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ y $b$ una forma bilineal de $V$. Diremos que dos vectores $x,y$ en $V$ son ortogonales (con respecto a $b$) si $b(x,y)=0$.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ y $b$ una forma bilineal de $V$. Sea $S$ un subconjunto de vectores de $V$. El conjunto ortogonal de $S$ (con respecto a $b$) consiste de todos aquellos vectores en $V$ que sean ortogonales a todos los vectores de $S$. En símbolos:

$$S^{\bot}:=\{v \in V : \forall s \in S, b(s,v)=0\}.$$

Es un buen ejercicio verificar que $S^\bot$ siempre es un subespacio de $V$. Finalmente, definimos la ortogonalidad de conjuntos.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ y $b$ una forma bilineal de $V$. Diremos que dos subconjuntos $S$ y $T$ son ortogonales (con respecto a $b$) si $S \subseteq T^{\bot}$.

En otras palabras, estamos pidiendo que todo vector de $S$ sea ortogonal a todo vector de $T$.

Observación. Si tenemos un espacio vectorial con producto interior $\langle \cdot, \cdot \rangle$ de norma $\norm{\cdot}$, entonces tenemos la fórmula $$\norm{x+y}^2=\norm{x}^2+2\langle x,y\rangle +\norm{y}^2.$$

De esta forma, $x$ y $y$ son ortogonales si y sólo si $$\norm{x+y}^2= \norm{x}^2+\norm{y}^2.$$ Podemos pensar esto como una generalización del teorema de Pitágoras.

Descomposición en un subespacio y su ortogonal

Comenzamos esta sección con un resultado auxiliar.

Teorema. Sea $V$ un espacio euclideano y $W$ un subespacio de $V$. Entonces $$V=W\oplus W^\bot.$$

Demostración. Sea $\langle \cdot,\cdot \rangle$ el producto interior de $V$. Para demostrar la igualdad que queremos, debemos mostrar que $W$ y $W^\bot$ están en posición de suma directa y que $V=W+W^\bot$.

Para ver que $W$ y $W^\bot$ están en posición de suma directa, basta ver que el único elemento en la intersección es el $0$. Si $x$ está en dicha intersección, entonces $\langle x, x \rangle =0$, pues por estar en $W^\bot$ debe ser ortogonal a todos los de $W$, en particular a sí mismo. Pero como tenemos un producto interior, esto implica que $x=0$.

Tomemos ahora un vector $v\in V$ cualquiera. Definamos la forma lineal $f:W\to \mathbb{R}$ tal que $f(u)=\langle u, v \rangle$. Por el teorema de representación de Riesz aplicado al espacio vectorial $W$ y a su forma lineal $f$, tenemos que existe un (único) vector $x$ en $W$ tal que $f(u)=\langle u, x \rangle$ para cualquier $u$ en $W$.

Definamos $y=v-x$ y veamos que está en $W^\bot$. En efecto, para cualquier $u$ en $W$ tenemos:

\begin{align*}
\langle u, y\rangle &= \langle u, v-x \rangle\\
&=\langle u, v \rangle – \langle u , x \rangle\\
&=f(u)-f(u)\\
&=0.
\end{align*}

De esta manera, podemos escribir $v=x+y$ con $x\in W$ y $y\in W^\bot$.

$\square$

En particular, el teorema anterior nos dice que la unión disjunta de una base de $W$ y una base de $W^\bot$ es una base de $V$. Por ello, tenemos el siguiente corolario.

Corolario. Sea $V$ un espacio euclideano y $W$ un subespacio de $V$. Entonces $$\dim{W}+\dim{W^\bot}=\dim{V}.$$

Tenemos un corolario más.

Corolario. Sea $V$ un espacio euclideano y $W$ un subespacio de $V$. Entonces $$(W^\bot)^\bot=W.$$

Demostración. Tanto $W$ como $(W^\bot)^\bot$ son subespacios de $V$. Tenemos que $W\subseteq (W^\bot)^\bot$ pues cualquier elemento de $W$ es ortogonal a cualquier elemento de $W^\bot$. Además, por el corolario anterior tenemos:

\begin{align*}
\dim{W}+\dim{W^\bot}&=\dim{V}\\
\dim{W^\bot}+\dim{(W^\bot)^\bot}&=\dim{V}.
\end{align*}

De aquí se sigue que $\dim{W} = \dim{(W^\bot)^\bot}$. Así, la igualdad que queremos de subespacios se sigue si un subespacio está contenido en otro de la misma dimensión, entonces deben de ser iguales.

$\square$

Proyecciones ortogonales

Debido al teorema anterior, podemos dar la siguiente definición.

Definición. Sea $V$ un espacio euclideano y $W$ un subespacio de $V$. La proyección ortogonal hacia $W$ es la transformación lineal $p_W:V\to W$ tal que a cada $v$ en $V$ lo manda al único vector $p_W(v)$ tal que $x-p_W(v)$ está en $W^\bot$.

Dicho en otras palabras, para encontrar a la proyección de $v$ en $W$ debemos escribirlo de la forma $v=x+y$ con $x\in W$ y $y\in W^\bot$ y entonces $p_W(v)=x$.

Distancia a subespacios

Cuando definimos la distancia entre conjuntos que tienen más de un punto, una posible forma de hacerlo es considerando los puntos más cercanos en ambos conjuntos, o en caso de no existir, el ínfimo de las distancias entre ellos. Esto da buenas propiedades para la distancia. En particular, cuando queremos definir la distancia de un punto $x$ a un conjunto $S$ hacemos lo siguiente.

Definición. Sea $V$ un espacio vectorial real con producto interior $\langle \cdot, \cdot \rangle$ de norma $\norm{\cdot}$. Sea $S$ un subconjunto de $V$ y $v$ un vector de $V$. Definimos la distancia de $v$ a $S$ como la menor posible distancia de $v$ hacia algún punto de $S$. En símbolos:

$$d(v,S):=\inf_{s\in S} d(v,s).$$

En general, puede ser complicado encontrar el punto que minimiza la distancia de un punto a un conjunto. Sin embargo, esto es más sencillo de hacer si el conjunto es un subespacio de un espacio con producto interior: se hace a través de la proyección al subespacio. Esto queda reflejado en el siguiente resultado.

Proposición. Sea $V$ un espacio euclideano con producto interior $\langle \cdot, \cdot \rangle$ de norma $\norm{\cdot}$. Sea $W$ un subespacio de $V$ y sea $v$ un vector en $V$. Entonces $$d(v,W)=\norm{v-p_W(v)}.$$

Más aún, $p_W(v)$ es el único punto en $W$ para el cual se alcanza la distancia mínima.

Demostración. Por el teorema de descomposición en un subespacio y su ortogonal, sabemos que podemos escribir $v=x+y$ con $x$ en $W$ y con $y$ en $W^\bot$.

Tomemos cualquier elemento $w$ en $W$. Tenemos que $x-w$ está en $W$ y que $y$ está en $W^\bot$. Así, usando el teorema de Pitágoras tenemos que:

\begin{align*}
\norm{v-w}^2&=\norm{y+(x-w)}^2\\
&=\norm{y}^2+\norm{x-w}^2\\
&\geq \norm{y}^2\\
&=\norm{v-x}^2.
\end{align*}

Esto muestra que $\norm{v-w}\geq \norm{v-x}$. Como $x\in W$, esto muestra que la distancia de $v$ a $W$ en efecto se alcanza con $x=p_W(v)$, pues cualquier otra distancia es mayor o igual.

La igualdad en la cadena anterior de alcanza si y sólo si $\norm{x-w}^2=0$, lo cual sucede si y sólo si $x=w$, como queríamos.

$\square$

Más adelante…

En la siguiente entrada recordaremos varias de las ventajas que tiene contar con una base de un espacio vectorial en la que cualesquiera dos vectores sean ortogonales entre sí. Y en la entrada después de esa, recordaremos algunas hipótesis bajo las cuales podemos garantizar encontrar una de esas bases.

Tarea moral

  1. Resuelve los siguientes ejercicios:
    1. Sea $\mathbb{R}^3$ con el producto interno canónico y $W=\{(0,0,a_3) : a_3 \in \mathbb{R} \}$. Encuentra a $W^{\bot}$ y define la proyección ortogonal $p_W$ hacia $W$.
    2. Encuentra el vector en $\text{Span}((1,2,1), (-1,3,-4))$ que sea el más cercano (respecto a la norma euclidiana) al vector $(-1,1,1)$.
  2. Sea $V$ un espacio euclidiano y $T : V \to V $ una transformación lineal tal que $T^2=T$. Prueba que T es una proyección ortogonal si y solo si para cualesquiera $x$ y $y$ en $V$ se tiene que $$\langle T(x),y\rangle =\langle x,T(y)\rangle.$$
  3. Resuelve los siguientes ejercicios:
    1. Demuestra que una proyección ortogonal reduce la norma, es decir, que si $T$ es una proyección ortogonal, entonces $\norm{T(v)}\leq \norm{v}$.
    2. Prueba que una proyección ortogonal únicamente puede tener como eigenvalores a $0$ ó a $1$.
  4. Demuestra que la composición de dos proyecciones ortogonales no necesariamente es una proyección ortogonal.
  5. En el teorema de descomposición, ¿es necesaria la hipótesis de tener un producto interior? ¿Qué sucede si sólo tenemos una forma bilineal, simétrica y positiva?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Teoría de los conjuntos I: Funciones (parte II)

Por Gabriela Hernández Aguilar

Introducción

En esta sección hablaremos acerca de algunas propiedades de la imagen y la imagen inversa de un conjunto bajo una función, dichas propiedades hablan de cómo se comportan estos conjuntos con respecto a la unión, la intersección y la diferencia.

Propiedades de la imagen de un conjunto

A continuación enunciamos algunas propiedades de la imagen de conjuntos bajo una función.

Teorema. Sean $X$ y $Y$ conjuntos y sea $f:X\to Y$ una función. Sean $X_1,X_2\subseteq X$ y $Y_1, Y_2\subseteq Y$. Entonces se cumplen las siguientes propiedades:

  1. Si $X_1\subseteq X_2$, entonces $f[X_1]\subseteq f[X_2]$,
  2. $f[X_1\cup X_2]=f[X_1]\cup f[X_2]$,
  3. $f[X_1\cap X_2]\subseteq f[X_1]\cap f[X_2]$,
  4. $f[X_1]\setminus f[X_2]\subseteq f[X_1\setminus X_2]$,
  5. Si $Y_1\subseteq Y_2$, entonces $f^{-1}[Y_1]\subseteq f^{-1}[Y_2]$,
  6. $f^{-1}[Y_1\cup Y_2]=f^{-1}[Y_1]\cup f[Y_2]$.1

Demostración.

1) Supongamos que $X_1\subseteq X_2$ y veamos que $f[X_1]\subseteq f[X_2]$.
Sea $y\in f[X_1]$, entonces existe $x\in X_1$ tal que $f(x)=y$. Dado que $X_1\subseteq X_2$, entonces $x\in X_2$ cumple $f(x)=y$, esto es $y\in f[X_2]$.
Por lo tanto, $f[X_1]\subseteq f[X_2]$.

2) Veamos que $f[X_1\cup X_2]=f[X_1]\cup f[X_2]$.

$\subseteq$] Sea $y\in f[X_1\cup X_2]$, entonces existe $x\in X_1\cup X_2$ tal que $f(x)= y$. Entonces $x\in X_1$ o $x\in X_2$ cumple $f(x)=y$.

  • Si $x\in X_1$, f(x)=y entonces $y\in f[X_1]$ y por lo tanto $y\in f[X_1]\cup f[X_2]$.
  • Si $x\in X_2$, f(x)=y entonces $y\in f[X_2]$ y por lo tanto $y\in f[X_1]\cup f[X_2]$.

Por lo tanto, $f[X_1\cup X_2]\subseteq f[X_1]\cup f[X_2]$.

$\supseteq$] Sea $y\in f[X_1]\cup f[X_2]$, entonces $y\in f[X_1]$ o $y\in f[X_2]$.

Si $y\in f[X_1]$, entonces existe $x\in X_1$ tal que $f(x)=y$. Luego, como $X_1\subseteq X_1\cup X_2$, tenemos que $x\in X_1\cup X_2$. Por lo tanto, existe $x\in X_1\cup X_2$ tal que $f(x)=y$, esto es $y\in f[X_1\cup X_2]$.

Si $y\in f[X_2]$, entonces existe $x\in X_2$ tal que $f(x)=y$. Luego, como $X_2\subseteq X_1\cup X_2$, tenemos que $x\in X_1\cup X_2$. Por lo tanto, existe $x\in X_1\cup X_2$ tal que $f(x)=y$, esto es $y\in f[X_1\cup X_2]$.

Por lo tanto, $f[X_1]\cup f[X_2]\subseteq f[X_1\cup X_2]$.

De las contenciones que demostramos tenemos que $f[X_1]\cup f[X_2]=f[X_1\cup X_2]$.

3) Ahora veamos que $f[X_1\cap X_2]\subseteq f[X_1]\cap f[X_2]$.

Sea $y\in f[X_1\cap X_2]$, entonces existe $x\in X_1\cap X_2$ tal que $f(x)= y$. Entonces $x\in X_1$, y $x\in X_2$ y cumple $f(x)=y$.

De donde $y\in f[X_1]$ y $y\in f[X_2]$. Por lo tanto, $y\in f[X_1]\cap f[X_2]$.

Así, $f[X_1\cap X_2]\subseteq f[X_1]\cap f[X_2]$.

4) A continuación mostraremos que $f[X_1]\setminus f[X_2]\subseteq f[X_1\setminus X_2]$.

Sea $y\in f[X_1]\setminus f[X_2]$, entonces $y\in f[X_1]$ y $y\notin f[X_2]$.

Dado que $y\in f[X_1]$, entonces existe $x\in X_1$ tal que $f(x)=y$. Luego, como $y\notin f[X_2]$ entonces para cualquier $a\in X_2$, $f(a)\not=y$. Resulta que $x\notin X_2$ pues de lo contrario $f(x)\not=y$ lo cual no puede ocurrir.

Por lo tanto, $x\in X_1\setminus X_2$ y cumple $f(x)=y$, esto es, $y\in f[X_1\setminus X_2]$.

5) Supongamos que $Y_1\subseteq Y_2$ y veamos que $f^{-1}[Y_1]\subseteq f^{-1}[Y_2]$.
Sea $x\in f^{-1}[Y_1]$, entonces existe $y\in Y_1$ tal que $f(x)=y$. Dado que $Y_1\subseteq Y_2$, entonces $y\in Y_2$ y se cumple $f(x)=y$, esto es $x\in f^{-1}[Y_2]$.
Por lo tanto, $f^{-1}[Y_1]\subseteq f^{-1}[Y_2]$.

6) Finalmente veamos que $f^{-1}[Y_1\cup Y_2]=f^{-1}[Y_1]\cup f^{-1}[Y_2]$.

Sea $x\in f^{-1}[Y_1\cup Y_2]$, entonces existe $y\in Y_1\cup Y_2$ tal que $f(x)=y$. Luego, como $y\in Y_1\cup Y_2$ se tiene que $y\in Y_1$ o $y\in Y_2$.

Si $y\in Y_1$, tenemos que $x\in f^{-1}[Y_1]$. Por lo tanto $x\in f^{-1}[Y_1]\cup f^{-1}[Y_2]$.

Si $y\in Y_2$, tenemos que $x\in f^{-1}[Y_2]$. Por lo tanto $x\in f^{-1}[Y_1]\cup f^{-1}[Y_2]$.

$\square$

¿Será cierto que $f[X_1\cap X_2]=f[X_1]\cap f[X_2]$?

Ya vimos que $f[X_1\cap X_2]\subseteq f[X_1]\cap f[X_2]$, por lo que, al igual que con la unión, podríamos pensar que se cumple la igualdad entre los conjuntos. Sin embargo, vamos a ver que en ocasiones $f[X_1]\cap f[X_2]\not\subseteq f[X_1\cap X_2]$.

Ejemplo.

Sean $X=\set{0,1,2}$ y $Y=\set{1,2,3}$ conjuntos y sea $f:X\to Y$ una función dada por el conjunto $f(x)=2$. Sean $X_1=\set{0,1}$ y $X_2=\set{2}$ subconjuntos de $X$.

Por un lado tenemos que $X_1\cap X_2=\set{0,1}\cap \set{2}=\emptyset$, por lo que $f[X_1\cap X_2]=f[\emptyset]= \emptyset$.

Por otro lado, $f[X_1]=f[\set{0,1}]=\set{2}$ y $f[X_2]=f[\set{2}]=\set{2}$. Así, $f[X_1]\cap f[X_2]=\set{2}$.

Por lo tanto, $f[X_1]\cap f[X_2]\not\subseteq f[X_1\cap X_2]$.

$\square$

¿Será cierto que $f[X_1\setminus X_2]=f[X_1]\setminus f[X_2]$?

Ya vimos que $f[X_1]\setminus f[X_2]\subseteq f[X_1\setminus X_2]$, pero veremos que la contención de regreso no siempre es posible, es decir, $f[X_1\setminus X_2] \not\subseteq f[X_1]\setminus f[X_2]$. Un ejemplo de esto se muestra a continuación.

Ejemplo.

Sean $X=\set{0,1,2}$ y $Y=\set{1,2,3}$ conjuntos y sea $f:X\to Y$ una función dada por $f(x)=2$ Sean $X_1=\set{0,1}$ y $X_2=\set{1,2}$ subconjuntos de $X$.

Por un lado tenemos que $X_1\setminus X_2=\set{0,1}\setminus \set{1,2}=\set{0}$, por lo que $f[X_1\setminus X_2]=f[\set{0}]= \set{2}$.

Por otro lado, $f[X_1]=f[\set{0,1}]=\set{2}$ y $f[X_2]=f[\set{1,2}]=\set{2}$. Así, $f[X_1]\setminus f[X_2]=\emptyset$.

Por lo tanto, $f[X_1\setminus X_2]\not\subseteq f[X_1]\setminus f[X_2]$.

$\square$

Restricción de una función

Si ya tenemos una función que va de un conjunto $X$ a un conjunto $Y$, podemos «limitar» a la función a un subconjunto de $X$ mediante la siguiente definición.

Definición. Sea $f:X\to Y$ una función y sea $A\subseteq X$. Decimos que la restricción de $f$ en $A$ es la función $f\upharpoonright_{A} :A\to Y$ dada por $f\upharpoonright_{A} (x)= f(x)$ para todo $x\in A$.

Aunque las funciones $f$ y $f\upharpoonright$ tengan la misma regla de correspondencia, típicamente son funciones distintas pues casi siempre tienen dominios distintos (a menos que $X=A$).

Ejemplo.

Sean $X=\set{1,2,3,4}$ y $Y=\set{1,2,3,4,5}$. Sea $f:X\to Y$ la función dada por $\set{(1,1), (2,2), (3,3), (4,1)}$. Si restringimos $f$ al subconjunto ${1,2,3}$ obtenemos la función identidad en este subconjunto. En efecto, $f\upharpoonright_A=\set{(1,1), (2,2), (3,3)}$.

$\square$

Composición de funciones

Recuerda que podemos pensar a una función $f:X\to Y$ como una «regla de correspondencia» que manda a cada elemento de $X$ a uno y sólo un elemento de $Y$. Si tenemos otra función $g:Y\to Z$ entonces también $g$ da una «regla de correspondencia», pero para mandar elementos de $Y$ a $Z$. Entonces, suena a que podríamos combinar a $f$ con $g$ de alguna manera para enviar elementos de $X$ a $Z$. Esto lo hará la composición de funciones. Reescribamos la definición que teníamos de relaciones, pero ahora para funciones.

Definición. Sean $f:X\to Y$ y $g:Y\to Z$. Definimos a la composición de $f$ con $g$ como el siguiente conjunto:

$g\circ f=\set{(x,z): \exists y\in Y( f(x)=y \text{ y } g(y)=z)}$.

Observa que estamos pidiendo que si estas dos igualdades pasan, entonces $g\circ f$ tiene a la pareja $(x,z)$. Como enuncia el siguiente teorema, esto impicará que $g\circ f$ es función, y que su regla de correspondencia será $(g\circ f)(x)=g(f(x))$.

Proposición. Si $f:X\to Y$ y $g:Y\to Z$ son funciones, entonces $g\circ f:X\to Z$ es función. Además, cumplirá que $(g\circ f)(x)=g(f(x))$ para toda $x\in X$.

Demostración.

En la sección de composición de relaciones vimos que si $f$ y $g$ son relaciones, entonces $g\circ f$ es relación, por lo que resta ver que $g\circ f$ es funcional y total.

Para ver que es funcional, supongamos que hay parejas $(x,z)$ y $(x,z’)$ en $g\circ f$. Por definición, esto implica que existen $y$ y $y’$ en $Y$ tales que $(x,y),(x,y’)\in f$ y $(y,z), (y’,z’) \in g$. Como $f$ es funcional, se tiene $y=y’$. Así, $(y,z), (y,z’)\in g$. Como $g$ es funcional, se tiene $z=z’$.

Para ver que es total, como $f$ es total, existe $y\in Y$ con $(x,y)\in f$. Como $g$ es total, existe $z$ con $(y,z)\in g$. Así, por definición de composisión tenemos $(x,z)\in g\circ f$ y por lo tanto $g\circ f$ es total.

El párrafo anterior justo nos dice que si $f(x)=y$ y $g(y)=z$, entonces $$(g\circ f)(x)=z=g(y)=f(g(x)).$$

$\square$

Ejemplo.

Sean $f:\set{1,2}\to \set{2,4}$ y $g:\set{2,4}\to \set{3,5}$ las funciones dadas por $f(x)= 2x$ y $g(x)=x+1$ respectivamente (con tu entendimiento actual de $2x$ y $x+1$, posteriormente formalizaremos estas operaciones). Entonces $g\circ f:\set{1,2}\to \set{3,5}$ está dada por:

$(g\circ f)(x)=g(f(x))=g(2x)=2x+1$.

Por lo que,

  • $(g\circ f)(1)=2(1)+1=2+1=3$,
  • $(g\circ f)(2)= 2(2)+1=4+1=5$.

De modo que los elementos de $g\circ f$ son $(1,3)$ y $(2,5)$.

$\square$

Tarea moral

  1. Demuestra que si $X$ y $Y$ son conjuntos, $X_1\subseteq X$, $Y_1, Y_2\subseteq Y$ y $f:X\to Y$ una función, entonces se cumplen las siguientes propiedades:
    • $f^{-1}[Y_1\cap Y_2]=f^{-1}[Y_1]\cap f^{-1}[Y_2]$,
    • $f^{-1}[Y_1\setminus Y_2]=f^{-1}[Y_1]\setminus f{-1}[Y_2]$,
    • $X_1\subseteq f^{-1}[f[X_1]]$,
    • $f[f^{-1}[B_1]]\subseteq B_1$.
  1. Demuestra que la composición de funciones es asociativa.
  2. ¿Será cierto que si $R$ es una función, entonces la relación inversa $R^{-1}$ también es función?
  3. ¿Será cierto que si $R$ de $A$ en $B$ y $S$ de $B$ en $C$ son relaciones tal que ninguna de ellas es función, entonces $S\circ R$ nunca es función?

Más adelante…

La siguiente sección estará dedicada a funciones inyectivas. Este tipo de funciones empezarán a estudiar cómo se comportan los elementos del codominio de una función. Específicamente, las funciones inyectivas serán aquellas para las que cada elemento del codominio viene de a lo más un elemento del dominio. Este tema será de gran importancia pues en muchas ocasiones tendremos que verificar si se satisface esta propiedad.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

  1. Puedes encontrar una prueba similar de este teorema en Gómez L. C, Álgebra Superior Curso Completo. Publicaciones Fomento Editorial, 2014, p. 49-50 ↩︎