Teoría de los Conjuntos I: Funciones inversas

Por Gabriela Hernández Aguilar

Introducción

En la entrada de composición de relaciones vimos que al componer una relación $R$ con la relación $Id$ obtenemos la relación $R$. Lo mismo ocurre para funciones. Ahora podríamos preguntarnos si dada una función $f$ existe alguna función que al componerla con $f$ nos devuelva la función identidad. Veremos que no siempre es posible y analizaremos cuáles condiciones se requieren para que sí ocurra. Funciones que satisfagan la propiedad de que al componerlas con alguna otra función el resultado sea la identidad les llamaremos funciones invertibles o diremos que tienen una inversa. Como la composición de funciones no es conmutativa, esto nos lleva a tres preguntas: ¿cuándo una función tiene inversa izquierda? ¿cuándo tiene inversa derecha? ¿cuándo tiene una función que sirva de inversa por ambos lados?

En esta entrada exploramos estas preguntas en las siguientes secciones, y las conectamos con las nociones de inyectividad, suprayectividad y biyectividad que trabajamos previamente.

Inversa izquierda

Estudiemos primero la noción de invertibilidad por la izquierda.

Definición. Sea $f:X\to Y$ una función. Si $g:Y\to X$ es una función tal que $g\circ f=Id_X$, entonces decimos que $g$ es inversa izquierda de $f$.

Ejemplo.

Sean $X=\set{1,2}$ y $Y=\set{1,2,3}$ conjuntos. Sea $f:X\to Y$ la función dada por el conjunto $f=\set{(1,1), (2,2)}$.

Luego, si tomamos $g:Y\to X$ definida como $g=\set{(1,1), (2,2), (3,2)}$ es inversa izquierda de $f$. En efecto, tenemos que $g\circ f=Id_X$ pues:

$(g\circ f)(1)= g(f(1))= g(1)=1= Id_X(1)$ y $(g\circ f)(2)= g(f(2))= g(2)=2= Id_X(2)$.

Por lo tanto, $g\circ f=Id_X$ y así $g$ es inversa izquierda de $f$.

$\square$

La invertibilidad por la izquierda está conectada con la inyectividad, como lo afirma la siguiente proposición.

Proposición. Sea $f:X\to Y$ una función, se tiene que $f$ es inyectiva si y sólo tiene $f$ tiene inversa izquierda.

Demostración. Un caso aparte sencillo es qué sucede si el conjunto $X$ es vacío. En este caso, cualquier función $f:\emptyset \to Y$ es vacía y por lo tanto inyectiva por vacuidad, y $f\circ f = \emptyset =Id_{\emptyset}$, es decir, $f$ es inversa izquierda de sí misma. Así que supondremos que $X\neq \emptyset$.

Supongamos que $f$ es inyectiva, es decir, para cualesquiera $x,y\in X$ se tiene que $f(x)= f(y)$ implica $x=y$. Vamos a demostrar que existe $g:Y\to X$ función tal que $g\circ f= Id_X$.

Para ello, como $X\neq \emptyset$, podemos tomar un $x_0\in X$ cualquiera y definir la siguiente función de $Y$ en $X$:

$$g(y)=\begin{cases} x & \text{si $y\in \text{Im}(f)$ y $f(x)=y$}\\ x_0 & \text{si $y\not \in \text{Im}(f)$}\end{cases}.$$

Veamos primero que $g$ en efecto está bien definida. Esta forma de asignar sí es total, pues para cualquier $y\in Y$ se tiene que o bien $y\in \text{Im}(f)$ o bien $y \not \in \text{Im}(f)$. En el primer caso, por definición existe un $x$ tal que $f(x)=y$ y entonces podemos usar la primera parte de la definición. En el segundo caso usamos la segunda parte de la definición. Además, esta forma de asignar sí es funcional. Cualquier $y\in Y$ está en uno y sólo uno de los casos de arriba. Si está en el primer caso, existe una y sólo una $x$ que cumple $f(x)=y$, pues $f$ es inyectiva. Si está en el segundo caso, $f(y)$ sólo puede valer $x_0$.

Ahora veamos que $g$ es inversa izquierda de $f$. En efecto, sea $x\in X$, entonces

$(g\circ f)(x)=g(f(x))= x=Id_X(x)$.

Ahora, supongamos que $f$ es una función invertible por la izquierda, es decir, existe $g$ tal que $g\circ f=Id_X$. Veamos que $f$ es inyectiva. Sean $x_1, x_2$ tales que $f(x_1)=f(x_2)$. Tenemos que

\begin{align*}
x_1&=Id_X(x_1)\\
&=(g\circ f)(x_1)\\
&=g(f(x_1))\\
&=g(f(x_2))\\
&=(g\circ f)(x_2)\\
&=Id_X(x_2)\\
&=x_2.
\end{align*}

Por lo tanto, $f$ es inyectiva.

$\square$

Inversa derecha

Una noción parecida a la invertibilidad por la izquierda es la invertibilidad por la derecha.

Definición. Sea $f:X\to Y$ una función. Si $g:Y\to X$ es una función tal que $f\circ g=Id_Y$, entonces decimos que $g$ es inversa derecha de $f$.

Ejemplo.

Sean $X=\set{1,2,3}$ y $Y=\set{1,2}$ conjuntos. Sea $f:X\to Y$ la función dada por el conjunto $f=\set{(1,1), (2,2), (3,1)}$.

Luego, se tiene que $g:Y\to X$ definida como $g=\set{(1,1), (2,2)}$ es inversa derecha de $f$. En efecto, tenemos que $f\circ g=Id_Y$ pues:

$(f\circ g)(1)= f(g(1))= f(1)=1= Id_Y(1)$ y $(f\circ g)(2)= f(g(2))= f(2)=2= Id_Y(2)$.

Por lo tanto, $f\circ g=Id_Y$ y así $g$ es inversa derecha de $f$.

$\square$

Del ejemplo anterior podrás notar que $f$ es suprayectiva pero no inyectiva por lo que $f$ no puede tener ninguna inversa izquierda. En general, el siguiente resultado nos dice que $f$ es invertible por la derecha justo cuando es suprayectiva.

Teorema. Sea $f:X\to Y$ una función, se tiene que $f$ es suprayectiva si y sólo si $f$ tiene inversa derecha.

Demostración (parcial).

Ahora, supongamos que $f$ tiene inversa derecha, digamos $g$. Sea $y\in Y$, veamos que existe $x\in X$ tal que $f(x)=y$.
Dado que $g$ es inversa derecha de $f$, entonces $f\circ g=Id_Y$, por lo que para cualquier $y\in Y$, $(f\circ g)(y)= Id_Y(y)=y$, por lo que al tomar $x= g(y)\in X$, se cumple que $f(x)=f(g(y))=y$. Por lo tanto, $f$ es suprayectiva.

Nos faltaría demostrar que si $f$ es suprayectiva, entonces tiene inversa derecha. Esto no lo podemos hacer ahora y postergamos la demostración para la última parte del curso, cuando hablemos del axioma de elección.

$\square$

¿Por qué no podemos hacer la demostración todavía? Un poco más adelante hablaremos de cómo incluir axiomáticamente a los números naturales en todo lo que estamos construyendo, así que en nuestra teoría tendremos conjuntos infinitos. La razón por la que no podemos hacer la demostración anterior es que los axiomas de teoría de conjuntos que hemos presentado hasta ahora no nos dicen cómo le podemos hacer para tomar «una infinidad de decisiones» para crear un conjunto, y justo necesitamos esto en este momento. ¿Por qué? Sabemos que $f:X\to Y$ es una función suprayectiva, y que entonces todos los elementos de $f$ vienen de por lo menos un elemento de $X$. Pero si cada elemento de $Y$ viene de dos elementos de $X$ (digamos) y $Y$ es infinito, ¿cómo construimos la inversa derecha $g$ de $f$? Tendríamos que decidir para cada $y\in Y$ el valor de $g(y)$ entre dos posibilidades. Esto lo resolveremos incluyendo otro axioma que nos permita tomar una infinidad de decisiones, conocido como Axioma de elección, el cual veremos en entradas posteriores.

Inversa izquierda pero no derecha y viceversa

Podemos preguntarnos por qué hasta este momento tenemos dos conceptos: uno de inversa izquierda y otro de inversa derecha. La respuesta es que en ocasiones la inversa izquierda no será inversa derecha y viceversa. Además habrá veces en las que una función sólo tenga inversa izquierda y no derecha, así como funciones que solo tengan inversa derecha pero no izquierda. Retomemos los ejemplos anteriores para ver esto último.

Ejemplo.

Sean $X=\set{1,2}$ y $Y=\set{1,2,3}$ conjuntos. Sea $f:X\to Y$ la función dada por el conjunto $f=\set{(1,1), (2,2)}$. Antes vimos que $g=\set{(1,1), (2,2), (3,2)}$ es inversa izquierda de $f$, sin embargo, $g$ no es inversa derecha pues $f\circ g= \set{(1,1), (2,2), (3, 2)}$ y $f\circ g\not= Id_Y$ pues $(f\circ g)(3)= 2\not= 3=Id_Y(3)$. Además $f$ no tiene inversa derecha pues $g$ debe enviar a $3$ a un elemento de $X$, en este caso las únicas posibilidades son $1$ o $2$. En cualquiera de los casos al componer a la función $g$ con $f$, la composición resulta ser distinta de la función identidad.

Ahora, sean $X=\set{1,2,3}$ y $Y=\set{1,2}$ conjuntos. Sea $f:X\to Y$ la función dada por el conjunto $f=\set{(1,1), (2,2), (3,1)}$. Vimos que $g=\set{(1,1), (2,2)}$ es inversa derecha de $f$. Sin embargo, $g$ no es inversa izquierda de $f$ pues $g\circ f=\set{(1,1), (2,2), (3,1)}$ y $g\circ f\not=Id_X$. De hecho, no podría tener inversa izquierda pues como ya demostramos arriba, $f$ tendría que ser inyectiva, pero no lo es pues $f(1)=1=f(3)$.

$\square$

Inversa de una función

La tercera noción que estudiaremos es la siguiente.

Definición. Sea $f:X\to Y$ una función. Si existe $g:Y\to X$ tal que $g$ es inversa izquierda e inversa derecha de $f$, entonces decimos que $g$ es una inversa de $f$. En este caso, diremos que $f$ es invertible.

Ejemplo.

Sea $X$ un conjunto, consideremos $Id_X$. Resulta que $Id_X$ es invertible. En efecto, si consideramos la función $g=Id_X$ tenemos $g\circ Id_X=Id_X\circ Id_X=Id_X=Id_X\circ Id_X=Id_X\circ g$. Por tanto, $g=Id_X$ es una inversa de $Id_X$.

$\square$

Ejemplo.

Sea $X=\set{0,1}$. Cualquier función inyectiva en $X$ es una función invertible. Para mostrar esto, notemos que las únicas funciones inyectivas en $X$ son $f_1=Id_X$ y $f_2=\set{(0,1),(1,0)}$. Luego, una inversa de $f_1$ es $f_1$ como lo vimos en el ejemplo anterior y, una inversa de $f_2$ es $f_2$ ya que $(f_2\circ f_2)(0)=f_2(f_2(0))=f_2(1)=0$ y $(f_2\circ f_2)(1)=f_2(f_2(1))=f_2(0)=1$, es decir, $f_2\circ f_2=Id_X$.

El siguiente resultado conecta varias propiedades de las que hemos platicado.

Teorema. Sea $f:X\to Y$. Las siguientes tres cosas son equivalentes:

  1. $f$ es biyectiva.
  2. $f$ tiene inversa.
  3. $f$ tiene inversa derecha y $f$ tiene inversa izquierda.

Demostración.

$1)\rightarrow 2)$. Supongamos que $f$ es biyectiva, entonces $f$ es inyectiva y suprayectiva. Para definir $g:Y\to X$ su inversa, notamos que para cada $y\in Y$ existe un único $x\in X$ tal que $f(x)=y$ y entonces definimos $g(y)=x$. Debemos ver que dicha $g$ compuesta tanto por la derecha como por la izquierda con $f$ nos da la identidad. Por un lado, para cualquier $x\in X$ tenemos que $g(f(x))=x$ por cómo definimos $g$, así que $g\circ f = Id_X$.

Tomemos ahora $y\in Y$ y estudiemos $f(g(y))$. Como $f$ es suprayectiva, existe un $x$ tal que $y=f(x)$. Por definición de $g$, tenemos $f(g(y))=f(g(f(x))=f(x)$. Y como $f$ es inyectiva, tenemos que $g(y)=x$. Así, $f(g(y))=f(x)=y$. Concluimos entonces que $f\circ g=Id_Y$. Con esto concluimos la prueba de que $g$ es inversa de $f$.

$2)\rightarrow 3)$. Si $f$ tiene inversa $g$, entonces $g\circ f = Id_X$ y $f\circ g = Id_Y$, que es justo lo que se pide para que $g$ sea inversa izquierda y derecha respectivamente.

$3)\rightarrow 1)$. Esto es conclusión de lo que ya mostramos anteriormente. Como $f$ tiene inversa derecha, entonces es suprayectiva. Como $f$ tiene inversa izquierda, entonces $f$ es inyectiva. Así, $f$ es biyectiva.

$\square$

Observa que en la demostración del resultado anterior estamos usando que si $f$ tiene inversa derecha, entonces es suprayectiva. Esto es algo que sí pudimos demostrar en esta entrada y por lo tanto la demostración que acabamos de hacer no necesita del axioma de elección. Por otro lado, observa que el teorema anterior nos da una condición necesaria y suficiente para determinar cuándo una función posee inversa, incluso sabemos que ésta es única y por ello podemos adoptar una notación para la inversa de una función; si existe la inversa de una función $f$, la denotaremos por $f^{-1}$, notación que coincide con la de la inversa de una relación.

Tarea moral

La siguiente lista de ejercicios te permitirá identificar cuándo una función tiene inversa ya sea izquierda o derecha

  • Sea $f:X\to Y$ una función inyectiva. Da un ejemplo en donde la relación inversa de $f$ no es total y por lo tanto no es función.
  • En la definición de función inversa para una función $f:X\to Y$ le llamamos a su inversa $f^{-1}$. Pero aquí implícitamente ya estamos suponiendo que la inversa es única. Demuestra que, en efecto, si una función $f:X\to Y$ tiene inversa, entonces dicha inversa es única.
  • Las inversas derechas e izquierdas no necesariamente son únicas. Para pensar en esto, haz lo siguiente:
    • Da una función que tenga dos inversas derechas distintas.
    • Da una función que tenga dos inversas izquierdas distintas.
  • Sean $f:X\to Y$ y $g:Y\to Z$ funciones biyectivas. Demuestra que $g\circ f$ es invertible, más aún que $(g\circ f)^{-1}= f^{-1}\circ g^{-1}$.

Más adelante…

En la siguiente sección comenzaremos con el tema de relaciones de equivalencia. En esta parte retomaremos el concepto de relación, sin embargo nos enfocaremos en las relaciones de un conjunto $A$ que cumplen determinadas propiedades, lo que las hará especiales y recibirán el nombre de relaciones de equivalencia.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Teoría de los Conjuntos I: Funciones suprayectivas y biyectivas

Por Gabriela Hernández Aguilar

Introducción

Si tenemos dos conjuntos $X$ y $Y$ y se nos pide definir una función $f:X\to Y$ lo que debemos hacer es relacionar a cada uno de los elementos de $X$ con un único elemento de $Y$. Esta forma de proceder no garantiza que cualquier elemento de $Y$ se encuentra relacionado con algún elemento de $X$. Aquellas funciones que sí cumplan esto último les llamaremos funciones suprayectivas y será el tema que trataremos en esta entrada.

Función suprayectiva

Definición. Sea $f:X\to Y$ una función. Si $f[X]=Y$, entonces decimos que $f$ es suprayectiva.

$\square$

Teorema. Sea $f:X\to Y$ una función. Entonces los siguientes enunciados son equivalentes:

  1. $f$ es suprayectiva.
  2. Para cualquier $y\in Y$, existe $x\in X$ tal que $f(x)=y$.
  3. Para cualesquiera $h,k:Y\to Z$ tales que $h\circ f= k\circ f$, se tiene que $h=k$.

Demostración.

$1)\rightarrow 2)$

Supongamos que $f$ es suprayectiva, es decir que $f[X]=Y$. Sea $y\in Y$, entonces $y\in f[X]$ por lo que existe $x\in X$ tal que $f(x)=y$. Por lo tanto, para cualquier $y\in Y$ existe $x\in X$ tal que $f(x)=y$.

$2)\rightarrow 3)$

Sean $h,k:Y\to Z$ tales que $h\circ f=k\circ f$. Veamos que $h=k$. Sea $y\in Y$, veamos que $h(y)=k(y)$. Dado que $y\in Y$, por hipótesis tenemos que existe $x\in X$ tal que $f(x)=y$, por lo que $h(y)= h(f(x))$ y $k(y)= k(f(x))$. Luego, como $(h\circ f)(x)= h(f(x))= k(f(x))= (k\circ f)(x)$, tenemos que $h(y)= k(y)$.

$3)\rightarrow 1)$

Observemos que $f[X]\subseteq Y$, por lo que resta probar que $Y\subseteq f[X]$. Definamos $h: Y\to \set{0,1}$ y $k: Y\to \set{0,1}$ funciones dadas por $h(y)=0$ para todo $y\in Y$ y

\begin{align*}
k(y) = \left\{ \begin{array}{lcc}
0 &  \text{si} & y\in f[X]\\
1 &  \text{si}  & y \notin f[X] \\
\end{array}
\right.
\end{align*}

respectivamente.

Sea $x\in X$, entonces $f(x)\in Y$ y así, $(h\circ f)(x)= h(f(x))=0$ y $(k\circ f)(x)= k(f(x))=0$. Por lo tanto, $h\circ f=k\circ f$ y, por hipótesis $h=k$.

Si tomamos $y\in Y$, $h(y)=k(y)$. Esto significa que $k(y)=0$, por lo tanto, debe ocurrir que $y\in f[X]$.

Algunas funciones suprayectivas

Ejemplo.

La función identidad es suprayectiva. En efecto, sea $Id_X:X\to X$ la función identidad y sea $y\in X$, entonces $y\in X$ satisface $Id_X(y)= y$.

Por lo tanto, $Id_X$ es suprayectiva.

$\square$

Ejemplo.

Sea $X$ un conjunto no vacío y $f:X\to \set{c}$ una función dada por $f(x)=c$ para todo $x\in X$. Tenemos que $f$ es suprayectiva.

Dado que $c$ es el único elemento de $\set{c}$, debemos encontrar que existe $x\in X$ tal que $f(x)=c$. Como $X$ no es vacío, existe $x\in X$ y es tal que que $f(x)=c$.

$\square$

Ejemplo.

Sea $X$ un conjunto y $A\subseteq X$ un subconjunto propio de $X$ (distinto de $X$ y no vacío). La función característica de $A$ es una función suprayectiva.

Deseamos ver que para cualquier $y\in \set{0,1}$ existe $x\in X$ tal que $\chi_A(x)=y$.

Caso 1: Si $y=0$, entonces tomemos $x\in X\setminus A$ de modo que $\chi_A(x)=0$.

Caso 2: Si $y=1$, entonces tomemos $x\in A$, de modo que $\chi_A(x)=1$.

Por lo tanto, $\chi_A$ es suprayectiva.

$\square$

Composición de funciones y suprayectividad

Así como lo hicimos en la entrada anterior con respecto a la inyectividad, también podemos averiguar qué pasa con la composición de funciones con respecto a la suprayectividad. Tenemos el siguiente teorema.

Teorema. Sean $f:X\to Y$ y $g:Y\to Z$ funciones suprayectivas, $g\circ f$ es suprayectiva.

Demostración.

Sea $z\in Z$, y veamos que existe $x\in X$ tal que $(g\circ f)(x)=z$.
Dado que $g$ es suprayectiva y $z\in Z$, entonces existe $y\in Y$ tal que $g(y)=z$. Luego, como $f$ es suprayectiva y $y\in Y$, entonces existe $x\in X$ tal que $f(x)=y$, así $z=g(y)=g(f(x))$. Por lo tanto, $g\circ f$ es suprayectiva.

$\square$

Funciones biyectivas

Definición. Decimos que $f:X\to Y$ es una función biyectiva si y sólo si $f$ es inyectiva y suprayectiva.

Ejemplo.

La función identidad es biyectiva.

Verificamos en la entrada de funciones inyectivas que la función identidad es una función inyectiva, además de que en esta entrada verificamos que es suprayectiva.

$\square$

Ejemplo.

Sean $X=\set{1,2,3}$ y $Y=\set{2,4,6}$ y sea $f:X\to Y$ la función dada por $f(x)=2x$. Tenemos que $f$ es inyectiva pues es una función uno a uno, es decir, elementos distintos van a dar a elementos distintos. Más explícitamente $1$ va a dar a $2$, $2$ a $4$ y $3$ a $6$.

Además $f$ es suprayectiva, pues para cualquier $y\in Y$, existe $x\in X$ tal que $f(x)=y$. En efecto, esto sucede ya que para $2\in Y$ existe $1\in X$ tal que $f(1)=2$; para $4\in Y$ existe $2\in X$ tal que $f(2)=4$ y por último para $6\in Y$ existe $3\in X$ tal que $f(3)=6$.

$\square$

Tarea moral

Realiza la siguiente lista de ejercicios que te ayudará a fortalecer los conceptos de función inyectiva, suprayectiva y biyectiva.

  1. Sean $f:X\to Y$ y $g:Y\to Z$ funciones. Demuestra que si $g\circ f$ es suprayectiva, entonces $g$ es suprayectiva.
  2. Demuestra o da un contraejemplo del siguiente enunciado: Si $f:X\to Y$ y $g:Y\to Z$ son funciones tales que $g\circ f$ es suprayectiva, entonces $f$ es suprayectiva.
  3. Sean $X=\set{1,2,3, \cdots}$ y $Y=\set{3,4,5,\cdots}$ y sea $f:X\to Y$ dada por $f(x)=2x+3$. ¿$f$ es suprayectiva? Argumenta tu respuesta. Quizás a estas alturas tengas que ser un poco informal en términos de teoría de conjuntos, pero usa lo que conoces de las operaciones de números.

Más adelante…

Ahora que aprendimos el concepto de función inyectiva y suprayectiva tenemos las bases suficientes para hablar de funciones invertibles. Veremos funciones invertibles por la derecha e invertibles por la izquierda, cuyos conceptos resultarán equivalentes al de función suprayectiva y función inyectiva respectivamente.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Teoría de los Conjuntos I: Funciones inyectivas

Por Gabriela Hernández Aguilar

Introducción

En esta entrada abordaremos el concepto de función inyectiva. Una función inyectiva será aquella que relacione elementos distintos del dominio con elementos distintos del codominio.

Función inyectiva

Definición. Sea $f: X \to Y$. Decimos que $f$ es una función inyectiva si para cualesquiera $x_1$, $x_2 \in X$ tales que $x_1\not=x_2$, se tiene que $f(x_1)\not= f(x_2)$.

Ejemplo.

Sean $X=\set{1,2,3,4}$ y $Y=\set{1,2,3,4,5}$ y sea $f:X\to Y$ una función dada por $f=\set{(1,2), (2,1), (3,3), (4,5)}$. Decimos que $f$ es inyectiva pues cada elemento de $X$ bajo la función va a dar a un elemento distinto de $Y$, como se muestra en la siguiente imagen:

Ejemplo.

La función identidad es una función inyectiva.

En efecto, dado que $Id_X:X\to X$ esta dada por $Id_X(x)=x$, entonces si $x_1,x_2\in X$ son tales que $Id_X(x_1)=Id_X(x_2)$, entonces tendríamos $x_1=Id_X(x_1)=Id_X(x_2)=x_2$. Así, $x_1=x_2$ y por lo tanto $Id_X$ es inyectiva.

$\square$

Ejemplo.

La función constante no es inyectiva.

Consideremos $X=\set{1,2,3}$ y $Y=\set{1}$. Sea $f:X\to Y$ la función dada por $f(x)=1$ para toda $x\in X$. Consideremos $x_1=1$ y $x_2=2$ elementos de $X$. Sabemos que $1\not=2$ por lo que para que nuestra función sea inyectiva esperamos que $f(x_1)\not=f(x_2)$, sin embargo, $f(1)=1=f(2)$. Esto demuestra que, en general, las funciones constantes no son inyectivas.

$\square$

Equivalencias de inyectividad

Aunque la definición de inyectividad es muy intuitiva («mandar elementos distintos a elementos distintos»), en la práctica nos conviene tener una serie de equivalencias de esta definición que podamos usar en situaciones variadas.

Teorema. Sea $f:X\to Y$ una función tal que $X\not=\emptyset$. Entonces los siguientes enunciados son equivalentes:

  1. $f$ es inyectiva.
  2. Para cualesquiera $x_1,x_2\in X$ si $f(x_1)=f(x_2)$, entonces $x_1=x_2$.
  3. Para cualesquiera $h,k:Z\to X$ si $f\circ h= f\circ k$, entonces $h=k$.
  4. Para cualesquiera $A,B$ subconjuntos de $X$, se cumple que $f[B\setminus A]= f[B]\setminus f[A]$.
  5. Para cualesquiera $A,B$ subconjuntos de $X$ se cumple que $f[A\cap B]= f[A]\cap f[B]$.

Demostración.

$1)\rightarrow 2)$
Supongamos que $f$ es inyectiva, esto es, para cualesquiera $x_1, x_2\in X$ tales que $x_1\not=x_2$ se tiene que $f(x_1)\not=f(x_2)$. Luego, sabemos que la implicación es equivalente a la contrapositiva por lo que podemos concluir que para cualesquiera $x_1, x_2\in X$, si $f(x_1)=f(x_2)$ entonces $x_1=x_2$.

$2)\rightarrow 3)$
Supongamos que para cualesquiera $x_1, x_2\in X$ si $f(x_1)=f(x_2)$, entonces $x_1= x_2$ y supongamos que $h,k:Z\to X$ son funciones tales que $f\circ h= f\circ k$ y veamos que $h=k$.

Sea $z\in Z$, entonces $h(z)\in X$ y $k(z)\in X$, luego como $f\circ h=f\circ k$ tenemos que $(f\circ h)(z)= (f\circ k)(z)$, de donde $f(h(z))= f(k(z))$ y como $f$ es inyectiva entonces $h(z)=k(z)$. Por lo tanto, $h(z)=k(z)$ para todo $z\in Z$. Para concluir que $h=k$ notemos lo siguiente: $(z,y)\in h$ si y sólo si $h(z)=y$, lo cual ocurre si y sólo si $k(z)=y$, es decir, si y sólo si $(z,y)\in k$.

$3)\rightarrow 4)$

Supongamos que para cualesquiera $h,k:Z\to X$ se cumple que si $f\circ h= f\circ k$, entonces $h=k$. Sean $A,B$ conjuntos tales que $A\subseteq B\subseteq X$ y veamos que $f[B\setminus A]= f[B]\setminus f[A]$.

En la entrada de funciones vimos que siempre ocurre que $f[B]\setminus f[A]\subseteq f[B\setminus A]$ por lo que basta ver la otra contención.

Sea $y\in f[B\setminus A]$, entonces existe $x\in B\setminus A$ tal que $f(x)=y$. Tenemos que $x\in B$ y $x\notin A$, de modo que $f(x)\in f[B]$. Resta ver que $f(x)\notin f[A]$. Supongamos que sí ocurre, es decir que $f(x)\in f[A]$. Entonces existe $z\in A$ tal que $f(z)=f(x)$.

Definamos $h:X\to X$ dada por $h(a)=x$ para todo $a\in X$ y $k:X\to X$ dada por $k(a)=z$ para todo $a\in X$. Notemos que $h\not=k$ pues $z\not=x$ ya que $z\in A$ y $x\notin A$. Luego, $(f\circ h)(a)=f(h(a))= f(x)$ y $(f\circ k)(a)= f(k(a))= f(z)=f(x)$ para cada $a\in A$, por lo que $f\circ h=f\circ k$. Así, por hipótesis se sigue que $h=k$ lo cuál es una contradicción, por lo tanto, no debe ocurrir que $f(x)\in f[A]$. Así, $f(x)\in f[B]\setminus f[A]$.

$4)\rightarrow 5)$

Supongamos que para cualesquiera $A, B$ subconjuntos de $X$, se cumple que $f[B\setminus A]=f[B]\setminus f[A]$. Veamos que $f[A\cap B]= f[A]\cap f[B]$.

En la entrada de funciones probamos que $f[A\cap B]\subseteq f[A]\cap f[B]$, por lo que basta ver que $f[A]\cap f[B]\subseteq f[A\cap B]$.

Sea $y\in f[A]\cap f[B]$, entonces $y\in f[A]$ y $y\in f[B]$, así existe $x\in A$ tal que $f(x)=y$. Queremos demostrar que $x\in B$. Supongamos que no es así, es decir $x\notin B$. Por lo tanto, $x\in A\setminus B$ y $y=f(x)\in f[A\setminus B]= f[A]\setminus f[B]$.

Se sigue que $y\in f[A]$ y $y\notin f[B]$ lo cual es una contradicción. Por lo tanto, debe ocurrir que $x\in B$, así existe $x\in A\cap B$ tal que $f(x)=y$.

Por lo tanto, $f[A]\cap f[B]= f[A\cap B]$.

$5)\rightarrow 1)$

Supongamos que para cualesquiera $A, B\subseteq X$ se cumple que $f[A]\cap f[B]= f[A\cap B]$.

Sean $x_1, x_2\in X$ tales que $x_1\not= x_2$, veamos que $f(x_1)\not= f(x_2)$.

Consideremos $\set{x_1}$ y $\set{x_2}$ subconjuntos de $X$. Luego,

\begin{align*}
\emptyset&=f[\emptyset]\\
&=f[\set{x_1}\cap \set{x_2}]\\
&=f[\set{x_1}]\cap f[\set{x_2}]\ \text{por hipótesis}\\
&=\set{f(x_1)}\cap \set{f(x_2)}.
\end{align*}

Luego, como $\set{f(x_1)}\cap \set{f(x_2)}=\emptyset$, se tiene $\set{f(x_1)}\not=\set{f(x_2)}$ y por lo tanto, $f(x_1)\not=f(x_2)$.

Por lo tanto, $f$ es inyectiva.

Por lo tanto, todos los enunciados anteriores son equivalentes.

$\square$

Aunque existen muchas equivalencias de función inyectiva, para estas notas usaremos con mayor frecuencia la equivalencia dos del resultado anterior.

¿Qué pasa con la composición y la inyectividad?

Anteriormente vimos que la composición de funciones (pensándolas como relaciones) resulta ser una función. Podemos preguntarnos qué ocurre si las funciones que conforman a la composición son inyectivas. ¿Será que eso implica que la composición es inyectiva? Esto lo responde el siguiente teorema.

Teorema. Sean $f:X\to Y$ y $g:Y\to Z$ funciones inyectivas. Se cumple que $g\circ f$ es inyectiva.

Demostración.

Sean $f$ y $g$ funciones inyectivas y sean $x_1, x_2\in X$ tales que $(g\circ f)(x_1)= g(f(x_1))=g(f(x_2))= (g\circ f)(x_2)$. Dado que $f(x_1), f(x_2)\in Y$ y $g$ es inyectiva, entonces $ g(f(x_1))=g(f(x_2)) $ implica que $f(x_1)=f(x_2)$. Por la inyectividad de $f$ podemos concluir que $x_1=x_2$. Por lo tanto, $g\circ f$ es una función inyectiva.

$\square$

Tarea moral

La siguiente lista de ejercicios te permitirá reforzar el tema de funciones inyectivas.

  • Demuestra que la función inclusión es inyectiva.
  • Sean $A=\set{1,2,3}$, $B=\set{1,2}$ y $C=\set{1,2}$ conjuntos. Sean $f:A\to B$ y $g:B\to C$ funciones dadas por $f=\set{(1,1), (2,1), (3,2)}$ y $g=\set{(1,2), (2,1)}$ respectivamente. Escribe al conjunto $g\circ f$ y ve si la función correspondiente es inyectiva. Argumenta tu respuesta.
  • Si $f\circ g$ es inyectiva, ¿es cierto que $f$ y $g$ son inyectivas? ¿Será cierto que por lo menos una de ellas siempre es inyectiva?
  • Demuestra que la función $\emptyset$ es inyectiva.
  • Demuestra que $f:X\to Y$ una función constante es inyectiva si y sólo si $X=\set{x}$ para algún conjunto $x$.

Más adelante…

En la siguiente entrada abordaremos el tema de funciones suprayectivas. Con este tema tendremos los conceptos necesarios para comenzar a hablar acerca de funciones biyectivas e invertibles.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Aplicaciones del teorema de Cayley-Hamilton

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores ya enunciamos y demostramos el teorema de Cayley-Hamilton. Veremos ahora algunas aplicaciones de este resultado.

Encontrar inversas de matrices

El teorema de Cayley-Hamilton nos puede ayudar a encontrar la inversa de una matriz haciendo únicamente combinaciones lineales de potencias de la matriz. Procedemos como sigue. Supongamos que una matriz $A$ en $M_n(F)$ tiene polinomio característico $$\chi_A(x)=x^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0.$$ Como $a_0=\det(A)$, si $a_0=0$ entonces la matriz no es invertible. Supongamos entonces que $a_0\neq 0$. Por el teorema de Cayley-Hamilton tenemos que $$A^n+a_{n-1}A^{n-1}+\ldots+a_1A+a_0I_n=O_n.$$ De aquí podemos despejar la matriz identidad como sigue:

\begin{align*}
I_n&=-\frac{1}{a_0}\left( A^n+a_{n-1}A^{n-1}+\ldots+a_1A \right)\\
&=-\frac{1}{a_0}\left(A^{n-1}+a_{n-1}A^{n-2}+\ldots+a_1 I\right) A.
\end{align*}

Estos cálculos muestran que la inversa de $A$ es la matriz $$ -\frac{1}{a_0}\left(A^{n-1}+a_{n-1}A^{n-2}+\ldots+a_1 I\right).$$

Ejemplo. Supongamos que queremos encontrar la inversa de la siguiente matriz $$A=\begin{pmatrix} 2 & 2 & 0 \\ 0 & -1 & 0 \\ 1 & 1 & 1 \end{pmatrix}.$$ Su polinomio característico es $\lambda^3-2\lambda^2 – \lambda +2$. Usando la fórmula de arriba, tenemos que

$$A^{-1}=-\frac{1}{2}(A^2-2A-I).$$

Necesitamos entonces $A^2$, que es:

$$A^2=\begin{pmatrix} 4 & 2 & 0 \\ 0 & 1 & 0 \\ 3 & 2 & 1 \end{pmatrix}.$$

De aquí, tras hacer las cuentas correspondientes, obtenemos que:

$$A^{-1}=\begin{pmatrix} \frac{1}{2} & 1 & 0 \\ 0 & -1 & 0 \\ -\frac{1}{2} & 0 & 1\end{pmatrix}.$$

Puedes verificar que en efecto esta es la inversa de $A$ realizando la multiplicación correspondiente.

$\triangle$

El método anterior tiene ciertas ventajas y desventajas. Es práctico cuando es sencillo calcular el polinomio característico, pero puede llevar a varias cuentas. En términos de cálculos, en general reducción gaussiana funciona mejor para matrices grandes. Como ventaja, el resultado anterior tiene corolarios teóricos interesantes. Un ejemplo es el siguiente resultado.

Corolario. Si $A$ es una matriz con entradas en los enteros y determinante $1$ ó $-1$, entonces $A^{-1}$ tiene entradas enteras.

Encontrar el polinomio mínimo de una matriz

Otra de las consecuencias teóricas del teorema de Cayley-Hamilton con aplicaciones prácticas ya la discutimos en la entrada anterior.

Proposición. El polinomio mínimo de una matriz (o transformación lineal) divide a su polinomio característico.

Esto nos ayuda a encontrar el polinomio mínimo de una matriz: calculamos el polinomio característico y de ahí intentamos varios de sus divisores polinomiales para ver cuál de ellos es el de grado menor y que anule a la matriz. Algunas consideraciones prácticas son las siguientes:

  • Si el polinomio característico se factoriza totalmente sobre el campo y conocemos los eigenvalores, entonces conocemos todos los factores lineales. Basta hacer las combinaciones posibles de factores lineales para encontrar el polinomio característico (considerando posibles multiplicidades).
  • Además, para cada eigenvalor $\lambda$ ya vimos que $\lambda$ debe ser raíz no sólo del polinomio característico, sino también del polinomio mínimo. Así, debe aparecer un factor $x-\lambda$ en el polinomio mínimo para cada eigenvalor $\lambda$.

Ejemplo 1. Encontramos el polinomio mínimo de la siguiente matriz:

$$B=\begin{pmatrix} 2 & 0 & 4 \\ 3 & -1 & -1 \\0 & 0 & 2 \end{pmatrix}.$$

Una cuenta estándar muestra que el polinomio característico es $(x-2)^2(x+1)$. El polinomio mínimo debe ser mónico, dividir al polinomio característico y debe contener forzosamente a un factor $(x-2)$ y un factor $(x+1)$. Sólo hay dos polinomios con esas condiciones: $(x-2)(x+1)$ y $(x-2)^2(x+1)$. Si $(x-2)(x+1)$ anula a $B$, entonces es el polinomio mínimo. Si no, es el otro. Haciendo las cuentas:

\begin{align*}
(B-2I_3)(B+I_3)&=\begin{pmatrix}0 & 0 & 4 \\ 3 & -3 & -1 \\ 0 & 0 & 0 \end{pmatrix} \begin{pmatrix} 3 & 0 & 4 \\ 3 & 0 & -1 \\ 0 & 0 & 3 \end{pmatrix}\\
&=\begin{pmatrix} 0 & 0 & 12 \\ 0 & 0 & 12 \\ 0 & 0 & 0 \end{pmatrix}.
\end{align*}

Así, $(x-2)(x+1)$ no anula a la matriz y por lo tanto el polinomio mínimo es justo el polinomio característico $(x-2)^2(x+1)$.

$\triangle$

Ejemplo 2. Consideremos la matriz $C=\begin{pmatrix} 3 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 3 \end{pmatrix}$. Su polinomio característico es $(x-3)^3$. Así, su polinomio mínimo es $x-3$, $(x-3)^2$ ó $(x-3)^3$. Nos damos cuenta rápidamente que $x-3$ sí anula a la matriz pues $A-3I_3=O_3$. De este modo, el polinomio mínimo es $x-3$.

$\triangle$

Clasificación de matrices con alguna condición algebraica

Si sabemos que una matriz cumple una cierta condición algebraica, entonces el teorema de Cayley-Hamilton puede ayudarnos a entender cómo debe ser esa matriz, es decir, a caracterizar a todas las matrices que cumplan la condición.

Por ejemplo, ¿quienes son todas las matrices en $M_n(\mathbb{R})$ que son su propia inversa? La condición algebraica es $A^2=I_2$. Si el polinomio característico de $A$ es $x^2+bx+c$, entonces por el teorema de Cayley-Hamilton y la hipótesis tenemos que $O_2=A^2+bA+cI_2=bA+(c+1)I_2$. De aquí tenemos un par de casos:

  • Si $b\neq 0$, podemos despejar a $A$ como $A=-\frac{c+1}{b}I_2$, es decir $A$ debe ser un múltiplo de la identidad. Simplificando la notación, $A=xI_2$. Así, la condición $A^2=I_2$ se convierte en $x^2I_2=I_2$, de donde $x^2=1$ y por lo tanto $x=\pm 1$. Esto nos da las soluciones $A=I_2$ y $A=-I_2$.
  • Si $b=0$, entonces $O_2=(c+1)I_2$, de donde $c=-1$. De este modo, el polinomio característico es $x^2-1=(x+1)(x-1)$. Se puede demostrar que aquí las soluciones son las matices semejantes a la matriz $\begin{pmatrix}1 & 0 \\ 0 & -1 \end{pmatrix}$, y sólo esas.

Más adelante…

El teorema de Cayley-Hamilton es un resultado fundamental en álgebra lineal. Vimos dos demostraciones, pero existen varias más. Discutimos brevemente algunas de sus aplicaciones, pero tiene otras tantas. De hecho, más adelante en el curso lo retomaremos para aplicarlo nuevamente.

Por ahora cambiaremos ligeramente de tema. De manera muy general, veremos cómo llevar matrices a otras matrices que sean más simples. En las siguientes entradas haremos esto mediante similaridades de matrices. Más adelante haremos esto mediante congruencias de matrices. Hacia la tercer unidad del curso encontraremos un resultado aún más restrictivo, en el que veremos que cualquier matriz simétrica real puede ser llevada a una matriz diagonal mediante una matriz que simultáneamente da una similaridad y una congruencia.

Tarea moral

  1. Encuentra el polinomio mínimo de la matriz $\begin{pmatrix}-3 & 1 & 0 & 0 \\ 0 & -3 & 0 & 0 \\ 0 & 0 & 2 & 1 \\ 0 & 0 & 0 & 2\end{pmatrix}$.
  2. Encuentra la inversa de la siguiente matriz usando las técnica usada en esta entrada: $$\begin{pmatrix} 0 & 1 & 1 \\ 1 & -1 & 2\\ 2 & 2 & 1 \end{pmatrix}.$$
  3. Demuestra el corolario de matrices con entradas enteras. De hecho, muestra que es un si y sólo si: una matriz invertibles con entradas enteras cumple que su inversa tiene únicamente entradas enteras si y sólo si su determinante es $1$ ó $-1$.
  4. ¿Cómo son todas las matrices en $M_2(\mathbb{R})$ tales que $A^2=A$?
  5. ¿Cómo son todas las matrices en $M_3(\mathbb{R})$ de determinante $0$ tales que $A^3=O_3$?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Proceso de Gram-Schmidt en espacios euclideanos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior recordamos algunas de las aplicaciones que pueden tener las bases ortogonales y ortonormales. Esto nos da la pista de que siempre es bueno intentar conseguir una base ortonormal. ¿Es esto siempre posible? En el primer curso de Álgebra Lineal vimos que si tenemos en espacio euclideano, entonces sí. Esto está explicado a detalle en la entrada del Proceso de Gram-Schmidt.

Esta entrada está escrita únicamente en formato de recordatorio. Enunciamos los resultados principales, pero las demostraciones y más ejemplos se encuentran en otras entradas.

Teorema de Gram-Schmidt

El teorema de Gram-Schmidt asegura que dado un conjunto de vectores linealmente independientes en un espacio vectorial real con un producto interior dado, podemos encontrar otros vectores que ahora sean ortonormales, que generen lo mismo y que además «apunten hacia un lado similar» a los vectores originales. Además, asegura que estos vectores son únicos. El resultado concreto es el siguiente.

Teorema. Sea $V$ un espacio vectorial real con producto interior $\langle \cdot, \cdot \rangle$. Sean $v_1,\ldots,v_d$ vectores linealmente independientes. Entonces, existen únicos vectores ortonormales $e_1,\ldots,e_d$ tales que para toda $k\in\{1,2,\ldots,d\}$ se tiene que $$\text{span}(e_1,\ldots,e_k)= \text{span}(v_1,\ldots,v_k)$$ y $\langle e_k, v_k \rangle >0$.

Muy a grandes rasgos, esta forma de escribir el teorema permite hacer inducción en $d$. Al pasar a un nuevo $d$, podemos usar hipótesis inductiva para construir $e_1,\ldots,e_{d-1}$. Así, sólo hay que ver cómo construir $e_d$ para que sea ortogonal a todos los anteriores y para que tenga norma $1$. Para encontrar a un buen candidato, se debe poner a $e_d$ en términos de los $e_1,\ldots,e_{d-1}$ y $v_d$, y se debe suponer que cumple lo deseado. Al hacer algunos productos interiores esto nos dice que $e_d$ forzosamente se construye definiendo

$$f_d=v_d-\sum_{i=1}^{d-1}\langle v_d, e_i\rangle e_i$$

y tomando $e_d=\frac{f_d}{\norm{f_d}}$.

En los detalles de la prueba se ve que este $e_d$ en efecto cumple todo lo deseado.

Si estamos en un espacio euclideano, entonces tenemos una base finita. Podemos usar esta en la hipótesis del teorema de Gram-Schmidt para concluir lo siguiente.

Corolario. Todo espacio euclideano tiene una base ortonormal.

Algoritmo de Gram-Schmidt

La demostración del teorema de Gram-Schmidt a su vez da un algoritmo para encontrar de manera explícita la base ortonormal buscada. Es un algoritmo que poco a poco va construyendo los vectores. Supongamos que nos dan los vectores $v_1,\ldots,v_n$.

Para empezar, normalizamos $v_1$ para obtener $e_1=\frac{v_1}{\norm{v_1}}$. De aquí en adelante procedemos recursivamente. Si ya construimos $e_1,\ldots,e_k$, entonces podemos construir $e_{k+1}$ a través de la fórmula que pusimos, es decir, primero definimos

$$f_{k+1}=v_{k+1}-\sum_{i=1}^{k}\langle v_{k+1}, e_i\rangle e_i,$$

para luego tomar $e_{k+1}$ como la normalización de $f_{k+1}$, es decir, como $\frac{f_{k+1}}{\norm{f_{k+1}}}.$ Seguimos de esta manera hasta terminar.

El siguiente diagrama da una idea un poco más visual de cómo vamos haciendo las operaciones. Comenzamos con los vectores $v_1,\ldots,v_d$ de la fila superior. Luego, vamos construyendo a los $e_i$ y $f_i$ en el orden indicado por las flechas: $e_1,f_2,e_2,\ldots,f_{d-1},e_{d-1},f_d,e_d$. Para construir un $f_i$ usamos la fórmula con productos interiores. Para construir el $e_i$ correspondiente, normalizamos.

Intuición geométrica

Ya tenemos el lenguaje para entender mucho mejor el proceso de Gram-Schmidt. Si te das cuenta, cuando tomamos $$f_{k+1}=v_{k+1}-\sum_{i=1}^{k}\langle v_{k+1}, e_i\rangle e_i$$ justamente estamos aprovechando la descomposición

$$v_{k+1}= \left(\sum_{i=1}^{k}\langle v_{k+1}\right)+ f_{k+1}$$

de $v_{k+1}$ como suma de un elemento en espacio generado por $e_1,\ldots, e_k$ y uno en su ortogonal. El elemento del espacio generado lo obtenemos a través de la fórmula que sale de la descomposición de Fourier que vimos en la entrada anterior. El hecho de que $f_{k+1}$ esté en el ortogonal es lo que hace que cada nuevo vector sea ortogonal a los anteriores. Al final hay que normalizar $f_{k+1}$ para que la base sea ortonormal y no sólo ortogonal. Habría dos formas de hacerlo. Una es tomar $\frac{f_{k+1}}{\norm{f_{k+1}}}$. La otra es tomar $-\frac{f_{k+1}}{\norm{f_{k+1}}}$. El producto escalar positivo que pedimos es lo que nos da la unicidad.

Ejemplo de aplicación del algoritmo de Gram-Schmidt

Hagamos un ejemplo muy sencillo. Será sólo de práctica y como recordatorio. Hay ejemplos más interesantes en la entrada Problemas de bases ortogonales, Fourier y proceso de Gram-Schmidt.

Es sencillo verificar que $\langle (a,b,c), (x,y,z)\rangle =4ax+3by+2cz$ es un producto interior en $\mathbb{R}^3$. Vamos a ortonormalizar la base $(1,1,1)$, $(0,1,1)$, $(0,0,1)$.

En la notación del algoritmo, tenemos entonces $v_1=(1,1,1)$, $v_2=(0,1,1)$ y $v_3=(0,0,1)$. El primer paso es tomar $e_1=\frac{v_1}{\norm{v_1}}$. La norma de $v_1$ con este producto interior es $\sqrt{4+3+2}=3$. De este modo, $e_1=\left(\frac{1}{3}, \frac{1}{3} , \frac{1}{3} \right)$.

Teniendo $e_1$, podemos definir $f_2$ con la fórmula dada:

\begin{align*}
f_2&=v_2-\langle v_2, e_1 \rangle e_1\\
&=(0,1,1)-\left(4\cdot 0\cdot \frac{1}{3}+3\cdot 1 \cdot \frac{1}{3} + 2 \cdot 1 \cdot \frac{1}{3}\right)\left(\frac{1}{3},\frac{1}{3},\frac{1}{3} \right)\\
&=(0,1,1)-\frac{5}{3} \left(\frac{1}{3},\frac{1}{3},\frac{1}{3} \right)\\
&=\left(-\frac{5}{9},\frac{4}{9},\frac{4}{9}\right).
\end{align*}

De aquí, debemos normalizar $f_2$. Su norma es $$\sqrt{ \frac{100}{81}+\frac{48}{81}+\frac{32}{81} } = \frac{\sqrt{180}}{9}=\frac{2\sqrt{5}}{3}=\frac{10}{3\sqrt{5}}.$$ De este modo, $$e_2=\left(-\frac{\sqrt{5}}{6},\frac{2\sqrt{5}}{15},\frac{2\sqrt{5}}{15}\right)$$

Teniendo $e_1$ y $e_2$, podemos definir $f_3$ con la fórmula dada:

\begin{align*}
f_3&=v_3-\langle v_3, e_1 \rangle e_1 – \langle v_3, e_2 \rangle e_2\\
&=(0,0,1)-\frac{2}{3} \left(\frac{1}{3}, \frac{1}{3} , \frac{1}{3} \right) – \frac{4\sqrt{5}}{15} \left(-\frac{\sqrt{5}}{6},\frac{2\sqrt{5}}{15},\frac{2\sqrt{5}}{15}\right)\\
&=(0,0,1)-\left(\frac{2}{9}, \frac{2}{9} , \frac{2}{9} \right)-\left(-\frac{2}{9},\frac{8}{45},\frac{8}{45}\right)\\
&=\left(0, -\frac{2}{5},\frac{3}{5}\right).
\end{align*}

De aquí, debemos normalizar $f_3$. Su norma es $$\sqrt{\frac{12}{25}+\frac{18}{25}}=\frac{\sqrt{6}}{\sqrt{5}}=\frac{6}{\sqrt{30}}.$$ De este modo, $$e_3=\left( 0, -\frac{\sqrt{30}}{15}, \frac{\sqrt{30}}{10}\right).$$

Hemos encontrado la base ortonormal buscada $e_1,e_2,e_3$.

$\triangle$

Más adelante…

Con esta entrada-recordatorio terminamos la segunda unidad del curso. A partir de ahora es importante que recuerdes que todo espacio euclideano tiene una base ortonormal. También es útil que recuerdes cómo se obtiene, así que asegúrate de practicar el proceso de Gram-Schmidt.

Todo lo que hemos mencionado tiene su análogo en espacios vectoriales sobre los complejos con un producto interior hermitiano. Asegúrate de entender las diferencias y de realizar los ejercicios que te permitirán entender los resultados correspondientes.

En la siguiente unidad desarrollaremos la teoría necesaria para poder enunciar y demostrar tanto el teorema espectral real, como el teorema espectral complejo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Haz la demostración del teorema de Gram-Schmidt a partir del esquema comentado en la entrada. En caso de que se te dificulte, revisa los detalles en la entrada de blog correspondiente.
  2. Para verificar que todo esté en orden, verifica que los vectores $e_1,e_2,e_3$ del ejemplo en efecto son una base ortonormal con el producto interior dado.
  3. En el teorema de Gram-Schmidt, ¿es importante el orden en el que elijamos $v_1$ hasta $v_n$? ¿Cambia el conjunto resultante si cambiamos el orden? ¿Es conveniente tomar algún otro orden para simplificar las cuentas?
  4. Aplica el proceso de Gram-Schmidt a los vectores \begin{align*}(1,1,1,1)\\ (0,1,1,1)\\ (0,0,1,1)\\ (0,0,0,1)\end{align*} en $\mathbb{R}^4$ con el producto interior canónico (el producto punto).
  5. Enuncia y demuestra un teorema de Gram-Schmidt para espacios vectoriales sobre $\mathbb{C}$ con un producto interior hermitiano. Obtén el corolario correspondiente para los espacios hermitianos. Aplica este proceso a los vectores $(1+i,1+i,1+i),(0,1+i,1+i),(0,0,1+i)$ de $\mathbb{C}^3$ con el producto hermitiano canónico para obtener una base ortonormal.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»