Álgebra Superior II: Construcción de números complejos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En una entrada anterior esbozamos las construcciones de los números racionales y los números reales. Es hora de construir los números complejos. Para ello, definiremos primero el conjunto, $\mathbb{C}$, sobre el que trabajaremos, después definiremos sus operaciones.

Una forma intuitiva de visualizar a $\mathbb{C}$ es tomar el conjunto de los números reales ($\mathbb{R}$) y en ellos introducir un nuevo elemento, $i$, el cual satisface que $i^2=-1$. Este es, realmente, un nuevo elemento, pues en $\mathbb{R}$ siempre se tiene que $x^2\geq 0$.

Una vez que introducimos a $i$, queremos que las operaciones de suma y producto estén definidas en $\mathbb{C}$ y que, además este conjunto, sea cerrado bajo estas operaciones. Es decir, es necesario que para cualquier número real $b$ se tenga $bi\in \mathbb{C}$ y que para cualesquiera números reales $a$ y $b$ tengamos, también, $a+bi\in \mathbb{C}$. Resulta que esto «es suficiente», en el sentido de que ya no hay que meter más números para que las operaciones estén bien definidas. Veamos como es esto, si tenemos los números de la forma $a+bi$ y $c+di$ con $a,b,c,d\in \mathbb{R}$ y los sumamos y multiplicamos como sigue: $$(a+bi)+(c+di)=(a+c)+(b+d)i$$, vemos que, la suma, «tiene la misma forma» (ya que $a+c$ y $b+d$ son números reales) así como su producto:
\begin{align*}
(a+bi)(c+di)&=ac+bci+adi+bdi^2\\
&=(ac-bd)+(ad+bc)i.
\end{align*}
Desde luego que lo anterior es soló una discusión informal. En las siguientes secciones veremos cómo formalizar estas ideas.

Los números complejos se comportan muy bien en términos algebraicos y en términos de análisis. En términos algebraicos, esto se comenzará a notar en la última parte del curso en donde veremos que cualquier polinomio tiene por lo menos una raíz compleja. En cursos posteriores, como el de álgebra lineal, verás otras de las propiedades algebraicas de los polinomios. Más adelante, si llevas un curso de variable compleja verás las bellas propiedades analíticas que tienen los números complejos.

El campo de los números complejos

La construcción del conjunto de números complejos es bastante sencilla. Para hacerla, simplemente consideraremos las parejas de números reales $$\mathbb{C}=\{(a,b): a,b\in \mathbb{R}\}.$$

Por el momento a cada $(a,b)$ lo puedes pensar de manera informal como el complejo $a+bi$. Lo interesante del conjunto de los números complejos no son sus elementos en sí, sino las siguientes operaciones que están definidas en él.

Definición. Para $(a,b)$ y $(c,d)$ en $\mathbb{C}$, definimos su suma como $$(a,b)+(c,d)=(a+c,b+d).$$

Recordemos que dentro del paréntesis se usa la suma de $\mathbb{R}$ ya que $a$, $b$, $c$ y $d$ son números reales.

Definición. Para $(a,b)$ y $(c,d)$ en $\mathbb{C}$, definimos su producto como $$(a,b)(c,d)=(ac-bd,ad+bc).$$

Igualmente dentro del paréntesis se usan la suma y producto de $\mathbb{R}$. La definición de producto está motivada por la discusión que hicimos en la introducción.

Teorema. El conjunto $\mathbb{C}$, junto con las operaciones de suma y producto que definimos, es un campo.

Demostración. La suma es conmutativa y asociativa ya que cada entrada pertenece a $\mathbb{R}$ y en $\mathbb{R}$ la suma es conmutativa y asociativa. El neutro es $(0,0)$ pues $$(a,b)+(0,0)=(a+0,b+0)=(a,b)$$ y para $(a,b)$ su inverso aditivo es $(-a,-b)$.

Veamos ahora el producto. Probemos que es conmutativo. Para dos complejos $(a,b)$ y $(c,d)$ tenemos que $$(a,b)(c,d)=(ac-bd,ad+bc)$$ y que $$(c,d)(a,b)=(ca-db,cb+da).$$

Ambos resultados son iguales ya que cada entrada pertenece a $\mathbb{R}$ y la suma y el producto son conmutativos en $\mathbb{R}$.

Probemos que el producto es asociativo. Para ello tomemos tres complejos $(a,b)$, $(c,d)$ y $(e,f)$. Tenemos que
\begin{align*}
[(a,b)(c,d)](e,f)&=(ac-bd,ad+bc)(e,f)\\
&=(ace-bde-adf-bcf,acf-bdf+ade+bce),
\end{align*} y que
\begin{align*}
(a,b)[(c,d)(e,f)]&=(a,b)(ce-df,cf+de)\\
&=(ace-adf-bcf-bde,acf+ade+bce-bdf),
\end{align*}

Ambas expresiones son iguales ya que cada entrada pertenece a $\mathbb{R}$ y la suma es conmutativa en $\mathbb{R}$.

El complejo $(1,0)$ actúa como neutro multiplicativo, pues $$(a,b)(1,0)=(a\cdot 1 – b\cdot 0, a\cdot 0 + b\cdot 1)=(a,b).$$ Además, si tomamos un complejo $(a,b)\neq (0,0)$ y lo multiplicamos por $\left(\frac{a}{a^2+b^2},\frac{-b}{a^2+b^2}\right)$ obtenemos \begin{align*}
(a,b)\left(\frac{a}{a^2+b^2},\frac{-b}{a^2+b^2}\right)&= \left(\frac{a^2+b^2}{a^2+b^2}, \frac{-ab}{a^2+b^2}+\frac{ba}{a^2+b^2}\right)\\ &= (1,0),
\end{align*} lo cual muestra que tenemos inversos multiplicativos.

Sólo falta demostrar la propiedad distributiva. Su verificación se deja como tarea moral.

$\square$

La copia de los reales en los números complejos

Dentro de $\mathbb{C}$ hay una copia de los números reales. Esta consiste en asociarle, a cada número real $a$, el número complejo $\varphi(a)=(a,0)$. Esta asociación es claramente biyectiva. Además, si $a$ y $b$ son números reales, tenemos que $$(a,0)+(b,0)=(a+b,0)=\varphi(a+b)$$ y
\begin{align*}
(a,0)(b,0) &= (ab-0\cdot 0, a\cdot 0 + b\cdot 0)\\
&= (ab,0) = \varphi(ab).
\end{align*}
Además los neutros se van a neutros y los inversos a inversos. Esto muestra que $\varphi$ es una asociación biyectiva entre $\mathbb{R}$ y los complejos de la forma $(a,0)$ y que respeta la estructura de campo de $\mathbb{R}$.

Por otro lado, notemos que $$(0,1) (0,1)= (0\cdot 0 – 1\cdot 1, 0\cdot 1 + 1\cdot 0)= (-1, 0).$$

En otras palabras, al elevar el complejo $(0,1)$ al cuadrado obtenemos el número $(-1,0)$, que es precisamente $\varphi(-1)$.

Tras toda esta discusión, estamos justificados entonces en llamar simplemente $1$ al complejo $(1,0)$, en llamar $i$ al complejo $(0,1)$, y por lo tanto en llamar $a+bi$ al complejo $(a,b)$. A partir de aquí ya podemos olvidar la notación de parejas y tratar a los números complejos como lo discutimos en la introducción.

Operaciones en la notación $a+bi$

La notación $a+bi$ para números complejos es bastante práctica. Podemos trabajar con los complejos «igualito que en $\mathbb{R}$, pero, además, con la propiedad de que $i^2=-1$».

Como $i^4=(-1)^2=1$, tenemos que las potencias de $i$ se ciclan cada cuatro: $$1, i, i^2, i^3, i^4, i^5, i^6, \ldots$$ son $$1,i, -1, -i, 1, i,\ldots .$$ Ya mencionamos en la introducción que para complejos $a+bi$ y $c+di$ se tiene que $$(a+bi)+(c+di)=(a+c)+(b+d)i$$ y que $$(a+bi)(c+di)=(ac-bd)+(ad+bc)i,$$ de modo que cualquier composición de sumas y productos de números complejos se puede simplificar a la forma $x+yi$ con $x$ y $y$ reales.

Ejemplo. Simplifica la expresión $$(1+i)(1-i)+(2+i)(3-4i).$$ Solución. Haciendo el producto del primer sumando tenemos $(1+i)(1-i)=1^2-i^2=1-(-1)=2$. Haciendo el producto del segundo sumando tenemos \begin{align*}
(2+i)(3-4i)&=6+3i-8i-4i^2\\
&=6-5i+4\\
&=10-5i.
\end{align*}
De esta forma, el resultado de la operación es $$2+(10-5i)=12-5i.$$

$\triangle$

En complejos también podemos usar expresiones fraccionales, como $\frac{3+2i}{5-i}$. Si queremos pasar estas expresiones a la forma $x+yi$ con $x$ y $y$ reales, tenemos que pensar a $\frac{1}{5-i}$ como «el inverso multiplicativo de $5-i$», que como vimos en la demostración de que $\mathbb{C}$ es un campo, es $$\frac{5}{5^2+(-1)^2}+\frac{1}{5^2+(-1)^2}i=\frac{5}{26}+\frac{1}{26} i.$$ Una vez hecho esto, tenemos que \begin{align*}
\frac{3+2i}{5-i}&=(3+2i)\left( \frac{5}{26}+\frac{1}{26} i \right)\\
&=\frac{13}{26} + \frac{13}{26} i\\
&=\frac{1}{2}+\frac{1}{2} i.
\end{align*}

Otra forma de pensarlo es que a una expresión de la forma $\frac{a+bi}{c+di}$ la podemos simplificar «multiplicando arriba y abajo» por $c-di$. De esta forma, obtenemos
\begin{align*}
\frac{a+bi}{c+di} \cdot \frac{c-di}{c-di} = \left(\frac{ac+bd}{c^2+d^2}\right) + \left(\frac{bc-ad}{c^2+d^2}\right)i.
\end{align*}

Ambos métodos dan el mismo resultado.

Más adelante…

Al tomar un número complejo $z=a+bi$ y calcular su inverso, aparecen de manera natural las expresiones $a-bi$ y $a^2+b^2$. Estas expresiones son fundamentales.

  • A $a-bi$ se le conoce como el conjugado de $z$, y se denota por $\overline{z}$.
  • A $\sqrt{a^2+b^2}$ se le conoce como la norma de $z$ y se denota por $|z|$.

En la siguiente ocasión hablaremos de las propiedades de estas dos operaciones y cómo están relacionadas entre sí. Más adelante veremos su utilidad al resolver ecuaciones cuadráticas en los números complejos.

Si quieres, puedes revisar esta entrada sobre aplicaciones interesantes de los números complejos en la resolución de problemas. Tiene teoría que no hemos visto, pero te puede servir de motivación para aprender lo que veremos a continuación.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que en los complejos se satisface la ley distributiva.
  2. Verifica que bajo la asociación $\varphi$ en efecto los neutros se van a los neutros y los inversos a inversos.
  3. Realiza la operación $(1+i)(2+i)(1+2i)(2+2i)$ y expresa el resultado de la forma $x+yi$ con $x$ y $y$ reales.
  4. Realiza la operación $$\frac{3+5i}{2+i}-\frac{1+2i}{4-3i}$$ y expresa el resultado de la forma $x+yi$ con $x$ y $y$ reales.
  5. Realiza la operación $$1+(1+i)+(1+i)^2+(1+i)^3+(1+i)^4$$ y expresa el resultado de la forma $x+yi$ con $x$ y $y$ reales.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal I: Problemas de dualidad y base dual

Por Blanca Radillo

Introducción

En esta ocasión, comenzaremos a resolver problemas sobre un nuevo tema: espacio dual. La parte teórica ya la hemos cubierto en entradas anteriores. En la entrada de introducción a dualidad definimos el espacio dual y las formas coordenadas. Después, en una siguiente entrada, de bases duales vimos que las formas coordenadas son una base del espacio dual, hablamos de ciertos problemas prácticos para resolver, y vimos un teorema que relaciona bases, bases duales y una matriz invertible.

Problemas resueltos

Uno de los problemas de dualidad que discutimos la ocasión anterior es expresar a una base dual de vectores en $V$ en términos de la base dual de la base canónica. Veamos un ejemplo de esto.

Problema 1. Sean $v_1,v_2,v_3,v_4$ los vectores en $\mathbb{R}^4$ definidos como $$v_1=\begin{pmatrix} 1 \\ 1 \\ 1 \\ 1 \end{pmatrix}, v_2=\begin{pmatrix} 1 \\ 2 \\ 3 \\ 4 \end{pmatrix}, v_3=\begin{pmatrix} 0 \\ 0 \\ 1 \\ 2 \end{pmatrix}, v_4=\begin{pmatrix} 1 \\ 0 \\ 0 \\ 5 \end{pmatrix}.$$ Demuestra que $V:=\{v_1,v_2,v_3,v_4\}$ es una base de $\mathbb{R}^4$ y encuentra la base dual de $V$ en términos de $e_i^\ast$, donde $e_i^\ast$ es la base dual de la base canónica de $\mathbb{R}^4$.

Solución. Dado que $V$ está conformado por cuatro vectores y la dimensión de $\mathbb{R}^4$ es $4$, basta con probar que son vectores linealmente independientes. Hay dos maneras de hacerlo.

Manera 1: Sean $a,b,c,d \in \mathbb{R}$ tales que $0=av_1+bv_2+cv_3+dv_4$. Esto da cuatro ecuaciones

\begin{align*}
0&=a+b+d\\
0&=a+2b\\
0&=a+3b+c\\
0&=a+4b+2c+5d.
\end{align*}

De la segunda obtenemos que $a=-2b$, sustituyendo en la primera y en la tercera
\begin{align*}
d&=2b-b=b,\\
c&=2b-3b=-b,
\end{align*}
y sustituyendo ésto en la cuarta, tenemos que $0=-2b+4b-2b+5b=5b$. Por lo tanto $a=b=c=d=0$, implicando que los vectores en $V$ son linealmente independientes, y por consiguiente forman una base de $\mathbb{R}^4$.

Manera 2: También podemos hacer la reducción gaussiana en la matriz $(A|I)$ donde $A$ es la matriz cuyas columnas son los vectores de $V$. Esta forma tiene la ventaja de que a la vez calcularemos la matriz inversa que nos interesa encontrar.
$$\left( \begin{array}{cccc|cccc} 1 & 1 & 0 & 1 & 1 & 0 & 0 & 0 \\ 1 & 2 & 0 & 0 & 0 & 1 & 0 & 0 \\ 1 & 3 & 1 & 0 & 0 & 0 & 1 & 0 \\ 1 & 4 & 2 & 5 & 0 & 0 & 0 & 1 \end{array} \right)$$

$$\to \left( \begin{array}{cccc|cccc} 1 & 1 & 0 & 1 & 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & -1 & -1 & 1 & 0 & 0 \\ 0 & 2 & 1 & -1 & -1 & 0 & 1 & 0 \\ 0 & 3 & 2 & 4 & -1 & 0 & 0 & 1 \end{array} \right)$$

$$\to \left( \begin{array}{cccc|cccc} 1 & 1 & 0 & 1 & 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & -1 & -1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 1 & 1 & -2 & 1 & 0 \\ 0 & 0 & 2 & 7 & 2 & -3 & 0 & 1 \end{array} \right)$$

$$\to \left( \begin{array}{cccc|cccc} 1 & 0 & 0 & 0 & 2 & -7/5 & 4/5 & -2/5 \\ 0 & 1 & 0 & 0 & -1 & 6/5 & -2/5 & 1/5 \\ 0 & 0 & 1 & 0 & 1 & -11/5 & 7/5 & -1/5 \\ 0 & 0 & 0 & 1 & 0 & 1/5 & -2/5 & 1/5 \end{array} \right)$$


Como podemos reducir a la identidad, los vectores iniciales son linealmente independientes y forman una base. Más aún, ya obtuvimos la inversa de $A$.

Ahora, para obtener la base dual $V^{\ast}:=\{v_1^\ast,v_2^\ast,v_3^\ast,v_4^\ast\}$ de la base $V$, por lo visto en la última entrada, podemos escribir a cada elemento de $V^\ast$ como combinación lineal de $e_i^\ast$, donde los coeficientes del vector $v_i^\ast$ están en la $i$-ésima fila de $A^{-1}$. Por lo tanto,
\begin{align*}
v_1^\ast &= 2e_1^\ast -\frac{7}{5} e_2^\ast +\frac{4}{5} e_3^\ast -\frac{2}{5}e_4^\ast\\
v_2^\ast &= -e_1^\ast +\frac{6}{5} e_2^\ast -\frac{2}{5} e_3^\ast +\frac{1}{5}e_4^\ast\\
v_3^\ast &= e_1^\ast -\frac{11}{5} e_2^\ast +\frac{7}{5} e_3^\ast -\frac{1}{5}e_4^\ast\\
v_4^\ast &= \frac{1}{5} e_2^\ast -\frac{2}{5} e_3^\ast +\frac{1}{5}e_4^\ast.
\end{align*}

$\square$

Otro tipo de problemas de dualidad consisten en determinar algunos vectores en $V$ cuya base dual sea una base dada de $V^\ast$.

Problema 2. Considera las siguientes formas lineales en $\mathbb{R}^3$: \begin{align*}
l_1(x,y,z)&=x-y, \\
l_2(x,y,z)&=y-z, \\
l_3(x,y,z)&=x+y-z.
\end{align*}

  1. Prueba que $l_1,l_2,l_3$ forman una base del dual de $\mathbb{R}^3$.
  2. Encuentra una base de $\mathbb{R}^3$ cuya base dual es $l_1,l_2,l_3$.

Solución. (1) Por el último teorema de la entrada de bases duales, sabemos que $l_1,l_2,l_3$ forman una base si la matriz $A=[l_i(e_j)]$ es invertible, donde $e_j$ es la base canónica de $\mathbb{R}^3$.

Para mostrar que $A$ es invertible, calcularemos la forma escalonada reducida de la matríz $(A|I)$. Entonces,

\begin{align*}
&\left( \begin{array}{ccc|ccc} 1 & -1 & 0 & 1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 1 & 0 \\ 1 & 1 & -1 & 0 & 0 & 1 \end{array} \right) \\ \to &\left( \begin{array}{ccc|ccc} 1 & -1 & 0 & 1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 1 & 0 \\ 0 & 2 & -1 & -1 & 0 & 1 \end{array} \right) \\
\to &\left( \begin{array}{ccc|ccc} 1 & -1 & 0 & 1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 1 & 0 \\ 0 & 0 & 1 & -1 & -2 & 1 \end{array} \right) \\ \to &\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 0 & -1 & 1 \\ 0 & 1 & 0 & -1 & -1 & 1 \\ 0 & 0 & 1 & -1 & -2 & 1 \end{array} \right)
\end{align*}

Con esto concluimos que $A$ es invertible, y por lo tanto $l_1,l_2,l_3$ forman una base del dual de $\mathbb{R}^3$.

(2) En el inciso anterior, calculamos la inversa de $A$, obteniendo $$A^{-1}=\begin{pmatrix} 0 & -1 & 1 \\ -1 & -1 & 1 \\ -1 & -2 & 1 \end{pmatrix}.$$
Recordemos que la base $v_1,v_2,v_3$ de $\mathbb{R}^3$ está determinada por las columnas de $B=A^{-1}$, entonces $$v_1=\begin{pmatrix} 0 \\ -1 \\ -1 \end{pmatrix}, \ v_2=\begin{pmatrix} -1 \\ -1 \\ -2 \end{pmatrix}, \ v_3=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}.$$

$\square$

Veamos otro ejemplo, en el que veremos formas lineales un poco más interesantes, relacionadas con cálculo.

Problema 3. Sea $V=\mathbb{C}_2[X]$ el espacio vectorial de polinomios de grado a lo más 2 con coeficientes complejos, y para cada $P\in V$ definimos
\begin{align*}
l_1(P)&=P(0), \\ l_2(P)&=\int_0^1 P(x) \, dx, \\ l_3(P)&=\int_0^1 P(x)e^{-2\pi ix}\, dx.
\end{align*}

  1. Prueba que $l_1,l_2,l_3$ pertenecen a $V^*$. Más aún, forman una base de $V^*$.
  2. Encuentra una base $v_1,v_2,v_3$ de $V$ cuya base dual es $l_1,l_2,l_3$.

Solución. (1) No es difícil ver que son formas lineales. Para $l_1$, notamos que \begin{align*}
l_1(P+Q)&=P(0)+Q(0)=l_1(P)+l_1(Q)\\
l_1(aP)&=aP(0)=al_1(P)
\end{align*} para cualesquiera polinomios $P$ y $Q$, y cualquier escalar $a$ en $\mathbb{C}$. Para $l_2$ y $l_3$, la linealidad se sigue por las propiedades de la integral.

Para probar que $l_1, l_2,l_3$ forman una base de $V^\ast$, lo haremos de manera similar al problema anterior. Sabemos que $1,x,x^2$ forman la base canónica de $V$, entonces $L:=\{l_1,l_2,l_3\}$ es una base de $V^\ast$ si la matriz $A=[l_i(e_j)]$ es invertible. Calculando $$l_1(1)=1, \ l_1(x)=l_1(x^2)=0,$$ $$l_2(1)=1, \ l_2(x)=\int_0^1 xdx=\frac{1}{2},$$ $$ l_2(x^2)=\int_0^1 x^2 dx=\frac{1}{3},$$ $$l_3(1)=\int_0^1 e^{-2\pi i x}dx=0, \ l_3(x)=\int_0^1 xe^{-2\pi i x}dx=\frac{i}{2\pi},$$ $$l_3(x^2)=\int_0^1 x^2e^{-2\pi i x}dx=\frac{1+i\pi}{2\pi^2}.$$
(Para calcular $l_3(x),l_3(x^2)$ se usa integración por partes). Entonces la matriz es $$A=\begin{pmatrix} 1 & 0 & 0 \\ 1 & 1/2 & 1/3 \\ 0 & \frac{i}{2\pi} & \frac{1+i\pi}{2\pi^2} \end{pmatrix}.$$

Ahora, reduciremos la matriz $(A|I)$ para simultáneamente probar que $A$ es invertible y encontrar $A^{-1}$. Tenemos que

\begin{align*}
&\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 1 & 1/2 & 1/3 & 0 & 1 & 0 \\ 0 & \frac{i}{2\pi} & \frac{1+i\pi}{2\pi^2} & 0 & 0 & 1 \end{array} \right)\\
\to &\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 0 & 1/2 & 1/3 & -1 & 1 & 0 \\ 0 & i\pi & 1+i\pi & 0 & 0 & 2\pi^2 \end{array} \right)\\
\to & \left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 0 & 3 & 2 & -6 & 6 & 0 \\ 0 & 1 & \frac{1+i\pi}{i\pi} & 0 & 0 & -2i\pi \end{array} \right)\\
\to &\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & \frac{-6-6\pi i}{3+\pi i} & \frac{6+6\pi i}{3+\pi i} & \frac{-4\pi^2}{3+\pi i} \\ 0 & 0 & 1 & \frac{6\pi i}{3+\pi i} & \frac{-6\pi i}{3+\pi i} & \frac{6\pi^2}{3+\pi i} \end{array} \right)
\end{align*}

Por lo tanto $A$ es invertible, implicando que $L$ es una base de $V^*$.

(2) Ya calculada en el inciso anterior, tenemos que $$A^{-1}=\frac{1}{3+\pi i} \begin{pmatrix} 3+\pi i & 0 & 0 \\ -6-6\pi i & 6+6\pi i & -4\pi^2 \\ 6\pi i & -6 \pi i & 6\pi^2 \end{pmatrix}.$$ De esta matriz leemos a las coordenadas de la base que estamos buscando en términos de la la base canónica $\{1,x,x^2\}$. Las columnas son los vectores de coordenadas. Por lo tanto, la base de $V$ tal que $L$ es la base dual es:

\begin{align*}
v_1&= \frac{1}{3+\pi i} \left(3+\pi i – (6+6\pi i) x + 6\pi i x^2\right) \\
v_2&= \frac{1}{3+\pi i} \left((6+6\pi i)x-6\pi i x^2 \right) \\
v_3&= \frac{1}{3+\pi i} \left( -4\pi^2 x+6\pi^2x^2 \right).
\end{align*}

$\square$

Fórmula de interpolación de Lagrange

La teoría de dualidad tiene amplias aplicaciones. Con ella se puede probar un resultado clásico: podemos construir un polinomio de grado $n$ que pase por $n+1$ puntos que nosotros queramos. En el siguiente ejercicio vemos los detalles.

Problema. (Interpolación de Lagrange) Sea $V=\mathbb{R}_n[X]$ el espacio vectorial de polinomios de grado a lo más $n$ con coeficientes reales. Sean $x_0,\dots,x_n$ números reales distintos. Para $0\leq i \leq n$ definimos $$L_i(x)=\prod_{0\leq j\leq n, j\neq i} \frac{x-x_j}{x_i-x_j}.$$

  1. Demuestra que $L_i(x_j)=\delta_{ij}$ para todo $1\leq i,j \leq n$, donde $\delta_{ij}$ es igual a 1 si $i=j$ y es igual a 0 si $i\neq j$.
  2. Prueba que $L_0,\dots,L_n$ forman una base de $V$.
  3. Encuentra la base dual de $L_0,\dots,L_n$.
  4. Prueba la Fórmula de Interpolación de Lagrange: para todo $P\in V$ tenemos que $$P=\sum_{i=0}^n P(x_i)L_i.$$
  5. Demuestra que para cualquiera $b_0,\dots,b_n \in\mathbb{R}$, podemos encontrar un único polinomio $P\in V$ tal que $P(x_i)=b_i$ para todo $0\leq i \leq n$. Este polinomio $P$ es llamado el polinomio de interpolación de Lagrange asociado a $b_0,\dots,b_n$.

Solución. (1) Si $j\neq i$, entonces $$L_i(x_j)=\frac{x_j-x_j}{x_i-x_j}\cdot\prod_{k\neq j,i} \frac{x_j-x_k}{x_i-x_k}=0.$$ Por otro lado si $i=j$, $$L_i(x_j)=L_i(x_i)=\prod_{k\neq i} \frac{x_i-x_k}{x_i-x_k} =1 .$$

(2) Dado que $\text{dim}(V)=n+1$, cuya base canónica es $1,x,\ldots,x^n$ y $L_0,\dots,L_n$ son $n+1$ vectores, para probar que son base, basta con demostrar que son linealmente independientes. Sean $a_0,\dots,a_n$ tales que $a_0L_0+\dots+a_nL_n=0$. Evaluando en $x_i$ y usando el inciso anterior, tenemos que $$0=\sum_{j=0}^n a_jL_j(x_i)=\sum_{j=0}^n a_j\delta_{ij}=a_i,$$ pero esto pasa cualquier $0\leq i \leq n$. Por lo tanto $L_0,\dots,L_n$ son linealmente independientes, y por consiguiente, son base de $V$.

(3) Por definición de la base dual $L_i^*(L_j)=\delta_{ij}$, y por el inciso (a) tenemos que $L_j(x_i)=\delta_{ij}$, entonces $L_i^*(L_j)=L_j(x_i)$, para toda $i,j$. Ahora, fijamos $i$. Dado que $L_0,\dots, L_n$ forman una base de $V$ y dado que $L_i^*$ es lineal, para todo polinomio $P$ en $V$, escrito en términos de la base como $$P(x)=a_0L_0+a_1L_1+\ldots+a_nL_n,$$ tenemos que
\begin{align*}
L_i^*(P)&=a_0L_i^*(L_0)+\ldots+a_nL_i^\ast(L_n)\\
&=a_0L_0(x_i)+\ldots+a_nL_n(x_i)\\
&=P(x_i).
\end{align*}

Por lo tanto la base dual es $L_i^*=\text{ev}_{x_i}$. Dicho de otra forma, la $i$-ésima forma coordenada consiste en evaluar en $x_i$.

(4) Sabemos que la base dual satisface que $$P=\sum_{i=0}^n \langle L_i^*,P \rangle L_i.$$ Pero por el inciso anterior, $\langle L_i^*,P\rangle =L_i^*(P)=P(x_i)$, entonces $P=\sum_i P(x_i)L_i$.

(5) Definimos $P=\sum_{i=0}^n b_iL_i$. Por el inciso (1), tenemos que $$P(x_j)=\sum_i b_iL_i(x_j)=\sum_i b_i\delta_{ij}=b_j.$$ Entonces el polinomio existe. Falta probar la unicidad.

Suponemos que existe $Q\in V$ tal que $Q(x_i)=b_i$ para todo $i$. Notemos que $P-Q$ es un polinomio de grado a lo más $n$ (por definición) y $(P-Q)(x_i)=0$ para todo $i$, esto implica que $P-Q$ tiene $n+1$ raíces distintas, lo cual es imposible si $P-Q \neq 0$, por lo tanto, $P-Q=0$, es decir $P=Q$.

$\square$

El último argumento viene de la teoría de polinomios. Puedes repasarla en otro curso que tenemos en el blog. Observa que este problema también se satisface para los polinomios con coeficientes complejos, $V=\mathbb{C}_n[X]$. Intenta reproducir la demostración por tu cuenta.

Expresar integral como suma de evaluaciones

Terminamos esta entrada con el siguiente problema. El enunciado no menciona dualidad, pero podemos usar la teoría desarrollada hasta ahora para resolverlo.

Problema. Sean $x_0,x_1,x_2\in [0,1]$, y sea $V=\mathbb{R}_2[X]$. Definimos el mapeo $$l(P)=\int_0^1 P(x)e^{-x} dx.$$ Demuestra que $l$ es una forma lineal en $V$ y prueba que existe una única tercia $(a_0,a_1,a_2)$ de números reales tales que para todo polinomio $P$ en $V$ se cumple que $$\int_0^1 P(x)e^{-x}dx=a_0P(x_0)+a_1P(x_1)+a_2P(x_2).$$

Solución. Debido a las propiedades de la integral, es fácil ver que $l$ es lineal, ya que

\begin{align*}
l(aP+Q)&=\int_0^1 (aP(x)+Q(x))e^{-x} dx \\
&= a\int_0^1 P(x)e^{-x}dx+\int_0^1 Q(x)e^{-x}dx \\
&=al(P)+l(Q).
\end{align*}

Usando el problema anterior, tenemos que $L_0^*=\text{ev}_{x_0}$, $L_1^*=\text{ev}_{x_1}$ y $L_2^*=\text{ev}_{x_2}$ forman una base de $V^$. Por lo tanto existen $(a_0,a_1,a_2)$ tales que $l=a_0L_0^*+a_1L_1^*+a_2L_2^*.$ Entonces

\begin{align*}
\int_0^1 P(x)e^{-x}&=l(P)=a_0L_0^*(P) + a_1L_1^*(P) + a_2L_3^*(P) \\
&= a_0P(x_0) + a_1P(x_1) + a_2P(x_2).
\end{align*}

Es fácil ver que es única esa tercia, ya que, si existiera otra $(b_0,b_1,b_2)$ tal que $$l=b_0L_0^*+b_1L_1^*+b_2L_2^*,$$ esto implica que $$0=(a_0-b_0)L_0^*+(a_1-b_1)L_1^*+(a_2-b_2)L_2^*,$$ y dado que $L_i^*$ son una base, tendríamos $a_i=b_i$ para $i=0,1,2$.

$\square$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Superior II: Simplificación, suma y producto de complejos

Por Claudia Silva

Introducción

En una entrada de blog anterior, construimos el campo de los números complejos y definimos sus operaciones básicas. Ahora resolveremos algunos problemas de operaciones con complejos.

Haremos dos tipos de problemas. El primer tipo se trata de simplificar expresiones en números complejos para que se vuelvan de la forma $x+yi$ con $x$ y $y$ números reales. El segundo tipo es de realizar operaciones de suma, resta, producto y división de complejos, y luego simplificar.

Simplificación de expresiones complejas

Comenzamos con un vídeo de simplificar expresiones de números complejos.

Expresar en la forma $a+bi$ las expresiones…

Problemas de operaciones con complejos

Ahora vemos varios ejemplos de realizar sumas con números complejos.

Sumar números complejos

En todos los ejemplos del vídeo, realizamos sólo sumas de dos números, pero se podrían realizar sumas con cualquier cantidad de sumandos. Por ejemplo, podemos considerar la suma $$(5+2i)+(8+i)-(1-7i).$$ ¿Cuál sería el resultado de esta operación?

Finalmente, a continuación se muestra un vídeo en donde se realizan operaciones de productos y de divisiones de números complejos.

Productos y divisiones de números complejos

En el vídeo se define al conjugado del número complejo $z=a+bi$, que se denota por $\overline{z}$ y se obtiene de cambiarle el signo a la parte imaginaria. Por ejemplo, $\overline{4-5i}=4+5i$. Si multiplicas a un número complejo $a+bi$ por su conjugado, obtienes el real $a^2+b^2$. Esto es útil para quitar las partes imaginarias de los denominadores de expresiones fraccionales con complejos.

Más ejemplos y práctica extra

En otro curso, el Seminario de Resolución de Problemas, escribimos una entrada de cómo se pueden usar los números complejos para la resolución de problemas matemáticos. Ahí hay teoría más avanzada, pero puedes echarle un ojo para que veas lo que veremos más adelante en el curso.

En la página de Khan Academy en Español, puedes aprender más acerca de los números complejos, así como hacer muchos ejercicios de práctica.

Más adelante…

Tarea moral

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Seminario de Resolución de Problemas: El teorema del valor extremo

Por Fabian Ferrari

Introducción

En una entrada anterior, acerca de funciones continuas, mencionamos dos teoremas fundamentales que estas funciones satisfacen: el teorema del valor intermedio y el teorema del valor extremo. Ya hablamos acerca del teorema del valor intermedio en una entrada anterior. El objetivo de esta entrada es mencionar aplicaciones del teorema del valor extremo.

Como recordatorio, el teorema del valor extremo o teorema de los valores extremos nos dice que si una función $f(x)$ es continua en un intervalo cerrado $[a, b]$, entonces existen valores $c$ y $d$ en $[a, b]$ tales que $f(c) \leq f(x) \leq f(d)$ para toda $x$ en el intervalo $[a, b]$.

En otras palabras, lo que nos dice el teorema es que si una función es continua en un intervalo cerrado, tenemos que la función debe alcanzar un valor máximo y un valor mínimo dentro del intervalo.

Dos teoremas para funciones derivables

Aprovecharemos para mencionar dos teoremas importantes que se ocuparán más adelante. Las demostraciones de dichos teoremas tienen que ver con la aplicación del teorema del valor extremo, estos teoremas son el teorema de Rolle y el teorema del valor medio (no confundir con el teorema del valor intermedio).

Teorema de Rolle. Sean $a<b$ reales y $f:[a,b]\to\mathbb{R}$ una función continua en el intervalo $[a, b]$ y derivable en $(a, b)$. Se tiene que si $f(a)=f(b)$, entonces existe $c$ en $(a, b)$ tal que $f^\prime(c)=0$.

Sugerencia pre-demostración. Por el teorema del valor extremo, la función debe alcanzar un máximo y un mínimo en el intervalo. Divide en casos de acuerdo a dónde están estos valores, si en los extremos o no.

Demostración: Como $f(x)$ es una función continua en $[a, b]$, por el teorema del valor extremo tenemos que $f(x)$ alcanza un valor máximo y un valor mínimo en el intervalo $[a, b]$. Tenemos entonces los siguientes casos.

  • Caso i: Si el valor máximo y mínimo se encuentran en los extremos del intervalo, tenemos que la función $f(x)$ tiene que ser constante dado que $f(a)=f(b)$. y se tiene que $f^\prime(c)=0$ para todo $c$ en $[a, b]$.
  • Caso ii: Si el valor mínimo o máximo no están en los extremos. Sean $c_1$ y $c_2$ en $(a, b)$, los valores en los que la función alcanza su mínimo y máximo respectivamente. Alguno de estos no está en los extremos. Como $f(x)$ es derivable en $(a, b)$, tenemos que también va a ser derivable en alguno de los puntos $c_1$ y $c_2$, teniendo que $f^\prime(c_1)=0$ o $f^\prime(c_2)=0$, así que basta con tomar $c=c_1$ o $c=c_2$.

$\square$

Teorema del valor medio. Sean $a<b$ reales y $f:[a,b]\to\mathbb{R}$ una función continua en $[a, b]$ y diferenciable en $(a, b)$. Entonces existe un número $c$ en $(a, b)$ tal que

$\frac{f(b)-f(a)}{b-a}=f^\prime(c)$.

Demostración: Consideremos la siguiente función auxiliar:

$g(x)=(f(b)-f(a))x-(b-a)f(x)$

Tenemos que $g(x)$ es continua en $[a, b]$ y además es derivable en $(a,b)$. La derivada de $g(x)$ está dada por

$g^\prime(x)=f(b)-f(a)-(b-a)f^\prime(x)$

Como $g(x)$ es continua en $[a, b]$, tenemos que por el teorema del valor extremo, la función alcanza un máximo y un mínimo en el intervalo $[a, b]$. Haciendo las cuentas, $g(a)=g(b)$, de modo que si el máximo y mínimo ocurren en los extremos, entonces $g$ es constante y toda $c\in (a,b)$ satisface $g'(c)=0$

En otro caso, sea $c\in(a, b)$ el valor en donde $g(x)$ alcanza su mínimo o su máximo. Tenemos que $g^\prime(c)=0$.

Así, como $g^\prime(c)=f(b)-f(a)-(b-a)f^\prime(c)$, tenemos que:

$0=f(b)-f(a)-(b-a)f^\prime(c)$

$(b-a)f^\prime(c)=f(b)-f(a)$

$f^\prime(c)=\frac{f(b)-f(a)}{b-a}$

$\square$

Alternativamente, en la función anterior pudimos haber aplicado el teorema de Rolle directamente a la función $g$. En las siguientes entradas veremos aplicaciones de estos resultados a problemas concretos.

Aplicación del teorema del valor extremo a un problema

Problema. Se tiene un circulo de radio $r$, y una tangente $L$ que pasa por un punto $P$ de la circunferencia. De un punto cualquiera $R$ en la circunferencia se traza una paralela a $L$ que corta a la circunferencia en $Q$. Determina el área máxima que puede tener el triángulo $PQR$.

Sugerencia pre-solución. Antes que nada, haz una figura. Usa el teorema del valor extremo para asegurar la existencia del valor máximo. Para ello, necesitarás construir una función continua cuyo valor sea el área buscada. Puedes usar argumentos de simetría para conjeturar cuándo se alcanza el valor máximo.

Solución. Hacemos el siguiente diagrama para entender mejor el problema.

Diagrama del enunciado del problema

Fijémonos que las condiciones de la altura y la base del triángulo $PQR$ se pueden describir mediante la siguiente figura:

Condiciones para la altura y base del triángulo

Notemos que la altura del triángulo está dada por $r+h$, donde $h$ puede variar entre $-r$ y $r$. Este dibujo también nos es de ayuda para determinar el valor de la base. Por el teorema de Pitágoras y sabiendo que la distancia del centro $C$ a los puntos $R$ y $Q$ es igual a $r$, tenemos que la base del triángulo es igual a $2\sqrt{r^2-h^2}$.

Así, el área del triángulo está dada por $(\sqrt{r^2-h^2})(r+h)$, pero como $h$ varía, nos conviene ver el área en función de $h$.

$A(h)=\sqrt{r^2-h^2}(r+h),$

La función $A(h)$ es una función continua en el intervalo $[-r, r]$.

Notemos que cuando $h$ toma los valores de $-r$ y $r$, el valor del área es nulo, es decir que en estos valores alcanza el mínimo, lo cual quiere decir que por el teorema del valor extremo, el valor máximo lo alcanza en algún valor en $(-r, r)$.

Si derivamos la función $A(h)$, tenemos

$A^\prime(h)=\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}.$

Como sabemos que hay un máximo en el intervalo $(-r, r)$ y la derivada en este punto máximo debe ser igual a cero, hacemos $A^\prime(h)=0$.

Así,

$\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}=0.$

Resolviendo la ecuación tenemos que

$h=\frac{r}{2}.$

Así, el área máxima del triángulo $PQR$ es $$A=\sqrt{r^2-\left(\frac{r}{2}\right)^2}\left(r+\frac{r}{2}\right)=\frac{3\sqrt{3}r^2}{4}.$$

$\square$

Más ejemplos

Se pueden encontrar más problemas de aplicación del teorema del vaalor extremo en la Sección 6.4 del libro Problem Solving through Problems de Loren Larson.

Álgebra Lineal I: Bases duales, recetas y una matriz invertible

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior definimos el espacio dual de un espacio vectorial $V$. Así mismo, definimos las formas coordenadas, que son formas lineales asociadas a una base $B$ de $V$. Lo que hace la $i$-ésima forma coordenada en un vector $v$ es «leer» el $i$-ésimo coeficiente de $v$ expresado en la base $B$. Nos gustaría ver que estas formas coordenadas conforman bases del espacio dual.

Más concretamente, el objetivo de esta entrada es mostrar el teorema que enunciamos al final de la entrada anterior, hablar de problemas prácticos de bases duales y de mostrar un resultado interesante que relaciona bases, bases duales y la invertibilidad de una matriz.

Pequeño recordatorio

Como recordatorio, dada una base $B=\{e_1,\ldots,e_n\}$ de un espacio vectorial $V$ de dimensión finita $n$, podemos construir $n$ formas coordenadas $e_1^\ast,\ldots,e_n^\ast$ que quedan totalmente determinadas por lo que le hacen a los elementos de $B$ y esto es, por definición, lo siguiente:

$$
e_i^\ast(e_j)=
\begin{cases}
1\quad \text{ si $i=j$,}\\
0\quad \text{ si $i\neq j$.}
\end{cases}
$$

Recordemos también que dado un vector $v$ en $V$ podíamos construir a la forma lineal «evaluar en $v$», que era la forma $\text{ev}_v:V^\ast \to F$ dada por $\text{ev}_v(f)=f(v)$. Como manda elementos de $V^\ast$ a $F$, entonces pertenece a $V^{\ast \ast}$. A partir de esta definición, construimos la bidualidad canónica $\iota:V\to V^{\ast \ast}$ que manda $v$ a $\text{ev}_v$.

Finalmente, recordemos que dada una forma lineal $l$ y un vector $v$, usamos la notación $\langle l,v\rangle = l(v)$, y que esta notación es lineal en cada una de sus entradas. Todo esto lo puedes revisar a detalle en la entrada anterior.

El teorema de bases duales

El resultado que enunciamos previamente y que probaremos ahora es el siguiente.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ y $B=\{e_1,\ldots,e_n\}$ una base de $V$. Entonces el conjunto de formas coordenadas $B^\ast=\{e_1^\ast, \ldots,e_n^\ast\}$ es una base de $V^\ast$. En particular, $V^\ast$ es de dimensión finita $n$. Además, la bidualidad canónica $\iota:V\to V^{\ast \ast}$ es un isomorfismo de espacios vectoriales.

Antes de comenzar, convéncete de que cada una de las $e_i^\ast$ son formas lineales, es decir, transformaciones lineales de $V$ a $F$.

Demostración. Veremos que $B^\ast=\{e_1^\ast,\ldots,e_n^\ast\}$ es un conjunto linealmente independiente y que genera a $V^\ast$. Veamos lo primero. Tomemos una combinación lineal igual a cero, $$z:=\alpha_1 e_1^\ast + \alpha_2 e_2^\ast+\ldots + \alpha_n e_n^\ast=0.$$ Para cada $i=1,2,\ldots,n$, podemos evaluar la forma lineal $z$ en $e_i$.

Por un lado, $z(e_i)=0$, pues estamos suponiendo que la combinación lineal de $e_i^\ast$’s es (la forma lineal) cero. Por otro lado, analizando término a término y usando que los $e_i^\ast$ son la base dual, tenemos que si $i\neq j$ entonces $e_j^\ast(e_i)$ es cero, y si $i=j$, es $1$.

Así que el único término que queda es $\alpha_i e_i^\ast(e_i)=\alpha_i$. Juntando ambas observaciones, $\alpha_i=z(e_i)=0$, de modo que todos los coeficientes de la combinación lineal son cero. Asi, $B^\ast$ es linealmente independiente.

Ahora veremos que $B^\ast$ genera a $V^\ast$. Tomemos una forma lineal arbitraria $l$, es decir, un elemento en $V^\ast$. Al evaluarla en $e_1,e_2,\ldots,e_n$ obtenemos escalares $$\langle l, e_1\rangle,\langle l, e_2\rangle,\ldots,\langle l, e_n\rangle. $$ Afirmamos que estos son los coeficientes que nos ayudarán a poner a $l$ como combinación lineal de elementos de $B^\ast$. En efecto, para cualquier vector $v$ tenemos que

\begin{align*}
\left(\sum_{i=1}^n\langle l, e_i \rangle e_i^\ast\right) (v)
&= \sum_{i=1}^{n} \langle l, e_i \rangle \langle e_i^\ast, v \rangle \\
&= \sum_{i=1}^{n} \langle l, \langle e_i^\ast, v \rangle e_i \rangle \\
&=\left \langle l, \sum_{i=1}^n \langle e_i^\ast, v\rangle e_i \right \rangle\\
&= \langle l, v \rangle\\
&= l(v).
\end{align*}

La primer igualdad es por la definición de suma de transformaciones lineales. En la segunda usamos la linealidad de la segunda entrada para meter el escalar $\langle e_i^\ast , v\rangle$. La siguiente es de nuevo por la linealidad de la segunda entrada. En la penúltima igualdad usamos que justo $\langle e_i^\ast , v\rangle$ es el coeficiente que acompaña a $e_i$ cuando escribimos a $v$ con la base $B$. Esto muestra que $B^\ast$ genera a $V^\ast$.

Así, $B^\ast$ es base de $V^\ast$. Como $B^\ast$ tiene $n$ elementos, entonces $V^\ast$ tiene dimensión $n$.

La última parte del teorema consiste en ver que $\iota:V\to V^{\ast \ast}$ es un isomorfismo de espacios vectoriales. Por lo que acabamos de demostrar, $$\dim V = \dim V^\ast = \dim V^{\ast \ast}.$$ Así que basta con mostrar que $\iota$ es inyectiva pues, de ser así, mandaría a una base de $V$ a un conjunto linealmente independiente de $V^{\ast \ast}$ con $n$ elementos, que sabemos que es suficiente para que sea base. Como $\iota$ es transformación lineal, basta mostrar que el único vector que se va a la forma lineal $0$ de $V^\ast$ es el $0$ de $V$.

Supongamos que $v$ es tal que $\text{ev}_v=0$. Vamos a mostrar que $v=0$. Si $\text{ev}_v=0$, en particular para las formas coordenadas $e_i^\ast$ tenemos que $ \text{ev}_v(e_i^\ast)=0$. En otras palabras, $e_i^\ast(v)=0$ para toda $i$. Es decir, todas las coordenadas de $v$ en la base $B$ son $0$. Así, $v=0$. Con esto terminamos la prueba.

$\square$

La demostración anterior muestra cómo encontrar las coordenadas de una forma lineal $l$ en términos de la base $B^\ast$: basta con evaluar $l$ en los elementos de la base $B$. Recopilamos esto y la igualdad dual como una proposición aparte, pues resulta ser útil en varios contextos.

Proposición. Sea $V$ un espacio vectorial de dimensión finita $n$, $B=\{e_1,\ldots, e_n\}$ una base de $V$ y $B^\ast=\{e_1^\ast,\ldots,e_n^\ast\}$ la base dual. Entonces, para todo vector $v$ en $V$ y para toda forma lineal $l:V\to F$, tenemos que
\begin{align*}
v&= \sum_{i=1}^n \langle e_i^\ast, v\rangle e_i \quad \text{ y }\\
l&= \sum_{i=1}^{n} \langle l, e_i \rangle e_i^\ast.
\end{align*}

La traza de una matriz en $M_n(F)$ es la suma de las entradas en su diagonal principal. Es sencillo verificar que la función $\text{tr}:M_n(F)\to F$ que manda a cada matriz a su traza es una forma lineal, es decir, un elemento de $M_n(F)^\ast$.

Ejemplo. Considera el espacio vectorial de matrices $M_3(\mathbb{R})$. Sea $B=\{E_{ij}\}$ su base canónica. Expresa a la forma lineal traza en términos de la base dual $B^\ast$.

Solución. Tenemos que $\text{tr}(E_{ii})=1$ y que si $i\neq j$, entonces $\text{tr}(E_{ij})=0$. De esta forma, usando la fórmula de la proposición anterior,
\begin{align*}
\text{tr}&=\sum_{i,j} \text{tr}(E_{ij}) E_{ij}^\ast\\
&=E_{11}^\ast + E_{22}^\ast + E_{33}^\ast.
\end{align*} Observa que, en efecto, esta igualdad es correcta. Lo que hace $E_{ii}^\ast$ por definición es obtener la entrada $a_{ii}$ de una matriz $A=[a_{ij}]$.

La igualdad que encontramos dice que «para obtener la traza hay que extraer las entradas $a_{11}$, $a_{22}$, $a_{33}$ de $A$ y sumarlas». En efecto, eso es justo lo que hace la traza.

$\triangle$

Algunos problemas prácticos de bases duales

Ya que introdujimos el concepto de espacio dual y de base dual, hay algunos problemas prácticos que puede que queramos resolver.

  • Dada una base $v_1,\ldots,v_n$ de $F^n$, ¿cómo podemos encontrar a la base dual $v_1^\ast, \ldots, v_n^\ast$ en términos de la base dual $e_1^\ast, \ldots, e_n^\ast$ de la base canónica?
  • Dada una base $L=\{l_1,\ldots, l_n\}$ de $V^\ast$, ¿es posible encontrar una base $B$ de $V$ tal que $B^\ast = L$? De ser así, ¿cómo encontramos esta base?

A continuación mencionamos cómo resolver ambos problemas. Las demostraciones se quedan como tarea moral. En la siguiente entrada veremos problemas ejemplo resueltos.

  • La receta para resolver el primer problema es poner a $v_1,\ldots, v_n$ como vectores columna de una matriz $A$. Las coordenadas de $v_1^\ast,\ldots, v_n^\ast$ en términos de la base $e_1^\ast,\ldots,e_n^\ast$ están dados por las filas de la matriz $A^{-1}$.
  • La receta para resolver el segundo problema es tomar una base $B’=\{e_1,\ldots, e_n\}$ cualquiera de $V$ y considerar la matriz $A$ con entradas $A=[l_i(e_j)]$. La matriz $A^{-1}$ tiene como columnas a los vectores de coordenadas de la base $B$ que buscamos con respecto a la base $B’$.

¿Por qué la matriz $A$ de la segunda receta es invertible? Esto lo mostramos en la siguiente sección.

Un teorema de bases, bases duales e invertibilidad de matrices

La demostración del siguiente teorema usa varias ideas que hemos estado desarrollando con anterioridad. Usamos que:

  • Si $V$ es de dimensión finita $n$ y $B$ es un conjunto de $n$ vectores de $V$, entonces basta con que $B$ sea linealmente independiente para ser base. Esto lo puedes repasar en la entrada del lema de intercambio de Steinitz.
  • Una matriz cuadrada $A$ es invertible si y sólo si el sistema de ecuaciones $AX=0$ sólo tiene la solución trivial $X=0$. Esto lo puedes repasar en la entrada de equivalencias de matrices invertibles.
  • Una matriz cuadrada $A$ es invertible si y sólo si su transpuesta lo es.
  • El hecho de que la bidualidad canónica $\iota$ es un isomorfismo entre $V$ y $V^{\ast \ast}$.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ sobre el campo $F$. Sea $B=\{v_1,\ldots, v_n\}$ un conjunto de vectores en $V$ y $L=\{l_1,\ldots, l_n\}$ un conjunto de elementos de $V^\ast$, es decir, de formas lineales en $V$. Consideremos a la matriz $A$ en $M_n(F)$ dada por $$A=[l_i(v_j)].$$ La matriz $A$ es invertible si y sólo si $B$ es una base de $V$ y $L$ es una base de $V^\ast$.

Demostración. Mostraremos primero que si $B$ no es base, entonces $A$ no es invertible. Como $B$ tiene $n$ elementos y no es base, entonces no es linealmente independiente, así que existe una combinación lineal no trivial $$\alpha_1 v_1+\ldots+\alpha_n v_n=0.$$ De esta forma, si definimos $v=(\alpha_1,\ldots, \alpha_n)$, este es un vector no cero, y además, la $i$-ésima entrada de $Av$ es $$\alpha_1 l_i(v_1)+\ldots+\alpha_n l_i(v_n) = l_i(\alpha_1 v_1 + \ldots + \alpha_n v_n) = 0.$$ De este modo, $AX=0$ tiene una no solución trivial y por lo tanto no es invertible.

De manera similar, si $L$ no es base, entonces hay una combinación lineal no trivial $$\beta_1 L_1 + \ldots + \beta_n L_n =0$$ y entonces el vector $w=(\beta_1,\ldots,\beta_n)$ es una solución no trivial a la ecuación $^t A X=0$, por lo que $^t A$ no es invertible, y por lo tanto $A$ tampoco lo es.

Ahora veremos que si $L$ y $B$ son bases, entonces $A$ es invertible. Si $A$ no fuera invertible, entonces tendríamos una solución no trivial $(\alpha_1,\ldots,\alpha_n)$ a la ecuación $AX=0$. Como vimos arriba, esto quiere decir que para cada $i$ tenemos que $$ l_i(\alpha_1 v_1 + \ldots + \alpha_n v_n) = 0.$$ Como $l_i$ es base de $V^\ast$, esto implica que $l(\alpha_1 v_1 + \ldots + \alpha_n v_n)=0$ para toda forma lineal $l$, y como la bidualidad canónica es un isomorfismo, tenemos que $$\alpha_1 v_1 + \ldots + \alpha_n v_n=0.$$ Esto es imposible, pues es una combinación lineal no trivial de los elementos de $B$, que por ser base, son linealmente independientes.

$\square$

Más adelante…

Esta entrada es un poco abstracta, pues habla de bastantes transformaciones aplicadas a transformaciones, y eso puede resultar un poco confuso. Se verán problemas para aterrizar estas ideas. La importancia de entenderlas y manejarlas correctamente es que serán de utilidad más adelante, cuando hablemos de los espacios ortogonales, de transposición de transformaciones lineales y de hiperplanos.

La teoría de dualidad también tiene amplias aplicaciones en otras áreas de las matemáticas. En cierto sentido, la dualidad que vemos aquí es también la que aparece en espacios proyectivos. Está fuertemente relacionada con la dualidad que aparece en teoremas importantes de optimización lineal, que permiten en ocasiones reformular un problema difícil en términos de uno más fácil, pero con el mismo punto óptimo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Usa la definición de linealidad para ver que las formas coordenadas $e_i^\ast$ en efecto son formas lineales.
  • Muestra que $\iota:V \to V^{\ast \ast}$, la bidualidad canónica, es una transformación lineal.
  • Justifica por qué la primer receta resuelve el primer problema práctico de bases duales.
  • Justifica por qué la segunda receta resuelve el segundo problema práctico de bases duales.
  • Sean $a_0,a_1,\ldots,a_n$ reales distintos. Considera el espacio vectorial $V=\mathbb{R}_n[x]$ de polinomios con coeficientes reales y grado a lo más $n$. Muestra que las funciones $\text{ev}_{a_i}:V\to \mathbb{R}$ tales que $\text{ev}_{a_i}(f)=f(a_i)$ son formas lineales linealmente independientes, y que por lo tanto son una base de $V^\ast$. Usa esta base, la base canónica de $V$ y el teorema de la última sección para mostrar que la matriz $$\begin{pmatrix} 1 & a_0 & a_0 ^2 & \ldots & a_0^n\\ 1 & a_1 & a_1^2 & \ldots & a_1^n\\ 1 & a_2 & a_2^2 & \ldots & a_2^n\\ & \vdots & & \ddots & \vdots \\ 1 & a_n & a_n^2 & \ldots & a_n^n\end{pmatrix}$$ es invertible.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»