Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Álgebra Superior II: Raíces en los complejos y raíces de la unidad.

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada veremos cómo resolver, en $\mathbb{C}$, la ecuación $w^n=z$, en donde $z$ es un complejo y $n$ es un entero positivo. Puedes pensar esto como que aprenderemos a obtener raíces en los complejos, pero sólo para $n$ entero. Más adelante hablaremos de la función exponencial compleja que nos permitirá elevar a otro tipo de exponentes.

Nuestra herramienta principal será la fórmula de De Moivre, que ya demostramos en una entrada anterior. Encontrar raíces $n$-ésimas es una herramienta más en nuestra caja para trabajar con números complejos, que hasta el momento ya incluye resolver ecuaciones cuadráticas complejas y sistemas de ecuaciones lineales complejos.

Introducción a raíces en los complejos

Pensemos en un ejemplo sencillo. ¿Cuáles son los complejos $w$ tales que $w^4=1$? En $\mathbb{R}$ tenemos dos de ellos: $1$ y $-1$. Como $$(-i)^4=i^4=(-1)^2=1,$$ en $\mathbb{C}$ tenemos otras dos soluciones: $i$ y $-i$. Así que tenemos $4$ soluciones en $\mathbb{C}$: $1$, $-1$, $i$ y $-i$.

Para mostrar que son las únicas en este sencillo caso, podemos hacer lo siguiente. Expresamos $1$ en forma polar $1=\text{cis}(0)$ y también, en forma polar, una solución $w=s\text{cis}(\alpha)$, con $\theta$ en $[0,2\pi)$. Por el teorema de De Moivre, tenemos que $$1=w^4=s^4\text{cis}(4\alpha).$$

Así, la norma $s$ de $w$ debe satisfacer $s^4=1$, y además $\text{cis}(4\alpha)$ debe ser $1$, por lo que $4\alpha$ debe ser un múltiplo entero de $2\pi$. La norma es un real positivo, así que la única solución para $s$ es $1$. Ahora, ¿cuántos argumentos $\alpha$ en $[0,2\pi)$ hacen que $4\alpha$ sea un múltiplo entero de $2\pi$?

Para determinar esto, notemos que $4\alpha$ está en $[0,8\pi)$, y ahí hay exactamente cuatro múltiplos enteros de $2\pi$, que son $$0,2\pi, 4\pi, 6\pi.$$ Esto es justo lo que limita las soluciones a que sean a lo más $4$.

Podemos continuar para verificar que en efecto son las soluciones que ya encontramos. Las soluciones para $\alpha$ en cada caso son $$0,\frac{\pi}{2},\pi,\frac{3\pi}{2}.$$ Concluimos entonces que las soluciones complejas de $w^4=1$ son, en forma polar,
\begin{align*}
w_1&=\text{cis}(0)\\
w_2&=\text{cis}\left(\frac{\pi}{2}\right)\\
w_3&=\text{cis}\left(\pi\right)\\
w_4&=\text{cis}\left(\frac{3\pi}{2}\right),
\end{align*}

que son exactamente $1,i,-1,-i$.

$\triangle$

El teorema de raíces en los complejos

La discusión anterior funciona en general para cualquier entero positivo $n$ y para cualquier complejo $\mathbb{C}$. Siempre tenemos exactamente $n$ soluciones y sabemos cómo se ven en forma polar.

Teorema. Sea $z=r\text{cis}(\theta)$ un número complejo, distinto de cero, dado en forma polar y $n$ un entero positivo. Existen exactamente $n$ elementos distintos de $\mathbb{C}$ tales que $w^n = z$. Están dados en forma polar por $$w_j=r^{1/n} \text{cis}\left(\frac{\theta}{n} + j\frac{2\pi}{n}\right)$$ para $j=0,1,2\ldots,n-1$.

Demostración. Tomemos una solución $w$ y la escribimos en forma polar $w=s\text{cis}(\alpha)$, con $\alpha$ en $[0,2\pi)$. Usando que $w$ es solución y la fórmula de De Moivre, obtenemos que $$r\text{cis}(\theta)=s^n\text{cis}(n\alpha).$$ Como $s$ tiene que ser real positivo, obtenemos que $s=r^{1/n}$ (aquí estamos usando la raíz $n$-ésima en los reales).

El ángulo $n\alpha$ está en el intervalo $[0,2n\pi)$, y debe diferir en un múltiplo entero de $2\pi$ del ángulo $\theta$. Como $\theta$ está en $[0,2\pi)$, las únicas posibilidades para $n\alpha$ pueden ser los $n$ valores $$\theta, \theta+2\pi,\ldots, \theta+2(n-1)\pi,$$ de donde las soluciones para $\alpha$ son $$\frac{\theta}{n},\frac{\theta}{n}+\frac{2\pi}{n}, \ldots, \frac{\theta}{n} + (n-1)\frac{2\pi}{n},$$ respectivamente. Como son ángulos distintos en $[0,2\pi)$, obtenemos las posibles soluciones distintas $$r^{1/n} \text{cis}\left(\frac{\theta}{n} + j\frac{2\pi}{n}\right)\quad \text{para $j=0,\ldots,n-1$}.$$

Verificar que en efecto son soluciones es sencillo, ya sea revirtiendo los pasos que hicimos, o usando directamente la fórmula de De Moivre. Esta verificación queda como tarea moral.

$\square$

Observa que el teorema dice que para obtener una raíz podemos empezar del complejo de norma $r^{1/n}$ y argumento $\frac{\theta}{n}$, y de ahí obtener el resto de las raíces en los complejos «rotando repetidamente $\frac{2\pi}{n}$ en el plano complejo». Esto muestra que las raíces forman los vértices de un $n$-ágono regular.

Nos costó un poco de trabajo mostrar que teníamos a lo más $n$ soluciones. En realidad, cualquier ecuación polinomial de grado $n$, es decir, de la forma $$a_nx^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0=0$$ tiene a lo más $n$ soluciones. Esto lo veremos con toda generalidad en la última unidad, cuando hablemos de polinomios.

Ejemplos de obtener raíces en los complejos

Ejemplo. Encontremos todas las raíces séptimas del complejo $128\text{cis}\left(\frac{14\pi}{13}\right)$. Para empezar, notemos que $128^{1/7}=2$, de modo que todas las raíces tienen norma $2$.

Una de las raíces tiene argumento $\frac{14\pi}{7\cdot 13}=\frac{2\pi}{13}$ y el argumento del resto difiere en múltiplos enteros de $\frac{2\pi}{7}$. De esta forma, las raíces son

\begin{align*}
w_1&=2\text{cis}\left(\frac{2\pi}{13}\right)\\
w_2&=2\text{cis}\left(\frac{2\pi}{13}+\frac{2\pi}{7}\right)=2\text{cis}\left(\frac{40\pi}{91}\right)\\
w_3&=2\text{cis}\left(\frac{2\pi}{13}+\frac{4\pi}{7}\right)=2\text{cis}\left(\frac{66\pi}{91}\right)\\
w_4&=2\text{cis}\left(\frac{2\pi}{13}+\frac{6\pi}{7}\right)=2\text{cis}\left(\frac{92\pi}{91}\right)\\
w_5&=2\text{cis}\left(\frac{2\pi}{13}+\frac{8\pi}{7}\right)=2\text{cis}\left(\frac{118\pi}{91}\right)\\
w_6&=2\text{cis}\left(\frac{2\pi}{13}+\frac{10\pi}{7}\right)=2\text{cis}\left(\frac{144\pi}{91}\right)\\
w_7&=2\text{cis}\left(\frac{2\pi}{13}+\frac{12\pi}{7}\right)=2\text{cis}\left(\frac{170\pi}{91}\right).
\end{align*}

$\triangle$

Problema. Sabemos que $(2-3i)^4=-119+120i$. Encuentra las otras raíces cuartas de $-119+120i$.

Solución. Podríamos pasar $-119+120i$ a forma polar y usar el método anterior. Esto funciona y dará una solución. Pero veamos una solución alternativa más corta, que nos ayuda a entender mejor el teorema de raíces en los complejos.

De acuerdo con lo que probamos, las raíces varían únicamente en argumento, al que se le va sumando $\frac{\pi}{2}$. Es decir, si tenemos una raíz en el plano complejo, las demás se obtienen de ir rotando $\frac{\pi}{2}$ (recuerda que esto es $90^\circ$) desde el origen. Al ir rotando el punto $(2,-3)$ en el plano complejo en este ángulo, obtenemos los puntos $(-3,-2)$, $(-2,3)$ y $(3,2)$, de modo que las otras tres raíces son $-3-2i$, $-2+3i$ y $3+2i$.

Otra forma más de pensarlo es la siguiente. Si ya tenemos una raíz cuarta $w$ de un complejo $z$, entonces todas las raíces se obtienen multplicando por $1,i,-1, -i$. En efecto, por ejemplo, $$(iw)^4=i^4w^4=w^4=1.$$ Así, para el problema que nos interesa, las soluciones son

\begin{align*}w_1&=2-3i\\w_2&=i(2-3i)=3+2i\\w_3&=-(2-3i)=-2+3i\\w_4&=-i(2-3i)=-3-2i,\end{align*}
lo cual coincide con lo que habíamos encontrado antes.

$\triangle$

Raíces $n$-ésimas de la unidad

Un caso particular importante de la teoría desarrollada en la sección anterior es cuando $z$ es $1$. Sea $n$ un entero positivo y $w$ un complejo tal que $w^n=1$. A $w$ se le conoce como una raíz $n$-ésima de la unidad.

Teorema (de las raíces $n$-ésimas de la unidad). Sea $n$ un entero positivo. Existen exactamente $n$ raíces $n$-ésimas de la unidad distintas. Si $\omega$ es la que tiene el menor argumento positivo, entonces dichas raíces son $$1,\omega, \omega^2,\ldots, \omega^{n-1}.$$

La demostración se sigue fácilmente del teorema de raíces $n$-ésimas y queda como tarea moral. Cualquier raíz $n$-ésima $\omega$ tal que sus primeras potencias generen todas las raíces $n$-ésimas de la unidad se le conoce como una raíz primitiva.

Las raíces $n$-ésimas de la unidad tienen una interpretación geométrica bonita. Forman los vértices del $n$-ágono regular con $n$ vértices, sobre la circunferencia unitaria, donde uno de los vértices es $1$.

Ejemplo. Obtengamos las raíces quintas de la unidad. Primero, obtengamos la de menor argumento positivo, que por el teorema de raíces en los complejos, es $$\omega = \text{cis}\left(\frac{2\pi}{5}\right).$$ El resto de las raíces son entonces $\omega^2$, $\omega^3$, $\omega^4$ y $1$. Las podemos encontrar en el plano complejo como vértices del siguiente pentágono regular:

Ejemplo de raíces en los complejos: raíces quintas de la unidad
Raíces quintas de la unidad

Cualquiera de $\omega$, $\omega^2$, $\omega^3$ y $\omega^4$ son raíces primitivas, pero $1$ no es raíz primitiva pues sus potencias sólo son él mismo.

$\triangle$

Las raíces $n$-ésimas de la unidad se utilizan en muchos contextos. Aunque se puede trabajar con ellas de forma explícita, muchas veces se utilizan sólo las propiedades algebraicas que cumplen. A continuación enunciamos algunas.

Teorema. Sea $\omega$ una raíz primitiva $n$-ésima de la unidad. Las raíces $n$-ésimas de la unidad $$\omega_i = \omega^i $$ para $i=0,\ldots,n-1$ satisfacen las siguientes propiedades:

  • Para $n>1$, se tiene que $\omega_0+\ldots+\omega_{n-1}=0$.
  • Para $k=0,1,\ldots,n-1$, se tiene que $$(\omega_k)^{-1}=\overline{\omega_k}=\omega_{n-k}.$$
  • Se tiene que $\omega_0\cdot\ldots\cdot \omega_{n-1} = (-1)^{n+1}$.

Demostración. Empezamos con el primer inciso. Si $n>1$, tenemos que $1$ no es raíz primitiva, así que para el primer inciso sabemos que $\omega\neq 1$. Usamos la fórmula para suma de términos en una progresión geométrica:
\begin{align*}
\omega_0+\omega_1&+\ldots+\omega_{n-1}\\
&= 1+\omega+\ldots+\omega^{n-1}\\
&=\frac{1-\omega^n}{1-\omega}\\
&=\frac{1-1}{1-\omega}\\
&=0.
\end{align*}

Para la segunda parte, notemos que $$\omega_k\omega_{n-k}=\omega^k\omega^{n-k}=\omega^n=1,$$ lo cual prueba una de las igualdades. La otra igualdad se sigue del hecho general que el inverso de un complejo de norma $1$ es su conjugado, cuya demostración queda como tarea moral.

La tercera parte se sigue de la propiedad anterior. Al multiplicar todas las raíces de la unidad, podemos emparejar a cada raíz con su conjugado para obtener producto $1$. Las únicas excepciones es cuando emparejamos a un complejo consigo mismo, es decir, para cuando $\omega_k=\overline{\omega_k}$, lo cual sucede sólo cuando $\omega_k$ es real. Las únicas posibilidades son $1$ ó $-1$. El $1$ no tiene problema pues colabora con un factor $1$. Si $n$ es impar, $-1$ no es raíz $n$-ésima, así que no contribuye al producto. Si $n$ es par sí. Esto muestra lo que queremos pues $(-1)^{n+1}$ es $1$ si $n$ es impar y $-1$ si es par.

$\square$

Para un entero positivo $n$, llamemos $(U_n,\cdot)$ al conjunto de raíces $n$-ésimas de la unidad equipadas con el producto complejo.

Teorema. Para cada entero positivo $n$, se tiene que $(U_n,\cdot)$ es un grupo y es isomorfo a $(\mathbb{Z}_n,+)$.

Demostración. El producto de cualesquiera dos raíces $n$-ésimas es también una raíz $n$-ésima. Por el teorema anterior, los inversos multiplicativos de las raíces $n$-ésimas también son raíces $n$-ésimas. Esto basta para mostrar que se forma un grupo.

Para la segunda parte, notamos que ambos grupos son el grupo cíclico de $n$ elementos. Una correspondencia entre ellos está dada por mandar $[1]_n$ a cualquier raíz primitiva.

$\square$

Más adelante…

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra las raíces cúbicas de $8-8i$ y dibújalas en el plano complejo.
  2. Verifica que las soluciones obtenidas en el teorema de raíces $n$-ésimas en efecto son soluciones.
  3. Muestra el teorema de las raíces $n$-ésimas de la unidad.
  4. Prueba que si $z$ es un complejo de norma $1$, entonces su inverso es su conjugado.
  5. Sea $\omega$ una raíz $n$-ésima primitiva de la unidad. Muestra que $w^k$ es una raíz primitiva si y sólo si $n$ y $k$ son primos relativos, es decir, $\MCD{n,k}=1$. Sugerencia: Usa lo que sabemos de soluciones a ecuaciones diofantinas lineales.
  6. Encuentra de manera explícita la parte real y la parte imaginaria de todas las raíces quintas de la unidad.
    Sugerencia: La ecuación $w^5-1=0$ se puede factorizar como $$(w-1)(w^4+w^3+w^2+w+1)$$ y $w^4+w^3+w^2+w+1$ se puede factorizar como $$\left(w^2+\frac{1+\sqrt{5}}{2}w+1\right)\left(w^2+\frac{1-\sqrt{5}}{2}w+1\right).$$ Usa lo que sabemos de resolver ecuaciones cuadráticas cojmplejas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal I: Bases ortogonales

Por Leonardo Ignacio Martínez Sandoval

Introducción

Como ya discutimos en las entradas anteriores, si tenemos un espacio vectorial $V$ con producto interior, entonces podemos definir varias nociones geométricas en $V$, como ángulos, norma y distancia. Ahora vamos a definir una noción muy útil en álgebra lineal: la de bases ortogonales. Para ello, combinaremos las nociones de bases y producto interior.

Las bases ortogonales no sólo tienen aplicaciones en álgebra lineal. También son el punto de partida de muchos conceptos matemáticos avanzados. Un primer ejemplo es el análisis de Fourier, que estudia cómo aproximar funciones mediante funciones trigonométricas y que tiene aplicaciones en el mundo real en análisis de señales. Otro ejemplo es la vasta teoría de polinomios ortogonales, con aplicaciones en el mundo real en aproximación e integración numérica.

En estas entradas de bases ortogonales tomaremos espacios vectoriales sobre $\mathbb{R}$ con un producto interior $\langle \cdot,\cdot \rangle$.

Conjuntos ortogonales y ortonormales

Comenzamos con la siguiente definición. Recuerda que $V$ es un espacio vectorial sobre $\mathbb{R}$ con producto interior, así que induce una norma $\Vert \cdot \Vert$.

Definición. Sea $S$ un conjunto de vectores en $V$. Decimos que $S$ es

  • Ortogonal si cualquier par de vectores distintos de $S$ es ortogonal, es decir, si para todo $v,w$ en $S$, con $v\neq w$ se tiene que $$\langle v, w \rangle = 0.$$
  • Ortonormal si es ortogonal, y además todo vector de $S$ tiene norma $1$.

En otras palabras, $S$ es ortonormal si para todo $v$ en $S$ se tiene $\langle v, v\rangle =1$ y para $v$ y $w$ en $S$ distintos se tiene $\langle v, w\rangle =0$.

Ejemplo. Si tomamos a $\mathbb{R}^n$ con el producto punto, entonces la base canónica es un conjunto ortonormal pues, en efecto, $e_i\cdot e_i = 1$ y para $i\neq j$ se tiene $e_i\cdot e_j = 0$.

Todo conjunto de un sólo elemento es ortogonal, pues no hay nada que probar. Otro conjunto ortonormal en $\mathbb{R}^2$ es el conjunto que sólo tiene al vector $\left(\frac{3}{5},\frac{4}{5}\right)$, pues este es un vector de norma $1$.

Los vectores $(1,1,0)$, $(1,-1,0)$ y $(0,0,1)$ forman otro conjunto ortogonal en $\mathbb{R}^3$, pues en efecto
\begin{align*}
(1,1,0)\cdot (1,-1,0)&=1-1=0\\
(1,-1,0)\cdot (0,0,1)&=0\\
(0,0,1)\cdot (1,1,0)&=0.
\end{align*}

Sin embargo, este no es un conjunto ortonormal, pues la norma de $(1,1,0)$ es $\sqrt{2}\neq 1$. Si normalizamos a cada vector, es decir, si lo dividimos entre su norma, entonces obtenemos los vectores ortonormales $\left(1/\sqrt{2},1/\sqrt{2},0\right)$, $\left(1/\sqrt{2},-1/\sqrt{2},0\right)$ y $(0,0,1)$.

$\triangle$

Propiedades de conjuntos ortogonales y ortonormales

Todo conjunto ortogonal de vectores no nulos se puede normalizar como en el ejemplo de la sección anterior para obtener un conjunto ortonormal. Es decir, si $S$ es un conjunto de vectores distintos de $0$, entonces $$S’=\left\{\frac{v}{\Vert v \Vert}: v\in S\right\}$$ es un conjunto ortonormal.

Una propiedad fundamental de los conjuntos ortonormales de vectores es que son linealmente independientes. Se puede probar algo un poco más general.

Proposición. Si $S$ es un conjunto ortogonal de vectores no nulos, entonces los elementos de $V$ son linealmente independientes.

Demostración. Tomemos $v_1,\ldots,v_n$ elementos de $S$ y supongamos que existen $\alpha_1,\ldots,\alpha_n$ escalares tales que $$v:=\sum_{i=1}^n \alpha_i v_i =0.$$

Tomemos un índice $j$ en $1,\ldots,n$ y hagamos el producto interior $\langle v, v_j\rangle$. Por un lado, como $v=0$, este produto es $0$. Por otro lado, por linealidad es $$\sum_{i=1}^n \alpha_i \langle v_i,v_j\rangle.$$

Cuando $i\neq j$, el sumando correspondiente es igual a $0$. De este modo, el único sumando no cero es cuando $i=j$, el cual es $\alpha_j \langle v_j,v_j\rangle$. De estos argumentos, deducimos que $$\alpha_j\langle v_j,v_j\rangle =0.$$ Como los vectores son no nulos, se tiene que $\langle v_j,v_j\rangle \neq 0$. Así, $\alpha_j=0$ para todo $j=1,\ldots,n$, lo cual muestra que los vectores son linealmente independientes.

$\square$

Como cada elemento de un conjunto ortonormal tiene norma $1$, entonces no puede ser nulo, así que como corolario de la proposición anterior, todo conjunto ortonormal es linealmente independiente. Otro corolario es el siguiente.

Corolario. En un espacio Euclideano de dimensión $d$, los conjuntos ortogonales sin vectores nulos tienen a lo más $d$ elementos.

Bases ortogonales y ortonormales

Cuando una base de un espacio vectorial es ortogonal (o bien, ortonormal), pasan varias cosas buenas. Esto amerita una definición por separado.

Definición. Sea $S$ un conjunto de vectores en $V$. Decimos que $S$ es

  • Una base ortogonal si $S$ es una base de $V$ y es un conjunto ortogonal.
  • Una base ortonormal si $S$ una base de $V$ y es un conjunto ortonormal.

Ejemplo. En $\mathbb{R}^n$ la base canónica es una base ortonormal.

En $\mathbb{R}^2$ el conjunto $S=\{(2,3),(9,-6)\}$ es un conjunto ortogonal. Además, se puede verificar fácilmente que son dos vectores linealmente independientes. De este modo, $S$ es una base ortogonal.

Sin embargo, $S$ no es una base ortonormal pues el primero de ellos tiene norma $\sqrt{2^2+3^2}=\sqrt{13}$. Si quisiéramos convertir a $S$ en una base ortonormal, podemos normalizar a cada uno de sus elementos.

$\triangle$

En la sección anterior vimos que los conjuntos ortonormales son linealmente independientes. Otro corolario de este resultado es lo siguiente.

Corolario. En un espacio Euclideano de dimensión $n$, un conjunto ortonormal de $n$ vectores es una base ortonormal.

La importancia de las bases ortogonales yace en que dada una base ortonormal $B$ y un vector $v$, podemos encontrar varias propiedades de $v$ en términos de $B$ fácilmente. Por ejemplo, veremos más adelante que:

  • Las coordenadas de $v$ con respecto a la base $B$ son sencillas.
  • Hay una fórmula simple para la norma de $v$ en términos de sus coordenadas en la base $B.$
  • Si $B$ es una base de un subespacio $W$ de $V$, entonces es fácil encontrar la distancia de $v$ a $W.$

Mejor aún, las bases ortonormales siempre existen.

Teorema. Todo espacio Euclideano tiene una base ortonormal.

Es decir, sin importar qué espacio vectorial real de dimensión finita tomemos, y sin importar qué producto punto le pongamos, podemos dar una base ortogonal. De hecho, veremos un resultado un poco más fuerte, que nos dará un procedimiento para encontrar dicha base, incluso imponiendo restricciones adicionales.

Ejemplo de bases ortogonales en polinomios

Ejemplo. Tomemos $\mathbb{R}_n[x]$ el espacio de polinomios de grado a lo más $n$ con coeficientes reales. Además, tomemos números reales distintos $x_0,\ldots,x_n$. A partir de estos reales podemos definir la operación $$\langle P, Q \rangle = \sum_{j=0}^n P(x_j)Q(x_j),$$ la cual es claramente bilineal y simétrica.

Tenemos que $\langle P,P\rangle$ es una suma de cuadrados, y por lo tanto es no negativa. Además, si $\langle P, P\rangle =0$, es porque $$\sum_{j=0}^n P(x_j)^2=0,$$ y como estamos trabajando en $\mathbb{R}$ esto implica que cada sumando debe ser cero. Pero las igualdades $$P(x_0)=\ldots=P(x_n)=0$$ dicen que los $n+1$ reales distintos $x_i$ son raíces de $P$, y como $P$ es de grado a lo más $n$, tenemos que $P$ es el polinomio $0$. En resumen, $\langle \cdot, \cdot \rangle$ es un producto interior en $\mathbb{R}_n[x]$. Vamos a dar una base ortogonal con respecto a este producto interior.

Para $i=0,\ldots,n$, consideremos los polinomios $$L_i(x)=\prod_{0\leq k \leq n, k\neq i} \frac{x-x_k}{x_i-x_k}.$$ Observa que $L_j(x_j)=1$ y si $j\neq i$, tenemos $L_i(x_j)=0$. Afirmamos que $$B=\{L_j:j=0,\ldots,n+1\}$$ es una base ortonormal de $\mathbb{R}_n[x]$ con el producto interior que definimos. Como consiste de $n+1$ polinomios y $\dim(\mathbb{R}_n[x])=n+1$, basta con que veamos que es un conjunto ortonormal.

Primero, notemos que
\begin{align*}
\langle L_i,L_i \rangle = \sum_{j=0}^n L_i(x_j)^2 = L_i(x_i)^2=1,
\end{align*}

de modo que cada $L_i$ tiene norma $1$.

Luego, notemos que si $i\neq j$, entonces $L_i(x_k)L_j(x_k)=0$ pues $x_k$ no puede ser simultáneamente $x_i$ y $x_j$. De este modo,

\begin{align*}
\langle L_i,L_j \rangle = \sum_{k=0}^n L_i(x_k)L_j(x_k)=0.
\end{align*}

Con esto mostramos que cada par de polinomios distintos es ortogonal. Esto termina la demostración de que $B$ es base ortonormal.

$\square$

Ejemplo de conjuntos ortogonales en funciones periódicas

Ejemplo. Consideremos $V$ el conjunto de funciones $f:\mathbb{R}\to \mathbb{R}$ continuas y periódicas de periodo $2\pi$. Definimos $$\langle f,g \rangle = \int_{-\pi}^\pi f(x)g(x)\, dx.$$ Se puede mostrar que $\langle \cdot, \cdot \rangle$ así definido es un producto interior en $V$.

Para cada entero positivo $n$, definimos
\begin{align*}
C_n(x)&=\frac{\cos(nx)}{\sqrt{\pi}}\\
S_n(x)&=\frac{\sin(nx)}{\sqrt{\pi}}.
\end{align*}

Además, definimos $C_0(x)=\frac{1}{\sqrt{2\pi}}$. Afirmamos que $$\mathcal{F}:=\{C_n:n\geq 0\}\cup \{S_n:n\geq 1\}$$ es un conjunto ortonormal de vectores. Mostremos esto.

Para empezar, notamos que $$\Vert C_0\Vert ^2 = \int_{-\pi}^{\pi} \frac{1}{2\pi}\, dx =1.$$

Luego, tenemos que para $n\geq 1$ que
\begin{align*}
\Vert C_n\Vert ^2 &= \int_{-\pi}^\pi \frac{1}{\pi} \cos^2(nx)\, dx\\
&= \int_{-\pi}^\pi \frac{1+\cos(2nx)}{2\pi}\, dx\\
&= 1,
\end{align*}

ya que para todo entero $m\neq 0$ se tiene que $$\int_{-\pi}^\pi \cos(mx) \, dx=0.$$ De manera similar, usando la identidad $$\sin^2(nx)=\frac{1-\cos(nx)}{2},$$ se puede ver que la norma de $S_n$ es $1$.

Para ver que las parejas de elementos distintas son ortogonales, tenemos varios casos. Si tomamos $n\geq 1$, el resultado para $\langle C_0,C_n\rangle$ ó $\langle C_0,S_n\rangle$ se deduce de que
$$\int_{-\pi}^\pi \cos(mx)\, dx=\int_{-\pi}^\pi \sin(mx)\, dx=0$$ para todo entero $m\neq 0$.

Si tomamos dos $C_i$’s distintos, dos $S_i’s$ distintos o un $C_i$ y un $S_i$, el resultado se deduce de las fórmulas «producto a suma» de las funciones trigonométricas.

$\square$

Más adelante…

En esta entrada combinamos las nociones de bases y el producto interior, estudiadas en entradas anteriores, para definir a las bases ortogonales. Vimos algunas propiedades de conjuntos ortogonales y ortonormales, para extenderlos a bases ortogonales y ortonormales. Vimos unos ejemplos de bases ortogonales de los polinomios y otros ejemplos de conjuntos ortogonales en funciones periódicas.

En la siguiente entrada veremos aplicaciones de estos conceptos, culminando en una descomposición de Fourier.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra un conjunto ortogonal de vectores en $\mathbb{R}^4$ tal que ninguna de las entradas de ninguno de sus vectores sea igual a $0$.
  • Escribe las demostraciones de los corolarios enunciados en esta entrada.
  • Muestra que $\langle \cdot, \cdot \rangle$ definido en el ejemplo de funciones periódicas es un producto interior.
  • Termina de mostrar que la familia $\mathcal{F}$ del ejemplo de funciones periódicas es ortonormal. Sugerencia: Usa identidades de suma y resta de ángulos para poner el producto de senos (o cosenos o mixto) como una suma de senos y/o cosenos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Seminario de Resolución de Problemas: Grupos, anillos y campos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En estas entradas hemos visto cómo distintas herramientas de álgebra nos pueden ayudar en la resolución de problemas. En las primeras dos entradas, hablamos de identidades algebraicas básicas y un par de avanzadas. Luego, hablamos de factorización en polinomios y del teorema de la identidad. Ahora platicaremos de cómo estructuras un poco más abstractas nos pueden ayudar. De manera particular, nos enfocaremos en aplicaciones de teoría de grupos a la resolución de problemas. Sin embargo, hacia el final de la entrada también hablaremos un poco acerca de anillos, dominios enteros y campos.

Teoría de grupos básica

Una de las nociones de álgebra abstracta más básicas, y a la vez más flexibles, es la de grupo. La teoría de grupos es muy rica y se estudia a profundidad en un curso de álgebra abstracta o álgebra moderna. Aquí veremos únicamente un poco de esta teoría y algunas aplicaciones a resolución de problemas. Comenzamos con la definición.

Definición. Un grupo es un conjunto no vacío $G$ con una operación binaria $\cdot$ que cumple lo siguiente:

  • Asociatividad: Para cualesquiera elementos $x,y,z$ en $G$ tenemos que $x\cdot (y\cdot z) = (x\cdot y) \cdot z$.
  • Neutro: Existe un elemento $e$ en $G$ tal que $x\cdot e = x = e\cdot x$ para todo elemento x.
  • Inversos: Para cada elemento $x$ en $G$, existe un elemento $y$ en $G$ tal que $x\cdot y = e = y\cdot x$.

Usualmente se simplifica la notación de la siguiente manera. Por un lado, en vez de poner el símbolo de producto, simplemente se ponen elementos consecutivos, por ejemplo $a\cdot b = ab$. Además, por la asociatividad, muchas veces no se ponen los paréntesis, de modo que expresiones como $(a\cdot b)\cdot c$ se escriben simplemente como $abc$, a menos que los paréntesis ayuden a entender un argumento.

Hay que tener cuidado con invertir el orden de factores. En grupos, no necesariamente sucede que la operación es conmutativa, es decir, que $ab=ba$ para todo par de elementos $a$ y $b$. Si $ab=ba$ decimos que $a$ y $b$ conmutan y si todo par de elementos de $G$ conmutan, decimos que $G$ es conmutativo. Un elemento siempre conmuta consigo mismo. Para $n$ un entero positivo definimos $a^n$ como el producto formado por $n$ veces el elemento $a$.

A partir de la definición se puede ver que el neutro es único, pues si hubiera dos neutros $e$ y $e’$ tendríamos $e=e\cdot e’=e’$, en donde primero usamos que $e’$ es neutro y después que $e$ lo es. Para $a$ en $G$, definimos $a^0$ como $e$.

En grupos se vale «cancelar». Por ejemplo, si $ab=ac$, entonces podemos multiplicar esta igualdad a la izquierda por un inverso $d$ de $a$ y obtendríamos $$b=eb=dab=dac=ec=c.$$ Del mismo modo, la igualdad $ba=ca$ implica $b=c$.

En particular, si $d$ y $d’$ son inversos de $a$, tenemos $da=e=d’a$, de donde $d=d’$. Esto muestra que los inversos también son únicos, así que al inverso de $a$ le llamamos $a^{-1}$. Observa que $e^{-1}=e$. Nota que si $a$ y $b$ son elementos de $G$, entonces $$ab(b^{-1}a^{-1})=aea^{-1}=aa^{-1}=e,$$ de modo que el inverso de un producto $ab$ es el producto $b^{-1}a^{-1}$. Para $n$ un entero positivo, definimos $a^{-n}$ como el inverso de $a^n$, que por lo anterior, es precisamente $(a^{-1})^n$. De hecho, ya definido $a^n$ para todo entero, se puede verificar que se satisfacen las leyes usuales de los exponentes.

Problema. Sean $a$ y $b$ dos elementos en un grupo $G$ con neutro $e$ tales que $aba=ba^2b$, $a^3=e$ y $b^{2021}=e$. Muestra que $b=e$.

Sugerencia pre-solución. Observa que si $a$ y $b$ conmutaran, entonces el resultado se deduce fácilmente de la primer igualdad. Así, intenta modificar el problema a demostrar que $a$ y $b$ conmutan. Para ello tienes que hacer un paso intermedio que necesita inducción.

Solución. Lo primero que veremos es que $a$ y $b^2$ conmutan. Poniendo una identidad entre ambas $b$ en el producto $ab^2$, tenemos que $$ab^2=abaa^{-1}b=ba^2ba^{-1}b.$$ De $a^3=e$, tenemos $a^{-1}=a^2$, así que siguiendo con la cadena de igualdades, \begin{align*}
ba^2ba^{-1}b&=ba^2ba^2b\\
&=ba^2aba\\
&=bba=b^2a.
\end{align*} Así, $ab^2=b^2a$.

Ahora veremos que $a$ y $b$ conmutan. Para ello, como $a$ y $b^2$ conmutan, tenemos que $a$ y $b^{2k}$ conmutan para cualquier entero $k$. Esto se puede probar por inducción. El caso $k=1$ es lo que ya probamos. Si es válido para cierta $k$, se sigue que $$ab^{2k+2}=b^{2k}ab^2=b^{2k+2}a.$$ Por hipótesis, $b^{2020}=b$, así que el resultado anterior nos dice que $a$ y $b$ conmutan.

Por esta razón, la primer hipótesis $aba=ba^2b$ se puede reescribir como $a^2b=a^2b^2$, que por cancelación izquierda da $e=b$, como queríamos mostrar.

$\square$

Subgrupos y órdenes

Dentro de un grupo pueden vivir grupos más pequeños.

Definición. Un subgrupo de un grupo $G$ es un subconjunto $H$ de $G$ que es un grupo con las operaciones de $G$ restringidas a $H$.

Para que $H$ sea subgrupo, basta con que no sea vacío y que sea cerrado bajo la operación de grupos y la operación «sacar inverso».

Por ejemplo, se puede ver que $\mathbb{Z}_{12}$, los enteros módulo $12$ con la suma, forman un grupo. De aquí, $H_1=\{0,3,6,9\}$ es un subgrupo y $H_2=\{0,4,8\}$ es otro.

Proposición. Si $a$ es un elemento de un grupo $G$, entonces o bien $$1,a, a^2, a^3,\ldots$$ son todos elementos distintos de $G$, o bien existe un entero positivo $n$ tal que $a^n=1$ y $1,a,\ldots,a^{n-1}$ son todos distintos. En este segundo caso, $\{1,a,\ldots,a^{n-1}\}$ es un subgrupo de $G$.

Sugerencia pre-demostración. Divide en casos. Luego, usa el principio de cancelación o las leyes de exponentes para grupos.

Demostración. Si todos los elementos son distintos, entonces no hay nada que hacer. De otra forma, existen $i<j$ tales que $a^j=a^i$, de donde por la ley de cancelación tenemos que $a^{j-i}=e$ y $j-i\geq 1$. Así, el conjunto de enteros positivos $m$ tales que $a^m=e$ es no vacío, de modo que por el principio de buen orden tiene un mínimo, digamos $n$.

Afirmamos que $$1,a,a^2,\ldots,a^{n-1}$$ son todos distintos. En efecto, de no ser así, como en el argumento de arriba existirían $0\leq i < j \leq {n-1}$ tales que $a^{j-i}=e$, pero $j-i\leq n-1$ sería una contradicción a la elección de $n$ como elemento mínimo.

Probemos ahora que $A=\{1,a,\ldots,a^{n-1}\}$ es subgrupo de $G$. Si tenemos $a^k$ y $a^l$ en $A$, su producto es $a^{k+l}$. Por el algoritmo de la división, $k+l=qn+r$, con $r\in \{0,\ldots,n-1\}$, de modo que $$a^ka^l=a^{qn+r}=(a^n)^qa^r=e^qa^r=a^r,$$ así que $A$ es cerrado bajo productos. Además, si $1\leq k\leq n-1$, entonces $1\leq n-k \leq n-1$ y $a^ka^{n-k}=a^n=e$. Así, $A$ es cerrado bajo inversos. Esto muestra que $A$ es subgrupo de $G$.

$\square$

En teoría de grupos, la palabra «orden» se usa de dos maneras. Por un lado si $G$ es un grupo, su orden $\text{ord}(G)$ es la cantidad de elementos que tiene. Por otro, dado un elemento $a$, el orden $\text{ord}(a)$ de $a$ es el menor entero positivo $n$ tal que $a^n=e$, si es que existe.

Definimos al subgrupo generado por $a$ como $$\langle a\rangle:=\{a^n:n\in \mathbb{Z}\}.$$ La proposición anterior dice que si $\langle a \rangle$ es finito, entonces es un subgrupo de $G$ de orden $\text{ord}(\langle a \rangle) = \text{ord}(a).$ A los grupos de la forma $\langle a \rangle$ se les llama cíclicos.

Teorema de Lagrange

Cuando estamos trabajando con grupos finitos, el orden de un subgrupo debe cumplir una condición de divisibilidad.

Teorema (de Lagrange). Sea $G$ un grupo finito y $H$ un subgrupo de $G$. Entonces $\text{ord}(H)$ divide a $\text{ord}(G)$.

No daremos la demostración de este teorema, pero veremos algunos corolarios que sirven en la resolución de problemas.

Proposición. Sea $G$ un grupo finito.

  • Si $\text{ord}(G)$ es un primo $p$, entonces $G$ es cíclico.
  • El orden de cualquier elemento $a$ de $G$ divide al orden de $G$, y por lo tanto $a^{\text{ord}(G)}=1$.
  • Si $a$ es un elemento de $G$ de orden $n$ y $a^m=e$, entonces $n$ divide a $m$.

Demostración. Para la primer parte, si tomamos un elemento $a$ de $G$ que no sea $e$, ya vimos que $\langle a \rangle$ es un subgrupo cíclico de $G$. Por el teorema de Lagrange, su orden debe dividir al primo $p$. Pero el orden de $\langle a \rangle$ es al menos $2$, así que el orden de $\langle a \rangle$ debe ser $p$ y por lo tanto $\langle a \rangle=G$.

Como vimos arriba, el orden de $a$ es el orden de $\langle a \rangle$, que divide a $G$. Así,
\begin{align*}
a^{\text{ord}(G)}&=(a^{\text{ord}{a}})^{\text{ord}(G)/ \text{ord}(a)}\\
&=e^{\text{ord}(G)/ \text{ord}(a)}\\
&=e.
\end{align*} Con esto queda probado el segundo punto.

Para el último punto, usamos el algoritmo de la división para escribir $m=qn+r,$ con $r$ entre $0$ y $n-1$. Tenemos que $$e=a^m=a^{qn+r}=a^r.$$ Por lo visto en la sección anterior, necesariamente $r=0$, así que $n$ divide a $m$.

$\square$

Veamos cómo se pueden aplicar algunas de las ideas anteriores a un problema de teoría de grupos concreto.

Problema. En un grupo $G$, tenemos elementos $a$ y $b$ tales que $a^7=1$ y $aba^{-1}=b^2$. Determina qué posibles valores puede tener el orden de $b$.

Sugerencia pre-solución. Conjetura una fórmula para $b^{2n}$ buscando un patrón. Establécela por inducción.

Solución. El orden de $a$ debe dividir a $7$, así que es o $1$ o $7$. Si es $1$, entonces $a=e$, por lo que por la hipótesis tenemos $b=b^2$. De aquí $b=e$, así que el orden de $b$ es $1$. La otra opción es que el orden de $a$ sea $7$.

Afirmamos que para todo entero $n$ se tiene que $a^nba^{-n}=b^{2^n}$. Esto se prueba inductivamente. Es cierto para $n=1$ por hipótesis. Si se cumple para cierta $n$ y elevamos la igualdad al cuadrado, tenemos que
\begin{align*}
b^{2^{n+1}}&=(b^{2n})^2\\
&=a^nba^{-n}a^nba^{-n}\\
&=a^nb^2a^{-n}\\
&=a^{n+1}ba^{-(n+1)},
\end{align*}

lo cual termina la inducción.

En particular, para $n=7$ tenemos que $a^7=a^{-7}=e$, por lo que $b=b^{2^7}$, y por lo tanto $b^{127}=e$. Como $127$ es primo, el orden de $b$ puede ser $1$ ó $127$.

$\square$

En realidad, en el problema anterior falta mostrar que en efecto existe un grupo que satisfaga las hipótesis, y para el cual el orden de $b$ sea exactamente $127$. Esto no lo verificaremos aquí.

Teoría de grupos en teoría de números

Lo que hemos platicado de teoría de grupos se vale para grupos en general. Cuando aplicamos estos resultados a grupos particulares, tenemos nuevas técnicas para resolver problemas. Uno de los casos que aparecen más frecuentemente es aplicar teoría de grupos en problemas de teoría de números.

Si tomamos un entero $n$, los enteros entre $1$ y $n-1$ que son primos relativos con $n$ forman un grupo con la operación de producto módulo $n$. Si llamamos $\varphi(n)$ a la cantidad de primos relativos con $n$ entre $1$ y $n-1$, el teorema de Lagrange da el siguiente corolario.

Teorema (de Euler). Para todo entero positivo $n$ y $a$ un entero primo relativo con $n$, se tiene que $$a^\varphi(n)\equiv 1\pmod n.$$

Como corolario al teorema de Euler, tenemos el pequeño teorema de Fermat, que hemos discutido previamente aquí en el blog.

Teorema (pequeño teorema de Fermat). Para $p$ un primo y $a$ un entero que no sea múltiplo de $p$, se tiene que $$a^{p-1}\equiv 1 \pmod p.$$

Así, cuando $p$ es primo y $a$ no es múltiplo de $p$, se tiene que el orden de $a$ divide a $p-1$. Veamos un ejemplo en donde esta idea forma parte fundamental de la solución.

Problema. Muestra que para ningún entero $n>1$ se tiene que $n$ divide a $2^n-1$.

Sugerencia pre-solución. Procede por contradicción, suponiendo que sí existe. Considera un primo $p$ que divida a $n$ y que además sea extremo en algún sentido. Trabaja módulo $p$.

Solución. Supongamos que existe un entero $n>1$ tal que $n$ divide a $2^n-1$. Sea $p$ el primo más pequeño que divide a $n$. Tomemos $a$ el orden de $2$ en el grupo multiplicativo $\mathbb{Z}_p$.

Por un lado, como $p$ divide a $n$ y $n$ divide a $2^n-1$, se tiene que $p$ divide a $2^n-1$ y por lo tanto $$2^n\equiv 1 \pmod p.$$ De esta forma, $a$ divide a $n$.

Por otro lado, por el pequeño teorema de Fermat, tenemos que $$2^{p-1}\equiv 1 \pmod p,$$ así que $a$ divide a $p-1$ y por lo tanto $a\leq p-1$.

Si $a\neq 1$, entonces $a$ tiene un divisor primo que divide a $n$ y es menor que $a\leq p-1$, lo cual es imposible pues elegimos a $p$ como el menor divisor primo de $n$. De esta forma, $a=1$. Pero esto da la contradicción $2\equiv 1 \pmod p$.

$\square$

Anillos, dominios enteros y campos

Cuando se están resolviendo problemas, es importante tener en mente que existen otras estructuras algebraicas. Definiremos sólo las más comunes y veremos un problema ejemplo.

Definición. Un anillo es un conjunto $R$ con dos operaciones binarias suma y producto tales que:

  • $R$ con la suma es un grupo conmutativo.
  • El producto en $R$ es asociativo, es decir $(ab)c=a(bc)$ para $a,b,c$ en $R$.
  • Se cumple la ley distributiva, es decir $a(b+c)=ab+ac$ y $(b+c)a=ba+ca$ para $a,b,c$ en $R$.

El producto en $R$ no tiene por qué ser un grupo. De hecho, ni siquiera tiene que tener neutro.

Definición. Si un anillo $R$ tiene neutro, decimos que $R$ es un anillo con $1$. Si la multiplicación de $R$ es conmutativa, decimos que $R$ es conmutativo.

Definición. Un dominio entero es un anillo conmutativo con uno en donde además se vale cancelar, es decir, $ab=ac$ implica $b=c$ y $ba=ca$ implica $b=c$.

Definición. Un campo es un anillo conmutativo con uno en donde cada elemento distinto de la identidad aditiva tiene inverso multiplicativo. En otras palabras, es un anillo en donde la suma y el producto son grupos.

Problema. Muestra que todo dominio entero finito es un campo.

Sugerencia pre-solución. Usa el principio de las casillas.

Solución. Supongamos que $R=\{a_1,\ldots,a_n\}$ es un dominio entero con una cantidad finita de elementos. Lo único que falta para que sea campo es que los elementos tengan inversos multiplicativos.

Sea $a$ un elemento de $R$ y supongamos que $a$ no tiene inverso multiplicativo. Entonces, los números $$a_1a, a_2a,\ldots,a_n a$$ sólo pueden tomar a lo más $n-1$ valores diferentes, de modo que por principio de las casillas existen dos de ellos que son iguales, digamos $a_ia=a_ja$ para $i\neq j$.

Como $R$ es dominio entero, se vale cancelar, lo cual muestra $a_i=a_j$. Esto es una contradicción, pues $a_i$ y $a_j$ eran elementos distintos de $R$. Así, todo elemento tiene inverso multiplicativo.

$\square$

En cursos de matemáticas a nivel superior se ven muchos ejemplos de estas estructuras algebraicas. En cursos de Álgebra Superior se construye el dominio entero de enteros $\mathbb{Z}$. Se construyen los campos $\mathbb{R}$, $\mathbb{Q}$ y $\mathbb{C}$. También, se construyen los anillos de polinomios $\mathbb{F}[x]$. La noción de campo es fundamental cuando se construye la teoría de Álgebra Lineal. Como se puede ver, la teoría de álgebra es muy amplia, así que esta entrada sólo queda como invitación al tema.

Más problemas

Puedes encontrar más problemas de estructuras algebraicas en la Sección 4.4 del libro Problem Solving through Problems de Loren Larson.

Álgebra Superior II: Multiplicación en forma polar y fórmula de De Moivre

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior hablamos de las coordenadas rectangulares y polares de un número complejo. También, definimos la forma polar de un número complejo. En esta entrada hablaremos de cómo con la forma polar, de los elementos de $\mathbb{C}$, podemos entender fácilmente su multiplicación. Además, usaremos esto para demostrar la fórmula de De Moivre, que nos dice cómo encontrar las potencias de un complejo.

Como pequeño recordatorio, la forma polar del complejo $z=x+iy$ es $z=r(\cos \theta + i \sin \theta)$, en donde $r$ es la norma de $z$ y $\theta$ es el ángulo que hace con el eje real positivo, pensándolo como el punto $(x,y)$. Esto queda resumido por la siguiente figura:

Complejo en forma rectangular y polar
Complejo en forma rectangular y polar

Forma polar, multiplicación y recordatorio trigonométrico

Para ver cómo la forma polar de los complejos nos ayuda a entender la multiplicación en $\mathbb{C}$, necesitamos recordar las siguientes fórmulas trigonométricas
\begin{align*}
\sin (\alpha+\beta) = \sin \alpha \cos \beta + \sin \beta \cos \alpha\\
\cos(\alpha+\beta) = \cos \alpha \cos \beta – \sin \beta \sin \alpha.
\end{align*}

Si tenemos dos números complejos en forma polar
\begin{align*}
w&=r (\cos\alpha+ i \sin \alpha)\\
z&=s(\cos \beta + i \sin \beta)
\end{align*}

y los multiplicamos con la definición, su producto tendría parte real $$rs(\cos\alpha\cos \beta – \sin \alpha\sin \beta) = rs\cos (\alpha+\beta)$$ y parte imaginaria $$rs(\sin \alpha \cos \beta+ \sin\beta\cos\alpha)=rs\sin (\alpha+\beta).$$

Además, como la norma es multiplicativa, tenemos que la norma de $wz$ es $rs$. Con esto mostramos que la forma polar de $wz$ es exactamente $$wz=(rs)(\cos(\alpha+\beta)+i\sin(\alpha+\beta)).$$ Esto queda resumido en el siguiente resultado

Proposición. Si tenemos dos números complejos en forma polar
\begin{align*}
w&=r \text{cis}(\alpha)\\
z&=s\text{cis}(\beta),
\end{align*} entonces la forma polar del producto es $$wz=rs\text{cis}(\alpha+\beta).$$

Otra forma de decirlo es que «al multiplicar complejos, multiplicamos normas y sumamos argumentos». Podemos también ver el resultado de forma geométrica mediante la siguiente figura, en donde marcamos con rojo y azul los factores, y con negro al producto.

Interpretación geométrica de la multiplicación en los complejos
Interpretación geométrica de la multiplicación en los complejos

Ejemplo. Vamos a encontrar la forma rectangular del producto de los complejos
\begin{align*}w& =7 \text{cis}\left( \frac{2\pi}{5} \right)\quad\text{y}\\ z&=2\text{cis}\left(\frac{3\pi}{5}\right).\end{align*}

Por la proposición anterior, el producto es exactamente el complejo
\begin{align*}
14 \text{cis}\left(\frac{2+3}{5}\pi \right)=14 \text{cis} (\pi).
\end{align*}

Esta es la forma polar del producto. Por un problema anterior, sabemos que $\text{cis}(\pi)=-1$, de modo que la forma rectangular del producto es $-14$.

Si tenemos un complejo no nulo en forma polar, podemos entender fácilmente su inverso multiplicativo. Esto está dado por la siguiente proposición, cuya demostración es sencilla y se deja como tarea moral.

Proposición. Sea $w\neq 0$ un complejo con forma polar $w=r\text{cis}(\theta)$. Su inverso multiplicativo es el complejo $r^{-1}\text{cis}(-\theta)$.

Ejemplo. Determinemos el inverso multiplicativo del complejo $$w=\sqrt{3}\text{cis}\left(\frac{3\pi}{7}\right).$$ Para ello, basta usar la proposición anterior, de donde $$w^{-1}=\frac{1}{\sqrt{3}} \text{cis}\left(-\frac{3\pi}{7}\right)=\frac{\sqrt{3}}{3}\text{cis}\frac{11\pi}{7}.$$

$\triangle$

Fórmula de De Moivre

La proposición para multiplicación de complejos se vuelve todavía más útil si la usamos iteradamente para hacer potencias de complejos.

Teorema (fórmula de De Moivre). Si $z$ es un complejo de norma $r$ y argumento $\theta$ y $n$ es un entero positivo, entonces $z^n$ es el complejo de norma $r^n$ y argumento $n\theta$. En otras palabras, si $z=r(\cos \theta + i \sin \theta)=r\text{cis}(\theta)$, entonces $$z^n=r^n (\cos (n\theta)+i\sin (n\theta))= r^n \text{cis} (n\theta).$$

Demostración. Procedemos por inducción sobre $n$. El caso $n=1$ es inmediato. Supongamos que el resultado es cierto para $n$, es decir, que $$z^n=r^n \text{cis} (n\theta).$$

Por hipótesis inductiva, tenemos entonces que la norma de $z^n$ es $r^n$, de modo que $z^{n+1}=z^n z$ tiene norma $r^nr=r^{n+1}$.

También por hipótesis inductiva, $z^n$ tiene argumento $n\theta$. Por cómo funciona la multiplicación compleja, el argumento de $z^{n+1}=z^n z$ es la suma de los argumentos de $z^n$ y $z$, es decir, $n\theta + \theta = (n+1)\theta$. Esto muestra que $$z^{n+1}=r^{n+1}\text{cis}((n+1)\theta),$$ y con esto acabamos el paso inductivo.

$\square$

Ejemplos de aplicación de fórmula de De Moivre

Ejemplo. Veremos quién es la décima potencia del complejo $$z=\sqrt{3}\text{cis} \left(\frac{4\pi}{5}\right).$$ Como este número ya está escrito en forma polar, podemos aplicarle directamente la fórmula de De Moivre:
\begin{align*}
z^{10}&=3^{10/2} \text{cis}\left(\frac{40\pi}{5}\right)\\
&=3^5 \text{cis} (8\pi)\\
&=3^5\\
&=243.
\end{align*}

$\triangle$

El ejemplo anterior nos dice que $z^{10}=243$. En otras palabras, $z$ es una raíz $10$-ésima de $243$. Pero existen otras raíces $10$-ésimas de 243, por ejemplo, tiene dos raíces reales $\sqrt[10]{243}$ y $-\sqrt[10]{243}$. ¿Cuántas raíces tiene entonces en total? ¿Quiénes son? Esto lo veremos en la siguiente entrada.

Veamos otro ejemplo en el que se aplica la fórmula de De Moivre.

Problema. Evalúa la expresión $(1+i)^{30}$, expresando el resultado final en forma rectangular.

Solución. Comenzamos expresando a $(1+i)$ en forma polar. Para ello, notamos que $\Vert 1+i \Vert = \sqrt{2}$, y que $1+i$ hace un ángulo de $\frac{\pi}{4}$ con el eje real positivo. Por el teorema de De Moivre, tenemos que

\begin{align*}
z^{30}&=\sqrt{2}^{30}\text{cis}\left(\frac{30\pi}{4}\right)\\
&=2^{15}\text{cis}\left(\frac{6\pi}{4} \right) \\
&=2^{15}\text{cis}\left(\frac{3\pi}{2} \right) \\
&=2^{15}(-i)\\
&=-2^{15}i.
\end{align*}

En la segunda igualdad usamos que $\frac{30\pi}{4}$ y $\frac{6\pi}{4}$ difieren en un múltiplo entero de $2\pi$. En la cuarta usamos la forma polar de $-i$.

$\triangle$

Más adelante…

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Muestra que para un complejo $z\neq 0$ escrito en forma polar $z=r\text{cis}(\theta)$, su inverso multiplicativo tiene forma polar $r^{-1}\text{cis} (-\theta)$.
  2. Evalúa la multiplicación $wz$, donde $w=2\text{cis}\left(\frac{5\pi}{7}\right)$ y $z=-5\text{cis}\left(\frac{7\pi}{5}\right)$. Expresa la respuesta forma polar.
  3. Haz la multiplicación $wz$, donde $w=3\text{cis}\left(\frac{\pi}{2}\right)$ y $z=4\text{cis}\left(\frac{\pi}{3}\right)$. Expresa la respuesta en forma rectangular.
  4. Sea $z=7\text{cis}\left(\frac{5\pi}{7}\right)$. Expresa $z^3$ en forma polar.
  5. Sea $z=\sqrt[3]{5} \text{cis}\left(\frac{\pi}{3}\right)$. Expresa $z^9$ en forma rectangular.
  6. Toma el complejo $z=-2+2i$. Evalúa la expresión $$1+z+\ldots+z^{29}.$$ Sugerencia: Usa primero la fórmula de suma de términos de una sucesión geométrica, y después la fórmula de De Moivre.

Puedes practicar más estos temas viendo los videos y haciendo los ejercicios de la página de Khan Academy, de su sección de números complejos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal I: Ángulos, norma, distancia y desigualdad de Minkowski

Por Leonardo Ignacio Martínez Sandoval

Introducción

Estamos listos para hablar de varias nociones geométricas como ángulo, norma, distancia y de la desigualdad de Minkowski. Antes de hacer eso, hagamos un breve repaso de qué hemos hecho en estas últimas entradas.

Primero, hablamos de formas bilineales y de su formas cuadráticas asociadas. Segundo, vimos cómo a través de la identidad de polarización podemos asignar una única forma bilineal simétrica a una forma cuadrática. Finalmente, en la última entrada nos enfocamos en las formas bilineales simétricas que cumplían cierta condición de positividad.

En esa misma entrada definimos producto interior, que simplemente es una forma bilineal simétrica y positiva definida. También definimos la norma de un vector en un espacio con producto interior $\langle \cdot, \cdot \rangle$, que era $$\Vert x \Vert = \sqrt{\langle x, x \rangle}.$$

Finalmente, en la entrada anterior probamos la siguiente versión general de la desigualdad de Cauchy-Schwarz:

Teorema (desigualdad de Cauchy-Schwarz). Sea $b:V\times V\to \mathbb{R}$ una forma bilineal simétrica y $q$ su forma cuadrática asociada.

  • Si $b$ es positiva, entonces para todo $x$ y $y$ en $V$ tenemos que $$b(x,y)^2\leq q(x)q(y).$$ Si $x$ y $y$ son linealmente dependientes, se da la igualdad.
  • Además, si $b$ es positiva definida y $x$ y $y$ son linealmente independientes, entonces la desigualdad es estricta.

Ángulos

Fijemos $V$ un espacio vectorial sobre los reales con producto interior. En la entrada anterior vimos que la desigualdad de Cauchy-Schwarz implica que para cualesquiera vectores $x$ y $y$ en $V$ tenemos que $$|\langle x, y \rangle| \leq \Vert x \Vert \cdot \Vert y \Vert.$$

Si $x$ y $y$ son vectores distintos de cero, podemos reescribir la desigualdad anterior como $$-1\leq \frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}\leq 1.$$ Esto justifica la siguiente definición.

Definición. Sean $x$ y $y$ vectores no nulos. Definimos al ángulo entre $x$ y $y$ como el único ángulo $\theta$ en el intervalo $[0,\pi]$ tal que $$\cos \theta = \frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}.$$

Observa que $\theta=\frac{\pi}{2}$ si y sólo si $\frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}=0$. Esto ocurre si y sólo si $\langle x, y \rangle=0$. Este caso es particularmente importante, y por ello recibe una definición especial.

Definición. Decimos que $x$ y $y$ son ortogonales si $\langle x, y \rangle=0$.

Para empezar, veamos un ejemplo sencillo de ortogonalidad.

Ejemplo 1. Tomemos $\mathbb{R}^5$ con el producto interior canónico, es decir, el producto punto. Los vectores $u=(1,0,-4,0,5)$ y $v=(0,3,0,-2,0)$ tienen producto punto $$\langle u, v \rangle=1\cdot 0 + 0\cdot 3 + (-4)\cdot 0 + 0 \cdot (-2) + 5 \cdot 0=0,$$ así que son ortogonales.

$\triangle$

Ahora, veamos un ejemplo un poco más elaborado, del cálculo de un ángulo en un espacio vectorial de funciones.

Ejemplo 2. Anteriormente vimos que $\mathcal{C}[0,1]$ tiene un producto interior $$\langle f, g \rangle=\int_0^1 f(x)g(x)\, dx.$$ Calculemos el ángulo entre $f(x)=x^2$ y $g(x)=x^3$ con este producto interior. Primero, calculamos $\Vert f \Vert$ y $\Vert g \Vert$ como sigue
\begin{align*}
\Vert f \Vert^2 &= \int_0^1 x^4 \,dx = \frac{1}{5}\\
\Vert g \Vert^2 &= \int_0^1 x^6 \,dx = \frac{1}{7},
\end{align*}

de donde $\Vert f \Vert = \frac{1}{\sqrt{5}}$ y $\Vert g \Vert = \frac{1}{\sqrt{7}}$.

Luego, calculamos
\begin{align*}
\langle f,g \rangle &=\int_0^1 f(x)g(x) \, dx\\
&=\int_0^1 x^5 \, dx\\
&=\frac{1}{6}.
\end{align*}

Como esperaríamos por la desigualdad de Cauchy-Schwarz, tenemos la siguiente desigualdad:
\begin{align*}
\langle f,g \rangle &= \frac{1}{6}\leq \frac{1}{\sqrt{35}}=\Vert f \Vert \Vert g \Vert.
\end{align*}

El ángulo entre $f$ y $g$ es entonces
\begin{align*}
\theta &= \arccos\left(\frac{\langle f, g \rangle}{\Vert f \Vert \cdot \Vert g \Vert}\right)\\
&=\arccos\left(\frac{1/6}{1/\sqrt{35}}\right)\\
&=\arccos\left(\frac{\sqrt{35}}{6}\right).
\end{align*}

$\triangle$

Desigualdad de Minkowski

Hay una forma un poco distinta de escribir la desigualdad de Cauchy-Schwarz. La enunciamos a continuación.

Teorema (desigualdad de Minkowski). Sean $x$ y $y$ vectores de un espacio vectorial $V$ con una forma cuadrática positiva $q$. Entonces $$\sqrt{q(x)}+\sqrt{q(y)}\geq \sqrt{q(x+y)}.$$

Demostración. Sea $b$ la forma polar de $q$. Recordemos que $$q(x+y)=q(x)+2b(x,y)+q(y).$$

Como $q$ es forma cuadrática positiva, la desigualdad que queremos mostrar es equivalente a la siguiente desigualdad obtenida de elevar ambos lados al cuadrado:

\begin{align*}
q(x)+2\sqrt{q(x)q(y)}+q(y)&\geq q(x+y)\\
&=q(x)+2b(x,y)+q(y).
\end{align*}

Cancelando $q(x)+q(y)$ de ambos lados y dividiendo entre $2$, obtenemos la desigualdad equivalente
\begin{align*}
\sqrt{q(x)q(y)}\geq b(x,y).
\end{align*}

Si $b(x,y)<0$, esta desigualdad es claramente cierta. Si $b(x,y)\geq 0$, esta desigualdad es equivalente a la obtenida de elevarla al cuadrado, es decir, $$q(x)q(y)\geq b(x,y)^2,$$ que es precisamente la desigualdad de Cauchy-Schwarz.

$\square$

De producto interior a norma

Estamos listos para mostrar algunas propiedades importantes de la noción de norma que definimos para espacios vectoriales reales con producto interior.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior con norma asociada $\Vert \cdot \Vert$. Se cumple que

  1. $\Vert v \Vert \geq 0$ para todo $v$ en $V$, con igualdad si y sólo si $v=0$.
  2. $\Vert cv \Vert =|c|\Vert v \Vert$ para todo $v$ en $V$ y real $c$.
  3. (Desigualdad del triángulo) $\Vert v \Vert + \Vert w \Vert \geq \Vert v+w \Vert$ para todo par de vectores $v$ y $w$ en $V$.

Demostración. Sea $b$ el producto interior de $V$. El punto 1 se sigue de que $b$ es positiva definida. El punto 2 se sigue de que $b$ es bilineal, pues $b(cv,cv)=c^2b(v,v)$, de modo que $$\Vert cv \Vert = \sqrt{c^2} \Vert v \Vert =|c| \Vert v \Vert.$$ El punto 3 es la desigualdad de Minkowski.

$\square$

En general, si tenemos un espacio vectorial $V$ sobre los reales y una función $\Vert \cdot \Vert:V \to \mathbb{R}$ que satisface los puntos 1 a 3 de la proposición anterior, decimos que $\Vert \cdot \Vert$ es una norma para $V$. Hay algunas normas que no se pueden obtener a través de un producto interior.

Ejemplo. Consideremos $V=M_n(\mathbb{R})$. El producto de Frobenius de las matrices $A$ y $B$ está dado por $$\langle A,B\rangle = \text{tr}(^tA B).$$ Se puede mostrar que el producto de Frobenius es un producto interior. La norma de Frobenius es la norma inducida por este producto, es decir, $$\Vert A \Vert = \sqrt{\text{tr}(^tAA)}.$$

Por la desigualdad de Minkowski, tenemos que para cualesquiera dos matrices $A$ y $B$ tenemos que $$\sqrt{\text{tr}(^t(A+B)(A+B))}\leq \sqrt{\text{tr}(^tAA)} + \sqrt{\text{tr}(^tBB)}.$$

En particular, si tomamos a la identidad $I$, tenemos que su norma de Frobenius es $\sqrt{n}$. Esto muestra la siguiente desigualdad, válida para cualquier matriz $A$ en $M_n(\mathbb{R})$:

$$\sqrt{\text{tr}((^tA+I)(A+I))}\leq \sqrt{\text{tr}(^tAA)}+ \sqrt{n}.$$

$\triangle$

De norma a distancia

Podemos pensar a la norma de un vector $v$ como qué tan lejos está del vector $0$. También nos gustaría poder hablar de qué tan lejos están cualesquiera dos vectores de un espacio vectorial con producto interior. Por esta razón, introducimos la siguiente definición.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior de norma $\Vert \cdot \Vert$. La distancia asociada a este producto interior es la función $d:V\times V\to \mathbb{R}$ tal que $d(x,y)=\Vert x-y\Vert.$ A $d(x,y)$ le llamamos la distancia entre $x$ y $y$.

El siguiente resultado se sigue de las propiedades de la norma de un producto interior. Su demostración queda como tarea moral.

Proposición. Si $V$ es un espacio vectorial sobre $\mathbb{R}$ con producto interior de distancia $d$, entonces:

  1. $d(x,y)\geq 0$ para todos $x$ y $y$ en $V$ y es igual a $0$ si y sólo si $x=y$.
  2. $d(x,y)=d(y,x)$ para todos $x$ y $y$ en $V$.
  3. $d(x,z)+d(z,y)\geq d(x,y)$ para todos $x$, $y$ y $z$ en $V$.

En general, si tenemos cualquier conjunto $X$ (no hace falta que sea un espacio vectorial), a una función $d$ que satisface los puntos 1 a 3 de la proposición anterior se le conoce como una métrica para $X$. Cualquier norma en un espacio vectorial $V$ (no sólo las de producto interior) induce una métrica en $V$. Sin embargo, hay métricas de espacios vectoriales que no vienen de una norma.

Más adelante…

Retomando conceptos ya definidos como la norma de un vector, en esta entrada vimos cómo encontrar el ángulo entre dos vectores no-nulos y se llegó a una forma natural de introducir la ortogonalidad entre dos vectores. Así mismo, se demostraron algunas propiedades de la norma asociada a un producto interior, siendo la última una forma distinta de expresar la desigualdad de Cauchy-Schwarz, usando la desigualdad de Minkowski. Finalmente, se definió el concepto de distancia entre dos vectores.

En entradas posteriores, usaremos estos conceptos para estudiar bases ortogonales, que tienen usos en conceptos matemáticos más avanzados como el análisis de Fourier o la teoría de polinomios ortogonales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Toma $\mathbb{R}^4$ con el producto interior canónico (producto punto). Determina la norma de $(3,4,0,1)$. Encuentra el ángulo entre los vectores $(1,0,2,5)$ y $(4,5,0,-3)$.
  • Muestra que el producto de Frobenius es un producto interior en $M_n(\mathbb{R})$.
  • Demuestra la proposición de propiedades de la distancia

Considera $V=\mathbb{R}_3[x]$ el espacio vectorial de polinomios con coeficientes reales y grado a lo más $3$. Definimos $$\langle p,q \rangle = \sum_{j=1}^5 p(j)q(j).$$

  • Muestra que $\langle \cdot, \cdot \rangle$ así definido es un producto interior.
  • Encuentra el ángulo entre los polinomios $1+x^2$ y $2x-3x^3$.
  • Para cada entero positivo $n$, determina la norma del polinomio $1+nx^3$.
  • Determina la distancia entre los polinomios $1$ y $1+x+x^2+x^3$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»