Archivo del Autor: Leonardo Ignacio Martínez Sandoval

Leonardo Ignacio Martínez Sandoval

Acerca de Leonardo Ignacio Martínez Sandoval

Hola. Soy Leonardo Martínez. Soy Profesor de Tiempo Completo en la Facultad de Ciencias de la UNAM. Hice un doctorado en Matemáticas en la UNAM, un postdoc en Israel y uno en Francia. Además, me gusta colaborar con proyectos de difusión de las matemáticas como la Olimpiada Mexicana de Matemáticas.

Álgebra Lineal I: Bases ortogonales

Por Leonardo Ignacio Martínez Sandoval

Introducción

Como ya discutimos en las entradas anteriores, si tenemos un espacio vectorial $V$ con producto interior, entonces podemos definir varias nociones geométricas en $V$, como ángulos, norma y distancia. Ahora vamos a definir una noción muy útil en álgebra lineal: la de bases ortogonales. Para ello, combinaremos las nociones de bases y producto interior.

Las bases ortogonales no sólo tienen aplicaciones en álgebra lineal. También son el punto de partida de muchos conceptos matemáticos avanzados. Un primer ejemplo es el análisis de Fourier, que estudia cómo aproximar funciones mediante funciones trigonométricas y que tiene aplicaciones en el mundo real en análisis de señales. Otro ejemplo es la vasta teoría de polinomios ortogonales, con aplicaciones en el mundo real en aproximación e integración numérica.

En estas entradas de bases ortogonales tomaremos espacios vectoriales sobre $\mathbb{R}$ con un producto interior $\langle \cdot,\cdot \rangle$.

Conjuntos ortogonales y ortonormales

Comenzamos con la siguiente definición. Recuerda que $V$ es un espacio vectorial sobre $\mathbb{R}$ con producto interior, así que induce una norma $\Vert \cdot \Vert$.

Definición. Sea $S$ un conjunto de vectores en $V$. Decimos que $S$ es

  • Ortogonal si cualquier par de vectores distintos de $S$ es ortogonal, es decir, si para todo $v,w$ en $S$, con $v\neq w$ se tiene que $$\langle v, w \rangle = 0.$$
  • Ortonormal si es ortogonal, y además todo vector de $S$ tiene norma $1$.

En otras palabras, $S$ es ortonormal si para todo $v$ en $S$ se tiene $\langle v, v\rangle =1$ y para $v$ y $w$ en $S$ distintos se tiene $\langle v, w\rangle =0$.

Ejemplo. Si tomamos a $\mathbb{R}^n$ con el producto punto, entonces la base canónica es un conjunto ortonormal pues, en efecto, $e_i\cdot e_i = 1$ y para $i\neq j$ se tiene $e_i\cdot e_j = 0$.

Todo conjunto de un sólo elemento es ortogonal, pues no hay nada que probar. Otro conjunto ortonormal en $\mathbb{R}^2$ es el conjunto que sólo tiene al vector $\left(\frac{3}{5},\frac{4}{5}\right)$, pues este es un vector de norma $1$.

Los vectores $(1,1,0)$, $(1,-1,0)$ y $(0,0,1)$ forman otro conjunto ortogonal en $\mathbb{R}^3$, pues en efecto
\begin{align*}
(1,1,0)\cdot (1,-1,0)&=1-1=0\\
(1,-1,0)\cdot (0,0,1)&=0\\
(0,0,1)\cdot (1,1,0)&=0.
\end{align*}

Sin embargo, este no es un conjunto ortonormal, pues la norma de $(1,1,0)$ es $\sqrt{2}\neq 1$. Si normalizamos a cada vector, es decir, si lo dividimos entre su norma, entonces obtenemos los vectores ortonormales $\left(1/\sqrt{2},1/\sqrt{2},0\right)$, $\left(1/\sqrt{2},-1/\sqrt{2},0\right)$ y $(0,0,1)$.

$\triangle$

Propiedades de conjuntos ortogonales y ortonormales

Todo conjunto ortogonal de vectores no nulos se puede normalizar como en el ejemplo de la sección anterior para obtener un conjunto ortonormal. Es decir, si $S$ es un conjunto de vectores distintos de $0$, entonces $$S’=\left\{\frac{v}{\Vert v \Vert}: v\in S\right\}$$ es un conjunto ortonormal.

Una propiedad fundamental de los conjuntos ortonormales de vectores es que son linealmente independientes. Se puede probar algo un poco más general.

Proposición. Si $S$ es un conjunto ortogonal de vectores no nulos, entonces los elementos de $V$ son linealmente independientes.

Demostración. Tomemos $v_1,\ldots,v_n$ elementos de $S$ y supongamos que existen $\alpha_1,\ldots,\alpha_n$ escalares tales que $$v:=\sum_{i=1}^n \alpha_i v_i =0.$$

Tomemos un índice $j$ en $1,\ldots,n$ y hagamos el producto interior $\langle v, v_j\rangle$. Por un lado, como $v=0$, este produto es $0$. Por otro lado, por linealidad es $$\sum_{i=1}^n \alpha_i \langle v_i,v_j\rangle.$$

Cuando $i\neq j$, el sumando correspondiente es igual a $0$. De este modo, el único sumando no cero es cuando $i=j$, el cual es $\alpha_j \langle v_j,v_j\rangle$. De estos argumentos, deducimos que $$\alpha_j\langle v_j,v_j\rangle =0.$$ Como los vectores son no nulos, se tiene que $\langle v_j,v_j\rangle \neq 0$. Así, $\alpha_j=0$ para todo $j=1,\ldots,n$, lo cual muestra que los vectores son linealmente independientes.

$\square$

Como cada elemento de un conjunto ortonormal tiene norma $1$, entonces no puede ser nulo, así que como corolario de la proposición anterior, todo conjunto ortonormal es linealmente independiente. Otro corolario es el siguiente.

Corolario. En un espacio Euclideano de dimensión $d$, los conjuntos ortogonales sin vectores nulos tienen a lo más $d$ elementos.

Bases ortogonales y ortonormales

Cuando una base de un espacio vectorial es ortogonal (o bien, ortonormal), pasan varias cosas buenas. Esto amerita una definición por separado.

Definición. Sea $S$ un conjunto de vectores en $V$. Decimos que $S$ es

  • Una base ortogonal si $S$ es una base de $V$ y es un conjunto ortogonal.
  • Una base ortonormal si $S$ una base de $V$ y es un conjunto ortonormal.

Ejemplo. En $\mathbb{R}^n$ la base canónica es una base ortonormal.

En $\mathbb{R}^2$ el conjunto $S=\{(2,3),(9,-6)\}$ es un conjunto ortogonal. Además, se puede verificar fácilmente que son dos vectores linealmente independientes. De este modo, $S$ es una base ortogonal.

Sin embargo, $S$ no es una base ortonormal pues el primero de ellos tiene norma $\sqrt{2^2+3^2}=\sqrt{13}$. Si quisiéramos convertir a $S$ en una base ortonormal, podemos normalizar a cada uno de sus elementos.

$\triangle$

En la sección anterior vimos que los conjuntos ortonormales son linealmente independientes. Otro corolario de este resultado es lo siguiente.

Corolario. En un espacio Euclideano de dimensión $n$, un conjunto ortonormal de $n$ vectores es una base ortonormal.

La importancia de las bases ortogonales yace en que dada una base ortonormal $B$ y un vector $v$, podemos encontrar varias propiedades de $v$ en términos de $B$ fácilmente. Por ejemplo, veremos más adelante que:

  • Las coordenadas de $v$ con respecto a la base $B$ son sencillas.
  • Hay una fórmula simple para la norma de $v$ en términos de sus coordenadas en la base $B.$
  • Si $B$ es una base de un subespacio $W$ de $V$, entonces es fácil encontrar la distancia de $v$ a $W.$

Mejor aún, las bases ortonormales siempre existen.

Teorema. Todo espacio Euclideano tiene una base ortonormal.

Es decir, sin importar qué espacio vectorial real de dimensión finita tomemos, y sin importar qué producto punto le pongamos, podemos dar una base ortogonal. De hecho, veremos un resultado un poco más fuerte, que nos dará un procedimiento para encontrar dicha base, incluso imponiendo restricciones adicionales.

Ejemplo de bases ortogonales en polinomios

Ejemplo. Tomemos $\mathbb{R}_n[x]$ el espacio de polinomios de grado a lo más $n$ con coeficientes reales. Además, tomemos números reales distintos $x_0,\ldots,x_n$. A partir de estos reales podemos definir la operación $$\langle P, Q \rangle = \sum_{j=0}^n P(x_j)Q(x_j),$$ la cual es claramente bilineal y simétrica.

Tenemos que $\langle P,P\rangle$ es una suma de cuadrados, y por lo tanto es no negativa. Además, si $\langle P, P\rangle =0$, es porque $$\sum_{j=0}^n P(x_j)^2=0,$$ y como estamos trabajando en $\mathbb{R}$ esto implica que cada sumando debe ser cero. Pero las igualdades $$P(x_0)=\ldots=P(x_n)=0$$ dicen que los $n+1$ reales distintos $x_i$ son raíces de $P$, y como $P$ es de grado a lo más $n$, tenemos que $P$ es el polinomio $0$. En resumen, $\langle \cdot, \cdot \rangle$ es un producto interior en $\mathbb{R}_n[x]$. Vamos a dar una base ortogonal con respecto a este producto interior.

Para $i=0,\ldots,n$, consideremos los polinomios $$L_i(x)=\prod_{0\leq k \leq n, k\neq i} \frac{x-x_k}{x_i-x_k}.$$ Observa que $L_j(x_j)=1$ y si $j\neq i$, tenemos $L_i(x_j)=0$. Afirmamos que $$B=\{L_j:j=0,\ldots,n+1\}$$ es una base ortonormal de $\mathbb{R}_n[x]$ con el producto interior que definimos. Como consiste de $n+1$ polinomios y $\dim(\mathbb{R}_n[x])=n+1$, basta con que veamos que es un conjunto ortonormal.

Primero, notemos que
\begin{align*}
\langle L_i,L_i \rangle = \sum_{j=0}^n L_i(x_j)^2 = L_i(x_i)^2=1,
\end{align*}

de modo que cada $L_i$ tiene norma $1$.

Luego, notemos que si $i\neq j$, entonces $L_i(x_k)L_j(x_k)=0$ pues $x_k$ no puede ser simultáneamente $x_i$ y $x_j$. De este modo,

\begin{align*}
\langle L_i,L_j \rangle = \sum_{k=0}^n L_i(x_k)L_j(x_k)=0.
\end{align*}

Con esto mostramos que cada par de polinomios distintos es ortogonal. Esto termina la demostración de que $B$ es base ortonormal.

$\square$

Ejemplo de conjuntos ortogonales en funciones periódicas

Ejemplo. Consideremos $V$ el conjunto de funciones $f:\mathbb{R}\to \mathbb{R}$ continuas y periódicas de periodo $2\pi$. Definimos $$\langle f,g \rangle = \int_{-\pi}^\pi f(x)g(x)\, dx.$$ Se puede mostrar que $\langle \cdot, \cdot \rangle$ así definido es un producto interior en $V$.

Para cada entero positivo $n$, definimos
\begin{align*}
C_n(x)&=\frac{\cos(nx)}{\sqrt{\pi}}\\
S_n(x)&=\frac{\sin(nx)}{\sqrt{\pi}}.
\end{align*}

Además, definimos $C_0(x)=\frac{1}{\sqrt{2\pi}}$. Afirmamos que $$\mathcal{F}:=\{C_n:n\geq 0\}\cup \{S_n:n\geq 1\}$$ es un conjunto ortonormal de vectores. Mostremos esto.

Para empezar, notamos que $$\Vert C_0\Vert ^2 = \int_{-\pi}^{\pi} \frac{1}{2\pi}\, dx =1.$$

Luego, tenemos que para $n\geq 1$ que
\begin{align*}
\Vert C_n\Vert ^2 &= \int_{-\pi}^\pi \frac{1}{\pi} \cos^2(nx)\, dx\\
&= \int_{-\pi}^\pi \frac{1+\cos(2nx)}{2\pi}\, dx\\
&= 1,
\end{align*}

ya que para todo entero $m\neq 0$ se tiene que $$\int_{-\pi}^\pi \cos(mx) \, dx=0.$$ De manera similar, usando la identidad $$\sin^2(nx)=\frac{1-\cos(nx)}{2},$$ se puede ver que la norma de $S_n$ es $1$.

Para ver que las parejas de elementos distintas son ortogonales, tenemos varios casos. Si tomamos $n\geq 1$, el resultado para $\langle C_0,C_n\rangle$ ó $\langle C_0,S_n\rangle$ se deduce de que
$$\int_{-\pi}^\pi \cos(mx)\, dx=\int_{-\pi}^\pi \sin(mx)\, dx=0$$ para todo entero $m\neq 0$.

Si tomamos dos $C_i$’s distintos, dos $S_i’s$ distintos o un $C_i$ y un $S_i$, el resultado se deduce de las fórmulas «producto a suma» de las funciones trigonométricas.

$\square$

Más adelante…

En esta entrada combinamos las nociones de bases y el producto interior, estudiadas en entradas anteriores, para definir a las bases ortogonales. Vimos algunas propiedades de conjuntos ortogonales y ortonormales, para extenderlos a bases ortogonales y ortonormales. Vimos unos ejemplos de bases ortogonales de los polinomios y otros ejemplos de conjuntos ortogonales en funciones periódicas.

En la siguiente entrada veremos aplicaciones de estos conceptos, culminando en una descomposición de Fourier.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra un conjunto ortogonal de vectores en $\mathbb{R}^4$ tal que ninguna de las entradas de ninguno de sus vectores sea igual a $0$.
  • Escribe las demostraciones de los corolarios enunciados en esta entrada.
  • Muestra que $\langle \cdot, \cdot \rangle$ definido en el ejemplo de funciones periódicas es un producto interior.
  • Termina de mostrar que la familia $\mathcal{F}$ del ejemplo de funciones periódicas es ortonormal. Sugerencia: Usa identidades de suma y resta de ángulos para poner el producto de senos (o cosenos o mixto) como una suma de senos y/o cosenos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Seminario de Resolución de Problemas: Grupos, anillos y campos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En estas entradas hemos visto cómo distintas herramientas de álgebra nos pueden ayudar en la resolución de problemas. En las primeras dos entradas, hablamos de identidades algebraicas básicas y un par de avanzadas. Luego, hablamos de factorización en polinomios y del teorema de la identidad. Ahora platicaremos de cómo estructuras un poco más abstractas nos pueden ayudar. De manera particular, nos enfocaremos en aplicaciones de teoría de grupos a la resolución de problemas. Sin embargo, hacia el final de la entrada también hablaremos un poco acerca de anillos, dominios enteros y campos.

Teoría de grupos básica

Una de las nociones de álgebra abstracta más básicas, y a la vez más flexibles, es la de grupo. La teoría de grupos es muy rica y se estudia a profundidad en un curso de álgebra abstracta o álgebra moderna. Aquí veremos únicamente un poco de esta teoría y algunas aplicaciones a resolución de problemas. Comenzamos con la definición.

Definición. Un grupo es un conjunto no vacío $G$ con una operación binaria $\cdot$ que cumple lo siguiente:

  • Asociatividad: Para cualesquiera elementos $x,y,z$ en $G$ tenemos que $x\cdot (y\cdot z) = (x\cdot y) \cdot z$.
  • Neutro: Existe un elemento $e$ en $G$ tal que $x\cdot e = x = e\cdot x$ para todo elemento x.
  • Inversos: Para cada elemento $x$ en $G$, existe un elemento $y$ en $G$ tal que $x\cdot y = e = y\cdot x$.

Usualmente se simplifica la notación de la siguiente manera. Por un lado, en vez de poner el símbolo de producto, simplemente se ponen elementos consecutivos, por ejemplo $a\cdot b = ab$. Además, por la asociatividad, muchas veces no se ponen los paréntesis, de modo que expresiones como $(a\cdot b)\cdot c$ se escriben simplemente como $abc$, a menos que los paréntesis ayuden a entender un argumento.

Hay que tener cuidado con invertir el orden de factores. En grupos, no necesariamente sucede que la operación es conmutativa, es decir, que $ab=ba$ para todo par de elementos $a$ y $b$. Si $ab=ba$ decimos que $a$ y $b$ conmutan y si todo par de elementos de $G$ conmutan, decimos que $G$ es conmutativo. Un elemento siempre conmuta consigo mismo. Para $n$ un entero positivo definimos $a^n$ como el producto formado por $n$ veces el elemento $a$.

A partir de la definición se puede ver que el neutro es único, pues si hubiera dos neutros $e$ y $e’$ tendríamos $e=e\cdot e’=e’$, en donde primero usamos que $e’$ es neutro y después que $e$ lo es. Para $a$ en $G$, definimos $a^0$ como $e$.

En grupos se vale «cancelar». Por ejemplo, si $ab=ac$, entonces podemos multiplicar esta igualdad a la izquierda por un inverso $d$ de $a$ y obtendríamos $$b=eb=dab=dac=ec=c.$$ Del mismo modo, la igualdad $ba=ca$ implica $b=c$.

En particular, si $d$ y $d’$ son inversos de $a$, tenemos $da=e=d’a$, de donde $d=d’$. Esto muestra que los inversos también son únicos, así que al inverso de $a$ le llamamos $a^{-1}$. Observa que $e^{-1}=e$. Nota que si $a$ y $b$ son elementos de $G$, entonces $$ab(b^{-1}a^{-1})=aea^{-1}=aa^{-1}=e,$$ de modo que el inverso de un producto $ab$ es el producto $b^{-1}a^{-1}$. Para $n$ un entero positivo, definimos $a^{-n}$ como el inverso de $a^n$, que por lo anterior, es precisamente $(a^{-1})^n$. De hecho, ya definido $a^n$ para todo entero, se puede verificar que se satisfacen las leyes usuales de los exponentes.

Problema. Sean $a$ y $b$ dos elementos en un grupo $G$ con neutro $e$ tales que $aba=ba^2b$, $a^3=e$ y $b^{2021}=e$. Muestra que $b=e$.

Sugerencia pre-solución. Observa que si $a$ y $b$ conmutaran, entonces el resultado se deduce fácilmente de la primer igualdad. Así, intenta modificar el problema a demostrar que $a$ y $b$ conmutan. Para ello tienes que hacer un paso intermedio que necesita inducción.

Solución. Lo primero que veremos es que $a$ y $b^2$ conmutan. Poniendo una identidad entre ambas $b$ en el producto $ab^2$, tenemos que $$ab^2=abaa^{-1}b=ba^2ba^{-1}b.$$ De $a^3=e$, tenemos $a^{-1}=a^2$, así que siguiendo con la cadena de igualdades, \begin{align*}
ba^2ba^{-1}b&=ba^2ba^2b\\
&=ba^2aba\\
&=bba=b^2a.
\end{align*} Así, $ab^2=b^2a$.

Ahora veremos que $a$ y $b$ conmutan. Para ello, como $a$ y $b^2$ conmutan, tenemos que $a$ y $b^{2k}$ conmutan para cualquier entero $k$. Esto se puede probar por inducción. El caso $k=1$ es lo que ya probamos. Si es válido para cierta $k$, se sigue que $$ab^{2k+2}=b^{2k}ab^2=b^{2k+2}a.$$ Por hipótesis, $b^{2020}=b$, así que el resultado anterior nos dice que $a$ y $b$ conmutan.

Por esta razón, la primer hipótesis $aba=ba^2b$ se puede reescribir como $a^2b=a^2b^2$, que por cancelación izquierda da $e=b$, como queríamos mostrar.

$\square$

Subgrupos y órdenes

Dentro de un grupo pueden vivir grupos más pequeños.

Definición. Un subgrupo de un grupo $G$ es un subconjunto $H$ de $G$ que es un grupo con las operaciones de $G$ restringidas a $H$.

Para que $H$ sea subgrupo, basta con que no sea vacío y que sea cerrado bajo la operación de grupos y la operación «sacar inverso».

Por ejemplo, se puede ver que $\mathbb{Z}_{12}$, los enteros módulo $12$ con la suma, forman un grupo. De aquí, $H_1=\{0,3,6,9\}$ es un subgrupo y $H_2=\{0,4,8\}$ es otro.

Proposición. Si $a$ es un elemento de un grupo $G$, entonces o bien $$1,a, a^2, a^3,\ldots$$ son todos elementos distintos de $G$, o bien existe un entero positivo $n$ tal que $a^n=1$ y $1,a,\ldots,a^{n-1}$ son todos distintos. En este segundo caso, $\{1,a,\ldots,a^{n-1}\}$ es un subgrupo de $G$.

Sugerencia pre-demostración. Divide en casos. Luego, usa el principio de cancelación o las leyes de exponentes para grupos.

Demostración. Si todos los elementos son distintos, entonces no hay nada que hacer. De otra forma, existen $i<j$ tales que $a^j=a^i$, de donde por la ley de cancelación tenemos que $a^{j-i}=e$ y $j-i\geq 1$. Así, el conjunto de enteros positivos $m$ tales que $a^m=e$ es no vacío, de modo que por el principio de buen orden tiene un mínimo, digamos $n$.

Afirmamos que $$1,a,a^2,\ldots,a^{n-1}$$ son todos distintos. En efecto, de no ser así, como en el argumento de arriba existirían $0\leq i < j \leq {n-1}$ tales que $a^{j-i}=e$, pero $j-i\leq n-1$ sería una contradicción a la elección de $n$ como elemento mínimo.

Probemos ahora que $A=\{1,a,\ldots,a^{n-1}\}$ es subgrupo de $G$. Si tenemos $a^k$ y $a^l$ en $A$, su producto es $a^{k+l}$. Por el algoritmo de la división, $k+l=qn+r$, con $r\in \{0,\ldots,n-1\}$, de modo que $$a^ka^l=a^{qn+r}=(a^n)^qa^r=e^qa^r=a^r,$$ así que $A$ es cerrado bajo productos. Además, si $1\leq k\leq n-1$, entonces $1\leq n-k \leq n-1$ y $a^ka^{n-k}=a^n=e$. Así, $A$ es cerrado bajo inversos. Esto muestra que $A$ es subgrupo de $G$.

$\square$

En teoría de grupos, la palabra «orden» se usa de dos maneras. Por un lado si $G$ es un grupo, su orden $\text{ord}(G)$ es la cantidad de elementos que tiene. Por otro, dado un elemento $a$, el orden $\text{ord}(a)$ de $a$ es el menor entero positivo $n$ tal que $a^n=e$, si es que existe.

Definimos al subgrupo generado por $a$ como $$\langle a\rangle:=\{a^n:n\in \mathbb{Z}\}.$$ La proposición anterior dice que si $\langle a \rangle$ es finito, entonces es un subgrupo de $G$ de orden $\text{ord}(\langle a \rangle) = \text{ord}(a).$ A los grupos de la forma $\langle a \rangle$ se les llama cíclicos.

Teorema de Lagrange

Cuando estamos trabajando con grupos finitos, el orden de un subgrupo debe cumplir una condición de divisibilidad.

Teorema (de Lagrange). Sea $G$ un grupo finito y $H$ un subgrupo de $G$. Entonces $\text{ord}(H)$ divide a $\text{ord}(G)$.

No daremos la demostración de este teorema, pero veremos algunos corolarios que sirven en la resolución de problemas.

Proposición. Sea $G$ un grupo finito.

  • Si $\text{ord}(G)$ es un primo $p$, entonces $G$ es cíclico.
  • El orden de cualquier elemento $a$ de $G$ divide al orden de $G$, y por lo tanto $a^{\text{ord}(G)}=1$.
  • Si $a$ es un elemento de $G$ de orden $n$ y $a^m=e$, entonces $n$ divide a $m$.

Demostración. Para la primer parte, si tomamos un elemento $a$ de $G$ que no sea $e$, ya vimos que $\langle a \rangle$ es un subgrupo cíclico de $G$. Por el teorema de Lagrange, su orden debe dividir al primo $p$. Pero el orden de $\langle a \rangle$ es al menos $2$, así que el orden de $\langle a \rangle$ debe ser $p$ y por lo tanto $\langle a \rangle=G$.

Como vimos arriba, el orden de $a$ es el orden de $\langle a \rangle$, que divide a $G$. Así,
\begin{align*}
a^{\text{ord}(G)}&=(a^{\text{ord}{a}})^{\text{ord}(G)/ \text{ord}(a)}\\
&=e^{\text{ord}(G)/ \text{ord}(a)}\\
&=e.
\end{align*} Con esto queda probado el segundo punto.

Para el último punto, usamos el algoritmo de la división para escribir $m=qn+r,$ con $r$ entre $0$ y $n-1$. Tenemos que $$e=a^m=a^{qn+r}=a^r.$$ Por lo visto en la sección anterior, necesariamente $r=0$, así que $n$ divide a $m$.

$\square$

Veamos cómo se pueden aplicar algunas de las ideas anteriores a un problema de teoría de grupos concreto.

Problema. En un grupo $G$, tenemos elementos $a$ y $b$ tales que $a^7=1$ y $aba^{-1}=b^2$. Determina qué posibles valores puede tener el orden de $b$.

Sugerencia pre-solución. Conjetura una fórmula para $b^{2n}$ buscando un patrón. Establécela por inducción.

Solución. El orden de $a$ debe dividir a $7$, así que es o $1$ o $7$. Si es $1$, entonces $a=e$, por lo que por la hipótesis tenemos $b=b^2$. De aquí $b=e$, así que el orden de $b$ es $1$. La otra opción es que el orden de $a$ sea $7$.

Afirmamos que para todo entero $n$ se tiene que $a^nba^{-n}=b^{2^n}$. Esto se prueba inductivamente. Es cierto para $n=1$ por hipótesis. Si se cumple para cierta $n$ y elevamos la igualdad al cuadrado, tenemos que
\begin{align*}
b^{2^{n+1}}&=(b^{2n})^2\\
&=a^nba^{-n}a^nba^{-n}\\
&=a^nb^2a^{-n}\\
&=a^{n+1}ba^{-(n+1)},
\end{align*}

lo cual termina la inducción.

En particular, para $n=7$ tenemos que $a^7=a^{-7}=e$, por lo que $b=b^{2^7}$, y por lo tanto $b^{127}=e$. Como $127$ es primo, el orden de $b$ puede ser $1$ ó $127$.

$\square$

En realidad, en el problema anterior falta mostrar que en efecto existe un grupo que satisfaga las hipótesis, y para el cual el orden de $b$ sea exactamente $127$. Esto no lo verificaremos aquí.

Teoría de grupos en teoría de números

Lo que hemos platicado de teoría de grupos se vale para grupos en general. Cuando aplicamos estos resultados a grupos particulares, tenemos nuevas técnicas para resolver problemas. Uno de los casos que aparecen más frecuentemente es aplicar teoría de grupos en problemas de teoría de números.

Si tomamos un entero $n$, los enteros entre $1$ y $n-1$ que son primos relativos con $n$ forman un grupo con la operación de producto módulo $n$. Si llamamos $\varphi(n)$ a la cantidad de primos relativos con $n$ entre $1$ y $n-1$, el teorema de Lagrange da el siguiente corolario.

Teorema (de Euler). Para todo entero positivo $n$ y $a$ un entero primo relativo con $n$, se tiene que $$a^\varphi(n)\equiv 1\pmod n.$$

Como corolario al teorema de Euler, tenemos el pequeño teorema de Fermat, que hemos discutido previamente aquí en el blog.

Teorema (pequeño teorema de Fermat). Para $p$ un primo y $a$ un entero que no sea múltiplo de $p$, se tiene que $$a^{p-1}\equiv 1 \pmod p.$$

Así, cuando $p$ es primo y $a$ no es múltiplo de $p$, se tiene que el orden de $a$ divide a $p-1$. Veamos un ejemplo en donde esta idea forma parte fundamental de la solución.

Problema. Muestra que para ningún entero $n>1$ se tiene que $n$ divide a $2^n-1$.

Sugerencia pre-solución. Procede por contradicción, suponiendo que sí existe. Considera un primo $p$ que divida a $n$ y que además sea extremo en algún sentido. Trabaja módulo $p$.

Solución. Supongamos que existe un entero $n>1$ tal que $n$ divide a $2^n-1$. Sea $p$ el primo más pequeño que divide a $n$. Tomemos $a$ el orden de $2$ en el grupo multiplicativo $\mathbb{Z}_p$.

Por un lado, como $p$ divide a $n$ y $n$ divide a $2^n-1$, se tiene que $p$ divide a $2^n-1$ y por lo tanto $$2^n\equiv 1 \pmod p.$$ De esta forma, $a$ divide a $n$.

Por otro lado, por el pequeño teorema de Fermat, tenemos que $$2^{p-1}\equiv 1 \pmod p,$$ así que $a$ divide a $p-1$ y por lo tanto $a\leq p-1$.

Si $a\neq 1$, entonces $a$ tiene un divisor primo que divide a $n$ y es menor que $a\leq p-1$, lo cual es imposible pues elegimos a $p$ como el menor divisor primo de $n$. De esta forma, $a=1$. Pero esto da la contradicción $2\equiv 1 \pmod p$.

$\square$

Anillos, dominios enteros y campos

Cuando se están resolviendo problemas, es importante tener en mente que existen otras estructuras algebraicas. Definiremos sólo las más comunes y veremos un problema ejemplo.

Definición. Un anillo es un conjunto $R$ con dos operaciones binarias suma y producto tales que:

  • $R$ con la suma es un grupo conmutativo.
  • El producto en $R$ es asociativo, es decir $(ab)c=a(bc)$ para $a,b,c$ en $R$.
  • Se cumple la ley distributiva, es decir $a(b+c)=ab+ac$ y $(b+c)a=ba+ca$ para $a,b,c$ en $R$.

El producto en $R$ no tiene por qué ser un grupo. De hecho, ni siquiera tiene que tener neutro.

Definición. Si un anillo $R$ tiene neutro, decimos que $R$ es un anillo con $1$. Si la multiplicación de $R$ es conmutativa, decimos que $R$ es conmutativo.

Definición. Un dominio entero es un anillo conmutativo con uno en donde además se vale cancelar, es decir, $ab=ac$ implica $b=c$ y $ba=ca$ implica $b=c$.

Definición. Un campo es un anillo conmutativo con uno en donde cada elemento distinto de la identidad aditiva tiene inverso multiplicativo. En otras palabras, es un anillo en donde la suma y el producto son grupos.

Problema. Muestra que todo dominio entero finito es un campo.

Sugerencia pre-solución. Usa el principio de las casillas.

Solución. Supongamos que $R=\{a_1,\ldots,a_n\}$ es un dominio entero con una cantidad finita de elementos. Lo único que falta para que sea campo es que los elementos tengan inversos multiplicativos.

Sea $a$ un elemento de $R$ y supongamos que $a$ no tiene inverso multiplicativo. Entonces, los números $$a_1a, a_2a,\ldots,a_n a$$ sólo pueden tomar a lo más $n-1$ valores diferentes, de modo que por principio de las casillas existen dos de ellos que son iguales, digamos $a_ia=a_ja$ para $i\neq j$.

Como $R$ es dominio entero, se vale cancelar, lo cual muestra $a_i=a_j$. Esto es una contradicción, pues $a_i$ y $a_j$ eran elementos distintos de $R$. Así, todo elemento tiene inverso multiplicativo.

$\square$

En cursos de matemáticas a nivel superior se ven muchos ejemplos de estas estructuras algebraicas. En cursos de Álgebra Superior se construye el dominio entero de enteros $\mathbb{Z}$. Se construyen los campos $\mathbb{R}$, $\mathbb{Q}$ y $\mathbb{C}$. También, se construyen los anillos de polinomios $\mathbb{F}[x]$. La noción de campo es fundamental cuando se construye la teoría de Álgebra Lineal. Como se puede ver, la teoría de álgebra es muy amplia, así que esta entrada sólo queda como invitación al tema.

Más problemas

Puedes encontrar más problemas de estructuras algebraicas en la Sección 4.4 del libro Problem Solving through Problems de Loren Larson.

Álgebra Superior II: Multiplicación en forma polar y fórmula de De Moivre

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior hablamos de las coordenadas rectangulares y polares de un número complejo. También, definimos la forma polar de un número complejo. En esta entrada hablaremos de cómo con la forma polar, de los elementos de $\mathbb{C}$, podemos entender fácilmente su multiplicación. Además, usaremos esto para demostrar la fórmula de De Moivre, que nos dice cómo encontrar las potencias de un complejo.

Como pequeño recordatorio, la forma polar del complejo $z=x+iy$ es $z=r(\cos \theta + i \sin \theta)$, en donde $r$ es la norma de $z$ y $\theta$ es el ángulo que hace con el eje real positivo, pensándolo como el punto $(x,y)$. Esto queda resumido por la siguiente figura:

Complejo en forma rectangular y polar
Complejo en forma rectangular y polar

Forma polar, multiplicación y recordatorio trigonométrico

Para ver cómo la forma polar de los complejos nos ayuda a entender la multiplicación en $\mathbb{C}$, necesitamos recordar las siguientes fórmulas trigonométricas
\begin{align*}
\sin (\alpha+\beta) = \sin \alpha \cos \beta + \sin \beta \cos \alpha\\
\cos(\alpha+\beta) = \cos \alpha \cos \beta – \sin \beta \sin \alpha.
\end{align*}

Si tenemos dos números complejos en forma polar
\begin{align*}
w&=r (\cos\alpha+ i \sin \alpha)\\
z&=s(\cos \beta + i \sin \beta)
\end{align*}

y los multiplicamos con la definición, su producto tendría parte real $$rs(\cos\alpha\cos \beta – \sin \alpha\sin \beta) = rs\cos (\alpha+\beta)$$ y parte imaginaria $$rs(\sin \alpha \cos \beta+ \sin\beta\cos\alpha)=rs\sin (\alpha+\beta).$$

Además, como la norma es multiplicativa, tenemos que la norma de $wz$ es $rs$. Con esto mostramos que la forma polar de $wz$ es exactamente $$wz=(rs)(\cos(\alpha+\beta)+i\sin(\alpha+\beta)).$$ Esto queda resumido en el siguiente resultado

Proposición. Si tenemos dos números complejos en forma polar
\begin{align*}
w&=r \text{cis}(\alpha)\\
z&=s\text{cis}(\beta),
\end{align*} entonces la forma polar del producto es $$wz=rs\text{cis}(\alpha+\beta).$$

Otra forma de decirlo es que «al multiplicar complejos, multiplicamos normas y sumamos argumentos». Podemos también ver el resultado de forma geométrica mediante la siguiente figura, en donde marcamos con rojo y azul los factores, y con negro al producto.

Interpretación geométrica de la multiplicación en los complejos
Interpretación geométrica de la multiplicación en los complejos

Ejemplo. Vamos a encontrar la forma rectangular del producto de los complejos
\begin{align*}w& =7 \text{cis}\left( \frac{2\pi}{5} \right)\quad\text{y}\\ z&=2\text{cis}\left(\frac{3\pi}{5}\right).\end{align*}

Por la proposición anterior, el producto es exactamente el complejo
\begin{align*}
14 \text{cis}\left(\frac{2+3}{5}\pi \right)=14 \text{cis} (\pi).
\end{align*}

Esta es la forma polar del producto. Por un problema anterior, sabemos que $\text{cis}(\pi)=-1$, de modo que la forma rectangular del producto es $-14$.

Si tenemos un complejo no nulo en forma polar, podemos entender fácilmente su inverso multiplicativo. Esto está dado por la siguiente proposición, cuya demostración es sencilla y se deja como tarea moral.

Proposición. Sea $w\neq 0$ un complejo con forma polar $w=r\text{cis}(\theta)$. Su inverso multiplicativo es el complejo $r^{-1}\text{cis}(-\theta)$.

Ejemplo. Determinemos el inverso multiplicativo del complejo $$w=\sqrt{3}\text{cis}\left(\frac{3\pi}{7}\right).$$ Para ello, basta usar la proposición anterior, de donde $$w^{-1}=\frac{1}{\sqrt{3}} \text{cis}\left(-\frac{3\pi}{7}\right)=\frac{\sqrt{3}}{3}\text{cis}\frac{11\pi}{7}.$$

$\triangle$

Fórmula de De Moivre

La proposición para multiplicación de complejos se vuelve todavía más útil si la usamos iteradamente para hacer potencias de complejos.

Teorema (fórmula de De Moivre). Si $z$ es un complejo de norma $r$ y argumento $\theta$ y $n$ es un entero positivo, entonces $z^n$ es el complejo de norma $r^n$ y argumento $n\theta$. En otras palabras, si $z=r(\cos \theta + i \sin \theta)=r\text{cis}(\theta)$, entonces $$z^n=r^n (\cos (n\theta)+i\sin (n\theta))= r^n \text{cis} (n\theta).$$

Demostración. Procedemos por inducción sobre $n$. El caso $n=1$ es inmediato. Supongamos que el resultado es cierto para $n$, es decir, que $$z^n=r^n \text{cis} (n\theta).$$

Por hipótesis inductiva, tenemos entonces que la norma de $z^n$ es $r^n$, de modo que $z^{n+1}=z^n z$ tiene norma $r^nr=r^{n+1}$.

También por hipótesis inductiva, $z^n$ tiene argumento $n\theta$. Por cómo funciona la multiplicación compleja, el argumento de $z^{n+1}=z^n z$ es la suma de los argumentos de $z^n$ y $z$, es decir, $n\theta + \theta = (n+1)\theta$. Esto muestra que $$z^{n+1}=r^{n+1}\text{cis}((n+1)\theta),$$ y con esto acabamos el paso inductivo.

$\square$

Ejemplos de aplicación de fórmula de De Moivre

Ejemplo. Veremos quién es la décima potencia del complejo $$z=\sqrt{3}\text{cis} \left(\frac{4\pi}{5}\right).$$ Como este número ya está escrito en forma polar, podemos aplicarle directamente la fórmula de De Moivre:
\begin{align*}
z^{10}&=3^{10/2} \text{cis}\left(\frac{40\pi}{5}\right)\\
&=3^5 \text{cis} (8\pi)\\
&=3^5\\
&=243.
\end{align*}

$\triangle$

El ejemplo anterior nos dice que $z^{10}=243$. En otras palabras, $z$ es una raíz $10$-ésima de $243$. Pero existen otras raíces $10$-ésimas de 243, por ejemplo, tiene dos raíces reales $\sqrt[10]{243}$ y $-\sqrt[10]{243}$. ¿Cuántas raíces tiene entonces en total? ¿Quiénes son? Esto lo veremos en la siguiente entrada.

Veamos otro ejemplo en el que se aplica la fórmula de De Moivre.

Problema. Evalúa la expresión $(1+i)^{30}$, expresando el resultado final en forma rectangular.

Solución. Comenzamos expresando a $(1+i)$ en forma polar. Para ello, notamos que $\Vert 1+i \Vert = \sqrt{2}$, y que $1+i$ hace un ángulo de $\frac{\pi}{4}$ con el eje real positivo. Por el teorema de De Moivre, tenemos que

\begin{align*}
z^{30}&=\sqrt{2}^{30}\text{cis}\left(\frac{30\pi}{4}\right)\\
&=2^{15}\text{cis}\left(\frac{6\pi}{4} \right) \\
&=2^{15}\text{cis}\left(\frac{3\pi}{2} \right) \\
&=2^{15}(-i)\\
&=-2^{15}i.
\end{align*}

En la segunda igualdad usamos que $\frac{30\pi}{4}$ y $\frac{6\pi}{4}$ difieren en un múltiplo entero de $2\pi$. En la cuarta usamos la forma polar de $-i$.

$\triangle$

Más adelante…

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Muestra que para un complejo $z\neq 0$ escrito en forma polar $z=r\text{cis}(\theta)$, su inverso multiplicativo tiene forma polar $r^{-1}\text{cis} (-\theta)$.
  2. Evalúa la multiplicación $wz$, donde $w=2\text{cis}\left(\frac{5\pi}{7}\right)$ y $z=-5\text{cis}\left(\frac{7\pi}{5}\right)$. Expresa la respuesta forma polar.
  3. Haz la multiplicación $wz$, donde $w=3\text{cis}\left(\frac{\pi}{2}\right)$ y $z=4\text{cis}\left(\frac{\pi}{3}\right)$. Expresa la respuesta en forma rectangular.
  4. Sea $z=7\text{cis}\left(\frac{5\pi}{7}\right)$. Expresa $z^3$ en forma polar.
  5. Sea $z=\sqrt[3]{5} \text{cis}\left(\frac{\pi}{3}\right)$. Expresa $z^9$ en forma rectangular.
  6. Toma el complejo $z=-2+2i$. Evalúa la expresión $$1+z+\ldots+z^{29}.$$ Sugerencia: Usa primero la fórmula de suma de términos de una sucesión geométrica, y después la fórmula de De Moivre.

Puedes practicar más estos temas viendo los videos y haciendo los ejercicios de la página de Khan Academy, de su sección de números complejos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal I: Ángulos, norma, distancia y desigualdad de Minkowski

Por Leonardo Ignacio Martínez Sandoval

Introducción

Estamos listos para hablar de varias nociones geométricas como ángulo, norma, distancia y de la desigualdad de Minkowski. Antes de hacer eso, hagamos un breve repaso de qué hemos hecho en estas últimas entradas.

Primero, hablamos de formas bilineales y de su formas cuadráticas asociadas. Segundo, vimos cómo a través de la identidad de polarización podemos asignar una única forma bilineal simétrica a una forma cuadrática. Finalmente, en la última entrada nos enfocamos en las formas bilineales simétricas que cumplían cierta condición de positividad.

En esa misma entrada definimos producto interior, que simplemente es una forma bilineal simétrica y positiva definida. También definimos la norma de un vector en un espacio con producto interior $\langle \cdot, \cdot \rangle$, que era $$\Vert x \Vert = \sqrt{\langle x, x \rangle}.$$

Finalmente, en la entrada anterior probamos la siguiente versión general de la desigualdad de Cauchy-Schwarz:

Teorema (desigualdad de Cauchy-Schwarz). Sea $b:V\times V\to \mathbb{R}$ una forma bilineal simétrica y $q$ su forma cuadrática asociada.

  • Si $b$ es positiva, entonces para todo $x$ y $y$ en $V$ tenemos que $$b(x,y)^2\leq q(x)q(y).$$ Si $x$ y $y$ son linealmente dependientes, se da la igualdad.
  • Además, si $b$ es positiva definida y $x$ y $y$ son linealmente independientes, entonces la desigualdad es estricta.

Ángulos

Fijemos $V$ un espacio vectorial sobre los reales con producto interior. En la entrada anterior vimos que la desigualdad de Cauchy-Schwarz implica que para cualesquiera vectores $x$ y $y$ en $V$ tenemos que $$|\langle x, y \rangle| \leq \Vert x \Vert \cdot \Vert y \Vert.$$

Si $x$ y $y$ son vectores distintos de cero, podemos reescribir la desigualdad anterior como $$-1\leq \frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}\leq 1.$$ Esto justifica la siguiente definición.

Definición. Sean $x$ y $y$ vectores no nulos. Definimos al ángulo entre $x$ y $y$ como el único ángulo $\theta$ en el intervalo $[0,\pi]$ tal que $$\cos \theta = \frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}.$$

Observa que $\theta=\frac{\pi}{2}$ si y sólo si $\frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}=0$. Esto ocurre si y sólo si $\langle x, y \rangle=0$. Este caso es particularmente importante, y por ello recibe una definición especial.

Definición. Decimos que $x$ y $y$ son ortogonales si $\langle x, y \rangle=0$.

Para empezar, veamos un ejemplo sencillo de ortogonalidad.

Ejemplo 1. Tomemos $\mathbb{R}^5$ con el producto interior canónico, es decir, el producto punto. Los vectores $u=(1,0,-4,0,5)$ y $v=(0,3,0,-2,0)$ tienen producto punto $$\langle u, v \rangle=1\cdot 0 + 0\cdot 3 + (-4)\cdot 0 + 0 \cdot (-2) + 5 \cdot 0=0,$$ así que son ortogonales.

$\triangle$

Ahora, veamos un ejemplo un poco más elaborado, del cálculo de un ángulo en un espacio vectorial de funciones.

Ejemplo 2. Anteriormente vimos que $\mathcal{C}[0,1]$ tiene un producto interior $$\langle f, g \rangle=\int_0^1 f(x)g(x)\, dx.$$ Calculemos el ángulo entre $f(x)=x^2$ y $g(x)=x^3$ con este producto interior. Primero, calculamos $\Vert f \Vert$ y $\Vert g \Vert$ como sigue
\begin{align*}
\Vert f \Vert^2 &= \int_0^1 x^4 \,dx = \frac{1}{5}\\
\Vert g \Vert^2 &= \int_0^1 x^6 \,dx = \frac{1}{7},
\end{align*}

de donde $\Vert f \Vert = \frac{1}{\sqrt{5}}$ y $\Vert g \Vert = \frac{1}{\sqrt{7}}$.

Luego, calculamos
\begin{align*}
\langle f,g \rangle &=\int_0^1 f(x)g(x) \, dx\\
&=\int_0^1 x^5 \, dx\\
&=\frac{1}{6}.
\end{align*}

Como esperaríamos por la desigualdad de Cauchy-Schwarz, tenemos la siguiente desigualdad:
\begin{align*}
\langle f,g \rangle &= \frac{1}{6}\leq \frac{1}{\sqrt{35}}=\Vert f \Vert \Vert g \Vert.
\end{align*}

El ángulo entre $f$ y $g$ es entonces
\begin{align*}
\theta &= \arccos\left(\frac{\langle f, g \rangle}{\Vert f \Vert \cdot \Vert g \Vert}\right)\\
&=\arccos\left(\frac{1/6}{1/\sqrt{35}}\right)\\
&=\arccos\left(\frac{\sqrt{35}}{6}\right).
\end{align*}

$\triangle$

Desigualdad de Minkowski

Hay una forma un poco distinta de escribir la desigualdad de Cauchy-Schwarz. La enunciamos a continuación.

Teorema (desigualdad de Minkowski). Sean $x$ y $y$ vectores de un espacio vectorial $V$ con una forma cuadrática positiva $q$. Entonces $$\sqrt{q(x)}+\sqrt{q(y)}\geq \sqrt{q(x+y)}.$$

Demostración. Sea $b$ la forma polar de $q$. Recordemos que $$q(x+y)=q(x)+2b(x,y)+q(y).$$

Como $q$ es forma cuadrática positiva, la desigualdad que queremos mostrar es equivalente a la siguiente desigualdad obtenida de elevar ambos lados al cuadrado:

\begin{align*}
q(x)+2\sqrt{q(x)q(y)}+q(y)&\geq q(x+y)\\
&=q(x)+2b(x,y)+q(y).
\end{align*}

Cancelando $q(x)+q(y)$ de ambos lados y dividiendo entre $2$, obtenemos la desigualdad equivalente
\begin{align*}
\sqrt{q(x)q(y)}\geq b(x,y).
\end{align*}

Si $b(x,y)<0$, esta desigualdad es claramente cierta. Si $b(x,y)\geq 0$, esta desigualdad es equivalente a la obtenida de elevarla al cuadrado, es decir, $$q(x)q(y)\geq b(x,y)^2,$$ que es precisamente la desigualdad de Cauchy-Schwarz.

$\square$

De producto interior a norma

Estamos listos para mostrar algunas propiedades importantes de la noción de norma que definimos para espacios vectoriales reales con producto interior.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior con norma asociada $\Vert \cdot \Vert$. Se cumple que

  1. $\Vert v \Vert \geq 0$ para todo $v$ en $V$, con igualdad si y sólo si $v=0$.
  2. $\Vert cv \Vert =|c|\Vert v \Vert$ para todo $v$ en $V$ y real $c$.
  3. (Desigualdad del triángulo) $\Vert v \Vert + \Vert w \Vert \geq \Vert v+w \Vert$ para todo par de vectores $v$ y $w$ en $V$.

Demostración. Sea $b$ el producto interior de $V$. El punto 1 se sigue de que $b$ es positiva definida. El punto 2 se sigue de que $b$ es bilineal, pues $b(cv,cv)=c^2b(v,v)$, de modo que $$\Vert cv \Vert = \sqrt{c^2} \Vert v \Vert =|c| \Vert v \Vert.$$ El punto 3 es la desigualdad de Minkowski.

$\square$

En general, si tenemos un espacio vectorial $V$ sobre los reales y una función $\Vert \cdot \Vert:V \to \mathbb{R}$ que satisface los puntos 1 a 3 de la proposición anterior, decimos que $\Vert \cdot \Vert$ es una norma para $V$. Hay algunas normas que no se pueden obtener a través de un producto interior.

Ejemplo. Consideremos $V=M_n(\mathbb{R})$. El producto de Frobenius de las matrices $A$ y $B$ está dado por $$\langle A,B\rangle = \text{tr}(^tA B).$$ Se puede mostrar que el producto de Frobenius es un producto interior. La norma de Frobenius es la norma inducida por este producto, es decir, $$\Vert A \Vert = \sqrt{\text{tr}(^tAA)}.$$

Por la desigualdad de Minkowski, tenemos que para cualesquiera dos matrices $A$ y $B$ tenemos que $$\sqrt{\text{tr}(^t(A+B)(A+B))}\leq \sqrt{\text{tr}(^tAA)} + \sqrt{\text{tr}(^tBB)}.$$

En particular, si tomamos a la identidad $I$, tenemos que su norma de Frobenius es $\sqrt{n}$. Esto muestra la siguiente desigualdad, válida para cualquier matriz $A$ en $M_n(\mathbb{R})$:

$$\sqrt{\text{tr}((^tA+I)(A+I))}\leq \sqrt{\text{tr}(^tAA)}+ \sqrt{n}.$$

$\triangle$

De norma a distancia

Podemos pensar a la norma de un vector $v$ como qué tan lejos está del vector $0$. También nos gustaría poder hablar de qué tan lejos están cualesquiera dos vectores de un espacio vectorial con producto interior. Por esta razón, introducimos la siguiente definición.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior de norma $\Vert \cdot \Vert$. La distancia asociada a este producto interior es la función $d:V\times V\to \mathbb{R}$ tal que $d(x,y)=\Vert x-y\Vert.$ A $d(x,y)$ le llamamos la distancia entre $x$ y $y$.

El siguiente resultado se sigue de las propiedades de la norma de un producto interior. Su demostración queda como tarea moral.

Proposición. Si $V$ es un espacio vectorial sobre $\mathbb{R}$ con producto interior de distancia $d$, entonces:

  1. $d(x,y)\geq 0$ para todos $x$ y $y$ en $V$ y es igual a $0$ si y sólo si $x=y$.
  2. $d(x,y)=d(y,x)$ para todos $x$ y $y$ en $V$.
  3. $d(x,z)+d(z,y)\geq d(x,y)$ para todos $x$, $y$ y $z$ en $V$.

En general, si tenemos cualquier conjunto $X$ (no hace falta que sea un espacio vectorial), a una función $d$ que satisface los puntos 1 a 3 de la proposición anterior se le conoce como una métrica para $X$. Cualquier norma en un espacio vectorial $V$ (no sólo las de producto interior) induce una métrica en $V$. Sin embargo, hay métricas de espacios vectoriales que no vienen de una norma.

Más adelante…

Retomando conceptos ya definidos como la norma de un vector, en esta entrada vimos cómo encontrar el ángulo entre dos vectores no-nulos y se llegó a una forma natural de introducir la ortogonalidad entre dos vectores. Así mismo, se demostraron algunas propiedades de la norma asociada a un producto interior, siendo la última una forma distinta de expresar la desigualdad de Cauchy-Schwarz, usando la desigualdad de Minkowski. Finalmente, se definió el concepto de distancia entre dos vectores.

En entradas posteriores, usaremos estos conceptos para estudiar bases ortogonales, que tienen usos en conceptos matemáticos más avanzados como el análisis de Fourier o la teoría de polinomios ortogonales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Toma $\mathbb{R}^4$ con el producto interior canónico (producto punto). Determina la norma de $(3,4,0,1)$. Encuentra el ángulo entre los vectores $(1,0,2,5)$ y $(4,5,0,-3)$.
  • Muestra que el producto de Frobenius es un producto interior en $M_n(\mathbb{R})$.
  • Demuestra la proposición de propiedades de la distancia

Considera $V=\mathbb{R}_3[x]$ el espacio vectorial de polinomios con coeficientes reales y grado a lo más $3$. Definimos $$\langle p,q \rangle = \sum_{j=1}^5 p(j)q(j).$$

  • Muestra que $\langle \cdot, \cdot \rangle$ así definido es un producto interior.
  • Encuentra el ángulo entre los polinomios $1+x^2$ y $2x-3x^3$.
  • Para cada entero positivo $n$, determina la norma del polinomio $1+nx^3$.
  • Determina la distancia entre los polinomios $1$ y $1+x+x^2+x^3$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Superior II: Forma polar y cambios de coordenadas de un complejo

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores comenzamos a hablar acerca de cómo resolver algunas ecuaciones en $\mathbb{C}$. Platicamos de ecuaciones cuadráticas y la fórmula general. Luego, vimos sistemas de ecuaciones lineales y varios métodos para resolverlos. Lo siguiente que haremos será resolver ecuaciones de la forma $z^n=w$, en donde $w$ en $\mathbb{C}$ y $n$ en $\mathbb{N}$ están dados y $z$ es la variable a determinar. Antes de resolver esta ecuación, necesitamos entender mejor la multiplicación en $\mathbb{C}$, y para ello vamos a estudiar la forma polar de un complejo.

En esta entrada comenzaremos recordando las coordenadas rectangulares de un número complejo, además definiremos sus coordenadas polares. Veremos cómo pasar de coordenadas rectangulares a polares de manera biyectiva, con lo cual podremos definir qué es la forma polar.

Más adelante, la forma polar nos ayudará a entender mejor la geometría de la multiplicación y exponenciación en $\mathbb{C}$. Esto será muy útil cuando queramos «sacar raíces $n$-ésimas», lo cual necesitaremos para resolver ecuaciones del estilo $z^n=w$.

De coordenadas rectangulares a coordenadas polares

Tomemos un número complejo $z=x+yi$ y pensémoslo como un punto del plano complejo, es decir, como el punto $(x,y)$ . Diremos que $(x,y)$ son las coordenadas rectangulares de $z$. Es recomendable recordar la siguiente figura, y regresar a ella frecuentemente.

Complejo en forma rectangular y polar
Complejo en forma rectangular y polar

El número complejo $z$ tiene norma $r=\sqrt{x^2+y^2}$. Además, si $z\neq 0$, tenemos que $z$ define un ángulo $\theta$ con el eje real positivo, medido en el sentido contrario al avance de las manecillas del reloj a partir del eje real positivo, al cual le llamaremos el argumento de $z$ y lo denotaremos por $\text{arg}(z)$. Todos los ángulos que manejamos están en radianes.

Sin embargo, este ángulo no es único. El complejo $z$ define al ángulo $\theta$ pero, por ejemplo, también define al ángulo $\theta+2\pi$, pues la suma de $2\pi$ corresponde a dar una vuelta completa alrededor del origen. Por ello, pensaremos que el argumento de $z$ toma todos los valores $$\{\theta+2k\pi:k\in \mathbb{Z}\}.$$ Así, $\text{arg}(z)$ es una multifunción, algo así como una función, pero que toma varios valores. Cuando digamos que un complejo tiene argumento $\theta$, nos referiremos a $\theta$ o cualquier otro ángulo que difiera un múltiplo entero de $2\pi$ Más adelante hablaremos de esto con detalle.

Aunque haya varios ángulos que le correspondan a $z$, hay uno único en el intervalo $[0,2\pi)$.

Definición. Definimos las coordenadas polares de un número complejo $z=x+yi$ como sigue:

  • Si $z=0$, sus coordenadas polares son $(0,0)$.
  • Si $z\neq 0$, entonces tomamos $r=\Vert z \Vert = \sqrt{x^2+y^2}$ y $\theta$ el único ángulo en $[0,2\pi)$ que hace $z$ con el eje real positivo. Las coordenadas polares de $z$ son $(r,\theta)$.

Observa que $r$ siempre es no negativo y es cero si y sólo si $z=0$. Además por trigonometría para el ángulo $\theta$ se cumple que \begin{align*}\sin \theta &= \frac{y}{r}\\ \cos \theta &= \frac{x}{r},\end{align*} lo cual nos da la siguiente forma práctica para encontrar $\theta$:

  • Calculamos $\frac{y}{r}$ o $\frac{x}{r}$ (el que parezca más sencillo).
  • Aplicamos una función trigonométrica inversa para reducir el problema a dos opciones.
  • Elegimos la opción correcta de acuerdo al signo de $x$ o $y$.

Ejemplo. Tomemos al complejo $z=3-3\sqrt{3}i$. Vamos a pasarlo a forma polar. Su norma es $\sqrt{9+27}=\sqrt{36}=6$. Para determinar el ángulo $\theta$ que define con el eje real, podemos notar que $$\cos{\theta}=\frac{3}{6}=\frac{1}{2},$$ así que $\theta = \frac{\pi}{3}$ ó $\theta= 2\pi-\frac{\pi}{3}=\frac{5\pi}{3}$, pues son los únicos ángulos en $[0,2\pi)$ con ese coseno. Como la parte imaginaria es negativa, se da el segundo caso. Por lo tanto, las coordenadas polares de $z$ son $\left(6,\frac{5\pi}{3}\right)$.

$\triangle$

De coordenadas polares a coordenadas rectangulares

También hay una forma de pasar de coordenadas polares a coordenadas rectangulares. En efecto, tomemos un real no negativo $r$ y consideremos la pregunta ¿quienes son los números complejos de norma $r$?

Por un lado, si $r=0$, necesitamos que $x^2+y^2=0^2=0$, de donde $x=y=0$, así que las coordenadas rectangulares deben ser $(0,0)$. Por otro lado, si $r>0$, se necesita que $$x^2+y^2=r^2,$$ lo cual, por el teorema de Pitágoras, define una circunferencia de radio $r$ con centro en el origen.

Circunferencia de complejos de norma r.
Circunferencia de complejos de norma $r$

Si además elegimos un ángulo, $\theta$ en $[0,2\pi)$, que el complejo haga con el eje real, entonces queda determinado de manera única. Supongamos que este complejo es $z=x+yi$

Por trigonometría, tenemos que
\begin{align*}x&=r\cos \theta\\ y &= r\sin \theta.\end{align*}

Problema. Determina en la forma $x+yi$ al número complejo cuyas coordenadas polares son $\left(7,\frac{3\pi}{4}\right)$.

Solución. Usamos las fórmulas obtenidas arriba. Tenemos que

\begin{align*}\\
x&=7\cos \frac{3\pi}{4}=7\cdot \left(-\frac{1}{\sqrt{2}}\right)=-\frac{7}{\sqrt{2}}\\
y &= 7\sin \frac{3\pi}{4}= 7\cdot \frac{1}{\sqrt{2}}=\frac{7}{\sqrt{2}}.
\end{align*}

De este modo, el complejo buscado es el $$-\frac{7}{\sqrt{2}}+\frac{7}{\sqrt{2}}.$$

$\square$

Los cambios de coordenadas son inversos entre sí

La primer sección explica cómo de coordenadas rectangulares podemos pasar a coordenadas polares. La anterior dice cómo pasar de coordenadas polares a rectangulares. Resulta que estas operaciones son inversas la una de la otra como veremos en la siguiente:

Proposición. Si tomamos coordenadas polares $(r,\theta)$ de un complejo, las pasamos a coordenadas rectangulares $(x,y)$ y luego éstas las pasamos a coordenadas polares $(r’,\theta’)$ de nuevo, tenemos que $$(r,\theta)=(r’,\theta’).$$

Demostración. En el caso $r=0$, sólo definimos coordenadas polares con $\theta=0$. Al ir a coordenadas rectangulares vamos al punto $(0,0)$, que de nuevo regresa a polares $(0,0)$. Podemos suponer entonces que $r>0$.

Como mencionamos en la segunda sección, las coordenadas rectangulares correspondientes a $(r,\theta)$ son exactamente $$(x,y)=(r\cos \theta,r\sin \theta).$$ Pasemos este complejo a coordenadas polares $(r’,\theta’)$. Usando la identidad pitagórica $\cos ^2\theta + \sin^2 \theta = 1$, la norma de este complejo es
\begin{align*}
\sqrt{r^2\cos^2\theta+r^2\sin^2 \theta} &= r\sqrt{\cos ^2\theta +\sin^2 \theta}\\
&=r\sqrt{1}\\
&=r,
\end{align*}

lo que prueba $r=r’$. Además, como discutimos en la primer sección, tenemos que
\begin{align*}
\sin \theta’ = \frac{r\sin \theta}{r} = \sin \theta\\
\cos \theta’ = \frac{r\cos \theta}{r}=\cos \theta.
\end{align*}

De esta forma, $\theta$ y $\theta’$ son ángulos en $[0,2\pi)$ con el mismo seno y coseno, lo cual implica $\theta=\theta’$.

$\square$

Corolario. El cambio de coordenadas rectangulares a polares , visto como una función de $$\mathbb{R}\times \mathbb{R}$$ a $$(\mathbb{R}^+\times [0,2\pi))\cup \{(0,0)\}$$ es biyectivo.

La forma polar de un número complejo

En las secciones anteriores pensamos a los complejos como parejas ordenadas. Podemos regresar los resultados obtenidos a la forma $x+yi$ de los complejos para justificar la siguiente definición.

Definición. La forma polar de un número complejo $z=x+yi$ es $z=r(\cos \theta + i\sin \theta)$, donde $(r,\theta)$ son las coordenadas polares de $(x,y)$.

Por costumbre, en la forma polar se pone $i$ antes de $\sin \theta$, a diferencia de la forma rectangular, en donde se pone $i$ después de $y$. A veces en expresiones como las de la forma polar aparecen ángulos $\theta$ fuera del rango $[0,2\pi)$. Podemos hacer las cuentas que necesitemos fuera de este rango sin problema. Al final podemos sumar o restar un múltiplo entero de $2\pi$ para caer en el rango $[0,2\pi)$. Esto no cambia el seno ni coseno del ángulo, por lo que no cambia al número complejo.

Como la expresión $ \cos \theta + i\sin \theta$ se usa mucho, usualmente se abrevia.

Definición. Para un ángulo $\theta$ definimos $\text{cis}(\theta) = \cos \theta + i \sin \theta$.

Problema. Determina la forma polar de los complejos $1$, $-1$, $i$ y $-i$.

Solución. Todos estos números tienen norma $1$. Además, hacen ángulos $0, \pi, \frac{\pi}{2}, \frac{3\pi}{2}$ con el eje real positivo, respectivamente. De esta forma, sus coordenadas polares son
\begin{align*}
(1,0)\quad (1,\pi)\quad\left(1,\frac{\pi}{2}\right)\quad \left(1,\frac{3\pi}{2}\right),
\end{align*}

respectivamente.

De esta forma, la forma polar de cada uno es:
\begin{align*}
1&=\cos 0+i \sin 0=\text{cis} (0)\\
-1&=\cos \pi + i \sin \pi = \text{cis} (\pi) \\
i&=\cos \frac{\pi}{2} + i \sin \frac{\pi}{2} = \text{cis} \left(\frac{\pi}{2}\right)\\
-i&= \cos \frac{3\pi}{2} + i \sin \frac{3\pi}{2} = \text{cis} \left( \frac{3\pi}{2}\right).
\end{align*}

$\triangle$

Una aclaración muy importante es que la forma polar de $z=x+yi$ no es $r+\theta i$. La forma polar es exactamente el mismo número complejo que el original, simplemente escrito de manera diferente.

Si la forma polar de un complejo es exactamente el mismo número que el original, ¿de qué nos sirve tenerlo en coordenadas polares? Resulta que la multiplicación compleja se entiende mucho mejor en términos de la forma polar. En la siguiente entrada veremos esto y cómo lo podemos usar para encontrar potencias de números complejos fácilmente.

Más adelante…

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Determina la forma polar de los siguientes complejos: $7-7i$ y $-2+2\sqrt{3}i$.
  2. Determina la forma rectangular de los complejos con coordenadas polares $\left(2,\frac{\pi}{3}\right)$ y $\left(1, \frac{11\pi}{6}\right)$.
  3. Si la forma polar del complejo $z$ es $r\text{cis} \theta$, ¿quién es la forma polar del conjugado?
  4. ¿Cuáles son aquellos números complejos que se obtienen al variar $\theta$ en la forma polar $3\text{cis}(\theta)$?
  5. ¿Qué figura en el plano definen aquellos números complejos que se obtienen al variar $r$ en la forma polar $r\text{cis}(\pi)$?

Puedes practicar más estos temas viendo los videos y haciendo los ejercicios de la página de Khan Academy, de su sección de números complejos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»