Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Álgebra Moderna I: Orden de un elemento y Grupo cíclico

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

En la entrada anterior aprendimos qué es un subgrupo, sus características y hablamos de los subgrupos finitos. Pero en general, si tenemos un conjunto $G$ y escogemos un subconjunto $X$ de $G$, $X$ no tendría por qué ser un subgrupo. A partir de esta entrada comenzaremos a estudiar qué necesitamos agregarle a $X$ para que se vuelva un subgrupo.

Particularmente, ahora hablaremos sobre el orden de un elemento y de cómo este orden puede inducir ciertos grupos y subgrupos. Por ejemplo, definiremos qué es un subgrupo generado por $a$, con $a \in G$.

El orden de un elemento

Definición. (Orden de un elemento)
Sea $G$ un grupo y $a \in G$. Si $a^k = e$ para algún $k \in \mathbb{Z}^+$ decimos que $a$ es de orden finito y en ese caso definimos el orden de $a$ como

$$o(a) = \text{mín}\{k\in \z^+ \,|\, a^k = e\}.$$

En caso contrario decimos que $a$ es de orden infinito.

Ejemplo 1. Sea $\Gamma_8 = \{ \xi^k \, | \, 0 \leq k < 8 \}$ con $\xi=e^{\frac{\pi i}{4}}$. Entonces $o(\xi^2) = 4$.

Ejemplo 2. Consideremos el conjunto $V = \{ (0,0), (1,0), (0,1) (1,1)\}$ con la suma entrada a entrada módulo $2$. Éste se conoce como el grupo de Klein. Tenemos que

  • $o((1,0)) = 2$ ya que $(1,0) \neq (0,0)$ pero $2(1,0) = (1,0) + (1,0) = (0,0)$.
  • $o((0,0)) = 1$, $o((1,0)) = o((0,1)) = o((1,1)) = 2$.

Ejemplo 3. Consideremos $\z$. $o(0) = 1$ y, para toda $a \in \z \setminus \{0\}$, $a$ es de orden infinito.

Lema. Sean $G$ un grupo y $a \in G$ de orden finito. Si $a^k = e$ para alguna $k \in \z$, entonces $o(a)$ divide a $k$.

Demostración.
Sea $a \in G$ de orden finito. Supongamos que $a^k = e$ para algún $k \in \z$.

P.D. $o(a) | k$
Por el algoritmo de la división en $\z$ existen $q,r \in \z$ tales que

\begin{align*}
k &= o(a) \, q + r & \text{con } 0 \leq r < o(a).
\end{align*}

Entonces

\begin{align*}
e &= a^k \\
& = a^{o(a)q + r} \\
& = (a^{o(a)})^q a^r \\
& = e^q a^r \\
& = e a^r \\
& = a^r.
\end{align*}

Así $e = a^r$, con $0 \leq r < o(a)$. Pero $o(a)$ es el mínimo entero positivo tal que al colocarlo como exponente en $a$ da $e$, entonces $r=0$. Por lo tanto $o(a) | k$.

$\blacksquare$

Lema. Sean $G$ un grupo, $a \in G$ de orden finito y $n \in \z^+$. Si se cumple que

  1. $a^n = e$
  2. $a^k = e$ con $k \in \z$ implica que $n|k$

entonces $n = o(a)$.

Demostración.
Sean $G$ un grupo, $a \in G$ de orden finito y $n \in \z^+$ tal que cumple los incisos 1 y 2.

P.D. $n = o(a)$.
Como se cumple el inciso 1, $a^n = e$. Entonces,

$$n \in \{k \in \z^+ \,|\, a^k = e\}.$$


Veamos que $n$ es el elemento mínimo.
Sea $k \in \z^+$ tal que $a^k = e$. Por el inciso 2, se tiene que $n | k$, entonces $|n|\leq |k|$ pero $n, k \in \z^+$ entonces $n\leq k$.

Por lo tanto $n = \text{mín}\{k \in \z^+ \,|\, a^k = e\} = o(a)$.

$\blacksquare$

Los subgrupos cíclicos

Proposición. Sean $G$ un grupo y $a \in G$. El conjunto $\{a^n \,|\, n \in \z\}$ es un subgrupo de $G$.

Notación. A partir de ahora, al conjunto anterior lo denotaremos como $\left< a \right> = \{a^n \,|\, n \in \z\}.$

Demostración de la proposición.
Sean $G$ un grupo y $a \in G$.

P.D. $\left< a\right> \leq G$.

El neutro es $e = a^0 \in \left< a \right>$.

Sean $x, y \in \left< a \right>$. Entonces $x = a^n$ y $y = b^m$ con $n,m \in \z$.

Tenemos que $x y^{-1} = a^n(a^m)^{-1} = a^n a^{-m} = a^{n-m} \in \left< a \right>$.
Por lo tanto $\left< a \right> \leq G$.

$\blacksquare$

Ahora definiremos formalmente lo que usamos antes como Notación.

Definición. Sean $G$ un grupo y $a \in G$. El conjunto

$$\left< a \right> = \{a^n \,|\, n \in \z\}$$

se llama el subgrupo cíclico de $G$ generado por $a$. Decidimos que $G$ es un grupo cíclico si $G= \left< a \right>$ para alguna $a \in G$ y en ese caso decimos que $a$ es un generador de $G$.

Ejemplos

Ejemplo 1. Sea $G = \{\xi^k \,|\, 0 \leq k < 8\}$ con $\xi=e^{\frac{\pi i}{4}}$.
$G$ es un grupo cíclico, pues $G = \left<\xi\right>$ y $\xi$ es un generador de $G$.
El conjugado de $\xi$, $\bar{\xi}$, es otro generador de $G$.
$\{1,i,-1,-i\} = \left< \xi^2 \right>$ es el subgrupo cíclico de $G$ generado por $i$.

Ejemplo 2. Sea $\z = \left< 1\right>$ es un grupo cíclico. $1$ y $-1$ son generadores de $\z$.

Ejemplo 3. Sea $V = \{(0,0), (1,0), (0,1), (1,1)\}$ el grupo de Klein definido al inicio de esta entrada. Tenemos que $\left<(1,0)\right> =\{(1,0),(0,0)\}$ es un subgrupo cíclico de $V$ generado por $(1,0)$. Se puede verificar que los elementos de $V$ generan subgrupos de uno o dos elementos. Por lo tanto $V$ no es cíclico.

Ejemplo 4. Sea $m\in\mathbb{Z}^+$. El conjunto de unidades de $\z_{m}$ se define como las clases módulo $m$ que tienen inverso multiplicativo, o bien $ \{\overline{n} \in \z_{m} \,|\, (n;m)=1\}$ y se denota por $U(\z_{m})$. Se puede probar que éste es un grupo con el producto.

Consideremos ahora el grupo $U(\z_{10}) = \{\overline{n} \in \z_{10} \,|\, (n;10)=1\}$.

Tenemos que $U(\z_{10}) = \{\overline{1}, \overline{3}, \overline{7}, \overline{9}\}$.
Como $\overline{3}^2 = \overline{9}$ y $\overline{3}^3 = \overline{27} = \overline{7}$, entonces

\begin{align*}
\overline{3}^4 &= \overline{3}^3 \, \overline{3} \\
&= \overline{7}\, \overline{3} \\
&= \overline{21} \\
&= \overline{7}.
\end{align*}
Así, $U(\z_{10}) = \left<\overline{3} \right>$ y $U(\z_{10})$ es cíclico.

Tarea moral

  1. Sea $G= GL(2, \mathbb{Q})$ (recuerda las definiciones en los ejemplos importantes de matrices). Considera las matrices
    $A = \begin{pmatrix}0 & -1 \\ 1 & 0 \end{pmatrix}$, $B = \begin{pmatrix}0 & 1 \\ -1 & 1 \end{pmatrix}.$
    Muestra que $A$ y $B$ tienen orden finito pero $AB$ no.
  2. Prueba que las siguientes 4 matrices forman un grupo multiplicativo y encuentra el orden de cada elemento.
    $\begin{pmatrix}1 & 0 \\ 0 & 1 \end{pmatrix}$, $\begin{pmatrix} -1 & 0 \\ 0 & -1 \end{pmatrix}$, $\begin{pmatrix}1 & 0 \\ 0 & -1 \end{pmatrix}$, $\begin{pmatrix}-1 & 0 \\ 0 & 1 \end{pmatrix}.$
  3. Prueba o da un contraejemplo: Si $a^k = e$, entonces $k$ es el orden de $a$.
  4. Considera el grupo diédrico formado por las simetrías de un hexágono. Sea $R$ la rotación de $\frac{2 \pi}{3}$.
    • Determina el orden de $R$.
    • Encuentra otros cincos valores $k$ enteros tales que $R^k = id$ y analiza si existe alguna relación entre $o(a)$ y estos valores de $k$.

Más adelante…

Ahora ya conocemos el subgrupo generado por $a$. En las siguientes entradas profundizaremos en las características de éste, definiremos el orden de un grupo y la relación que podemos encontrar entre ambos.

Entradas relacionadas

Variable Compleja I: Forma Polar. Potencias en $\mathbb{C}$

Por Pedro Rivera Herrera

Introducción

Hasta ahora hemos descrito la forma en que asociaremos los números complejos, pensados como pares ordenados de números reales, con puntos en el plano complejo utilizando un sistema de coordenadas cartesianas en el que el eje de las abscisas corresponde al eje real y el eje de las ordenadas al eje imaginario. Esto nos permitió darle una representación geométrica a los números complejos como vectores en el plano complejo con sus operaciones definidas.

De acuerdo con nuestros cursos de Geometría Analítica sabemos que, en el plano, un punto $P$ de coordenadas $(x,y)$ puede representarse en el sistema de coordenadas polares si se considera su forma polar $(r, \theta)$, donde $r$ determina la distancia del punto al origen y $\theta$ la dirección de $P$. La principal motivación de realizar un cambio de variables es que las coordenadas polares nos permitirán realizar una mejor representación e interpretación geométrica de los números complejos.

Forma polar de un número complejo.

Observación 4.1.
Debemos recordar que a diferencia de las coordenadas cartesianas, no existe una relación biunívoca entre los puntos del plano y las coordenadas polares que los representan, esto es porque un punto $P$ puede estar representado por un par cualquiera de un número infinito de pares de coordenadas polares desde que $\theta$ y $\theta + 2\pi n$, $n\in\mathbb{Z}$ representan al mismo ángulo, es decir que el ángulo asociado con un punto no es único y por tanto las coordenadas $(r,\theta)$ y $(r,\theta+2\pi n)$, $n\in\mathbb{Z}$, nos determinan al mismo punto $P$.

Sabemos que las coordenadas polares y las coordenadas cartesianas satisfacen las siguientes relaciones:
\begin{equation*}
y = r \, \text{sen}(\theta),
\end{equation*}

\begin{equation*}
x = r \, \text{cos}(\theta).
\end{equation*}

\begin{equation*}
r = \sqrt{x^2 + y^2},
\end{equation*}

\begin{equation*}
\theta = \text{arc tan}\left(\frac{y}{x}\right), \,x\neq0.
\end{equation*}

Utilizando lo anterior como motivación, consideremos la siguiente:

Definición 4.1. (Argumentos de un número complejo.)
Sea $z \in \mathbb{C}$ con $z \neq 0$. Un argumento de $z$, denotado como $\theta$, es el ángulo formado por el vector $z$, el cual parte del origen, con el eje real, figura 7. Entonces diremos que el argumento de $z$, denotado como $\operatorname{arg}\,z$, está definido, módulo $2\pi$, como el número $\theta$ para el cual:

\begin{align*} \text{sen}(\theta) = \frac{\text{Re}(z)}{|\, z \,|},\\ \text{cos}(\theta) = \frac{\text{Im}(z)}{|\, z \,|}. \tag{4.1} \end{align*}

No se debe confundir la notación designada para este ángulo, ya que no es una función, por lo que omitiremos los paréntesis.

Figura 7: Forma polar de un número complejo $z$.

Observación 4.2.
Es importante notar que el argumento de un número complejo no es único desde que las funciones sen$(\theta)$ y cos$(\theta)$ son $2 \pi$-periódicas, es decir, para un número complejo $z$ que tenga un argumento $\theta_0$, entonces necesariamente los ángulos $\theta_0 \pm 2\pi, \theta_0 \pm 4\pi, \ldots$, son también argumentos de $z$, es decir, el símbolo $\text{arg} \, z$ representa un conjunto de posibles valores que puede tomar el ángulo $\theta$.

Definición 4.2. (Forma polar de un número complejo.)
Sea $z=x+iy \in \mathbb{C}$ con $z \neq 0$. La representación en coordenadas polares de $z$ está dada por:
\begin{align*}
x = r \, \operatorname{cos}(\theta),\\
y = r \, \operatorname{sen}(\theta),
\end{align*}

donde $r = |\, z \,|$ y $\theta =\operatorname{arg} \, z$. Entonces la forma polar de $z$ está dada por:
\begin{equation*}
z = r\,\left( \operatorname{cos}(\theta) + i \, \operatorname{sen}(\theta) \right).
\end{equation*}

Es claro que escribir $\operatorname{arg}\,z = \theta + 2\pi n$ o simplemente $\operatorname{arg}\,z = \theta$ es un abuso de notación, pero es común encontrar estas expresiones para denotar a un argumento en específico, es decir a un ángulo paticular que satisface las condiciones de (4.1).

Observación 4.3.
A partir de ahora usaremos la siguiente notación:
\begin{equation*}
\operatorname{cis}(\theta) = \operatorname{cos}(\theta) + i \, \operatorname{sen}(\theta).
\end{equation*}

Así:
\begin{equation*}
z = r \, \operatorname{cis}(\theta).
\end{equation*}

En la práctica es común encontrar al argumento de $z$ mediante:
\begin{equation*}
\operatorname{tan}(\theta) = \frac{y}{x} \quad \Longrightarrow \quad \theta = \operatorname{arc tan}\left(\frac{y}{x}\right), \, \, x\neq 0.
\end{equation*}

Sin embargo, dado que la función $\operatorname{tan}(\theta)$ es $\pi$-periódica, debemos tener cuidado al utilizar esta última ecuación. Recordemos que $\operatorname{arc\,tan}\left(\frac{y}{x}\right) \in \left(-\frac{\pi}{2}, \frac{\pi}{2}\right)$, por lo que para cualquier $z \in \mathbb{C}$, $z\neq 0$, es necesario dar un argumento que sea consistente con la región en el plano en la que se encuentra dicho número, esto porque a veces será necesario sumar o restar $\pi$ a un argumento $\operatorname{arc tan}\left(\frac{y}{x}\right)$ con la finalidad de ajustarlo con el cuadrante adecuado.

Definición 4.3. (El argumento principal de un número complejo.)
El argumento principal de un número complejo $z \neq 0$, denotado por $\operatorname{Arg} \, z$, es el único ángulo del conjunto $\operatorname{arg}\,z$ tal que $-\pi < \operatorname{Arg} \, z \leq \pi$.

De la definición 4.3 y la observación 4.2 se sigue que: \begin{equation*} \operatorname{arg}\, z = \{ \operatorname{Arg}\, z + 2\pi n \, : \, n\in\mathbb{Z}\}, \end{equation*}

de donde es claro que para un número complejo $z\neq 0$ se tiene una infinidad de argumentos. Además, en el caso de que $z$ sea un número real negativo, se tiene que el argumento principal de $z$ es justamente $\pi$.

Observación 4.4.
Usualmente un argumento de un número complejo $z\neq0$ se toma en intervalos semiabiertos de la forma: \begin{equation*} (2n-1)\pi < \operatorname{arg}\, z \leq (2n+1)\pi, \quad n \in \mathbb{Z},\tag{4.2} \end{equation*} \begin{equation*} 2n\pi \leq \operatorname{arg}\, z < 2(n+1)\pi, \quad n \in \mathbb{Z}. \tag{4.3} \end{equation*}

Por lo que, el argumento principal de $z$, es decir $\text{Arg} \, z$, queda definido, tomando $n=0$ en (4.2), como el ángulo tal que:
\begin{equation*}
\text{tan}(\text{Arg}\, z) = \frac{y}{x}, \quad -\pi < \text{Arg}\, z \leq \pi.
\end{equation*}

Ejemplo 4.1.
Considera los siguientes números complejos y encuentra su forma polar considerando su argumento principal:

  • a) $ \quad z_1 = -1 + i \, \sqrt{3}$.
  • b) $ \quad z_2 = -\sqrt{3} – i$.
  • c) $ \quad z_3 = i$ y $z_4 = -i$.

Solución. Primeramente grafiquemos los números en el plano complejo.

Figura 8: Gráficas de los números complejos $z_1$ y $z_2$ con sus argumentos.

Figura 9: Gráficas de los números complejos $z_3$ y $z_4$ con sus argumentos.

  • a) Tenemos que:

\begin{align*}
r_1 = |\,z_1\,| = \sqrt{(-1)^2 + \left(\sqrt{3}\right)^2} = 2,\\
\theta_1 = \text{arc tan}\left(-\sqrt{3}\right) = -\frac{\pi}{3}.
\end{align*}

De acuerdo con la figura 8(a), notamos que el número complejo $z_1$ se encuentra en el segundo cuadrante, mientras que utilizando la función $\text{arc tan}\left(\frac{y}{x}\right)$ se tiene un argumento $\theta_1 = -\frac{\pi}{3}$, el cual se encuentra en el cuarto cuadrante, por lo que una solución que satisface la condición de ser el argumento principal está dada por:
\begin{equation*}
\text{Arg}\,z_1 = \theta_1 + \pi = -\frac{\pi}{3} + \pi = \frac{2\pi}{3}
\end{equation*}

ya que:
\begin{equation*}
-\pi<\text{Arg}\,z_1 \leq \pi,
\end{equation*}

y además:
\begin{equation*}
\text{tan}\left( \text{Arg}\,z_1 \right) = \text{tan}\left( \frac{2\pi}{3}\right) = \frac{\sqrt{3}}{-1} = -\sqrt{3}.
\end{equation*}

Por lo tanto, considerando su argumento principal, tenemos que la forma polar de $z_1$ está dada por:
\begin{equation*}
z_1 = 2\,\text{cis}\left( \frac{2\pi}{3} \right).
\end{equation*}

Mientras que:
\begin{equation*}
\text{arg}\,z = \text{Arg}\,z + 2\pi n = -\frac{5\pi}{6} + 2\pi n, \quad n\in \mathbb{Z}.
\end{equation*}

  • b) Tenemos que:

\begin{align*}
r_2 = |\,z_2\,| = \sqrt{\left(-\sqrt{3}\right)^2 + (-1)^2} = 2,\ \theta_2 = \text{arc tan}\left(\frac{-1}{-\sqrt{3}}\right) = \frac{\pi}{6}.
\end{align*}

Considerando ahora la gráfica 8(b) notamos que $z_2$ se encuentra en el tercer cuadrante, mientras que el argumento $\theta_2 = \frac{\pi}{6}$, dado por la función $\text{arc tan}\left(\frac{y}{x}\right)$, se encuentra en el primer cuadrante, por lo que no coincide con la ubicación de $z_2$ en el plano. Podemos encontrar entonces al argumento principal de $z_2$ como:
\begin{equation*}
\text{Arg}\,z_2 = \theta_1 – \pi = \frac{\pi}{6} – \pi = -\frac{5\pi}{6},
\end{equation*}

ya que:
\begin{equation*}
-\pi<\text{Arg}\,z_2 \leq \pi,
\end{equation*}

y además:
\begin{equation*}
\text{tan}\left( \text{Arg}\,z_2 \right) = \text{tan}\left( -\frac{5\pi}{6}\right) = \frac{-1}{-\sqrt{3}} = \frac{1}{\sqrt{3}}.
\end{equation*}

Por lo tanto, considerando su argumento principal, tenemos que la forma polar de $z_1$ está dada por:
\begin{equation*}
z_2 = 2\,\text{cis}\left( -\frac{5\pi}{6} \right).
\end{equation*}

Mientras que:
\begin{equation*}
\text{arg}\,z = \text{Arg}\,z + 2\pi n = -\frac{5\pi}{6} + 2\pi n, \quad n\in \mathbb{Z}.
\end{equation*}

  • c) Tenemos que para $z_3 = i$ y $z_4 = -i$:

\begin{equation*}
r_3 = r_4 = |\, z_3 \,| = |\, z_4 \,| = \sqrt{0^2 + (\pm1)^2} = 1.
\end{equation*}

De acuerdo con las figuras 9(a) y 9(b), observamos que en ambos casos la parte real de los respectivos números complejos es igual a cero, por lo que debemos analizar qué sucede en este caso, aunque de manera gráfica es claro que es posible determinar algunos argumentos para $z_3$ y $z_4$.

Sabemos que la función $\text{tan}(x)$ es continua e invertible en $\left(-\frac{\pi}{2}, \frac{\pi}{2}\right)$ y además se cumple que:
\begin{align*}
\lim_{\text{Arg}\,z \to \left(\frac{\pi}{2}\right)^+} \text{tan}(\text{Arg}\,z) = + \infty.\\
\lim_{x \to 0^+} \frac{y}{x} =
\left\{ \begin{array}{lcc}
+ \infty & si & y>0, \\
\\ – \infty & si & y<0.
\end{array}
\right.
\end{align*}

Por lo que usando la inversa de la función $\text{tan}(x)$ tenemos que:
\begin{equation*}
\lim_{x \to 0^+} \text{arc tan}\left(\frac{y}{x}\right) = \left\{ \begin{array}{lcc} \frac{\pi}{2} & si & y>0,\\
– \frac{\pi}{2} & si & y<0.
\end{array} \right.
\end{equation*}

Lo anterior nos deja ver que en el caso en que $x=0$, el signo de $y$ determinará el valor del argumento principal, es decir:
\begin{align*}
\text{Arg}\,z_3 = \frac{\pi}{2},\\
\text{Arg}\,z_4 = -\frac{\pi}{2}.
\end{align*}

los cuales claramente satisfacen la definición 4.3. Entonces, utilizando el argumento principal de $z_3$ y $z_3$ tenemos que la forma polar de cada uno es respectivamente:
\begin{align*}
z_3 = \text{cis}\left(\frac{\pi}{2}\right),\\
z_4 = \text{cis}\left(\frac{-\pi}{2}\right).
\end{align*}

Los ejemplos anteriores nos dejan ver que para determinar el argumento principal de un número complejo debemos identificar el cuadrante en el que se encuentra dicho número y verificar que se satisfagan las condiciones dadas en la observación 4.4, por lo que para obtener el argumento principal de un número complejo $z\neq 0$, con $z = x + iy$ podemos considerar los siguientes casos:

  1. Si $x > 0$, entonces $\text{Arg}\,z = \text{arc tan}\left(\frac{y}{x}\right)$.
  2. Si $x < 0$ y $y>0$, entonces $\text{Arg}\,z = \text{arc tan}\left(\frac{y}{x}\right) + \pi$.
  3. Si $x < 0$ y $y<0$, entonces $\text{Arg}\,z = \text{arc tan}\left(\frac{y}{x}\right) – \pi$.
  4. Si $x = 0$ y $y>0$, entonces $\text{Arg}\,z = \frac{\pi}{2}$.
  5. Si $x = 0$ y $y<0$, entonces $\text{Arg}\,z = -\frac{\pi}{2}$.
  6. Si $y = 0$ y $x>0$, entonces $\text{Arg}\,z = 0$.
  7. Si $y = 0$ y $x<0$, entonces $\text{Arg}\,z =\pi$.

Analicemos estos casos de manera gráfica:

Figura 10: Caso 1. Gráficas de un números complejo $z=x+iy$ tal que $x>0$.

Figura 11: Caso 2. Gráfica de un número complejo $z$ ubicado en el segundo cuadrante, es decir $z$ tal que $x<0$ y $y>0$.
Figura 12: Caso 3. Gráfica de un número complejo $z=x+iy$ ubicado en el tercer cuadrante, es decir $z$ tal que $x<0$ y $y<0$.
Figura 13: Caso 4. Gráfica de un número complejo $z=x+iy$ tal que $x=0$ y $y>0$.
Figura 14: Caso 5. Gráfica de un número complejo $z=x+iy$ tal que $x=0$ y $y<0$.
Figura 15: Caso 6. Gráfica de un número complejo $z=x+iy$ tal que $y=0$ y $x>0$.
Figura 16: Caso 7. Gráfica de un número complejo $z=x+iy$ tal que $y=0$ y $x<0$.

Por lo que para un número complejo $z \neq 0$, con $z=x+iy$, podemos encontrar su argumento principal como:

\begin{equation*}
\text{Arg}\,z= \left\{ \begin{array}{lcc}
\text{arc tan}\left(\frac{y}{x}\right) & \text{si} & x>0,\\
\\ \text{arc tan}\left(\frac{y}{x}\right) + \pi & \text{si} & x<0 \quad \text{y} \quad y>0,\\
\\ \text{arc tan}\left(\frac{y}{x}\right) – \pi & \text{si} & x<0 \quad \text{y} \quad y<0,\\
\\ \frac{\pi}{2} & \text{si} & x=0 \quad \text{y} \quad y>0,\\
\\ -\frac{\pi}{2} & \text{si} & x=0 \quad \text{y} \quad y<0,\\
\\ 0 & \text{si} & x>0 \quad \text{y} \quad y=0,\\
\\ \pi & \text{si} & x<0 \quad \text{y} \quad y=0.\\
\end{array}
\right.
\end{equation*}

Observación 4.5.
Hasta ahora solo hemos considerado los casos en que $z\neq0$, pero ¿qué pasa si $z = 0$? Para responder esta pregunta basta ver que para $z = 0$ se tiene: \begin{equation*} r = |\,z\,| = 0, \quad \operatorname{Re}(z) = 0, \quad \operatorname{Im}(z) = 0, \end{equation*} por lo que no existe un argumento $\theta\in\mathbb{R}$ que satisfaga las ecuaciones (4.1).

Sin embargo, dado que para cualquier $\theta\in\mathbb{R}$ se cumple que: \begin{equation*} 0 = 0 \operatorname{cis}(\theta), \end{equation*} en ocasiones suele plantearse que cualquier número real $\theta$ puede ser un argumento de $z=0$.

Para los fines del curso nos quedaremos con el primer planteamiento, es decir, para $z=0$ diremos que su argumento no está definido.

Figura 17: Circunferencia unitaria en $\mathbb{C}$ con los argumentos principales de algunos números complejos, considerando a los ángulos en el sentido positivo convencional.

Expresar un número complejo en su forma polar nos permite analizar mejor, en un sentido geométrico, al producto y el cociente de dos números complejos, esto es, sean $z_1 = r_1\,\text{cis}(\theta_1)$ y $z_2 = r_2 \, \text{cis}(\theta_2)$ dos números complejos distintos de cero, con $r_i = |\,z_i\,|$ y $\theta_i = \text{arg} \, z_i$ para $i=1,2$, entonces:
\begin{align*} z_1 z_2 &= \left[ r_1 \text{cis}(\theta_1)\right] \left[ r_2 \text{cis}(\theta_2) \right]\\
&= \left[ r_1 \,\text{cos}(\theta_1) + i\, r_1 \, \text{sen}(\theta_1)\right] \left[ r_2\, \text{cos}(\theta_2) + i\,r_2\,\text{sen}(\theta_2) \right]\\
&= r_1 \, r_2\, \text{cos}(\theta_1) \, \text{cos}(\theta_2) – r_1 \, r_2\, \text{sen}(\theta_1) \,\text{sen}(\theta_2) + i \, \left[ r_1 \, r_2\,\text{sen}(\theta_1) \, \text{cos}(\theta_2) + r_1 \, r_2\,\text{cos}(\theta_1)\, \text{sen}(\theta_2) \right]\\
&= r_1 \, r_2\, \left [\text{cos}(\theta_1 + \theta_2) + i \, \text{sen}(\theta_1 + \theta_2) \right]\\
&= r_1 \, r_2\, \text{cis}(\theta_1 + \theta_2).
\end{align*}

De lo anterior tenemos que el módulo del producto de dos números complejos, $z_1 z_2$, es el producto de sus módulos, mientras que el argumento del producto queda determinado, salvo múltiplos de $2 \, \pi$, como la suma de los argumentos, es decir:
\begin{align*}
|\, z_1 z_2 \,| = r_1 r_2 = | \, z_1 \, | | \, z_2|, \\
\text{arg}\,z_1 z_2 = \theta_1 + \theta_2 =\text{arg}\,z_1 + \text{arg}\,z_2.
\end{align*}

Entonces: \begin{equation*} \operatorname{arg}\,z_1 z_2 = \left\{ \theta_1 + \theta_2 + 2\pi n \, : \, n\in\mathbb{Z}\right\}, \end{equation*} donde $\theta_1$ y $\theta_2$ son ángulos particulares tales que satisfacen las ecuaciones (4.1) respectivamente.

Geométricamente tenemos que:

Figura 18: Producto de dos números complejos en su forma polar.

Por otra parte, utilizando la definición del cociente es fácil obtener que:
\begin{align*}
\frac{z_1}{z_2} &=\frac{r_1}{r_2} \, \text{cis}(\theta_1 – \theta_2),
\end{align*}

de donde concluimos que el módulo del cociente de dos números complejos, $\dfrac{z_1}{z_2}$, es el cociente de los módulos, mientras que el argumento del cociente queda determinado, salvo múltiplos de $2 \, \pi$, como la diferencia de los argumentos, es decir:
\begin{align*}
\left|\, \frac{z_1}{z_2} \,\right| = \frac{r_1}{r_2} = \frac{| \, z_1 \, |}{| \, z_2 \, |},\\ \text{arg}\, \frac{z_1}{z_2} = \theta_1 – \theta_2 =\text{arg}\,z_1 – \text{arg}\,z_2. \end{align*}

Entonces: \begin{equation*} \operatorname{arg}\,\frac{z_1}{z_2} = \left\{ \theta_1 – \theta_2 + 2\pi n \, : \, n\in\mathbb{Z}\right\}, \end{equation*} donde $\theta_1$ y $\theta_2$ son ángulos particulares tales que satisfacen las ecuaciones (4.1) respectivamente.

Considerando lo anterior, tenemos que:

Observación 4.6.
Si $z_1 = z_2$, entonces:
\begin{align*}
z_1^2 & = z_1 z_1\\
& = r_1 \, r_1 \, \text{cis}(\theta_1 + \theta_1)\\
& = r_1^2 \, \text{cis}(2 \theta_1).
\end{align*}

\begin{align*}
z_1^3 & = z_1 z_1^2\\
& = r_1 \, r_1^2 \, \text{cis}(\theta_1 + 2\theta_1)\\
& = r_1^3 \, \text{cis}(3 \theta_1).
\end{align*}

Lo cual nos deja ver que podemos proceder por inducción y generalizar el resultado para $n\geq1$.

Observación 4.7.
Es importante hacer aquí la siguiente convención. Para todo $z\in\mathbb{C}$, se tiene que $z^0 = 1$.

Proposición 4.1. (Fórmula de De Moivre.)
Sea $z \in \mathbb{C}$ tal que $z \neq 0$. Considerando a $r$ y $\theta$ como el módulo y el argumento de $z$, respectivamente, entonces:
\begin{equation*}
z^n = r^n \, \text{cis}(n\theta), \quad n\in\mathbb{N}.
\end{equation*}

Demostración. Dadas las hipótesis, procedemos a realizar la prueba por inducción sobre $n$, primeramente notemos que para $n=0$ se sigue que:
\begin{align*}
z^0 & = r^0 \, \text{cis}(0)\\
& = 1 \, \left[\text{cos}(0) + i\, \text{sen}(0) \right]\\
& = 1 \, \left[1 + i\, 0 \right]\\ & = 1.
\end{align*}

Lo cual satisface la convención establecida en la observación 4.7.

Entonces, de acuerdo con la observación 4.6, tenemos que se cumple para $n=0,1,2,3$. Supongamos que se cumple para $n=k$, para algún $k \in \mathbb{N}$. Tenemos que:
\begin{align*}
z^{k+1} & = z^k z\\
& = \left[ r^k \, \text{cis}(k\theta) \right] \left[ r \, \text{cis}(\theta) \right]\\
& = r^k \, r \left[\text{cos}(k\theta) + i\,\text{sen}(k\theta) \right] \left[\text{cos}(\theta) + i\,\text{sen}(\theta) \right]\\
& = r^{k+1} \left[\text{cos}(k\theta)\, \text{cos}(\theta) – \text{sen}(k\theta)\, \text{sen}(\theta) + i\{\, \text{cos}(k\theta)\,\text{sen}(\theta) + \text{sen}(k\theta) \, \text{cos}(\theta)\} \right]\\
& = r^{k+1} \left[\text{cos}(k\theta + \theta) + i \, \text{sen}(k\theta + \theta)\right]\\
& = r^{k+1} \text{cis}\left(\left[k+1\right]\theta\right).
\end{align*}

Por lo que se cumple para $n=k+1$, por lo tanto se cumple para toda $n\in\mathbb{N}$.

$\blacksquare$

Es interesante notar que la fórmula de De Moivre se cumple en general para los números enteros, para esto veamos que se cumple para $n\in\mathbb{Z}^-$. Recordemos que para un número complejo $z\neq0$, su inverso multiplicativo se puede calcular como:
\begin{equation*}
z^{-1} = \frac{\overline{z}}{|\,z\,|^2}.
\end{equation*}

Consideremos a $z$ en su forma polar, es decir $z=r\,\text{cis}(\theta)$, con $r$ su módulo y $\text{arg}\,z = \theta$, entonces:
\begin{align*}
z^{-1} & = \frac{\overline{r\,\text{cis}(\theta)}}{r^2}\\
& = \frac{r \left(\overline{\text{cos}(\theta) + i\,\text{sen}(\theta)}\right)}{r^2}\\
& = r^{-1}\left(\text{cos}(\theta) – i\,\text{sen}(\theta)\right)\\
& = r^{-1}\left[\text{cos}(-\theta) + i\,\text{sen}(-\theta)\right]\\
& = r^{-1}\text{cis}(-\theta).
\end{align*}

De acuerdo con esta última igualdad, notemos que para $m\in\mathbb{Z}^-$ podemos reescribir:
\begin{equation*}
m=-n=(-1)n=n(-1), \quad n\in\mathbb{N^+},
\end{equation*}

entonces:
\begin{align*}
z^{m} & = \left(z^n\right)^{-1}\\
& = \left(r^n\,\text{cis}(n\theta)\right)^{-1}\\
& = \frac{\overline{r^n\,\left[\text{cos}(n\theta) + i\,\text{sen}(n\theta) \right]}}{\left(r^n\right)^2}\\
& = \frac{r^n\left[\text{cos}(n\theta) – i\,\text{sen}(n\theta) \right]}{r^{2n}}\\
& = r^{-n}\left[\text{cos}(-n\theta) + i\,\text{sen}(-n\theta) \right]\\
& = r^{m}\,\text{cis}(m\theta).
\end{align*}

Corolario 4.1.
Sea $z\neq0$ un número complejo, considerando su forma polar, $z=r\,\text{cis}(\theta)$, con $r=|\,z\,|$ y $\theta=\text{arg}\,z$, entonces:
\begin{equation*}
z^n = r^n\text{cis}(n\theta), \quad \forall n \in \mathbb{Z}.
\end{equation*}

$\blacksquare$

Tomando a $r=1$, notamos que la fórmula de De Moivre nos dice que para toda $n \in \mathbb{Z}$:
\begin{align*} \text{cis}(n\theta) & = \text{cos}(n\theta) + i\,\text{sen}(n\theta)\\
& = \left[\text{cos}(\theta) + i\,\text{sen}(\theta)\right]^n\\
& = \text{cis}^n(\theta).
\end{align*}

Además es fácil concluir por inducción que para $z\neq 0$ se cumple para toda $n \in\mathbb{Z}$:
\begin{equation*}
|\,z^n\,| = |\, z \,|^n, \quad \operatorname{arg}\,z^n = n\, \operatorname{arg}\,z,\,\, \text{módulo}\,2\pi.
\end{equation*}

Ejemplo 4.2.
Sea $z=\sqrt{3} + i$. Hallar $z^7$.

Solución. Primeramente expresemos a $z$ en su forma polar. Tenemos que $r = |\,z\,|=2$.

Por otra parte notemos que $z$ se ubica en el primer cuadrante, figura 19, por lo que:
\begin{align*}
\text{Arg}\,z = \text{arc tan}\left(\frac{1}{\sqrt{3}}\right) = \frac{\pi}{6}.\\ \text{arg}\,z = \frac{\pi}{6} + 2\pi n, \quad \forall n \in \mathbb{Z}.
\end{align*}

En general sabemos que $z = r\,\text{cis}(\text{arg}\,z)$, por lo que considerando su argumento principal, $\text{Arg}\,z$, es decir $n=0$, tenemos que la forma polar de $z$ es:
\begin{equation*}
z = 2 \, \text{cis}\left(\frac{\pi}{6}\right).
\end{equation*}

De acuerdo con la fórmula de De Moivre:
\begin{align*}
z^7 & = 2^7 \, \text{cis}\left(\frac{7\pi}{6}\right)\\
& = 2^7 \left[ -\frac{\sqrt{3}}{2} – i \frac{1}{2}\right]\\
& = -64\left(\sqrt{3}+i\right).
\end{align*}

Figura 19: Gráfica del número complejo $z=\sqrt{3} + i$ en el plano complejo.

Tarea moral

  1. ¿Consideras que sea necesario pedir que $z\neq0$ en la definición 4.2?
  2. De acuerdo con la observación 4.5 ¿Por qué consideras que para $z=0$ el argumento de $z$ puede ser cualquier constante?
  3. Para $z_1, z_2\in\mathbb{C}$, distintos de cero, al expresarlos en su forma polar concluimos que: \begin{equation*} \frac{z_1}{z_2} = \frac{r_1}{r_2} \, \text{cis}(\theta_1 – \theta_2). \end{equation*} Realiza el desarrollo completo para obtener dicho resultado ¿Cómo podemos representar dicho resultado de manera geométrica? Haz un diagrama.
  4. ¿Consideras necesario realizar la convención de la observación 4.7?
  5. Utilizando los resultados de la entrada resuelve lo siguiente:
  • a) Considerando el argumento principal y otro argumento distinto del principal expresa en su forma polar a $z = \dfrac{12}{\sqrt{3}+i}$.
  • b) El número complejo $z =10\,\text{cis}\left(\dfrac{\pi}{5}\right)$ está dado en su forma polar. Exprésalo en su forma $z=a+ib$.
  • c) Muestra que:
    \begin{equation*}
    \left(\dfrac{1+i\,\text{tan}(\theta)}{1-i\,\text{tan}(\theta)}\right)^n = \dfrac{1+i\,\text{tan}(n\theta)}{1-i\,\text{tan}(n\theta)}
    \end{equation*}
  • d) Prueba que:
    \begin{equation*}
    \left(\dfrac{1+\operatorname{sen}(\theta) + i\, \operatorname{cos}(\theta)}{1+\operatorname{sen}(\theta) – i\, \operatorname{cos}(\theta)}\right)^n = \operatorname{cos}\left(\dfrac{n\pi}{2} – n\theta\right) + i \operatorname{sen}\left(\dfrac{n\pi}{2} – n\theta\right).
    \end{equation*}
  1. Considera a los números complejos $z = 1+i\sqrt{3}$ y $w=1-3i$. Realiza las siguientes operaciones:
  • a) $ \quad z^4w^2$.
  • b) $ \quad \left(\dfrac{z}{w}\right)^5$.

Más adelante…

Hemos visto que mediante la forma polar de un número complejo es posible interpretar mejor, desde un sentido geométrico, a las operaciones entre números complejos.

Además, considerar a un número complejo en su forma polar nos permitió obtener nuevas relaciones que cumplen las potencias enteras de los números complejos en términos de sus módulos y sus argumentos, en particular obtuvimos la fórmula de De Moivre, la cual resultó de gran utilidad para operar con números complejos.

La siguiente entrada continuaremos trabajando a los números complejos desde una perspectiva geométrica y retomaremos la forma polar de un número complejo para dar solución a ecuaciones de la forma $w^n=z$, introduciendo primeramente el concepto de la raíz de un número complejo.

Entradas relacionadas

Probabilidad I-Videos: Distribución binomial

Por Aurora Martínez Rivas

Introducción

Esta vez, nos enfocaremos en el estudio de la distribución discreta: asociada a las variables aleatorias que surgen, al tratar con repeticiones de ensayos Bernoulli independientes y que consisten en determinar el número total de éxitos sin importar su orden. Esta distribución se conoce como distribución binomial.

Distribución binomial

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE 104721: “Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM”. Sitio web del proyecto: https://www.matematicasadistancia.com.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Demuestra que la función de probabilidad asociada a la distribución binomial es efectivamente una función de probabilidad.
  • Sea $X$ una variable aleatoria tal que $X\sim binomial\left ( n,p\right ) $, demuestra que cuando $k$ pasa de 0 a n.$\ P(X=k)$ primero aumenta monótonamente y luego disminuye monótonamente alcanzando su valor más grande cuando $k$ es el entero más grande menor o igual que $(n+1)p$.
  • Basándote en la demostración del inciso anterior, da una relación recursiva entre las probabilidades asociadas con valores sucesivos de $X$ y con ella encuentra $P(X<4)$ cuando $X\sim binomial\left ( 50,.4\right ) $.
  • Demuestra que si $X$ es una variable aleatoria tal que $X\sim binomial\left ( n,p\right ) $, entonces la función de masa de probabilidad $f_X\left ( k\right ) $ tiene la siguiente propiedad: $f\left ( k-1\right ) f\left ( k+1\right ) \le f\left ( k\right ) ^2$.
  • Sea $X$ una variable aleatoria tal que $X\sim binomial\left ( n,p\right ) $, encuentra la distribución de probabilidad de $n-X$.

Más adelante…

La distribución binomial, es utiliza para la Estimación de probabilidades: asociadas a resultados, en cualquier subconjunto de ensayos que impliquen éxitos o fracasos. Así, como para estimar probabilidades asociadas a juegos de azar.

Por sus aplicaciones en la teoría de probabilidad y estadística, la distribución binomial es probablemente la de uso más frecuente entre las distribuciones discretas,

Entradas relacionadas

Ecuaciones Diferenciales I: Demostración del Teorema de Existencia y Unicidad de Picard – Lindelöf

Por Omar González Franco

Si la gente no cree que las matemáticas son simples, es solo
porque no se dan cuenta de lo complicado que es la vida.
– John Louis von Neumann

Introducción

¡Hemos llegado al final de la primera unidad de este curso!.

Concluiremos con la demostración de uno de los teoremas más importantes dentro del campo de las ecuaciones diferenciales; el teorema de existencia y unicidad de Picard – Lindelöf. Pero antes, un poco de contexto histórico.

Este resultado fue estudiado y desarrollado entre los años 1820 y 1900 por Cauchy, Liouville, Lipschitz, Picard y Lindelöf. Entre 1820 y 1830 Cauchy probó que si $f = f(x, y)$ es una función continua y existe su derivada parcial $\dfrac{df}{dy}$ continua en cierta región $U \subset \mathbb{R}^{2}$ que contiene el punto $(x_{0}, y_{0})$, entonces existe un intervalo $\delta$ en el que un problema de valor inicial posee una única solución definida en $\delta$.

En 1838, Liouville simplificó la prueba de Cauchy introduciendo el método de las aproximaciones sucesivas, que más tarde continuarían siendo desarrolladas por Picard y que se conocerían como iterantes de Picard.

En 1876, Lipschitz mejoraría el resultado de Cauchy, sustituyendo la condición de que exista la derivada continua de $f$ por una menos fuerte, conocida como condición de Lipschitz.

Posteriormente, todo lo anterior fue ligeramente mejorado y generalizado por Picard (1890) y Lindelöf (1893), siguiendo las mismas ideas dadas por Liouville y Lipschitz.

Actualmente el método y los resultados se les atribuyen a Picard conociéndose como método de las iterantes de Picard y teorema de Picard (o más generalmente, teorema de Picard – Lindelöf).

En las dos últimas entradas hemos presentado una teoría preliminar con todas las herramientas necesarias para demostrar el teorema de Picard – Lindelöf, sin más, demostremos el teorema.

Teorema de existencia y unicidad de Picard – Lindelöf

El resultado global del teorema de existencia y unicidad de Picard – Lindelöf es el siguiente.

Demostración del teorema de Picard – Lindelöf

Sea $\delta = [a, b]$. Como cualquier función $y: \delta \rightarrow \mathbb{R}$ tiene su gráfica en $U$ y por hipótesis $f$ es continua en $U$, tenemos, como consecuencia del teorema sobre la ecuación integral, que $y: \delta \rightarrow \mathbb{R}$ es solución del PVI si y solo si $y(x)$ es una función continua en $\delta$ y para cada $x \in \delta$ verifica la ecuación integral

$$y(x) = y_{0} + \int_{x_{0}}^{x} f(t, y(t))dt \label{2} \tag{2}$$

Necesitamos probar que esta ecuación integral sólo posee una solución continua. Para ello, al ser $U$ una banda vertical, podemos definir sin problema alguno las iterantes de Picard $y_{n}: \delta \rightarrow \mathbb{R}$, las cuales son funciones continuas que verifican $y_{n}(x_{0}) = y_{0}$.

La demostración la dividiremos en tres secciones:

  • Primero probaremos que la sucesión de iterantes $\{y_{n}\}$ converge uniformemente en el intervalo $\delta$ hacia una función continua $y: \delta \rightarrow \mathbb{R}$.
  • Posteriormente comprobaremos que esta función $y: \delta \rightarrow \mathbb{R}$ verifica la ecuación integral (\ref{2}) y, por tanto, es solución del PVI.
  • Finalmente probaremos que el PVI no posee otra solución distinta de $y: \delta \rightarrow \mathbb{R}$.

Con los primeros dos puntos estaremos demostrando la existencia de una solución al problema de valor inicial y con el tercer punto estaremos demostrando la unicidad. Es importante mencionar que en cada uno de los tres puntos anteriores, aparte de la continuidad de $f$, haremos uso de manera esencial de la condición de Lipschitz de $f$ respecto de la segunda variable.

$$|f(x, y_{1}) -f(x, y_{2})| \leq L|y_{1} -y_{2}| \label{3} \tag{3}$$

para cada par de puntos $(x, y_{1}), (x, y_{2}) \in U$. Con $L$ la constante de Lipschitz para $f$ en $U$.

Así mismo, en el primer punto utilizaremos de forma esencial que la convergencia de las iterantes es uniforme, pues no basta con la convergencia puntual.

Demostremos el primer punto.

  • Convergencia uniforme de las iterantes de Picard.

Para probar que la sucesión de iterantes $\{y_{n}\}$ converge uniformemente en el intervalo $\delta$ es conveniente expresarlas de la siguiente forma.

$$y_{n}(x) = y_{0}(x) + \sum_{m = 1}^{n}(y_{m}(x) -y_{m -1}(x)) \label{4} \tag{4}$$

Desglosa la serie anterior para que verifiques la equivalencia.

Fijado $x \in \delta$ es evidente que la sucesión numérica $\{y_{n}(x)\}$ es convergente en $\mathbb{R}$ si y sólo si la serie numérica $\sum_{m = 1}^{\infty}(y_{m}(x) -y_{m -1}(x))$ es convergente, para lo cual es suficiente con la convergencia absoluta de la serie para cada $x \in \delta$, es decir

$$\sum_{m = 1}^{\infty }|y_{m}(x) -y_{m -1}(x)|< \infty \label{5} \tag{5}$$

Si la serie (\ref{5}) fuese convergente para cada $x \in \delta$, entonces se tendría que la sucesión de iterantes converge puntualmente en $\delta$, sin embargo no es suficiente con la convergencia puntual; necesitamos algo más fuerte, como lo es la convergencia uniforme.

Para probar que la serie funcional $\sum_{m = 1}^{\infty}(y_{m}(x) -y_{m -1}(x))$ converge uniformemente en $\delta$ y, por tanto, la sucesión de iterantes, vamos a usar el criterio mayorante de Weierstrass para lo cual necesitamos probar que existen unas constantes $M_{m} \in \mathbb{R}^{+}$, tales que

$$|y_{m}(x) -y_{m -1}(x)|\leq M_{m} \label{6} \tag{6}$$

para cada $x \in \delta$, cada $m = 1, 2, 3 \cdots$, y $\sum_{m = 1}^{\infty } M_{m} < \infty$.

Vamos a comenzar con los casos $m = 1$ y $m = 2$, es decir, vamos a hallar las constantes $M_{1}$ y $M_{2}$, tales que

$$|y_{1}(x) -y_{0}(x)| \leq M_{1} \hspace{1cm} y \hspace{1cm} |y_{2}(x) -y_{1}(x)| \leq M_{2}$$

y con estos resultados intentaremos encontrar una relación de recurrencia para las constantes $M_{m}$ para luego corroborar que $\sum_{m = 1}^{\infty } M_{m} < \infty$ y de esta manera probar la convergencia (\ref{5}).

Partiendo de la ecuación de las iterantes de Picard

$$y_{m}(x) = y_{0} + \int_{x_{0}}^{x} f(t, y_{m -1}(t)) dt; \hspace{1cm} y_{0} = y_{0}(x) \label{7} \tag{7}$$

las primeras iterantes son

$$y_{1}(x) = y_{0}(x) + \int_{x_{0}}^{x} f(t, y_{0}(t)) dt \hspace{1cm} y \hspace{1cm} y_{2}(x) = y_{0}(x) + \int_{x_{0}}^{x} f(t, y_{1}(t)) dt$$

de donde,

$$|y_{1}(x) -y_{0}(x)| = \left| \int_{x_{0}}^{x} f(t, y_{0}) dt \right |$$

y

$$|y_{2}(x) -y_{1}(x)| = \left| \int_{x_{0}}^{x} f(t, y_{1}(t)) -f(t, y_{0}(t))dt \right|$$

Al momento de estimar $|y_{1}(x) -y_{0}(x)|$ necesitamos hacer la siguiente consideración. La función $f$ es continua en $U$ y, por tanto, la función

$$g: \delta \rightarrow \mathbb{R}; \hspace{1cm} x \rightarrow g(x) = f(x, y_{0}(x))$$

es continua en $\delta$. Como $\delta$ es compacto, la función $g(x)$ está acotada en $\delta$, es decir, existe una constante $H > 0$, tal que

$$|g(x)| = |f(x, y_{0}(x))| \leq H$$

para cada $x \in \delta$ y, por tanto, se verifica lo siguiente.

\begin{align*}
|y_{1}(x) -y_{0}(x)| &= \left| \int_{x_{0}}^{x} f(t, y_{0}(t)) dt \right | \\
&\leq \int_{x_{0}}^{x}|f(t, y_{0}(t))| dt \\
&\leq \int_{x_{0}}^{x} H dt \\
&= H|x -x_{0}|
\end{align*}

esto es,

$$|y_{1}(x) -y_{0}(x)| \leq H|x -x_{0}| \label{8} \tag{8}$$

Si consideramos todo el intervalo $\delta = [a, b]$ podríamos obtener finalmente la estimación

$$|y_{1}(x) -y_{0}(x)| \leq H (b -a) = M_{1} \label{9} \tag{9}$$

Para poder estimar adecuadamente $|y_{2}(x) -y_{1}(x)|$ consideremos el resultado (\ref{8}), además de las siguientes dos desigualdades.

\begin{align*}
|y_{2}(x) -y_{1}(x)| &= \left| \int_{x_{0}}^{x} f(t, y_{1}(t)) -f(t, y_{0}(t))dt \right| \\
&\leq \int_{x_{0}}^{x}| f(t, y_{1}(t)) -f(t, y_{0}(t))|dt \label{10} \tag{10}
\end{align*}

y la condición de Lipschitz

$$|f(t, y_{1}(t)) -f(t, y_{0})| \leq L |y_{1}(t) -y_{0}(t)| \label{11} \tag{11}$$

Supongamos que $x > x_{0}$. Usando (\ref{10}) y (\ref{11}), además del resultado (\ref{8}), se tiene

\begin{align*}
|y_{2}(x) -y_{1}(x)| &\leq \int_{x_{0}}^{x}|f(t, y_{1}(t)) -f(t ,y_{0}(t))| dt \\
&\leq \int_{x_{0}}^{x} L |y_{1}(t) -y_{0}(t)|dt \\
&\leq LH \int_{x_{0}}^{x}|t- x_{0}|dt \\
&= LH \int_{x_{0}}^{x}(t -x_{0})dt \\
&= LH \dfrac{(x -x_{0})^{2}}{2}
\end{align*}


Por otro lado, para $x < x_{0}$, se tiene

\begin{align*}
|y_{2}(x) -y_{1}(x)| &\leq \int_{x}^{x_{0}}|f(t, y_{1}(t)) -f(t ,y_{0}(t))| dt \\
&\leq L \int_{x}^{x_{0}}|y_{1}(t) -y_{0}(t)|dt \\
&\leq LH \int_{x}^{x_{0}}|t -x_{0}|dt \\
&= LH \int_{x}^{x_{0}}(x_{0} -t)dt \\
&= LH \dfrac{(x_{0} -x)^{2}}{2}
\end{align*}

De ambos resultados, podemos afirmar que para cada $x \in \delta$

$$|y_{2}(x) -y_{1}(x)| \leq HL \dfrac{|x -x_{0}|^{2}}{2!} \label{12} \tag{12}$$

La desigualdad (\ref{8}) la podemos escribir de forma similar a (\ref{12}) de la siguiente forma.

$$|y_{1}(x) -y_{0}(x)| \leq HL^{0} \dfrac{|x -x_{0}|^{1}}{1!}$$

De estas dos relaciones establecemos una relación de recurrencia que vamos a probar por inducción sobre $m$. Proponemos que para cada $m = 1, 2, 3, \cdots$, y para cada $x \in \delta$, se cumple

$$|y_{m}(x) -y_{m -1}(x)| \leq HL^{m -1} \dfrac{|x -x_{0}|^{m}}{m!} \label{13} \tag{13}$$

La desigualdad ha sido probada anteriormente para $m = 1$ y $m = 2$. Supongamos que es cierta para $m$ y vamos a probar que es válida para $m + 1$ siguiendo el mismo razonamiento que en la obtención del caso $m = 2$. Vamos a mostrar el caso $x > x_{0}$, pero la prueba es similar para el caso $x < x_{0}$.

Si $x > x_{0}$, se tiene

\begin{align*}
|y_{m+1}(x) -y_{m}(x)| &\leq \int_{x_{0}}^{x}|f(t, y_{m}(t)) -f(t, y_{m -1}(t))|dt \\
&\leq L \int_{x_{0}}^{x}|y_{m}(t) -y_{m -1}(t)|dt \\
&\leq \dfrac{HL^{m}}{m!} \int_{x_{0}}^{x}(t -x_{0})^{m} dt \\
&= HL^{m} \dfrac{(x -x_{0})^{m + 1}}{(m+1)!}
\end{align*}

De forma similar, si $x < x_{0}$, se tiene

$$|y_{m+1}(x) -y_{m}(x)| \leq HL^{m} \dfrac{(x_{0} -x)^{m + 1}}{(m+1)!}$$

De ambos resultados concluimos que

$$|y_{m+1}(x) -y_{m}(x)| \leq HL^{m} \dfrac{|x -x_{0}|^{m + 1}}{(m+1)!}$$

Es Importante hacer énfasis que en este desarrollo ha sido fundamental que las iterantes $\{y_{n}\}$ tengan sus gráficas en una región $U$ donde $f$ es lipschitziana.

De lo obtenido anteriormente, y considerando el intervalo completo $\delta = [a, b]$, obtenemos finalmente la siguiente desigualdad.

$$|y_{m}(x) -y_{m -1}(x)| \leq \dfrac{H}{L} \dfrac{(L(b -a))^{m}}{m!} = M_{m} \label{14} \tag{14}$$

para cada $x \in \delta$ y cada $m = 1, 2, 3, \cdots$. Como el intervalo $\delta$ es acotado, entonces $M_{m} \in \mathbb{R}^{+}$ y sabemos que

$$\sum_{m = 1}^{\infty} \dfrac{(L(b -a))^{m}}{m!} = e^{L(b -a)} -1< \infty \label{15} \tag{15}$$

En definitiva,

$$\sum_{m=1}^{\infty } M_{m} < \infty$$

es decir la serie es convergente. Con esto queda probada la condición (\ref{5}) y debido a que la prueba se hizo utilizando el criterio mayorante de Weierstrass concluimos que se trata de una convergencia uniforme de las iterantes de Picard en el intervalo $\delta$ hacia una función $y: \delta \rightarrow \mathbb{R}$.

Es bien conocido que si una sucesión $y_{n}: \delta \rightarrow \mathbb{R}$, $n = 1, 2, 3, \cdots$, de funciones continuas sobre $\delta$ que convergen uniformemente en $\delta$ hacia una función $y: \delta \rightarrow \mathbb{R}$, la función límite uniforme $y$ también es continua en $\delta$.

Queda así demostrado el primer punto de la prueba. Ahora verifiquemos que la función límite uniforme $y: \delta \rightarrow \mathbb{R}$ verifica la ecuación integral (\ref{2}) siendo la solución al problema de valor inicial.

  • La existencia de la solución.

Sea $y: \delta \rightarrow \mathbb{R}$ la función obtenida anteriormente como límite uniforme de las iterantes de Picard $\{y_{n}\}$. La convergencia uniforme de $\{y_{n}\}$ hacia $y(x)$ en el intervalo $\delta$ significa que dado cualquier $\hat{\varepsilon} > 0$ existe un natural $N = N(\hat{\varepsilon})$, tal que para cada $n > N$ y cada $x \in \delta$

$$|y_{n}(x) -y(x)| < \hat{\varepsilon} \label{16} \tag{16}$$

Sabemos que la convergencia uniforme implica la convergencia puntual (pero no al revés), de manera que para cada $x \in \delta$ se cumple que

$$\lim_{n \to \infty}y_{n}(x) = y(x) \label{17} \tag{17}$$

Fijemos un $x \in \delta$. De acuerdo a (\ref{17}) y usando (\ref{7}), se tiene

$$y(x) = \lim_{n \to \infty} y_{n+1}(x) = y_{0} + \lim_{n \to \infty } \int_{x_{0}}^{x}f(t, y_{n}(t))dt$$

Por otro lado, sabemos que la función solución que satisface el PVI satisface también la ecuación integral (\ref{2}),

$$y(x) = y_{0} + \int_{x_{0}}^{x} f(t, y(t))dt$$

Nuestro objetivo es probar que

$$\lim_{n\rightarrow \infty }\int_{x_{0}}^{x} f(t, y_{n}(t)) dt = \int_{x_{0}}^{x}f(t, y(t))dt \label{18} \tag{18}$$

Pues de esta forma la función límite uniforme $y$ verificaría la ecuación integral y, por tanto sería solución del PVI en el intervalo $\delta$, quedando así probada la existencia de la solución.

Demostrar la relación (\ref{18}) es equivalente a probar que $\forall \varepsilon > 0$ existe $N = N(\varepsilon) \in \mathbb{N}$, tal que para cada $n > N$ y cada $x \in \delta$

$$\left|\int_{x_{0}}^{x}f(t, y_{n}(t))dt -\int_{x_{0}}^{x} f(t, y(t))dt \right| < \varepsilon \label{19} \tag{19}$$

Para probar la relación (\ref{19}) de nuevo haremos uso de la condición de Lipschitz (\ref{3}) y de la convergencia uniforme de las iterantes hacia $y$ en $\delta$ (\ref{16}).

\begin{align*}
\left|\int_{x_{0}}^{x}f(t, y_{n}(t))dt -\int_{x_{0}}^{x} f(t, y(t))dt\right| &\leq \int_{x_{0}}^{x}|f(t, y_{n}(t)) -f(t, y(t))|dt \\
&\leq \int_{a}^{b}|f(t, y_{n}(t)) -f(t, y(t))|dt \\
&\leq L \int_{a}^{b}|y_{n}(t) -y(t)|dt
\end{align*}

Dado $\varepsilon > 0$, definimos

$$\hat{\varepsilon} = \dfrac{\varepsilon }{L(b -a)} \label{20} \tag{20}$$

Con esto, la desigualdad (\ref{16}) se puede escribir como

$$|y_{n}(t) -y(t)|< \dfrac{\varepsilon }{L(b -a)} \label{21} \tag{21}$$

Usando esta desigualdad notamos que, para cada $n > N$ y cada $x \in \delta$

\begin{align*}
\left|\int_{x_{0}}^{x}f(t, y_{n}(t))dt -\int_{x_{0}}^{x} f(t, y(t))dt\right| &\leq L \int_{a}^{b}|y_{n}(t) -y(t)|dt \\
&\leq \dfrac{L}{L(b -a)} \int_{a}^{b} \varepsilon dt \\
&= \dfrac{L}{L(b -a)} \varepsilon (b -a) \\
&= \varepsilon
\end{align*}

Por lo tanto, $ \forall \varepsilon > 0$ existe $N = N(\varepsilon) \in \mathbb{N}$, tal que para cada $n > N$ y cada $x \in \delta$

$$\left|\int_{x_{0}}^{x}f(t, y_{n}(t))dt -\int_{x_{0}}^{x} f(t, y(t))dt \right| < \varepsilon$$

lo que confirma la relación (\ref{18}) que es lo que queríamos demostrar. De esta forma queda demostrada la existencia de la solución $y: \delta \rightarrow \mathbb{R}$ para el problema de valor inicial. Finalmente demostremos la unicidad de esta solución.

  • Demostración de la unicidad.

Con los dos puntos anteriores estamos convencidos de la existencia de una solución $y: \delta \rightarrow \mathbb{R}$ que satisface el problema de valor inicial (\ref{1}), así como la ecuación integral (\ref{2}). La prueba de la unicidad se basa en la suposición de la existencia de otra solución $\hat{y}: \delta \rightarrow \mathbb{R}$ que igualmente cumple con los dos puntos anteriores y el objetivo será demostrar que $\hat{y}(x) = y(x)$.

De tarea moral demostrarás que la solución $\hat{y}(x)$ es también una función límite uniforme de las mismas iterantes de Picard para cada $x \in \delta$, esto es

$$\lim_{n \to \infty}y_{n}(x) = \hat{y}(x) \label{22} \tag{22}$$

o, lo que es equivalente, mostrar que

$$\lim_{n \to \infty} |\hat{y}(x) -y_{n}(x)| = 0 \label{23} \tag{23}$$

y por la ecuación (\ref{17}) concluir que $\hat{y}(x) = y(x)$.

En esta situación se procede de manera muy similar a la prueba del primer punto en el que debemos encontrar una relación de recurrencia que acote a la cantidad $|\hat{y}(x) -y_{n}(x)|$ para cada $x \in \delta$ de la siguiente manera

$$0 \leq |\hat{y}(x) -y_{n}(x)| \leq B_{n} \label{24} \tag{24}$$

y si se prueba que

$$\lim_{n \to \infty}B_{n} = 0$$

entonces quedará probada la relación (\ref{23}).

A continuación te damos algunos hints y resultados que deberás obtener a lo largo de tu demostración.

Estudia lo que sucede con $n = 1$ y $n = 2$ y con los resultados encuentra la relación de recurrencia general para cada $n \in \mathbb{N}$, para ello considera la máxima distancia entre $\hat{y}$ y $y_{0}$, esto es

$$A = \max_{x \in \delta} |\hat{y} -y_{0}|$$

El máximo $A \in \mathbb{R}^{+}$ esta asegurado gracias a la continuidad de la función $\hat{y}$ en el intervalo compacto $\delta$. Como la gráfica de la función $\hat{y}(x)$ está contenida en $U$ y $f = f(x, \hat{y})$ es una función lipschitziana, demuestra que para cada $x \in \delta$

$$|\hat{y}(x) -y_{1}(x)| \leq L \int_{x_{0}}^{x}|\hat{y}(t) -y_{0}(t)|dt \leq AL|x -x_{0}| \label{25} \tag{25}$$

Usando este resultado demuestra que

$$|\hat{y}(x) -y_{2}(x)| \leq AL^{2} \int_{x_{0}}^{x}|t -x_{0}|dt \leq AL^{2} \dfrac{|x -x_{0}|^{2}}{2!} \label{26} \tag{26}$$

Demuestra por inducción que en general, para cada $n = 1, 2, 3, \cdots,$ y $x \in \delta$

$$|\hat{y}(x) -y_{n}(x)| \leq AL^{n} \dfrac{|x -x_{0}|}{n!} \label{27} \tag{27}$$

Este resultado te permite concluir que para cada $x \in \delta = [a, b]$

$$|\hat{y}(x) -y_{n}(x)| \leq A \dfrac{(L(b -a))^{n}}{n!} = B_{n} \label{28} \tag{28}$$

Prueba que

$$\lim_{n \to \infty} B_{n} = \lim_{n \to \infty} \dfrac{(L(b -a))^{n}}{n!} = 0 \label{29} \tag{29}$$

Así finalmente queda demostrada la relación (\ref{23}) y por lo tanto $\hat{y}(x) = y(x)$ para cada $x \in \delta$.

Realizar este ejercicio te servirá para consolidar mucho mejor lo que hemos realizado a lo largo de la demostración. Sin embargo, la demostración de la unicidad puede ser mucho más simple si aplicamos el lema de Gronwall. Demostremos la unicidad por esta opción.

Sean $y: \delta \rightarrow \mathbb{R}$ y $\hat{y}: \delta \rightarrow \mathbb{R}$ soluciones al PVI (\ref{1}) y la ecuación integral (\ref{2}).

$$y(x) = y_{0} + \int_{x_{0}}^{x}f(t, y(t)) dt \hspace{1cm} y \hspace{1cm} \hat{y}(x) = y_{0} + \int_{x_{0}}^{x}f(t, \hat{y}(t)) dt$$

Restemos las dos ecuaciones anteriores y consideramos su valor absoluto.

\begin{align*}
|y(x) -\hat{y}(x)| &= \left|\int_{x_{0}}^{x}f(t, y(t))dt -\int_{x_{0}}^{x}f(t, \hat{y}(t))dt \right|\\
&= \left|\int_{x_{0}}^{x}f(t, y(t)) -f(t, \hat{y}(t))dt \right| \\
&\leq \int_{x_{0}}^{x}|f(t, y(t)) -f(t,\hat{y}(t))|dt
\end{align*}

Como $f$ es una función lipschitziana respecto de la segunda variable, entonces

$$\int_{x_{0}}^{x}|f(t, y(t)) -f(t, \hat{y}(t))|dt \leq \int_{x_{0}}^{x} L|y(t) -\hat{y}(t)|dt = L \int_{x_{0}}^{x}|y(t) -\hat{y}(t)|dt$$

es decir,

$$|y(x) -\hat{y}(x)| \leq L \int_{x_{0}}^{x}|y(t) -\hat{y}(t)|dt \label{30} \tag{30}$$

Para que este resultado nos sea más familiar definamos lo siguiente.

$$h(x) = |y(x) -\hat{y}(x)| \hspace{1cm} y \hspace{1cm} \alpha = 0, \hspace{0.2cm} \beta = L$$

Usando esto reescribimos a la ecuación (\ref{30}) como

$$0 \leq h(x) \leq \alpha + \beta \int_{x_{0}}^{x} h(t) dt \label{31} \tag{31}$$

Estamos en las condiciones del lema de Gronwall, pero en el caso especial en el que $\alpha = 0$, así que aplicando el corolario del lema de Gronwall podemos concluir que para cada $x \in \delta$

$$h(x) = |y(x) -\hat{y}(x)| = 0$$

lo que significa que $\forall x \in \delta$, $y(x) = \hat{y}(x)$, es decir, la solución al problema de valor inicial es única.

Con esto quedan demostrados los tres puntos de la prueba, por lo tanto concluimos que el problema de valor inicial (\ref{1}) posee una única solución en $\delta = [a, b]$ y además, las iterantes de Picard asociadas al PVI convergen uniformemente en $\delta$ hacia la solución $y: \delta \rightarrow \mathbb{R}$ del PVI.

$\square$

¡Listo!. Hemos demostrado el teorema de existencia y unicidad de Picard – Lindelöf.

Apliquemos este resultado al caso de las ecuaciones diferenciales lineales.

Existencia y unicidad en ecuaciones lineales

Apliquemos el teorema de Picard – Lindelöf al caso de las ecuaciones diferenciales lineales de primer orden.

$$\dfrac{dy}{dx} = P(x) y + Q(x); \hspace{1cm} y(x_{0}) = y_{0} \label{32} \tag{32}$$

Donde las funciones $P(x)$ y $Q(x)$ son continuas en un intervalo compacto $\delta = [a, b]$, $x_{0} \in \delta$ y $y_{0} \in \mathbb{R}$.

En este caso $U = \delta \times \mathbb{R}$ y

$$f(x, y) = P(x) y + Q(x)$$

Notemos que se verifica lo siguiente:

  • $U$ es una banda vertical de base compacta, pues $\delta$ es un intervalo compacto.
  • Como $P(x)$ y $Q(x)$ son continuas en $\delta$, entonces $f$ es continua en $U$.
  • Como $P(x)$ es continua en el intervalo $\delta$ y éste es compacto, entonces la función $P(x)$ es acotada, así que podemos fijar $L > 0$, tal que $|P(x)|< L$ para todo $x \in \delta$. Considerando esto tenemos que

\begin{align*}
|f(x, y_{1}) -f(x, y_{2})| &= |(P(x) y_{1} + Q(x)) -(P(x) y_{2} + Q(x))| \\
&= |P(x) y_{1} -P(x) y_{2}| \\
&= |P(x) ||y_{1} -y_{2}| \\
&\leq L|y_{1} -y_{2}|
\end{align*}

esto es

$$|f(x, y_{1}) -f(x, y_{2})| \leq L|y_{1} -y_{2}| \label{33} \tag{33}$$

para cada par de puntos $(x, y_{1}), (x, y_{2}) \in U$ es decir, $f$ es una función lipschitziana.

Por tanto, se cumplen las condiciones del teorema de existencia y unicidad global. En consecuencia ratificamos el resultado visto anteriormente en el que se asegura que cualquier problema de valor inicial asociado a una ecuación lineal posee solución única en el intervalo $\delta$. Además, ahora podemos afirmar que las iterantes de Picard asociadas convergen uniformemente hacia la solución del PVI.

$\square$

Un resultado importante que debemos revisar es que si dos problemas de valor inicial tienen valores iniciales muy cercanos entre sí, entonces las soluciones a cada PVI serán funciones muy próximas. A esto le llamamos dependencia continua de las soluciones respecto a condiciones iniciales. Revisemos este resultado. En la demostración será de uso esencial el lema de Gronwall.

Dependencia continua de la condición inicial

Demostración: Como $y(x)$ y $\hat{y}(x)$ son solución de sus respectivos PVI, entonces cada solución verifica una ecuación integral.

$$y(x) = y_{0} + \int_{x_{0}}^{x}f(t, y(t)) dt \hspace{1cm} y \hspace{1cm} \hat{y}(x) = \hat{y}_{0} + \int_{x_{0}}^{x}f(t, \hat{y}(t)) dt$$

Vemos que

\begin{align*}
|y(x) -\hat{y}(x)| &= \left| y_{0} -\hat{y}_{0} + \int_{x_{0}}^{x} f(t, y(t)) dt -\int_{x_{0}}^{x}f(t, \hat{y}(t)) dt \right| \\
&\leq |y_{0} -\hat{y}_{0}| + \left| \int_{x_{0}}^{x} f(t, y(t)) -f(t, \hat{y}(t)) dt \right | \\
&\leq |y_{0} -\hat{y}_{0}| + \int_{x_{0}}^{x}\left| f(t, y(t)) -f(t, \hat{y}(t)) \right| dt
\end{align*}

Sabemos que $f$ es una función lipschitziana respecto de la segunda variable en $R$ de manera que

$$|f(x, y(x)) -f(x, \hat{y}(x)) | \leq L | y(x) -\hat{y}(x)| \label{35} \tag{35}$$

con $L$ la constante de Lipschitz para $f$ en $R$. Entonces,

$$|y(x) -\hat{y}(x)| \leq |y_{0} -\hat{y}_{0} | + L \int_{x_{0}}^{x} |y(t) -\hat{y}(t)|dt \label{36} \tag{36}$$

Definamos

$$0 < g(x) = |y(x) -\hat{y}(x)|, \hspace{1cm} \alpha = |y_{0} -\hat{y}_{0}| \hspace{1cm} y \hspace{1cm} \beta = L$$

Con esto la desigualdad (\ref{36}) la podemos reescribir como

$$0 < g(x) \leq \alpha +\beta \int_{x_{0}}^{x}g(t) dt$$

Ahora podemos aplicar el lema de Gronwall.

$$g(x) \leq \alpha e^{\beta (x -x_{0})}$$

es decir,

$$|y(x) -\hat{y}(x)| \leq |y_{0} -\hat{y}_{0}| e^{L(x -x_{0})}$$

Que es lo que queríamos demostrar.

$\square$

De este resultado observamos que si

$$y_{0} \rightarrow \hat{y}_{0} \hspace{1cm} \Rightarrow \hspace{1cm} |y_{0} -\hat{y}_{0}| \rightarrow 0$$

Entonces las soluciones de los PVI serán funciones muy próximas

$$|y(x) -\hat{y}(x)| \rightarrow 0 \hspace{1cm} \Rightarrow \hspace{1cm} y(x) \rightarrow \hat{y}(x)$$

Para concluir la entrada hagamos un breve comentario sobre el resultado local del teorema de Picard y realicemos unos ejemplos al respecto.

Teorema de existencia y unicidad local

Recordemos que el resultado local del teorema de existencia y unicidad de Picard – Lindelöf establece lo siguiente.

La demostración a este teorema corresponde a una adaptación de la demostración vista para el caso global, teniendo en cuenta que las gráficas de las iterantes de Picard, así como la de cualquier posible solución, definidas en el intervalo $\delta = [x_{0} -h, x_{0} + h]$, están dentro del rectángulo $R$ donde la función $f$ es continua y lipschitziana respecto de la segunda variable. Los pasos claves a seguir y las técnicas son prácticamente una repetición de lo visto anteriormente cambiando la banda vertical $U = [a, b] \times \mathbb{R}$ por el rectángulo

$$R = \{(x, y) \in \mathbb{R} \mid |x -x_{0}| \leq a, |y -y_{0}| \leq b, \hspace{0.2cm} a, b \in \mathbb{R} \}$$

Para conocer sobre los detalles puedes revisar la demostración del teorema local en los videos de este mismo curso.

Finalmente, resolvamos algunos ejemplos.

Ejemplo: Mostrar que el problema de valor inicial

$$\dfrac{dy}{dx} = \sin^{2}{(x -y)}; \hspace{1cm} y(0) = 0$$

posee una única solución definida en $\mathbb{R}$.

Solución: En este caso tenemos la función $f: U = \mathbb{R} \times \mathbb{R} \rightarrow \mathbb{R}$ definida como

$$f(x, y) = \sin^{2}{(x -y)}$$

Es claro que $f$ es continua en la región $U = \mathbb{R} \times \mathbb{R}$. La función derivada parcial $\dfrac{\partial f}{\partial y}: U \rightarrow \mathbb{R}$ está dada como

$$\dfrac{\partial f}{\partial y} = -2 \sin{(x -y) \cos{(x -y)}}$$

Como

$$|\sin{(x -y)}| \leq 1 \hspace{1cm} y \hspace{1cm} |\cos{(x -y)}| \leq 1$$

para todo $(x, y) \in U$, entonces

$$\left| \dfrac{\partial f}{\partial y} (x, y) \right| \leq 2$$

para todo $(x, y) \in U$. En consecuencia $f$ es una función lipschitziana en $U$ respecto de la segunda variable. Con esto hemos probado que se satisfacen las hipótesis del teorema de existencia y unicidad global por lo que podemos asegurar que el PVI posee una única solución definida en $\mathbb{R}$.

$\square$

Calcular las iterantes no siempre será sencillo. En el ejemplo anterior las iterantes pueden no ser fácil de desarrollar, pero debido a que satisface el teorema de Picard – Lindelöf podemos asegurar que dichas iterantes van a converger a la solución del PVI.

Ejemplo: Mostrar que aplicando el resultado global del teorema de Picard – Lindelöf al problema de valor inicial

$$\dfrac{dy}{dx} = y^{2}; \hspace{1cm} y(0) = 1$$

no es posible asegurar la existencia y unicidad de la solución.

Solución: La función $f: U = \mathbb{R} \times \mathbb{R} \rightarrow \mathbb{R}$ definida como

$$f(x, y) = y^{2}$$

es continua en $U = \mathbb{R} \times \mathbb{R}$, sin embargo su derivada parcial

$$\dfrac{\partial f}{\partial y} = 2y$$

no está acotada en $U$ por lo que $f$ no es una función lipschitziana en $U$.

Una observación más es que la solución al PVI dada por

$$y(x) = \dfrac{1}{1 -x}$$

no está definida en $\mathbb{R}$ si no en el intervalo $(-\infty, 1)$.

En definitiva, como no se cumple la tercera condición del teorema global, entonces no podemos asegurar nada sobre la existencia y unicidad de la solución del PVI.

$\square$

Veamos ahora la importancia del resultado local del teorema de existencia y unicidad de Picard – Lindelöf . Resolvamos de nuevo el ejemplo anterior, pero ahora considerando una región $R$ alrededor del punto dado por la condición inicial.

Ejemplo: Mostrar que aplicando el resultado local del teorema de Picard – Lindelöf, el problema de valor inicial

$$\dfrac{dy}{dx} = y^{2}; \hspace{1cm} y(0) = 1$$

posee una única solución. Encontrar el intervalo de existencia y unicidad.

Solución: Es claro que la función

$$f(x, y) = y^{2}$$

es continua en $\mathbb{R}^{2}$ por lo que $f$ será una función lipschitziana en cualquier conjunto $R$ convexo y compacto. Consideremos el rectángulo centrado en el valor inicial $(0, 1)$ de dimensiones $a = 2$ y $b = 1$, es decir

$$R = \{(x, y) \in \mathbb{R} \mid |x| \leq 2, |y -1| \leq 1\} = [-2, 2] \times [0, 2]$$

En la región $R$ la función $f$ si es lipschitziana y continua por lo que se satisfacen las condiciones del teorema local de existencia y unicidad de Picard. Este teorema nos dice que existe una única solución definida en el intervalo $\delta = [x_{0} -h, x_{0} + h]$ donde

$$ h = \min \left\{a,\dfrac{b}{M} \right\} \hspace{1cm} y \hspace{1cm} M \geq \max_{(x, y) \in R}|f(x, y)|$$

En este caso, como el máximo valor que puede tomar $y$ en el rectángulo $R$ es $y = 2$, entonces

$$M = \max_{(x, y) \in R}|f(x, y)| = \max_{(x, y) \in R}|y^{2}| = 4$$

Usando este resultado, se tiene

$$h = \min \left\{a,\dfrac{b}{M} \right\} = \min \left\{2,\dfrac{1}{4} \right\} = \dfrac{1}{4}$$

Por lo tanto, podemos asegurar la existencia y unicidad de la solución del PVI en el intervalo

$$\delta = [x_{0} -h, x_{0} + h] = \left[ -\dfrac{1}{4}, \dfrac{1}{4} \right]$$

Además podemos asegurar que las iterantes de Picard convergen uniformemente en el intervalo $\delta$ hacia la solución única del PVI. A saber, convergen a

$$y(x) = \dfrac{1}{1 -x}$$

$\square$

Con esto concluimos la primera unidad del curso.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  1. Completar la demostración de la unicidad de la solución a un problema de valor inicial que cumple con las hipótesis del teorema global de existencia y unicidad. Recuerda que el objetivo es demostrar que $$\lim_{n \to \infty} |\hat{y}(x) -y_{n}(x)| = 0$$
  1. Comprobar que el problema de valor inicial $$\dfrac{dy}{dx} = \dfrac{y}{x}; \hspace{1cm} y(0) = 0$$ posee infinitas soluciones en cualquier intervalo $\delta$ en el que $0 \in \delta$.
    ¿Porqué no contradice esto al teorema de existencia y unicidad local?.
  1. Determinar, por el método de iterantes de Picard, la solución del siguiente problema de valor inicial: $$\dfrac{dy}{dx} = 2y(1 + x); \hspace{1cm} y(-1) = 1$$
  1. Comprobar que el mayor intervalo que proporciona el teorema local de existencia y unicidad de Picard para el problema de valor inicial $$\dfrac{dy}{dx} = 1 + x^{2}; \hspace{1cm} y(0) = 0$$ donde se asegura la existencia y unicidad de la solución, es $\delta = \left[-\dfrac{1}{2}, \dfrac{1}{2} \right]$.

Más adelante…

Con la demostración del teorema de existencia y unicidad de Picard – Lindelöf justificamos la teoría realizada a lo largo de esta primera unidad.

En la siguiente entrada comenzaremos la unidad 2 del curso. En dicha unidad estudiaremos las ecuaciones diferenciales de orden mayor a uno, en particular estudiaremos con mayor detalle las ecuaciones diferenciales de segundo orden.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Variable Compleja I: El plano complejo $\mathbb{C}$

Por Pedro Rivera Herrera

Introducción

En el año de 1685 el matemático británico John Wallis planteó en su libro «De algebra tractatus» la primera idea sobre la existencia de una correspondencia entre los puntos del plano y los números complejos, aunque ésta no tuvo gran influencia entre sus contemporáneos pues era un tanto confusa. Es hasta el año de 1798 cuando el topógrafo noruego Caspar Wessel da una propuesta seria, en su libro «On the Analytical Representation of Direction«, de una primera representación de los números complejos a través de puntos en un plano. Aunque el trabajo de Wessel permaneció oculto hasta su traducción al francés en 1897, la idea de Wessel era tratar a los números complejos como segmentos de líneas dirigidos, por lo que introduce un eje imaginario, perpendicular al eje de los números reales, asigna la letra griega $\varepsilon$ para denotar a la unidad imaginaria $\sqrt{-1}$ e identifica entonces a los números complejos como puntos en el plano, es decir intuitivamente los tratan como vectores en 2 dimensiones, por lo que las operaciones con las que los trata coinciden con las operaciones de vectores usuales, obteniendo así una primera representación geométrica de estos números.

Otra interpretación geométrica de los números complejos fue dada por el contador suizo Jean Robert Argand, quien en su libro «Essai sur une manière de représenter les quantités imaginaires dans les constructions géometriques«, interpreta a $\sqrt{-1}$ como una rotación de un ángulo recto en el plano. Su justificación se basaba en el hecho de que $\sqrt{-1} \sqrt{-1} = -1$, es decir dos rotaciones de un ángulo recto son equivalentes a una rotación de dos ángulos rectos. El trabajo de Argand es quizás de los más trascendentes pues la forma en que representa a los números en el plano, denominado como el plano de Argand, es básicamente la que usamos hoy en día.

Para 1749, Leonhard Euler redacta en su escrito «De la controverse entre Mrs. Leibnitz et Bernoulli sur les logarithmes des nombres négatifs et imaginaires«, que para localizar un número imaginario $x$ en el plano solo basta con tomar un arco $g$ de la circunferencia de radio $r$ y determinar su seno y coseno, entonces dicho número está determinado por:

\begin{equation*}
x = r \left(\text{cos}(g) + \sqrt{-1} \, \text{sen}(g)\right).
\end{equation*}

Es gracias al trabajo de Carl Friedrich Gauss que se logra por fin unificar todas estas ideas y poder dar sin duda una relación de los números complejos y el plano complejo. Alrededor del año de 1796, Gauss estaba de acuerdo con la asociación de los números complejos con puntos en el plano, tanto que para el año de 1799 hizo uso de esa idea en su trabajo para probar el Teorema Fundamental del Álgebra. En 1811 Gauss redactó en uno de sus escritos con Bessel que «tal como uno puede pensar en todo el dominio de las magnitudes reales representado como una línea recta, así también el dominio completo de todas las magnitudes, tanto números reales como números imaginarios, puede ser visualizado como un plano infinito, en el cual el punto definido por la ordenada $a$ y la abscisa $b$, igualmente representa a la magnitud $a+ib$».

Es hasta 1835 que el matemático británico William Rowan Hamilton en su trabajo «Theory of Conjugate Functions, or Algebra Couples, with a Preliminary and Elementary Essay on Algebra as the Science of Pure Time«, da la primera definición de un número complejo como un par ordenado de números reales, tal y como la conocemos hoy en día.

Si deseas conocer más acerca de la historia de los números complejos puedes consultar los libros An Introduction to Complex Analysis de Agarwal, Ravi P., y Numbers de Ebbinghaus, H.D.

Interpretación geométrica de los números complejos.

Hasta ahora tenemos construido ya el campo de los números complejos, el cual lo definimos como el conjunto:
\begin{equation*}
\mathbb{C} = \{ z = (a,b) \, \, | \, \, a, b \in \mathbb{R}, \, i=(0,1)\}.
\end{equation*}

Esta definición de número complejo como un par ordenado es la representación geométrica de un número complejo con la que trabajaremos. Es decir, a cada número complejo de la forma $z=a+ib$, donde $a,b \in \mathbb{R}$, le corresponde el punto $(a, b) = \left(\text{Re}(z), \, \text{Im}(z)\right)$ en el plano cartesiano, de ahora en adelante llamado el plano complejo o el plano de Argand.

De acuerdo con esta idea, los números reales $a$ son asociados en el plano complejo con puntos en el eje $x$, llamado propiamente como el eje real, mientras que los números complejos puros, es decir de la forma $ib$, corresponden a puntos en el eje $y$ el cual se denomina como el eje imaginario, figura 1.

Figura 1: El plano complejo.

Las operaciones definidas en la entrada previa cobran entonces un sentido geométrico. Mientras que la suma de dos números complejos coincide con la suma vectorial en $\mathbb{R}^2$, figura 2(a), el producto de dos números complejos corresponde a una rotación, seguida de una homotecia en $\mathbb{R}^2$, figura 2(b). Por otra parte, tenemos que el conjugado de un número complejo $z$ resulta ser la reflexión de dicho número a través del eje real, figura 3.

Figura 2: Operaciones aritméticas de dos números $z_1$ y $z_2$ complejos en el plano.

Figura 3: Conjugado de un número complejo $z$.

Definición 3.1. (El módulo de un número complejo.)
Sea $z = a+ib \in \mathbb{C}$. El módulo o valor absoluto de $z$ se define como el número real, no negativo:
\begin{equation*}
|\, z \,| = \sqrt{a^2 + b^2}
\end{equation*}
Geométricamente, el número $| \, z \, |$ es la distancia entre el punto $(a, b)$ y el origen, o la longitud del radio del vector que representa $z$.

Es interesante notar que si $z$ es un número real, es decir si $\operatorname{Im}(z)=0$, entonces el módulo de $\mathbb{C}$ es simplemente el valor absoluto de $\mathbb{R}$.

Figura 4: Módulo de un número complejo.

De acuerdo con la figura 4, notemos que la parte real, Re$(z)$, de un número complejo $z$, es la proyección de $z$ sobre el eje real, mientras que su parte imaginaria, Im$(z)$, es la proyección de $z$ sobre el eje imaginario.

Observación 3.1.
Considerando la definición del módulo de un número complejo es fácil verificar que:
\begin{equation*}
\text{máx}\left\{|\,\operatorname{Re}(z)\,|, |\,\operatorname{Im}(z)\,|\right\} \leq |\,z\,| \leq |\,\operatorname{Re}(z)\,| + |\,\operatorname{Im}(z)\,|.
\end{equation*}

Observación 3.2
A diferencia de $\mathbb{R}$, en $\mathbb{C}$ no es posible introducir una propiedad de ser positivo que sea compatible con las operaciones de suma y producto definidas en $\mathbb{C}$, lo cual nos imposibilita el ordenar a los números complejos bajo la relación “$>0$”. Para probar esto, basta ver que dicha propiedad no es compatible con las operaciones de campo, es decir notemos que no se cumplen las siguientes propiedades de manera simultánea:

  1. Para todo $z \in \mathbb{C}$, se cumple una y solo una de las siguientes tres condiciones: $z>0$, $z=0$ ó $-z>0$.
  2. Si $z>0$ y $w>0$, entonces $z+w>0$ y $zw>0$.

Sin perder generalidad, notemos que si suponemos que $z \neq 0$, entonces se cumple que $z^2>0$. De manera particular tenemos que $1^2>0$, $i^2>0$, por lo que $1^2 + i^2 >0$, pero $1^2 + i^2 = 1 + (-1) = 0$, es decir que $0>0$, lo cual claramente es una contradicción a la antisimetría, por lo que, bajo esta relación de orden, $\mathbb{C}$ no puede ser ordenado.

La observación 3.2 nos deja ver que dados $z_1, z_2 \in \mathbb{C}$ la desigualdad $z_1 < z_2$ no tiene sentido desde que no podemos decir que alguno es mayor que cero. Sin embargo mediante el módulo de un número complejo sí es posible pensar en la desigualdad $| \, z_1 \, | < | \, z_2 \,|$, que de acuerdo con la definición 3.1 nos diría que el punto $z_1$ está más cerca del origen que el punto $z_2$.

Ejemplo 3.1.
Sean $z_1 = -4 + 2i$, $z_2 = 3 – i$ y $z_3 = -4$ entonces:

  • a) $ \quad |\, z_1 \,| = |\, -4 + 2i \,| = \sqrt{(-4)^2 + 2^2} = \sqrt{16 + 4} = \sqrt{20}$.
  • b) $\quad |\, z_2 \,| = |\, 3 – i \,| = \sqrt{3^2 + (-1)^2} = \sqrt{9 + 1} = \sqrt{10}$.
  • c) $\quad |\, z_3 \,| = \sqrt{\left(-4\right)^2} = |\, -4 \,| = 4$.

Como $|\,z_1\,|>|\,z_2\,|$, entonces $z_1$ está más lejos del origen que $z_2$.

Por otra parte, tenemos que $|\,z_3\,|$ simplemente nos determina el valor absoluto del número real $z_3$.

Observación 3.3.
De acuerdo con las observaciones 2.3 y 2.4 sabemos que para $z = a+ib \in \mathbb{C}$ se cumple que $z\overline{z} = a^2 + b^2$, por lo que:
\begin{equation*}
| \, z \, |^2 = z \overline{z}.
\end{equation*}

Si consideramos que $z \neq 0$, tenemos que:
\begin{equation*}
\frac{z \overline{z}}{| \, z \, |^2} = z \, \frac{\overline{z}}{| \, z \, |^2} = 1.
\end{equation*}

Lo anterior nos dice que para $z \neq 0$, podemos calcular el inverso multiplicativo de $z$ como:
\begin{equation*}
z^{-1} = \frac{1}{z} = \frac{\overline{z}}{| \, z \, |^2}.
\end{equation*}
Geométricamente esto nos dice que el inverso de un número complejo $z\neq0$ estará en la dirección de su conjugado $\overline{z}$, pero su módulo estará determinado por el inverso del módulo de $z$, lo cual cobrará mayor sentido en la entrada 6.

Ejemplo 3.2.
Consideremos los siguientes números complejos:

  • a) $\quad z_1 = i$.
  • b) $\quad z_2 = 1 + i\,\sqrt{3}$.
  • c) $\quad z_3 = \frac{-1-i}{2}$.

Entonces:

  • a) \begin{equation*}
    z_1^{-1} =\frac{1}{z_1} =\frac{-i}{1^2} = – i.
    \end{equation*}
  • b) \begin{equation*}
    z_2^{-1} =\frac{1}{z_2} =\frac{1-i\sqrt{3}}{2^2} = \frac{1}{4}(1-i\sqrt{3}).
    \end{equation*}
  • c) \begin{equation*}
    z_3^{-1} =\frac{1}{z_3} =\frac{ \frac{-1+i}{2}}{\left(\frac{\sqrt{2}}{2}\right)^2} = -1+i.
    \end{equation*}
Figura 5: Gráfica de los números complejos del ejemplo 3.2 con sus respectivos inversos multiplicativos.

Proposición 3.1.
Sean $z, w \in \mathbb{C}$, entonces se satisfacen las siguientes igualdades:

  1. $|\, z + w \, |^2 = |\, z \, |^2 + 2 \, \text{Re}(z \overline{w}) + |\, w \, |^2$.
  2. Ley de cosenos.
    \begin{equation*}
    |\, z – w \, |^2 = |\, z \, |^2 – 2 \, \text{Re}(z \overline{w}) + |\, w \, |^2.
    \end{equation*}
  3. Identidad del paralelogramo.
    \begin{equation*}
    |\, z + w \, |^2 + |\, z – w \, |^2 = 2 \left(|\, z \, |^2 + |\, w \, |^2\right).
    \end{equation*}
  4. $| \, z w \,| = |\,z\,| \, |\,w\,|$.
  5. $\text{Re}(z \pm w) = \text{Re}(z) \pm \text{Re}(w)$ y $\text{Im}(z \pm w) = \text{Im}(z) \pm \text{Im}(w)$.
  6. Para $\alpha \in \mathbb{R}$, $\alpha\,\text{Re}(z) = \text{Re}(\alpha z)$ y $\alpha\,\text{Im}(z) = \text{Im}(\alpha z)$.
  7. Si $w \neq 0$, entonces $\left| \dfrac{z}{w} \right| = \dfrac{|\,z\,|}{|\,w|\,}$.
  8. $|\, z \,| = |\, \overline{z} \,|$.

Demostración. Dadas las hipótesis y considerando las observaciones 2.3 y 2.4, tenemos que:


  1. \begin{align*}
    |\, z + w \, |^2 & = \left( z + w \right)\overline{\left( z + w \right)}\\
    & = \left( z + w \right) \left( \overline{z} + \overline{w} \right)\\
    & = z \overline{z} + z \overline{w} + \overline{z}w + w \overline{w}\\
    & = |\, z \, |^2 + z \overline{w} + \overline{z \overline{w}} + |\, w \, |^2\\
    & = |\, z \, |^2 + 2 \, \text{Re}(z \overline{w}) + |\, w \, |^2.
    \end{align*}
  2. Se deja como ejercicio al lector.
  3. Considerando 1 y 2 tenemos que:
    \begin{align*}
    |\, z + w \, |^2 + |\, z – w \, |^2 & = \left(|\, z \, |^2 + 2\,\text{Re}(z \overline{w}) + |\, w \, |^2\right) + \left(|\, z \, |^2 – 2 \, \text{Re}(z \overline{w}) + |\, w \, |^2\right)\\
    & = 2 \, |\, z \, |^2 + 2 \, |\, w \, |^2\\
    & = 2 \left(|\, z \, |^2 + |\, w \, |^2\right)
    \end{align*}
  4. Sabemos que para todo $z\in\mathbb{C}$ se tiene que $|\,z\,|\geq0$, por lo que:
    \begin{equation*}
    |\,zw\,|^2 = \left(zw\right)\left(\overline{zw}\right) = \left(z \overline{z} \right)\left(w \overline{w}\right) = |\,z\,|^2 |\,w\,|^2.
    \end{equation*}

Entonces $|\,zw\,| = |\,z\,|\, |\,w\,|$.

  1. Se deja como ejercicio al lector.
  2. Se deja como ejercicio al lector.
  3. Supongamos que $w\neq0$, entonces $|\,w\,|>0$, por lo que considerando el punto 4 tenemos que:
    \begin{equation*}
    |\, z \,| = \left|\,\frac{z}{w}\, w\,\right| = \left|\,\frac{z}{w}\,\right|\,|\, w\,|, \quad \Longrightarrow \quad \frac{|\,z\,|}{|\,w\,|} = \left|\,\frac{z}{w}\,\right|.
    \end{equation*}
  4. Se deja como ejercicio al lector.

$\blacksquare$

Observación 3.4.
Las propiedades 4, 5 y 6 de esta proposición se pueden generalizar por medio de inducción matemática, es decir para $z_1, z_2, \ldots, z_n \in\mathbb{C}$, con $n\geq2$, se cumple que:

\begin{equation*}
|\,z_1 z_2 \cdots z_n\,| = |\,z_1\,| \, |\,z_2\,| \cdots |\,z_n\,|.
\end{equation*}

\begin{equation*}
\operatorname{Re}(z_1 + z_2 + \cdots + z_n) =\operatorname{Re}(z_1) + \operatorname{Re}(z_2) + \cdots + \text{Re}(z_n).
\end{equation*}

\begin{equation*}
\operatorname{Im}(z_1 + z_2 + \cdots + z_n) = \operatorname{Im}(z_1) + \operatorname{Im}(z_2) + \cdots + \operatorname{Im}(z_n).
\end{equation*}

Es importante notar que al igual que el valor absoluto satisface la desigualdad del triángulo en $\mathbb{R}$, el módulo en $\mathbb{C}$ también la cumple.

Proposición 3.2. (Desigualdad del triángulo.)
Para todo $z_1,z_2\in\mathbb{C}$ se cumple que:

\begin{equation*}
|\,z_1 + z_2\,| \leq |\,z_1\,| + |\,z_2\,|
\end{equation*}

Demostración. De acuerdo con la observación 3.1 tenemos que para todo $z \in \mathbb{C}$ se cumple:
\begin{equation*}
\operatorname{Re}(z) \leq \left|\,\operatorname{Re}(z)\,\right| \leq \left|\,z\,\right|. \tag{3.1}
\end{equation*}

Considerando la proposición 3.1, incisos 4 y 6, tenemos que:
\begin{equation*}
|\, z_1 \,| \, |\, z_2 \,| = |\, z_1 \,| \, |\, \overline{z_2} \,| = |\, z_1 \overline{z_2}\,|.
\end{equation*}

Entonces, por (3.1) se sigue que:
\begin{equation*}
\operatorname{Re}(z_1\overline{z_2}) \leq |\, z_1 \overline{z_2}\,|.
\end{equation*}

Por otra parte, por la proposición 3.1 inciso 1, se tiene que:
\begin{align*}
|\, z_1 + z_2 \, |^2 & = |\, z_1 \, |^2 + 2 \, \operatorname{Re}(z_1 \overline{z_2}) + |\, z_2 \, |^2 \\
& \leq |\, z_1 \, |^2 + 2 \, |\, z_1 \overline{z_2}\,| + |\, z_2 \, |^2\\
& = |\, z_1 \, |^2 + 2\,|\, z_1 \,| \, |\,\overline{z_2}\,| + |\, z_2 \, |^2\\
& = |\, z_1 \, |^2 + 2\,|\, z_1 \,| \, |\,z_2\,| + |\, z_2 \, |^2\\
& = \left( | \, z_1 \, | + | \, z_2 \, | \right)^2.
\end{align*}

Como $| \, z \,| \geq 0 $ para todo $z \in \mathbb{C}$, entonces tomando raíz cuadrada en la desigualdad se sigue que:
\begin{equation*}
| \, z_1 + z_2 \, | \leq | \, z_1 \, | + | \, z_2 \,|.
\end{equation*}

$\blacksquare$

De manera geométrica podemos comprobar que se satisface la desigualdad del triángulo:

Figura 6: Desigualdad del triángulo para el módulo de números complejos.

Observación 3.5.
Consideremos la proposición 3.2, tenemos que:
\begin{equation*}
\operatorname{Re} \left(z_1\,\overline{z_2}\right) = |\,z_1\,\overline{z_2}\,| \quad \Longleftrightarrow \quad z_1\,\overline{z_2} \in \mathbb{R} \,\, \text{y} \, \, z_1\,\overline{z_2}\geq 0.
\end{equation*}

La cual es una condición necesaria y suficiente para que se cumpla la igualdad en la desigualdad del triángulo. (¿Por qué?)

Notemos que si $z_2 \neq 0$, entonces $z_1\,\overline{z_2} = \dfrac{z_1 |z_2|^2}{z_2}$, por lo que (¿Por qué?):
\begin{equation*}
z_1\,\overline{z_2} \in \mathbb{R} \,\, \text{y} \, \, z_1\,\overline{z_2}\geq0 \quad \Longleftrightarrow \quad \frac{z_1}{z_2}\geq0.
\end{equation*}

Entonces:
\begin{align*}
|\, z_1 + z_2 \,| &= \left|\,\left(\frac{z_1}{z_2} + 1 \right)z_2\,\right|\\
&= \left|\,\frac{z_1}{z_2} + 1 \,\right|\,|\,z_2\,|\\
&= \left(\frac{|\,z_1\,|}{|\,z_2\,|} + 1 \right) |\,z_2\,|\\
&=|\,z_1\,| + |\,z_2\,|.
\end{align*}

Una consecuencia de la desigualdad del triángulo es:

Proposición 3.3.
Para todo $z_1, z_2 \in \mathbb{C}$ se cumple que:
\begin{equation*}
\left| \, | \, z_1 \, | – | \, z_2 \,| \, \right| \leq | \, z_1 \pm z_2 \, |.
\end{equation*}

Demostración.
Se deja como ejercicio al lector.

$\blacksquare$

Ejemplo 3.3.
Sea $z$ un número complejo tal que $|\, z \,| = 1$, entonces:
\begin{equation*}
1 = |\, – 1 \,| = |\, 1 – 2 \,| = |\, |\,z\,| – 2 \,| \leq |\, z – 2\,|.
\end{equation*}

\begin{equation*}
|\, z – 2\,| \leq |\,z\,| + 2 = 1 + 2 = 3.
\end{equation*}

Observación 3.6.
La desigualdad del triángulo se puede generalizar mediante inducción matemática para un número finito de términos, es decir:
\begin{equation*}
|\, z_1 + z_2 + \cdots + z_n\,| \leq |\,z_1\,| + |\,z_2\,| + \cdots + |\,z_n\,|, \quad \forall n \geq 2.
\end{equation*}

o simplemente:
\begin{equation*}
\left|\, \sum_{i=1}^n z_i \,\right| \leq \sum_{i=1}^n |\,z_i\,|, \quad \forall n \geq 2.
\end{equation*}

Otro resultado importante es la siguiente desigualdad:

Proposición 3.4. (Desigualdad de Cauchy – Schwarz para números complejos.)
Si $z_1, \ldots, z_n$ y $w_1, \ldots, w_n$ son números complejos, entonces:
\begin{equation*}
\left|\, \sum_{i=1}^n z_i w_i \,\right|^2 \leq \sum_{i=1}^n \left|\,z_i\,\right|^2 \sum_{i=1}^n \left|\,w_i\,\right|^2, \quad \forall n \geq 2.
\end{equation*}

Demostración. Dadas las hipótesis, tenemos sin pérdida de generalidad que:
\begin{equation*}
\sum_{i=1}^n \left|\,w_i\,\right|^2 = 0 \quad \Longleftrightarrow \quad \left|\,w_i\,\right|^2 = 0, \quad \forall i \in {1, \ldots, n} \quad \Longleftrightarrow \quad w_i = 0, \quad \forall i \in {1, \ldots, n}.
\end{equation*}

Por lo que en caso de que $w_i = 0, \, \forall i \in {1, \ldots, n}$, es claro que se cumple la igualdad. Entonces, sin pérdida de generalidad supongamos que $\sum_{i=1}^n \left|\,w_i\,\right|^2 \neq 0$.

Notemos que para cualquier $\lambda \in \mathbb{C}$ se cumple que:
\begin{equation*}
0 \leq \sum_{i=1}^n \left|\,z_i – \lambda \overline{w_i}\,\right|^2.
\end{equation*}
De acuerdo con la proposición 3.1 tenemos que:
\begin{align*}
\sum_{i=1}^n \left|\,z_i – \lambda \overline{w_i}\,\right|^2 & = \sum_{i=1}^n \left( \left|\,z_i\,\right|^2 + \left|\,w_i\,\right|^2 – 2 \, \text{Re}\left(z_i \overline{\lambda \overline{w_i}}\right) \right)\\
& = \sum_{i=1}^n \left|\,z_i\,\right|^2 + \left|\,\lambda\,\right|^2\sum_{i=1}^n \left|\,w_i\,\right|^2 – 2 \, \sum_{i=1}^n \text{Re}\left(z_i \overline{\lambda} w_i\right)\\
& = \sum_{i=1}^n \left|\,z_i\,\right|^2 + \left|\,\lambda\,\right|^2\sum_{i=1}^n \left|\,w_i\,\right|^2 – 2\,\text{Re}\left( \overline{\lambda} \sum_{i=1}^n z_i w_i\right). \tag{3.2}
\end{align*}

Por otra parte, dado que $\lambda$ es arbitrario y $\sum_{i=1}^n \left|\,w_i\,\right|^2 \neq 0$, entonces podemos tomarlo de la forma:
\begin{equation*}
\lambda = \frac{\sum_{i=1}^n z_i w_i}{\sum_{i=1}^n \left|\, w_i\,\right|^2} \quad \Longrightarrow \quad \overline{\lambda} = \frac{\overline{\sum_{i=1}^n z_i w_i}}{\sum_{i=1}^n \left|\, w_i\,\right|^2}.
\end{equation*}

Notemos que:
\begin{align*}
\overline{\lambda}\sum_{i=1}^n z_i w_i & = \left( \frac{\overline{\sum_{i=1}^n z_i w_i}}{\sum_{i=1}^n \left|\, w_i\,\right|^2} \right) \left( \sum_{i=1}^n z_i w_i \right)\\
& = \frac{\left|\sum_{i=1}^n z_i w_i\right|^2}{\sum_{i=1}^n \left|\, w_i\,\right|^2} \in \mathbb{R},
\end{align*}

por lo que:
\begin{align*}
– 2\,\text{Re}\left( \overline{\lambda} \cdot \sum_{i=1}^n z_i w_i\right) & = – 2\,\text{Re}\left( \frac{\left|\sum_{i=1}^n z_i w_i\right|^2}{\sum_{i=1}^n \left|\, w_i\,\right|^2}\right)\\
& = – 2 \, \frac{\left|\sum_{i=1}^n z_i w_i\right|^2}{\sum_{i=1}^n \left|\, w_i\,\right|^2}.
\end{align*}

Sustituyendo en (3.2) tenemos que:
\begin{align*}
0 & \leq \sum_{i=1}^n \left|\,z_i\,\right|^2 + \left|\,\frac{\sum_{i=1}^n z_i w_i}{\sum_{i=1}^n \left|\, w_i\,\right|^2} \,\right|^2\sum_{i=1}^n \left|\,w_i\,\right|^2 – 2\,\text{Re}\left( \overline{\lambda} \sum_{i=1}^n z_i w_i\right)\\
& = \sum_{i=1}^n \left|\,z_i\,\right|^2 + \frac{\left|\,\sum_{i=1}^n z_i w_i\,\right|^2}{\sum_{i=1}^n \left|\, w_i\,\right|^2} – 2\,\frac{\left|\,\sum_{i=1}^n z_i w_i\,\right|^2}{\sum_{i=1}^n \left|\, w_i\,\right|^2}.
\end{align*}

Por lo tanto:
\begin{equation*} \frac{\left|\,\sum_{i=1}^n z_i w_i\,\right|^2}{\sum_{i=1}^n \left|\, w_i\,\right|^2} \leq \sum_{i=1}^n \left|\,z_i\,\right|^2 \quad \Longrightarrow \quad \left|\,\sum_{i=1}^n z_i w_i\,\right|^2 \leq \sum_{i=1}^n \left|\,z_i\,\right|^2 \sum_{i=1}^n \left|\, w_i\,\right|^2.
\end{equation*}

$\blacksquare$

Esta desigualdad será de mucha utilidad en la última unidad como criterio para probar la convergencia de algunas series.

Observación 3.7.
La definición de producto interior en un espacio vectorial tiene cierta sutileza cuando se trata de un espacio vectorial complejo, ya que en dado caso es posible hablar de un producto interior hermitiano, es decir la propiedad de simetría que conocemos queda sujeta a la operación de la conjugación compleja, por lo que en algunos textos es común establecer la desigualdad de Cauchy-Schwarz como:
\begin{equation*}
\left|\, \sum_{i=1}^n z_i \overline{w_i} \,\right|^2 \leq \sum_{i=1}^n \left|\,z_i\,\right|^2 \sum_{i=1}^n \left|\,w_i\,\right|^2, \quad \forall n \geq 2, \end{equation*}

ya que $\sum_{i=1}^n z_i \overline{w_i}$ define justamente un producto interior en $\mathbb{C}^n$.

De acuerdo con lo anterior, se puede plantear la siguiente proposición, cuya demostración se obtuvo del libro Principios de Análisis Matemático de Walter Rudin.

Proposición 3.4.1. (Desigualdad de C-S.)
Si $z_1,\ldots,z_n, w_1, \ldots, w_n\in\mathbb{C}$, entonces:
\begin{equation*}
\left|\, \sum_{i=1}^n z_i \overline{w_i} \,\right|^2 \leq \sum_{i=1}^n \left|\,z_i\,\right|^2 \sum_{i=1}^n \left|\,w_i\,\right|^2, \quad \forall n \geq 2. \end{equation*}

Demostración. Dadas las hipótesis, sean $A = \sum_{i=1}^n \left|\,z_i\,\right|^2$, $B = \sum_{i=1}^n \left|\,w_i\,\right|^2$ y $C = \sum_{i=1}^n z_i \overline{w_i}$, entonces:
\begin{align*}
\sum_{i=1}^n |\,Bz_i – Cw_i\,|^2 & = B^2 A – 2\,\text{Re}(B\overline{C}C) + |\,C\,|^2B\\
& = B\left(AB – |C|^2\right)\geq 0.
\end{align*}

Entonces de $|\,C\,|^2 \leq AB$ se sigue el resultado.

$\blacksquare$

Tarea moral

  1. Verifica las desigualdades de la observación 3.1.
  2. Realiza las demostraciones faltantes en la proposición 3.1.
  3. Considera la observación 3.5. Justifica porqué la primera condición es necesaria y suficiente para que se cumpla la igualdad en la proposición 3.2. Explica porqué son equivalentes las últimas dos condiciones.
  4. Escribe la demostración de la proposición 3.3 de manera detallada.
  5. Realiza por inducción la prueba de la observación 3.6. ¿Qué condición es necesaria y suficiente para que se de la igualdad?
  6. Considera la proposición 3.5, ¿es posible probar la desigualdad de Cauchy-Schawrz por inducción?
  7. Justifica y desarrolla los pasos de la demostración de la desigualdad de Cauchy-Schwarz dada en la proposición 3.4.1. Argumenta de manera detallada porqué se cumple el resultado.
  8. Sean $z_1,z_2,z_3\in\mathbb{C}$. Prueba la siguiente igualdad:
    \begin{equation*}
    (z_1 – z_2)(1+z_3\overline{z_3}) = (z_1 – z_3)(1+z_2\overline{z_3}) + (z_3 – z_2)(1+z_1\overline{z_3}).
    \end{equation*}
  9. Sean $z,w\in\mathbb{C}$ y sea $n\in\mathbb{N}$. Prueba el siguiente resultado:
    \begin{equation*}
    (n+zw)(n+\overline{zw}) \leq \left(n+|\,z\,|^2\right) \left(n+|\,w\,|^2\right). \end{equation*}

Más adelante…

Hasta ahora hemos realizado una interpretación geométrica de los números complejos mediante una correspondencia con los puntos del plano, ahora llamado el plano complejo. Analizamos las operaciones aritméticas de estos números y notamos cómo la suma y resta de números complejos se comportan como la suma y resta vectorial en $\mathbb{R}^2$ respectivamente, mientras que notamos que la multiplicación y división de números complejos se comportan como una rotación compuesta con una homotecia en $\mathbb{R}^2$ y la conjugación compleja se comporta como una reflexión del número complejo sobre el eje real. Observamos que la parte real y la parte imaginaria de un número complejo son las proyecciones de dicho número sobre los ejes real e imaginario respectivamente.

De manera geométrica interpretamos el concepto del módulo de un número complejo como la distancia que hay entre un número $z\in\mathbb{C}$ y el cero. Además probamos algunas propiedades del módulo que nos permitieron caracterizar y entender mejor a los números complejos. Por ejemplo, notamos que en el caso en que un número complejo es un número real entonces el módulo de $\mathbb{C}$ es simplemente el valor absoluto de $\mathbb{R}$ y que a diferencia de $\mathbb{R}$, en $\mathbb{C}$ no es posible establecer un orden que sea compatible con las operaciones de campo definidas en la entrada anterior.

En la siguiente entrada continuaremos analizando al campo $\mathbb{C}$ desde una perspectiva geométrica. Consideraremos el concepto del módulo y sus propiedades para dar una nueva interpretación de un número complejo mediante el uso de coordenadas polares, misma que nos permitirá dar solución a ecuaciones de la forma $w^n = z$, con $w,z\in\mathbb{C}$, $z\neq 0$ y $n\in\mathbb{Z}$.

Entradas relacionadas