Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Cálculo Diferencial e Integral III: Sistemas de ecuaciones lineales

Por Alejandro Antonio Estrada Franco

Introducción

En esta entrada daremos un repaso a la teoría de sistemas de ecuaciones lineales. En caso de que quieras leer una versión detallada, puedes comenzar con la entrada de Sistemas de ecuaciones lineales y sistemas homogéneos asociados que forma parte del curso Álgebra Lineal I aquí en el blog.

Nuestra motivación para este repaso comienza como sigue. Supongamos que $T:\mathbb{R}^n \rightarrow \mathbb{R}^m$ es una transformación lineal. Tomemos un vector $\bar{w}\in \mathbb{R}^m$. Es muy natural preguntarse qué vectores $\bar{v}$ hay en $\mathbb{R}^n$ tales que $T(\bar{v})=\bar{w}$, en otras palabras, preguntarse cuál es la preimagen de $\bar{w}$.

Sistemas de ecuaciones lineales

Continuando con la situación planteada en la introducción, si $A$ es la representación matricial de $T$ en una cierta base $\beta$, podemos contestar la pregunta planteada resolviendo la ecuación matricial $AX=B$ donde $X$, $B$ son las representaciones de los vectores $\bar{v}$, $\bar{w}$ en la base $\beta$, respectivamente. Una vez llegado a este punto, la ecuación $AX=B$ nos conduce a que se deban cumplir varias igualdades. Veamos cuáles son en términos de las entradas de $A$, $X$ y $Y$. Pensemos que $$A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix}.$$

Pensemos también que $X$ es el vector columna con entradas (incógnitas) $x_1,\ldots,x_n$, y que $B$ es el vector columna con entradas $b_1,\ldots,b_m$.

Al realizar las operaciones, la igualdad $AX=B$ se traduce en que se deban cumplir todas las siguientes ecuaciones simultáneamente:

\begin{equation}\left\{
\begin{matrix} a_{11}x_{1} + & \dots & + a_{1n}x_{n} & = b_{1} \\
\vdots & \ddots & \vdots & \vdots \\
a_{m1}x_{1} + & \dots & + a_{mn}x_{n} & = b_{m}
\end{matrix}\right.
\label{eq:sistema}
\end{equation}

Definición. Un sistema de $m$ ecuaciones lineales con $n$ incógnitas es un sistema de ecuaciones de la forma \eqref{eq:sistema}. Como discutimos arriba, al sistema también lo podemos escribir de la forma $AX=B$. A la matriz $A$ le llamamos la matriz de coeficientes. Al vector $X$ le llamamos el vector de incógnitas.

Resolver el sistema \eqref{eq:sistema} se refiere a determinar todos los posibles valores que pueden tomar las incógnitas $x_1,\ldots,x_n$ de manera que se cumplan todas las ecuaciones dadas.

Definición. Diremos que dos sistemas de ecuaciones son equivalentes si tienen las mismas soluciones.

Un resultado importante que relaciona a los sistemas de ecuaciones con las operaciones elementales que discutimos con anterioridad es el siguiente.

Proposición. Sea $A\in M_{m,n}(\mathbb{R})$ y $e$ una operación elemental cualquiera (intercambio de renglones, reescalamiento de renglón, o transvección). Entonces el sistema de ecuaciones $AX=B$ es equivalente al sistema de ecuaciones $e(A)X=e(B)$.

En otras palabras, si comenzamos con un sistema de ecuaciones $AX=B$ y aplicamos la misma operación elemental a $A$ y a $B$, entonces obtenemos un sistema equivalente. Veamos como ejemplo un esbozo de la demostración en el caso del reescalamiento de vectores. Los detalles y las demostraciones para las otras operaciones elementales quedan como ejercicio.

Demostración. Consideremos el rescalamiento $e$ de la $j$-ésima columna de una matriz por un factor $r$. Veremos que $e(A)X=e(B)$. Tomemos

\[ A=\begin{pmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \dots & a_{mn} \end{pmatrix}, B= \begin{pmatrix} b_{1} \\ \vdots \\ b_{m} \end{pmatrix}, X=\begin{pmatrix} x_{1} \\ \vdots \\ x_{n} \end{pmatrix} \]

Entonces la ecuación matricial $AX=B$ nos produce el siguiente sistema de ecuaciones lineales:
\[ \left\{\begin{matrix} a_{11}x_{1}+ & \dots & +a_{1n}x_{n}=b_{1} \\ \vdots & \ddots & \vdots \\ a_{m1}x_{1}+ & \dots & +a_{mn}x_{n}=b_{m}. \end{matrix} \right.\]

Tomemos una solución del sistema: \[ X’= \begin{pmatrix} x_{1}’\\ \vdots \\ x_{n}’ \end{pmatrix} \]

La ecuación matricial $e(A)X=e(B)$ nos produce el siguiente sistema de ecuaciones: \[ \left\{\begin{matrix} a_{11}x_{1}+ & \dots & +a_{1n}x_{n}=b_{1} \\ \vdots & \ddots & \vdots \\ ra_{j1}x_{1}+ & \dots & +ra_{jn}x_{n}=rb_{j} \\ \vdots & \ddots \ & \vdots \\ a_{m1}x_{1}+ & \dots & +a_{mn}x_{n}=b_{m}. \end{matrix}\right. \]

Ahora, de cada una de las $n$ ecuaciones, excepto la $j$-ésima, sabemos que se solucionan al sustituir $x_{1}’, \dots ,x_{m}’$, resta revisar la $j$-ésima ecuación. Lo que sí sabemos de que $X’$ sea solución es que $$a_{j1}x_{1}’+ \dots +a_{jn}x_{n}’=b_{j}.$$ Así, al multiplicar por $r$ de ambos lados $ra_{j1}x_{1}’+ \dots + ra_{jn}x_{n}’=rb_{j}$. Así obtenemos que $X’$ satisface también a $e(A)X=e(B)$. Inversamente si una solución satisface al sistema $e(A)X=e(B)$ también lo hace para $AX=Y$. Te recomendamos revisar los detalles por tu cuenta.

$\square$

Soluciones a sistemas de ecuaciones lineales

La teoría de sistemas de ecuaciones lineales nos dice que tenemos tres posibles situaciones que se pueden presentar cuando estamos resolviendo un sistema de ecuaciones lineales en $\mathbb{R}$: no hay solución, hay una única solución, o tenemos infinidad de soluciones. Por ejemplo, se puede descartar que haya exactamente dos soluciones. En cuanto sucede esto, la cantidad de soluciones se dispara a una infinidad

Haremos una discusión de cuándo se presenta cada caso. De acuerdo con la sección anterior, cualquier operación elemental pasa un sistema de ecuaciones a uno equivalente. Además, de acuerdo con el teorema de reducción gaussiana, cualquier matriz puede ser llevada a la forma escalonada reducida. Así, al aplicar tanto a $A$ como a $B$ las operaciones elementales que llevan $A$ a su forma escalonada reducida $A_{red}$, llegamos a un sistema equivalente $A_{red}X=C$. El comportamiento del conjunto solución de $AX=B$ se puede leer en este otro sistema equivalente como sigue:

  1. Sin solución. El sistema $AX=B$ no tiene solución si en $A_{red}X=C$ hay una igualdad lineal del estilo $0x_{j1}+\dots +0x_{jn}=c_j$, con $c_j\neq 0$. En otras palabras, si en $A_{red}$ hay una fila $j$ de ceros y la entrada $c_j$ es distinta de cero.
  2. Infinidad de soluciones. El sistema $AX=B$ tiene una infinidad de soluciones si tiene solución, y además hay por lo menos una columna $k$ de $A_{red}$ en la que no haya pivote de ninguna fila. Esta columna $k$ corresponde a una variable libre $x_k$ que puede tomar cualquier valor, y el sistema tiene soluciones sin importar el valor que se le de a esta variable.
  3. Solución única. Un sistema de ecuaciones con solución, pero sin variables libres tiene una única solución. Esto se puede leer en la matriz $A_{red}$, pues se necesita que todas las columnas tengan un pivote de alguna fila.

Pensemos un poco a qué se deben los comportamientos anteriores. Pensemos en que ya llegamos a $A_{red}X=C$. Iremos determinando los posibles valores de las entradas de $X$ de abajo hacia arriba, es decir, en el orden $x_n, x_{n-1},\ldots, x_1$. Si $x_k$ es variable libre, pongamos el valor que sea. Si $x_k$ tiene el pivote de, digamos, la fila $j$, entonces la ecuación $j$ nos dice \[0+\dots + 0 + x_{k}+\dots +a_{jn}x_{n}=b_{j}.\] Esto nos diría que \[x_{k}=b_{j}-a_{j(k+1)}x_{k+1}-\dots -a_{jn}x_{n},\] así que hemos logrado expresar a $x_k$ en términos de las variables ya determinadas $x_{k+1},\dots x_{n}$.

Matrices equivalentes por filas

Definición. Consideremos $I\in M_{m}(\mathbb{R})$ la matriz identidad de tamaño $m$. Una matriz elemental será una matriz que se obtenga de la identidad tras aplicar una operación elemental.

Definición. Sean $A, B\in M_{m,n}(\mathbb{R})$. Diremos que $A$ es equivalente por filas a $B$ si $A$ se puede obtener al aplicar una sucesión finita de operaciones elementales a $B$.

Se puede demostrar que «ser equivalente por filas» es una relación de equivalencia en $M_{m,n}(\mathbb{R})$. Así mismo, se puede demostrar en general que si $e$ es una operación elemental, entonces $e(A)$ es exactamente la misma matriz que multiplicar la matriz elemental $e(I)$ por la izquierda por $A$, es decir, $e(A)=e(I)A$. Como tarea moral, convéncete de ambas afirmaciones.

Para realizar la demostración, quizás quieras auxiliarte de la siguiente observación. Tomemos una matriz $B\in M_{m,n}(\mathbb{R})$ y pensemos en cada columna de $B$ como un vector columna:

\[ B_{1} =\begin{pmatrix} B_{11} \\ \vdots \\ B_{m1} \end{pmatrix} \hspace{1cm} \cdots \hspace{1cm} B_{n} =\begin{pmatrix} B_{1n} \\ \vdots \\ B_{mn} \end{pmatrix}. \]

Tomemos ahora una matriz $A\in M_{p,m}$. Tras realizar las operaciones, se puede verificar que la matriz $AB$ tiene como columnas a los vectores columna $AB_1, AB_2,\ldots,AB_n$.

El siguiente teorema nos da una manera alternativa de saber si dos matrices son equivalentes por filas.

Teorema. Sean $A, B\in M_{m\times n}(\mathbb{R})$. Se tiene que $B$ es equivalente por filas a $A$ si y sólo si $B=PA$, donde $P$ es una matriz en $M_m(\mathbb{R})$ obtenida como producto de matrices elementales.

Demostración. Por la discusión anterior, si $B$ es equivalente por filas a $A$, $A$ resulta de la aplicación de una sucesión finita de operaciones elementales a $B$ o, lo que es lo mismo, resulta de una aplicación finita de productos de matrices elementales por la izquierda. Por otro lado, si $B=PA$, con $P=E_{k}\cdot … \cdot E_{1}$ producto de matrices elementales, tenemos que $E_{1}A$ es equivalente por filas a $A$, que $E_{2}(E_{1}A)$ es equivalente por filas a $E_{1}A$, que $E_{3}(E_2(E_1(A)))$ equivalente por filas a $E_2(E_1(A))$, y así sucesivamente. Usando que ser equivalente por filas es transitivo (por ser relación de equivalencia), concluimos que $B$ es equivalente por filas a $A$.

$\square$

¿Qué sucede con los determinantes y las operaciones elementales? La siguiente proposición lo resume.

Proposición. Sea $A$ una matriz en $M_n(\mathbb{R})$ con determinante $\det(A)$.

  • Si se intercambian dos filas, el determinante se vuelve $-\det(A)$.
  • Si se reescala una fila por un real $r\neq 0$, el determinante se vuelve $r\det(A)$.
  • Si se hace una transvección, el determinante no cambia.

Observa que, en particular, si $\det(A)\neq 0$, entonces sigue siendo distinto de cero al aplicar operaciones elementales.

Matrices invertibles y sistemas de ecuaciones lineales

En muchas ocasiones nos encontramos en cálculo de varias variables con funciones que van de $\mathbb{R}^n$ a sí mismo. Si la función que estamos estudiando es una transformación lineal, entonces corresponde a una matriz cuadrada en $M_n(\mathbb{R})$. En estos casos hay otro concepto fundamental que ayuda, entre otras cosas, para resolver sistemas de ecuaciones lineales: el de matriz invertible. Veremos a continuación que esto interrelaciona a las matrices, las matrices elementales, los sistemas de ecuaciones lineales y a los determinantes.

Definición. Una matriz $A$ cuadrada es invertible por la izquierda (resp. derecha) si existe una matriz $B$ tal que $BA=I$ (resp. $AB=I$). A $B$ le llamamos la inversa izquierda (resp. derecha) de $A$. A una matriz invertible por la derecha y por la izquierda, donde la inversa izquierda sea igual a la derecha, simplemente se le llama invertible.

Se puede demostrar que, cuando existe, la matriz izquierda (o derecha) es única. Esto es sencillo. Se puede demostrar también que si $B$ es inversa izquierda y $B’$ es inversa derecha, entonces $B=B’$, lo cual no es tan sencillo. Además, se cumplen las siguientes propiedades de matrices invertibles.

Proposición. Sean $A, B\in M_n(\mathbb{R})$

  1. Si $A$ es invertible, también lo es $A^{-1}$ y $(A^{-1})^{-1}=A$.
  2. Si $A$ y $B$ son invertibles, también lo es $AB$ y $(AB)^{-1}=B^{-1} A^{-1}$.

Demostración. El inciso 1 es claro; para el inciso 2 tenemos \[ (AB)(B^{-1} A^{-1})=A(BB^{-1})A^{-1}=A(I)A^{-1}=AA^{-1}=I\] \[=B^{-1}(I)B=B^{-1}(A^{-1}A)B=(B^{-1}A^{-1})(AB) \].

$\square$

Veamos ahora cómo se conecta la noción de invertibilidad con la de matrices elementales. Como parte de la tarea moral, cerciórate de que cualquiera de las tres operaciones elementales para matrices son invertibles. Es decir, para cada operación elemental, piensa en otra operación elemental que aplicada sucesivamente a la primera nos de la matriz original. Con más detalle; si denotamos con $e$ a una operación elemental (puede ser cualquiera) denotamos como $e^{-1}$ a la segunda a la cual llamaremos inversa de $e$; y estas cumplen $e(e^{-1})(A)=A=e^{-1}(e(A))$ para cualquier matriz $A$ a la que se le pueda aplicar $e$.

Proposición. Toda matriz elemental es invertible.

Demostración. Supongamos que $E$ una matriz elemental correspondiente a la operación unitaria $e$. Si $e^{-1}$ es la operación inversa de $e$ y $E_{1}=e^{-1}(I)$ tenemos: \[ EE_{1}=e(E_{1})=e(e^{-1}(I))=I,\] y así mismo tenemos \[E_{1}E=e_{1}(E)=e_{1}(e(I))=I.\] De esta manera $E$ es invertible y su inversa es $E_{1}$.

$\square$

El resultado anterior habla sólo de la invertibilidad de matrices elementales, pero podemos usar a estas para caracterizar a las matrices invertibles.

Teorema. Sea $A\in M_n(\mathbb{R})$, los siguientes enunciados son equivalentes:

  1. $A$ es invertible
  2. $A$ es equivalente por filas a la matriz identidad
  3. $A$ es producto de matrices elementales

Demostración. $1\Rightarrow 2)$. Supongamos que $A$ invertible, y usemos el teorema de reducción Gaussiana para encontrar la forma escalonada reducida $A_{red}$ de $A$ mediante una sucesión de operaciones elementales. Por el teorema de la sección de matrices equivalentes por filas, tenemos que $R=E_{k}\cdots E_{1}A$, donde $E_{k},\dots ,E_{1}$ son matrices elementales. Cada $E_{i}$ es invertible, y $A$ es invertible. Por la proposición anterior, tenemos entonces que $A_{red}$ es invertible. Se puede mostrar que entonces ninguna fila de $A_{red}$ puede consistir de puros ceros (verifícalo de tarea moral), de modo que toda fila de $A$ tiene pivote (que es igual a $1$). Como hay $n$ filas y $n$ columnas, entonces hay exactamente un $1$ en cada fila y en cada columna. A $A_{red}$ no le queda otra opción que ser la matriz identidad.

$2\Rightarrow 3)$. Si $A$ es equivalente por filas a $I$, entonces hay operaciones elementales que la llevan a $I$. Como ser equivalente por filas es relación de equivalencia, existen entonces operaciones elementales que llevan $I$ a $A$. Pero entonces justo $A$ se obtiene de $I$ tras aplicar un producto (por la izquierda) de matrices elementales. Por supuesto, en este producto podemos ignorar a $I$ (o pensarla como un reescalamiento por $1$).

$3\Rightarrow 1)$. Finalmente como cada matriz elemental es invertible y todo producto de matrices invertibles es invertible tenemos que 3 implica 1.

$\square$

Ya que entendemos mejor la invertibilidad, la podemos conectar también con la existencia y unicidad de soluciones en sistemas de ecuaciones lineales.

Teorema. Sea $A\in M_{n}(\mathbb{R})$; las siguientes afirmaciones son equivalentes:

  1. $A$ es invertible.
  2. Para todo $Y$, el sistema $AX=Y$ tiene exactamente una solución $X$.
  3. Para todo $Y$, el sistema $AX=Y$ tiene al menos una solución $X$.

Demostración. $1\Rightarrow 2)$. Supongamos $A$ invertible. Tenemos que $X=A^{-1}Y$ es solución pues $AX=A(A^{-1})Y=IY=Y$. Veamos que la solución es única. Si $X$ y $X’$ son soluciones, tendríamos $AX=Y=AX’$. Multiplicando por $A^{-1}$ por la izquierda en ambos lados de la igualdad obtenemos $X=X’$.

$2\Rightarrow 3)$. Es claro pues la única solución es, en particular, una solución.

$3\Rightarrow 1)$. Tomemos los vectores canónicos $\hat{e}_1,\hat{e}_2,\ldots,\hat{e}_n$ de $\mathbb{R}^n$. Por $(3)$ tenemos que todos los sistemas $AX=\hat{e}_1, \ldots, AX=\hat{e}_n$ tienen solución. Tomemos soluciones $B_1,\ldots,B_n$ para cada uno de ellos y tomemos $B$ como la matriz con columnas $B_1,\ldots, B_n$. Por el truco de hacer el producto de matrices por columnas, se tiene que las columnas de $AB$ son $AB_1=\hat{e}_1,\ldots, AB_n=\hat{e}_n$, es decir, $AB$ es la matriz identidad.

$\square$

En la demostración anterior falta un detalle importante. ¿Puedes encontrar cuál es? Está en la demostración $3\Rightarrow 1)$. Si quieres saber cuál es y cómo arreglarlo, puedes consultar la entrada Mariposa de 7 equivalencias de matrices invertibles.

Terminamos la teoría de esta entrada con un resultado que conecta invertibilidad y determinantes.

Proposición. Sea $A\in M_{n}(\mathbb{R})$. $A$ es invertible, si y sólo si, $det(A)\neq 0$.

Demostración. Si $A$ es invertible, entonces se cumple la ecuación $I=AA^{-1}$. Aplicando determinante de ambos lados y usando que es multiplicativo: $$1=det(I)=det(AA^{-1})=det(A)det(A^{-1}).$$ Como al lado izquierdo tenemos un $1$, entonces $\det(A)\neq 0$.

Si $det(A)\neq 0$, llevemos $A$ a su forma escalonada reducida $A_{red}$. Por la observación hecha al final de la sección de matrices elementales, se tiene que $\det(A_{red})\neq 0$. Así, en cada fila tenemos por lo menos un elemento no cero. Como argumentamos anteriormente, esto implica $A_{red}=I$. Como $A$ es equivalente por filas a $I$, entonces es invertible.

$\square$

Mas adelante…

Continuaremos estableciendo herramientas de Álgebra lineal que usaremos en el desarrollo de los temas subsiguientes. En la siguiente entrada hablaremos de eigenvalores y eigenvectores. Con ellos, expondremos un método que proporciona una representación matricial sencilla simple para cierto tipos de transformaciones lineales.

Tarea moral

  1. Demuestra que la relación «es equivalente por filas» es una relación de equivalencia en $M_{m,n}(\mathbb{R})$.
  2. Sea $A\in M_{m,n}\mathbb{R}$. Verifica que para cualquier operación elemental $e$ de cualquiera de los tres tipos se cumple que $e(A)X=e(B)$ es equivalente a $AX=B$. Deberás ver que cualquier solución de uno es solución del otro y viceversa.
  3. Demuestra que si $A$ es invertible, también lo es $A^{-1}$ y que $(A^{-1})^{-1}=A$. Verifica la invertibilidad izquierda y derecha.
  4. Demuestra que cualquiera de las tres operaciones elementales para matrices son invertibles. Es decir, para cada operación elemental, hay otra que al aplicarla sucesivamente nos regresa a la matriz original.
  5. Prueba que una matriz invertible tiene por lo menos un elemento distinto de cero en cada fila, y por lo menos un elemento distinto de cero en cada columna.

Entradas relacionadas

Variable Compleja I: Funciones trigonométricas e hiperbólicas complejas

Por Pedro Rivera Herrera

Introducción

En las dos entradas anteriores hemos definido y obtenido una serie de resultados de las funciones exponencial compleja y logaritmo complejo, mediante las cuales hemos extendido sobre $\mathbb{C}$ a las funciones reales exponencial y logaritmo, respectivamente.

En esta entrada definiremos a las funciones trigonométricas complejas así como a las funciones hiperbólicas complejas y obtendremos para ambas algunas de sus propiedades más elementales, extendiendo sobre $\mathbb{C}$ a sus correspondientes versiones reales.

Notemos que mediante la identidad de Euler podemos relacionar a las funciones trigonométricas reales con la función exponencial compleja. Tenemos que: \begin{equation*} e^{i\theta} = \operatorname{cos}(\theta) + i \operatorname{sen}(\theta), \tag{22.1} \end{equation*} donde $\theta$ es un número real. Sustituyendo $\theta$ por $-\theta$ tenemos que: \begin{align*} e^{-i\theta} & = \operatorname{cos}(-\theta) + i \operatorname{sen}(-\theta)\\ & = \operatorname{cos}(\theta) – i \operatorname{sen}(\theta). \tag{22.2} \end{align*}

Sumando (22.1) y (22.2) tenemos que: \begin{equation*} \operatorname{cos}(\theta) = \frac{e^{i\theta} + e^{-i\theta}}{2}. \tag{22.3} \end{equation*}

Por otra parte, restando a (22.1) la ecuación (22.2) tenemos que: \begin{equation*} \operatorname{sen}(\theta) = \frac{e^{i\theta} – e^{-i\theta}}{2i}. \tag{22.4} \end{equation*}

Las expresiones obtenidas en (22.3) y (22.4) nos motivan a extender las funciones trigonométricas reales a $\mathbb{C}$ mediante la siguiente:

Definición 22.1. (Funciones seno y coseno complejas.)
Sea $z\in\mathbb{C}$. Definimos a las funciones complejas seno y coseno, respectivamente, como: \begin{equation*} \operatorname{sen}(z) := \frac{e^{iz} – e^{-iz}}{2i}, \quad \operatorname{cos}(z) := \frac{e^{iz} + e^{-iz}}{2}. \end{equation*}

Ejemplo 22.1.
Sea $z\in\mathbb{C}$. Determinemos los ceros de las funciones complejas seno y coseno y veamos que son todos reales.

Solución. Tenemos que: \begin{align*} \operatorname{sen}(z) = \frac{e^{iz} – e^{-iz}}{2i} = 0 \quad & \Longleftrightarrow \quad e^{iz} – e^{-iz} = 0,\\ & \Longleftrightarrow \quad e^{iz} = e^{-iz},\\ & \Longleftrightarrow \quad e^{2iz} = 1 = e^{2k\pi i}, \quad k \in \mathbb{Z}, \end{align*} de donde $2iz = 2\pi i(k+n)$ para $k\in\mathbb{Z}$ y para alguna $n\in\mathbb{Z}$ (corolario 20.2), es decir $z = k’\pi$ con $k’=k+n \in \mathbb{Z}$, por lo que los ceros de la función seno son $z=0, \pm\pi, \pm2\pi, \pm 3\pi, \ldots$.

Procedemos de manera análoga para la función coseno, es decir: \begin{align*} \operatorname{cos}(z) = \frac{e^{iz} + e^{-iz}}{2} = 0 \quad & \Longleftrightarrow \quad e^{iz} + e^{-iz} = 0,\\ & \Longleftrightarrow \quad e^{iz} = -e^{-iz},\\ & \Longleftrightarrow \quad e^{2iz} = -1 = e^{(2k+1)\pi i}, \quad k \in \mathbb{Z}, \end{align*}

entonces $2iz = (2(k+n)+1)\pi i$ para $k\in\mathbb{Z}$ y para alguna $n\in\mathbb{Z}$ (corolario 20.2), es decir $z = \left(k’ + \frac{1}{2}\right)\pi$ con $k’=k+n \in \mathbb{Z}$, por lo que los ceros de la función coseno son $z=\pm\pi/2, \pm3\pi/2, \pm 5\pi/2, \ldots$.

En ambos casos es claro que los ceros de las funciones seno y coseno son todos reales.

Observación 22.1.
De nuestros cursos de Cálculo sabemos que las funciones reales hipérbolicas seno y coseno se definen, para $x\in\mathbb{R}$, respectivamente como: \begin{equation*} \operatorname{senh}(x) = \frac{e^x – e^{-x}}{2}, \quad \operatorname{cosh}(x) = \frac{e^x + e^{-x}}{2}. \end{equation*}

Al igual que en el caso real, las funciones trigonométricas complejas satisfacen algunas identidades con las que ya estamos familiarizados y que suelen ser de utilidad en la resolución de ciertos problemas.

Proposición 22.1. (Identidades trigonométricas seno y coseno.)
Sean $z, z_1, z_2 \in \mathbb{C}$, con $z=x+iy$, entonces las funciones trigonométricas complejas seno y coseno satisfacen:

  1. $\operatorname{sen}(-z) = -\operatorname{sen}(z)$ y $\operatorname{cos}(z) = \operatorname{cos}(-z)$.
  2. $\operatorname{sen}(z_1 \pm z_2) = \operatorname{sen}(z_1) \operatorname{cos}(z_2) \pm \operatorname{sen}(z_2) \operatorname{cos}(z_1)$.
  3. $\operatorname{cos}(z_1 \pm z_2) = \operatorname{cos}(z_1) \operatorname{cos}(z_2) \mp \operatorname{sen}(z_1) \operatorname{sen}(z_2)$.
  4. Son $2\pi$-periódicas.
  5. $\operatorname{sen}\left(z+\frac{\pi}{2}\right) = \operatorname{cos}(z)$ y $\operatorname{cos}\left(z+\frac{\pi}{2}\right) = -\operatorname{sen}(z)$.
  6. Fórmula de Euler para argumentos complejos: \begin{equation*} e^{iz} = \operatorname{cos}(z) + i \operatorname{sen}(z). \end{equation*}
  7. $\operatorname{cos}^2(z) + \operatorname{sen}^2(z) = 1$.
  8. $\operatorname{sen}^2(z) = \dfrac{1-\operatorname{cos}(2z)}{2}$.
  9. $\operatorname{cos}^2(z) = \dfrac{1+\operatorname{cos}(2z)}{2}$.
  10. $\operatorname{sen}(z) = \operatorname{sen}(x) \operatorname{cosh}(y) + i\operatorname{cos}(x) \operatorname{senh}(y)$.
  11. $\cos(z) = \cos(x) \cosh(y) – i\operatorname{sen}(x) \operatorname{senh}(y)$.

Demostración. Sea $z=x+iy\in\mathbb{C}$, entonces:

  1. De acuerdo con la definición 22.1 tenemos que: \begin{equation*} \operatorname{sen}{(-z)} = \frac{e^{i(-z)} – e^{-i(-z)}}{2i} = \frac{e^{-iz} – e^{iz}}{2i} = – \left(\frac{e^{iz} – e^{-iz}}{2i}\right) =\operatorname{sen}{(z)}, \end{equation*} \begin{equation*} \operatorname{cos}{(-z)} = \frac{e^{i(-z)} + e^{-i(-z)}}{2} = \frac{e^{-iz} + e^{iz}}{2} = \operatorname{cos}{(z)}. \end{equation*}
  2. Se deja como ejercicio al lector.
  3. Se deja como ejercicio al lector.
  4. De acuerdo con la definición 22.1 y la proposición 20.2 tenemos que: \begin{equation*} \operatorname{sen}{(z+2\pi)} = \frac{e^{i(z+2\pi)} – e^{-i(z+2\pi)}}{2i} = \frac{e^{iz}e^{i 2\pi} – e^{-iz}e^{-i2\pi}}{2i} = \frac{e^{iz} – e^{-iz}}{2i} = \operatorname{sen}{(z)}, \end{equation*} \begin{equation*} \cos{(z+2\pi)} = \frac{e^{i(z+2\pi)} + e^{-i(z+2\pi)}}{2} = \frac{e^{iz}e^{i 2\pi} + e^{-iz}e^{-i2\pi}}{2} = \frac{e^{iz} + e^{-iz}}{2} = \cos{(z)}. \end{equation*}
  5. Se deja como ejercicio al lector.
  6. De acuerdo con la definición 22.1 tenemos que: \begin{equation*} \cos{(z)} + i\operatorname{sen}{(z)} = \frac{e^{iz} + e^{-iz}}{2} + i\left(\frac{e^{iz} – e^{-iz}}{2i}\right) = \frac{e^{iz} + e^{-iz} + e^{iz} – e^{-iz}}{2} = e^{iz}. \end{equation*}
  7. Considerando los resultados (1) y (6), tenemos que: \begin{align*} 1 = e^{iz} e^{-iz} & = \left[ \cos{(z)} + i\operatorname{sen}{(z)}\right]\left[\cos{(-z)} + i\operatorname{sen}{(-z)}\right]\\ & = \left[ \cos{(z)} + i\operatorname{sen}{(z)}\right]\left[\cos{(z)} – i\operatorname{sen}{(z)}\right]\\ & = \left[\cos{(z)}\right]^2 – \left[i\operatorname{sen}{(z)}\right]^2\\ & = \cos^2{(z)} + \operatorname{sen}^2{(z)}. \end{align*}
  8. De acuerdo con (3), para $z=z_1=z_2$ tenemos que: \begin{equation*} \operatorname{cos}{(2z)} = \operatorname{cos}^2{(z)} – \operatorname{sen}^2{(z)}. \end{equation*} Por otra parte, de (7) tenemos que: \begin{equation*} \operatorname{cos}^2{(z)} = 1 – \operatorname{sen}^2{(z)}. \end{equation*} Por lo que: \begin{equation*} \operatorname{cos}{(2z)} = 1 – \operatorname{sen}^2{(z)} – \operatorname{sen}^2{(z)} = 1 – 2\operatorname{sen}^2{(z)}, \end{equation*} de donde se sigue el resultado.
  9. Se deja como ejercicio al lector.
  10. De acuerdo con la proposición 20.2 y la observación 22.1 tenemos que: \begin{align*} \operatorname{sen}(z) = \operatorname{sen}{(x+iy)} & = \frac{e^{i(x+iy)} – e^{-i(x+iy)}}{2i}\\ & = \frac{e^{-y+ix} – e^{y-ix}}{2i}\\ & = \frac{e^{-y}e^{ix} – e^{y}e^{-ix}}{2i}\\ & = \frac{e^{-y}\left[\operatorname{cos}(x)+i\operatorname{sen}(x)\right] – e^{y}\left[\operatorname{cos}(-x)+i\operatorname{sen}(-x)\right]}{2i}\\ & = \frac{-\operatorname{cos}(x)\left[ e^{y} – e^{-y} \right] + i\operatorname{sen}(x)\left[ e^{-y} + e^{y} \right]}{2i}\\ & = \operatorname{sen}(x) \left( \frac{e^{y}+e^{-y}}{2}\right) + i \operatorname{cos}(x) \left( \frac{e^{y} – e^{-y}}{2}\right)\\ & = \operatorname{sen}(x) \operatorname{cosh}(y) + i\operatorname{cos}(x) \operatorname{senh}(y). \end{align*}
  11. Se deja como ejercicio al lector.

$\blacksquare$

Ejemplo 22.2.
Determina todas las soluciones de la ecuación $\cos{(z)} = 2$.

Solución. Sea $z=x+iy\in\mathbb{C}$, entonces por el resultado anterior tenemos que la ecuación dada se puede reescribir como: \begin{equation*} \cos(z) = \cos(x) \cosh(y) – i\operatorname{sen}(x) \operatorname{senh}(y) = 2. \end{equation*}

Tomando las partes real e imaginaria de esta última igualdad tenemos: \begin{equation*} \left\{ \begin{array}{l} \cos(x) \cosh(y) = 2, \tag{22.5}\\ \operatorname{sen}(x) \operatorname{senh}(y) = 0. \end{array} \right. \end{equation*}

Procedemos a resolver este sistema de ecuaciones para las variables $x$ e $y$.

Notemos que si $y=0$, entonces $\cosh(0)=1$, por lo que de la primera ecuación de (22.5) se tiene que: \begin{equation*} \cos(x) = 2, \end{equation*} lo cual claramente no es posible para ningún valor de $x\in\mathbb{R}$, por tanto concluimos que $y\neq 0$.

Como $y\neq 0$, entonces $\operatorname{senh}(y)\neq 0$, por lo que de la segunda ecuación de (22.5) se tiene que: \begin{equation*} \operatorname{sen}(x) = 0, \end{equation*} de donde $x = n\pi$, con $n\in\mathbb{Z}$.

Sustituyendo lo anterior en la primera ecuación, para $n\in\mathbb{Z}$ tenemos que: \begin{equation*} \cos\left( n\pi\right) \cosh(y) = 2 \quad \Longleftrightarrow \quad \left( -1\right)^n \cosh(y) = 2, \end{equation*} pero como $\cosh(y)>0$ para toda $y\in\mathbb{R}$, entonces $n$ debe ser par, es decir: \begin{equation*} x = 2k\pi, \end{equation*} para $k\in\mathbb{Z}$. Por lo que: \begin{align*} \cosh{(y)} = 2 \quad &\Longleftrightarrow \quad \frac{e^{y} + e^{-y}}{2} = 2,\\ &\Longleftrightarrow \quad e^{y} + e^{-y} = 4,\\ &\Longleftrightarrow \quad e^{y}e^{y} + e^{-y}e^{y} – 4e^{y} = 0,\\ &\Longleftrightarrow \quad \left(e^{y}\right)^2 – 4e^{y} + 1 = 0. \end{align*}

Resolviendo la ecuación cuadrática para $e^y$, tenemos: \begin{equation*} e^y = \frac{-(-4) \pm \sqrt{(-4)^2 – 4(1)(1)}}{2(1)} = \frac{4\pm 2\sqrt{3}}{2} = 2 \pm \sqrt{3}, \end{equation*} de donde $y = \ln{\left(2 \pm \sqrt{3}\right)}$.

Notemos que: \begin{equation*} \ln{\left(2 – \sqrt{3}\right)} = \ln{\left(\frac{\left[2 – \sqrt{3} \, \right] \left[2 + \sqrt{3} \, \right] }{2 + \sqrt{3}}\right)} = \ln{\left(\frac{1}{2 + \sqrt{3}}\right)} = – \ln{\left(2 + \sqrt{3}\right)}, \end{equation*} por lo que: \begin{equation*} y = \pm \ln{\left(2 + \sqrt{3}\right)}. \end{equation*}

Entonces, las soluciones de la ecuación $\cos{(z)} = 2$ son: \begin{equation*} z = 2k\pi \pm i \ln{\left(2 + \sqrt{3}\right)}, \quad k\in\mathbb{Z}. \end{equation*}

Considerando la definición 22.1 y el hecho de que las funciones complejas seno y coseno son una extensión de las funciones trigonométircas reales, resulta natural definir el resto de las funciones trigonométricas complejas mediante estas dos funciones.

Definición 22.2. (Funciones trigonométricas complejas.)
Sea $z\in\mathbb{C}$. Definimos a las funciones {\bf trigonométricas complejas} como: \begin{equation*} \operatorname{tan}(z) := \frac{\operatorname{sen}(z)}{\operatorname{cos}(z)} = -i \left( \frac{e^{iz} – e^{-iz}}{e^{iz} + e^{-iz}} \right), \quad \operatorname{cos}(z)\neq 0, \end{equation*} \begin{equation*} \operatorname{cot}(z) := \frac{\operatorname{cos}(z)}{\operatorname{sen}(z)} = i \left( \frac{e^{iz} + e^{-iz}}{e^{iz} – e^{-iz}}\right), \quad \operatorname{sen}(z)\neq 0, \end{equation*} \begin{equation*} \operatorname{sec}(z) := \frac{1}{\operatorname{cos}(z)} = \frac{2}{e^{iz} + e^{-iz}}, \quad \operatorname{cos}(z)\neq 0, \end{equation*} \begin{equation*} \operatorname{csc}(z) := \frac{1}{\operatorname{sen}(z)} = \frac{2i}{e^{iz} – e^{-iz}}, \quad \operatorname{sen}(z)\neq 0. \end{equation*}

Observación 22.2.
Notemos que las funciones trigonométricas dadas en la definición anterior son funciones racionales, por lo que tanto su dominio natural como su dominio de analicidad dependen de los ceros de las funciones complejas seno y coseno.

Ejemplo 22.3. La función tangente compleja es $\pi$-periódica. Veamos que $\operatorname{tan}(z_1) = \operatorname{tan}(z_2)$ si y solo si $z_1 = z_2 + k\pi$, con $k\in\mathbb{Z}$.

Solución. De acuerdo con el ejemplo 22.1 tenemos que la función tangente compleja no está definida para los valores de $z = \left(k + \frac{1}{2}\right)\pi$, con $k \in \mathbb{Z}$, entonces consideremos a $z_1, z_2 \in \mathbb{C}$ tales que $z_1, z_2 \neq \left(k + \frac{1}{2}\right)\pi$. Por la proposición 22.1(2) tenemos que: \begin{align*} \operatorname{tan}(z_1) = \operatorname{tan}(z_2) \quad & \Longleftrightarrow \quad \frac{\operatorname{sen}(z_1)}{\operatorname{cos}(z_1)} = \frac{\operatorname{sen}(z_2)}{\operatorname{cos}(z_2)}\\ & \Longleftrightarrow \quad \operatorname{sen}(z_1) \operatorname{cos}(z_2) – \operatorname{sen}(z_2) \operatorname{cos}(z_1) = 0\\ & \Longleftrightarrow \quad \operatorname{sen}(z_1 – z_2) = 0\\ & \Longleftrightarrow \quad z_1 – z_2 = k\pi, \quad k\in\mathbb{Z},\\ & \Longleftrightarrow \quad z_1 = z_2 + k\pi, \quad k\in\mathbb{Z}. \end{align*}

Es posible deducir una serie de identidades para las funciones trigonométricas complejas con las que ya estamos familiarizados.

Proposición 22.2. (Identidades funciones trigonométricas.)
Sean $z,z_1,z_2\in\mathbb{C}$. Considerando el dominio de definición de cada una de las funciones trigonométricas complejas, tenemos que:

  1. $\tan(-z) = -\tan(z)$.
  2. $\cot(-z) = -\cot(z)$.
  3. $\sec(-z) = \sec(z)$.
  4. $\csc(-z) = -\csc(z)$.
  5. $1+\tan^2(z) = \sec^2(z)$.
  6. $1+\cot^2(z) = \csc^2(z)$.
  7. $\tan(z_1\pm z_2) = \dfrac{\tan(z_1)\pm \tan(z_2)}{1\mp \tan(z_1)\tan(z_2)}$.
  8. $\cot(z_1\pm z_2) = \dfrac{\cot(z_1)\cot(z_2)\mp 1}{\cot(z_1)\pm \cot(z_2)}$.

Demostración. Se deja como ejercicio al lector.

$\blacksquare$

Ejemplo 22.4.
Determinemos el valor de las siguientes funciones trigonométricas en su forma $a+ib$.
a) $\operatorname{sen}(i)$.
b) $\operatorname{cos}(1+i)$.
c) $\operatorname{tan}(2i – \pi)$.

Solución.
a) Por definición de la función seno complejo y considerando a la función real seno hiperbólico tenemos que: \begin{align*} \operatorname{sen}(i) & = \frac{e^{i^2} – e^{-i^2}}{2i}\\ & = -i \left(\frac{e^{-1} – e^{1}}{2}\right)\\ & = i \left(\frac{e^{1} – e^{-1}}{2}\right)\\ & = i \operatorname{senh}(1). \end{align*} b) Por la definición de la función coseno complejo, de acuerdo con la proposición 20.2, de la entrada 20, y considerando a las funciones reales seno y coseno hiperbólicos tenemos que: \begin{align*} \operatorname{cos}(1+i) & = \frac{e^{i(1+i)} + e^{-i(1+i)}}{2}\\ & = \frac{e^{i+i^2} + e^{-i-i^2}}{2}\\ & = \frac{e^{i-1} + e^{1-i}}{2}\\ & = \frac{e^{i}e^{-1} + e^{1}e^{-i}}{2}\\ & = \frac{e^{-1}\left[\operatorname{cos}(1) + i \operatorname{sen}(1)\right] + e\left[\operatorname{cos}(-1) + i \operatorname{sen}(-1)\right]}{2}\\ & = \frac{\operatorname{cos}(1)\left[e^1 + e^{-1} \right]}{2} – i \left( \frac{\operatorname{sen}(1) \left[e^1 – e^{-1}\right]}{2}\right)\\ & = \operatorname{cos}(1)\operatorname{cosh}(1) – i \operatorname{sen}(1)\operatorname{senh}(1). \end{align*} c) De acuerdo con la proposición 22.2(1) sabemos que para $z \neq \left(k + \frac{1}{2}\right)\pi$, con $k\in\mathbb{Z}$, se cumple que $\operatorname{tan}(-z) = – \operatorname{tan}(z)$, es decir que $\tan(z)$ es una función impar, por lo que considerando la definición de la función tangente compleja, la proposición 20.1, de la entrada 20, y la observación 22.1 tenemos que: \begin{align*} \operatorname{tan}(2i-\pi) = – \operatorname{tan}(\pi – 2i) &= -(-i)\left( \frac{e^{i\pi -2i^2} – e^{-i\pi + 2i^2}}{e^{i\pi -2i^2} + e^{-i\pi + 2i^2}}\right)\\ &= i\left( \frac{e^{i\pi}e^{2} – e^{-i\pi} e^{-2}}{e^{i\pi}e^{2} – e^{-i\pi} e^{-2}}\right)\\ &= i\left( \frac{e^{2}\left(-1\right) – e^{-2}\left(-1\right)}{e^{2}\left(-1\right) + e^{-2}\left(-1\right)}\right)\\ &= i\left( \frac{e^{2} – e^{-2}}{e^{2} + e^{-2}}\right)\\ & = i \tanh{(2)}. \end{align*}

Proposición 22.3. (Derivadas de las funciones trigonométricas.)
Sea $z\in\mathbb{C}$. Considerando el dominio de definición de cada una de las funciones trigonométricas complejas, tenemos que:

  1. $\operatorname{sen}(z)$ y $\operatorname{cos}(z)$ son funciones enteras y sus derivadas son, respectivamente: \begin{equation*} \frac{d}{dz} \operatorname{sen}(z) = \operatorname{cos}(z), \quad \frac{d}{dz} \operatorname{cos}(z) = -\operatorname{sen}(z). \end{equation*}
  2. Para $z \neq \left(k + \frac{1}{2}\right)\pi$, con $k \in \mathbb{Z}$, las funciones $\operatorname{tan}(z)$ y $\operatorname{sec}(z)$ son analíticas y se tiene que: \begin{equation*} \frac{d}{dz} \operatorname{tan}(z) = \operatorname{sec}^2(z), \quad \frac{d}{dz} \operatorname{sec}(z) = \operatorname{sec}(z)\operatorname{tan}(z). \end{equation*}
  3. Para $z \neq k\pi$, con $k \in \mathbb{Z}$, las funciones $\operatorname{cot}(z)$ y $\operatorname{csc}(z)$ son analíticas y se tiene que: \begin{equation*} \frac{d}{dz} \operatorname{cot}(z) = – \operatorname{csc}^2(z), \quad \frac{d}{dz} \operatorname{csc}(z) = -\operatorname{csc}(z)\operatorname{cot}(z). \end{equation*}

Demostración.

  1. De acuerdo con la definición 22.1, como las funciones $\operatorname{sen}(z)$ y $\operatorname{cos}(z)$ están definidas en términos de las funciones $e^{iz}$ y $e^{-iz}$, las cuales son funciones enteras, entonces ambas funciones trigonométricas son enteras. Más aún, utilizando la regla de la cadena para cada una de las funciones tenemos que: \begin{align*} \frac{d}{dz} \operatorname{sen}(z) & = \frac{d}{dz} \left( \frac{e^{iz} – e^{-iz}}{2i} \right)\\ & = \frac{\frac{d}{dz} e^{iz} – \frac{d}{dz} e^{-iz}}{2i}\\ & = \frac{i e^{iz} + i e^{-iz}}{2i}\\ & = \frac{e^{iz} + e^{-iz}}{2}\\ & = \cos{(z)}. \end{align*} \begin{align*} \frac{d}{dz} \operatorname{cos}(z) & = \frac{d}{dz} \left( \frac{e^{iz} + e^{-iz}}{2} \right)\\ & = \frac{\frac{d}{dz} e^{iz} + \frac{d}{dz} e^{-iz}}{2i}\\ & = \frac{ i e^{iz} – i e^{-iz}}{2}\\ & =i \left( \frac{e^{iz} – e^{-iz}}{2}\right)\\ & =- \left(\frac{e^{iz} – e^{-iz}}{2i}\right)\\ & = -\operatorname{sen}(z). \end{align*}
  2. Se deja como ejercicio al lector.
  3. Se deja como ejercicio al lector.

$\blacksquare$

Ejemplo 22.5.
Veamos que al igual que en el caso real, para las funciones complejas seno y coseno se cumple que: \begin{equation*} \lim_{z\to 0} \frac{\operatorname{sen}(z)}{z} = 1, \quad \lim_{z\to 0} \frac{\operatorname{cos}(z) – 1}{z} = 0. \end{equation*}

Solución. De acuerdo con la proposición 22.3 sabemos que las funciones $f(z) = \operatorname{sen(z)}$ y $g(z) = \operatorname{cos(z)}$ son enteras. En particular notemos que: \begin{equation*} 1 = \operatorname{cos}(0) = f'(0) = \lim_{z \to 0}\frac{f(z) – f(0)}{z-0} = \lim_{z \to 0}\frac{\operatorname{sen}(z)}{z}, \end{equation*} \begin{equation*} 0 = -\operatorname{sen}(0) = g'(0) = \lim_{z \to 0}\frac{g(z) – g(0)}{z-0} = \lim_{z \to 0}\frac{\operatorname{cos}(z) – 1}{z}. \end{equation*}

Ejemplo 22.6.
Determinemos el dominio de analicidad $U$ de la función $f(z) = \tan\left(\dfrac{\pi z^2}{2}\right)$ y obtengamos $f'(z)$ para $z\in U$.

Solución. Notemos que podemos ver a $f$ como la composición de las funciones $g(z) = \tan(z)$ y $h(z) = \dfrac{\pi z^2}{2}$, es decir $f = g \circ h$.

Dado que $h$ es una función polinómica es claro que es una función entera, mientras que $g$ es analítica en: \begin{equation*} V = \mathbb{C} \setminus \left\{\left(k + \frac{1}{2}\right)\pi : k \in\mathbb{Z} \right\}. \end{equation*}

Entonces, el dominio de analicidad de $f$ es el conjunto abierto: \begin{equation*} U =\left\{z\in\mathbb{C} : \frac{\pi z^2}{2} \in V \right\}. \end{equation*}

Tenemos que para $z\in\mathbb{C}$ se cumple que: \begin{equation*} \frac{\pi z^2}{2} = \left(k + \frac{1}{2}\right)\pi \quad \Longleftrightarrow \quad z^2 = 2k + 1 \quad \Longleftrightarrow \quad z^2 \, \, \text{es un entero impar}, \end{equation*} por lo que $z\in V$ siempre que $z^2$ no sea un entero impar, entonces: \begin{equation*} U =\mathbb{C} \setminus \left( \left\{\pm\sqrt{2k+1} : k \in \mathbb{N} \right\} \bigcup \left\{\pm i \sqrt{2k+1} : k \in \mathbb{N}\right\} \right). \end{equation*}

Sea $z\in U$, entonces por la regla de la cadena tenemos que \begin{equation*} f'(z) = g’\left(h(z)\right) h’\left(z\right) = \sec^2\left( \frac{\pi z^2}{2}\right) \pi z. \end{equation*}

Considerando la definición de las funciones hiperbólicas reales, observación 22.1, podemos también extender estas funciones a $\mathbb{C}$ mediante la función exponencial compleja como sigue:

Definición 22.3. (Funciones hiperbólicas complejas.)
Sea $z\in\mathbb{C}$. Definimos al seno hiperbólico complejo y al coseno hiperbólico complejo, respectivamente, como: \begin{equation*} \operatorname{senh}(z) := \frac{e^{z} – e^{-z}}{2}, \quad \operatorname{cosh}(z) := \frac{e^{z} + e^{-z}}{2}. \end{equation*}

De manera natural definimos el resto de las funciones hiperbólicas complejas en términos de estas dos funciones. \begin{equation*} \operatorname{tanh}(z) := \frac{\operatorname{senh}(z)}{\operatorname{cosh}(z)}, \quad \operatorname{cosh}(z)\neq 0, \end{equation*} \begin{equation*} \operatorname{coth}(z) := \frac{\operatorname{cosh}(z)}{\operatorname{senh}(z)}, \quad \operatorname{senh}(z)\neq 0, \end{equation*} \begin{equation*} \operatorname{sech}(z) := \frac{1}{\operatorname{cosh}(z)}, \quad \operatorname{cosh}(z)\neq 0, \end{equation*} \begin{equation*} \operatorname{csch}(z) := \frac{1}{\operatorname{senh}(z)}, \quad \operatorname{sen}(z)\neq 0. \end{equation*}

Observación 22.4.
En el ejercicio 4 de esta entrada se determinan los ceros de las funciones complejas seno y coseno hiperbólicas, es decir $\operatorname{senh}(z) = 0$ si y solo si $z = ik\pi$, para $ k\in\mathbb{Z}$. Mientras que $ \operatorname{cosh}(z) = 0$ si y solo si $ z = i\left(k+\frac{1}{2}\right)\pi$, con $k\in\mathbb{Z}$. Por tanto, el dominio natural y el dominio de analicidad de las funciones hiperbólicas, definidas como funciones racionales en términos de las funciones seno y coseno hiperbólicos, dependerán de los ceros de dichas funciones.

Es interesante notar que las funciones complejas trigonométricas e hiperbólicas están relacionadas mediante las siguientes identidades.

Proposición 22.4.
Sea $z = x+iy \in\mathbb{C}$, entonces, considerando el dominio de definición de cada una de las funciones trigonométricas e hiperbólicas, se cumple que:

  1. $\operatorname{senh}(iz) = i \operatorname{sen}(z)$ y $\operatorname{sen}(iz) = i\operatorname{senh}(z)$.
  2. $\operatorname{cosh}(iz) = \operatorname{cos}(z)$ y $\operatorname{cos}(iz) = \operatorname{cosh}(z)$.
  3. $\operatorname{tanh}(iz) = i \operatorname{tan}(z)$ y $\operatorname{tan}(iz) = i\operatorname{tanh}(z)$.
  4. $\operatorname{coth}(iz) = -i\operatorname{cot}(z)$ y $\operatorname{cot}(iz) = – i \operatorname{coth}(z)$.
  5. $\operatorname{senh}(z) = \operatorname{senh}(x) \operatorname{cos}(y) + i\operatorname{cosh}(x)\operatorname{sen}(y)$.
  6. $\operatorname{cosh}(z) = \operatorname{cosh}(x) \operatorname{cos}(y) + i\operatorname{senh}(x)\operatorname{sen}(y)$.

Demostración. Sea $z=x+iy\in\mathbb{C}$, tenemos que:

  1. De acuerdo con la definición 22.3 tenemos que: \begin{equation*} \operatorname{senh}{(iz)} = \frac{e^{iz} – e^{-iz}}{2} = i\left(\frac{e^{iz} – e^{-iz}}{2i}\right) = i \operatorname{sen}{(z)}, \end{equation*} \begin{equation*} \operatorname{sen}{(iz)} = \frac{e^{i^2z} – e^{-i^2z}}{2i} = -(-i)\left(\frac{e^{z} – e^{-z}}{2}\right) = i\operatorname{senh}{(z)}. \end{equation*}
  2. De acuerdo con la definición 22.3 tenemos que: \begin{equation*} \cosh{(iz)} = \frac{e^{iz} + e^{-iz}}{2} = \cos{(z)}, \end{equation*} \begin{equation*} \cos{(iz)} = \frac{e^{i^2z} + e^{-i^2z}}{2} = \frac{e^{z} + e^{-z}}{2} = \cosh{(z)}. \end{equation*}
  3. Se deja como ejercicio al lector.
  4. Se deja como ejercicio al lector.
  5. De acuerdo con la definición 22.3 y la proposición 20.2 tenemos que: \begin{align*} \operatorname{senh}(z) = \operatorname{senh}{(x+iy)} & = \frac{e^{x+iy} – e^{-x-iy}}{2}\\ & = \frac{e^{x}e^{iy} – e^{-x}e^{-iy}}{2}\\ & = \frac{e^{x}\left[\cos{(y)} + i\operatorname{sen}{(y)}\right] – e^{-x}\left[\cos{(-y)} + i\operatorname{sen}{(-y)}\right]}{2}\\ & = \frac{e^{x}\left[\cos{(y)} + i\operatorname{sen}{(y)}\right] – e^{-x}\left[\cos{(y)} – i\operatorname{sen}{(y)}\right]}{2}\\ & = \frac{\cos{(y)}\left[ e^{x} – e^{-x}\right] + i\operatorname{sen}{(y)}\left[e^{x}+e^{-x}\right]}{2}\\ & = \cos{(y)} \left( \frac{e^{x} – e^{-x}}{2}\right) + i \operatorname{sen}{(y)} \left( \frac{e^{x} + e^{-x}}{2}\right)\\ & =\operatorname{senh}(x) \operatorname{cos}(y) + i\operatorname{cosh}(x)\operatorname{sen}(y). \end{align*}
  6. Se deja como ejercicio al lector.

$\blacksquare$

Al igual que con las funciones trigonométricas complejas, para las funciones hiperbólicas complejas es posible deducir algunas identidades que resultan útiles al resolver algún problema. Podemos mencionar algunas en la siguiente:

Proposición 22.5. (Identidades funciones hiperbólicas.)
Sean $z, z_1, z_2\in\mathbb{C}$. Considerando el dominio de definición de cada una de las funciones trigonométricas, se cumple que:

  1. $\operatorname{senh}{(-z)} = -\operatorname{senh}{(z)}$.
  2. $\cosh{(-z)} = \cosh{(z)}$.
  3. $\tanh{(-z)} = -\tanh{(z)}$.
  4. Las funciones seno y coseno hiperbólicas son $2\pi i$-periódicas, mientras que la función tangente hiperbólica es $\pi i$-periódica.
  5. $\operatorname{senh}(z_1 \pm z_2) = \operatorname{senh}(z_1) \operatorname{cosh}(z_2) \pm \operatorname{senh}(z_2) \operatorname{cosh}(z_1)$.
  6. $\operatorname{cosh}(z_1 \pm z_2) = \operatorname{cosh}(z_1) \operatorname{cosh}(z_2) \pm \operatorname{senh}(z_1) \operatorname{senh}(z_2)$.
  7. $\tanh{(z_1 \pm z_2)} = \dfrac{\tanh(z_1)\pm \tanh(z_2)}{1\pm \tanh(z_1)\tanh(z_2)}$.
  8. $\operatorname{cosh}^2(z) – \operatorname{senh}^2(z) = 1$.
  9. $1-\operatorname{tanh}^2(z)= \operatorname{sech}^2(z)$.
  10. $\operatorname{coth}^2(z) – 1= \operatorname{csch}^2(z)$.

Demostración. Sean $z, z_1, z_2\in\mathbb{C}$, entonces:

  1. Por la definición 22.3 tenemos que: \begin{equation*} \operatorname{senh}(-z) = \frac{e^{-z} – e^{-(-z)}}{2} = -\left(\frac{e^{z} – e^{-z}}{2}\right) = -\operatorname{senh}{(z)}. \end{equation*}
  2. Por la definición 22.3 tenemos que: \begin{equation*} \cosh{(-z)} = \frac{e^{-z} + e^{-(-z)}}{2} = \frac{e^{-z} + e^{z}}{2} = \cosh{(z)}. \end{equation*}
  3. Se deja como ejercicio al lector.
  4. Considerando la definición 22.3 y la proposición 20.2, de la entrada 20, tenemos que: \begin{equation*} \operatorname{senh}{(z+2\pi i)} = \frac{e^{z+2\pi i} – e^{-(z+2\pi i)}}{2} = \frac{e^{z}e^{2\pi i} – e^{-z}e^{-2\pi i}}{2} = \frac{e^{z} – e^{-z}}{2} = \operatorname{senh}{(z)}, \end{equation*} \begin{equation*} \cosh{(z+2\pi i)} = \frac{e^{z+2\pi i} + e^{-(z+2\pi i)}}{2} = \frac{e^{z}e^{2\pi i} + e^{-z}e^{-2\pi i}}{2} = \frac{e^{z} + e^{-z}}{2} = \cosh{(z)}. \end{equation*} Si $z \neq i\left(k+\frac{1}{2}\right)\pi$, con $k\in\mathbb{Z}$, entonces: \begin{equation*} \tanh{(z+\pi i)} = \frac{\operatorname{senh}{(z+ \pi i)}}{\cosh{(z+\pi i)}} = \frac{e^z e^{\pi i} – e^{-z} e^{-\pi i}}{e^{z} e^{\pi i} + e^{-z} e^{-\pi i}} = \frac{e^z – e^{-z}}{e^{z} + e^{-z}} = \tanh{(z)}. \end{equation*}
  5. Se deja como ejercicio al lector.
  6. De acuerdo con la proposición 22.4 y la proposición 22.1(3), tenemos que: \begin{align*} \cosh{(z_1\pm z_2)} & = \cos{(iz_1 \pm i z_2)}\\ & = \operatorname{cos}(iz_1) \operatorname{cos}(iz_2) \mp \operatorname{sen}(iz_1) \operatorname{sen}(iz_2)\\ & = \operatorname{cos}(iz_1) \operatorname{cos}(iz_2) \pm \left[-i\operatorname{sen}(iz_1)\right] \left[-i\operatorname{sen}(iz_2)\right]\\ & = \operatorname{cosh}(z_1) \operatorname{cosh}(z_2) \pm \operatorname{senh}(z_1) \operatorname{senh}(z_2). \end{align*}
  7. Se deja como ejercicio al lector.
  8. De acuerdo con la definición 22.3 tenemos que: \begin{align*} \operatorname{cosh}^2(z) – \operatorname{senh}^2(z) & = \left( \frac{e^{z} + e^{-z}}{2} \right)^2 – \left( \frac{e^{z} – e^{-z}}{2} \right)^2\\ & = \frac{e^{2z} + 2e^{z}e^{-z} + e^{-2z} – e^{2z} + 2 e^{z} e^{-z} – e^{-2z}}{4}\\ & = \frac{4e^{z-z}}{4}\\ & = \frac{4}{4}\\ & = 1. \end{align*}
  9. Se deja como ejercicio al lector.
  10. Se deja como ejercicio al lector.

$\blacksquare$

Observación 22.5.
Recordemos que las funciones reales seno y coseno cumplen que: \begin{equation*} |\,\operatorname{sen}(x)\,| \leq 1, \quad |\,\cos(x)\,| \leq 1, \quad \forall x\in\mathbb{R}, \end{equation*} es decir son funciones acotadas.

Es interesante notar que en el caso complejo las funciones seno y coseno no son acotadas. De acuerdo con la proposición 22.1 y la proposición 22.5 tenemos que: \begin{align*} |\,\operatorname{sen}(z)\,| & = \sqrt{\operatorname{sen}^2(x) \cosh^2(y) + \cos^2(x) \operatorname{senh}^2(y)}\\ & = \sqrt{\operatorname{sen}^2(x) \left[1 + \operatorname{senh}^2(y)\right] + \cos^2(x) \operatorname{senh}^2(y)}\\ & = \sqrt{\operatorname{sen}^2(x) + \left[\cos^2(x) + \operatorname{sen}^2(x)\right] \operatorname{senh}^2(y)}\\ & = \sqrt{\operatorname{sen}^2(x) + \operatorname{senh}^2(y)}. \end{align*}

Análogamente tenemos que: \begin{equation*} |\,\cos(z)\,| = \sqrt{\cos^2(x) + \operatorname{senh}^2(y)}. \end{equation*}

Como la función real seno hiperbólico no es acotada, se tiene que si $y \to \infty$, entonces $\operatorname{senh}(y) \to \infty$, por lo que no existe constante real $M>0$ tal que $|\,\operatorname{sen}(z)\,| < M$ ó $|\,\cos(z)\,| < M$ para todo $z\in\mathbb{C}$.

Ejemplo 22.7.
Muestra que para todo $z=x+iy\in\mathbb{C}$ se cumple que: \begin{equation*} |\,\operatorname{senh}(y)\,| \leq |\,\operatorname{sen}(z)\,| \leq \cosh(y),\quad |\,\operatorname{senh}(y)\,| \leq |\,\cos(z)\,| \leq \cosh(y). \end{equation*}

Solución. Sea $z=x+iy\in\mathbb{C}$. Por la observación anterior tenemos que: \begin{equation*} |\,\operatorname{sen}(z)\,|^2 = \operatorname{sen}^2(x) + \operatorname{senh}^2(y), \quad |\,\cos(z)\,|^2 = \cos^2(x) + \operatorname{senh}^2(y), \end{equation*} de donde: \begin{equation*} \operatorname{senh}^2(y) = |\,\operatorname{sen}(z)\,|^2 – \operatorname{sen}^2(x) \leq |\,\operatorname{sen}(z)\,|^2. \end{equation*}

Por otra parte, de la proposición 22.4 se sigue que: \begin{align*} |\,\operatorname{sen}(z)\,|^2 & = \operatorname{sen}^2(x) + \operatorname{senh}^2(y)\\ & = \operatorname{sen}^2(x) + \left(\cosh^2(y) -1\right)\\ & = \cosh^2(y) – \left(1 – \operatorname{sen}^2(x)\right)\\ & = \cosh^2(y) – \cos^2(x)\\ & \leq \cosh^2(y). \end{align*}

Considerando lo anterior es claro que: \begin{equation*} \operatorname{senh}^2(y) \leq |\,\operatorname{sen}(z)\,|^2 \leq \cosh^2(y). \end{equation*}

Dado que para todo $x\in\mathbb{R}$ se cumple que $\cosh(x)>0$, entonces tomando raíz cuadrada en la desigualdad anterior tenemos que: \begin{equation*} |\,\operatorname{sen}(y)\,| \leq |\,\operatorname{sen}(z)\,| \leq \cosh(y). \end{equation*}

De manera análoga, como: \begin{equation*} \operatorname{senh}^2(y) = |\,\cos(z)\,|^2 – \cos^2(x) \leq |\,\cos(z)\,|^2 \end{equation*} y \begin{align*} |\,\cos(z)\,|^2 & = \cos^2(x) + \operatorname{senh}^2(y)\\ & = \cos^2(x) + \left(\cosh^2(y) -1\right)\\ & = \cosh^2(y) – \left(1 – \cos^2(x)\right)\\ & = \cosh^2(y) – \operatorname{sen}^2(x)\\ & \leq \cosh^2(y), \end{align*} entonces: \begin{equation*} \operatorname{senh}^2(y) \leq |\,\operatorname{sen}(z)\,|^2 \leq \cosh^2(y), \end{equation*} de donde se sigue el resultado al tomar raíz cuadrada en la desigualdad anterior.

Ejemplo 22.8.
Determina todas las soluciones de la ecuación $\cosh(z) = -2$.

Solución. Podemos resolver este problema mediante un planteamiento similar al del ejemplo 22.2, sin embargo, a fin de mostrar otra alternativa procedemos mediante la definición de la función coseno hiperbólico.

Sea $z\in\mathbb{C}$, entonces: \begin{align*} \cosh{(z)} = -2 \quad & \Longleftrightarrow \quad \frac{e^{z} + e^{-z}}{2} = -2,\\ & \Longleftrightarrow \quad e^{z} + e^{-z} = -4,\\ & \Longleftrightarrow \quad e^{z}e^{z} + e^{-z}e^{z} +4e^{z} = 0,\\ & \Longleftrightarrow \quad \left(e^{z}\right)^2 +4e^{z} + 1 = 0. \end{align*}

Resolvemos la ecuación cuadrática para $e^{z}$, entonces: \begin{equation*} e^z = \frac{-4\pm\sqrt{4^2-4(1)(1)}}{2(1)} = \frac{-4\pm\sqrt{3}}{2} = -2\pm\sqrt{3}. \end{equation*}

Para determinar los valores de $z$ que satisfacen esta última igualdad utilizaremos el logaritmo complejo. Dado que las raíces obtenidas son ambas reales y negativas, tenemos que: \begin{equation*} \operatorname{Arg}\left(-2\pm\sqrt{3}\right) = \pi, \end{equation*} entonces: \begin{equation*} \arg\left(-2\pm\sqrt{3}\right) = \pi + 2\pi n = \pi(2n + 1), \quad n\in\mathbb{Z}. \end{equation*}

Consideremos a la primera raíz, es decir $e^z = -2+\sqrt{3}$, entonces: \begin{equation*} z = \log(-2+\sqrt{3}) = \ln\left(\left|-2+\sqrt{3}\right|\right) + i \arg\left(-2+\sqrt{3}\right). \end{equation*}

Notemos que: \begin{equation*} \ln{\left(\left| – 2 + \sqrt{3} \right| \right)} = \ln{\left(\left|\frac{\left[- 2 + \sqrt{3} \, \right] \left[2 + \sqrt{3} \, \right]}{2 + \sqrt{3}}\right|\right)} = \ln{\left(\left|\frac{1}{2 + \sqrt{3}}\right|\right)} = – \ln{\left(\left|2 + \sqrt{3}\right|\right)} = – \ln{\left(2 + \sqrt{3}\right)}, \end{equation*} por lo que: \begin{equation*} z = \log(-2+\sqrt{3}) = – \ln{\left(2 + \sqrt{3}\right)} + i\pi(2n + 1), \quad n\in\mathbb{Z}. \end{equation*}

Consideremos ahora a la segunda raíz, es decir $e^z = -2-\sqrt{3}$, entonces: \begin{equation*} z = \log(-2-\sqrt{3}) = \ln\left(\left|-2-\sqrt{3}\right|\right) + i \arg\left(-2-\sqrt{3}\right). \end{equation*}

Pero tenemos que:
\begin{equation*} \ln{\left(\left| – 2 – \sqrt{3} \right| \right)} = \ln{\left(\left| 2 + \sqrt{3} \right| \right)} = \ln{\left(2 + \sqrt{3}\right)}, \end{equation*} de donde: \begin{equation*} z = \log(-2-\sqrt{3}) =\ln{\left(2 + \sqrt{3}\right)} + i\pi(2n + 1), \quad n\in\mathbb{Z}. \end{equation*}

Por lo tanto, las soluciones de la ecuación $\cosh(z) = -2$ son: \begin{equation*} z = \pm \ln{\left(2 + \sqrt{3}\right)} + i\pi(2n + 1), \quad n\in\mathbb{Z}. \end{equation*}

Proposición 22.4. (Derivadas de las funciones hiperbólicas.)
Considerando el dominio de definición de cada una de las funciones hiperbólicas complejas, tenemos que:

  1. $\operatorname{senh}(z)$ y $\operatorname{cosh}(z)$ son funciones enteras y sus derivadas son, respectivamente: \begin{equation*} \frac{d}{dz} \operatorname{senh}(z) = \operatorname{cosh}(z), \quad \frac{d}{dz} \operatorname{cosh}(z) = \operatorname{senh}(z). \end{equation*}
  2. Para $z \neq i\left(k + \frac{1}{2}\right)\pi$, con $k \in \mathbb{Z}$, las funciones $\operatorname{tanh}(z)$ y $\operatorname{sech}(z)$ son analíticas y se tiene que: \begin{equation*} \frac{d}{dz} \operatorname{tanh}(z) = \operatorname{sec}^2(z), \quad \frac{d}{dz} \operatorname{sech}(z) = \operatorname{sec}(z)\operatorname{tan}(z). \end{equation*}
  3. Para $z \neq i k\pi$, con $k \in \mathbb{Z}$, las funciones $\operatorname{coth}(z)$ y $\operatorname{csch}(z)$ son analíticas y se tiene que: \begin{equation*} \frac{d}{dz} \operatorname{coth}(z) = – \operatorname{csch}^2(z), \quad \frac{d}{dz} \operatorname{csch}(z) = -\operatorname{csch}(z)\operatorname{coth}(z). \end{equation*}

Demostración.

  1. Como las funciones $\operatorname{senh}(z)$ y $\operatorname{cosh}(z)$ están definidas en términos de la función exponencial compleja, la cual es una función entera, entonces es claro que ambas funciones son enteras. Considerando la regla de la cadena para cada una de las funciones tenemos que: \begin{align*} \frac{d}{dz} \operatorname{senh}(z) & = \frac{d}{dz} \left( \frac{e^{z} – e^{-z}}{2} \right)\\ & = \frac{\frac{d}{dz} e^{z} – \frac{d}{dz} e^{-z}}{2}\\ & = \frac{e^{z} + e^{-z}}{2}\\ & = \cosh{(z)}. \end{align*} \begin{align*} \frac{d}{dz} \operatorname{cosh}(z) & = \frac{d}{dz} \left( \frac{e^{z} + e^{-z}}{2} \right)\\ & = \frac{\frac{d}{dz} e^{z} + \frac{d}{dz} e^{-z}}{2}\\ & = \frac{e^{z} – e^{-z}}{2}\\ & = \operatorname{senh}(z). \end{align*}
  2. Se deja como ejercicio al lector.
  3. Se deja como ejercicio al lector.

$\blacksquare$

Ejemplo 22.9.
Analicemos la analicidad de la función $f(z) = \cosh\left(iz+e^{iz}\right)$ y obtengamos $f'(z)$.

Solución. Notemos que si consideramos a $g(z) = \cosh(z)$ y $h(z) = iz+e^{iz}$, entonces $f = g\circ h$.

Es claro que $h$ y $g$ son ambas funciones enteras, por lo que $f$ es también una función entera. Más aún, para $z\in\mathbb{C}$, por la regla de la cadena tenemos que: \begin{equation*} f'(z) = g'(h(z))h'(z) = \operatorname{senh}(iz+e^{iz}) \left(i + ie^{iz}\right). \end{equation*}

Tarea moral

  1. Completa las demostraciones de la proposiciones de esta entrada.
  2. Determina el valor de cada una de las siguientes funciones trigonométricas e hiperbólicas en su forma $a+ib$.
    a) $\operatorname{tan}(2i)$.
    b) $\operatorname{sec}\left(\frac{\pi}{2}-i\right)$.
    c) $\operatorname{csc}(1+i)$.
    d) $\operatorname{cosh}\left(1+\frac{\pi}{6}i\right)$.
    e) $\operatorname{senh}\left(\frac{\pi}{2}i\right)$.
    f) $\operatorname{tanh}\left(2+3i\right)$.
  3. Muestra que para todo $z\in\mathbb{C}$ se cumple que: \begin{equation*} \operatorname{cos}\left(\overline{z}\right) = \overline{\operatorname{cos}(z)}, \quad \operatorname{sen}\left(\overline{z}\right) = \overline{\operatorname{sen}(z)}. \end{equation*}
  4. Sea $z \in \mathbb{C}$, muestra que: \begin{align*} \operatorname{senh}(z) = 0 \quad \Longleftrightarrow \quad z = ik\pi, \quad k\in\mathbb{Z},\\ \operatorname{cosh}(z) = 0 \quad \Longleftrightarrow \quad z = i\left(k+\frac{1}{2}\right)\pi, \quad k\in\mathbb{Z}. \end{align*} Hint: Utiliza la proposición 22.3.
  5. Para cada inciso prueba lo que se te pide.
    a) Para $z\in\mathbb{C}$, con $z\neq 1$, y para $n\in\mathbb{N}$, muestra que: \begin{equation*} 1 + z + z^2 + \cdots + z^n = \frac{1 – z^{n+1}}{1-z}. \end{equation*} b) Considera a $z=e^{i\theta}$, para $\theta \in\mathbb{R}$ tal que $\theta \neq 2\pi k$, con $k\in\mathbb{Z}$ y muestra que: \begin{equation*} 1 + e^{i\theta} + e^{i2\theta} + \cdots + e^{i n\theta} = \frac{i}{2} \frac{\left(1 – e^{i(n+1)\theta}\right)e^{-i \frac{\theta}{2}}}{\operatorname{sen}\left(\frac{\theta}{2}\right)}. \end{equation*} Hint: Sustituye en (a) $z=e^{i\theta}$, después multiplica y divide por $e^{-i\frac{\theta}{2}}$ y utiliza (22.4).
    c) Toma la parte real e imaginaria de la identidad obtenida en (b) y concluye que: \begin{equation*} \frac{1}{2} + \operatorname{cos}(\theta) + \operatorname{cos}(2\theta) + \cdots + \operatorname{cos}(n \theta) = \frac{\operatorname{sen}\left(\left[n+\frac{1}{2}\right]\theta\right)}{2\operatorname{sen}\left(\frac{\theta}{2}\right)}, \end{equation*} \begin{equation*} \operatorname{sen}(\theta) + \operatorname{sen}(2\theta) + \cdots + \operatorname{sen}(n \theta) = \frac{\operatorname{cos}\left(\frac{\theta}{2}\right) – \operatorname{cos}\left(\left[n+\frac{1}{2}\right]\theta\right)}{2\operatorname{sen}\left(\frac{\theta}{2}\right)}. \end{equation*} La suma $D_n(\theta) = 1 + 2\operatorname{cos}(\theta) + 2\operatorname{cos}(2\theta) + \cdots + 2\operatorname{cos}(n \theta)$ es llamada el núcleo de Dirichlet y juega un papel importante en la teoría de las series de Fourier.
  6. Obtén la parte real e imaginaria de las siguientes funciones:
    a) $f(z) = \operatorname{sen}(2z)$.
    b) $f(z) = z\operatorname{cos}(z)$.
    c) $f(z) = \operatorname{cos}(z^2)$.
    d) $f(z) = \operatorname{tan}(z)$.
  7. Determina el dominio de analicidad de las siguientes funciones y obtén su derivada.
    a) $f(z) = z \tan\left(\frac{1}{z}\right)$.
    b) $f(z) = \cos \left(i e^z\right)$.
    c) $f(z) = \sec \left(z^2\right)$.
    d) $f(z) = \operatorname{sen}(z) \operatorname{senh}{(z)} $.
    e) $f(z) = \tanh{ \left(iz-2\right)}$.
  8. Resuelve las siguientes ecuaciones.
    a) $\cos{(z)} = i \operatorname{sen}{(z)}$.
    b) $\cosh{(z)} = i$.
    c) $\cos{(z)} = 4$.
    d) $ \operatorname{senh}{(z)} = -1$.
  9. ¿Dónde son diferenciables las siguientes funciones? ¿Son analíticas?
    a) $f(z) = \operatorname{sen} \left(|\,z\,|^2\right)$.
    b) $f(z) = \dfrac{e^z}{\operatorname{cos}(z)}$.
  10. Prueba que la función: \begin{equation*} f(z)= \left\{ \begin{array}{lcc} 1 & \text{si} & z = 0, \\ \\ z^{-1} \operatorname{sen}(z) & \text{si} & z\neq 0, \end{array} \right. \end{equation*} es una función continua en $\mathbb{C}$.

Más adelante…

En esta entrada hemos extendido a $\mathbb{C}$ las funciones trigonométricas e hiperbólicas reales a través de la función exponencial compleja. Es interesante notar que a diferencia del caso real, para el caso complejo es posible definir a las funciones elementales a través de las funciones complejas exponencial y logaritmo, mediante las cuales es claro que muchas de las propiedades como continuidad, diferenciabilidad y analicidad, entre otras, se heredan de manera natural a las funciones elementales.

Vimos que muchas de las propiedades con las que estamos familiarizados para el caso real, se cumplen también para el caso complejo. Sin embargo, a diferencia del caso real, las funciones trigonométricas complejas no son acotadas, mientras que las funciones hiperbólicas complejas son periódicas y tienen una infinidad de ceros.

La siguiente entrada analizaremos a las funciones inversas de las funciones complejas trigonométricas e hiperbólicas vistas en esta sección, recordando nuevamente el concepto de función multivaluada.

Entradas relacionadas

Variable Compleja I: Consecuencias de las ecuaciones de Cauchy-Riemann

Por Pedro Rivera Herrera

Introducción

En las entradas anteriores hemos determinado condiciones necesarias y suficientes para garantizar la analicidad de una función compleja. En particular hemos deducido las ecuaciones de C-R y hemos visto que dichas condiciones nos permiten caracterizar por completo la diferenciabilidad en el sentido complejo. Además, a través de dichas ecuaciones hemos probado que la diferenciabilidad en el sentido real de una función vectorial de dos variables no es equivalente a la diferenciabilidad de una función compleja, por lo que debe ser claro que no toda función vectorial de dos variables resultará ser una función analítica.

En esta entrada abordaremos algunos resultados que son consecuencia directa de las ecuaciones de C-R y veremos que es posible extender algunas resultados vistos en nuestros cursos de Cálculo para las funciones complejas a través de las funciones reales correspondientes con las partes real e imaginaria de una función compleja.

Observación 19.1.
De nuestros cursos de Cálculo sabemos que para una función $u:U \to \mathbb{R}$ de clase $C^1$, con $U\subset\mathbb{R}^2$ una región, se cumple que $u$ no depende de la variable $x$ si y solo si $\partial u/ \partial x = 0$ para todo punto en $U$. Análogamente para la variable $y$. Más aún, tenemos que: \begin{align*} \frac{\partial}{\partial x} x = 1, \quad \frac{\partial}{\partial y} x = 0,\\ \frac{\partial}{\partial x} y = 0, \quad \frac{\partial}{\partial y} y = 1. \end{align*}

Para motivar los siguientes planteamientos consideremos el siguiente:

Ejemplo 19.1.
Determinemos si la función compleja $f(z) = 2xy + i(y^2-x^2)$ es analítica o no.

Solución. Es claro que podemos estudiar la analicidad de esta función a través de los resultados de la entrada anterior, sin embargo notemos que operando un poco a la función, para $z=x+iy\in \mathbb{C}$, tenemos que: \begin{align*} f(z) & = 2xy + i(y^2-x^2)\\ & = -i(i2xy) + i(y^2-x^2)\\ & = -i \left[-(y^2-x^2) + i2xy \right]\\ & = -i \left(x^2 -y^2 + i2xy \right)\\ & = – i\left(x+iy\right)^2\\ & = -i z^2, \end{align*} es decir que para todo $z\in \mathbb{C}$ se tiene que $f(z) = -iz^2$, la cual es una función polinómica y por tanto analítica en todo $\mathbb{C}$. Es importante notar que en la función anterior no aparecen términos que dependan del conjugado de $z$.

Debe ser claro que el conjugado de un número complejo $z$, es decir $\overline{z}$, resulta ser una función compleja de la variable $z$. En el ejemplo 17.2, de la entrada 17, hemos visto que la función $f(z)=\overline{z}$ no es analítica en $\mathbb{C}$ desde que no se cumplen las ecuaciones de C-R en ningún punto. Sin embargo, esta función en particular cumple que $u_x = – v_y$ y $u_y = v_x$ para todo $z=x+iy\in \mathbb{C}$.

De acuerdo con la observación 12.5 de la entrada 12, estamos interesados en caracterizar a las funciones complejas que solo dependen de la variable $z$, es decir que no tienen términos que dependan de su conjugado.

Lo anterior nos motiva a considerar a $\overline{z} = x-iy$ como una variable «independiente» de $z=x+iy$. Entonces, nuestro objetivo es determinar un criterio similar al de la observación 19.1 para garantizar la analicidad de una función compleja $f$ cuando esta dependa únicamente de la variable $z$. Tenemos que si $z$ y $\overline{z}$ son variables independientes, entonces: \begin{align*} \frac{\partial}{\partial z} z = 1, \quad \frac{\partial}{\partial \overline{z}} z = 0,\\ \frac{\partial}{\partial z} \overline{z} = 0, \quad \frac{\partial}{\partial \overline{z}} \overline{z} = 1. \end{align*}

Como para todo $z=x+iy\in\mathbb{C}$ se cumple que: \begin{equation*} x = \frac{z+\overline{z}}{2}, \quad y = \frac{z-\overline{z}}{2i}, \tag{19.1} \end{equation*} entonces, dada una función compleja $f(z)=u(x,y) + iv(x,y)$ definida en un conjunto abierto $U\subset \mathbb{C}$ de clase $C^1$, podemos pensarla como una función de las variables independientes $x$ e $y$ o bien de las variables «independientes» $z$ y $\overline{z}$, y así definir: \begin{equation*} g(z,\overline{z}) = \hat{f}(x,y):= f(z) = u\left( \frac{z+\overline{z}}{2}, \frac{z-\overline{z}}{2i}\right) + i v\left( \frac{z+\overline{z}}{2}, \frac{z-\overline{z}}{2i}\right). \end{equation*}

Lo anterior resulta de gran utilidad al considerar a $z$ y $\overline{z}$ como variables independientes, ya que bajo este supuesto podemos obtener a las derivadas parciales complejas $g_z$ y $g_{\overline{z}}$ mediante la regla de la cadena como sigue: \begin{align*} g_{z} = \frac{\partial g}{\partial z} = \frac{\partial g}{\partial x} \frac{\partial x}{\partial z} + \frac{\partial g}{\partial y} \frac{\partial y}{\partial z} = \frac{1}{2}\left(\frac{\partial g}{\partial x} – i \frac{\partial g}{\partial y} \right),\\ g_{\overline{z}} = \frac{\partial g}{\partial \overline{z}} = \frac{\partial g}{\partial x} \frac{\partial x}{\partial \overline{z}} + \frac{\partial g}{\partial y} \frac{\partial y}{\partial \overline{z}} = \frac{1}{2}\left(\frac{\partial g}{\partial x} + i \frac{\partial g}{\partial y} \right). \end{align*}

De lo anterior obtenemos la siguiente:

Definición 19.1. (Operadores diferenciales complejos de Wirtinger.)
Sea $U\subset \mathbb{C}$ un conjunto abierto y $f(z)=u(x,y)+iv(x,y)$ una función compleja definida en $U$ de clase $C^1$. Definimos los operadores direrenciales complejos de Wirtinger como: \begin{align*} f_z := \frac{\partial f}{\partial z} = \frac{1}{2}\left(\frac{\partial f}{\partial x} – i \frac{\partial f}{\partial y} \right) = \frac{1}{2} \left(\frac{\partial u }{\partial x} + \frac{\partial v}{\partial y} \right) + \frac{i}{2} \left(\frac{\partial v }{\partial x} – \frac{\partial u}{\partial y} \right),\\ f_{\overline{z}} := \frac{\partial f}{\partial \overline{z}} = \frac{1}{2}\left(\frac{\partial f}{\partial x} + i \frac{\partial f }{\partial y} \right) = \frac{1}{2} \left(\frac{\partial u }{\partial x} – \frac{\partial v}{\partial y} \right) + \frac{i}{2} \left(\frac{\partial v }{\partial x} + \frac{\partial u}{\partial y} \right). \end{align*}

Observación 19.2.
Notemos que la condición $\dfrac{\partial f}{\partial \overline{z}} =0$, intuitivamente nos dice que la función $f$ no depende de la variable $\overline{z}$ como lo planteamos inicialmente. Más aún, considerando la definición anterior se tiene el siguiente:

Lema 19.1.
Sean $U \subset \mathbb{C}$ un conjunto abierto y $f(z) = u(x,y) + iv(x,y)$ una función definida en $U$ de clase $C^1$. Entonces $u$ y $v$ satisfacen las ecuaciones de C-R en $U$ si y solo si $\dfrac{\partial f}{\partial \overline{z}} =0$ para todo $z=x+iy\in U$.

Demostración. Se deja como ejercicio al lector.

$\blacksquare$

Ejemplo 19.2.
Sea $z\in\mathbb{C}$. Consideremos a la función $f(z) = |\,z\,|$. Determinemos a la función $g(z,\overline{z})$ y a las derivadas parciales $f_z$ y $f_{\overline{z}}$.

Solución. Tenemos que $f(z) = |\,z\,| = \left(z \overline{z}\right)^{1/2}$, por lo que $g(z,\overline{z}) = \left(z \overline{z}\right)^{1/2}$.

Por otra parte, si $z\neq 0$, entonces: \begin{align*} f_z(z) = \frac{\partial g}{\partial z}(z,\overline{z}) = \frac{1}{2}\left(z \overline{z}\right)^{-1/2} \overline{z} = \frac{\overline{z}}{2|\,z\,|},\\ f_{\overline{z}}(z) = \frac{\partial g}{\partial \overline{z}}(z,\overline{z}) = \frac{1}{2}\left(z \overline{z}\right)^{-1/2} z = \frac{z}{2|\,z\,|}. \end{align*}

Observación 19.2.
De acuerdo con el ejercicio 7 de la entrada 16, sabemos que la función $f(z)=|\,z\,|$ no es analítica en ningún punto de $\mathbb{C}$. Podemos analizar esto mediante el lema anterior.

Para $z = 0$ es claro que $f$ no es diferenciable en dicho punto desde que no existe: \begin{equation*} \lim_{h \to 0 } \frac{f(0+h) – f(0)}{h} = \lim_{h \to 0 } \frac{|h|}{h}. \end{equation*}

Por otra parte, para $z\neq 0$ se tiene que: \begin{equation*} \frac{\partial f}{\partial \overline{z}} = 0 \quad \Longleftrightarrow \quad \frac{z}{2|\,z\,|} = 0 \quad \Longleftrightarrow \quad z = 0, \end{equation*} lo cual claramente no es posible, por lo que no se satisfacen las ecuaciones de C-R para ningún $z\neq 0$, es decir que $f$ no es analítica en ningún punto de $\mathbb{C}$.

El ejemplo anterior motiva la siguiente:

Proposición 19.1.
Sean $U\subset \mathbb{C}$ un conjunto abierto y $f(z)=u(x,y)+iv(x,y)$ una función definida en $U$ de clase $C^1$. Las siguientes condiciones son equivalentes:

  1. $f$ es analítica en $U$.
  2. $\dfrac{\partial f}{\partial \overline{z}} = 0$ para todo $z_0\in U$. En tal caso: \begin{equation*} f'(z_0) = \frac{\partial f}{\partial z} (z_0) = \frac{\partial f}{\partial x} (z_0) = -i\frac{\partial f}{\partial y} (z_0), \quad z_0 \in U. \end{equation*}

Demostración. Se deja como ejercicio al lector.

$\blacksquare$

Observación 19.3.
La trascendencia de este resultado radica en que podemos pensar a las funciones analíticas como «auténticas funciones complejas» en el sentido de que si $f(z) = u(x,y) + iv(x,y)$ es una función analítica, entonces al sustituir a las variables $x$ e $y$ por $\dfrac{z+\overline{z}}{2}$ y $\dfrac{z-\overline{z}}{2i}$ respectivamente, dicha función no depende de la variable $\overline{z}$ como mencionamos en la observación 19.2.

Ejemplo 19.3.
Consideremos a la función compleja $f(z) = |\,z\,|^2 + \dfrac{z}{\overline{z}}$. Veamos que $f$ no es analítica en ningún punto en $\mathbb{C}$, determinemos dónde $f$ es al menos diferenciable y obtengamos a las derivadas parciales $f_z$ y $f_{\overline{z}}$.

Solución. La función $f$ está definida en el dominio $U = \mathbb{C}\setminus\{0\}$. Para $z=x+iy \in U$ tenemos que: \begin{align*} f(z) & = |\,z\,|^2 + \frac{z}{\overline{z}}\\ & = |\,z\,|^2 + \frac{z^2}{|\,z\,|^2}\\ & = x^2 + y^2 + \frac{x^2+2ixy -y^2}{x^2 + y^2}\\ & = \left(x^2 + y^2 + \frac{x^2 -y^2}{x^2 + y^2}\right) + i \left(\frac{2xy}{x^2 + y^2}\right)\\ & := u(x,y) + i v(x,y). \end{align*}

Para mostrar la utilidad de obtener las derivadas parciales complejas pensando a $f$ como una función $g$ de las variables $z$ y $\overline{z}$, primeramente procedemos a obtener las derivadas parciales $f_z$ y $f_{\overline{z}}$ mediante la definición 19.1.

Derivamos parcialmente a las funciones $u$ y $v$. Sea $z = x+iy \neq 0$, entonces:
\begin{align*} \frac{\partial u}{\partial x} = \frac{2x^5 + 4x^3y^2 + 2xy^4 + 4xy^2}{(x^2+y^2)^2},\\ \frac{\partial u}{\partial y} = \frac{2y^5 + 4y^3x^2 + 2yx^4 – 4yx^2}{(x^2+y^2)^2}, \end{align*} \begin{align*} \frac{\partial v}{\partial x} = \frac{2y^3-2yx^2}{(x^2+y^2)^2},\\ \frac{\partial v}{\partial y} = \frac{2x^3 – 2xy^2}{(x^2+y^2)^2}. \end{align*}

Por tanto, para $z\neq 0$ tenemos que: \begin{align*} \frac{\partial f}{\partial z} & = \frac{1}{2} \left(\frac{\partial u }{\partial x} + \frac{\partial v}{\partial y} \right) + \frac{i}{2} \left(\frac{\partial v }{\partial x} – \frac{\partial u}{\partial y} \right),\\ & = \left(x + \frac{x}{x^2+y^2}\right) – i \left(y – \frac{y}{x^2+y^2} \right), \end{align*} \begin{align*} \frac{\partial f}{\partial \overline{z}} &= \frac{1}{2} \left(\frac{\partial u }{\partial x} – \frac{\partial v}{\partial y} \right) + \frac{i}{2} \left(\frac{\partial v }{\partial x} + \frac{\partial u}{\partial y} \right)\\ & = \left(x + \frac{3xy^2 – x^3}{(x^2+y^2)^2}\right) + i \left(y – \frac{3x^2y – y^3}{(x^2+y^2)^2} \right). \end{align*}

Considerando las igualdades dadas en (19.1), tenemos que: \begin{equation*} f_z = \overline{z} + \frac{1}{\overline{z}}, \quad \text{y} \quad f_{\overline{z}} = z – \frac{z}{\overline{z}^2}. \end{equation*}

Notemos que podemos evitar todo el desarrollo anterior si consideramos que: \begin{align*} f(z) & = |\,z\,|^2 + \dfrac{z}{\overline{z}}\\ & = z \overline{z} + \dfrac{z}{\overline{z}}\\ & := g(z,\overline{z}), \quad \forall z \neq 0, \end{align*}

entonces para todo $z\neq 0$ existen las derivadas parciales complejas: \begin{align*} f_z = \frac{\partial g}{\partial z} = \overline{z} + \frac{1}{\overline{z}},\\ f_{\overline{z}} = \frac{\partial g}{\partial \overline{z}} = z – \frac{z}{\overline{z}^2}. \end{align*}

De estas últimas expresiones es claro que las funciones $f_z$ y $f_{\overline{z}}$ son continuas en $U = \mathbb{C}\setminus\{0\}$, por lo que lo son también las derivadas parciales $u_x$, $u_y$, $v_x$ y $v_y$ , es decir que $f$ es de clase $C^1(U)$.

Por otra parte, dado que: \begin{equation*} \frac{\partial f}{\partial \overline{z}} = 0 \quad \Longleftrightarrow \quad z – \frac{z}{\overline{z}^2} = 0 \quad \Longleftrightarrow \quad \overline{z}^2 = 1 \quad \Longleftrightarrow \quad z = \pm 1, \end{equation*} entonces $f$ solo es diferenciable en los puntos $z=1$ y $z=-1$. Puesto que no existe disco abierto alrededor de dichos puntos donde $f$ sea diferenciable, concluimos que $f$ no es analítica en ningún punto en $\mathbb{C}$.

Observación 19.4.
Debe ser claro que si tenemos una función compleja $f$ diferenciable en un punto $z_0$, entonces se cumple que $f_{\overline{z}}(z_0) = 0$. Sin embargo, debemos enfatizar en que la existencia de $f_{\overline{z}}(z_0)$ no garantiza la existencia de $f'(z_0)$, desde que las ecuaciones de C-R no son una condición suficiente para la diferenciabilidad en el sentido complejo.

Ejemplo 19.4.
Consideremos el ejercicio 6 de la entrada 17. Tenemos que la función: \begin{equation*} f(z)= \left\{\begin{array}{lcc} \dfrac{z^5}{|\,z\,|^4}& \text{si} & z\neq 0, \\ 0 & \text{si} & z = 0, \end{array} \right. \end{equation*} satisface las ecuaciones de C-R en $z=0$, pero $f'(0)$ no existe.

Notemos que para $z=x+iy \neq 0$ tenemos que: \begin{equation*} f(z) = \frac{x^5-10x^3y^2 + 5xy^4}{(x^2+y^2)^2} + i \left(\frac{x^4-10x^2y^3 + y^5}{(x^2+y^2)^2}\right), \end{equation*} por lo que: \begin{align*} \frac{\partial u }{\partial x}(0,0) = \lim_{h \to 0} \frac{u(h,0) – u(0,0)}{h} = 0\\ \frac{\partial u }{\partial y}(0,0) = \lim_{k \to 0} \frac{u(0,k) – u(0,0)}{k} = 0\\ \frac{\partial v}{\partial x}(0,0) = \lim_{h \to 0} \frac{v(h,0) – v(0,0)}{h} = 0\\ \frac{\partial v}{\partial y}(0,0) = \lim_{k \to 0} \frac{v(0,k) – u(0,0)}{k} = 0, \end{align*}

entonces, considerando la definición 19.1, tenemos que: \begin{align*} \frac{\partial f}{\partial z}(0,0) = \frac{1}{2} \left(\frac{\partial u }{\partial x}(0,0) + \frac{\partial v}{\partial y}(0,0) \right) + \frac{i}{2} \left(\frac{\partial v }{\partial x}(0,0) – \frac{\partial u}{\partial y}(0,0) \right) = 0,\\ \frac{\partial f}{\partial \overline{z}} (0,0)= \frac{1}{2} \left(\frac{\partial u }{\partial x}(0,0) – \frac{\partial v}{\partial y}(0,0) \right) + \frac{i}{2} \left(\frac{\partial v }{\partial x}(0,0) + \frac{\partial u}{\partial y}(0,0) \right) = 0, \end{align*}

es decir que $f_z(0,0) = f_{\overline{z}}(0,0) = 0$. Sin embargo, notemos que para $z\neq 0$ se tiene que: \begin{align*} \lim_{z\to 0} \frac{f(z) – f(0)}{z-0} & = \lim_{z\to 0} \frac{z^4}{|\,z\,|^4}\\ & = \lim_{z\to 0} \frac{z^2}{\overline{z}^2}, \end{align*} pero dicho límite no existe pues si nos aproximamos a $0$ a través de la recta $y=x$ tenemos que: \begin{align*} \lim_{z\to 0} \frac{f(z) – f(0)}{z-0} & = \lim_{x\to 0} \frac{x^2 \left(1+i\right)^2}{x^2 \left(1-i\right)^2}\ & = \left(\frac{ 1+i}{1-i}\right)^2 = -1, \end{align*}

mientras que si nos aproximamos a $0$ a través del eje $x$ tenemos que: \begin{equation*} \lim_{z\to 0} \frac{f(z) – f(0)}{z-0} = \lim_{x\to 0} \frac{\left(x + i0\right)^2}{\left(x-i0\right)^2} = 1, \end{equation*} por lo que $f'(0)$ no existe.

El resultado obtenido en este ejemplo no contradice el teorema 18.1 de la entrada anterior ni a la proposición 19.1 de esta entrada, sino que en ambos casos no se cumple la hipótesis de continuidad de las derivadas parciales de las funciones $u$ y $v$ que determinan a $f$.

Lema 19.2.
Sea $D\subset\mathbb{R}^2$ un conjunto abierto y conexo. Si $u:D\to\mathbb{R}$ es una función real tal que $u_x(z) = u_y(z) = 0$ para todo $z=(x,y)\in D$, entonces $u$ es una función constante en $D$.

Demostración. Dadas las hipótesis, tomemos a $z_0=(x_0,y_0)\in D$ fijo, entonces existe algún $r>0$ tal que $B(z_0,r)\subset D$. Sea $z=(x,y)\in B(z_0,r)$, procediendo como en la prueba del teorema 18.1 de la entrada anterior, concluimos, por el teorema del valor intermedio para funciones reales, que existen $\alpha, \beta\in(0,1)$, tales que:
\begin{align*} u(z)-u(z_0) & = u(x,y)-u(x_0,y_0)\\ & = (x-x_0) u_x(x_0+\alpha(x-x_0),y) + (y-y_0) u_y(x_0, y_0+\beta(y-y_0)).\tag{19.2} \end{align*}

Sean $\zeta_1 = (x_0+\alpha(x-x_0),y)$ y $\zeta_2 = (x_0,y_0+\beta(y-y_0))$, para algunos $\alpha, \beta\in(0,1)$. Es claro que, figura 75: \begin{equation*} \left| \zeta_1 – z_0 \right| \leq \left| z – z_0 \right|<r, \quad \left| \zeta_2 – z_0\right| \leq \left| z – z_0 \right|<r, \end{equation*} por lo que, la igualdad en (19.2) es equivalente a decir que existen $\zeta_1, \zeta_2 \in B(z_0,r)$ tales que: \begin{equation*} u(z)-u(z_0) = (x-x_0) u_x(\zeta_1) + (y-y_0) u_y(\zeta_2). \tag{19.3} \end{equation*}

Figura 75: $\zeta_1, \zeta_2 \in B(z_0,r)$ dados por el segmento de recta $[z_0, z]$ contenido en el disco abierto con centro en $z_0$ y radio $r>0$.

De acuerdo con la igualdad (19.3), como $\zeta_1, \zeta_2 \in D$, entonces por hipótesis se cumple que: \begin{equation*} u(z)-u(z_0) = (x-x_0) \cdot 0 + (y-y_0) \cdot 0 = 0, \end{equation*} por lo que para todo $z\in B(z_0, r)$ se cumple que $u(z) = u(z_0)$, es decir que $u$ es una función constante en todo disco abierto completamente contenido en $D$.

Para $z_0\in D$ un punto fijo, definimos los siguientes conjuntos: \begin{equation*} U=\{ z\in D : u(z) = u(z_0)\} \quad \text{y} \quad V=\{ z\in D : u(z) \neq u(z_0)\}. \end{equation*}

Probemos que $U$ y $V$ son conjuntos abiertos en $D$.

Sea $z\in U$, entonces $u(z) = u(z_0)$. Por otra parte, como $D$ es abierto entonces existe $r>0$ tal que $B(z,r) \subset D$. Veamos que $B(z,r) \subset U$.

De acuerdo con lo que probamos antes, es claro que para todo $z^* \in B(z,r)$ la función $u$ es constante en dicho disco, por lo que $u(z) = u(z^*)$, entonces para todo $z^* \in B(z,r)$ se cumple que $u(z^*) = u(z_0)$, es decir, $z^* \in U$, entonces: \begin{equation*} B(z,r) \subset U, \end{equation*} por lo que concluimos que $U$ es un conjunto abierto. De manera análoga se verifica que $V$ es un conjunto abierto, por lo que se deja como ejercicio al lector.

Tenemos entonces que $D = U \cup V$ y $U \cap V = \emptyset$, pero como $D$ es un conjunto conexo, entonces uno de los dos conjuntos $U$ o $V$ debe ser vacío. Por construcción es claro que $z_0\in U$, por lo que $V = \emptyset$, por lo tanto $D = U$, entonces para todo $z\in D$ se cumple que $u(z) = u(z_0)$, es decir que $u$ es una función constante en $D$.

$\blacksquare$

Proposición 19.2.
Sean $D\subset\mathbb{C}$ un dominio y $f:D\to\mathbb{C}$ una función analítica en $D$. Si $f'(z) = 0$ para todo $z\in D$, entonces $f$ es una función constante en $D$.

Demostración. Dadas las hipótesis, tomemos a $f(z) = u(x,y) + iv(x,y)$ definida en $D$. Como $f$ es una función analítica en $D$, entonces las funciones $u$ y $v$ satisfacen las ecuaciones de C-R en $D$ y se cumple que: \begin{equation*} f'(z) = u_x(z) + iv_x(z), \quad \forall z = x+iy \in D. \end{equation*}

Por hipótesis tenemos que: \begin{equation*} 0 = f'(z) = u_x(z) + iv_x(z) = v_y(z) – i u_y(z), \end{equation*} para todo $z \in D$, es decir que para todo punto en $D$ se cumple que: \begin{equation*} u_x(x,y) = u_y(x,y) = v_x(x,y) = v_y(x,y) = 0. \end{equation*}

Considerando el lema 19.2 concluimos que las funciones $u$ y $v$ son constantes en $D$ y por tanto que $f$ es una función constante en $D$.

$\blacksquare$

Corolario 19.1.
Sean $D\subset\mathbb{C}$ un dominio y $f,g\in \mathcal{F}(D)$ dos funciones analíticas en $D$. Si $f$ y $g$ coinciden en un punto y tienen la misma derivada en $D$, entonces $f$ y $g$ son idénticas.

Demostración. Se deja como ejercicio al lector.

$\blacksquare$

Observación 19.5.
La propiedad de conexidad del dominio $D$ es necesaria. Notemos que en la prueba de la proposición 19.2, de manera implícita, usamos fuertemente el hecho de que $D$ era un conjunto conexo, pero si $D$ solo es un conjunto abierto el resultado no es válido.

Ejemplo 19.5.
Consideremos al conjunto $U = \{ z=x+iy\in\mathbb{C} : x \neq 0\}$, el cual es abierto en $\mathbb{C}$. Definimos a la función: \begin{equation*} f(z)= \left\{ \begin{array}{lcc} 1 & \text{si} & \operatorname{Re}(z)>0, \\ 2 & \text{si} & \operatorname{Re}(z)<0. \end{array} \right. \end{equation*} Claramente la función $f(z)$ es analítica en $U$ y $f'(z) = 0$ para todo $z\in U$, sin embargo $f$ no es una función constante.

Procedemos ahora a probar un resultado en el cual podemos ver que la analicidad de una función compleja es una propiedad más restrictiva que la diferenciabilidad en el sentido real.

Proposición 19.3.
Sean $D\subset\mathbb{C}$ un dominio y $f(z) = u(x,y) + iv(x,y)$ una función analítica en $D$.

  1. Si $u$ ó $v$ son constantes en $D$, entonces $f$ también es una función constante en $D$.
  2. Si $|\,f\,|$ es constante en $D$, entonces $f$ también es una función constante en $D$.

Dadas las hipótesis, como $f$ es una función analítica en $D$, entonces las funciones $u$ y $v$ satisfacen las ecuaciones de C-R en $D$ y se tiene que: \begin{equation*} f'(z) = u_x(z) + iv_x(z) = v_y(z) – iu_y(z), \quad \forall z\in D\tag{19.4} \end{equation*}

  1. Probaremos el resultado considerando a la función $u$ como constante, el caso en el que la función $v$ es constante es completamente análogo.

Si suponemos que $u$ es una función constante en $D$, entonces se cumple que: \begin{equation*} u_x(z) = u_y(z) = 0, \quad \forall z=x+iy\in D. \end{equation*}

De acuerdo con (19.4) tenemos que: \begin{equation*} f'(z) = u_x(z) – iu_y(z) = 0, \end{equation*} para todo $z=x+iy\in D$, por lo que se sigue de la proposición 19.2 que $f$ es constante en $D$.

  1. Supongamos ahora que $|\,f\,|$ es una función constante en $D$, entonces tenemos que: \begin{equation*} |\,f(z)\,|^2 = u^2(x,y) + v^2(x,y) = c, \tag{19.5} \end{equation*} para todo $z=x+iy\in D$ y para alguna constante real $c\geq 0$.

Si $c = 0 $, entonces es claro que $f(z) = 0$ para todo $z=x+iy\in D$, por lo que en tal caso $f$ es constante.

Supongamos que $c > 0 $, entonces tomando derivadas parciales en (19.5), con respecto a $x$ e $y$, para todo $z=x+iy\in D$ tenemos que: \begin{align*} 2u(x,y) u_x(x,y) + 2 v(x,y) v_x(x,y) = 0,\\ 2u(x,y) u_y(x,y) + 2 v(x,y) v_y(x,y) = 0, \end{align*}

Por hipótesis sabemos que se cumplen las ecuaciones de C-R en $D$, por lo que para todo $z=x+iy \in D$ se tiene que: \begin{align*} u(x,y) u_x(x,y) – v(x,y) u_y(x,y) = 0,\\ u(x,y) u_y(x,y) + v(x,y) u_x(x,y) = 0. \end{align*}

Multiplicando por las funciones $u(x,y)$ y $v(x,y)$, respectivamente, en las igualdades anteriores, procedemos a sumarlas y restarlas, entonces para todo $z=x+iy\in D$ tenemos que: \begin{align*} u_x(x,y)\left(u^2(x,y) + v^2(x,y) \right) = 0,\\ u_y(x,y)\left(u^2(x,y) + v^2(x,y) \right) = 0, \end{align*} de donde $u_x(x,y) = u_y(x,y) = 0$ para todo $z=x+iy\in D$. De manera análoga podemos obtener que $v_x(x,y) = v_y(x,y) = 0$ en $D$. Considerando el lema 19.2 concluimos que $u$ es una función constante en $D$, por lo que, de acuerdo con la primera parte de la prueba, $f$ es una función constante en $D$.

Tarea moral

  1. Demuestra el lema 19.1 y la proposición 19.1.
  2. Sea $D\subset\mathbb{C}$ un dominio. Supón que $f$ y $|\,f\,|$ son funciones analíticas en $D$. Prueba que $f$ es una función constante en $D$.
  3. Obtén las derivadas parciales $f_z$ y $f_{\overline{z}}$ para las siguientes funciones complejas:
    a) $f(z) = 2x^3y^2 + i(x^2-y)$.
    b) $f(z) = \dfrac{x-1-iy}{(x-1)^2 + y^2}$.
    c) $f(z) = x^2+y^2+3x+1+i3y$.
    d) $f(z) = x^2-y^2+i3xy$.
    e) $f(z) = (x+iy)(x^2+y^2)$.
    ¿Son analíticas? ¿Son diferenciables?
  4. Sea $U\subset \mathbb{C}$ un conjunto abierto y $f:U\to\mathbb{C}$ una función de clase $C^1$. Muestra que para todo $z\in U$ se cumple que:
    a) $(\overline{f})_z = \overline{f_{\overline{z}}}$.
    b) $(\overline{f})_{\overline{z}} = \overline{f_z}$.
  5. Sean $D\subset\mathbb{C}$ un dominio y $f \in \mathcal{F}(D)$ una función analítica. Supón que existen $a,b,c\in\mathbb{R}$, constantes reales con $a^2 + b^2 > 0$, tales que: \begin{equation*} a \operatorname{Re} f(z) + b \operatorname{Im} f(z) = c, \quad \forall z \in D. \end{equation*} Prueba que la función $f$ es constante en $D$.
  6. Sea $f:\mathbb{C} \to \mathbb{C}$ un polinomio. Supón que: \begin{equation*} \frac{\partial f}{\partial z} = 0 = \frac{\partial f}{\partial \overline{z}}, \quad \forall z\in \mathbb{C}. \end{equation*} Prueba que la función $f$ es constante.
  7. Demuestra el corolario 19.1.
  8. Sea $U\subset \mathbb{C}$ un conjunto abierto y sean $f,g:U \to \mathbb{C}$ dos funciones de clase $C^1$. Muestra que para cualesquiera constantes $a,b\in\mathbb{C}$ se cumple que:
    a) $\dfrac{\partial}{\partial z}\left( a f + b g\right) = a \dfrac{\partial f}{\partial z} + b \dfrac{\partial g}{\partial z}$.
    b) $\dfrac{\partial}{\partial \overline{z}}\left( a f + b g\right) = a \dfrac{\partial f}{\partial \overline{z}} + b \dfrac{\partial g}{\partial \overline{z}}$.
    c) $\dfrac{\partial}{\partial z}\left( fg\right) = g \dfrac{\partial f}{\partial z} + f \dfrac{\partial g}{\partial z}$.
    d) $\dfrac{\partial}{\partial \overline{z}}\left( fg\right) = g \dfrac{\partial f}{\partial \overline{z}} + f \dfrac{\partial g}{\partial \overline{z}}$.
  9. Sean $U, V\subset \mathbb{C}$ dos conjuntos abiertos. Supón que $f:U \to \mathbb{C}$ y $g:V \to \mathbb{C}$ son dos funciones de clase $C^1$ y que $f(U) \subset V$. Muestra que: \begin{align*} \left(g\circ f\right)_z = \left(g_z \circ f\right)f_z + \left(g_{\overline{z}} \circ f\right)\left(\overline{f}\right)_z,\\ \left(g \circ f\right)_{\overline{z}} = \left(g_z\circ f\right)f_{\overline{z}} + \left(g_{\overline{z}} \circ f\right)\left(\overline{f}\right)_{\overline{z}}. \end{align*} Concluye que:
    a) Si $f$ es analítica en $U$, entonces: \begin{equation*} \left(g\circ f\right)_z = \left(g_z \circ f\right)f’, \quad \left(g \circ f\right)_{\overline{z}} = \left(g_{\overline{z}} \circ f\right)\overline{f’}. \end{equation*}
    b) Si $g$ es analítica en $V$, entonces: \begin{equation*} \left(g\circ f\right)_z = \left(g’ \circ f\right)f_z, \quad \left(g\circ f\right)_{\overline{z}} = \left(g’ \circ f\right)f_{\overline{z}}.\end{equation*}

Más adelante…

En esta entrada hemos deducido una serie de resultados que son consecuencia directa de las ecuaciones de C-R, además de caracterizar aún más a la diferenciabilidad compleja a través del concepto de analicidad de una función, que como vimos resulta ser un concepto más restrictivo que el de diferenciabilidad real. Mediante los resultados de esta entrada hemos concluido que las «genuinas» funciones complejas que resultan ser analíticas son aquellas que solo están dadas en términos de la variable compleja $z$, es decir que no dependen de $\overline{z}$.

La siguientes entradas definiremos algunas de las funciones complejas elementales para la teoría. Mediante estas funciones haremos una extensión de las funciones reales como la exponencial, el logaritmo y las funciones trigonométricas. Veremos que para el caso complejo muchas de las propiedades que satisfacen dichas funciones reales se seguirán cumpliendo, aunque como es de esperarse veremos que en el caso complejo estas funciones cumplen otras propiedades como la periodicidad y retomaremos nuevamente el concepto de funciones multivaludas.

Entradas relacionadas

Nota 3. El complemento de un conjunto.

Por Julio César Soria Ramírez

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción.

En notas anteriores hemos estado usando la noción intuitiva de un conjunto, concretamos ciertas ideas como la relación de pertenencia y establecimos algunos axiomas. Por otra parte definimos lo que es un subconjunto: dados $A$ y $B$ conjuntos $A\subseteq B$ si y sólo si para toda $z$, $z\in A$ implica que $z\in B.$ Dedujimos también propiedades de la contención haciendo énfasis en la manera en la que se hace una prueba. Ver la nota 2.

Vimos entre otras cosas que dada una propiedad $P$, no todos los elementos que cumplan la propiedad van a ser un conjunto. Si consideramos por ejemplo $\set{x\mid x\notin x}$, resultaba no ser un conjunto ya que de considerarlo como tal podemos tener paradojas como la de Russell, llegando a contradicciones. Por otro lado si ya tenemos un conjunto $A$ y consideramos los elementos en él que cumplan una propiedad $\set{\,x\in A\mid\,x\,cumple\,P\,}$, ese sí es un conjunto y establecemos ese hecho como un axioma de la teoría llamado de comprensión o de separación.

En esta tercera nota retomaremos esas ideas y definiremos el complemento de un conjunto. Deduciremos algunas propiedades básicas pero muy importantes.

Como mencionamos la colección $\set{x\mid x\notin x}$, no es un conjunto, pero no debemos preocuparnos, ya que usualmente trabajaremos con objetos que sabemos perfectamente que sí son un conjunto, gracias al axioma de separación, por ejemplo con los números racionales, o con los puntos del plano cartesiano, o con la colección de todas las funciones de los reales en sí mismos. A este conjunto dentro del cual se encuentran todos los objetos que trabajaremos en algún momento dado, le llamaremos un conjunto universo y lo denotaremos usualmente por $X$.

Es importante señalar que no se trata de un único conjunto universo ya que de acuerdo a lo que estudiamos mediante la paradoja de Russell el universo completo no es un conjunto. Por ello hablaremos de «un» conjunto universo ya que va variando según el contexto en el que trabajemos, eligiendo un conjunto universo que contenga a todos los conjuntos que consideraremos en ese momento.

Definición

Sea $X$ un conjunto universo, $A$ un subconjunto de $X$. El complemento de $A$ respecto a $X$ es:

$X\setminus A =A^c=\set{x\in X\mid x\notin A}.$

Ejemplos:

  1. Si $X=\set{1,2,3,4,5}$ y $A=\set{1,3,5}$
    $X\setminus A =A^c=\set{ 2,4}$.
  2. Si $X=\mathbb N$ y $A=\set{x\in \mathbb N\mid 5\leq x}=\set{5,6,7,…}$
    $ \mathbb N \setminus A =A^c=\set{x\in \mathbb N \mid x\notin A}$ = $\set{x\in \mathbb N \mid x< 5}=\{0,1,2,3,4\}.$
  3. Si $X=\mathbb Z$ y $A=\set{x\in \mathbb N\mid 5\leq x}=\set{5,6,7,…}\phantom{zzzzzzz}$ $\mathbb Z \setminus A =A^c=\set{x\in \mathbb Z \mid x\notin A}$ = $\set{x\in \mathbb Z \mid x< 5}=\{\dots, -2,-1,0,1,2,3,4\}.$

De acuerdo a los ejemplos 2 y 3 nota que siempre tienes que aclarar cuál será el conjunto universo $X$ a considerar para hablar del complemento de un conjunto. La notación $A^c$ es bastante útil pero debemos tener claro quién es el conjunto $X$ con respecto al cual estamos calculando el complemento del conjunto $A$.

En el siguiente recurso de Geogebra, mueve los deslizadores para construir el conjunto $A$ y obtener su complemento.

Vamos a revisar algunas propiedades del complemento.

Propiedades

Sean $X$ un conjunto universo, $A$ y $B$ subconjuntos de $X$.

  1. $(A^c)^c=A.$
  2. $A\subseteq B \Longleftrightarrow B^c\subseteq A^c.$
  3. $A=B \Longleftrightarrow B^c=A^c.$
  4. $\emptyset^c=X.$
  5. $X^c=\emptyset .$

Demostración de 1.

Según el axioma de extensionalidad $A=B$ es equivalente a $A\subseteq B$ y $B\subseteq A$.

Estas pruebas de igualdad entre conjuntos se realizan usando el axioma de extensionalidad y se dice entonces que se trata de una prueba por doble contención.

Así, para demostrar que:

$(A^c)^c=A$

mostraremos que $(A^c)^c\subseteq A$ y que $A\subseteq (A^c)^c$.

Primero probemos que $(A^c)^c\subseteq A$.

Sea $z\in (A^c)^c$, por definición de complemento tenemos que $ (A^c)^c=\set{x\in X \mid x\notin A^c}$, así:

$z\in \set{x\in X \mid x\notin A^c}$

por lo que $z$ cumple la propiedad que define al conjunto, es decir $z\in X$ pero $z\notin A^c$. Como $ A^c=\set{x\in X \mid x\notin A}$, se deduce que $z\in A$ (pues en caso contrario $z$ sería un elemento de $A^c$), y de esta manera tenemos lo que queríamos demostrar pues cada vez que $z\in (A^c)^c$ también $z\in A$. Por lo tanto $(A^c)^c\subseteq A$.

Procedamos a probar la segunda contención $A\subseteq (A^c)^c$.

Sea $z\in A$, entonces $z\notin \set{x\in X \mid x\notin A}= A^c$ (debido a que no cumple la segunda condición que se pide para que un elemento pertenezca a este conjunto, el hecho de no ser elemento de $A$). Por otro lado, como $z\in A$ y $A\subseteq X$ (ya que $X$ es el conjunto universo), se tiene que $z\in X$. Así, $z$ cumple la propiedad que define al siguiente conjunto:

$\set{x\in X\mid x\notin A^c}$

cuyos elementos son aquellos elementos de $X$ que cumplen con la propiedad de no pertenecer al complemento de $A$, pero por definición ese conjunto es $(A^c)^c$, y por lo tanto $z\in (A^c)^c$. Así, $A\subseteq (A^c)^c$.

Como hemos probado las dos contenciones, $(A^c)^c\subseteq A$ y $A\subseteq (A^c)^c$, por el axioma de extensionalidad podemos afirmar que $A=(A^c)^c$.

Demostración de 2.

Por demostrar que $A\subseteq B \Longleftrightarrow B^c\subseteq A^c$.

Esta es una implicación de ida y vuelta, bicondicional o si y sólo si.

Debemos demostrar ambas implicaciones, es decir que:

  • $A\subseteq B \Longrightarrow B^c\subseteq A^c$ y que
  • $B^c\subseteq A^c \Longrightarrow A\subseteq B.$

Por demostrar que $A\subseteq B \Longrightarrow B^c\subseteq A^c$.

Supongamos por hipótesis que $A\subseteq B$. A partir de ello mostremos que $ B^c\subseteq A^c$. Para probar dicha contención sea $z\in B^c$ y veamos que $z\in A^c$. Como $z\in B^c=\set{x\in X\mid x\notin B}$ tenemos que $z\in X$ y $z\notin B$. Sabemos que hay dos opciones, que $z\in A$ o que $z\notin A$. Pero si $z\in A$, dado que por hipótesis $A\subseteq B$, tendríamos que $z\in B,$ lo que contradice el hecho de que $z\notin B$. Concluimos entonces que $z\notin A$, lo que muestra que $z$ es elemento del conjunto $\set{x\in X \mid x\notin A}=A^c$, que es lo que queríamos demostrar y por tanto: $A\subseteq B \Longrightarrow B^c\subseteq A^c$.

Por demostrar que $B^c\subseteq A^c \Longrightarrow A\subseteq B$.

Supongamos como hipótesis que $B^c\subseteq A^c$ y probemos con ello que $A\subseteq B$.

Por la implicación que acabamos de probar podemos afirmar que si:

$B^c\subseteq A^c$

entonces:

$(A^c)^c\subseteq (B^c)^c.$

Además, por lo demostrado en 1:

$(A^c)^c=A$ y $(B^c)^c=B.$

Así:

$A\subseteq B$.

Por lo tanto: $B^c\subseteq A^c \Longrightarrow A\subseteq B$.

Demostración 3.

Por demostrar que $A=B \Longleftrightarrow B^c=A^c$.

$ A=B \Longleftrightarrow A\subseteq B \text{ y } B\subseteq A$por el Ax. de extensionalidad
$\phantom{A=B}\Longleftrightarrow B^c\subseteq A^c \text{ y } A^c\subseteq B^c$ por la propiedad 2
$\phantom{A=B}\Longleftrightarrow A^c=B^c.$por el Ax. de extensionalidad

Nota cómo esta cadena de implicaciones son derivadas de los axiomas o de las propiedades ya demostradas.

Demostración 4.

Por demostrar que $\emptyset^c=X$

La prueba se hará por doble contención.

Así, primero mostremos que $\emptyset^c\subseteq X$.

Sea $z\in \emptyset^c=\set{x\in X\mid x\notin \emptyset}.$ Entonces $z$ cumple las condiciones que caracterizan a los elementos de dicho conjunto, en particular $z\in X$.

Por lo tanto $\emptyset^c\subseteq X$, lo que nos da la primera contención.

Ahora mostremos que $X\subseteq \emptyset^c$

Sea $z\in X$. Sabemos que el vacío no tiene elementos así que ningún objeto puede ser elemento del vacío, en particular $z\notin\emptyset$. Entonces, por definición de complemento:

$z\in \set{x\in X \mid z\notin \emptyset}=\emptyset^c.$

Así, $X\subseteq \emptyset^c$, lo que nos da la segunda contención.

Finalmente como $\emptyset^c\subseteq X$ y $X\subseteq \emptyset^c$ por el axioma de extensionalidad tenemos que $X= \emptyset^c$, que es lo que queríamos demostrar.

Demostración 5.

Por demostrar que $X^c=\emptyset.$

De la propiedad 4 sabemos que: $\emptyset^c=X$, y por la propiedad 3 esto implica que $(\emptyset^c)^c=X^c$. Pero $(\emptyset^c)^c=\emptyset$ por la propiedad 1, así $\emptyset=X^c$, que es lo que queríamos demostrar.

Esto concluye la demostración de las 5 propiedades mencionadas, en la tarea moral hay ejercicios que te permitirán aplicar los nuevos teoremas que hemos estudiado.

$\square$

Tarea Moral.

  1. Considera el conjunto universal de los números enteros y los siguientes subconjuntos de los enteros:

$$C=\set{t\in \mathbb Z\mid\,t=9k+3\,para\,alguna\,k\in \mathbb Z}$$ $$D=\set{t\in \mathbb Z\mid\,t\,es\,un\,múltiplo\,de\,3}. $$

Prueba lo siguiente:

  • Prueba que $C\subseteq D$.
  • Encuentra $C^c$.
  • Encuentra $D^c$
  • Verifica que $D^c\subseteq C^c$ a partir de cómo están definidos los conjuntos $C^c$ y $D^c$ .

3. Sea $X=\mathbb R$ el conjunto universo. Encuentra el complemento de los siguientes conjuntos:

  • $\set{x\in \mathbb R \mid x<2}.$
  • $\set{x\in \mathbb R \mid -3\leq x< 2}.$
  • $\set{x\in \mathbb R \mid\,x\,es\,un\,número\,racional\, }.$
  • $\set{x\in \mathbb R \mid \,x\,es\,irracional\,y\,x\leq0\,}.$

Más adelante

En la siguiente sección definiremos dos operaciones con conjuntos, la unión e intersección de conjuntos. Además demostraremos propiedades bastante útiles para el desarrollo de muchas áreas de la matemática como la topología y el análisis.

Entradas relacionadas

Página principal del curso.

Nota. Las imágenes mostradas para ilustrar los conjuntos no fueron de diseño propio, y se da las gracias a: https://www.spanish.cl/ por sus divertidos dibujos. Se deja el link de donde se obtuvieron: https://www.spanish.cl/vocabulario/animales-de-la-granja.htm.

Nelson Lillo Terán ( Gaiano Andino

Este recurso de GeoGebra fue elaborado por Nelson Lillo Terán ( Gaiano Andino , a quien agradezco por permitir su uso y adaptación.

Nota 1. Noción de Conjunto

Por Julio César Soria Ramírez

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

No nos rompamos tanto la cabeza, desde que estamos en educación preescolar hemos estado trabajando con ellos, colocamos objetos con alguna característica común o no y consideramos esa colección como una unidad.

De esta manera podemos dar una definición intuitiva de lo que es un conjunto:

Definición (intuitiva)

Un conjunto es una colección de objetos considerada como un todo, y los objetos que pertenecen a un conjunto son sus elementos.

La pertenencia es una relación binaria que se aplica entre los objetos de la teoría de conjuntos.

Notación:

$x\in A$ indica que $x$ es un elemento del conjunto $A$, mientras que la negación $x\notin A$ indica que $x$ no es un elemento de $A$ . Se acostumbra escribir a los elementos del conjunto entre llaves, separados por una coma.

Para poder trabajar con los conjuntos de forma adecuada, debemos establecer reglas llamadas axiomas que nos permitan saber cuándo una colección será considerada un conjunto. Veremos sólo algunos de ellos para darnos una idea de qué tipo de reglas son las que se establecen en la teoría de conjuntos. Por ahora mencionemos los siguientes:

Axioma del conjunto vacío

Podemos construir un conjunto que no tenga elementos, se llamará el conjunto vacío, se denotará por $\emptyset$ o por $\{\}$.

Notemos que, dado que el conjunto vacío no tiene elementos, se tiene que $\emptyset\notin \emptyset$ y, de manera más general, para todo conjunto $a$ se tiene que $a\notin \emptyset$.

Axioma del par

Dados dos objetos $C$ y $D$ podemos construir un conjunto que tiene por elementos exactamente a $C$ y $D$, denotado por $\set{C,D}$. En particular, si $C=D$ se puede formar el conjunto unitario cuyo único elemento es $C$, que se denota por $\{C\}$.

En general si $C_1,…,C_n$ son objetos, podemos construir el conjunto $\set{ C_1,…,C_n }$ .

Cabe señalar que todos los objetos que trabajaremos serán conjuntos, así que todo elemento de un conjunto es a su vez un conjunto.

Como veremos más adelante, los números naturales serán conjuntos y resultarán ser distintos como conjuntos cuando sean distintos como números, ver la sección 5.1, página 207, del libro de Avella y Campero que se menciona en la bibliografía de este curso.

Ejemplo:

  1. Consideremos el conjunto vacío, $\emptyset$. Podemos formar el conjunto unitario cuyo único elemento es el conjunto vacío que se denota por $\{\emptyset\}$. En este caso tenemos que $\emptyset\in\{\emptyset\}$.
  2. Consideremos el conjunto cuyos elementos son $\emptyset$ y $\{\emptyset\}$, es decir el conjunto $\{\emptyset,\{\emptyset\}\}$. En este caso tenemos que $\emptyset\in\{\emptyset,\{\emptyset\}\}$ y $\{\emptyset\}\in\{\emptyset,\{\emptyset\}\}$.
  3. Consideremos el conjunto cuyo único elemento es el unitario del vacío, es decir el conjunto $\{\{\emptyset\}\}$. En este caso tenemos que $\{\emptyset\}\in\{\{\emptyset\}\}$.
  4. Dados los números $4$ y $7$ formamos el conjunto que tiene a éstos como elementos y lo denotamos como $\set{4,7}$. Observa que: $4\in \set{4,7}$ y $7\in \set{4,7}$. Formemos ahora un conjunto que tiene como elementos al conjunto $\set{4,7}$ y al número $6$, denotado por $\set{\set{4,7},6}$. Entonces, $\set{4,7}\in \set{\set{4,7},6}$ y $6\in \set{\set{4,7},6}$.
  5. Considera el conjunto formado por los números $2$ y $3$, denotado por $\set{2,3}$. Ahora considera al conjunto formado por los números $3$, $9$ y $11$, es decir el conjunto $,\set{\,3,9,11\,}$. Formemos después al conjunto que tiene por elementos a los números $33$, $1$ y al conjunto $\set{\,3,9,11\,}$ que se denota por $\set{\,33,1,\set{\,3,9,11\,}\,}$. Finalmente sea $A$ el conjunto cuyos elementos son exactamente el conjunto $\set{2,3}$, el número $4$ y el conjunto $\set{\,33,1,\set{\,3,9, 11\,}\,}$, es decir, $$A=\set{\,\set{2,3},4,\set{\,33,1,\set{\,3,9, 11\,}\,}\,}.$$ Notemos entonces que, dado que los elementos de $A$ son el conjunto $\set{2,3}$, el número $4$ y el conjunto $\set{\,33,1,\set{\,3,9, 11\,}\,}$, podemos afirmar que $\set{2,3}\in A$, $4\in A$ y $\set{\,33,1,\set{\,3,9,11\,}\,}\in A$.

Los conjuntos se pueden describir a partir de propiedades que caracterizan a sus elementos.

Ejemplos:

  1. $\set{\,x \mid x=1 \,\,o\,\, x=2}=\set{1,2}$.
  2. $\set{\,x \mid x \, \text{es un número tal que $x^2=1$}}=\set{1,-1}$.
  3. $\set{\,x \mid x\neq x}$ es un conjunto sin elementos, es decir es el conjunto vacío, es decir, $\set{\,x \mid x\neq x}=\{\}=\emptyset$.
  4. $A=\set{2,-7,\frac{1}{4},5,\pi}$.

En general, si una propiedad $P$ describe a los elementos del conjunto $A$ escribimos:

$A=\set{x \mid x\, \text{cumple $P$}}$

¿Toda propiedad $P$ define un conjunto?

Si cualquier propiedad $P$ puede definir un conjunto, en particular la propiedad de no pertenecer a sí mismo debería determinar un conjunto.

Así, consideremos la colección $C = \set{ x \mid x \notin x }$, formado por todos los conjuntos que no se pertenecen a sí mismos.

Si $C$ es un conjunto es razonable preguntarse si $C$ pertenece o no a sí mismo. Analicemos entonces ambas posibilidades.

Si $C \in C$, entonces $C$ es un elemento de sí mismo y, por lo tanto, tiene que cumplir la propiedad que caracteriza a sus elementos, así que $C \notin C$.

Si $C \notin C$, $C$ cumple la propiedad que caracteriza a los elementos de $C$ y, por lo tanto, $C \in C$.

En cualquiera de ambos casos hemos llegado a que $C \in C$ y $C \notin C$. Esto contradice la lógica matemática clásica, pues sólo una de las aseveraciones es cierta: $C \in C$ o $C \notin C$. Esto es una paradoja, es decir una contradicción a la que se llega mediante un razonamiento lógico. Fue encontrada por el filósofo y matemático Bertrand Russell en la teoría de conjuntos que desarrollaba el matemático Georg Cantor. En honor a él se le conoce como la paradoja de Russell.

Así, no toda propiedad define un conjunto y por ello se tiene la necesidad de establecer las reglas o axiomas que mencionamos, para saber qué colecciones sí se considerarán un conjunto.

Definición

Dada una propiedad $P$ decimos que $\set{x \mid x\, \text{cumple $P$}}$ es la colección o clase formada por todos los objetos que cumplen la propiedad $P$. Decimos que es una clase propia si no es un conjunto.

Nota que todo conjunto es una clase, pero, por lo dicho anteriormente, no toda clase será considerada un conjunto. Por ejemplo, $C = \set{ x \mid x \notin x }$ es una clase que no es un conjunto, es decir es una clase propia.

Tarea Moral

Ve el siguiente video:

Más adelante

Es necesario determinar cuándo dos conjuntos son iguales y para ello es importante entender qué es lo que nos interesará de los conjuntos. Intuitivamente lo que determina a un conjunto son sus elementos, no el orden en que aparecen , ni si se escribe un mismo elemento varias veces. Para lograr formalizar esta idea requerimos el concepto de subconjunto por lo que en la siguiente nota veremos más objetos de la teoría de conjuntos que se obtienen de considerar colecciones formadas al elegir algunos elementos de un conjunto dado, además será la primera entrada donde haremos afirmaciones y las probaremos.

Entradas relacionadas

Página principal del curso

Nota siguiente del curso: Nota 2. Subconjuntos.

Nota. Las imágenes mostradas para ilustrar los conjuntos no fueron de diseño propio, y se da las gracias a: https://www.spanish.cl/ por sus divertidos dibujos. Se deja el link de donde se obtuvieron: https://www.spanish.cl/vocabulario/animales-de-la-granja.htm.