Investigación de Operaciones: El problema de la mochila

Por Aldo Romero

Introducción

En la entrada anterior hablamos del problema de la dieta, en donde queríamos cumplir ciertas restricciones alimenticias creando un menú de bajo costo. En esta entrada veremos otro ejemplo conocido de PPL: el problema de la mochila. La idea general es que queremos transportar ciertos bienes mediante un contenedor que tiene cierta capacidad. Este contenedor puede ser algo tan sencillo como una mochila, o algo tan complicado como un tren. A continuación veremos un ejemplo intermedio.

Ejemplo del problema de la mochila

Cesar es un fabricante de botanas que vende 3 de sus productos a varios distribuidores dentro de su localidad. Cada caja de sus productos tiene un peso diferente y generan diferentes ganancias al ser vendidas. Esta información está reflejada en la siguiente tabla:

Peso por caja
en kilogramos
Ganancia en pesos
por caja vendida
Producto 110150
Producto 212200
Producto 315300

Cesar tiene una camioneta que aguanta hasta 800 kilos de carga sin contar al conductor. Cesar quiere saber cuales son los productos que debe llevar con tal de maximizar sus ganancias.

Variables de decisión

Nuestra variable de decisión es bastante intuitiva.

$x_i$ = número de cajas del producto $i$ que Cesar va a llevar en su camioneta. $i \in \{1, 2, 3\}$

Función objetivo

Como el objetivo de Cesar es maximizar las ganancias, la función objetivo va a ser:

$$Max \quad z = 150x_1 + 200x_2 + 300x_3$$

Restricciones

En este problema, la única condición que nos dan es que el peso total de las cajas a llevar no exceda la capacidad de carga de la camioneta. Es decir:

\begin{align*}
10x_1 + 12x_2 + 15x_3 \leq 800\\
x_i \geq 0, i \in \{1, 2, 3\}\\
\end{align*}

Resumen

El PPL que obtenemos es en resumen:

\begin{align*}
Max \quad z= 150x_1&+ 200x_2 + 300x_3\\
s.a.&\\
10x_1&+12x_2+15x_3 \leq 800\\
x_i& \geq 0,i \in \{1, 2, 3\}\\
\end{align*}

Formulación general del problema de la mochila

Un modelo como el anterior recibe el nombre de problema de la mochila pues originalmente fue formulado del siguiente modo: un excursionista desea determinar la cantidad de latas de ciertos comestibles que llevará en su mochila. Las latas tienen cierto peso $p_i$, cierto valor $v_i$ para el excursionista y su mochila tiene capacidad $P$. Si hay $n$ alimentos disponibles y usamos como variables de decisión a $x_1,\ldots,x_n$, donde $x_i$ es el número de latas de alimento $i$ que el excursionista llevarán, entonces el problema de la mochila es:

\begin{align*}
Max \quad z &= \sum_{n}^{i=1} v_ix_i\\
s.a.&\\
\sum_{n}^{i=1} p_ix_i &\leq P\\
x_i &\geq 0, x_i \in \mathbb Z, i=1, \ldots, n.\\
\end{align*}

Este es un problema de programación lineal, pero más específicamente se le conoce como un problema de programación lineal entera (PPLE), o bien un modelo lineal entero, pues las variables $x_i$ están sujetas a tomar sólo valores en los números enteros. Sorpresivamente, aunque los problemas de programación entera parezcan «más fáciles» dado que sus posibilidades están más restringidas, esto no es así. Han sido objeto de mucho estudio pues agregar la condición de integralidad (que las variables sean enteras) crea complicaciones adicionales y hacen que los métodos generales no funcionen tan bien. Los problemas de programación lineal entera son difíciles incluso en términos de una noción computacional muy precisa del tiempo requerido para obtener la mejor solución.

Más adelante…

Aún tenemos algunos problemas conocidos por explorar. El siguiente que veremos es el problema del transporte, en donde queremos saber cómo distribuir productos a través distintas posibilidades de transporte para economizar costos.

En algunas entradas más también hablaremos de cómo llevar cualquier PPL a una forma estándar, que nos permitirá desarrollar la teoría general necesaria para resolverlo.

Tarea

  1. Imagina el siguiente escenario:
    Cesar ahora solo vende los productos 1 y 2. El producto 1 ahora pesa 8 kilogramos y el producto 2 ahora pesa 10 kilogramos, que el primero de ellos da una ganancia de \$120 y que el segundo da una ganancia de \$155. El vehículo que tenemos ahora es un coche que sólo puede cargar 392 kilogramos. ¿Cómo cargarías en este caso el coche para maximizar las ganancias? Plantea el PPLE e intenta resolver el problema con las herramientas con las que cuentes hasta ahora.
  2. Para entender un poco el problema binario de la mochila, considera el siguiente ejemplo. Se tienen 7 posibles artículos con pesos de 7, 10, 12, 4, 5, 9, 11 kilos y con valor de 23, 25, 28, 17, 19, 25, 26 respectivamente. Sólo podemos decidir si llevar o no llevar cada artículo, y el peso total que se cargará no puede exceder 40 kilos. ¿Cuáles artículos hay que llevar para maximizar el valor? Plantea el PPLE e intenta resolverlo con las herramientas con las que cuentes hasta ahora.
  3. Considera el problema ejemplo original de esta entrada de blog. ¿Qué pasaría con la respuesta del problema si ocurrieran los siguientes escenarios? ¿Las ganancias aumentarán o disminuirán?
    • Cesar compró una mejor camioneta, que ahora puede transportar 1.5 toneladas.
    • El producto 3 se volvió más caro y ahora Cesar solo gana 250 pesos por caja vendida.
    • El tipo de envoltura y material de la caja cambio, por lo que ahora los pesos de los productos son 12, 17, 25 kilos para los productos 1, 2 y 3 respectivamente.

Respuestas

1.- Podríamos calcular cual es el producto que nos da más ganancias por kilo con una simple división. El producto 1 nos da 120/8 = 15 pesos por kilo del producto y el producto 2 nos da 155/10 = 15.5 pesos por kilo. El producto 2 es el que más ganancias nos va a dar por lo que vamos a llenar el carro con la mayor cantidad de productos 1 que se pueda.
Lo máximo que podemos meter dentro del carro son 39 unidades del producto 2, teniendo una ganancia de 6045 pesos, pero nos sobrarían 2 kilos para llegar al límite de peso. Entonces vamos a tratar de considerar las opciones donde incluyamos algunas unidades del producto 1 y a ver si podemos mejoran las ganancias.
Si tomamos 38 unidades del producto 2, nos quedan 12 kilos de capacidad y solamente podemos solamente agregar una unidad del producto 1, teniendo en total una ganancia de 6010 pesos. Esta opción no mejora las ganancias.
Si tomamos 37 unidades del producto 2 nos quedan 22 kilos de capacidad y solamente podemos agregar dos unidades del producto 1, teniendo una ganancia de 5975 pesos. Esta opción tampoco mejora las ganancias.
Ahora, si tomamos 36 unidades del producto 2, nos quedan 32 kilos de capacidad y ahora podemos agregar 4 unidades del producto 1, teniendo ahora una ganancia de 6060 pesos. En este caso SI conseguimos una mejora en nuestras ganancias.
Y si somos observadores, nos daremos cuenta que si seguimos agregando unidades del producto 1, ahora las ganancias solo van a ir disminuyendo, por lo que nos quedaremos con esta última solución para nuestro problema.

2.- La variable de decisión sería como el visto en esta entrada, con la siguiente variante: $x_i$ = 1 si el articulo i se va a llevar o 0 si el articulo i no se va a llevar.

La función objetivo simplemente va a ser la que maximice el valor total de los artículos a llevar:

$$Max z = 23x_1 + 25x_2 + 28x_3 + 17x_4 + 19x_5 + 25x_6 + 26x_7$$

Y la única restricción es:

$$7x_1 + 10x_2 + 12x_3 + 4x_4 + 5x_5 + 9x_6 + 11x_7 \leq 40$$

Entonces, el problema planteado sería:

\begin{align*}
Max z = &23x_1 + 25x_2 + 28x_3 + 17x_4 + 19x_5 + 25x_6 + 26x_7\\
&s.a\\
&7x_1 + 10x_2 + 12x_3 + 4x_4 + 5x_5 + 9x_6 + 11x_7 \leq 40\\
&x_i \geq 0, i \in {1, \ldots, 7}\\
\end{align*}

Y el modo de resolverlo es muy similar al anterior, solo hay que considerar los cocientes de los artículos que dan más valor por cada kilo que pesan, tomar los mejores y si sobra capacidad de peso, probar combinaciones de tal manera que el se elimine esa capacidad restante y evaluar si el valor sube en efecto o hasta baja.

3.- $\bullet$ La solución va a ser similar a el problema 1, se va a llenar la camioneta con el producto que ofrezca la mayor ganancia/kilo (el producto 3) y si sobra capacidad de carga se va a intentar introducir algunos los productos de menor peso, hasta encontrar la solución que nos de las mayores ganancias. La diferencia solo va a ser en el número de unidades que van a entrar en la camioneta y por tanto, la solución aunque sea análoga, va a ser diferente.

$\bullet$ Como la ganancia del producto de mayor ganancia/kilo cambió, ahora hay que comparar este nuevo valor con el de los otros productos y nos daremos cuenta que ahora tendremos la misma ganancia/kilo entre este producto y el producto número 2, entonces lo que se intentará es llenar la camioneta entre estos dos productos de tal manera que no quede capacidad de carga sobrante.

$\bullet$ Hay que calcular la nueva ganancia/kilo de cada producto y resulta ahora que al cambiar los pesos de las cajas, el producto 1 es el que mayor ganancia/kilo tiene, entonces vamos a tratar de incluir la mayor cantidad de unidades de este producto que sea posible y si sobra capacidad tratar de combinar con algunas unidades de los otros productos con tal de tener la ganancia más grande.

Entradas relacionadas

Álgebra Superior II: Ideales en los enteros

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada pasada hablamos del concepto de divisibilidad en los números enteros. Enunciamos y demostramos varias de sus propiedades. La noción de divisibilidad da lugar a muchos otros conceptos importantes dentro de la teoría de los números enteros, como el máximo común divisor, el mínimo común múltiplo y los números primos. Así mismo, la noción de divisibilidad está fuertemente ligada con los ideales en los enteros.

En esta entrada hablaremos de este último concepto a detalle. Es una entrada un poco técnica, pero nos ayudará para asentar las bases necesarias para poder hablar de los máximos comunes divisores y los mínimos comunes múltiplos con comodidad un poco más adelante.

Ideales en los enteros y una equivalencia

Los ideales son ciertas estructuras importantes en matemáticas. En el caso particular de los números enteros, tenemos la siguiente definición.

Definición. Un ideal de $\mathbb{Z}$ es un subconjunto $I$ de $\mathbb{Z}$ que cumple las siguientes dos propiedades:

  • No es vacío.
  • Es cerrado bajo restas, es decir, si $a$ y $b$ están en $I$, entonces $a-b$ también.

Veamos un ejemplo sencillo. Diremos que un número entero es par si es múltiplo de $2$ y que es impar si no es múltiplo de dos.

Ejemplo. El conjunto de todos los números pares son un ideal de $\mathbb{Z}$. Este conjunto claramente no es vacío, pues adentro de él está, por ejemplo, el $2$. Además, si tenemos que dos números $a$ y $b$ son pares, entonces por definición podemos encontrar enteros $k$ y $l$ tales que $a=2k$ y $b=2l$, de modo que $$a-b=2k-2l=2(k-l),$$ lo cual nos dice que $a-b$ también es par.

$\triangle$

Como veremos un poco más adelante, el ejemplo anterior se puede generalizar. Antes de ver esto, veremos una caracterización un poco distinta de lo que significa ser un ideal.

Proposición. Un subconjunto $I$ de $\mathbb{Z}$ es un ideal si y sólo si cumple las siguientes tres propiedades:

  • No es vacío.
  • Es cerrado bajo sumas, es decir, si $a$ y $b$ están en $I$, entonces $a+b$ también.
  • Es absorbente, es decir, si $a$ está en $I$ y $b$ está en $\mathbb{Z}$, entonces $ab$ también está en $I$.

Demostración. Primero veremos que si $I$ es un ideal, entonces cumple las tres propiedades anteriores. Luego veremos que si $I$ cumple las tres propiedades anteriores, entonces es un idea.

Supongamos que $I$ es un ideal. Por definición, no es vacío, que es lo primero que queríamos ver. Veamos ahora que es cerrado bajo sumas. Supongamos que $a$ y $b$ están en $I$. Como $I$ es cerrado bajo restas y $b-b=0$, obtenemos que $b$ está en $I$. Usando nuevamente que $b$ es cerrado bajo restas para $0$ y $b$, obtenemos que $0-b=-b$ también está en $I$. Usando una última vez la cerradura de la resta, obtenemos ahora que $a+b=a-(-b)$ está en $I$, como queríamos.

La tercera propiedad la demostraremos primero para los $b\geq 0$ por inducción. Si $b=0$, debemos ver que $0\cdot a=0$ está en $I$. Esto es cierto pues en el párrafo anterior ya vimos por qué $0$ está en $I$. Supongamos ahora que para cierta $b$ fija se tiene que $ab$ está en $I$. Por la cerradura de la suma obtenemos que $$ab+a=ab+a\cdot 1=a(b+1)$$ también está en $I$, como queríamos. Aquí usamos que $1$ es identidad multiplicativa, la distributividad, la hipótesis inductiva y la cerradura de la suma.

Nos falta ver qué pasa con los $b<0$. Sin embargo, si $b<0$, tenemos que $a(-b)$ sí está en $I$ (pues $-b>0$). Así, por la cerradura de la resta tenemos que $0-a(-b)=ab$ está en $I$.

Apenas llevamos la mitad de la demostración, pues vimos que la definición de ideal implica las tres propiedades que se mencionan. Pero el regreso es más sencillo. Supongamos que un conjunto $I$ cumple las tres propiedades mencionadas. Como cumple la primera, entonces no es vacío. Ahora vemos que es cerrado bajo restas. Tomemos $a$ y $b$ en $I$. Como cumple la segunda propiedad, tenemos que $(-1)b=-b$ está en $I$. Como cumple la cerradura de la suma, tenemos que $a+(-b)=a-b$ está en $I$. Así, $I$ es cerrado bajo restas.

$\square$

La ventaja del resultado anterior es que nos permitirá pensar a los ideales de una o de otra forma, de acuerdo a lo que sea más conveniente para nuestros fines más adelante.

Clasificación de ideales

Veamos la generalización de nuestro ejemplo de números pares e impares.

Definición. Sea $n$ un entero. Al conjunto de todos los múltiplos de $n$ lo denotaremos por $n\mathbb{Z}$ y lo llamaremos el conjunto de los múltiplos de $n$, es decir:

$n\mathbb{Z}=\{nm: m\in \mathbb{Z}\}.$

Proposición. Si $n$ es cualquier entero, entonces $n\mathbb{Z}$ es un ideal de $\mathbb{Z}$.

Demostración. Claramente $n\mathbb{Z}$ no es vacío pues, por ejemplo, $0=0\cdot n$ está en $n\mathbb{Z}$. La demostración de la cerradura de la resta se sigue de un corolario de la entrada anterior. Si $a,b$ están en $n\mathbb{Z}$, entonces ambos son divisibles entre $n$, así que su resta $a-b$ también. Así, $a-b$ está en $n\mathbb{Z}$.

$\square$

El ejemplo anterior de hecho da todos los posibles ideales que existen en $\mathbb{Z}$. El siguiente teorema enuncia esto con precisión.

Teorema. Un conjunto $I$ de $\mathbb{Z}$ es un ideal si y sólo si existe un entero no negativo $n$ tal que $I=n\mathbb{Z}$.

Demostración. Tomemos $I$ un ideal de $\mathbb{Z}$. Existe la posibilidad de que $I=\{0\}$, pues en efecto este es un ideal: es no vacío (pues tiene a $0$) y es cerrado bajo restas (pues sólo hay que verificar que $0-0=0$ está en I). Si este es el caso, entonces $I=0\mathbb{Z}$, como queríamos. Así, a partir de ahora supondremos que $I$ no es este conjunto. Veremos que $I$ tiene por lo menos un elemento positivo.

Sea $a\in I$ cualquier elemento que no sea $0$. Si $a$ es positivo, entonces ya lo logramos. Si $a$ es negativo, entonces notamos que $0=a-a$ está en $I$, y que entonces $-a=0-a$ está en $I$. Pero entonces $-a$ es un número positivo en $I$.

Debido a esto, por el principio del buen orden podemos tomar al menor entero positivo $n$ que está en $I$. Afirmamos que $I=n\mathbb{Z}$. Por la caracterización de ideales que dimos en la sección anterior, todos los múltiplos de $n$ están en $I$, así que $I\supseteq n\mathbb{Z}$.

Veamos que $I\subseteq n\mathbb{Z}$ procediendo por contradicción. Supongamos que este no es el caso, y que entonces existe un $m\in I$ que no sea múltiplo de $n$. Por el algoritmo de la división, podemos escribir $m=qn+r$ con $0<r<n$. Como $m$ está en $I$ y $qn$ está en $I$, tendríamos entonces que $m-qn=r$ está en $I$. ¡Pero esto es una contradicción! Tendríamos que $r$ está en $I$ y que $0<r<n$, lo cual contradice que $n$ era el menor entero positivo en $I$ que tomamos con el principio del buen orden. Esta contradicción sólo puede evitarse si $m$ es múltiplo de $n$, como queríamos.

$\square$

Un teorema como el anterior se conoce como un teorema de clasificación pues nos está diciendo cómo son todas las posibles estructuras que definimos a partir de un criterio fácil de enunciar.

Ideal generado por dos elementos

Dado un conjunto de números enteros $S$, podríamos preguntarnos por el ideal más chiquito que contenga a $S$. Un ejemplo sencillo es tomar $S$ con sólo un elemento, digamos $S=\{n\}$. En este caso, es fácil convencerse de que el ideal más pequeño que contiene a $S$ es precisamente $n\mathbb{Z}$ (ve los problemas de la tarea moral).

Un caso un poco más interesante es, ¿qué sucede si tenemos dos elementos?

Ejemplo. ¿Cuál será el menor ideal posible $I$ que tiene a los números $13$ y $9$? Empecemos a jugar un poco con la propiedad de la cerradura de la resta. Como $13$ y $9$ están, entonces también está $4=13-9$. Como $9$ y $4$ están, entonces también está $5=9-4$. Así mismo, debe estar $1=5-4$. Pero aquí ya llegamos a algo especial: que el $1$ está. Recordemos los ideales también cumplen que una vez que está un número, están todos sus múltiplos. Así, $1\mathbb{Z}$ está contenido en $I$. Pero entonces $I=1\mathbb{Z}=\mathbb{Z}$.

$\square$

No siempre obtenemos $\mathbb{Z}$ como respuesta. Para un ejemplo en donde se obtiene $2\mathbb{Z}$, ve los problemas de la tarea moral. En la siguiente entrada hablaremos con más detalle de la respuesta, pero por el momento probaremos lo siguiente.

Proposición. Si $a$ y $b$ son enteros, entonces:

  • El conjunto $M=\{ra+sb: r,s\in \mathbb{Z}\}$ es un ideal de $\mathbb{Z}$ que tiene a $a$ y a $b$.
  • Si $I$ es un ideal de $\mathbb{Z}$ que tiene a $a$ y a $b$, entonces $M\subseteq I$.

En otras palabras, «$M$ es el ideal más pequeño (en contención) que tiene a $a$ y a $b$».

Demostración. Veamos primero que $M$ en efecto es un ideal. Para ello, notemos que no es vacío pues, por ejemplo, $0=0\cdot a+0\cdot b$ está en $M$. Además, es cerrado bajo restas pues si tenemos dos elementos en $M$, son de la forma $ra+sb$ y $ka+lb$, y su resta es $$(ra+sb)-(ka+lb)=(r-k)a+(s-l)b,$$ que vuelve a estar en $M$ pues $r-k$ y $s-l$ son enteros. Además, $a=1\cdot a+ 0\cdot b$, lo que muestra que $a$ está en $M$ y $b=0\cdot a + 1 \cdot b$, lo que muestra que $b$ está en $M$ también. Con esto demostramos el primer punto.

Para el segundo punto, supongamos que $a$ está en $I$ y que $b$ está en $I$ también. Como $I$ es idea, tiene a todos los múltiplos de $a$ y los de $b$, es decir, a todos los números de la forma $ra$ y $sb$. Como es ideal, también es cerrado bajo sumas, así que tiene todas las formas de números de este estilo. En particular, tiene a todos los números de la forma $ra+sb$ (variando $r$ y $s$), es decir, a todos los elementos de $I$, como queríamos.

$\square$

Quizás notaste algo raro. El conjunto $M$ es un ideal, pero se ve un poco distinto de los que obtuvimos con nuestra caracterización de la sección anterior. Parece más bien que «está hecho por dos enteros» en vez de estar hecho sólo por uno. Esto no es problema. Nuestra caracterización nos dice que debe existir un entero $d$ tal que $M=d\mathbb{Z}$. Esto nos llevará en la siguiente entrada a estudiar el máximo común divisor.

Intersección de ideales

Los ideales de $\mathbb{Z}$ son subconjuntos, así que podemos aplicarles operaciones de conjuntos. ¿Qué sucede si intersectamos dos ideales? La siguiente operación nos dice que

Proposición. Si $I$ y $J$ son ideales de $\mathbb{Z}$, entonces $I\cap J$ también.

Demostración. La demostración es sencilla. Como $I$ y $J$ son ideales, se puede ver que ambos tienen al $0$, y que por lo tanto su intersección también. Ahora veamos que $I\cap J$ es cerrada bajo restas. Si $a$ y $b$ están en $I\cap J$, entonces $a$ y $b$ están en $I$. Como $I$ es cerrado bajo restas, $a-b$ está en $I$. Análogamente, está en $J$. Así, $a-b$ está en $I\cap J$, como queríamos.

$\square$

Este resultado motivará nuestro estudio del mínimo común múltiplo un poco más adelante.

Más adelante…

Esta fue una entrada un poco técnica, pero ahora ya conocemos a los ideales en los enteros, algunas de sus propiedades y hasta los caracterizamos. La idea de tomar el ideal generado por dos elementos nos llevará a estudiar en la siguiente entrada el concepto de máximo común divisor. Y luego, la idea de intersectar ideales nos llevará en un par de entradas a explorar la noción de mínimo común múltiplo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Imagina que sabes que un ideal tiene al número $6$. Esto forza a que también tenga a $6-6=0$. Así, esto forza a que también tenga el $0-6=-6$. Sigue así sucesivamente, jugando con todas las nuevas restas que deben quedarse dentro del ideal. ¿Cuál es el menor ideal que puede tener al $6$?
  2. Repite lo anterior, pero ahora suponiendo que tu ideal tiene a los números $10$ y $12$. ¿Qué números puedes obtener si repetidamente puedes hacer restas? ¿Quién sería el menor ideal que tiene a ambos números?
  3. Sean $I_1,\ldots,I_k$ ideales de $\mathbb{N}$. Demuestra que $I_1\cap I_2 \cap \ldots \cap I_k$ también es un idea. Como sugerencia, usa inducción.
  4. Toma a los ideales $6\mathbb{Z}$ y $8\mathbb{Z}$. Por el resultado de la entrada, tenemos que su intersección $A$ también es un ideal. Intenta averiguar y demostrar quién es el $k$ tal que $A=k\mathbb{Z}$.
  5. ¿Es cierto que la unión de dos ideales siempre es un ideal? Si es falso, encuentra contraejemplos. Si es verdadero, da una demostración. Si es muy fácil, ¿puedes decir exactamente para qué enteros $m$ y $n$ sucede que $m\mathbb{Z}\cup n\mathbb{Z}$ es un ideal?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Variable Compleja I: Ecuaciones de Cauchy-Riemann. Condiciones suficientes para la diferenciabilidad compleja.

Por Pedro Rivera Herrera

Introducción

En las entradas anteriores hemos definido y trabajado con los conceptos de diferenciabilidad y analicidad de una función compleja, en particular hemos visto que dichos conceptos no son equivalentes, desde que la analicidad de una función compleja en un punto $z_0$ implica la diferenciabilidad de la función en todo un $\varepsilon$-vecindario de $z_0$.

Como hemos visto a lo largo de la unidad 2, toda función compleja está totalmente definida a través de un par de funciones reales de dos variables, a las cuales hemos llamado su parte real e imaginaria. Más aún, hemos caracterizado algunos conceptos matemáticos importantes como el de límite y continuidad a través de dichas funciones, por lo que resulta natural cuestionarnos acerca de si es posible caracterizar la diferenciabilidad de una función compleja mediante estás funciones reales.

La entrada anterior deducimos las ecuaciones de Cauchy-Riemann y vimos que para una función compleja $f(z)=u(x,y) + iv(x,y)$ analítica en un conjunto abierto $U\subset\mathbb{C}$ las funciones $u$ y $v$, correspondientes con su parte real e imaginaria, deben satisfacer dichas ecuaciones. Sin embargo, vimos que dichas ecuaciones son solamente una condición necesaria, pero no suficiente, que las funciones $u$ y $v$ deben satisfacer. En esta entrada veremos que además de las ecuaciones de C-R, es necesario imponer unas condiciones extras sobre las funciones $u$ y $v$ para garantizar que una función compleja es analítica.

Recordemos la definición de diferenciabilidad de una función real de dos variables, vista en nuestros cursos de Cálculo.

Definición 18.1. (Diferenciabilidad de funciones reales de dos variables.)
Sea $U\subset\mathbb{R}^2$ un conjunto abierto. Una función real de dos variables $u:U \to \mathbb{R}$, es diferenciable en $(x_0,y_0) \in U$ si existen $A,B\in\mathbb{R}$ constantes tales que: \begin{equation*} \lim_{(x,y) \to (x_0, y_0)} \frac{u(x,y) – u(x_0, y_0) – A(x-x_0) – B(y-y_0)}{\sqrt{(x-x_0)^2 + (y-y_0)^2}} = 0, \end{equation*} en tal caso $A = \dfrac{\partial u}{\partial x}(x_0, y_0)$ y $B = \dfrac{\partial u}{\partial y}(x_0, y_0)$.

Observación 18.1.
De acuerdo con la definición 18.1, tenemos que una función real de dos variables $u$, definida sobre un abierto $U\subset \mathbb{R}^2$, es diferenciable en $(x_0,y_0)\in U$ si puede escribirse de la forma: \begin{equation*} u(x,y) = u(x_0,y_0) + A(x-x_0) + B(y-y_0) + \varepsilon(x,y)\sqrt{(x-x_0)^2 + (y-y_0)^2}, \end{equation*} donde $A = \dfrac{\partial u}{\partial x}(x_0, y_0)$ y $B = \dfrac{\partial u}{\partial y}(x_0, y_0)$ son constantes reales y $\lim\limits_{(x,y) \to (x_0,y_0)}\varepsilon(x,y) = 0$.

Consideremos el siguiente resultado.

Proposición 18.1.
Sean $U\subset\mathbb{C}$ un conjunto abierto y $f:U\to\mathbb{C}$ una función. Entonces, $f$ es analítica en $z_0\in U$ si y solo si $f$ se puede escribir de la forma: \begin{equation*} f(z) = f(z_0) + c(z-z_0) + \varepsilon(z)(z-z_0), \tag{18.2} \end{equation*} donde $c\in\mathbb{C}$ es una constante, $\varepsilon: U \to \mathbb{C}$ es continua en $z_0$ y $\lim\limits_{z \to z_0} \varepsilon(z) = 0$. En tal caso se tiene que $f'(z_0) = c$.

Demostración. Dadas las hipótesis, tenemos lo siguiente.

$\Rightarrow)$
Supongamos que $f'(z_0)$ existe, entonces definimos la función: \begin{equation*} \varepsilon(z)= \left\{ \begin{array}{lcc} \dfrac{f(z)- f(z_0)}{z – z_0} – f'(z_0) & \text{si} & z\neq z_0, \\ 0 & \text{si} & z = z_0. \end{array} \right. \end{equation*} Es claro que dicha función satisface que $\lim_{z \to z_0} \varepsilon(z) = 0$ y además es una función continua en $z_0$.

$(\Leftarrow$
Supongamos que $f(z)$ se puede escribir como (18.2) con $c\in\mathbb{C}$ constante, entonces para $z\neq z_0$, tenemos que: \begin{equation*} \frac{f(z) – f(z_0)}{z – z_0} = c + \varepsilon(z), \end{equation*} por lo que, tomando límites en la igualdad anterior: \begin{equation*} \lim_{z\to z_0} \frac{f(z) – f(z_0)}{z – z_0} = \lim_{z\to z_0} \left(c + \varepsilon(z)\right) = c, \end{equation*} de donde $f'(z_0) = c$.

$\blacksquare$

La proposición anterior establece que la diferenciabilidad de una función compleja $f(z)$ en $z_0$ es equivalente a que dicha función se puede aproximar en $z_0$ por la función lineal $f(z_0) + c(z-z_0)$, con $c\in\mathbb{C}$ constante, en el sentido que cuando $z$ está cerca de $z_0$ la diferencia entre $f(z)$ y $f(z_0) + c(z-z_0)$ es pequeña comparada con $|\,z-z_0\,|$.

Procedemos ahora a responder nuestra pregunta sobre cuáles son las condiciones suficientes que se deben imponer sobre las funciones $u$ y $v$, correspondientes con la parte real e imaginaria de una función compleja, además de las ecuaciones de C-R, para garantizar la analicidad de una función compleja.

Teorema 18.1.
Una función compleja $f(z) = u(x,y) + iv(x,y)$ es analítica en un conjunto abierto $U\subset\mathbb{C}$ si las cuatro derivadas parciales $u_x, v_x, u_y$ y $v_y$ existen y son continuas en todo punto de $U$ (es decir $u$ y $v$ son funciones de clase $C^1$) y satisfacen las ecuaciones de C-R en todo punto de $U$. En tal caso, para todo $z_0=x_0+iy_0\in U$ se tiene que: \begin{equation*} f'(z_0) = \frac{\partial u}{\partial x}(x_0,y_0) + i \frac{\partial v}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0) – i \frac{\partial u}{\partial y}(x_0,y_0). \tag{18.3} \end{equation*}

Demostración. Dadas las hipótesis, tomemos a $z_0 = x_0 + iy_0 \in U$ fijo, entonces existe $r>0$ tal que $B(z_0, r) \subset U$. Sea $z \in B(z_0, r)$ y supongamos que $z \neq z_0$, entonces tenemos que el segmento de recta que une a $z_0$ con $z$, es decir $[z_0, z]$, está totalmente contenido en $B(z_0, r)$ (¿por qué?). Sin perdida de generalidad supongamos que $x>x_0$ y $y>y_0$ (los casos restantes son completamente análogos), figura 74, por lo que: \begin{equation*} u(x,y) – u(x_0, y_0) = u(x,y) – u(x_0, y) + u(x_0, y) – u(x_0, y_0). \end{equation*}

Figura 74: Segmento de recta $[z_0, z]$ contenido en el disco abierto con centro en $z_0$ y radio $r>0$. Caso $x>x_0$ y $y>y_0$.

Definimos $h = x – x_0 > 0$ y $k = y – y_0 > 0$. Sean $g_1 : [0,h] \to \mathbb{R}$ y $g_2 : [0,k] \to \mathbb{R}$ dadas por: \begin{equation*} g_1(t) = u(x_0 + t,y) \quad \text{y} \quad g_2(t) = u(x_0,y_0 + t). \end{equation*}

Tenemos que: \begin{align*} g_1′(t) & = \lim_{h\to 0} \frac{g_1(t+h)-g_1(t)}{h}\\ & = \lim_{h\to 0} \frac{u(x_0 + t + h,y)-u(x_0 + t,y)}{h}\\ & = \frac{\partial u}{\partial x}(x_0 + t,y), \end{align*} \begin{align*} g_2′(t) & = \lim_{k\to 0} \frac{g_2(t+k)-g_2(t)}{k}\\ & = \lim_{k\to 0} \frac{u(x_0,y_0 + t + k)-u(x_0,y_0 + t)}{k}\\ & = \frac{\partial u}{\partial y}(x_0,y_0+t). \end{align*}

Como $u_x$ y $u_y$ existen en $U$, entonces para $y$ fijo tenemos que $g_1$ es una función diferenciable en $[0,h]$ y para $x_0$ fijo tenemos que $g_2$ también es una función diferenciable en $[0,k]$, por lo que $g_1$ y $g_2$ son funciones continuas en $[0,h]$ y $[0,k]$ respectivamente.

Por el teorema del valor medio para funciones reales, tenemos que existen $c_1\in(0,h)$ y $c_2\in(0,k)$ tales que: \begin{align*} g_1(h) – g_1(0) = g_1′(c_1) (h – 0),\\ g_2(h) – g_2(0) = g_2′(c_2) (k – 0), \end{align*} o equivalentemente que existen $\alpha_1, \beta_1 \in (0,1)$, tales que: \begin{align*} g_1(h) – g_1(0) = h \, g_1′(h\alpha_1),\\ g_2(h) – g_2(0) = k \, g_2′(k\beta_1), \end{align*} es decir: \begin{align*} u(x, y) – u(x_0, y) & = u(x_0 + h, y_0 + k) – u(x_0, y_0 + k)\\ & = h \, u_x(x_0 +\alpha_1 h, y_0 + k), \end{align*} \begin{align*} u(x_0, y) – u(x_0, y_0) & = u(x_0, y_0 + k) – u(x_0, y_0)\\ & = k \, u_y(x_0, y_0 + \beta_1 k). \end{align*} Por lo que: \begin{equation*} u(x,y) – u(x_0, y_0) = h \, u_x(x_0 +\alpha_1 h, y_0 + k) + k \, u_y(x_0, y_0 + \beta_1 k). \end{equation*}

De manera análoga concluimos que existen $\alpha_2, \beta_2 \in (0,1)$ tales que: \begin{align*} v(x_0 + h, y_0 + k) – v(x_0, y_0 + k) = h \, v_x(x_0 +\alpha_2 h, y_0 + k),\\ v(x_0, y_0 + k) – v(x_0, y_0) = k \, v_y(x_0, y_0 + \beta_2 k), \end{align*} donde $h = x – x_0 > 0$ y $k = y – y_0 > 0$.

Por lo que: \begin{equation*} v(x,y) – v(x_0, y_0) = h \, v_x(x_0 +\alpha_2 h, y_0 + k) + k \, v_y(x_0, y_0 + \beta_2 k). \end{equation*} Entonces, para $z\neq z_0$ tenemos que: \begin{align*} \frac{f(z) – f(z_0)}{z-z_0} & = \frac{u(x,y) + iv(x,y) – \left[ u(x_0,y_0) + iv(x_0,y_0)\right]}{(x – x_0) + i (y-y_0)}\\ & = \frac{u(x,y) – u(x_0,y_0)}{h + i k} + i \left[ \frac{v(x,y) – v(x_0,y_0)}{h + i k}\right]\\ & = \frac{h \, u_x(x_0 +\alpha_1 h, y_0 + k) + k \, u_y(x_0, y_0 + \beta_1 k)}{h + i k}\\ & \quad + i \left[ \frac{h \, v_x(x_0 +\alpha_2 h, y_0 + k) + k \, v_y(x_0, y_0 + \beta_2 k)}{h + i k}\right]\\ & = \frac{h}{h+ik}\left[u_x(x_0 +\alpha_1 h, y_0 + k) + i v_x(x_0 +\alpha_2 h, y_0 + k)\right]\\ & \quad + \frac{k}{h+ik} \left[u_y(x_0, y_0 + \beta_1 k) + i v_y(x_0, y_0 + \beta_2 k)\right], \end{align*} donde $h = x – x_0 > 0$, $k = y – y_0 > 0$ y $\alpha_i, \beta_i \in (0,1)$ para $i=1,2$. Además la igualdad anterior se cumple aún si $x = x_0$ o $y = y_0$.

Dado que $u_x, u_y, v_x$ y $v_y$ son continuas en $U$, entonces tenemos que: \begin{align*} \lim_{(h,k) \to (0,0)} u_x(x_0 +\alpha_1 h, y_0 + k) = u_x(x_0, y_0),\\ \lim_{(h,k) \to (0,0)} v_x(x_0 +\alpha_2 h, y_0 + k) = v_x(x_0, y_0),\\ \lim_{(h,k) \to (0,0)} u_y(x_0, y_0 + \beta_1 k) = u_y(x_0, y_0),\\ \lim_{(h,k) \to (0,0)} v_y(x_0, y_0 + \beta_2 k) = v_y(x_0, y_0). \end{align*} Por lo que: \begin{align*} \frac{f(z) – f(z_0)}{z-z_0} & = \frac{h}{h+ik}\left[u_x(x_0, y_0) + i v_x(x_0, y_0) + \varepsilon_1 \right]\\ & \quad + \frac{k}{h+ik} \left[u_y(x_0, y_0) + i v_y(x_0, y_0) + \varepsilon_2 \right], \end{align*} donde $\varepsilon_1, \varepsilon_2 \to 0$ si $(h,k) \to (0,0)$ o equivalentemente si $z \to z_0$.

Como se cumplen las ecuaciones de C-R, tenemos que: \begin{align*} u_x(x_0, y_0) = A = v_y(x_0, y_0),\\ u_y(x_0, y_0) = B = – v_x(x_0, y_0), \end{align*} para algunos $A$ y $B$ números reales.

Entonces: \begin{align*} \frac{f(z) – f(z_0)}{z-z_0} & = \frac{h}{h+ik}\left(A – i B\right) + \frac{k}{h+ik} \left(B + i A\right) + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}\\ & = \frac{A\left(h + i k\right)}{h+ik} -i \frac{B\left(h + ik\right)}{h+ik} + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}\\ & = A -iB + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}\\ & = u_x(x_0, y_0) +iv_x(x_0,y_0) + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}, \end{align*} donde $\varepsilon_1, \varepsilon_2 \to 0$ si $z \to z_0$.

Dado que para todo $z\in\mathbb{C}$ se cumple que $|\,\operatorname{Re}(z)\,| \leq |\,z\,|$ e $|\,\operatorname{Im}(z)\,| \leq |\,z\,|$, entonces: \begin{align*} 0<|\,h\,| \leq |\,h+ik\,| \quad \Longrightarrow \frac{|\,h\,|}{|\,h+ik\,|} \leq 1,\\ 0<|\,k\,| \leq |\,h+ik\,| \quad \Longrightarrow \frac{|\,k\,|}{|\,h+ik\,|} \leq 1. \end{align*} Por lo que: \begin{align*} \left| \, \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik} \, \right| & \leq \left|\, \frac{h \varepsilon_1}{h+ik} \,\right| + \left|\, \frac{k \varepsilon_2}{h+ik} \,\right|\\ & = \frac{\left|\, h \,\right|}{\left|\, h+ik\,\right|} \left|\,\varepsilon_1 \,\right| + \frac{\left|\, k \,\right|}{\left|\,h+ik\,\right|} \left|\,\varepsilon_2 \,\right|\\ & \leq \left|\,\varepsilon_1 \,\right| + \left|\,\varepsilon_2 \,\right|, \end{align*} tomando límites en la desigualdad anterior concluimos que: \begin{equation*} \lim_{(h,k) \to (0,0)} \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik} = \lim_{z \to z_0} \frac{(x-x_0) \varepsilon_1 + (y-y_0) \varepsilon_2}{(x-x_0)+i(y-y_0)} = 0. \end{equation*} Por tanto, tenemos que: \begin{align*} \lim_{z \to z_0} \frac{f(z) – f(z_0)}{z-z_0} & =\lim_{z \to z_0} \left( u_x(x_0, y_0) +iv_x(x_0,y_0) + \frac{(x-x_0) \varepsilon_1 + (y-y_0) \varepsilon_2}{(x-x_0)+i(y-y_0)} \right)\\ & =\lim_{z \to z_0} u_x(x_0, y_0) + \lim_{z \to z_0} iv_x(x_0,y_0) + \lim_{z \to z_0} \frac{(x-x_0) \varepsilon_1 + (y-y_0) \varepsilon_2}{(x-x_0)+i(y-y_0)}\\ & = u_x(x_0, y_0) +iv_x(x_0,y_0). \end{align*}

Entonces $f$ es analítica en $z_0 =x_0+iy_0 \in U$ y su derivada está dada por (18.3).

Dado que $z_0 = x_0 + iy_0\in U$ era arbitrario, entonces el resultado se cumple para todo punto en $U$.

$\blacksquare$

El resultado anterior es un primer recíproco parcial del teorema 17.1 de la entrada anterior, en el cual vimos que las ecuaciones de C-R son solo una condición necesaria, pero no suficiente, para la analicidad de una función compleja.

Observación 18.2.
Es importante recordar que los conceptos de diferenciabilidad y analicidad de una función no son intercambiables, por lo que puede suceder que una función sea diferenciable en un punto, pero no analítica en dicho punto. Considerando el resultado anterior podemos determinar a través de las ecuaciones de C-R dónde una función sí puede ser al menos diferenciable.

Ejemplo 18.1.
Sea $z=x+iy \in \mathbb{C}$. Consideremos a la función $f(z)=x^2+y^2+2ixy$. Veamos que $f$ no es analítica en ningún punto, pero es diferenciable en todo el eje real. Más aún, veamos que en dicho conjunto de puntos se tiene que $f'(z) = 2x$.

Solución. Considerando a la función $f$ tenemos que: \begin{equation*} u(x,y) = x^2 + y^2 \quad \quad \text{y} \quad \quad v(x,y) = 2xy. \end{equation*} Claramente ambas funciones están definidas sobre todo $\mathbb{C}$, por lo que $f$ está definida en $\mathbb{C}$.

Tenemos que: \begin{align*} \frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = 2y,\\ \frac{\partial v}{\partial x} = 2y, \quad \frac{\partial v}{\partial y} = 2x. \end{align*} Es claro que las derivadas parciales existen y son continuas para todo $z = x+iy \in \mathbb{C}$.

Notemos que $u_x = v_y$, pero $u_y \neq -v_x$. Sin embargo: \begin{align*} \frac{\partial u}{\partial y} = – \frac{\partial v}{\partial x} \quad & \Longleftrightarrow \quad y = 0\\ & \Longleftrightarrow \quad z = \operatorname{Re}(z) = x. \end{align*}

Por lo que, por el teorema 18.1, concluimos que $f$ únicamente es diferenciable para todo $z$ en el eje real y su derivada en dicho conjunto de puntos es: \begin{equation*} f'(z) = f'(x) = \frac{\partial u}{\partial x}(x,0) + i \frac{\partial v}{\partial x}(x,0) = 2x. \end{equation*}

Dado que para todo $z_0=x_0+i0$ en el eje real y para todo $\delta>0$, existe $z_\delta=x_0 + i\frac{\delta}{2} \in B(z_0, \delta)$ un punto en donde $f$ no es diferenciable, entonces no existe un disco abierto alrededor de $z_0$ en el cual $f$ sea diferenciable y por tanto no es analítica en ningún punto sobre el eje real y en general en ningún punto en $\mathbb{C}$.

Ejemplo 18.2.
Sea $f:\mathbb{C} \to \mathbb{C}$ dada por $f(z)=x^2 – y^3 + i(x-y)$. Mostremos que $f$ no es analítica en $\mathbb{C}$ y determinemos el conjunto de puntos donde es diferenciable y hallemos su derivada en dicho conjunto.

Solución. De acuerdo con la definición de $f$ tenemos que: \begin{equation*} u(x,y) = x^2 – y^3 \quad \quad \text{y} \quad \quad v(x,y) = x-y. \end{equation*}

Tanto $u$ como $v$ son funciones reales diferenciables en todo punto en $\mathbb{R}^2$ y: \begin{align*} \frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = -3y^2,\\ \frac{\partial v}{\partial x} = 1, \quad \frac{\partial v}{\partial y} = -1, \end{align*} las cuales existen y son continuas para todo punto en $\mathbb{R}^2$.

Es claro que $u_x \neq v_y$ y $u_y \neq -v_x$. Procedemos a determinar en qué puntos de $\mathbb{C}$ se satisfacen las igualdades: \begin{align*} \frac{\partial u}{\partial x} = \frac{\partial v}{\partial y} \quad & \Longleftrightarrow \quad 2x = -1\\ & \Longleftrightarrow \quad x = -\frac{1}{2}. \end{align*} \begin{align*} \frac{\partial u}{\partial y} = – \frac{\partial v}{\partial x} \quad & \Longleftrightarrow \quad -3y^2 = -1\\ & \Longleftrightarrow \quad y = \pm \frac{1}{\sqrt{3}}. \end{align*}

Sea $S = \left\{-\frac{1}{2}+i\frac{\sqrt{3}}{3}, -\frac{1}{2}-i\frac{\sqrt{3}}{3} \right\}$.

Entonces, por el teorema 18.1, concluimos que $f$ únicamente es diferenciable para $z_0 \in S$ y su derivada en dicho conjunto de puntos es: \begin{align*} f’\left(z_0\right) & = \frac{\partial u}{\partial x}\left(-\frac{1}{2},\pm \frac{\sqrt{3}}{3}\right) + i \frac{\partial v}{\partial x}\left(-\frac{1}{2},\pm \frac{\sqrt{3}}{3}\right)\\ & = -1 + i. \end{align*}

Notemos que para todo $z_0\in S$ y para todo $\delta>0$, existe $z_\delta=z_0 + \frac{\delta}{2} \in B(z_0, \delta)$ un punto en donde $f$ no es diferenciable, entonces no existe un disco abierto alrededor de $z_0$ en el cual $f$ sea diferenciable y por tanto no es analítica en ningún punto en $S$ y en general en ningún punto en $\mathbb{C}$.

Definición 18.2. (Dominio de analicidad.)
Un conjunto $U \subset \mathbb{C}$ es llamado un dominio de analicidad de una función compleja $f$ si $U$ es el mayor conjunto abierto en el cual $f$ es analítica.

Ejemplo 18.3
Para las funciones $f(z) = 1/z$ y $g(z) = \overline{z}$ tenemos que sus dominios de analicidad son los conjuntos $U = \mathbb{C} \setminus \{0\}$ y $G = \emptyset$ respectivamente.

Considerando la proposición 18.1 y la observación 18.1, planteamos el siguiente resultado en el cual establecemos cuales son las condiciones necesarias y suficientes que deben satisfacer las funciones reales $u$ y $v$, correspondientes con la parte real e imaginaria de una función compleja, para garantizar la analicidad de dicha función en un conjunto abierto $U\subset\mathbb{C}$.

Teorema 18.2.
Una función compleja $f(z) = u(x,y) + iv(x,y)$ es una función analítica en un conjunto abierto $U\subset\mathbb{C}$ si y solo si las funciones reales de dos variables $u$ y $v$ son diferenciables en $U$ y satisfacen las ecuaciones de C-R en todo punto de $U$. En tal caso, para todo $z_0=x_0+iy_0\in U$ se tiene que: \begin{equation*} f'(z_0) = \frac{\partial u}{\partial x}(x_0,y_0) + i \frac{\partial v}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0) – i \frac{\partial u}{\partial y}(x_0,y_0). \tag{18.3.} \end{equation*}

Demostración. Sea $f(z) = u(x,y) + iv(x,y)$ una función compleja definida sobre un conjunto abierto $U\subset \mathbb{C}$ y sea $z = x+iy\in U$.

$\Rightarrow)$
Supongamos que $f$ es analítica en $U$ y sea $z_0 = x_0 +i y_0 \in U$ fijo. De acuerdo con la proposición 18.1, como la función $f$ es analítica en $z_0 \in U$, entonces puede escribirse como en (18.2), es decir de la forma: \begin{equation*} f(z) – f(z_0) = c(z-z_0) + \varepsilon(z)(z-z_0), \end{equation*} donde $c = f'(z_0) \in \mathbb{C}$ es constante y $\lim\limits_{z \to z_0} \varepsilon(z) = 0$.

Sea $c = f'(z_0) = A+iB\in\mathbb{C}$ para algunos $A$ y $B$ números reales. Entonces podemos reescribir esta última igualdad como: \begin{equation*} u(x,y) + iv(x,y) – \left[u(x_0,y_0) + iv(x_0,y_0)\right] = (A+iB)\left[(x-x_0) + i(y-y_0)\right] + \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right]. \end{equation*} Separando en la parte real e imaginaria de la igualdad anterior obtenemos: \begin{align*} u(x,y) – u(x_0,y_0) = A(x-x_0) – B(y-y_0) + \operatorname{Re}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right),\\ v(x,y) – v(x_0,y_0) = B(x-x_0) + A(y-y_0) + \operatorname{Im}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right). \end{align*} Tenemos que: \begin{align*} \operatorname{Re}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right) & = \bigg(\operatorname{Re}\bigg[ \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \bigg]\bigg) \frac{\sqrt{(x-x_0)^2 + (y-y_0)^2}}{\sqrt{(x-x_0)^2 + (y-y_0)^2}}\\ & = \bigg(\operatorname{Re}\bigg[\frac{\varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right]}{\sqrt{(x-x_0)^2 + (y-y_0)^2}} \bigg]\bigg) \sqrt{(x-x_0)^2 + (y-y_0)^2}\\ & =:\varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}, \end{align*} y de manera análoga obtenemos que: \begin{equation*} \operatorname{Im}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right) =: \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}. \end{equation*} Por tanto: \begin{align*} u(x,y) – u(x_0,y_0) = A(x-x_0) – B(y-y_0) + \varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2},\\ v(x,y) – v(x_0,y_0) = B(x-x_0) + A(y-y_0) + \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}. \tag{18.4} \end{align*} Notemos que: \begin{equation*} |\, \varepsilon_1(x,y)\,| \leq |\, \varepsilon(z)\,| \quad \text{y} \quad |\, \varepsilon_2(x,y)\,| \leq |\, \varepsilon(z)\,|. \end{equation*} Dado que $\lim\limits_{z \to z_0} \varepsilon(z) = 0$, entonces tomando límites en estas dos desigualdades concluimos que: \begin{equation*} \lim_{(x,y) \to (x_0,y_0)} \varepsilon_1(x,y) = 0 \quad \text{y} \lim_{(x,y) \to (x_0,y_0)} \varepsilon_2(x,y) = 0. \tag{18.5} \end{equation*} Por lo tanto, considerando (18.4) y (18.5), se sigue de la observación 18.1 que $u$ y $v$ son funciones diferenciables en $(x_0,y_0)\in U$ y se cumple que: \begin{align*} \frac{\partial u}{ \partial x}(x_0,y_0) = A =\frac{\partial v}{ \partial y}(x_0,y_0),\\ \frac{\partial v}{ \partial x}(x_0,y_0) = B = -\frac{\partial u}{ \partial y}(x_0,y_0), \end{align*} es decir que se satisfacen las ecuaciones de C-R en $z_0 = x_0 + iy_0 \in U$. Dado que dicho punto era arbitrario entonces el resultado es válido para todo punto en $U$.

$(\Leftarrow$
Supongamos ahora que las funciones reales de dos variables $u$ y $v$ son diferenciables en un punto $(x_0, y_0) \in U$ y satisfacen las ecuaciones de C-R en dicho punto, entonces: \begin{align*} \frac{\partial u}{ \partial x}(x_0,y_0) = A =\frac{\partial v}{ \partial y}(x_0,y_0),\\ \frac{\partial v}{ \partial x}(x_0,y_0) = B = -\frac{\partial u}{ \partial y}(x_0,y_0) \end{align*} para algunos $A$ y $B$ números reales.

Por la observación 18.1 y considerando las igualdades anteriores tenemos que $u$ y $v$ se pueden escribir de la forma: \begin{align*} u(x,y) – u(x_0,y_0) = A(x-x_0) – B(y-y_0) + \varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2},\\ v(x,y) – v(x_0,y_0) = B(x-x_0) + A(y-y_0) + \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}, \end{align*} donde $\varepsilon_1(x,y) \to 0$ y $\varepsilon_2(x,y) \to 0$ si $(x,y) \to (x_0,y_0)$.

Considerando a la función $f(z) = u(x,y) + iv(x,y)$, tenemos que: \begin{align*} f(z) – f(z_0) & = u(x,y) + iv(x,y) – \left[u(x_0,y_0) + iv(x_0,y_0)\right]\\ & = u(x,y) – u(x_0,y_0) + i\left[ v(x,y) – v(x_0,y_0)\right]\\ & = A(x-x_0) – B(y-y_0) + \varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}\\ & \quad \quad + i \left[ B(x-x_0) + A(y-y_0) + \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}\right]\\ & = (A+iB)\left[(x-x_0)+i(y-y_0)\right] + \sqrt{(x-x_0)^2 + (y-y_0)^2} \left[ \varepsilon_1(x,y) + i\varepsilon_2(x,y) \right]. \end{align*} Tomando: \begin{equation*} \varepsilon(x+iy) : = \frac{\sqrt{(x-x_0)^2 + (y-y_0)^2}}{(x-x_0) +i (y-y_0)}\left[ \varepsilon_1(x,y) + i\varepsilon_2(x,y) \right], \end{equation*} entonces: \begin{align*} f(z) – f(z_0) & = (A+iB)\left[(x-x_0)+i(y-y_0)\right] + \varepsilon(x+iy) \left[(x-x_0) +i (y-y_0)\right]\\ & = (A+iB)\left(z – z_0\right) + \varepsilon(z) \left( z- z_0\right). \tag{18.6} \end{align*} Claramente: \begin{equation*} |\, \varepsilon(z)\,| \leq |\, \varepsilon_1(x,y)\,| + |\, \varepsilon_2(x,y)\,|. \end{equation*} Como $\varepsilon_1(x,y) \to 0$ y $\varepsilon_2(x,y) \to 0$ si $(x,y) \to (x_0,y_0)$, entonces tomando límites en esta última desigualdad concluimos que: \begin{equation*} \lim\limits_{z \to z_0} \varepsilon(z) = 0. \tag{18.7} \end{equation*} Por lo tanto, considerando (18.6) y (18.7), se sigue de la proposición 18.1 que $f$ es analítica en $z_0 \in U$.

Más aún, tenemos que: \begin{equation*} f'(z_0) = A+iB = \frac{\partial u}{ \partial x}(x_0,y_0) + i \frac{\partial v}{ \partial x}(x_0,y_0) = \frac{\partial v}{ \partial y}(x_0,y_0) – i \frac{\partial u}{ \partial y}(x_0,y_0), \end{equation*} por lo que se cumple (18.3).

Dado que $z_0 = x_0 + iy_0\in U$ era arbitrario, entonces el resultado se cumple para todo punto en $U$.

$\blacksquare$

Observación 18.3.
Recordemos que hemos construido a $\mathbb{C}$ a través de $\mathbb{R}^2$, por lo que si pensamos a una función compleja $f$ como una función de $\mathbb{R}^2$ a $\mathbb{R}^2$ podemos preguntarnos acerca de la relación entre la diferenciabilidad compleja y la diferenciabilidad real de $f$.

Definición 18.3. (Diferenciabilidad de una función vectorial de dos variables.)
Sean $U\subset\mathbb{R}^2$ un conjunto abierto, $z_0 =(x_0,y_0) \in U$ y $f: U\to\mathbb{R}^2$ una función. Decimos que $f$ es diferenciable en $z_0$ (en el sentido real) si y solo si existe una transformación lineal $D_{f(z_0)} : \mathbb{R}^2 \to \mathbb{R}^2$ tal que: \begin{equation*}\lim_{z \to z_0}\frac{\|f(z)-f(z_0)-D_{f(z_0)}\left(z-z_0\right)\|}{\left\| z-z_0 \right\|} = 0, \tag{18.8} \end{equation*} donde $\|\cdot\|$ denota la norma usual en $\mathbb{R}^2$.

Por nuestros cursos de Cálculo sabemos que si una función vectorial de dos variables $f:U\to\mathbb{R}^2$, dada por $f(x,y) = (f_1(x,y),f_2(x,y))$, es diferenciable en un punto $z_0\in U\subset\mathbb{R}^2$, es decir existe el límite (18.8), entonces existen todas las derivadas parciales (de primer orden) en el punto $z_0$, de las funciones componentes de $f$ y al considerar la base canónica de $\mathbb{R}^2$, la matriz de $2\times2$ que representa a la transformación lineal $D_{f(z_0)}$ está formada por dichas derivadas parciales y recibe el nombre de la matriz Jacobiana, es decir: \begin{equation*} J_{f}(z_0) = \left(\begin{matrix} \frac{\partial f_1}{\partial x}(z_0) & \frac{\partial f_1}{\partial y}(z_0)\\ \\ \frac{\partial f_2}{\partial x}(z_0) & \frac{\partial f_2}{\partial y}(z_0) \end{matrix} \right). \tag{18.9} \end{equation*} Más aún, se prueba que $f$ es diferenciable en $U$ si y solo si $f_i: U \to \mathbb{R}$, con $i=1,2$, son funciones diferenciables en $U$.

De acuerdo con lo anterior podemos hacer algunas observaciones importantes. Notemos que la norma usal en $\mathbb{R}^2$ coincide con el módulo complejo en $\mathbb{C}$. Además, para una función compleja $f(z) = u(x,y) + iv(x,y)$, al considerarla como una función de $\mathbb{R}^2$ a $\mathbb{R}^2$, se tiene que las funciones componentes de $f$ son: \begin{equation*} f_1(x,y) = u(x,y), \quad f_2(x,y) = v(x,y). \tag{18.10} \end{equation*}

Considerando a un número complejo $\lambda = a+ib$ fijo y $z=x+iy\in\mathbb{C}$, tenemos que su producto es: \begin{equation*} \lambda z = (a+ib)(x+iy) = (ax -by) + i(ay + bx). \end{equation*}

Por lo que, a través del producto de dos números complejos es posible definir una trasnformación lineal de $\mathbb{R}^2$ a $\mathbb{R}^2$, como sigue. Sean $\lambda=(a,b)\in\mathbb{R}^2$ constante y $z=(x,y)\in\mathbb{R}^2$, entonces: \begin{equation*} M_{\lambda} : \mathbb{R}^2 \to \mathbb{R}^2, \quad M_{\lambda}(z) = \begin{pmatrix} ax-by\\ ay+bx \end{pmatrix} = \begin{pmatrix} a & -b\\ b & a \end{pmatrix} \begin{pmatrix} x\\ y \end{pmatrix}, \tag{18.11} \end{equation*} de donde es claro que la matriz $A = \begin{pmatrix} a & -b\\ b & a \end{pmatrix}$ representa, en la base canónica de $\mathbb{R}^2$, a la transformación $M_\lambda$ correspondiente con la multiplicación de dos números complejos.

Procedamos ahora a analizar la definición de diferenciabilidad compleja dada en la entrada 16. De acuerdo con la definición 16.1, sabemos que para $U\subset\mathbb{C}$ un conjunto abierto y $f:U \to \mathbb{C}$ una función, decimos que $f$ es diferenciable en $z_0\in U$ si existe el límite: \begin{equation*} \lim_{z\to z_0} \frac{f(z) – f(z_0)}{z-z_0}, \end{equation*} lo cual es equivalente a que exista un número complejo $\lambda = a+ib\in\mathbb{C}$ tal que: \begin{align*} \lim_{z\to z_0} \frac{f(z) – f(z_0)}{z-z_0} = \lambda \quad & \Longleftrightarrow \quad \lim_{z\to z_0} \frac{f(z) – f(z_0) – \lambda(z-z_0)}{z-z_0} = 0\\ & \Longleftrightarrow \quad \lim_{z\to z_0} \frac{| \, f(z) – f(z_0) – \lambda(z-z_0)\,|}{|\,z-z_0\,|} = 0, \tag{18.12} \end{align*} en cuyo caso $\lambda = f'(z_0)$.

De acuerdo con todo lo anterior, tenemos que la existencia de los límites dados en (18.8) y (18.12), así como el cumplimiento de las ecuaciones de C-R, nos deja ver que hay una estrecha relación entre las definiciones de diferenciabilidad real, para una función vectorial de dos variables, y de diferenciabilidad compleja.

Sean $U\subset\mathbb{C}$ un conjunto abierto y $f(z)=u(x,y)+iv(x,y)$ una función definida en $U$ y consideremos que $z=x+iy=(x,y)\in U$.

Si $f$ es una función analítica en $z_0\in U$, entonces existe $\lambda=a+ib\in\mathbb{C}$ tal que se cumple (18.12). Notemos que: \begin{align*} \lambda(z-z_0) &= (a+ib)\left[(x-x_0)+i(y-y_0)\right]\\ & = \left[a(x-x_0) – b(y-y_0)\right] + i \left[b(x-x_0) + a(y-y_0)\right], \end{align*} por lo que, considerando la transformación lineal dada por (18.11), tenemos que: \begin{equation*} M_\lambda(z-z_0) = \left(a(x-x_0) – b(y-y_0), b(x-x_0) + a(y-y_0)\right), \end{equation*} entonces: \begin{align*} 0 & = \lim_{z\to z_0} \frac{| \, f(z) – f(z_0) – \lambda(z-z_0)\,|}{|\,z-z_0\,|}\\ & = \lim_{z \to z_0} \frac{\left\| f(z) – f(z_0) – M_\lambda(z-z_0) \right\|}{\left\| z-z_0 \right\|}, \end{align*} por lo que $f$ es diferenciable, en el sentido real como función de $\mathbb{R}^2$ a $\mathbb{R}^2$. Más aún, la matriz $A$ que representa a la transformación lineal $M_\lambda$, en la base canónica de $\mathbb{R}^2$, debe ser igual a la matriz Jacobiana de $f$ en $z_0$, entonces considerando (18.10) tenemos que: \begin{equation*} \begin{pmatrix} a & -b\\ b & a \end{pmatrix} = \left(\begin{matrix} u_x(z_0) & u_y(z_0)\\ \\ v_x(z_0) & v_y(z_0) \end{matrix} \right), \end{equation*} de donde se siguen las ecuaciones de C-R y se cumple que $\lambda = f'(z_0) = u_x(z_0) + iv_x(z_0) = v_y(z_0) – i u_x(z_0)$.

Si suponemos ahora que $f$, como función de $\mathbb{R}^2$ a $\mathbb{R}^2$, es diferenciable en el sentido real y que se satisfacen las ecuaciones de C-R, entonces tenemos que se cumple (18.8).

Considerando a la matriz Jacobiana que representa a la transformación lineal $D_{f(z_0)}$, dada en (18.8), como se cumplen las ecuaciones de C-R, tenemos que dicha matriz es de la forma: \begin{equation*} \left(\begin{matrix} u_x(z_0) & -u_y(z_0)\\ \\ u_y(z_0) & u_x(z_0) \end{matrix} \right) = \begin{pmatrix} a & -b\\ b & a \end{pmatrix}, \end{equation*} para algunos $a,b\in\mathbb{R}$.

Dado que la transformación lineal $D_{f(z_0)}$ es única y la matriz que la representa es igual a la de la transformación dada en (18.11), entonces debe suceder que $D_{f(z_0)} = M_\lambda$, para $\lambda = a+ib\in\mathbb{C}$, es decir que se trata de la multiplicación por el número complejo $\lambda$, entonces: \begin{align*} 0 & = \lim_{z \to z_0} \frac{\| f(z) – f(z_0) – D_{f(z_0)}(z-z_0)\|}{\left\| z-z_0 \right\|}\\ & = \lim_{z\to z_0} \frac{| \, f(z) – f(z_0) – \lambda(z-z_0)\,|}{|\,z-z_0\,|}\ \end{align*}

Con lo anterior hemos probado el siguiente resultado.

Teorema 18.3.
Sean $U\subset\mathbb{C}$ un conjunto abierto y $f(z) = u(x,y) + iv(x,y)$ una función compleja definida en $U$. Las siguientes condiciones son equivalentes:

  1. $f$ es diferenciable en $z_0\in U$, en el sentido complejo.
  2. $f$ es diferenciable en $z_0=(x_0,y_0) \in U$, en el sentido real, pensada como una función de $\mathbb{R}^2$ a $\mathbb{R}^2$, y se satisfacen las ecuaciones de C-R en $z_0$.

$\blacksquare$

Ejemplo 18.4.
Sea $z=x+iy\in\mathbb{C}$ y sea $f:\mathbb{C} \to \mathbb{C}$ una función compleja dada por $f(z)=x^2-y^2+i2xy$. Veamos que $f$ es analítica en $\mathbb{C}$.

Solución. Si consideramos a $f$ como una función de $\mathbb{R}^2$ a $\mathbb{R}^2$ tenemos que $f(x,y) = (x^2 – y^2, 2xy)$, de donde se sigue que sus funciones componentes son: \begin{equation*} f_1(x,y)=u(x,y) = x^2-y^2, \quad f_2(x,y)=v(x,y) = 2xy. \end{equation*}

Dado que: \begin{align*} \frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = -2y,\\ \frac{\partial v}{\partial x} = 2y, \quad \frac{\partial v}{\partial y} = 2x, \end{align*} existen y son continuas para todo $z=(x,y)\in\mathbb{R}^2$, entonces $f$ es una función diferenciable, en el sentido real, en $\mathbb{R}^2$.

Es claro que $u_x = v_y$ y $u_y = – v_x$ para todo $z=(x,y)\in\mathbb{R}^2$, por lo que de acuerdo con el teorema 18.3, concluimos que $f$ es diferenciable en todo $\mathbb{C}$ y por tanto analítica en todo punto.

Por último, tenemos que la matriz Jacobiana de dicha función compleja es: \begin{equation*} J_f = \begin{pmatrix} u_x & u_y\\ v_x & v_y \end{pmatrix} = \begin{pmatrix} u_x & -v_x\\ v_x & u_x \end{pmatrix} = \begin{pmatrix} 2x & -2y\\ 2y & 2x \end{pmatrix}, \end{equation*} para todo $z=x+iy\in\mathbb{C}$.

Entonces, para $z_0=x_0+iy_0\in\mathbb{C}$ se tiene que: \begin{equation*} f'(z_0) = u_x(x_0,y_0) + i v_x(x_0,y_0) = 2x_0 + i2y_0 = 2z_0, \end{equation*} lo cual era de esperarse ya que $f(z) = z^2 = x^2 – y^2 + i2xy$.

Observación 18.4.
Es importante notar que el resultado anterior es solo una reformulación del teorema 18.3, desde que la diferenciabilidad, en el sentido real, de una función $f:U\subset\mathbb{R}^2 \to \mathbb{R}^2$ es equivalente a la diferenciabilidad de sus funciones componentes. Sin embargo, la importancia de este resultado radica en que ahora que conocemos la matriz Jacobiana de una función analítica, pensada como una función de $\mathbb{R}^2$ a $\mathbb{R}^2$, es claro, por el ejercicio 3 de la entrada 12, que dicha matriz corresponde con la derivada compleja de una función analítica en cualquier punto. Además veremos que a través de esta representación matricial de la derivada es posible establecer algunos resultados de las funciones analíticas que veremos en la siguiente entrada.

Por otra parte, estos últimos resultados nos dejan ver que la diferenciabilidad compleja es más fuerte que la diferenciabilidad real, lo cual resulta sorprendente, pues a diferencia de algunos conceptos como el límite y la continuidad para los cuales vimos que podemos caracterizarlos a través de dos funciones reales, correspondientes con la parte real e imaginaria de la función, en el caso de la diferenciabilidad es claro que no bastará la diferenciabilidad en el sentido real de dichas funciones o de la diferenciabilidad en el sentido real de la función vectorial conformada por dichas funciones reales. Esto resulta de suma importancia pues nos permite diferenciar a las funciones complejas de las funciones vectoriales de dos variables, desde que la diferenciabilidad de las primeras implica la diferenciabilidad de las segundas, pero el recíproco no es cierto ya que se deben cumplir también las ecuaciones de C-R, que como probamos antes resultan ser una condición necesaria para la diferenciabilidad compleja y por ende para la analicidad de una función compleja.

Para convencernos de esto último, basta con considerar a la función $f(z)=\overline{z} = x-iy$. Es claro que está función no es diferenciable en el sentido complejo desde que las ecuaciones de C-R no se satisfacen en ningún punto en $\mathbb{C}$ y por tanto tampoco es analítica. Sin embargo, si la consideramos como una función de $\mathbb{R}^2$ a $\mathbb{R}^2$ es claro que dicha función sí es diferenciable en el sentido real.

Tanto el teorema 18.1 como el teorema 18.2 nos dejan ver que además de las ecuaciones de C-R, es necesario imponer una serie de hipótesis extras sobre las funciones reales $u$ y $v$, que caracterizan a una función compleja $f(z)=u(x,y)+iv(x,y)$, para garantizar la analicidad de dicha función. Cerraremos esta entrada con un notable resultado que nos muestra que la condición de continuidad de las derivadas parciales en el teorema 18.1 resulta superfluo. No daremos una prueba de este, pero puede consultarse en algún texto como Complex Analysis in One Variable de Raghavan Narasimhan e Yves Nievergelt.

Teorema 18.4. (Teorema de Looman-Menchoff.)
Sean $U\subset$ un conjunto abierto y $f(z)=u(x,y) = iv(x,y)$ una función definida en $U$. Si las funciones reales $u$ y $v$ son continuas en $U$ (es decir que $f$ es continua en $U$), las cuatro derivadas parciales $u_x$, $u_y$, $v_x$ y $v_y$ existen en $U$ y se satisfacen las ecuaciones de C-R en $U$, entonces $f$ es analítica en $U$.

Tarea moral

  1. Muestra que las siguientes funciones son diferenciables solo en los conjuntos dados y determina su derivada.
    a) $f(z) = x – iy^2$ en $S=\{z\in\mathbb{C} : \operatorname{Im}(z) = -1/2\}$.
    b) $f(z) = x^2 + iy^2$ en $S=\{z\in\mathbb{C} : \operatorname{Re}(z) = \operatorname{Im}(z)\}$.
    c) $f(z) = yx + iy^2$ en $S=\{z\in\mathbb{C} : \operatorname{Re}(z) = \operatorname{Im}(z) = 0 \}$.
    d) $f(z) = x^3+i(1-y)^3$ en $S=\{z\in\mathbb{C} : \operatorname{Re}(z) = 0 \,\, \text{y} \,\, \operatorname{Im}(z) = 1\}$.
  2. Para cada una de las siguientes funciones complejas determina el conjunto donde $f$ es diferenciable y el dominio de analicidad de $f$. Donde exista, determina su derivada.
    a) $f(z) = (x^3 + 3xy^2 – 3x) + i(y^3 + 3x^2y – 3y)$.
    b) $f(z) = 6\overline{z}^2 – 2\overline{z} – 4i|\,z\,|^2$.
    c) $f(z) = (3x^2 + 2x – 3y^2 -1) + i(6xy + 2y)$.
    d) $f(z) = \dfrac{2z^2 + 6}{z(z^2 + 4)}$.
  3. Determina el dominio de analicidad de las siguientes funciones.
    a) $f(z) = 4x^2+5x-4y^2+9+i(8xy+5y-1)$.
    b) $f(z) = 5r\operatorname{cos}(\theta) + r^4\operatorname{cos}(4 \theta) + i(5r\operatorname{sen}(\theta) + r^4 \operatorname{sen}(4 \theta))$.
    c) $f(z) = \dfrac{x^3+xy^2+x}{x^2+y^2} + i \dfrac{y^3+x^2y-y}{x^2+y^2}$.
    d) $f(z) = \dfrac{\operatorname{cos}(\theta)}{r} – i \dfrac{\operatorname{sen}(\theta)}{r}$.
    e) $f(z) = \dfrac{x-1}{(x-1)^2+y^2} – i \dfrac{y}{(x-1)^2+y^2}$.
  4. ¿Cuál debe ser el valor de las constantes reales $a,b,c$ y $d$ para que las siguientes funciones sean analíticas?
    a) $f(z) = 3x-y+5+i(ax+by-3)$.
    b) $f(z) = x^2 + axy+by^2+i(cx^2+dxy+y^2)$.
  5. Supón que $f$ es una función analítica en un conjunto abierto $U\subset\mathbb{C}$. Prueba que el determinante de su matriz Jacobiana es igual a $|f'(z)|^2$ para todo $z\in U$.
  6. Sean $f(z) = z^3$, $z_1 = 1$ y $z_2 = i$. Prueba que no existe un punto $z_0$ en el segmento de recta que une a $z_1$ y $z_2$, es decir $[z_1,z_2]$, tal que: \begin{equation*} f(z_2) – f(z_1) = f'(z_0) (z_2 – z_1). \end{equation*} Concluye que el teorema del valor medio para funciones reales no se extiende para funciones complejas.
  7. Sea $f$ una función analítica en un conjunto abierto $U\subset\mathbb{C}$. Prueba que la función $g(z)=\overline{f(\overline{z})}$ es analítica en el conjunto $U^*=\{\overline{z} : z\in U\}$.

Más adelante…

En esta entrada vimos bajo que condiciones es posible garantizar la analicidad de una función compleja $f(z)=u(x,y) + i v(x,y)$ sobre un conjunto abierto $U\subset\mathbb{C}$. Para ello recurrimos nuevamente a analizar las funciones reales $u$ y $v$, concluyendo que, además de las ecuaciones de C-R, es necesario imponer algunas condiciones extras sobre dichas funciones.

El objetivo de esta entrada fue dar algunos recíprocos parciales para el Teorema 17.1 de la entrada anterior. Es interesante notar que es posible relajar algunas condiciones sobre las funciones $u$ y $v$ para garantizar la analicidad de una función compleja, como es el caso del teorema de Looman-Menchoff.

La siguiente entrada abordaremos algunos resultados interesantes que son consecuencia directa de las ecuaciones de Cauchy-Riemann y que nos permitirán caracterizar aún más a las funciones complejas a través de su parte real e imaginaria, extendiendo algunos resultados obtenidos en nuestros cursos de Cálculo.

Entradas relacionadas

Investigación de Operaciones: El problema de la dieta

Por Aldo Romero

Introducción

En la entrada anterior hablamos un poco de lo que es la Programación Lineal, de su historia y de cuáles son los tipos de problemas que estudia. Dijimos que un problema de programación lineal es aquel en el que se busca optimizar una función lineal bajo ciertas restricciones lineales. En estas entradas y las siguientes veremos algunos ejemplos conocidos de problemas de programación lineal. Comenzaremos hablando del problema de la dieta.

El problema de la dieta fue uno de los primeros problemas sobre optimización. George Joseph Stigler fue quien lo planteo a finales de la década de los años 30. El problema de régimen alimenticio óptimo para tratar de satisfacer la necesidad del ejército americano por hallar la manera más económica de alimentar a sus tropas, asegurándose de satisfacer al mismo tiempo unos determinados requerimientos nutricionales.

Análisis e interpretación

En este tipo de problemas, nos van a dar una cierta cantidad de alimentos diferentes, digamos $m$ alimentos, y cada alimento va a contener una cantidad finita de nutrientes de interés, digamos $n$ nutrientes. Entonces la cantidad de nutrientes j que va a tener el alimento i por unidad va a quedar representado por una constante dada, digamos $a_{i,j}$.

——Nutriente 1Nutriente 2$\ldots$Nutriente $n-1$Nutriente $n$Costo del alimento
Alimento 1$a_{1,1}$$a_{1,2}$$\ldots$$a_{1,n-1}$$a_{1,n}$$c_1$
Alimento 2$a_{2,1}$$a_{2,2}$$\ldots$$a_{2,n-1}$$a_{2,n}$$c_2$
$\vdots$$\vdots$$\vdots$$\ddots$$\vdots$$\vdots$$\vdots$
Alimento m-1$a_{m-1,1}$$a_{m-1,2}$$\ldots$$a_{m-1,n-1}$$a_{m-1,n}$$c_{m-1}$
Alimento m$a_{m,1}$$a_{m,2}$$\ldots$$a_{m,n-1}$$a_{m,n}$$c_m$
Nutrientes
requeridos
$b_1$$b_2$$\ldots$$b_{n-1}$$b_n$——

Cada individuo (ya sea persona u otro ser vivo) tiene el mismo requerimiento mínimo de cada uno de estos nutrientes, digamos $b_j, \quad \forall \ j \in {1, \ldots, n}$.

Sea $x_i$ = el número de unidades del alimento i que vamos a asignar a cada individuo

Entonces vamos a tener la restricción de que cada individuo tiene que recibir los nutrientes requeridos por los alimentos que le son dados. Esto se representa de la siguiente manera:

(Alimento 1: cantidad de nutriente j)(Unidades de alimento 1) + (Alimento 2: cantidad de nutriente j)(Unidades de alimento 2) + $\ldots$ + (Alimento m: cantidad de nutriente j) (Unidades de alimento m)$\geq$ Nutriente j requerido

Usando la notación de la tabla y las variables que creamos, se escribiría:

$a_{1,j}x_1 + a_{2,j}x_2 + \ldots + a_{m,j}x_m \geq b_j$ para cualquiera de los n nutrientes.

Cada alimento va a tener un coste dado por unidad, digamos $c_i$.

Como se mencionó, se busca la manera más económica de alcanzar los nutrimentos requeridos de los alimentos asignados a cada individuo, entonces, el problema busca minimizar el costo de los alimentos que elijamos. Esto se traduce como:

Minimizar z = (Costo alimento 1)(Unidades de alimento 1) + (Costo de alimento 2)(Unidades de alimento 2) + $\ldots$ + (Costo de alimento m)(Unidades de alimento m)

Usando la notación de la tabla y las variables que creamos, se escribiría:

$Min \quad z = c_1x_1 + c_2x_2 + \ldots + c_mx_m$

Como la cantidad de alimentos que vamos a asignar es a lo menos cero, nuestras variables $x_i$ van a ser mayores o iguales a cero.

Entonces, en términos generales, el problema quedaría de esta forma:

\begin{align*}
Min \quad z = c_1&x_1 + c_2x_2 + \ldots + c_mx_m\\
sujeto \quad a \quad &(s. a)\\
&a_{1,1}x_1 + a_{2,1}x_2 + \ldots + a_{m,1}x_m \geq b_1\\
&a_{1,2}x_1 + a_{2,2}x_2 + \ldots + a_{m,2}x_m \geq b_2\\
\vdots\\
&a_{1,n}x_1 + a_{2,n}x_2 + \ldots + a_{m,n}x_m \geq b_n\\
&x_i \geq 0\\
\end{align*}

Ejemplo del problema de la dieta

Consideremos el siguiente problema:

Un estudiante de la facultad de ciencias asiste a clases los 5 días de la semana. En su hora de comida tiene 3 opciones preferidas: Ir al comedor, comprar una torta o comprar unos tacos de canasta. Cada opción tiene un aporte nutritivo distinto que está representado en la siguiente tabla, así como el costo por merienda de cada opción

Costo por merienda
en pesos
Contenido nutritivo por unidad de alimento
N1N2
Comedor$351410
Torta$28107
Tacos de
canasta
$2064
Necesidades de nutrición
a la semana
4535

El estudiante busca cumplir sus necesidades nutricionales semanales y aparte gastar lo menos posible ya que la beca no da para tanto tristemente. Plantea como un problema de programación lineal.

Veamos cómo podemos plantear el problema anterior como un problema de programación lineal usando el análisis que hicimos anteriormente.

Sea $x_1$ las meriendas en el comedor por semana, $x_2$ las meriendas con torta por semana y $x_3$ las meriendas con tacos de canasta. En la tabla nos indican los costos de estas por lo que ya tenemos nuestra función objetivo a minimizar:

$Min \quad z = 35x_1 + 28x_2 + 20x_3$

Luego, tenemos que considerar las restricciones de los nutrientes que son requeridos. Solo tenemos dos nutrientes a considerar entonces tenemos las siguientes restricciones:

(Merienda 1: cantidad de nutriente 1)(Meriendas 1 por semana) +
(Merienda 2: cantidad de nutriente 1)(Meriendas 2 por semana) +
(Merienda 3: cantidad de nutriente 1)(Meriendas 3 por semana) $\geq$
Nutriente 1 requerido

(Merienda 1: cantidad de nutriente 2)(Meriendas 1 por semana) +
(Merienda 2: cantidad de nutriente 2)(Meriendas 2 por semana) +
(Merienda 3: cantidad de nutriente 2)(Meriendas 3 por semana) $\geq$
Nutriente 2 requerido

Escrito en la notación general descrita:

\begin{align*}
&a_{1,1}x_1 + a_{2,1}x_2 + a_{3,1}x_3 \geq b_1\\
&a_{1,2}x_1 + a_{2,2}x_2 + a_{3,2}x_3 \geq b_2\\
\end{align*}

Y usando los valores de el problema, tenemos:

\begin{align*}
&14x_1 + 10x_2 + 6x_3 \geq 45\\
&10x_1 + 7x_2 + 4x_3 \geq 35\\
\end{align*}

Y por último solo cabe mencionar que las meriendas del alimento que vamos a considerar es un número mayor o igual a cero. Por lo que el planteamiento del problema quedaría de la siguiente manera:

\begin{align*}
Min \quad z = 35&x_1 + 28x_2 + 20x_3\\
s.a&\\
14&x_1 + 10x_2 + 6x_3 \geq 45\\
10&x_1 + 7x_2 + 4x_3 \geq 35\\
&x_1, x_2, x_3 \geq 0\\
\end{align*}

Más adelante…

El problema de la dieta es el primer ejemplo de problema de programación lineal que nos encontramos. En las siguientes entradas veremos otros ejemplos más, como el problema de la mochila, el del transporte y otros.

Hasta ahora sólo hemos hablado de qué tipo de problemas queremos resolver, pero no hemos dicho nada con respecto al cómo los resolveremos. Veremos eso un poco más adelante.

Tarea

  • ¡Oh no! La inflación llegó y el precio de las meriendas mencionadas subió un $10\%$. Realiza nuevamente la formulación del problema de la dieta del ejemplo bajo este supuesto.
  • Formula como un PPL el siguiente ejemplo:
    «Se tienen disponibles 4 tipos de inversión cuyos costos son \$12,000, \$20,000, \$16,000, \$15,000 respectivamente. La inversión 1 tiene un valor presente neto de \$14,000, la 2 de \$25,000, la 3 de \$20,000 y la 4 de \$18,000. Se cuenta con un presupuesto de \$50,000. El objetivo es determinar la combinación de inversiones que aporte el valor presente neto máximo.»
  • Imagina que tenemos un problema más sencillo. Sólo se pueden elegir entre tortas y tacos. Cuestan \$30 las tortas y \$20 los tacos. La torta da 12 unidades de N1 y 8 de N2. Los tacos dan 9 unidades de N1 y 6 de N2. Imagina que se deben consumir 50 unidades de N1 y 35 unidades de N2. Se quiere encontrar la dieta más económica. Plantea este problema como un problema de programación lineal.
  • Intenta resolver el problema de programación lineal del inciso anterior con las herramientas con las que cuentes hasta ahora de Cálculo, Álgebra Lineal, etc. ¿Cuál sería el plan de meriendas semanal más económico?
  • ¿Por qué en el problema de la dieta no tiene sentido preguntarse por la dieta menos económica? Intenta argumentarlo desde el punto de vista práctico, como desde el punto de vista matemático.

Respuestas

$\bullet$ \begin{align*}
Min \quad z = 38.5&x_1 + 30.8x_2 + 22x_3\\
s.a&\\
14&x_1 + 10x_2 + 6x_3 \geq 45\\
10&x_1 + 7x_2 + 4x_3 \geq 35\\
&x_1, x_2, x_3 \geq 0\\
\end{align*}

$\bullet$ Nuestra variable de decisión es la siguiente:

$x_i$ = Se hace el tipo de inversión $i$ con $i \in \{1, 2, 3, 4\}$, $x_i \in \{0, 1\}$

Observemos que si se hace el tipo de inversión $i$, las ganancias son: valor presente neto – costo de la inversión. Como eventualmente lo que se busca es maximizar las ganancias, nuestra función objetivo sería la siguiente:

$$Max \quad z = 2000x_1 + 5000x_2 + 4000x_3 + 3000x_4$$

La única restricción es el presupuesto con el que se cuenta para realizar las inversiones. Entonces, la restricción será:

$$12,000x_1 + 20,000x_2 + 16,000x_3 + 15,000x_4 \leq 50,000$$

Y como las variables solo toman valor 0 o 1, también se satisface la no negatividad.

Entonces, el problema quedaría planteado de la siguiente forma:

\begin{align*}
Max \quad z = &2000x_1 + 5000x_2 + 4000x_3 + 3000x_4\\
&s.a\\
&12,000x_1 + 20,000x_2 + 16,000x_3 + 15,000x_4 \leq 50,000\\
&x_1 \in {0, 1}, i \in {1, 2, 3, 4}\\
\end{align*}

$bullet$ El cambio es muy simple, solo hay que cambiar las variables de decisión a $x_1$ las meriendas con torta por semana y $x_2$ las meriendas con tacos de canasta por semana. Entonces, con los cambios aplicados:

\begin{align*}
Min \quad z = 30&x_1 + 20x_2\\
s.a&\\
12&x_1 + 9x_2 \geq 50\\
8&x_1 + 6x_2 \geq 35\\
&x_1, x_2 \geq 0\\
\end{align*}

$bullet$ Una idea sería considerar solamente todos los valores posibles a elegir en la semana, revisar que cumplan con las necesidades de nutrición y calcular el gasto que conllevaría cada plan. Vamos a representar esos resultados en la siguiente tabla:

Combinación alimentariaN1 $\geq$ 50N2 \geq 35Costo del plan
5 días torta6045150
4 días torta,
1 día taco
5642140
3 días torta,
2 días tacos
5239
2 días torta,
3 días tacos
4836
1 día torta,
4 días tacos
4433110
5 días tacos4030100

Las filas que tienen una casilla roja no cumplen la necesidad nutricional de su respectiva columna.

Entonces, nuestra solución va a ser el plan de alimentación que tenga el menor costo y que tenga las dos casillas de necesidades nutricionales en verde. Esta solución es la de combinar 3 días con merienda de torta y dos días con merienda de tacos de canasta.

$\bullet$ Podría tal vez argumentarse es que la finalidad de resolver este tipo de problema es economizar los gastos de el o los individuos, entonces al tomar planes de dieta más caros, estamos haciendo lo opuesto a lo propuesto por la función objetivo.

Texto de la cabecera

Texto de la cabecera

Entradas relacionadas

Investigación de Operaciones: Introducción a la programación lineal

Por Aldo Romero

Introducción

En esta entrada comenzaremos a abordar el primer tema de este curso de Investigación de Operaciones: el de la programación lineal. Hablaremos un poco de por qué es importante estudiar esta disciplina. Luego, explicaremos un poco en qué consiste. Finalmente, veremos el tipo de problemas que podremos responder una vez que hayamos desarrollado más teoría.

¿Por qué estudiar programación lineal?

El desarrollo de la programación lineal ha sido clasificado como uno de los avances científicos más importantes de mediados del siglo XX. En la actualidad es una herramienta de uso cotidiano que permite efectuar de manera óptima muchas de las operaciones que realizan individuos, gobiernos, compañías y negocios. Esto ha su vez ha permitido el uso eficiente de los recursos y ahorros prácticamente incalculables.

Además de las ventajas que trae usar la programación lineal, también es notable la facilidad con la que hoy en día se aplican sus métodos. El tipo de matemáticas sobre las cuales está construida la programación lineal es en general teoría bien conocida: resultados básicos de álgebra lineal, teoremas importantes de cálculo, teoría de gráficas y redes. Esto se complementa con que en la actualidad es sencillo llevar esta teoría a la práctica, pues existen varios lenguajes de programación para uso científico que cuentan con bibliotecas dedicadas a la programación lineal.

¿Qué es la programación lineal?

La programación lineal es una rama de la programación matemática que estudia problemas de optimización en los cuales se desea maximizar (o minimizar) una función lineal restringida mediante ecuaciones o desigualdades lineales. En este contexto no hablamos de la palabra «programación» en el sentido usual de crear código para diseñar programas en una computadora. Más bien, nos referimos a «programación» más como en el sentido de «la programación de cierto canal de televisión» o bien como en la frase «programé una cita con mi dentista», es decir, como una manera de tomar decisiones para repartir un recurso (el tiempo de aire en el caso de la televisión y el tiempo del doctor y del paciente en el ejemplo del dentista).

Existe una gran variedad de problemas, en diversos campos, que pueden ser formulados o aproximados como modelos lineales. Una de las ventajas de resolver problemas por métodos de programación lineal es que existen técnicas eficientes, sencillas y bien estudiadas para resolverlos. Además, se tiene la comodidad de que una vez que se haya resuelto un problema, es sencillo hacer una variación de los parámetros originales para tener una buena intuición de la nueva respuesta sin tener que volver a hacer un procedimiento largo (a esto se le llama análisis de postoptimalidad).

Aunque una de sus aplicaciones más frecuentes es la asignación de recursos, la programación lineal tiene muchas otras posibilidades. En realidad, cualquier problema cuyo modelo matemático se ajuste al formato general de un problema de programación lineal, puede ser estudiado mediante las herramientas de la teoría.

Formato general de un problema de programación lineal

A un problema de programación lineal y su modelo lo llamaremos programa lineal. Abreviaremos problema de programación lineal como PPL y programa lineal como PL.

Estos problemas tienen que cumplir con las siguientes condiciones:

  • El criterio para seleccionar el mejor valor de las variables desconocidas involucradas en el problema, llamadas variables de decisión, puede describirse como función lineal de éstas. A esta función se le da el nombre de función objetivo.
  • Las reglas de operación que gobiernan el proceso (que definen las alternativas de solución) pueden expresarse mediante un conjunto de ecuaciones o desigualdades lineales a las cuales se les da el nombre de restricciones del problema.

El planteamiento matemático inicial del problema de programación lineal fue desarrollado por George Bernard Dantzig en 1947 junto con el método de solución simplex. El formato general del un modelo de esta clase es:

\begin{align*}
\text{Maximizar (o Minimizar)}&\\
z = c_1x_1+c_2x_2&+\ldots+c_nx_n\\
\text{s.a (sujeto a)}\\
a_{11}x_1+a_{12}x_2+\ldots+a_{1n}x_n \quad &\leq b_1 \quad \text{(o bien $\geq$ o $=$)}\\ a_{21}x_1+a_{22}x_2+\ldots+a_{2n}x_n \quad &\leq b_2 \quad \text{(o bien $\geq$ o $=$)}\\
&\vdots\\
a_{m1}x_1+a_{m2}x_2+\ldots+a_{mn}x_n \quad &\leq b_m \quad \text{(o bien $\geq$ o $=$)}\\
x_i & \geq 0, i = 1,\ldots,n.
\end{align*}

Este problema de programación lineal PPL puede escribirse en forma matricial:

\begin{align*}
\text{Max. (o Min.)}&\\
z &= c\\
\text{s.a}\\
Ax \quad &\leq b
\quad \text{(o bien $\geq$ o $=$)}\\
x &\geq 0.
\end{align*}

En esta expresión $c$ es un vector renglón en $\mathbb{R}^n$, llamado vector de costos o de coeficientes en la función objetivo. El vector $x$ es un vector columna (formado por las variables de decisión $x_1,\ldots,x_n$) en $\mathbb{R}^n$. La matriz $A$ es de $m$ renglones y $n$ columnas, llamada la matriz de restricciones. Y finalmente $b$ es un vector columna en $\mathbb{R}^n$, llamado el vector de recursos o lado derecho.

Más adelante…

En esta entrada hablamos un poco de qué es la programación lineal y qué es un PPL, pero nos hemos quedado en términos un poco abstractos. La mejor forma de entender qué es un problema lineal es mediante la presentación de ejemplos. En las siguientes entradas formularemos algunos ejemplos comunes, motivados en aplicaciones prácticas. Hablaremos del problema de la dieta, el problema de la mochila, el problema del transporte, y otros.

Tarea

  1. Ve el siguiente video de acerca de George Dantzig. ¿Que te pareció la anécdota de su tiempo de estudiante?
  1. Aún no hemos visto ejemplos de Problemas de Programación Lineal (PPL) pero, ¿crees que es siguiente ejemplo pueda formularse como uno? «Encontrar la ruta más corta entre una ciudad y otra teniendo varias rutas posibles que se cruzan entre sí.»
  2. Investiga un poco más de la historia de la programación lineal. ¿Qué gran evento en el mundo ayudó a que la teoría se desarrollara aceleradamente?

Entradas relacionadas