Investigación de Operaciones: El problema de la mochila

Por Aldo Romero

Introducción

En la entrada anterior hablamos del problema de la dieta, en donde queríamos cumplir ciertas restricciones alimenticias creando un menú de bajo costo. En esta entrada veremos otro ejemplo conocido de PPL: el problema de la mochila. La idea general es que queremos transportar ciertos bienes mediante un contenedor que tiene cierta capacidad. Este contenedor puede ser algo tan sencillo como una mochila, o algo tan complicado como un tren. A continuación veremos un ejemplo intermedio.

Ejemplo del problema de la mochila

Supongamos que un estado de la República Mexicana cuenta con un programa social para la venta de ciertos productos de la canasta básica a un precio reducido. Para ello, una camioneta transporta sacos de estos productos y los lleva a varios poblados del estado para venderlos. Si el consumidor adquiere el producto con la camioneta en vez de con otro distribuidor obtiene cierto ahorro.

En la siguiente tabla se indican los productos que se transportarán. Para cada uno de ellos, se muestra el peso en kilogramos de un saco de cada producto. También se muestra el ahorro, en pesos por saco, que obtendrán los consumidores.

ProductoPeso de un saco
en kilogramos
Ahorro al consumidor
en pesos por saco
Arroz1225
Azúcar1520
Café1030
Frijol1525

La camioneta puede transportar un máximo de 2 toneladas en carga. Queremos determinar con qué productos se debe cargar la camioneta de manera que se produzca el máximo ahorro al consumidor.

Variables de decisión del problema de la mochila

Puesto que se desea determinar la cargar de la camioneta, definimos las siguientes variables para cada $i=1,2,3,4$:

$x_i$ = número de sacos del producto $i$ que se incluirán en la carga de la camioneta.

Así como en la entrada anterior sobre el problema de la dieta, un conjunto de posibles asignaciones de valores de estas variables corresponden a una alternativa para el problema, es decir, una manera de posible de cargar la camioneta.

Restricciones del problema de la mochila

En este caso la única condición que debe satisfacer una alternativa posible es que su peso total no exceda la capacidad de carga de la camioneta. El peso de una carga posible es: $12x_1+15x_2+10x_3+15x_4$ kilogramos. Las cuentas son muy similares a las del problema de la entrada anterior. Por ejemplo, el término $12x_1$ aparece pues se transportarán $x_1$ sacos de arroz y cada uno de ellos pesa $12$ kilogramos.

El peso de la carga no debe exceder de las $2$ toneladas. Aquí hay que ser cuidadosos pues las unidades son distintas: kilos vs. toneladas. Para plantear correctamente el problema, debemos primero considerar que $2$ toneladas son $2000$ kilogramos. De este modo, la restricción queda escrita como $$12x_1+15x_2+10x_3+15x_4\leq 2000.$$

Por otro lado, dada su definición, las variables deben ser no negativas (pues no podemos transportar una cantidad negativa de sacos) y enteras (pues no podemos transportar sólo una fracción de saco).

Función objetivo del problema de la mochila

El criterio de comparación entre las alternativas es el ahorro total que aporten a los consumidores, de modo que tenemos que diseñar la función objetivo para que represente a éste. El ahorro total que se obtiene es de $$z=25x_1+20x_2+30x_3+25x_4.$$ Esta es la cantidad que se quiere maximizar.

Resumen de formulación del problema de la mochila

El PPL que obtenemos es en resumen:

\begin{align*}
Max \quad z&=25x_1+20x_2+30x_3+25x_4\\
s.a.&\\
12x_1&+15x_2+10x_3+15x_4 \leq 2000\\
x_i &\geq 0,x_i \in \mathbb Z, i=1,\ldots,4.\\
\end{align*}

Formulación general del problema de la mochila

Un modelo como el anterior recibe el nombre de problema de la mochila pues originalmente fue formulado del siguiente modo: un excursionista desea determinar la cantidad de latas de ciertos comestibles que llevará en su mochila. Las latas tienen cierto peso $p_i$, cierto valor $v_i$ para el excursionista y su mochila tiene capacidad $P$. Si hay $n$ alimentos disponibles y usamos como variables de decisión a $x_1,\ldots,x_n$, donde $x_i$ es el número de latas de alimento $i$ que el excursionista llevarán, entonces el problema de la mochila es:

\begin{align*}
Max \quad z &= \sum_{n}^{i=1} v_ix_i\\
s.a.&\\
\sum_{n}^{i=1} p_ix_i &\leq P\\
x_i &\geq 0, x_i \in \mathbb Z, i=1, \ldots, n.\\
\end{align*}

Este es un problema de programación lineal, pero más específicamente se le conoce como un problema de programación lineal entera (PPLE), o bien un modelo lineal entero, pues las variables $x_i$ están sujetas a tomar sólo valores en los números enteros. Sorpresivamente, aunque los problemas de programación entera parezcan «más fáciles» dado que sus posibilidades están más restringidas, esto no es así. Han sido objeto de mucho estudio pues agregar la condición de integralidad (que las variables sean enteras) crea complicaciones adicionales y hacen que los métodos generales no funcionen tan bien. Los problemas de programación lineal entera son difíciles incluso en términos de una noción computacional muy precisa del tiempo requerido para obtener la mejor solución.

Un caso particular de este modelo, también difícil de resolver, es el problema binario de la mochila en el cual las variables sólo pueden tomar los valores $0$ o $1$. Esto se traduce, en el caso de la excursión, simplemente a decidir si se incluye o no una lata de alimento $i$.

Más adelante…

Aún tenemos algunos problemas conocidos por explorar. El siguiente que veremos es el problema del transporte, en donde queremos saber cómo distrubuir productos a través distintas posibilidades de transporte para economizar costos.

En algunas entradas más también hablaremos de cómo llevar cualquier PPL a una forma estándar, que nos permitirá desarrollar la teoría general necesaria para resolverlo.

Tarea moral

  • Para entender un poco las dificultades de los PPLE considera el siguiente ejemplo. Imagina que el saco de arroz pesa 5 kilogramos, que el saco de azucar pesa 3 kilogramos, que el primero de ellos da un ahorro de \$12 y que el segundo da un ahorro de \$10. El vehículo que tenemos ahora es un coche que sólo puede cargar 300 kilogramos. ¿Cómo cargarías en este caso el coche para maximizar el ahorro? Plantea el PPLE e intenta resolver el problema con las herramientas con las que cuentes hasta ahora.
  • Para entender un poco el problema binario de la mochila, considera el siguiente ejemplo. Se tienen 10 posibles artículos con peso $7,10,12,4,5,9,11$ y con valor correspondiente $23,25,28,17,19,25,26$. Sólo podemos decidir si llevar o no llevar cada artículo, y el peso total que se cargará no puede exceder $40$. ¿Cuáles artículos hay que llevar para maximizar el valor? Plantea el PPLE e intenta resolverlo con las herramientas con las que cuentes hasta ahora.
  • Considera el problema ejemplo de la entrada. ¿Qué crees que pase con la respuesta del problema si pasan las siguientes cosas? ¿El ahorro óptimo aumentará o dismunuirá? Considera cada caso por separado, uno por uno.
    • El programa compró una mejor camioneta, que ahora puede transportar 2.5 toneladas.
    • El café se volvió más caro y ahora cada saco sólo ahorra 25 pesos al consumidor.
    • La fábrica de frijol ya cambió las presentaciones de sus productos y ahora sólo vende sacos de 30 kilos, que le dan un ahorro de 50 pesos al comprador.
    • Por una nueva política de salud, se quitó el azucar de los productos beneficiados por el programa social.
  • ¿Notaste que en la entrada anterior no dimos la formulación general del problema de la dieta, sino sólo un ejemplo? Es tu turno de plantear una versión general. Regresa a la entrada anterior y plantea la versión general del problema de la dieta.

Entradas relacionadas

Álgebra Superior II: Ideales en los enteros

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada pasada hablamos del concepto de divisibilidad en los números enteros. Enunciamos y demostramos varias de sus propiedades. La noción de divisibilidad da lugar a muchos otros conceptos importantes dentro de la teoría de los números enteros, como el máximo común divisor, el mínimo común múltiplo y los números primos. Así mismo, la noción de divisibilidad está fuertemente ligada con los ideales en los enteros.

En esta entrada hablaremos de este último concepto a detalle. Es una entrada un poco técnica, pero nos ayudará para asentar las bases necesarias para poder hablar de los máximos comunes divisores y los mínimos comunes múltiplos con comodidad un poco más adelante.

Ideales en los enteros y una equivalencia

Los ideales son ciertas estructuras importantes en matemáticas. En el caso particular de los números enteros, tenemos la siguiente definición

Definición. Un ideal de $\mathbb{Z}$ es un subconjunto $I$ de $\mathbb{Z}$ que cumple las siguientes dos propiedades:

  • No es vacío.
  • Es cerrado bajo restas, es decir, si $a$ y $b$ están en $I$, entonces $a-b$ también.

Veamos un ejemplo sencillo. Diremos que un número entero es par si es múltiplo de $2$ y que es impar si no es múltiplo de dos.

Ejemplo. El conjunto de todos los números pares son un ideal de $\mathbb{Z}$. Este conjunto claramente no es vacío, pues adentro de él está, por ejemplo, el $2$. Además, si tenemos que dos números $a$ y $b$ son pares, entonces por definición podemos encontrar enteros $k$ y $l$ tales que $a=2k$ y $b=2l$, de modo que $$a-b=2k-2l=2(k-l),$$ lo cual nos dice que $a-b$ también es par.

$\square$

Como veremos un poco más adelante, el ejemplo anterior se puede generalizar. Antes de ver esto, veremos una caracterización un poco distinta de lo que significa ser un ideal.

Proposición. Un subconjunto $I$ de $\mathbb{Z}$ es un ideal si y sólo si cumple las siguientes tres propiedaes:

  • No es vacío.
  • Es cerrado bajo sumas, es decir, si $a$ y $b$ están en $I$, entonces $a+b$ también.
  • Es absorbente, es decir, si $a$ está en $I$ y $b$ está en $\mathbb{Z}$, entonces $ab$ también está en $I$.

Demostración. Primero veremos que si $I$ es un ideal, entonces cumple las tres propiedades anteriores. Luego veremos que si $I$ cumple las tres propiedades anteriores, entonces es un idea.

Supongamos que $I$ es un ideal. Por definición, no es vacío, que es lo primero que queríamos ver. Veamos ahora que es cerrado bajo sumas. Supongamos que $a$ y $b$ están en $I$. Como $I$ es cerrado bajo restas y $b-b=0$, obtenemos que $b$ está en $I$. Usando nuevamente que $b$ es cerrado bajo restas para $0$ y $b$, obtenemos que $0-b=-b$ también está en $I$. Usando una última vez la cerradura de la resta, obtenemos ahora que $a+b=a-(-b)$ está en $I$, como queríamos.

La tercera propiedad la demostraremos primero para los $b\geq 0$ por inducción. Si $b=0$, debemos ver que $0\cdot a=0$ está en $I$. Esto es cierto pues en el párrafo anterior ya vimos por qué $0$ está en $I$. Supongamos ahora que para cierta $b$ fija se tiene que $ab$ está en $I$. Por la cerradura de la suma obtenemos que $$ab+a=ab+a\cdot 1=a(b+1)$$ también está en $I$, como queríamos. Aquí usamos que $1$ es identidad multiplicativa, la distributividad, la hipótesis inductiva y la cerradura de la suma.

Nos falta ver qué pasa con los $b<0$. Sin embargo, si $b<0$, tenemos que $a(-b)$ sí está en $I$ (pues $-b>0$). Así, por la cerradura de la resta tenemos que $0-a(-b)=ab$ está en $I$.

Apenas llevamos la mitad de la demostración, pues vimos que la definición de ideal implica las tres propiedades que se mencionan. Pero el regreso es más sencillo. Supongamos que un conjunto $I$ cumple las tres propiedades mencionadas. Como cumple la primera, entonces no es vacío. Ahora vemos que es cerrado bajo restas. Tomemos $a$ y $b$ en $I$. Como cumple la segunda propiedad, tenemos que $(-1)b=-b$ está en $I$. Como cumple la cerradura de la suma, tenemos que $a+(-b)=a-b$ está en $I$. Así, $I$ es cerrado bajo restas.

$\square$

La ventaja del resultado anterior es que nos permitirá pensar a los ideales de una o de otra forma, de acuerdo a lo que sea más conveniente para nuestros fines más adelante.

Clasificación de ideales

Veamos la generalización de nuestro ejemplo de números pares e impares.

Definición. Sea $n$ un entero. Al conjunto de todos los múltiplos de $n$ lo denotaremos por $n\mathbb{Z}$ y lo llamaremos el conjunto de los múltiplos de $n$, es decir:

$n\mathbb{Z}=\{nm: m\in \mathbb{Z}\}.$

Proposición. Si $n$ es cualquier entero, entonces $n\mathbb{Z}$ es un ideal de $\mathbb{Z}$.

Demostración. Claramente $n\mathbb{Z}$ no es vacío pues, por ejemplo, $0=0\cdot n$ está en $n\mathbb{Z}$. La demostración de la cerradura de la resta se sigue de un corolario de la entrada anterior. Si $a,b$ están en $n\mathbb{Z}$, entonces ambos son divisibles entre $n$, así que su resta $a-b$ también. Así, $a-b$ está en $n\mathbb{Z}$.

$\square$

El ejemplo anterior de hecho da todos los posibles ideales que existen en $\mathbb{Z}$. El siguiente teorema enuncia esto con precisión.

Teorema. Un conjunto $I$ de $\mathbb{Z}$ es un ideal si y sólo si existe un entero no negativo $n$ tal que $I=n\mathbb{Z}$.

Demostración. Tomemos $I$ un ideal de $\mathbb{Z}$. Existe la posibilidad de que $I=\{0\}$, pues en efecto este es un ideal: es no vacío (pues tiene a $0$) y es cerrado bajo restas (pues sólo hay que verificar que $0-0=0$ está en I). Si este es el caso, entonces $I=0\mathbb{Z}$, como queríamos. Así, a partir de ahora supondremos que $I$ no es este conjunto. Veremos que $I$ tiene por lo menos un elemento positivo.

Sea $a\in I$ cualquier elemento que no sea $0$. Si $a$ es positivo, entonces ya lo logramos. Si $a$ es negativo, entonces notamos que $0=a-a$ está en $I$, y que entonces $-a=0-a$ está en $I$. Pero entonces $-a$ es un número positivo en $I$.

Debido a esto, por el principio del buen orden podemos tomar al menor entero positivo $n$ que está en $I$. Afirmamos que $I=n\mathbb{Z}$. Por la caracterización de ideales que dimos en la sección anterior, todos los múltiplos de $n$ están en $I$, así que $I\supseteq n\mathbb{Z}$.

Veamos que $I\subseteq n\mathbb{Z}$ procediendo por contradicción. Supongamos que este no es el caso, y que entonces existe un $m\in I$ que no sea múltiplo de $n$. Por el algoritmo de la división, podemos escribir $m=qn+r$ con $0<r<n$. Como $m$ está en $I$ y $qn$ está en $I$, tendríamos entonces que $m-qn=r$ está en $I$. ¡Pero esto es una contradicción! Tendríamos que $r$ está en $I$ y que $0<r<n$, lo cual contradice que $n$ era el menor entero positivo en $I$ que tomamos con el principio del buen orden. Esta contradicción sólo puede evitarse si $m$ es múltiplo de $n$, como queríamos.

$\square$

Un teorema como el anterior se conoce como un teorema de clasificación pues nos está diciendo cómo son todas las posibles estructuras que definimos a partir de un criterio fácil de enunciar.

Ideal generado por dos elementos

Dado un conjunto de números enteros $S$, podríamos preguntarnos por el ideal más chiquito que contenga a $S$. Un ejemplo sencillo es tomar $S$ con sólo un elemento, digamos $S=\{n\}$. En este caso, es fácil convencerse de que el ideal más pequeño que contiene a $S$ es precisamente $n\mathbb{Z}$ (ve los problemas de la tarea moral).

Un caso un poco más interesante es, ¿qué sucede si tenemos dos elementos?

Ejemplo. ¿Cuál será el menor ideal posible $I$ que tiene a los números $13$ y $9$? Empecemos a jugar un poco con la propiedad de la cerradura de la resta. Como $13$ y $9$ están, entonces también está $4=13-9$. Como $9$ y $4$ están, entonces también está $5=9-4$. Así mismo, debe estar $1=5-4$. Pero aquí ya llegamos a algo especial: que el $1$ está. Recordemos los ideales también cumplen que una vez que está un número, están todos sus múltiplos. Así, $1\mathbb{Z}$ está contenido en $I$. Pero entonces $I=1\mathbb{Z}=\mathbb{Z}$.

$\square$

No siempre obtenemos $\mathbb{Z}$ como respuesta. Para un ejemplo en donde se obtiene $2\mathbb{Z}$, ve los problemas de la tarea moral. En la siguiente entrada hablaremos con más detalle de la respuesta, pero por el momento probaremos lo siguiente.

Proposición. Si $a$ y $b$ son enteros, entonces:

  • El conjunto $M=\{ra+sb: r,s\in \mathbb{Z}\}$ es un ideal de $\mathbb{Z}$ que tiene a $a$ y a $b$.
  • Si $I$ es un ideal de $\mathbb{Z}$ que tiene a $a$ y a $b$, entonces $M\subseteq I$.

En otras palabras, «$M$ es el ideal más pequeño (en contención) que tiene a $a$ y a $b$».

Demostración. Veamos primero que $M$ en efecto es un ideal. Para ello, notemos que no es vacío pues, por ejemplo, $0=0\cdot a+0\cdot b$ está en $M$. Además, es cerrado bajo restas pues si tenemos dos elementos en $M$, son de la forma $ra+sb$ y $ka+lb$, y su resta es $$(ra+sb)-(ka+lb)=(r-k)a+(s-l)b,$$ que vuelve a estar en $M$ pues $r-k$ y $s-l$ son enteros. Además, $a=1\cdot a+ 0\cdot b$, lo que muestra que $a$ está en $M$ y $b=0\cdot a + 1 \cdot b$, lo que muestra que $b$ está en $M$ también. Con esto demostramos el primer punto.

Para el segundo punto, supongamos que $a$ está en $I$ y que $b$ está en $I$ también. Como $I$ es idea, tiene a todos los múltiplos de $a$ y los de $b$, es decir, a todos los números de la forma $ra$ y $sb$. Como es ideal, también es cerrado bajo sumas, así que tiene todas las formas de números de este estilo. En particular, tiene a todos los números de la forma $ra+sb$ (variando $r$ y $s$), es decir, a todos los elementos de $I$, como queríamos.

$\square$

Quizás notaste algo raro. El conjunto $M$ es un ideal, pero se ve un poco distinto de los que obtuvimos con nuestra caracterización de la sección anterior. Parece más bien que «está hecho por dos enteros» en vez de estar hecho sólo por uno. Esto no es problema. Nuestra caracterización nos dice que debe existir un entero $d$ tal que $M=d\mathbb{Z}$. Esto nos llevará en la siguiente entrada a estudiar el máximo común divisor.

Intersección de ideales

Los ideales de $\mathbb{Z}$ son subconjuntos, así que podemos aplicarles operaciones de conjuntos. ¿Qué sucede si intersectamos dos ideales? La siguiente operación nos dice que

Proposición. Si $I$ y $J$ son ideales de $\mathbb{Z}$, entonces $I\cap J$ también.

Demostración. La demostración es sencilla. Como $I$ y $J$ son ideales, se puede ver que ambos tienen al $0$, y que por lo tanto su intersección también. Ahora veamos que $I\cap J$ es cerrada bajo restas. Si $a$ y $b$ están en $I\cap J$, entonces $a$ y $b$ están en $I$. Como $I$ es cerrado bajo restas, $a-b$ está en $I$. Análogamente, está en $J$. Así, $a-b$ está en $I\cap J$, como queríamos.

$\square$

Este resultado motivará nuestro estudio del mínimo común múltiplo un poco más adelante.

Más adelante…

Esta fue una entrada un poco técnica, pero ahora ya conocemos a los ideales en los enteros, algunas de sus propiedades y hasta los caraterizamos. La idea de tomar el ideal generado por dos elementos nos llevará a estudiar en la siguiente entrada el concepto de máximo común divisor. Y luego, la idea de intersectar ideales nos llevará en un par de entradas a explorar la noción de mínimo conún múltiplo

Tarea moral

  1. Imagina que sabes que un ideal tiene al número $6$. Esto forza a que también tenga a $6-6=0$. Así, esto forza a que también tenga el $0-6=-6$. Sigue así sucesivamente, jugando con todas las nuevas restas que deben quedarse dentro del ideal. ¿Cuál es el menor ideal que puede tener al $6$?
  2. Repite lo anterior, pero ahora suponiendo que tu ideal tiene a los números $10$ y $12$. ¿Qué números puedes obtener si repetidamente puedes hacer restas? ¿Quién sería el menor ideal que tiene a ambos números?
  3. Sean $I_1,\ldots,I_k$ ideales de $\mathbb{N}$. Demuestra que $I_1\cap I_2 \cap \ldots \cap I_k$ también es un idea. Como sugerencia, usa inducción.
  4. Toma a los ideales $6\mathbb{Z}$ y $8\mathbb{Z}$. Por el resultado de la entrada, tenemos que su intersección $A$ también es un ideal. Intenta averiguar y demostrar quién es el $k$ tal que $A=k\mathbb{Z}$.
  5. ¿Es cierto que la unión de dos ideales siempre es un ideal? Si es falso, encuentra contraejemplos. Si es verdadero, da una demostración. Si es muy fácil, ¿puedes decir exactamente para qué enteros $m$ y $n$ sucede que $m\mathbb{Z}\cup n\mathbb{Z}$ es un ideal?

Entradas relacionadas

Variable Compleja I: Ecuaciones de Cauchy-Riemann. Condiciones suficientes para la diferenciabilidad compleja.

Por Pedro Rivera Herrera

Introducción

En las entradas anteriores hemos definido y trabajado con los conceptos de diferenciabilidad y analicidad de una función compleja, en particular hemos visto que dichos conceptos no son equivalentes, desde que la analicidad de una función compleja en un punto $z_0$ implica la diferenciabilidad de la función en todo un $\varepsilon$-vecindario de $z_0$.

Como hemos visto a lo largo de la unidad 2, toda función compleja está totalmente definida a través de un par de funciones reales de dos variables, a las cuales hemos llamado su parte real e imaginaria. Más aún, hemos caracterizado algunos conceptos matemáticos importantes como el de límite y continuidad a través de dichas funciones, por lo que resulta natural cuestionarnos acerca de si es posible caracterizar la diferenciabilidad de una función compleja mediante estás funciones reales.

La entrada anterior deducimos las ecuaciones de Cauchy-Riemann y vimos que para una función compleja $f(z)=u(x,y) + iv(x,y)$ analítica en un conjunto abierto $U\subset\mathbb{C}$ las funciones $u$ y $v$, correspondientes con su parte real e imaginaria, deben satisfacer dichas ecuaciones. Sin embargo, vimos que dichas ecuaciones son solamente una condición necesaria, pero no suficiente, que las funciones $u$ y $v$ deben satisfacer. En esta entrada veremos que además de las ecuaciones de C-R, es necesario imponer unas condiciones extras sobre las funciones $u$ y $v$ para garantizar que una función compleja es analítica.

Recordemos la definición de diferenciabilidad de una función real de dos variables, vista en nuestros cursos de Cálculo.

Definición 18.1. (Diferenciabilidad de funciones reales de dos variables.)
Sea $U\subset\mathbb{R}^2$ un conjunto abierto. Una función real de dos variables $u:U \to \mathbb{R}$, es diferenciable en $(x_0,y_0) \in U$ si existen $A,B\in\mathbb{R}$ constantes tales que: \begin{equation*} \lim_{(x,y) \to (x_0, y_0)} \frac{u(x,y) – u(x_0, y_0) – A(x-x_0) – B(y-y_0)}{\sqrt{(x-x_0)^2 + (y-y_0)^2}} = 0, \end{equation*} en tal caso $A = \dfrac{\partial u}{\partial x}(x_0, y_0)$ y $B = \dfrac{\partial u}{\partial y}(x_0, y_0)$.

Observación 18.1.
De acuerdo con la definición 18.1, tenemos que una función real de dos variables $u$, definida sobre un abierto $U\subset \mathbb{R}^2$, es diferenciable en $(x_0,y_0)\in U$ si puede escribirse de la forma: \begin{equation*} u(x,y) = u(x_0,y_0) + A(x-x_0) + B(y-y_0) + \varepsilon(x,y)\sqrt{(x-x_0)^2 + (y-y_0)^2}, \end{equation*} donde $A = \dfrac{\partial u}{\partial x}(x_0, y_0)$ y $B = \dfrac{\partial u}{\partial y}(x_0, y_0)$ son constantes reales y $\lim\limits_{(x,y) \to (x_0,y_0)}\varepsilon(x,y) = 0$.

Consideremos el siguiente resultado.

Proposición 18.1.
Sean $U\subset\mathbb{C}$ un conjunto abierto y $f:U\to\mathbb{C}$ una función. Entonces, $f$ es analítica en $z_0\in U$ si y solo si $f$ se puede escribir de la forma: \begin{equation*} f(z) = f(z_0) + c(z-z_0) + \varepsilon(z)(z-z_0), \tag{18.2} \end{equation*} donde $c\in\mathbb{C}$ es una constante, $\varepsilon: U \to \mathbb{C}$ es continua en $z_0$ y $\lim\limits_{z \to z_0} \varepsilon(z) = 0$. En tal caso se tiene que $f'(z_0) = c$.

Demostración. Dadas las hipótesis, tenemos lo siguiente.

$\Rightarrow)$
Supongamos que $f'(z_0)$ existe, entonces definimos la función: \begin{equation*} \varepsilon(z)= \left\{ \begin{array}{lcc} \dfrac{f(z)- f(z_0)}{z – z_0} – f'(z_0) & \text{si} & z\neq z_0, \\ 0 & \text{si} & z = z_0. \end{array} \right. \end{equation*} Es claro que dicha función satisface que $\lim_{z \to z_0} \varepsilon(z) = 0$ y además es una función continua en $z_0$.

$(\Leftarrow$
Supongamos que $f(z)$ se puede escribir como (18.2) con $c\in\mathbb{C}$ constante, entonces para $z\neq z_0$, tenemos que: \begin{equation*} \frac{f(z) – f(z_0)}{z – z_0} = c + \varepsilon(z), \end{equation*} por lo que, tomando límites en la igualdad anterior: \begin{equation*} \lim_{z\to z_0} \frac{f(z) – f(z_0)}{z – z_0} = \lim_{z\to z_0} \left(c + \varepsilon(z)\right) = c, \end{equation*} de donde $f'(z_0) = c$.

$\blacksquare$

La proposición anterior establece que la diferenciabilidad de una función compleja $f(z)$ en $z_0$ es equivalente a que dicha función se puede aproximar en $z_0$ por la función lineal $f(z_0) + c(z-z_0)$, con $c\in\mathbb{C}$ constante, en el sentido que cuando $z$ está cerca de $z_0$ la diferencia entre $f(z)$ y $f(z_0) + c(z-z_0)$ es pequeña comparada con $|\,z-z_0\,|$.

Procedemos ahora a responder nuestra pregunta sobre cuáles son las condiciones suficientes que se deben imponer sobre las funciones $u$ y $v$, correspondientes con la parte real e imaginaria de una función compleja, además de las ecuaciones de C-R, para garantizar la analicidad de una función compleja.

Teorema 18.1.
Una función compleja $f(z) = u(x,y) + iv(x,y)$ es analítica en un conjunto abierto $U\subset\mathbb{C}$ si las cuatro derivadas parciales $u_x, v_x, u_y$ y $v_y$ existen y son continuas en todo punto de $U$ (es decir $u$ y $v$ son funciones de clase $C^1$) y satisfacen las ecuaciones de C-R en todo punto de $U$. En tal caso, para todo $z_0=x_0+iy_0\in U$ se tiene que: \begin{equation*} f'(z_0) = \frac{\partial u}{\partial x}(x_0,y_0) + i \frac{\partial v}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0) – i \frac{\partial u}{\partial y}(x_0,y_0). \tag{18.3} \end{equation*}

Demostración. Dadas las hipótesis, tomemos a $z_0 = x_0 + iy_0 \in U$ fijo, entonces existe $r>0$ tal que $B(z_0, r) \subset U$. Sea $z \in B(z_0, r)$ y supongamos que $z \neq z_0$, entonces tenemos que el segmento de recta que une a $z_0$ con $z$, es decir $[z_0, z]$, está totalmente contenido en $B(z_0, r)$ (¿por qué?). Sin perdida de generalidad supongamos que $x>x_0$ y $y>y_0$ (los casos restantes son completamente análogos), figura 64, por lo que: \begin{equation*} u(x,y) – u(x_0, y_0) = u(x,y) – u(x_0, y) \quad + u(x_0, y) – u(x_0, y_0). \end{equation*}

Segmento de recta $[z_0, z]$ contenido en el disco abierto con centro en $z_0$ y radio $r>0$. Caso $x>x_0$ y $y>y_0$.

Definimos $h = x – x_0 > 0$ y $k = y – y_0 > 0$. Sean $g_1 : [0,h] \to \mathbb{R}$ y $g_2 : [0,k] \to \mathbb{R}$ dadas por: \begin{equation*} g_1(t) = u(x_0 + t,y) \quad \text{y} \quad g_2(t) = u(x_0,y_0 + t). \end{equation*} Como $u_x$ y $u_y$ existen en $U$, entonces para $y$ fijo tenemos que $g_1$ es una función diferenciable en $[0,h]$ y para $x_0$ fijo tenemos que $g_2$ también es una función diferenciable en $[0,k]$, por lo que $g_1$ y $g_2$ son funciones continuas en $[0,h]$ y $[0,k]$ respectivamente y sus derivadas son: \begin{align*} g_1′(t) & = \lim_{h\to 0} \frac{g_1(t+h)-g_1(t)}{h}\\ & = \lim_{h\to 0} \frac{u(x_0 + t + h,y)-u(x_0 + t,y)}{h}\\ & = \frac{\partial u}{\partial x}(x_0 + t,y), \end{align*} \begin{align*} g_2′(t) & = \lim_{k\to 0} \frac{g_2(t+h)-g_2(t)}{k}\\ & = \lim_{h\to 0} \frac{u(x_0,y_0 + t + h)-u(x_0,y_0 + t)}{k}\\ & = \frac{\partial u}{\partial y}(x_0,y_0+t). \end{align*} Por el teorema del valor medio para funciones reales, tenemos que existen $c_1\in(0,h)$ y $c_2\in(0,k)$ tales que: \begin{align*} g_1(h) – g_1(0) = g_1′(c_1) (h – 0),\\ g_2(h) – g_2(0) = g_2′(c_2) (k – 0), \end{align*} o equivalentemente que existen $\alpha_1, \beta_1 \in (0,1)$, tales que: \begin{align*} g_1(h) – g_1(0) = h \, g_1′(h\alpha_1),\\ g_2(h) – g_2(0) = k \, g_2′(k\beta_1), \end{align*} es decir: \begin{align*} u(x, y) – u(x_0, y) & = u(x_0 + h, y_0 + k) – u(x_0, y_0 + k)\\ & = h \, u_x(x_0 +\alpha_1 h, y_0 + k), \end{align*} \begin{align*} u(x_0, y) – u(x_0, y_0) & = u(x_0, y_0 + k) – u(x_0, y_0)\\ & = k \, u_y(x_0, y_0 + \beta_1 k). \end{align*} Por lo que: \begin{equation*} u(x,y) – u(x_0, y_0) = h \, u_x(x_0 +\alpha_1 h, y_0 + k) + k \, u_y(x_0, y_0 + \beta_1 k). \end{equation*}

De manera análoga concluimos que existen $\alpha_2, \beta_2 \in (0,1)$ tales que: \begin{align*} v(x_0 + h, y_0 + k) – v(x_0, y_0 + k) = h \, v_x(x_0 +\alpha_2 h, y_0 + k),\\ v(x_0, y_0 + k) – v(x_0, y_0) = k \, v_y(x_0, y_0 + \beta_2 k), \end{align*} donde $h = x – x_0 > 0$ y $k = y – y_0 > 0$.

Por lo que: \begin{equation*} v(x,y) – v(x_0, y_0) = h \, v_x(x_0 +\alpha_2 h, y_0 + k) + k \, v_y(x_0, y_0 + \beta_2 k). \end{equation*} Entonces, para $z\neq z_0$ tenemos que: \begin{align*} \frac{f(z) – f(z_0)}{z-z_0} & = \frac{u(x,y) + iv(x,y) – \left[ u(x_0,y_0) + iv(x_0,y_0)\right]}{(x – x_0) + i (y-y_0)}\\ & = \frac{u(x,y) – u(x_0,y_0)}{h + i k} + i \left[ \frac{v(x,y) – v(x_0,y_0)}{h + i k}\right]\\ & = \frac{h \, u_x(x_0 +\alpha_1 h, y_0 + k) + k \, u_y(x_0, y_0 + \beta_1 k)}{h + i k}\\ & \quad + i \left[ \frac{h \, v_x(x_0 +\alpha_2 h, y_0 + k) + k \, v_y(x_0, y_0 + \beta_2 k)}{h + i k}\right]\\ & = \frac{h}{h+ik}\left[u_x(x_0 +\alpha_1 h, y_0 + k) + i v_x(x_0 +\alpha_2 h, y_0 + k)\right]\\ & \quad + \frac{k}{h+ik} \left[u_y(x_0, y_0 + \beta_1 k) + i v_y(x_0, y_0 + \beta_2 k)\right], \end{align*} donde $h = x – x_0 > 0$, $k = y – y_0 > 0$ y $\alpha_i, \beta_i \in (0,1)$ para $i=1,2$. Además la igualdad anterior se cumple aún si $x = x_0$ o $y = y_0$.

Dado que $u_x, u_y, v_x$ y $v_y$ son continuas en $U$, entonces tenemos que: \begin{align*} \lim_{(h,k) \to (0,0)} u_x(x_0 +\alpha_1 h, y_0 + k) = u_x(x_0, y_0),\\ \lim_{(h,k) \to (0,0)} v_x(x_0 +\alpha_2 h, y_0 + k) = v_x(x_0, y_0),\\ \lim_{(h,k) \to (0,0)} u_y(x_0, y_0 + \beta_1 k) = u_y(x_0, y_0),\\ \lim_{(h,k) \to (0,0)} v_y(x_0, y_0 + \beta_2 k) = v_y(x_0, y_0). \end{align*} Por lo que: \begin{align*} \frac{f(z) – f(z_0)}{z-z_0} & = \frac{h}{h+ik}\left[u_x(x_0, y_0) + i v_x(x_0, y_0) + \varepsilon_1 \right]\\ & \quad + \frac{k}{h+ik} \left[u_y(x_0, y_0) + i v_y(x_0, y_0) + \varepsilon_2 \right], \end{align*} donde $\varepsilon_1, \varepsilon_2 \to 0$ si $(h,k) \to (0,0)$ o equivalentemente si $z \to z_0$.

Como se cumplen las ecuaciones de C-R, tenemos que: \begin{align*} u_x(x_0, y_0) = A = v_y(x_0, y_0),\\ u_y(x_0, y_0) = B = – v_x(x_0, y_0), \end{align*} para algunos $A$ y $B$ números reales.

Entonces: \begin{align*} \frac{f(z) – f(z_0)}{z-z_0} & = \frac{h}{h+ik}\left(A – i B\right) + \frac{k}{h+ik} \left(B + i A\right) + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}\\ & = \frac{A\left(h + i k\right)}{h+ik} -i \frac{B\left(h + ik\right)}{h+ik} + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}\\ & = A -iB + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}\\ & = u_x(x_0, y_0) +iv_x(x_0,y_0) + \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik}, \end{align*} donde $\varepsilon_1, \varepsilon_2 \to 0$ si $z \to z_0$.

Dado que para todo $z\in\mathbb{C}$ se cumple que $|\,\operatorname{Re}(z)\,| \leq |\,z\,|$ e $|\,\operatorname{Im}(z)\,| \leq |\,z\,|$, entonces: \begin{align*} 0<|\,h\,| \leq |\,h+ik\,| \quad \Longrightarrow \frac{|\,h\,|}{|\,h+ik\,|} \leq 1,\\ 0<|\,k\,| \leq |\,h+ik\,| \quad \Longrightarrow \frac{|\,k\,|}{|\,h+ik\,|} \leq 1. \end{align*} Por lo que: \begin{align*} \left| \, \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik} \, \right| & \leq \left|\, \frac{h \varepsilon_1}{h+ik} \,\right| + \left|\, \frac{k \varepsilon_2}{h+ik} \,\right|\\ & = \frac{\left|\, h \,\right|}{\left|\, h+ik\,\right|} \left|\,\varepsilon_1 \,\right| + \frac{\left|\, k \,\right|}{\left|\,h+ik\,\right|} \left|\,\varepsilon_2 \,\right|\\ & \leq \left|\,\varepsilon_1 \,\right| + \left|\,\varepsilon_2 \,\right|, \end{align*} tomando límites en la desigualdad anterior concluimos que: \begin{equation*} \lim_{(h,k) \to (0,0)} \frac{h \varepsilon_1 + k \varepsilon_2}{h+ik} = \lim_{z \to z_0} \frac{(x-x_0) \varepsilon_1 + (y-y_0) \varepsilon_2}{(x-x_0)+i(y-y_0)} = 0. \end{equation*} Por tanto, tenemos que: \begin{align*} \lim_{z \to z_0} \frac{f(z) – f(z_0)}{z-z_0} & =\lim_{z \to z_0} \left( u_x(x_0, y_0) +iv_x(x_0,y_0) + \frac{(x-x_0) \varepsilon_1 + (y-y_0) \varepsilon_2}{(x-x_0)+i(y-y_0)} \right)\\ & =\lim_{z \to z_0} u_x(x_0, y_0) + \lim_{z \to z_0} iv_x(x_0,y_0) + \lim_{z \to z_0} \frac{(x-x_0) \varepsilon_1 + (y-y_0) \varepsilon_2}{(x-x_0)+i(y-y_0)}\\ & = u_x(x_0, y_0) +iv_x(x_0,y_0). \end{align*}

Entonces $f$ es analítica en $z_0 =x_0+iy_0 \in U$ y su derivada está dada por (18.3).

Dado que $z_0 = x_0 + iy_0\in U$ era arbitrario, entonces el resultado se cumple para todo punto en $U$.

$\blacksquare$

El resultado anterior es un primer recíproco parcial del teorema 17.1 de la entrada anterior, en el cual vimos que las ecuaciones de C-R son solo una condición necesaria, pero no suficiente, para la analicidad de una función compleja.

Observación 18.2.
Es importante recordar que los conceptos de diferenciabilidad y analicidad de una función no son intercambiables, por lo que puede suceder que una función sea diferenciable en un punto, pero no analítica en dicho punto. Considerando el resultado anterior podemos determinar a través de las ecuaciones de C-R dónde una función sí puede ser al menos diferenciable.

Ejemplo 18.1.
Sea $z=x+iy \in \mathbb{C}$. Consideremos a la función $f(z)=x^2+y^2+2ixy$. Veamos que $f$ no es analítica en ningún punto, pero es diferenciable en todo el eje real. Más aún, veamos que en dicho conjunto de puntos se tiene que $f'(z) = 2x$.

Solución. Considerando a la función $f$ tenemos que: \begin{equation*} u(x,y) = x^2 + y^2 \quad \quad \text{y} \quad \quad v(x,y) = 2xy. \end{equation*} Claramente ambas funciones están definidas sobre todo $\mathbb{C}$, por lo que $f$ está definida en $\mathbb{C}$.

Tenemos que: \begin{align*} \frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = 2y,\\ \frac{\partial v}{\partial x} = 2y, \quad \frac{\partial v}{\partial y} = 2x. \end{align*} Es claro que las derivadas parciales existen y son continuas para todo $z = x+iy \in \mathbb{C}$.

Notemos que $u_x = v_y$, pero $u_y \neq -v_x$. Sin embargo: \begin{align*} \frac{\partial u}{\partial y} = – \frac{\partial v}{\partial x} \quad & \Longleftrightarrow \quad y = 0\\ & \Longleftrightarrow \quad z = \operatorname{Re}(z) = x. \end{align*}

Por lo que, por el teorema 18.1, concluimos que $f$ únicamente es diferenciable para todo $z$ en el eje real y su derivada en dicho conjunto de puntos es: \begin{equation*} f'(z) = f'(x) = \frac{\partial u}{\partial x}(x,0) + i \frac{\partial v}{\partial x}(x,0) = 2x. \end{equation*}

Dado que para todo $z_0=x_0+i0$ en el eje real y para todo $\delta>0$, existe $z_\delta=x_0 + i\frac{\delta}{2} \in B(z_0, \delta)$ un punto en donde $f$ no es diferenciable, entonces no existe un disco abierto alrededor de $z_0$ en el cual $f$ sea diferenciable y por tanto no es analítica en ningún punto sobre el eje real y en general en ningún punto en $\mathbb{C}$.

Ejemplo 18.2.
Sea $f:\mathbb{C} \to \mathbb{C}$ dada por $f(z)=x^2 – y^3 + i(x-y)$. Mostremos que $f$ no es analítica en $\mathbb{C}$ y determinemos el conjunto de puntos donde es diferenciable y hallemos su derivada en dicho conjunto.

Solución. De acuerdo con la definición de $f$ tenemos que: \begin{equation*} u(x,y) = x^2 – y^3 \quad \quad \text{y} \quad \quad v(x,y) = x-y. \end{equation*}

Tanto $u$ como $v$ son funciones reales diferenciables en todo punto en $\mathbb{R}^2$ y: \begin{align*} \frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = -3y^2,\\ \frac{\partial v}{\partial x} = 1, \quad \frac{\partial v}{\partial y} = -1, \end{align*} las cuales existen y son continuas para todo punto en $\mathbb{R}^2$.

Es claro que $u_x \neq v_y$ y $u_y \neq -v_x$. Procedemos a determinar en qué puntos de $\mathbb{C}$ se satisfacen las igualdades: \begin{align*} \frac{\partial u}{\partial x} = \frac{\partial v}{\partial y} \quad & \Longleftrightarrow \quad 2x = -1\\ & \Longleftrightarrow \quad x = -\frac{1}{2}. \end{align*} \begin{align*} \frac{\partial u}{\partial y} = – \frac{\partial v}{\partial x} \quad & \Longleftrightarrow \quad -3y^2 = -1\\ & \Longleftrightarrow \quad y = \pm \frac{1}{\sqrt{3}}. \end{align*}

Sea $S = \left\{-\frac{1}{2}+i\frac{\sqrt{3}}{3}, -\frac{1}{2}-i\frac{\sqrt{3}}{3} \right\}$.

Entonces, por el teorema 18.1, concluimos que $f$ únicamente es diferenciable para $z_0 \in S$ y su derivada en dicho conjunto de puntos es: \begin{align*} f’\left(z_0\right) & = \frac{\partial u}{\partial x}\left(-\frac{1}{2},\pm \frac{\sqrt{3}}{3}\right) + i \frac{\partial v}{\partial x}\left(-\frac{1}{2},\pm \frac{\sqrt{3}}{3}\right)\\ & = -1 + i. \end{align*}

Notemos que para todo $z_0\in S$ y para todo $\delta>0$, existe $z_\delta=z_0 + \frac{\delta}{2} \in B(z_0, \delta)$ un punto en donde $f$ no es diferenciable, entonces no existe un disco abierto alrededor de $z_0$ en el cual $f$ sea diferenciable y por tanto no es analítica en ningún punto en $S$ y en general en ningún punto en $\mathbb{C}$.

Considerando la proposición 18.1 y la observación 18.1, planteamos el siguiente resultado en el cual establecemos cuales son las condiciones necesarias y suficientes que deben satisfacer las funciones reales $u$ y $v$, correspondientes con la parte real e imaginaria de una función compleja, para garantizar la analicidad de dicha función en un conjunto abierto $U\subset\mathbb{C}$.

Teorema 18.2.
Una función compleja $f(z) = u(x,y) + iv(x,y)$ es una función analítica en un conjunto abierto $U\subset\mathbb{C}$ si y solo si las funciones reales de dos variables $u$ y $v$ son diferenciables en $U$ y satisfacen las ecuaciones de C-R en todo punto de $U$. En tal caso, para todo $z_0=x_0+iy_0\in U$ se tiene que: \begin{equation*} f'(z_0) = \frac{\partial u}{\partial x}(x_0,y_0) + i \frac{\partial v}{\partial x}(x_0,y_0) = \frac{\partial v}{\partial y}(x_0,y_0) – i \frac{\partial u}{\partial y}(x_0,y_0). \tag{18.3.} \end{equation*}

Demostración. Sea $f(z) = u(x,y) + iv(x,y)$ una función compleja definida sobre un conjunto abierto $U\subset \mathbb{C}$ y sea $z = x+iy\in U$.

$\Rightarrow)$
Supongamos que $f$ es analítica en $U$ y sea $z_0 = x_0 +i y_0 \in U$ fijo. De acuerdo con la proposición 18.1, como la función $f$ es analítica en $z_0 \in U$, entonces puede escribirse como en (18.2), es decir de la forma: \begin{equation*} f(z) – f(z_0) = c(z-z_0) + \varepsilon(z)(z-z_0), \end{equation*} donde $c = f'(z_0) \in \mathbb{C}$ es constante y $\lim\limits_{z \to z_0} \varepsilon(z) = 0$.

Sea $c = f'(z_0) = A+iB\in\mathbb{C}$ para algunos $A$ y $B$ números reales. Entonces podemos reescribir esta última igualdad como: \begin{equation*} u(x,y) + iv(x,y) – \left[u(x_0,y_0) + iv(x_0,y_0)\right] = (A+iB)\left[(x-x_0) + i(y-y_0)\right] + \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right]. \end{equation*} Separando en la parte real e imaginaria de la igualdad anterior obtenemos: \begin{align*} u(x,y) – u(x_0,y_0) = A(x-x_0) – B(y-y_0) + \operatorname{Re}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right),\\ v(x,y) – v(x_0,y_0) = B(x-x_0) + A(y-y_0) + \operatorname{Im}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right). \end{align*} Tenemos que: \begin{align*} \operatorname{Re}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right) & = \bigg(\operatorname{Re}\bigg[ \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \bigg]\bigg) \frac{\sqrt{(x-x_0)^2 + (y-y_0)^2}}{\sqrt{(x-x_0)^2 + (y-y_0)^2}}\\ & = \bigg(\operatorname{Re}\bigg[\frac{\varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right]}{\sqrt{(x-x_0)^2 + (y-y_0)^2}} \bigg]\bigg) \sqrt{(x-x_0)^2 + (y-y_0)^2}\\ & =:\varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}, \end{align*} y de manera análoga obtenemos que: \begin{equation*} \operatorname{Im}\left( \varepsilon(x+iy) \left[ (x-x_0) + i(y-y_0)\right] \right) =: \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}. \end{equation*} Por tanto: \begin{align*} u(x,y) – u(x_0,y_0) = A(x-x_0) – B(y-y_0) + \varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2},\\ v(x,y) – v(x_0,y_0) = B(x-x_0) + A(y-y_0) + \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}. \tag{18.4} \end{align*} Notemos que: \begin{equation*} |\, \varepsilon_1(x,y)\,| \leq |\, \varepsilon(z)\,| \quad \text{y} \quad |\, \varepsilon_2(x,y)\,| \leq |\, \varepsilon(z)\,|. \end{equation*} Dado que $\lim\limits_{z \to z_0} \varepsilon(z) = 0$, entonces tomando límites en estas dos desigualdades concluimos que: \begin{equation*} \lim_{(x,y) \to (x_0,y_0)} \varepsilon_1(x,y) = 0 \quad \text{y} \lim_{(x,y) \to (x_0,y_0)} \varepsilon_2(x,y) = 0. \tag{18.5} \end{equation*} Por lo tanto, considerando (18.4) y (18.5), se sigue de la observación 18.1 que $u$ y $v$ son funciones diferenciables en $(x_0,y_0)\in U$ y se cumple que: \begin{align*} \frac{\partial u}{ \partial x}(x_0,y_0) = A =\frac{\partial v}{ \partial y}(x_0,y_0),\\ \frac{\partial v}{ \partial x}(x_0,y_0) = B = -\frac{\partial u}{ \partial y}(x_0,y_0), \end{align*} es decir que se satisfacen las ecuaciones de C-R en $z_0 = x_0 + iy_0 \in U$. Dado que dicho punto era arbitrario entonces el resultado es válido para todo punto en $U$.

$(\Leftarrow$
Supongamos ahora que las funciones reales de dos variables $u$ y $v$ son diferenciables en un punto $(x_0, y_0) \in U$ y satisfacen las ecuaciones de C-R en dicho punto, entonces: \begin{align*} \frac{\partial u}{ \partial x}(x_0,y_0) = A =\frac{\partial v}{ \partial y}(x_0,y_0),\\ \frac{\partial v}{ \partial x}(x_0,y_0) = B = -\frac{\partial u}{ \partial y}(x_0,y_0) \end{align*} para algunos $A$ y $B$ números reales.

Por la observación 18.1 y considerando las igualdades anteriores tenemos que $u$ y $v$ se pueden escribir de la forma: \begin{align*} u(x,y) – u(x_0,y_0) = A(x-x_0) – B(y-y_0) + \varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2},\\ v(x,y) – v(x_0,y_0) = B(x-x_0) + A(y-y_0) + \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}, \end{align*} donde $\varepsilon_1(x,y) \to 0$ y $\varepsilon_2(x,y) \to 0$ si $(x,y) \to (x_0,y_0)$.

Considerando a la función $f(z) = u(x,y) + iv(x,y)$, tenemos que: \begin{align*} f(z) – f(z_0) & = u(x,y) + iv(x,y) – \left[u(x_0,y_0) + iv(x_0,y_0)\right]\\ & = u(x,y) – u(x_0,y_0) + i\left[ v(x,y) – v(x_0,y_0)\right]\\ & = A(x-x_0) – B(y-y_0) + \varepsilon_1(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}\\ & \quad \quad + i \left[ B(x-x_0) + A(y-y_0) + \varepsilon_2(x,y) \sqrt{(x-x_0)^2 + (y-y_0)^2}\right]\\ & = (A+iB)\left[(x-x_0)+i(y-y_0)\right] + \sqrt{(x-x_0)^2 + (y-y_0)^2} \left[ \varepsilon_1(x,y) + i\varepsilon_2(x,y) \right]. \end{align*} Tomando: \begin{equation*} \varepsilon(x+iy) : = \frac{\sqrt{(x-x_0)^2 + (y-y_0)^2}}{(x-x_0) +i (y-y_0)}\left[ \varepsilon_1(x,y) + i\varepsilon_2(x,y) \right], \end{equation*} entonces: \begin{align*} f(z) – f(z_0) & = (A+iB)\left[(x-x_0)+i(y-y_0)\right] + \varepsilon(x+iy) \left[(x-x_0) +i (y-y_0)\right]\\ & = (A+iB)\left(z – z_0\right) + \varepsilon(z) \left( z- z_0\right). \tag{18.6} \end{align*} Claramente: \begin{equation*} |\, \varepsilon(z)\,| \leq |\, \varepsilon_1(x,y)\,| + |\, \varepsilon_2(x,y)\,|. \end{equation*} Como $\varepsilon_1(x,y) \to 0$ y $\varepsilon_2(x,y) \to 0$ si $(x,y) \to (x_0,y_0)$, entonces tomando límites en esta última desigualdad concluimos que: \begin{equation*} \lim\limits_{z \to z_0} \varepsilon(z) = 0. \tag{18.7} \end{equation*} Por lo tanto, considerando (18.6) y (18.7), se sigue de la proposición 18.1 que $f$ es analítica en $z_0 \in U$.

Más aún, tenemos que: \begin{equation*} f'(z_0) = A+iB = \frac{\partial u}{ \partial x}(x_0,y_0) + i \frac{\partial v}{ \partial x}(x_0,y_0) = \frac{\partial v}{ \partial y}(x_0,y_0) – i \frac{\partial u}{ \partial y}(x_0,y_0), \end{equation*} por lo que se cumple (18.3).

Dado que $z_0 = x_0 + iy_0\in U$ era arbitrario, entonces el resultado se cumple para todo punto en $U$.

$\blacksquare$

Tarea moral

  1. Muestra que las siguientes funciones son diferenciables solo en los conjuntos dados y determina su derivada.
    a) $f(z) = x – iy^2$ en $S=\{z\in\mathbb{C} : \operatorname{Im}(z) = -1/2\}$.
    b) $f(z) = x^2 + iy^2$ en $S=\{z\in\mathbb{C} : \operatorname{Re}(z) = \operatorname{Im}(z)\}$.
    c) $f(z) = yx + iy^2$ en $S=\{z\in\mathbb{C} : \operatorname{Re}(z) = \operatorname{Im}(z) = 0 \}$.
    d) $f(z) = x^3+i(1-y)^3$ en $S=\{z\in\mathbb{C} : \operatorname{Re}(z) = 0 \,\, \text{y} \,\, \operatorname{Im}(z) = 1\}$.
  2. Para cada una de las siguientes funciones complejas determina el conjunto donde $f$ es diferenciable y donde $f$ es analítica. Donde exista, determina su derivada.
    a) $f(z) = (x^3 + 3xy^2 – 3x) + i(y^3 + 3x^2y – 3y)$.
    b) $f(z) = 6\overline{z}^2 – 2\overline{z} – 4i|\,z\,|^2$.
    c) $f(z) = (3x^2 + 2x – 3y^2 -1) + i(6xy + 2y)$.
    d) $f(z) = \dfrac{2z^2 + 6}{z(z^2 + 4)}$.

Más adelante…

En esta entrada vimos bajo que condiciones es posible garantizar la analicidad de una función compleja $f(z)=u(x,y) + i v(x,y)$ sobre un conjunto abierto $U\subset\mathbb{C}$. Para ello recurrimos nuevamente a analizar las funciones reales $u$ y $v$, concluyendo que, además de las ecuaciones de C-R, es necesario imponer algunas condiciones extras sobre dichas funciones.

El objetivo de esta entrada fue dar algunos recíprocos parciales para el Teorema 17.1 de la entrada anterior. Es interesante notar que es posible relajar algunas condiciones sobre las funciones $u$ y $v$ para garantizar la analicidad de una función compleja, como es el caso del teorema de Looman-Menchoff.

La siguiente entrada abordaremos algunos resultados interesantes que son consecuencia directa de las ecuaciones de Cauchy-Riemann y que nos permitirán caracterizar aún más a las funciones complejas a través de su parte real e imaginaria, extendiendo algunos resultados obtenidos en nuestros cursos de Cálculo.

Entradas relacionadas

Investigación de Operaciones: El problema de la dieta

Por Aldo Romero

Introducción

En la entrada anterior hablamos un poco de lo que es la Programación Lineal, de su historia y de cuáles son los tipos de problemas que estudia. Dijimos que un problema de programación lineal es aquel en el que se busca optimizar una función lineal bajo ciertas restricciones lineales. En estas entradas y las siguientes veremos algunos ejemplos conocidos de problemas de programación lineal. Comenzaremos hablando del problema de la dieta.

Ejemplo del problema de la dieta

Consideremos el problema de diseñar un desayuno en una escuela que satisfaga ciertos requisitos de nutrición establecidos por alguna institución de salud que hace recomendaciones con respecto a la dieta de la población.

Supongamos que se tienen cuatro alimentos disponibles: leche, jamón, huevo y pan. El costo de la leche es de \$10 por litro, el del jamón de \$45 por kilogramo, el del huevo de \$13 por kilogramo y el del pan de \$0.60 por pieza.

De acuerdo a las restricciones establecidas por la institución de salud, en cada menú los niños deben ingerir por lo menos, entre otras cosas, 25 unidades de cierto nutriente al que llamaremos N1 y 20 unidades de otro denominado N2. Si quieres puedes pensar en que N1 son proteinas y N2 carbohidratos.

El contenido nutritivo de los alimentos y el costo de éstos se muestra en la siguiente tabla. Debemos diseñar el menú más económico que satisfaga las necesidades nutrimentales mencionadas.

AlimentoCosto por unidad en pesosContenido nutritivo por unidad de alimento
N1N2
Leche$10/lt153
Jamón$45/kg515
Huevo$13/kg88
Pan$0.60/pz14
Necesidades de nutrición2520

Veamos cómo podemos plantear el problema anterior como un problema de programación lineal.

Variables de decisión del problema de la dieta

Puesto que el problema es determinar la cantidad de cada alimento que debemos incluir en el menú, definiremos las siguientes variables:

  • $x_1$ = número de litros de leche a incluir en el menú.
  • $x_2$ = número de kilogramos de jamón a incluir en el menú.
  • $x_3$ = número de kilogramos de huevo a incluir en el menú.
  • $x_4$ = número de piezas de pan a incluir en el menú.

Observemos que un conjunto de asignación de valores a las variables de decisión representa una alternativa de solución para el problema, es decir, un menú.

Restricciones del problema de la dieta

El conjunto de posibles valores de las variables debe representar a todas las alternativas factibles para el problema. En otras palabras, las restricciones que se impongan a los valores de las variables deben garantizar el consumo de nutrientes requerido.

Hagamos de manera detallada el cálculo para el nutriente N1. Notemos que la cantidad de nutriente N1 que tiene un menú se puede desglosar de acuerdo a cuánto contribuye cada tipo de alimento. Así, calculemos las siguientes cantidades:

  • Como tendremos $x_1$ litros de leche y cada litro contribuye con $15$ unidades de nutriente $1$, entonces el número de unidades del nutriente N1 contribuidas por la lecha es $15x_1$.
  • De manera similar, el número de unidades de nutriente N1 contribuidas por los $x_2$ kilogramos de jamón es $5x_2$.
  • Así mismo, el número de unidades de nutriente N1 contribuidas por $x_3$ kilogramos de huevo es $8x_3$.
  • Finalmente, el número de unidades de nutriente N1 contribuidas al menú por las $x_4$ piezas de pan es simplemente $x_4$, pues cada pieza contribuye con sólo una unidad.

Así, en el menú compuesto por $x_1$ litros de leche, $x_2$ kilogramos de jamón, $x_3$ kilogramos de huevo y $x_4$ piezas de pan tenemos un total de

$$15x_1+5x_2+8x_3+x_4$$

unidades de nutriente N1 y esta cantidad deberá ser mayor o igual que $25$.

En resumen, la primera restricción del problema es: $$15x_1+5x_2+8x_3+x_4 \geq 25.$$

Aún no terminamos con todas las restricciones. También debemos considerar al nutriente N2. Afortunadamente, los cálculos son muy similares y nos dicen que la cantidad total de nutriente N2 incluida en un menú compuesto por $x_1$ litros de leche, $x_2$ kilogramos de jamón, $x_3$ kilogramos de huevo y $x_4$ piezas de pan es $$3x_1+15x_2+8x_3+4x_4.$$

De este modo, para cumplir con los requisitos de tener al menos $20$ unidades de N2 se debe cumplir que $$3x_1+15x_2+8x_3+4x_4\geq 20.$$

Finalmente notemos que en un menú no puede haber una cantidad negativa de ingredientes. Por ejemplo, no podemos tener $-5$ piezas de pan. Así, también deben satisfacerse las siguiente restricciones de no-negatividad: $$x_i \geq 0 \quad \text{para $i=1, \ldots , 4$.}$$

Función objetivo del problema de la dieta

La función objetivo de un problema de programación lineal está dada por la cantidad que queremos optimizar. En el problema que tenemos, se pide encontrar el menú más económico. Así, el criterio de evaluación de las alternativas de menú que tenemos es su costo.

Podemos calcular el costo de un menú de manera muy similar a la que calculamos la cantidad de nutrientes. El costo depende de cuántas unidades incluyamos de cada alimento, y esto ya sabemos que está contemplado en las variables $x_1,x_2,x_3,x_4$. Por ejemplo, como cada litro de leche cuesta \$10, entonces tendremos que la leche costará en total $10x_1$ pesos. Haciendo lo mismo para el resto de los alimentos, obtenemos que el costo de un menú compuesto por $x_1$ litros de leche, $x_2$ kilogramos de jamón, $x_3$ kilogramos de huevo y $x_4$ piezas de pan es: $$z=10x_1+45x_2+13x_3+0.6x_4.$$

Esta es la función que queremos optimizar. Más concretamente, es la función que debemos minimizar.

Resumen de formulación del problema de la dieta

En resumen, la versión matemática del problema de programación lineal que nos interesa estudiar es la siguiente:

\begin{align*}
Min \quad z &= 10x_1+45x_2+13x_3+0.6x_4\\
s.a.\\
15x_1&+5x_2+8x_3+x_4 \geq 25\\
3x_1&+15x_2+8x_3+4x_4 \geq 20\\
x_i& \geq 0, \quad i=1, \ldots ,4.\\
\end{align*}

Más adelante…

El problema de la dieta es el primer ejemplo de problema de programación lineal que nos encontramos. En las siguientes entradas veremos otros ejemplos más, como el problema de la mochila, el del transporte y otros.

Hasta ahora sólo hemos hablado de qué tipo de problemas queremos resolver, pero no hemos dicho nada con respecto al cómo los resolveremos. Veremos eso un poco más adelante.

Tarea moral

  • ¡Oh no! La inflación llegó y el precio de los alimentos mencionados en la entrada subió en $10\%$. Realiza nuevamente la formulación del problema de la dieta del ejemplo bajo este supuesto.
  • Formula como un PPL el siguiente ejemplo:
    «Se tienen disponibles 4 tipos de inversión cuyos costos son \$12,000, \$20,000, \$16,000, \$15,000 respectivamente. La inversión 1 tiene un valor presente neto de \$14,000, la 2 de \$25,000, la 3 de \$20,000 y la 4 de \$18,000. Se cuenta con un presupuesto de \$50,000. El objetivo es determinar la combinación de inversiones que aporte el valor presente neto máximo.»
  • Imagina que tenemos un problema de la dieta muy sencillo. Sólo se puede adquirir pan y leche. Cuesta \$1 la pieza de pan y \$10 el litro de leche. El pan da 5 unidades de N1 y 1 de N2. La lecha da 3 unidades de N1 y 10 de N2. Imagina que se deben consumir 25 unidades de N1 y 20 unidades de N2. Se quiere encontrar la dieta más económica. Plantea este problema como un problema de programación lineal.
  • Intenta resolver el problema de programación lineal del inciso anterior con las herramientas con las que cuentes hasta ahora de Cálculo, Álgebra Lineal, etc. ¿Cuál sería el menú más económico?
  • ¿Por qué en el problema de la dieta no tiene sentido preguntarse por la dieta menos económica? Intenta argumentarlo desde el punto de vista práctico, como desde el punto de vista matemático.

Entradas relacionadas

Investigación de Operaciones: Introducción a la programación lineal

Por Aldo Romero

Introducción

En esta entrada comenzaremos a abordar el primer tema de este curso de Investigación de Operaciones: el de la programación lineal. Hablaremos un poco de por qué es importante estudiar esta disciplina. Luego, explicaremos un poco en qué consiste. Finalmente, veremos el tipo de problemas que podremos responder una vez que hayamos desarrollado más teoría.

¿Por qué estudiar programación lineal?

El desarrollo de la programación lineal ha sido clasificado como uno de los avances científicos más importantes de mediados del siglo XX. En la actualidad es una herramienta de uso cotidiano que permite efectuar de manera óptima muchas de las operaciones que realizan individuos, gobiernos, compañías y negocios. Esto ha su vez ha permitido el uso eficiente de los recursos y ahorros prácticamente incalculables.

Además de las ventajas que trae usar la programación lineal, también es notable la facilidad con la que hoy en día se aplican sus métodos. El tipo de matemáticas sobre las cuales está construida la programación lineal es en general teoría bien conocida: resultados básicos de álgebra lineal, teoremas importantes de cálculo, teoría de gráficas y redes. Esto se complementa con que en la actualidad es sencillo llevar esta teoría a la práctica, pues existen varios lenguajes de programación para uso científico que cuentan con bibliotecas dedicadas a la programación lineal.

¿Qué es la programación lineal?

La programación lineal es una rama de la programación matemática que estudia problemas de optimización en los cuales se desea maximizar (o minimizar) una función lineal restringida mediante ecuaciones o desigualdades lineales. En este contexto no hablamos de la palabra «programación» en el sentido usual de crear código para diseñar programas en una computadora. Más bien, nos referimos a «programación» más como en el sentido de «la programación de cierto canal de televisión» o bien como en la frase «programé una cita con mi dentista», es decir, como una manera de tomar decisiones para repartir un recurso (el tiempo de aire en el caso de la televisión y el tiempo del doctor y del paciente en el ejemplo del dentista).

Existe una gran variedad de problemas, en diversos campos, que pueden ser formulados o aproximados como modelos lineales. Una de las ventajas de resolver problemas por métodos de programación lineal es que existen técnicas eficientes, sencillas y bien estudiadas para resolverlos. Además, se tiene la comodidad de que una vez que se haya resuelto un problema, es sencillo hacer una variación de los parámetros originales para tener una buena intuición de la nueva respuesta sin tener que volver a hacer un procedimiento largo (a esto se le llama análisis de postoptimalidad).

Aunque una de sus aplicaciones más frecuentes es la asignación de recursos, la programación lineal tiene muchas otras posibilidades. En realidad, cualquier problema cuyo modelo matemático se ajuste al formato general de un problema de programación lineal, puede ser estudiado mediante las herramientas de la teoría.

Formato general de un problema de programación lineal

A un problema de programación lineal y su modelo lo llamaremos programa lineal. Abreviaremos problema de programación lineal como PPL y programa lineal como PL.

Estos problemas tienen que cumplir con las siguientes condiciones:

  • El criterio para seleccionar el mejor valor de las variables desconocidas involucradas en el problema, llamadas variables de decisión, puede describirse como función lineal de éstas. A esta función se le da el nombre de función objetivo.
  • Las reglas de operación que gobiernan el proceso (que definen las alternativas de solución) pueden expresarse mediante un conjunto de ecuaciones o desigualdades lineales a las cuales se les da el nombre de restricciones del problema.

El planteamiento matemático inicial del problema de programación lineal fue desarrollado por George Bernard Dantzig en 1947 junto con el método de solución simplex. El formato general del un modelo de esta clase es:

\begin{align*}
\text{Maximizar (o Minimizar)}&\\
z = c_1x_1+c_2x_2&+\ldots+c_nx_n\\
\text{s.a. (sujeto a)}\\
a_{11}x_1+a_{12}x_2+\ldots+a_{1n}x_n \quad &\leq b_1 \quad \text{(o bien $\geq$ o $=$)}\\ a_{21}x_1+a_{22}x_2+\ldots+a_{2n}x_n \quad &\leq b_2 \quad \text{(o bien $\geq$ o $=$)}\\
&\vdots\\
a_{m1}x_1+a_{m2}x_2+\ldots+a_{mn}x_n \quad &\leq b_m \quad \text{(o bien $\geq$ o $=$)}\\
x_i & \geq 0, i = 1,\ldots,n.
\end{align*}

Este problema de programación lineal PPL puede escribirse en forma matricial:

\begin{align*}
\text{Max. (o Min.)}&\\
z &= c\\
\text{s.a.}\\
Ax \quad &\leq b
\quad \text{(o bien $\geq$ o $=$)}\\
x &\geq 0.
\end{align*}

En esta expresión $c$ es un vector renglón en $\mathbb{R}^n$, llamado vector de costos o de coeficientes en la función objetivo. El vector $x$ es un vector columna (formado por las variables de decisión $x_1,\ldots,x_n$) en $\mathbb{R}^n$. La matriz $A$ es de $m$ renglones y $n$ columnas, llamada la matriz de restricciones. Y finalmente $b$ es un vector columna en $\mathbb{R}^n$, llamado el vector de recursos o lado derecho.

Más adelante…

En esta entrada hablamos un poco de qué es la programación lineal y qué es un PPL, pero nos hemos quedado en términos un poco abstractos. La mejor forma de entender qué es un problema lineal es mediante la presentación de ejemplos. En las siguientes entradas formularemos algunos ejemplos comunes, motivados en aplicaciones prácticas. Hablaremos del problema de la dieta, el problema de la mochila, el problema del transporte, y otros.

Tarea moral

  1. Ve el siguiente video de acerca de George Dantzig. ¿Que te pareció la anécdota de su tiempo de estudiante?
  1. Aún no hemos visto ejemplos de Problemas de Programación Lineal (PPL) pero, ¿crees que es siguiente ejemplo pueda formularse como uno? «Encontrar la ruta más corta entre una ciudad y otra teniendo varias rutas posibles que se cruzan entre sí.»
  2. Investiga un poco más de la historia de la programación lineal. ¿Qué gran evento en el mundo ayudó a que la teoría se desarrollara aceleradamente?

Enlaces