Archivo de la etiqueta: optimización

Investigación de Operaciones: Soluciones básicas, factibles y no degeneradas (10)

Por Aldo Romero

Introducción

Ya hablamos de qué es la forma canónica y la forma estándar de un problema lineal. Como platicamos, esto nos permitirá llevar los problemas que nos interesan a ciertas formas especiales a las que podremos aplicarles algunos métodos más adelante. Lo que haremos ahora es comenzar a pensar en qué quiere decir resolver un problema lineal. Para ello, recordaremos de distintos tipos de soluciones que los problemas lineales pueden tener.

Tipos de soluciones y región de factibilidad

En esta sección recordaremos los conceptos de soluciones factibles, soluciones básicas factibles (degeneradas y no degeneradas) y de región de factibilidad.

Supongamos que tenemos un problema de programación lineal en su forma canónica:

Maxz=cxs.a.Axbx0,

donde usamos la misma notación que en la entrada anterior, pero donde tomaremos l variables de decisión. En particular, x,c son vectores en Rn, b es un vector en Rm y A es una matriz de entradas reales de m×n. Recuerda que en la expresión anterior entendemos 0 como el vector en Rn con entradas todas iguales a cero.

Este problema también tiene una forma estándar, en donde transformamos las desigualdades en igualdades introduciendo variables de sobra y de holgura.
Maxz=cxs.a.Ax=bx0,

en donde en hemos agregado nm variables de holgura al vector x, para obtener un vector x en Rn, así como nm columnas a A para volverla una matriz en de m×n, para agregar los coeficientes de las variables de holgura que hacen que se de la igualdad.

Como recordatorio, tenemos las siguientes definiciones para los tipos de soluciones del problema lineal.

Definición. Una solución factible al problema lineal en forma canónica dado anteriormente es un vector columna x=(x1x2xn) que satisface las restricciones Axb y x0. Esto se corresponde con una solución x al problema en forma estándar que satisface Ax=b y x0.

Definición. La región de factibilidad del problema lineal en forma canónica es el conjunto de todas las soluciones factibles.

De entre las soluciones factibles, hay algunas que son un poco más sencillas, en el sentido de que varias de sus entradas son iguales a cero pensadas como soluciones del problema en forma estándar. En las siguientes definiciones suponemos que el rango de la matriz A es exactamente igual a m.

Definición. Una solución básica factible es una solución factible x correspondiente a una solución x del problema en forma estándar con no más de m componentes positivas. En otras palabras, x tiene al menos nm entradas iguales a cero.

Definición. Una solución básica factible no degenerada es una solución factible x correspondiente a una solución x del problema en forma estándar con exactamente m componentes positivas. En otras palabras, x tiene exactamente nm entradas iguales a cero.

Definición. Una solución básica factible degenerada es una solución factible x correspondiente a uan solución x del problema en forma estándar con menos de m componentes positivas. En otras palabras, x tiene más de nm entradas iguales a cero.

La importancia de las soluciones básicas factibles y no degeneradas es que cumplen las siguientes:

  1. Se puede mostrar que si un problema de programación lineal tiene óptimo, entonces dicho óptimo se alcanza para alguna solución básica factible y no degenerada.
  2. Las soluciones básicas factibles y no degeneradas se pueden encontrar resolviendo sistemas de ecuaciones.
  3. Geométricamente, las soluciones básicas factibles y no degeneradas están en vértices de la región de factibilidad.

A continuación explicaremos algunos de estos puntos con un ejemplo detallado, que te ayudará a entender la intuición detrás de estas definiciones y de su importancia.

Ejemplos de región de factibilidad y tipos de solución

Consideremos el siguiente problema de programación lineal:

Max.z=2x1+3x2s.a.2x1+x24x1+2x25x1,x20.

Antes de comenzar a estudiar la región de factibilidad, debemos verificar que está en forma canónica. En efecto, todo está en orden: el problema es de maximización, las desigualdades son y a las variables de decisión se les pide ser no negativas.

La región de factibilidad es el conjunto de todos los (x1,x2) (en el plano R2) que cumplen las restricciones del problema, es decir, 2x1+x24, x1+2x25, x10 y x20. Para entender esto mejor, lo podemos pensar en cuatro regiones:

Región 1: La región x10, que queda a la derecha del eje y.

Región 2: La región x20, que queda arriba del eje x.

Región 3: La región 2x1+x24, que queda debajo de la recta 2x1+x2=4.

Región 4: La región x1+2x25, que queda por debajo de la recta x1+2x2=5.

Como queremos que (x1,x2) satisfaga todas las restricciones simultáneamente, necesitamos que esté en la intersección de todas las regiones. Así, la región de factibilidad es en la que se intersectan todas estas regiones que acabamos de dibujar. Al sobreponerlas, obtenemos la región encerrada en la siguiente figura:

Si gustas, puedes también explorar el interactivo de GeoGebra en donde se han coloreado los complementos de las regiones para más claridad. Puedes usar el cursor para mover la figura y las herramientas de lupa para hacer acercamientos y alejamientos.

La intuición que debemos tener ahora es que el máximo de la función objetivo 2x1+3x2 se tiene que alcanzar en alguno de los vértices del cuadrilátero que es la región factible. A grandes rasgos, estos vértices serán las soluciones básicas factibles y no degeneradas. Veamos dónde el álgebra nos dice esto.

Para ello, pensemos al problema en su forma estándar, tomando variables de holgura s1 y s2. Las restricciones que tienen las cuatro variables en conjunto son las siguientes.

2x1+x2+s1=4x1+2x2+s2=5x1,x2,s1,s20.

La matriz A es (21101201), que puedes verificar que tiene rango 2. Las soluciones básicas y no degeneradas corresponden a tener en ese sistema de ecuaciones exactamente m=2 variables positivas, de manera que necesitamos hacer exactamente nm=42=2 de estas variables iguales a cero. Al hacer esto, podemos resolver para las m=2 variables restantes. Por ejemplo, si establecemos x1=0 y x2=0, las ecuaciones se convierten en

s1=4s2=5x1,x2,s1,s20,

que tiene solución única (x1,x2,s1,s2)=(0,0,4,5). Así, la solución básica del problema en forma canónica es (x1,x2)=(0,0). Hay que recordar dar la solución básica ya sólo para las variables originales, es decir, las del problema en forma canónica.

Esta solución corresponde al punto C del interactivo de GeoGebra. Se puede determinar otra solución básica fijando s1=0 y s2=0, donde el sistema sería ahora

2x1+x2=4x1+2x2=5x1,x2,s1,s20,

y tras resolver las dos ecuaciones, la solución básica que se obtiene es (x1,x2)=(1,2), que es el punto A del interactivo de GeoGebra.

Podemos seguir haciendo esto. Si consideramos todas las posibilidades en las que dos variables son cero y resolvemos las ecuaciones resultantes, eso nos dará puntos (x1,x2) en el plano. La solución óptima es la solución básica factible (punto de esquina) con el mejor valor objetivo.

En este ejemplo tenemos (42)=4!2!2!=6 formas de volver dos de las n variables iguales a cero. Ya para las variables x1 y x2, los puntos que obtenemos son los puntos A, B, C, D que son vértices de la región de factibilidad. Los puntos E y F del interactivo también son puntos básicos y no degenerados (son las otras dos intersecciones de las rectas que dibujamos), pero como no satisfacen la condición de factibilidad del problema, entonces no los podemos considerar y por lo tanto no son candidatos a dar el valor óptimo.

La siguiente tabla muestra todas las soluciones básicas y no básicas de este ejemplo:

Variables no básicas (cero)Variables básicasSolución para (x1,x2)Punto de esquina asociado¿Factible?Valor objetivo z
(x1,s1)(s1,s2)(0,0)C0
(x1,s1)(x2,s2)(0,4)ENo___
(x1,s2)(x2,s1)(0,2.5)D7.5
(x2,s1)(x1,s2)(2,0)B4
(x2,s2)(x1,s1)(5,0)FNo___
(s1,s2)(x1,x2)(1,2)A8 (óptimo)

Más adelante…

Notemos que a medida que el tamaño del problema se incrementa, enumerar todos los puntos esquina se volverá una tarea que tomaría mucho tiempo. Por ejemplo, si tuviéramos 20 variables (ya con las de holgura) y 10 restricciones, es necesario resolver considerar (2010)=184756 formas de crear ecuaciones de 10×10, y resolver cada una de ellas. Aunque esto es finito, son demasiadas operaciones. Y este en la práctica incluso es un ejemplo pequeño, ya que en la vida real hay problemas lineales que pueden incluir miles de variables y restricciones.

Por ello, se vuelve cruciar encontrar un método que atenúe esta carga computacional en forma drástica, que permita investigar sólo un subconjunto de todas las posibles soluciones factibles básicas no degeneradas (vértices de la región de factibilidad), pero que garantice encontrar el óptimo. Una idea intuitiva que debería servir es comenzar en un vértice y «avanzar en una dirección que mejore la función objetivo». Esto precisamente es la intuición detrás del método simplex, que repasaremos a continuación.

Tarea moral

  1. Considera el siguiente problema lineal en su forma canónica:

Maxz=2x1+3x2s.a.x1+3x263x1+2x26x1,x20.

Sigue los pasos descritos arriba para encontrar todas sus soluciones básicas factibles y no degeneradas. Usa ello para encontrar el óptimo del problema.

  1. Actualiza las restricciones en el interactivo de GeoGebra que se compartió en la entrada para visualizar este problema y confirmar tus cuentas del ejercicio anterior. Para ello, deberás ir al apartado «Álgebra» del interactivo y modificar los objetos a y b.
  2. Considera un problema de optimización lineal en dos variables x y y, en forma canónica y con m restricciones (desigualdades), además de las restricciones x0 y y0. Explica por qué la región de factibilidad siempre es un polígono con a lo más m+2 lados, y por qué entonces basta evaluar la función objetivo en a lo más m+2 puntos para encontrar su máximo.
  3. ¿Cómo se vería la región de factibilidad de un problema de optimización lineal de maximización que no tenga máximo? Explica todas las posibilidades y da ejemplos.
  4. Intenta usar las ideas de esta entrada para resolver los problemas de optimización lineal clásicos que hemos descrito en entradas anteriores.

Entradas relacionadas

Cálculo Diferencial e Integral III: Multiplicadores de Lagrange

Por Alejandro Antonio Estrada Franco

Introducción

En la entrada anterior buscábamos optimizar un campo escalar f. Retomaremos este problema, pero ahora agregando restricciones al dominio de f. Para ello hablaremos del método de los multiplicadores de Lagrange, el cual nos permitirá dar una solución bajo ciertas condiciones de diferenciabilidad.

Esto en general es lo mejor que podremos hacer. En realidad, los problemas de este estilo son muy difíciles y no tienen una solución absoluta. Si no tenemos las condiciones del teorema de Lagrange, es posible que se tengan que hacer cosas mucho más compliadas para obtener óptimos exactos, o bien que se tengan que hacer aproximaciones numéricas.

En la demostración del teorema de los multiplicadores de Lagrange usaremos el teorema de la función implícita, lo cual es evidencia adicional de lo importante y versátil que es este resultado.

Un ejemplo para motivar la teoría

Imagina que tenemos la función f(x,y)=x2+y2 y queremos encontrar su mínimo. Esto es muy fácil. El mínimo se da cuando x=y=0, pues en cualquier otro valor tenemos un número positivo. Pero, ¿Qué pasaría si además queremos que los pares (x,y) que usamos satisfagan también otra condición?, por ejemplo, que cumplan 2x2+3y2=10

En este caso, la respuesta ya no es obvia. Podríamos intentar encontrar el mínimo por inspección, pero suena que será difícil. Podríamos intentar usar la teoría de la entrada anterior, pero esa teoría no nos dice nada de qué hacer con nuestra condición.

La teoría que desarrollaremos a continuación nos permitirá respondernos preguntas de este estilo. En este ejemplo en concreto, puedes pensar que la solución se obtendrá de la siguiente manera: La ecuación 2x2+3y2=10 nos dibuja una elipse en el plano, como se ve en la figura 1 imagen 3. Las curvas de nivel de la superficie dibujada por la gráfica de la función f corresponden a circunferencias concéntricas, cuyo centro es el origen. Al ir tomando circunferencias cada vez mas grandes en el plano comenzando con el punto (0,0) nos quedaremos con la primera que toque a la elipse, de hecho la tocará en dos puntos, digamos (x1,y1) y (x2,y2), donde f(x1,y1)=f(x2,y2) sería el mínimo buscado, es decir el mínimo que sobre la superficie f(x,y) cumple con la ecuación 2x2+3y2=10.

Pero como ahí se da una tangencia, entonces suena que justo en ese punto (x,y) hay una recta simultáneamente tangente a la curva de nivel y a la elipse. Esto nos da una relación entre gradientes. El teorema de multiplicadores de Lagrange detecta y enuncia esta relación entre gradientes con precisión y formalidad, incluso cuando tenemos más de una condición. A estas condiciones también las llamamos restricciones, y están dadas por ecuaciones.

Enunciado del teorema de multiplicadores de Lagrange

A continuación enunciamos el teorema.

Teorema (multiplicadores de Lagrange). Sea f:SRnR es un campo escalar de clase C1. Para m<n, tomamos g1,,gm:S∈⊂RnR campos escalares de clase C1 en S. Consideremos el conjunto S donde todos los gi se anulan, es decir:

S={x¯S|g1(x¯)=g2(x¯)==gm(x¯)=0}.

Tomemos un x¯0 en S para el cual

  1. f tiene un extremo local en x¯0 para los puntos de S y
  2. g1(x¯0),,gm(x¯0) son linealmente independientes.

Entonces existen λ1,,λmR, a los que llamamos multiplicadores de Lagrange tales que:

f(x¯0)=λ1g1(x¯0)++λmgm(x¯0).

Si lo meditas un poco, al tomar m=1 obtenemos una situación como la del ejemplo motivador. En este caso, la conclusión es que f(x¯0)=λg(x¯0), que justo nos dice que en x¯0, las gráficas de los campos escalares f y g tienen una tangente en común.

Demostración del teorema de multiplicadores de Lagrange

Demostración. La demostración del teorema de multiplicadores de Lagrange usa varios argumentos de álgebra lineal. Esto tiene sentido, pues a final de cuentas, lo que queremos hacer es poner un gradiente (f(x¯0)) como combinación lineal de otros gradientes (g1(x¯0),,gm(x¯0)). A grandes rasgos, lo que haremos es:

  • Definir un espacio W.
  • Mostrar que g1(x¯0),,gm(x¯0) generan al espacio ortogonal W.
  • Mostrar que f(x¯0) es ortogonal a todo vector de W, por lo cual estará en W y así por el inciso anterior será combinación lineal de g1(x¯0),,gm(x¯0).

Para construir el espacio W del que hablamos, usaremos el teorema de la función implícita y la regla de la cadena. Empecemos este argumento. Consideremos la siguiente matriz:

(1)(g1x1(x¯0)g1xm(x¯0)g1xm+1(x¯0)g1xn(x¯0)gmx1(x¯0)gmxm(x¯0)gmxm+1(x¯0)g1xn(x¯0)).

Dado que los vectores g1(x¯0),,gm(x¯0) son linealmente independientes, el rango por renglones de esta matriz es m, de modo que su rango por columnas también es m (tarea moral). Sin perder generalidad (quizás tras hacer una permutación de columnas, que permuta las entradas), tenemos que las primeras m columnas son linealmente independientes. Así, la matriz

(g1x1(x¯0)g1xm(x¯0)gmx1(x¯0)gmxm(x¯0))

es invertible. Hagamos l=nm y reetiquetemos las variables coordenadas x1,,xm como v1,,vm, y las variables coordenadas xm+1,,xn como u1,,ul. Escribiremos x¯0=(v¯0,u¯0) para referirnos al punto al que hacen referencia las hipótesis. Esto nos permite pensar Rn=Rm×Rl y nos deja en el contexto del teorema de la función implícita. Como la matriz anterior es invertible, existen URl y VRm para los cuales u¯0U, v¯0V y hay una única función h=(h1,,hm):UV de clase C1 tal que para u¯U y v¯V se cumple que g(v¯,u¯)=0 si y sólo si v¯=h(u¯).

Definamos ahora la función H:URlRm×Rl como H(u¯)=(h(u¯),u¯), la cual es de clase C1 en U.

Por cómo construimos h, sucede que (h(u¯),u¯)S para toda u¯U. Por definición, esto quiere decir que para toda i=1,,m tenemos que (giH)(u¯)=0 para toda u¯U. Esto quiere decir que giH es una función constante y por lo tanto su derivada en u¯0 es la transformación 0. Pero otra forma de obtener la derivada es mediante la regla de la cadena como sigue:

D(giH)(u¯0)=Dgi(H(u¯0))DH(u¯0)=Dgi(v¯0,u¯0)DH(u¯0).

En términos matriciales, tenemos entonces que el siguiente producto matricial es igual al vector (0,,0) de l entradas (evitamos poner (v¯0,u¯0) para simplificar la notación):

(2)(giv1givmgiu1giul)(h1u1h1ulhmu1hmul1001),

para cada i=1,,m. Nos gustaría escribir esta conclusión de manera un poco más sencilla, para lo cual introducimos los siguientes vectores para cada j=1,,l:

w¯j=((h1uj(u¯0),,hmuj(u¯0)),e^j).

Cada uno de estos lo pensamos como vector en Rm×Rl. Además, son l vectores linealmente independientes, pues sus entradas e^j son linealmente independientes. El espacio vectorial W que generan es entonces un subespacio de Rm×Rl, con dim(W)=l.

De la ecuación (2) tenemos que gi(v¯0,u¯0)w¯j=0 para todo i=1,,m, y j=1,,l. Se sigue que gi(v¯0,u¯0)W, donde W es el complemento ortogonal de W en Rm×Rl. Pero además, por propiedades de espacios ortogonales tenemos que

dim(W)=dim(Rm×Rl)dim(W)=m+ll=m.

Así dim(W)=m, además el conjunto {gi(v¯0,u¯0)}i=1m es linealmente independiente con m elementos, por tanto este conjunto es una base para W. Nuestra demostración estará terminada si logramos demostrar que f(v¯0,u¯0) también está en W, es decir, que es ortogonal a todo elemento de W.

Pensemos qué pasa al componer f con H en el punto u¯0. Afirmamos que u¯0 es un extremo local de fH. En efecto, (fH)(u¯0)=f(g(u¯0),u¯0)=(v¯0,u¯0). Si, por ejemplo (v¯0,u¯0) diera un máximo, entonces los valores f(v¯,u¯) para (v¯,u¯) dentro de cierta bola Bδ(v¯0,u¯0) serían menores a f(v¯0,u¯0). Pero entonces los valores cercanos u¯ a u¯0 cumplen (fH)(u¯)=f(h(u¯),u¯), con (u¯,h(u¯)) en S y por lo tanto menor a f(v¯0,u¯0) (para mínimos es análogo).

Resumiendo lo anterior, u¯0 es extremo local de fH. Aplicando lo que aprendimos en la entrada anterior, la derivada de fH debe anularse en u¯0. Pero por regla de la cadena, dicha derivada es

(fH)(u¯0)=D(fH)(u¯0)=Df(H(u¯0))DH(u¯0)=Df(h(u¯0),u¯0)DH(u¯0)=Df(v¯0,u¯0)DH(u¯0)

Viéndolo como multiplicación de matrices, el siguiente producto es el vector (0,0,,0) de l entradas:

(fv1fvmfu1ful)(h1u1h1ulhmu1hmul1001)=0

De donde concluimos f(v¯0,u¯0)w¯j=0 para cada j=1,l. Esto precisamente nos dice que f(v¯0,u¯0)W. Esto es justo lo que queríamos, pues habíamos demostrado que {gi(v¯0,u¯0)}i=1m es una base de W. Por ello podemos expresar a f(v¯0,u¯0) como combinación lineal de esta base, es decir, existen λ1,,λm escalares tales que:

f(v¯0,u¯0)=λ1g1(v¯0,u¯0)++λmgm(v¯0,u¯0).

◻

¡Qué bonita demostración! Usamos el teorema de la función implícita, la regla de la cadena (dos veces), nuestros resultados para valores extremos de la entrada anterior, y un análisis cuidadoso de ciertos espacios vectoriales.

Ejemplos del método de multiplicadores de Lagrange

Veamos algunos problemas que podemos resolver con esta nueva herramienta.

Ejemplo. Determinaremos los puntos extremos de f(x,y)=x+2y bajo la condición x2+y2=5. Para poner todo en términos de nuestro teorema, definimos g(x,y)=x2+y25. Por el teorema de multiplicadores de Lagrange, en los puntos extremos debe existir una λ tal que f(x,y)=λg(x,y). Calculando las parciales correspondientes, debemos tener entonces

(1,2)=λ(2x,2y).

Adicionalmente, recordemos que se debe satisfaces g(x,y)=0. Llegamos entonces al sistema de ecuaciones

{12xλ=022yλ=0x2+y25=0

Al despejar x y y en ambas ecuaciones tenemos:

x=12λy=1λx2+y25=0.

Poniendo los valores de x y y en la tercera ecuación, llegamos a (12λ)2+(1λ)25=0, de donde al resolver tenemos las soluciones λ1=12 y λ2=12.

Al sustituir en las ecuaciones de nuestro sistema, obtenemos como puntos críticos a (x,y)=(1,2) y (x,y)=(1,2).

Si intentamos calcular el hessiano de f, esto no nos dirá nada (no tendremos eigenvalores sólo positivos, ni sólo negativos). Pero esto ignora las restricciones que nos dieron. Podemos hacer una figura para entender si estos puntos son máximos o mínimos. En la Figura 1 tenemos la gráfica de f, intersectada con la superfice dada por g. Nos damos cuenta que hay un punto máximo y uno mínimo. Al evaluar, obtenemos f(1,2)=5 y f(1,2)=5. Esto nos dice que el máximo en la superficie se alcanza en (1,2) y el mínimo en (1,2).

Figura 2: Ilustración del Ejemplo 1 la función g(x,y)=x2+y25 esta dibujada en azul esta impone restricción a la función f que dibuja un plano en el espacio.

Ejemplo. Veamos cómo minimizar la expresión f(x,y,z)=x2+y2+z2 sujetos a la condición x+y+z=1. Una vez más, proponemos g(x,y,z)=x+y+z1 para tener la situación del teorema de multiplicadores de Lagrange. Debe pasar que λ f(x,y,z)=λg(x,y,z). El gradiente de g(x,y,z) es de puros ceros unos, así que tenemos el sistema de ecuaciones:

{2x=λ2y=λ2z=λx+y+z1=0

De las primeras tres ecuaciones tenemos 2x=2y=2z de donde x=y=z. Sustituyendo en la tercera ecuación, 3x1=0, es decir x=y=z=13. Ya que sólo tenemos una solución, ésta es el mínimo del conjunto de soluciones. En la figura 3 tenemos la ilustración de la solución de este problema, la esfera centrada en el origen de radio 13 toca al plano x+y+z=1 en el punto (13,13,13)

Figura 3: En azul claro el plano x+y+z=1, inflamos esferas centradas en el origen; desde la de radio cero vamos aumentando el radio hasta tener el radio correspondiente para el cual la esfera toque tangentemente al plano.

Más adelante…

Con esta entrada cerramos el curso de Cálculo Diferencial e Integral III. ¡¡Felicidades!! Esperamos que todas estas notas te hayan sido de ayuda para estudiar, repasar o impartir la materia. Quedamos al pendiente de cualquier duda, observación o sugerencia en la sección de comentarios de las entradas.

Tarea moral

  1. Determina los extremos de la función f(x,y)=xy+14 bajo la restricción x2+y2=18
  2. El plano x+y+2z=2 interseca al paraboloide z=x2+y2 en una elipse E. Determina el punto de la elipse con el valor mayor en el eje z, y el punto con el valor mínimo en el mismo eje. Sugerencia: f(x,y,z)=x+y+2z2, y g(x,y,z)=x2+y2z
  3. Determinar el máximo valor de f(x,y,z)=x2+36xy4y218x+8y bajo la restricción 3x+4y=32
  4. Determinar los puntos extremos de la función f(x,y,z)=x2+y2+z2 bajo la restricción xyz=4
  5. Demuestra que en una matriz M su rango por columnas es igual a su rango por renglones. Sugerencia. Usa el teorema de reducción gaussiana. También, puedes revisar la entrada que tenemos sobre rango de matrices.

Entradas relacionadas

Investigación de Operaciones: Forma canónica y forma estándar de un problema lineal (9)

Por Aldo Romero

Introducción

En las entradas anteriores hemos dado ejemplos de varios problemas de aplicación que pueden ser planteados mediante un problema de programación lineal. Una vez que llegamos a un modelo, se pueden tener restricciones de los tipos , = y . Además, puede haber restricciones de signo sobre las variables. Puede que se les pida ser no positivas, no negativas o irrestrictas (no restringidas) en signo. Lo que haremos ahora es ver cómo podemos llegar a un cierto formato (forma estándar o forma canónica).

Forma canónica de un problema lineal

A continuación introducimos el primer formato que nos facilitará el trabajo.

Definición. Se dice que un problema de programación lineal está en forma canónica si cumple simultáneamente las siguientes tres propiedades:

  1. El problema es de maximización.
  2. Las restricciones del problema son todas del tipo (menor o igual).
  3. Las variables de decisión son no negativas.

Así, tenemos entonces que un problema en forma canónica se ve como sigue:

Maxz=c1x1++cnxns.a.a11x1+a12x2++a1nxnb1a21x1+a22x2++a2nxnb2am1x1+am2x2++amnxnbnx10,x20,,xn0.

En términos matriciales, esto podemos reescribirlo de manera mucho más compacta como sigue:

Maxz=cxs.a.Axbx0,

en donde:

  • c=(c1,,cn)Rn es el vector de costos (vector renglón)
  • x=(x1,,xn)Rn es el vector de variables de decisión (vector columna),
  • A=[aij] es la matriz de restricciones, que es una matriz de m×n y
  • b=(b1,,bm)Rm es el vector de constantes que acotan las combinaciones lineales de variables.
  • Entendemos 0 como el vector en Rn que consiste de puras entradas iguales a cero.

Todo problema de programación lineal puede ser expresado en forma canónica; es decir, puede definirse un problema en forma canónica equivalente a él, en el sentido de que la solución de uno nos permite encontrar la solución del otro de manera sencilla. En efecto:

  • Si el problema es de minimización, puede considerarse en vez de z la función z=z y en el problema equivalente se busca maximizar z.
  • Si una restricción es del tipo puede ser mutiplicada por -1 para obtener una del tipo .
  • Una ecuación puede ser substituida por una desigualdad del tipo y otra del tipo . Luego, la del tipo puede ser substituida por una del tipo como en el punto anterior.
  • Para una variable xi0 puede definirse xi=xi, resultando xi0. Claramente hay una biyección entre elegir el valor de xi y xi.
  • Para una xi no restringida pueden ser definidas dos variables no negativas xi y xi tales que xixi=xi. Para cualquier xi dado podemos construir dichas variables, y viceversa, para xi y xi se puede construir xi.

Ejemplo de pasar un problema a forma canónica

Transformaremos el siguiente problema a su forma canónica.
Minz=x13x2+7x3s.a.3x1+x2+3x340x1+9x27x3505x1+3x2=205x2+8x380x1,x20,x3libre.

Primeramente se definen las variables no negativas x3 y x3, tales que x3x3=x3, con objeto de satisfacer el punto (3) de la definición. Para satisfacer el punto (1) se considera la función:
z=z=x1+3x27x3=x1+3x27x3+7x3

y se busca maximiza ésta (equivalente a minimizar z). Finalmente se realizan cambios en las restricciones para satisfacer el punto (2). La primera y cuarta desigualdad cumplen con la definición por lo que no se modifican (más allá de la sustitución de x3 por x3x3); la segunda desigualdad se multiplica por 1 para obtener una del tipo : x1+9x27x350x19x2+7x350.

Substituyendo las nuevas variables se obtiene: x19x2+7x37x350.

Para la tercera desigualdad se tiene lo siguiente:

5x1+3x2=205x1+3x220y5x1+3x2205x1+3x220y5x13x220.

Finalmente el problema queda expresado en forma canónica como:

Maxz=x1+3x27x3+7x3s.a.3x1+x2+3x33x340x19x2+7x37x3505x1+3x2205x13x2205x2+8x38x380x1,x2,x3,x30.

Forma estándar de un problema lineal

Definición. Se dice que un problema de programación lineal está en forma estándar si

  1. Todas las restricciones son ecuaciones.
  2. Todas las variables son no negativas.
  3. La función objetivo puede pedirse que se optimice maximizándola, o minimizándola.

De esta manera, un problema en forma estándar se ve como sigue:

Max(Min)z=c1x1++cnxns.a.a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bnx10,x20,,xn0.

En notación matricial, el problema en forma canónica queda expresado de la siguiente manera:

Max(Min)z=cxs.a.Ax=bx0

en donde c,x,A y b0 son como se mencionó antes.

Así como cualquier problema de programación lineal puede ser expresado en forma canónica, también cualquier problema de programación lineal puede expresarse en forma estándar. Una restricción del tipo () puede ser transformada en una ecuación sumando (o restando) una variable no negativa que recibe el nombre de variable de holgura (o variable de sobra).

Ejemplo de pasar un problema a forma estándar

Retomemos el problema ejemplo anterior, antes de expresarlo en forma canónica.

Minz=x13x2+7x3s.a.3x1+x2+3x340x1+9x27x3505x1+3x2=205x2+8x380x1,x20,x3libre.

Vamos a expresarlo ahora en forma estándar. Como lo hicimos anteriormente, hacemos la sustitución x=x3x3 para que la variable libre se convierta en dos con restricciones de ser no negativas.

Para satisfacer (1) se introducen las variables de holgura, x4, x5 y x6 que pediremos que sean no negativas. A la primera desigualdad le sumamos x4. A la quinta le sumamos x6. Y finalmente, a la segunda le restamos x5. Esto transforma las desigualdades en igualdades. De esta manera, el problema queda expresado de la siguiente manera:

Minz=x13x2+7x37x3s.a.3x1+x2+3x33x3+x4=40x1+9x27x3+7x3x5=505x1+3x2=205x2+8x38x3+x6=80x1,x2,x3,x3,x4,x5,x60.

Más adelante…

Las formas que estudiamos en esta entrada nos ayudarán posteriormente para plantear soluciones para problemas de programación lineal.

Mientras tanto, en la siguiente entrada hablaremos de algunos otros conceptos relativos a la teoría de problemas lineales y posibles propiedades que puede tener una asignación de variables. Diremos qué es una solución básica, una solución factible y un punto extremo para un problema lineal.

Tarea moral

  1. ¿Cuál sería la forma estándar del problema de maximizar x+y sujeto a xy8 y y0? ¿Y su forma canónica?
  2. Transforma el siguiente problema de programación lineal a su forma canónica y a su forma estándar:
    Maxz=2x1+3x22x3s.a.4x1x25x3=102x1+3x2+2x312x10,x2,x3irrestrictas.
  3. Revisa nuevamente las entradas anteriores y encuentra las formas canónicas y formas estándar de los problemas que hemos planteado hasta ahora.
  4. La forma estándar (o bien la forma canónica) de un programa lineal «es equivalente» al problema original. Justifica esta afirmación formalmente. Es decir, explica por qué una solución x1,,xn que optimiza el problema original está asociada a una solución de su forma estándar (o canónica) y viceversa.
  5. Imagina que tenemos un sistema de ecuaciones de la forma Ax=B con A matriz en Mm,n(R) y b vector en Rm. Queremos encontrar de todas las posibles soluciones al sistema aquella que minimiza la suma de las entradas de x. Plantea esto como un problema lineal y transfórmalo a su forma canónica y a su forma estándar.

Entradas relacionadas

Investigación de Operaciones: El problema de producción e inventario (7)

Por Aldo Romero

Introducción

Ya hemos visto algunos ejemplos en los que se plantea un problema de programación lineal a partir de un contexto específico. Hemos visto el problema de la dieta, el problema de la mochila y el problema del transporte. Hay algunos problemas que parecen un poco más complicados y que no es tan evidente desde el inicio que se pueden plantear como problemas de programación lineal. En esta ocasión veremos uno de ellos: el problema de producción e inventario.

Abundan las aplicaciones de la programación lineal para planificar la producción y para controlar inventarios. El siguiente es solo una de múltiples aplicaciones que se les puede dar a este tipo de problemas.

A grandes rasgos, el problema consiste en modelar una fábrica que necesita tener lista cierta cantidad de inventario de un producto en determinados momentos del año. La fábrica puede producir cierta cantidad de producto que depende de la temporada del año. Quizás haya temporadas en las que puede producir más de lo que necesita, pero si hace eso incurrirá en costos de almacenaje. ¿Cómo puede distribuir su producción, almacenaje y despacho la fábrica para minimizar el costo y cumplir con su compromiso de inventario? Veamos a continuación que esta situación se puede plantear en términos de un problema de programación lineal.

Ejemplo del problema de producción e inventario

Una empresa productora de videojuegos indie acaba de finalizar su último gran lanzamiento y está lista para producirlo en masa en su formato físico. La siguiente tabla indica la demanda de los primeros 3 meses de lanzamiento.

Meses transcurridos a
partir del lanzamiento
012
Demanda en miles de copias
del mes en curso
806040
Productividad disponible del
mes en curso
1105030

Como el primer mes de lanzamiento es el más importante, la empresa decide que se pueden producir hasta 110 mil copias ese mes, y gradualmente va a reducir su productividad a 50 mil copias el segundo mes y 30 mil el tercer mes; esto con la finalidad de enfocar más tiempo y recursos en otras producciones.

La empresa productora y las tiendas donde se venden tiene un contrato que establece en particular dos cosas:

  • Las tiendas tienen que tener en stock la cantidad de copias demandas cada mes, y esta cantidad de copias será las que la empresa productora entregó este mes junto con las que sobraron el mes pasado
    • Si se entregan más copias que las demandadas por la tienda, se cobrará un costo de almacenamiento de $2000 al mes por cada mil copias que están siendo almacenadas en tienda fuera de la demanda establecida.

El costo de producción de cada mil copias es de $20000. Se desea determinar el plan de producción e inventario que satisfaga el contrato con estas tiendas a fin de minimizar los costos.

Variables de decisión

De manera intuitiva, vamos a hacer nuestras variables de decisión las miles de copias que se van a producir el mes en curso desde el lanzamiento del juego.

xi = miles de copias a producir en el mes i desde el lanzamiento del juego. (i{1,2,3}).

Función objetivo

Como se mencionó, el plan de producción tiene que minimizar los costos para la empresa, tanto los gastos de producción de sus videojuegos como el almacenamiento de estos.

El costo de producción es simplemente el número de copias producidas por cada mes, multiplicado por el costo de fabricación de cada copia ($20). Esto es: 20(x1+x2+x3).

Y luego consideramos el costo de almacenamiento de las copias que no fueron demandadas por la empresa en ese mes. Entonces, para el primer mes, x180 son las miles de copias que la empresa tiene que cubrir en gastos de almacenamiento. Para el segundo mes, las copias demandadas al momento son las acumuladas del primer y segundo mes (140000) y los juegos producidos son solamente x1+x2. Entonces, los miles de juegos por los que hay que cubrir el costo de almacenamiento son x1+x2140. Y para el tercer mes, las copias demandadas son las acumuladas de los primeros 3 meses (180000) y los juegos producidos serán x1+x2+x3 en miles de copias, y así, los costos de almacenamiento para el tercer mes serán x1+x2+x3180.

Entonces, el número de miles de copias por las que hay que cubrir costos de almacenamiento para estos 3 meses será: (x180)+(x1+x2140)+(x1+x2+x3180). Y esta cantidad la multiplicamos por el costo de almacenamiento mensual por millar de copias ($2000).

Entonces, juntando las expresiones, el costo total que hay que minimizar sería:

Minz=20000(x1+x2+x3)+2000[(x180)+(x1+x2140)+(x1+x2+x3180)]

O si lo queremos poner de la forma más resumida posible, esto es:

Minz=26000x1+24000x2+22000x3800000

Restricciones del problema de producción e inventario

Primero, vayamos con las restricciones de oferta:

x1110x250x330

Después, vayamos con las restricciones de demanda:

x180x2+(x180)60x3+(x1+x2140)40

Recordemos que la razón de la última restricción es para que la empresa productora no se quede ninguna copia más de las demandadas para que no haya cuota por almacenamiento en las tiendas para el cuarto mes.

Y naturalmente nuestras variables de decisión son no negativas ya que hablamos de la cantidad de unidades que tenemos de un producto.

Resumen de formulación del problema de producción e inventario

En resumen, nuestro problema de programación lineal quedaría planteado así:

Minz=20000(x1+x2+x3)+2000[(x180)+(x1+x2140)+(x1+x2+x3180)]s.ax1110x250x330x180x2+(x180)60x3+(x1+x2140)40xi0,i{1,2,3}

Más adelante…

La siguiente entrada muestra nuestro último ejemplo introductorio: el problema de la ruta más corta. Como veremos, en este problema también es necesario aprovechar la situación del problema de manera creativa para poder llevarlo a un contexto lineal.

Tarea

  1. El problema se vuelve mucho más sencillo si únicamente hay dos periodos. Plantea un problema que refleje esta situación en el caso particular de la entrada y resuélvelo. Es decir, determina en esos dos periodos (el primer y segundo mes) cuál es la cantidad correcta de unidades a producir por mes, para minimizar el costo total.
  2. Cambia el planteamiento dado en la entrada por uno en el que el costo de almacenaje en las tiendas sea de $0. En ese caso, ¿cuál sería el plan de producción e inventario óptimo?
  3. En esta entrada dimos la formulación de un caso particular del problema de producción e inventario. Sin embargo, ya tienes todas las herramientas para plantear el problema de manera general. Realiza una formulación general en la que:
    1. Se tengan n periodos con demanda de unidadesd1,d2,,dn por cada periodo.
    2. Se tengan capacidades de producción o1,o2,,on unidades en cada periodo.
    3. Se tengan costos P y A, de producir y almacenar una unidad de producto respectivamente.
  4. En un problema general de producción e inventario. ¿Por qué podría ser mala idea producir mucho más de lo necesario en las temporadas en las que se puede? Intenta justificar intuitivamente, y luego encuentra algunos casos particulares del problema que apoyen tus argumentos.

Entradas relacionadas

Investigación de Operaciones: El problema del transporte (6)

Por Aldo Romero

Introducción

En esta entrada abordaremos otro de los problemas conocidos que se pueden plantear en términos de programación lineal: el problema del transporte. A grandes rasgos, el problema del transporte habla de cómo surtir a diferentes destinos de un cierto producto que parte de diferentes orígenes con disponibilidad limitada.

Siendo un poco más concretos, cada origen tiene una cierta cantidad de unidades de producto. Cada destino requiere de una cierta cantidad de unidades de producto. Además, para cada pareja origen-destino se tiene un costo de transporte unitario. El objetivo es determinar cuál es la manera más económica de cumplir con todos los requisitos de oferta y demanda.

Ejemplo del problema del transporte

Supongamos que una compañía que produce electrónicos tiene tres almacenes A, B y C. La cantidad de computadoras portátiles disponibles en cada uno de los almacenes se encuentra registrada en la siguiente tabla.

OrigenABC
Oferta en unidades200350470

Pensemos que hay dos tiendas de electrónicos X y Y que desean vender computadoras portátiles de dicha compañía. La cantidad de computadoras portátiles que necesita cada tienda está dada en la siguiente tabla.

DestinoXY
Demanda en
unidades
300500

Además de esto sabemos que transportar cada una de las computadoras portátiles tiene un costo que depende del almacén origen y de la tienda destino. El costo unitario de transporte está dado por la siguiente tabla.

ABC
X354042
Y443745

Así, por ejemplo, transportar una computadora portátil del almacén B a la tienda Y tiene un costo de $37.

Queremos determinar cuántas computadoras portátiles se tienen que enviar de cada origen a cada destino de manera que no se exceda la cantidad disponible en cada origen, a cada tienda llegue la cantidad de computadoras que se deben enviar y se minimice el costo total de envío.

Variables de decisión

Lo que tenemos que decidir en nuestro problema es cuántas computadoras portátiles se envían de cada origen a cada destino. Por ejemplo, debemos decidir cuánto vale una variable xAX que nos dice cuántas computadoras portátiles enviar del almacén A a la tienda X. Así, las variables se definen de la siguiente manera:

xij = número de computadoras a transportar del almacén i al destino j. i{A,B,C},j{X,Y}.

En este ejemplo en concreto, la cantidad de unidades debe ser un número entero (no podemos enviar 1/2 de computadora portátil de un almacén a una tienda).

Función objetivo

Debemos de establecer cuál es la función objetivo que queremos optimizar. Notemos que el costo total que involucrarán las computadoras portátiles enviadas del almacén A a la tienda X es 35xAX, pues de acuerdo a la tabla de costos de transporte, hay un costo de $35 para enviar cada computadora portátil. Todas las computadoras que salgan del almacén A tendrán entonces un costo de 35xAX+44xAY. Si calculamos de manera similar el costo de las computadoras que se salen de los almacenes B y C obtenemos el total. Entonces la función objetivo será la siguiente expresión:

Minz=35xAX+44xAY+40xBX+37xBY+42xCX+45xCY.

Restricciones

Hay dos tipos de restricciones que debemos cuidar:

  • Que ninguno de los almacenes exceda la cantidad de computadoras portátiles que tiene disponible.
  • Que cada tienda reciba el número de computadoras portátiles que requiere.

En el caso de la primera restricción, lo que estamos haciendo es limitar a las sumas que involucren a un mismo almacén. Por ejemplo, para no exceder las 200 unidades que se tienen disponibles en el almacén A, se debe cumplir que xAX+xAY200. De manera similar, con el almacén B obtenemos que xBX+xBY350 y con el almacén C obtenemos que xCX+xCY470.

En el caso de la segunda restricción, ahora la desigualdad es opuesta: es una condición que requiere que las computadoras portátiles que lleguen a cada tienda sean al menos un valor dado. Entonces, para la tienda X se tiene que cumplir xAX+xBX+xCX300 y para la tienda Y se tiene que cumplir xAY+xBY+xCY500.

Entonces, juntando todas las restricciones, tenemos:

xAX+xAY200xBX+xBY350xCX+xCY470xAX+xBX+xCX300xAY+xBY+xCY500xijN,i{A,B,C},j{X,Y}

Resumen de formulación del problema del transporte

En resumen, el ejemplo de problema de transporte queda resumido en el siguiente PPL.

Minz=35xAX+44xAY+40xBX+37xBY+42xCX+45xCYs.a.xAX+xAY200xBX+xBY350xCX+xCY470xAX+xBX+xCX300xAY+xBY+xCY500xijN,i{A,B,C},j{X,Y}

Formulación general del problema del transporte

De manera general, en el problema del transporte se requieren transportar ciertas unidades de un producto desde m centros de oferta (también llamados orígenes), a n centros de demanda, (también denominados destinos). Cada centro de oferta tiene una cierta cantidad de unidades disponibles, y cada centro de demanda tiene una cierta cantidad de unidades que desea recibir.

Llamemos oi a la oferta del origen i en unidades del producto (i=1,,m) y dj la demanda del destino j en unidades del producto (j=1,,n). Para cada origen i y cada destino j tiene cierto costo enviar una unidad de producto. Sea cij el costo unitario de transporte del producto del origen i al destino j (i=1,,m;j=1,,n).

Lo que buscamos es determinar para cada origen i y cada destino j cuántas unidades xij se deben transportar de tal modo que no se exceda la producción de cada origen, se satisfaga la demanda en cada destino y se incurra en el mínimo costo de transporte.

Como lo hemos hecho en entradas anteriores, las condiciones anteriores pueden ser planteadas en términos lineales. Para no exceder la oferta del origen i, se debe cumplir que

j=1nxijoi,

para cada i=1,,m. A estas desigualdades les llamamos las restricciones de oferta.

Para cumplir con la demanda en el destino j se debe cumplir que

i=1mxijdj,

para cada j=1,,n. A estas desigualdades les llamamos las restricciones de demanda.

Agregando las condiciones de positividad y estableciendo que queremos minimizar el costo total, obtenemos el problema planteado de la siguiente manera:

Minz=i=1mj=1ncijxijs.a.j=1nxijoi,i=1,,m(1)i=1mxijdj,j=1,,n(2)xij0;i=1,,m;j=1,,n,

donde xij es el número de unidades del producto a transportar del origen i al destino j, para cada i=1,,m y cada j=1,,n.

Las desigualdades en (1) se llaman restricciones de oferta y en (2) restricciones de demanda.

Más adelante…

Con este problema contamos ya con tres ejemplos de situaciones que se pueden plantear en términos de programación lineal: el problema de la dieta, el problema de la mochila y el problema del transporte. A continuación veremos dos más: el problema de producción e inventario, y el problema de la ruta más corta.

Tarea

  1. Encuentra por lo menos una manera de realizar las asignaciones de variables en el problema de los almacenes de computadoras portátiles y las tiendas. No importa que el costo total que encuentres no sea óptimo, pero sí se deben cumplir las restricciones de oferta y de demanda.
  2. ¿Qué sucede en el problema del transporte si la cantidad total de demanda excede a la cantidad total de oferta? Plantea esta posibilidad en términos de los parámetros oi y dj de oferta y demanda, respectivamente.
  3. Imagina que en el ejemplo que planteamos de computadoras portátiles, almacenes y tiendas sucede que el precio de transportar una computadora portátil es de $30 sin importar el almacén origen o la tienda destino. En este caso, ¿cuál sería una manera óptima de realizar los envíos, y tal que se cumplan las restricciones de oferta y demanda?
  4. Se presenta la siguiente situación:

Una empresa coreana fabrica y luego distribuye sus pantallas a diferentes vendedores. En este momentos tienen pantallas de 4 diferentes tamaños: 43″, 50″, 55″ y 65″. Los países a donde distribuyen sus productos son Japón, China y Estados Unidos. En la siguiente tabla se muestra el costo de exportación en miles de dólares por cada 1000 televisores de cada modelo.

43″50″55″65″Demanda este año
Japón$50k$60k$65k$70k100k
China$60k$70k$75k$80k300k
Estados Unidos$80k$90k$95k$100k350k
Disponibilidad250k220k180k150k——

También se señaló en la tabla anterior cual es la demanda de cada país para este año y las pantallas que fueron fabricadas este año por cada modelo.

Plantea este problema como un problema del transporte como se hizo anteriormente.

  1. Un posible caso particular del problema del transporte sucede cuando hay muchos orígenes y únicamente un destino. Plantea esta posibilidad de manera general. En este caso, ¿cuál sería una buena estrategia para decidir cuáles orígenes deben enviar unidades del producto al destino?

Entradas relacionadas