Archivo de la etiqueta: polígonos

Investigación de Operaciones: Soluciones básicas, factibles y no degeneradas (10)

Por Aldo Romero

Introducción

Ya hablamos de qué es la forma canónica y la forma estándar de un problema lineal. Como platicamos, esto nos permitirá llevar los problemas que nos interesan a ciertas formas especiales a las que podremos aplicarles algunos métodos más adelante. Lo que haremos ahora es comenzar a pensar en qué quiere decir resolver un problema lineal. Para ello, recordaremos de distintos tipos de soluciones que los problemas lineales pueden tener.

Tipos de soluciones y región de factibilidad

En esta sección recordaremos los conceptos de soluciones factibles, soluciones básicas factibles (degeneradas y no degeneradas) y de región de factibilidad.

Supongamos que tenemos un problema de programación lineal en su forma canónica:

Maxz=cxs.a.Axbx0,

donde usamos la misma notación que en la entrada anterior, pero donde tomaremos l variables de decisión. En particular, x,c son vectores en Rn, b es un vector en Rm y A es una matriz de entradas reales de m×n. Recuerda que en la expresión anterior entendemos 0 como el vector en Rn con entradas todas iguales a cero.

Este problema también tiene una forma estándar, en donde transformamos las desigualdades en igualdades introduciendo variables de sobra y de holgura.
Maxz=cxs.a.Ax=bx0,

en donde en hemos agregado nm variables de holgura al vector x, para obtener un vector x en Rn, así como nm columnas a A para volverla una matriz en de m×n, para agregar los coeficientes de las variables de holgura que hacen que se de la igualdad.

Como recordatorio, tenemos las siguientes definiciones para los tipos de soluciones del problema lineal.

Definición. Una solución factible al problema lineal en forma canónica dado anteriormente es un vector columna x=(x1x2xn) que satisface las restricciones Axb y x0. Esto se corresponde con una solución x al problema en forma estándar que satisface Ax=b y x0.

Definición. La región de factibilidad del problema lineal en forma canónica es el conjunto de todas las soluciones factibles.

De entre las soluciones factibles, hay algunas que son un poco más sencillas, en el sentido de que varias de sus entradas son iguales a cero pensadas como soluciones del problema en forma estándar. En las siguientes definiciones suponemos que el rango de la matriz A es exactamente igual a m.

Definición. Una solución básica factible es una solución factible x correspondiente a una solución x del problema en forma estándar con no más de m componentes positivas. En otras palabras, x tiene al menos nm entradas iguales a cero.

Definición. Una solución básica factible no degenerada es una solución factible x correspondiente a una solución x del problema en forma estándar con exactamente m componentes positivas. En otras palabras, x tiene exactamente nm entradas iguales a cero.

Definición. Una solución básica factible degenerada es una solución factible x correspondiente a uan solución x del problema en forma estándar con menos de m componentes positivas. En otras palabras, x tiene más de nm entradas iguales a cero.

La importancia de las soluciones básicas factibles y no degeneradas es que cumplen las siguientes:

  1. Se puede mostrar que si un problema de programación lineal tiene óptimo, entonces dicho óptimo se alcanza para alguna solución básica factible y no degenerada.
  2. Las soluciones básicas factibles y no degeneradas se pueden encontrar resolviendo sistemas de ecuaciones.
  3. Geométricamente, las soluciones básicas factibles y no degeneradas están en vértices de la región de factibilidad.

A continuación explicaremos algunos de estos puntos con un ejemplo detallado, que te ayudará a entender la intuición detrás de estas definiciones y de su importancia.

Ejemplos de región de factibilidad y tipos de solución

Consideremos el siguiente problema de programación lineal:

Max.z=2x1+3x2s.a.2x1+x24x1+2x25x1,x20.

Antes de comenzar a estudiar la región de factibilidad, debemos verificar que está en forma canónica. En efecto, todo está en orden: el problema es de maximización, las desigualdades son y a las variables de decisión se les pide ser no negativas.

La región de factibilidad es el conjunto de todos los (x1,x2) (en el plano R2) que cumplen las restricciones del problema, es decir, 2x1+x24, x1+2x25, x10 y x20. Para entender esto mejor, lo podemos pensar en cuatro regiones:

Región 1: La región x10, que queda a la derecha del eje y.

Región 2: La región x20, que queda arriba del eje x.

Región 3: La región 2x1+x24, que queda debajo de la recta 2x1+x2=4.

Región 4: La región x1+2x25, que queda por debajo de la recta x1+2x2=5.

Como queremos que (x1,x2) satisfaga todas las restricciones simultáneamente, necesitamos que esté en la intersección de todas las regiones. Así, la región de factibilidad es en la que se intersectan todas estas regiones que acabamos de dibujar. Al sobreponerlas, obtenemos la región encerrada en la siguiente figura:

Si gustas, puedes también explorar el interactivo de GeoGebra en donde se han coloreado los complementos de las regiones para más claridad. Puedes usar el cursor para mover la figura y las herramientas de lupa para hacer acercamientos y alejamientos.

La intuición que debemos tener ahora es que el máximo de la función objetivo 2x1+3x2 se tiene que alcanzar en alguno de los vértices del cuadrilátero que es la región factible. A grandes rasgos, estos vértices serán las soluciones básicas factibles y no degeneradas. Veamos dónde el álgebra nos dice esto.

Para ello, pensemos al problema en su forma estándar, tomando variables de holgura s1 y s2. Las restricciones que tienen las cuatro variables en conjunto son las siguientes.

2x1+x2+s1=4x1+2x2+s2=5x1,x2,s1,s20.

La matriz A es (21101201), que puedes verificar que tiene rango 2. Las soluciones básicas y no degeneradas corresponden a tener en ese sistema de ecuaciones exactamente m=2 variables positivas, de manera que necesitamos hacer exactamente nm=42=2 de estas variables iguales a cero. Al hacer esto, podemos resolver para las m=2 variables restantes. Por ejemplo, si establecemos x1=0 y x2=0, las ecuaciones se convierten en

s1=4s2=5x1,x2,s1,s20,

que tiene solución única (x1,x2,s1,s2)=(0,0,4,5). Así, la solución básica del problema en forma canónica es (x1,x2)=(0,0). Hay que recordar dar la solución básica ya sólo para las variables originales, es decir, las del problema en forma canónica.

Esta solución corresponde al punto C del interactivo de GeoGebra. Se puede determinar otra solución básica fijando s1=0 y s2=0, donde el sistema sería ahora

2x1+x2=4x1+2x2=5x1,x2,s1,s20,

y tras resolver las dos ecuaciones, la solución básica que se obtiene es (x1,x2)=(1,2), que es el punto A del interactivo de GeoGebra.

Podemos seguir haciendo esto. Si consideramos todas las posibilidades en las que dos variables son cero y resolvemos las ecuaciones resultantes, eso nos dará puntos (x1,x2) en el plano. La solución óptima es la solución básica factible (punto de esquina) con el mejor valor objetivo.

En este ejemplo tenemos (42)=4!2!2!=6 formas de volver dos de las n variables iguales a cero. Ya para las variables x1 y x2, los puntos que obtenemos son los puntos A, B, C, D que son vértices de la región de factibilidad. Los puntos E y F del interactivo también son puntos básicos y no degenerados (son las otras dos intersecciones de las rectas que dibujamos), pero como no satisfacen la condición de factibilidad del problema, entonces no los podemos considerar y por lo tanto no son candidatos a dar el valor óptimo.

La siguiente tabla muestra todas las soluciones básicas y no básicas de este ejemplo:

Variables no básicas (cero)Variables básicasSolución para (x1,x2)Punto de esquina asociado¿Factible?Valor objetivo z
(x1,s1)(s1,s2)(0,0)C0
(x1,s1)(x2,s2)(0,4)ENo___
(x1,s2)(x2,s1)(0,2.5)D7.5
(x2,s1)(x1,s2)(2,0)B4
(x2,s2)(x1,s1)(5,0)FNo___
(s1,s2)(x1,x2)(1,2)A8 (óptimo)

Más adelante…

Notemos que a medida que el tamaño del problema se incrementa, enumerar todos los puntos esquina se volverá una tarea que tomaría mucho tiempo. Por ejemplo, si tuviéramos 20 variables (ya con las de holgura) y 10 restricciones, es necesario resolver considerar (2010)=184756 formas de crear ecuaciones de 10×10, y resolver cada una de ellas. Aunque esto es finito, son demasiadas operaciones. Y este en la práctica incluso es un ejemplo pequeño, ya que en la vida real hay problemas lineales que pueden incluir miles de variables y restricciones.

Por ello, se vuelve cruciar encontrar un método que atenúe esta carga computacional en forma drástica, que permita investigar sólo un subconjunto de todas las posibles soluciones factibles básicas no degeneradas (vértices de la región de factibilidad), pero que garantice encontrar el óptimo. Una idea intuitiva que debería servir es comenzar en un vértice y «avanzar en una dirección que mejore la función objetivo». Esto precisamente es la intuición detrás del método simplex, que repasaremos a continuación.

Tarea moral

  1. Considera el siguiente problema lineal en su forma canónica:

Maxz=2x1+3x2s.a.x1+3x263x1+2x26x1,x20.

Sigue los pasos descritos arriba para encontrar todas sus soluciones básicas factibles y no degeneradas. Usa ello para encontrar el óptimo del problema.

  1. Actualiza las restricciones en el interactivo de GeoGebra que se compartió en la entrada para visualizar este problema y confirmar tus cuentas del ejercicio anterior. Para ello, deberás ir al apartado «Álgebra» del interactivo y modificar los objetos a y b.
  2. Considera un problema de optimización lineal en dos variables x y y, en forma canónica y con m restricciones (desigualdades), además de las restricciones x0 y y0. Explica por qué la región de factibilidad siempre es un polígono con a lo más m+2 lados, y por qué entonces basta evaluar la función objetivo en a lo más m+2 puntos para encontrar su máximo.
  3. ¿Cómo se vería la región de factibilidad de un problema de optimización lineal de maximización que no tenga máximo? Explica todas las posibilidades y da ejemplos.
  4. Intenta usar las ideas de esta entrada para resolver los problemas de optimización lineal clásicos que hemos descrito en entradas anteriores.

Entradas relacionadas

Cálculo Diferencial e Integral II: Introducción y método exhaustivo

Por Moisés Morales Déciga

Introducción

Este curso es la continuación de la materia Cálculo Diferencial e Integral I. En el primer curso de cálculo hablamos del cálculo diferencial. Nuestro principal objeto matemático fue la derivada y cómo se puede interpretar como la razón de cambio del objeto de análisis: la tangente de una curva, la velocidad y aceleración de una partícula, la variación de un objeto en su trayectoria, etc.

En este siguiente curso hablaremos de temas relacionados con el cálculo integral. Hablaremos un poco de sus orígenes, de los principales objetos matemáticos que estudia, de varios aspectos fundamentales de su teoría y de sus aplicaciones. El objetivo principal de esta rama matemática es el estudio de las integrales y las anti-derivadas. Una motivación importante es que ellas son una herramienta para la solución de problemas de cálculo de áreas y de volúmenes.

Así, el objeto matemático estelar del curso será la integral y la motivaremos mediante su gran utilidad para el cálculo de áreas. Sin embargo, esto no será lo único que haremos. La definiremos formalmente, probaremos las muchas propiedades matemáticas que tiene y veremos numerosas aplicaciones no sólo al cálculo de integrales, sino también a la construcción de otros objetos matemáticos fundamentales como la función exponencial.

Es muy probable que ya cuentes con una buena noción de área. En cursos de primaria, secundaria y bachillerato se explica un poco de esto y se dan fórmulas para calcular áreas. Sin embargo, estas fórmulas no salen de la nada. Pueden ser construidas a partir de nociones más básicas y por distintos métodos. Uno de ellos es la integración. Hasta que hagamos más precisiones formales, puedes aprovechar la intuición que ya tienes sobre las áreas y pensar en ellas intuitivamente como una magnitud que «mide» qué tan grande es una región contenida dentro de ciertos límites y cuyas unidades están «al cuadrado». Esto te ayudará a tener en qué cimentar tu intuición para cuando demos una definición más formal.

Algunas notas históricas

Históricamente, se han encontrado casos de utilización de de herramientas de cálculo diferencial en trabajos antiguos, por ejemplo, los trabajos de Arquímedes. Pero fue hasta los siglos XVI y XVII donde se tuvo un desarrollo sistemático, atribuido a Isaac Newton y Gottfried Leibniz, quienes son considerados como los dos grandes pioneros y más grandes representantes del Cálculo. Sin embargo, no fueron los únicos aportadores a éste.

Otra persona importante, Isaac Barrow, quién sería el profesor de Newton, tenía una comprensión sobre la reciprocidad entre la derivación e integración. Este concepto es el punto de partida del cálculo desarrollado por Newton y Leibnitz. Es primordial pues da pie a la introducción y demostración de los dos teoremas fundamentales del cálculo.

Método exhaustivo

A modo de introducción, platicaremos en esta entrada sobre el método exhaustivo. Es un método matemático que utiliza la geometría para aproximar algún resultado o aproximar a la solución un problema que tengamos. La característica que tiene el método es que, a la vez que aumenta el cálculo o las repeticiones, aumenta el grado de precisión de nuestra aproximación con respecto al resultado que queremos.

Arquímides desarrolló una de las aplicaciones de este método para el cálculo de áreas planas. Eudoxo también trabajó con este método, sólo que su objetivo era calcular el volumen de las pirámides de Egipto. En cierto sentido, también ya usamos este método cuando hablamos de la derivada de una función. Para pensar en la tangente en un punto P a la gráfica de una función, la intuición (y de hecho, en cierto sentido la definición formal) consistió en tomar rectas secantes que pasaran por P y otro punto Q en la gráfica. Conforme Q se acercaba a P nos aproximábamos más y más a la tangente y, si cierto límite existía, justo esa era la definición de tangente.

Para ejemplificar nuevamente el método exhaustivo, veremos cómo encontrar de manera un poco informal el el área de un círculo. Sea C un círculo y sea M3 un número natural. Tomemos PM un polígono regular de M lados inscrito al círculo C y QM un polígono de M lados circunscrito al círculo C. Para que dichos polígonos queden bien definidos, podemos pedir además que su lado inferior sea horizontal. Por ejemplo, en la figura a continuación se muestra el caso M=5.

Notemos que los polígonos que definimos tienen dos áreas: una que incluye al área del círculo y otra que está incluida en el círculo.

Para cada valor de M tenemos dos polígonos. De este modo, estamos generando dos sucesiones de polígonos: la de polígonos inscritos {PM}M3 y la de polígonos circunscritos {QM}M3. Notemos que el área cada uno de los polígonos inscritos PM queda acotada superiormente por el área de cada uno de los polígonos QM; a su vez, el área de cada uno de los polígonos circunscritos QM queda acotada inferiormente por el área de cada uno de los polígonos PM. Además, no es muy difícil convencerse de que el área de los polígonos inscritos crece conforme M aumenta y, en contraparte, el área de los circunscritos decrece conforme M aumenta. Recordando del primer curso de cálculo lo que sabemos sobre supremos, ínfimos y sobre sucesiones monótonas y acotadas, tendríamos entonces que los siguientes dos límites existen:

p=limMárea(PM)=supM3área(PM)q=limMárea(QM)=infM3área(QM).

Además, pq. De hecho, si el área del círculo C que nos interesa es c, entonces por lo que mencionamos arriba tendríamos que pcq. Nuestra intuición nos dice que cuando la M aumenta, generamos un polígono con más lados que van acercándose a la circunferencia, y que en el límite debemos obtener el área de la circunferencia. Por lo tanto, esperaríamos que p=c=q.

¿Qué sería suficiente para respaldar esta intuición? ¿Bastaría que calculáramos explícitamente limMárea(PM) y limMárea(QM) (por ejemplo, dividiendo los polígonos en triángulos para encontrar una fórmula explícita) y que viéramos que son iguales? Esto seguro aumentaría mucho la confianza en nuestro procedimiento. Pero, ¿qué tal que aproximamos al círculo con otros polígonos que no son regulares? ¿nos dará lo mismo? Nuestra definición formal de área ayudará a resolver estas dudas.

En resumen, el método iterativo nos permite aproximar el área del círculo, encerrándolo entre 2 polígonos, de los cuales sabemos calcular el área mediante triángulos. Intuitivamente, mientras más fraccionemos los polígonos, la aproximación del área del círculo será mejor. Esta idea de «encerrar» el área que nos interesa entre dos áreas que sepamos (o acordemos) cómo calcular será clave cuando definamos la integral definida.

Más adelante…

En esta entrada hablamos brevemente sobre la conexión de este curso de cálculo con el anterior. Dimos unas pocas notas históricas e introducimos la idea del método exhaustivo. En la siguiente entrada comenzaremos a formalizar estas ideas para el cálculo de áreas entre la gráfica de una función y el eje x.

Tarea moral

  1. Con las herramientas de geometría que has adquirido en la educación básica, intenta completar el ejemplo que comenzamos sobre el método exhaustivo. No te preocupes mucho por la formalización de límites, funciones trigonométricas, fórmulas de áreas de triángulos, etc. Es parte de lo que haremos en este curso. Entre otras cosas, tendrás que:
    • Calcular explícitamente la distancia del centro de un círculo C de radio r a un vértice (y a un lado) del polígono inscrito (y circunscrito) en C que es regular y de n lados.
    • Encontrar el área de Pn y Qn.
    • Encontrar los límites de estas áreas conforme n tiende a infinito.
  2. Investiga más sobre los orígenes del cálculo integral.
  3. Averigua sobre el método exhaustivo y otros usos históricos que se le ha dado.
  4. El método exhaustivo puede ser algo peligroso si se usa apresuradamente. Por ejemplo, toma un cuadrado de lado 1 y divídelo en cuadrados pequeños para formar un tablero de n×n. Mediante un camino Cn que sube y va a la derecha alternadamente, se puede comenzar en el vértice inferior izquierdo y llegar al vértice superior derecho. Intuitivamente, cuando n tiende a infinito, este camino pareciera converger a la diagonal del cuadrado, la cual tiene longitud 2. Sin embargo, la longitud de cada camino Cn siempre es 2 pues en total avanza una unidad a la derecha y una hacia arriba. ¿Por qué la longitud de Cn no tiende a 2 si aparentemente Cn tiende a la diagonal del cuadrado?
  5. Realiza un repaso de los teoremas principales de Cálculo Diferencial e Integral I. ¡Te serán sumamente útiles para este curso! En particular, sería bueno que revises los siguientes temas:
    • Definición y propiedades de límites.
    • Definición y propiedades de funciones contínuas.
    • Definición y propiedades de derivadas.
    • Reglas de derivación.
    • El teorema del valor intermedio.
    • El teorema del valor medio.

Entradas relacionadas