Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Investigación de Operaciones: Soluciones básicas, factibles y no degeneradas (10)

Por Aldo Romero

Introducción

Ya hablamos de qué es la forma canónica y la forma estándar de un problema lineal. Como platicamos, esto nos permitirá llevar los problemas que nos interesan a ciertas formas especiales a las que podremos aplicarles algunos métodos más adelante. Lo que haremos ahora es comenzar a pensar en qué quiere decir resolver un problema lineal. Para ello, recordaremos de distintos tipos de soluciones que los problemas lineales pueden tener.

Tipos de soluciones y región de factibilidad

En esta sección recordaremos los conceptos de soluciones factibles, soluciones básicas factibles (degeneradas y no degeneradas) y de región de factibilidad.

Supongamos que tenemos un problema de programación lineal en su forma canónica:

\begin{align*}
Max \quad z &= c\cdot x\\
s.a.&\\
Ax &\leq b\\
x &\geq 0,\\
\end{align*}

donde usamos la misma notación que en la entrada anterior, pero donde tomaremos $l$ variables de decisión. En particular, $x,c$ son vectores en $\mathbb{R}^n$, $b$ es un vector en $\mathbb{R}^m$ y $A$ es una matriz de entradas reales de $m\times n$. Recuerda que en la expresión anterior entendemos $0$ como el vector en $\mathbb{R}^n$ con entradas todas iguales a cero.

Este problema también tiene una forma estándar, en donde transformamos las desigualdades en igualdades introduciendo variables de sobra y de holgura.
\begin{align*}
Max \quad z &= c\cdot x\\
s.a.&\\
A’x’ &=b\\
x’ &\geq 0,\\
\end{align*}

en donde en hemos agregado $n-m$ variables de holgura al vector $x$, para obtener un vector $x’$ en $\mathbb{R}^n$, así como $n-m$ columnas a $A$ para volverla una matriz en de $m\times n$, para agregar los coeficientes de las variables de holgura que hacen que se de la igualdad.

Como recordatorio, tenemos las siguientes definiciones para los tipos de soluciones del problema lineal.

Definición. Una solución factible al problema lineal en forma canónica dado anteriormente es un vector columna $x=\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}$ que satisface las restricciones $Ax\leq b$ y $x\geq 0$. Esto se corresponde con una solución $x’$ al problema en forma estándar que satisface $A’x’= b$ y $x’\geq 0$.

Definición. La región de factibilidad del problema lineal en forma canónica es el conjunto de todas las soluciones factibles.

De entre las soluciones factibles, hay algunas que son un poco más sencillas, en el sentido de que varias de sus entradas son iguales a cero pensadas como soluciones del problema en forma estándar. En las siguientes definiciones suponemos que el rango de la matriz $A’$ es exactamente igual a $m$.

Definición. Una solución básica factible es una solución factible $x$ correspondiente a una solución $x’$ del problema en forma estándar con no más de $m$ componentes positivas. En otras palabras, $x’$ tiene al menos $n-m$ entradas iguales a cero.

Definición. Una solución básica factible no degenerada es una solución factible $x$ correspondiente a una solución $x’$ del problema en forma estándar con exactamente $m$ componentes positivas. En otras palabras, $x’$ tiene exactamente $n-m$ entradas iguales a cero.

Definición. Una solución básica factible degenerada es una solución factible $x$ correspondiente a uan solución $x’$ del problema en forma estándar con menos de $m$ componentes positivas. En otras palabras, $x’$ tiene más de $n-m$ entradas iguales a cero.

La importancia de las soluciones básicas factibles y no degeneradas es que cumplen las siguientes:

  1. Se puede mostrar que si un problema de programación lineal tiene óptimo, entonces dicho óptimo se alcanza para alguna solución básica factible y no degenerada.
  2. Las soluciones básicas factibles y no degeneradas se pueden encontrar resolviendo sistemas de ecuaciones.
  3. Geométricamente, las soluciones básicas factibles y no degeneradas están en vértices de la región de factibilidad.

A continuación explicaremos algunos de estos puntos con un ejemplo detallado, que te ayudará a entender la intuición detrás de estas definiciones y de su importancia.

Ejemplos de región de factibilidad y tipos de solución

Consideremos el siguiente problema de programación lineal:

\begin{align*}
Max. \quad z &= 2x_1 + 3x_2\\
s.a.&\\
&\begin{matrix}2x_1 &+ x_2 &\leq & 4\\
x_1 &+ 2x_2 &\leq &5\end{matrix}\\
&x_1, x_2 \geq 0.
\end{align*}

Antes de comenzar a estudiar la región de factibilidad, debemos verificar que está en forma canónica. En efecto, todo está en orden: el problema es de maximización, las desigualdades son $\leq$ y a las variables de decisión se les pide ser no negativas.

La región de factibilidad es el conjunto de todos los $(x_1,x_2)$ (en el plano $\mathbb{R}^2$) que cumplen las restricciones del problema, es decir, $2x_1 + x_2 \leq 4$, $x_1 + 2x_2 \leq 5$, $x_1\geq 0$ y $x_2\geq 0$. Para entender esto mejor, lo podemos pensar en cuatro regiones:

Región 1: La región $x_1\geq 0$, que queda a la derecha del eje $y$.

Región 2: La región $x_2\geq 0$, que queda arriba del eje $x$.

Región 3: La región $2x_1 + x_2 \leq 4$, que queda debajo de la recta $2x_1+x_2=4$.

Región 4: La región $x_1+2x_2\leq 5$, que queda por debajo de la recta $x_1+2x_2=5$.

Como queremos que $(x_1,x_2)$ satisfaga todas las restricciones simultáneamente, necesitamos que esté en la intersección de todas las regiones. Así, la región de factibilidad es en la que se intersectan todas estas regiones que acabamos de dibujar. Al sobreponerlas, obtenemos la región encerrada en la siguiente figura:

Si gustas, puedes también explorar el interactivo de GeoGebra en donde se han coloreado los complementos de las regiones para más claridad. Puedes usar el cursor para mover la figura y las herramientas de lupa para hacer acercamientos y alejamientos.

La intuición que debemos tener ahora es que el máximo de la función objetivo $2x_1+3x_2$ se tiene que alcanzar en alguno de los vértices del cuadrilátero que es la región factible. A grandes rasgos, estos vértices serán las soluciones básicas factibles y no degeneradas. Veamos dónde el álgebra nos dice esto.

Para ello, pensemos al problema en su forma estándar, tomando variables de holgura $s_1$ y $s_2$. Las restricciones que tienen las cuatro variables en conjunto son las siguientes.

\begin{align*}
2x_1 + x_2 + s_1 &= 4\\
x_1 + 2x_2 + s_2 &= 5\\
x_1, x_2, s_1, s_2 &\geq 0.
\end{align*}

La matriz $A’$ es $\begin{pmatrix}2 & 1 & 1 & 0 \\ 1 & 2 & 0 & 1 \end{pmatrix}$, que puedes verificar que tiene rango $2$. Las soluciones básicas y no degeneradas corresponden a tener en ese sistema de ecuaciones exactamente $m=2$ variables positivas, de manera que necesitamos hacer exactamente $n-m=4-2=2$ de estas variables iguales a cero. Al hacer esto, podemos resolver para las $m=2$ variables restantes. Por ejemplo, si establecemos $x_1 = 0$ y $x_2 = 0$, las ecuaciones se convierten en

\begin{align*}
s_1 = 4\\
s_2 = 5\\
x_1, x_2, s_1, s_2 \geq 0,
\end{align*}

que tiene solución única $(x_1,x_2,s_1,s_2)=(0,0,4,5)$. Así, la solución básica del problema en forma canónica es $(x_1,x_2)=(0,0)$. Hay que recordar dar la solución básica ya sólo para las variables originales, es decir, las del problema en forma canónica.

Esta solución corresponde al punto $C$ del interactivo de GeoGebra. Se puede determinar otra solución básica fijando $s_1 = 0$ y $s_2 = 0$, donde el sistema sería ahora

\begin{align*}
2x_1 + x_2 = 4\\
x_1 + 2x_2 = 5\\
x_1, x_2, s_1, s_2 \geq 0,
\end{align*}

y tras resolver las dos ecuaciones, la solución básica que se obtiene es $(x_1,x_2)=(1,2)$, que es el punto $A$ del interactivo de GeoGebra.

Podemos seguir haciendo esto. Si consideramos todas las posibilidades en las que dos variables son cero y resolvemos las ecuaciones resultantes, eso nos dará puntos $(x_1,x_2)$ en el plano. La solución óptima es la solución básica factible (punto de esquina) con el mejor valor objetivo.

En este ejemplo tenemos $\binom{4}{2} = \frac{4!}{2!2!} = 6$ formas de volver dos de las $n$ variables iguales a cero. Ya para las variables $x_1$ y $x_2$, los puntos que obtenemos son los puntos $A$, $B$, $C$, $D$ que son vértices de la región de factibilidad. Los puntos $E$ y $F$ del interactivo también son puntos básicos y no degenerados (son las otras dos intersecciones de las rectas que dibujamos), pero como no satisfacen la condición de factibilidad del problema, entonces no los podemos considerar y por lo tanto no son candidatos a dar el valor óptimo.

La siguiente tabla muestra todas las soluciones básicas y no básicas de este ejemplo:

Variables no básicas (cero)Variables básicasSolución para $(x_1,x_2)$Punto de esquina asociado¿Factible?Valor objetivo z
$(x_1, s_1)$$(s_1, s_2)$$(0, 0)$C0
$(x_1, s_1)$$(x_2, s_2)$$(0, 4)$ENo___
$(x_1, s_2)$$(x_2, s_1)$$(0, 2.5)$D7.5
$(x_2, s_1)$$(x_1, s_2)$$(2, 0)$B4
$(x_2, s_2)$$(x_1, s_1)$$(5, 0)$FNo___
$(s_1, s_2)$$(x_1, x_2)$$(1, 2)$A8 (óptimo)

Más adelante…

Notemos que a medida que el tamaño del problema se incrementa, enumerar todos los puntos esquina se volverá una tarea que tomaría mucho tiempo. Por ejemplo, si tuviéramos $20$ variables (ya con las de holgura) y $10$ restricciones, es necesario resolver considerar $\binom{20}{10}=184756$ formas de crear ecuaciones de $10\times 10$, y resolver cada una de ellas. Aunque esto es finito, son demasiadas operaciones. Y este en la práctica incluso es un ejemplo pequeño, ya que en la vida real hay problemas lineales que pueden incluir miles de variables y restricciones.

Por ello, se vuelve cruciar encontrar un método que atenúe esta carga computacional en forma drástica, que permita investigar sólo un subconjunto de todas las posibles soluciones factibles básicas no degeneradas (vértices de la región de factibilidad), pero que garantice encontrar el óptimo. Una idea intuitiva que debería servir es comenzar en un vértice y «avanzar en una dirección que mejore la función objetivo». Esto precisamente es la intuición detrás del método simplex, que repasaremos a continuación.

Tarea moral

  1. Considera el siguiente problema lineal en su forma canónica:

\begin{align*}
Max \quad z &= 2x_1 + 3x_2 \\
s.a.&\\
&\begin{matrix}x_1 &+ 3x_2 &\leq&6\\
3x_1 &+ 2x_2 &\leq &6\end{matrix}\\
&x_1, x_2 \geq 0.
\end{align*}

Sigue los pasos descritos arriba para encontrar todas sus soluciones básicas factibles y no degeneradas. Usa ello para encontrar el óptimo del problema.

  1. Actualiza las restricciones en el interactivo de GeoGebra que se compartió en la entrada para visualizar este problema y confirmar tus cuentas del ejercicio anterior. Para ello, deberás ir al apartado «Álgebra» del interactivo y modificar los objetos $a$ y $b$.
  2. Considera un problema de optimización lineal en dos variables $x$ y $y$, en forma canónica y con $m$ restricciones (desigualdades), además de las restricciones $x\geq 0$ y $y\geq 0$. Explica por qué la región de factibilidad siempre es un polígono con a lo más $m+2$ lados, y por qué entonces basta evaluar la función objetivo en a lo más $m+2$ puntos para encontrar su máximo.
  3. ¿Cómo se vería la región de factibilidad de un problema de optimización lineal de maximización que no tenga máximo? Explica todas las posibilidades y da ejemplos.
  4. Intenta usar las ideas de esta entrada para resolver los problemas de optimización lineal clásicos que hemos descrito en entradas anteriores.

Entradas relacionadas

Completación de un espacio métrico

Por Lizbeth Fernández Villegas

$ \textit{ MATERIAL EN REVISIÓN}$

Introducción

En secciones anteriores vimos que las sucesiones de Cauchy no siempre son convergentes en un espacio métrico, pero cuando todas lo son decimos que el espacio es completo.

Si tenemos un espacio que no es completo, intuitivamente podemos pensar en agregar puntos a los que las sucesiones de Cauchy converjan, produciendo así, un espacio métrico más grande que sí sea completo. Habrá que tener cuidado en definir adecuadamente las distancias con los nuevos elementos. Podríamos preguntarnos entonces si dicha completación es posible, y más aún, si es única.

Comencemos con la siguiente:

Definición. Completación de un espacio métrico: Sea $(X,d)$ un espacio métrico. Diremos que un espacio métrico completo $(X^*,d^*)$ es una completación del espacio $X$ si cumple que:

  1. $X$ es subespacio métrico de $X^*.$ Así $d$ es la métrica restringida en $X.$
  2. $X$ es denso en $X^*,$ es decir $\overline{X}=X^*.$

Ejemplo: El espacio métrico $(\mathbb{R},|\cdot|)$ es una completación de $(\mathbb{Q},|\cdot|).$

Proposición: Todo espacio métrico $(X,d)$ tiene una completación y esta completación es única, salvo una aplicación isométrica que envía los puntos de $X$ en sí mismos. (Aquí vimos la definición de isometría).

Prueba unicidad

Considera $X$ un espacio métrico y dos completaciones $(X^*,d^*)$ y $(X^{**},d^{**})$ de este espacio. Para probar que son iguales salvo isometrías debemos demostrar que existe una isometría biyectiva entre ambas completaciones. La isometría se construye como sigue:

Sea $x^* \in X^*,$ como $X^*$ es completación de $X$ entonces, de acuerdo con la definición $\overline{X}=X^*,$ en consecuencia $x^* \in \overline{X}$ y existe una sucesión $(x_n)_{n \in \mathbb{N}}$ de puntos en $X,$ que converge a $x^*.$ (Resultado visto en Convergencia). Nota que la convergencia permite concluir que $(x_n)$ es de Cauchy en $X^*$ (pues $X \subset X^*$) y por tanto también lo es en $X,$ debido a que la completación debe preservar las distancias para cualesquiera dos puntos de $X.$

$(x_n)_{n \in \mathbb{N}}$ es de Cauchy en $X \subset X^*$ y converge a $x^*$ en $X^*.$

Como también $X \subset X^{**}$ se sigue que los términos de $(x_n)$ también pertenecen a $X^{**}$ que, al ser completo, implica que $x_n \to x^{**}$ para algún $x^{**} \in X^{**},$ (pues si la sucesión es de Cauchy en $X$ también lo es en la completación $X^{**}$).

La misma sucesión $(x_n)_{n \in \mathbb{N}}$ converge también en algún punto $x^{**}$ en $X^{**}$

Afirmación: El punto $x^{**}$ no depende de la sucesión elegida $(x_n)$ que converge en $x^*.$ Esto es, cualquier otra que también converja en $x^*$ en el espacio $X^*,$ igualmente convergerá a $x^{**}$ en el espacio $X^{**}.$ ¿Por qué? $\textcolor{orange}{\text{(Ejercicio como tarea moral).}}$
Para cada $x^* \in X^*$ sea $\phi(x^*)=x^{**}.$ Demostraremos que $\phi$ es la isometría buscada:

Se cumple que para todo $x \in X, \, \phi(x)=x.$ ¿Por qué? $\textcolor{orange}{\text{(Ejercicio como tarea moral).}}$ Por otra parte, si suponemos que tenemos sucesiones $(x_n), (y_n)$ cuyos términos están en $X,$ tales que:

$x_n \to x^*$ en $X^*\, $ y $\, x_n \to x^{**}$ en $X^{**};$
$y_n \to y^*$ en $X^*\, $ y $\, y_n \to y^{**}$ en $X^{**}$

entonces:

$d^*(x^*,y^*)=\underset{n \to \infty}{lim}\, d^*(x_n,y_n)=\underset{n \to \infty}{lim}\, d(x_n,y_n)$

así mismo

$d^{**}(x^{**},y^{**})=\underset{n \to \infty}{lim}\, d^{**}(x_n,y_n)=\underset{n \to \infty}{lim}\, d(x_n,y_n)$ ¿Por qué? $\textcolor{orange}{\text{(Ejercicio como tarea moral).}}$

Por lo tanto,

\begin{align*}
d^*(x^*,y^*)&=d^{**}(x^{**},y^{**})\\
&=d^{**}(\phi(x^*),\phi(y^*)).
\end{align*}

Lo cual demuestra que $\phi$ es una isometría. ¿Por qué se le puede considerar biyectiva? $\textcolor{orange}{\text{(Ejercicio como tarea moral).}}$

Prueba existencia

Antes de probar la existencia veamos la siguiente:

Definición. Sucesiones equivalentes: Sean $(x_n)_{n \in \mathbb{N}}\,$ y $\,(x’_n)_{n \in \mathbb{N}}$ sucesiones de Cauchy en el espacio métrico $X.$ Si ocurre que $\underset{n \to \infty}{lim} \, d(x_n,x’_n)=0$ diremos que las sucesiones son equivalentes y lo denotaremos como:
$$(x_n)\sim (x’_n)$$

Dos sucesiones equivalentes se acercan conforme $n \to \infty$

Se deja como $\textcolor{orange}{\text{ejercicio como tarea moral}}$ probar que esta relación es de equivalencia (reflexiva, simétrica y transitiva). Para recordar, te recomendamos visitar Álgebra Superior I: Relaciones de equivalencia y clases de equivalencia.

Con esto se define un conjunto de clases de equivalencia, agrupando según la relación, las sucesiones de Cauchy en $X.$ Veremos que es una completación de $X.$ Probablemente esto cause confusión en este momento, pues mientras $X$ es un conjunto de puntos, la completación que proponemos tiene como elementos conjuntos de sucesiones de Cauchy. No obstante, aunque el tipo de elementos entre ambos conjuntos parezcan muy diferentes, en las próximas líneas veremos que la magia del isomorfismo admitirá considerarlos equivalentes.

Espacio $X$ y espacio de clases de equivalencia.

Sean $[(x_n)] \,$ y $\, [(y_n)]$ dos clases de equivalencia y sean $(x_n)$ y $(y_n)$, respectivamente, representantes de clase. Definimos la distancia entre ambas clases como:
$$d^*([(x_n)],[(y_n)])=\underset{n \to \infty}{lim} \, d(x_n,y_n).$$

Entonces se considera la distancia entre un término de la sucesión $(x_n)$ y el término correspondiente en $(y_n).$ Hablar de que existe el límite de las distancias cuando $n \to \infty$ indica que en algún momento, la distancia entre pares de términos se estabiliza.

Representación distancia entre clases

Por supuesto que habrá que demostrar que este límite existe y que esta distancia es invariante, no depende del representante de clase elegido en cada clase de equivalencia.

Probemos primero que la sucesión dada por $(d(x_n,y_n))_{n \in \mathbb{N}}$ es convergente en $\mathbb{R}$. Bastará con demostrar que es de Cauchy.

Sea $\varepsilon >0.$ Como $(x_n),(y_n)$ son de Cauchy, existen $N_1$ y $N_2 \in \mathbb{N}$ tales que

\begin{align}
\text{si } \, n,m \geq N_1 \text{ entonces } d(x_n,x_m) < \dfrac{\varepsilon}{2}\\
\text{si } \, n,m \geq N_2 \text{ entonces } d(y_n,y_m) < \dfrac{\varepsilon}{2}.
\end{align}

Sea $N=\text{máx} \, \{N_1,N_2\}.$ Se sigue que $\forall \, n,m \geq N$ se cumple que:
\begin{align*}
|d(x_n,y_n)-d(x_m,y_m)|&=|d(x_n,y_n) \textcolor{magenta}{- d(x_n,y_m)+ d(x_n,y_m)}-d(x_m,y_m)| &\textcolor{gray}{\text{(sumando un cero estratégico)}}\\
&\leq |d(x_n,y_n)- d(x_n,y_m)|+ |d(x_n,y_m)-d(x_m,y_m)| &\textcolor{gray}{\text{(desigualdad del triángulo)}}
\end{align*}

Es sencillo probar que si $u,v,w$ son elementos de un espacio métrico $(Y,d_Y)$ se satisface que

\begin{align}
|d_Y(u,v)-d_Y(u,w)|\leq d_Y(v,w). \, \textcolor{orange}{\text{ (Ejercicio como tarea moral).}}
\end{align}

Con este resultado es posible continuar con la cadena de igualdades:

\begin{align*}
|d(x_n,y_n)- d(x_n,y_m)|+ |d(x_n,y_m)-d(x_m,y_m)|&\leq d(y_n,y_m) + d(x_n,x_m) \\
&\leq \frac{\varepsilon}{2}+ \frac{\varepsilon}{2} &\textcolor{gray}{\text{(desigualdades (1) y (2) )}}\\
&= \varepsilon
\end{align*}

Entonces la sucesión $(d(x_n,y_n))_{n \in \mathbb{N}}$ es de Cauchy en $\mathbb{R}$ y converge cuando $n \to \infty.$

Ahora demostremos que la distancia entre clases no depende del representante elegido. Sean $(x_n) \sim (x’_n)$ y sean $(y_n) \sim (y’_n)$. En efecto
$$d^*([(x_n)],[(y_n)])\, \textbf{=} \, d^*([(x’_n)],[(y’_n)])$$
pues al calcular la diferencia entre estas magnitudes tenemos:

\begin{align*}
|d^*([(x_n)],[(y_n)]) \, \textbf{-} \, d^*([(x’_n)],[(y’_n)])|&=|\underset{n \to \infty}{lim} \, d(x_n,y_n)-\underset{n \to \infty}{lim} \,d(x’_n,y’_n)| &\textcolor{gray}{\text{(por definición)}}\\
&=|\underset{n \to \infty}{lim} \, (d(x_n,y_n)- \,d(x’_n,y’_n))| &\textcolor{gray}{\text{(propiedad de límites)}}\\
&=|\underset{n \to \infty}{lim}(d(x_n,y_n)\textcolor{magenta}{- d(x_n,y’_n)+ d(x_n,y’_n)}-d(x’_n,y’_n))|&\textcolor{gray}{\text{(sumando un cero estratégico)}} \\
&=|\underset{\textcolor{ForestGreen}{n \to \infty}}{\textcolor{ForestGreen}{lim}}(d(x_n,y_n)- d(x_n,y’_n))+ \underset{\textcolor{RoyalBlue}{n \to \infty}}{\textcolor{RoyalBlue}{lim}}(d(x_n,y’_n)-d(x’_n,y’_n))| &\textcolor{gray}{\text{(propiedad de límites)}}\\
&\leq |\underset{\textcolor{ForestGreen}{n \to \infty}}{\textcolor{ForestGreen}{lim}} (d(x_n,y_n)- d(x_n,y’_n))| + |\underset{\textcolor{RoyalBlue}{n \to \infty}}{\textcolor{RoyalBlue}{lim}} (d(x_n,y’_n)-d(x’_n,y’_n))| &\textcolor{gray}{\text{(desigualdad del triángulo)}}\\
&\leq \underset{\textcolor{ForestGreen}{n \to \infty}}{\textcolor{ForestGreen}{lim}} |(d(x_n,y_n)- d(x_n,y’_n))| + \underset{\textcolor{RoyalBlue}{n \to \infty}}{\textcolor{RoyalBlue}{lim}} |(d(x_n,y’_n)-d(x’_n,y’_n))| &\textcolor{gray}{\text{(propiedad de límites y $|\cdot|$)}}\\
&\leq \underset{\textcolor{ForestGreen}{n \to \infty}}{\textcolor{ForestGreen}{lim}} d(y_n,y’_n) + \underset{\textcolor{RoyalBlue}{n \to \infty}}{\textcolor{RoyalBlue}{lim}} d(x_n,x’_n) &\textcolor{gray}{\text{(desigualdad (3) )}}\\
&= 0+0 &\textcolor{gray}{\text{(por ser sucesiones equivalentes)}}\\
&= 0
\end{align*}

Por lo tanto la distancia entre clases está bien definida.

El conjunto de clases de equivalencias de sucesiones es un espacio métrico

Sean $[(x_n)], [(y_n)], [(z_n)]$ clases de equivalencia de la relación descrita arriba. Se satisfacen los axiomas:

  1. $d^*([(x_n)], [(y_n)])=0$ si y solo si $[(x_n)]= [(y_n)]$
  2. $d^*([(x_n)], [(y_n)])=d^*([(y_n)], [(x_n)])$
  3. $d^*([(x_n)], [(y_n)]) \leq d^*([(x_n)], [(z_n)]) +d^*([(z_n)], [(y_n)])$

Dejaremos como $\textcolor{orange}{\text{ejercicio como tarea moral}}$ probar $1)$ y $2)$
Para probar $3)$ partimos de tomar representantes de clase $(x_n) \in [(x_n)], \, (y_n) \in [(y_n)] \text{ y } \,(z_n) \in [(z_n)].$ Lo siguiente es consecuencia de la desigualdad del triángulo en $d$ y la distancia entre clases definida.

\begin{align*}
&&d(x_n,y_n) &\leq d(x_n,z_n) + d(z_n,y_n)\\
&\Rightarrow & \underset{n \to \infty}{lim}d(x_n,y_n) &\leq \underset{n \to \infty}{lim}d(x_n,z_n) + \underset{n \to \infty}{lim}d(z_n,y_n)\\
&\Rightarrow& d^*([(x_n)], [(y_n)]) &\leq d^*([(x_n)], [(z_n)]) +d^*([(z_n)], [(y_n)]).
\end{align*}

Que es lo que queríamos demostrar.

Representación de la partición creada por la relación $\sim.$

En el dibujo cada clase de equivalencia está representada por sucesiones de colores similares. Al ser de Cauchy y tener distancias entre ellas que “se reducen a cero” podemos pensar en que todas las sucesiones de una clase convergen a un punto del espacio $X$ cuando de hecho son convergentes;

o bien, si no convergen en $X$ lo harán en un punto “afuerita” de $X,$ (en la cerradura respecto al espacio completo que lo contiene). Esta misma idea nos deja imaginar la distancia entre clases como la distancia entre esos “puntos de convergencia.”

El conjunto de clases de equivalencia es una completación de $X$

Sea $X^*$ el conjunto de clases de equivalencia de sucesiones de Cauchy en $X.$ Definimos $\phi:X \to X^*$ tal que para cada punto $x \in X, \,$ $\phi(x)$ es la clase de sucesiones de Cauchy que convengen en $x.$

Representación $\phi:X \to X^*.$

Sean $x,y \in X$ y dos sucesiones $(x_n), (y_n)$ en $X$ tales que:
$$\underset{n \to \infty}{lim}x_n=x \, \text{ y } \, \underset{n \to \infty}{lim}y_n =y.$$
Entonces se cumple que:
\begin{align*}
d(x,y)&=\underset{n \to \infty}{lim}d(x_n,y_n) &\textcolor{orange}{\text{(ejercicio)}}\\
&=d^*([(x_n)], [(y_n)]).
\end{align*}

Distancia entre puntos en $X$ y distancia entre las clases que convergen en ellos.

Por lo tanto $\phi$ es una isometría entre $X$ y $X^*$

Ahora que podemos considerar a $X$ como $\phi(X),$ demostremos que $\overline{\phi(X)}=X^*.$ En consecuencia, el espacio métrico $(X^*, d^*)$ será isométrico al espacio métrico $(\overline{\phi(X)}, d^*).$

Sea $[(x_n)] \in X^*$ y sea $\varepsilon>0.$
Buscamos demostrar que existe un elemento de $\phi(X)$ en la bola de radio $\varepsilon$ con centro en $[(x_n)],$ es decir, que su distancia a $[(x_n)]$ sea menor que $\varepsilon.$

Sea $(x_n)$ un representante de clase de $[(x_n)]$. Como es de Cauchy, existe $N \in \mathbb{N}$ tal que $\forall \, n,m \geq N$ se cumple que
$$d(x_n,x_m)< \varepsilon.$$

Entonces si consideramos la sucesión constante $(x_N),$ donde todos sus términos son $x_N,$ se sigue:
$$d^*([(x_N)],[(x_n)])= \underset{k \to \infty}{lim} \, d(x_N,x_k)< \varepsilon$$
Lo cual demuestra que $[(x_N)] \in \phi(X)$ está en la bola de radio $\varepsilon$ con centro en $[(x_n)].$ Por lo tanto $\overline{\phi(X)}$ es denso en $X^*.$

$X^*$ es completo

Sea $(x_n)_{n \in \mathbb{N}}$ una sucesión de Cauchy en $X^*.$ Si todos los términos de la sucesión están en $\phi(X)$ entonces cada una de las clases, términos de $(x_n),$ converge en puntos de $X$ formando así una sucesión de Cauchy en $X.$

Luego, por como fue construido $X^*,$ la sucesión converge a su clase de equivalencia $[(x_n)]$ en $X^*.$
En el caso general, si la sucesión en $X^*$ es de la forma $(x^*_n)_{n \in \mathbb{N}}$ donde cada $(x^*_n)$ es una clase de equivalencia que no necesariamente tiene una sucesión constante de puntos en $X$, dada la densidad de $X$ (visto como $\phi(X)),$ para cada $n \in \mathbb{N}$ es posible elegir $x_n \in X$ tal que $x_n \in B(x^*_n,\frac{1}{n}).$ Queda como $\textcolor{orange}{\text{ ejercicio }}$ argumentar que la sucesión $(x_n)$ es de Cauchy y por tanto, vista como sucesión de clases, converge a algún $x^* \in X^*$. $\textcolor{orange}{\text{ Argumenta también }}$ por qué podemos concluir que $(x^*_n)$ también converge a $x^*.$

Con esto queda demostrada la proposición.

Más adelante…

Seguiremos trabajando con la convergencia de sucesiones, pero ahora tendrán, como términos, los valores asignados en un punto por una sucesión de funciones. Hablaremos de los valores a los que una sucesión de funciones converge y veremos los términos de límite puntual y límite uniforme.

Tarea moral

  1. Argumenta los detalles que quedaron pendientes en la demostración de la completación de un espacio métrico.

Enlaces

Teorema de Baire

Por Lizbeth Fernández Villegas

$ \textit{ MATERIAL EN REVISIÓN}$

Introducción

Dedicaremos esta entrada a la presentación de un teorema que ha dado resultados importantes en el estudio de los espacios métricos completos. Para comenzar, necesitamos imaginar la pertenencia de los elementos de un conjunto cuando seleccionamos, arbitrariamente, bolas abiertas en el espacio métrico. El primer concepto dice lo siguiente:

Definición. Conjunto denso. Sean $(X,d)$ un espacio métrico y $A \subset X.$ Decimos que $A$ es un conjunto denso en $X$ si $\overline{A}=X.$

La intersección de las bolas abiertas con $A$ es no vacía

Nota que esto es equivalente a decir que todas las bolas abiertas de $X$ tienen puntos en $A.$

Ejemplo: En el espacio métrico euclidiano de los números reales, el conjunto $\mathbb{Q}$ es denso.

$\mathbb{Q}$ es denso en $\mathbb{R}$

Aunque basta con encontrar una bola abierta en $X$ ajena al conjunto $A$ para demostrar que $A$ no es denso, presentamos un tipo de conjunto que no solo no lo es sino que no lo es en «ninguna parte» de $A.$

El conjunto de puntos es denso a la izquierda del dibujo pero no a la derecha

Definición. Conjunto nunca denso. Sean $(X,d)$ un espacio métrico y $A \subset X.$ Si para toda bola abierta $B \subset X$ existe una bola abierta contenida $B’ \subset B$ que no tiene puntos de $A$ diremos que $A$ es un conjunto nunca denso (o denso en ninguna parte).

El conjunto de puntos es nunca denso

Con estos conceptos ya podemos entender el teorema prometido.

Teorema de Baire. Si $(X,d)$ es un espacio métrico completo, entonces no puede representarse como la unión numerable de conjuntos nunca densos.

Demostración:
Sea $X$ un espacio métrico completo. Considera el conjunto $\underset{n \in \mathbb{N}}{\bigcup} \, A_n,$ donde para cada $n \in \mathbb{N}$ el conjunto $A_n \subset X$ es nunca denso en $X.$ Construiremos una sucesión de bolas cerradas encajadas como sigue: (Concepto visto en entrada anterior).
Sea $B_0$ una bola cerrada de radio $1.$ Como $A_1$ es nunca denso, existe una bola cerrada $B_1$ de radio menor que $\frac{1}{2}$ tal que $B_1 \subset B_0$ y $B_1 \cap A_1= \emptyset.$ Proponemos como ejercicio al lector argumentar por qué seleccionar dicha bola es posible.
De igual manera, como $A_2$ es nunca denso existe una bola cerrada $B_2$ de radio menor que $\frac{1}{3}$ tal que $B_2 \subset B_1$ y $B_2 \cap A_2= \emptyset.$

Si continuamos recursivamente, terminaremos construyendo una sucesión de bolas cerradas encajadas $(B_n)_{n \in \mathbb{N}}$ cuyos radios tienden a $0$. En la entrada anterior vimos que, al ser $X$ completo la intersección de estas bolas tiene un punto, de hecho $\underset{n \in \mathbb{N}}{\bigcap}A_n= \{x\}$ para algún $x \in X.$ Este punto no pertenece a ningún conjunto $A_k, \, k \in \mathbb{N},$ pues al estar en la intersección de todas las bolas cerradas, particularmente $x \in B_k$ que, recordemos es ajeno a $A_k,$ por lo tanto $x \notin A_k.$ Entonces tenemos un punto $x \in X$ tal que $x \notin \underset{n \in \mathbb{N}}{\bigcap}A_n$ concluyendo así que $X \neq \underset{n \in \mathbb{N}}{\bigcap}A_n.$

A partir de este teorema podemos concluir la siguiente:

Proposición: Todo espacio métrico completo $X$ sin puntos aislados es no numerable.

Demostración:
Recordemos que un punto aislado $x \in X$ es aquel que tiene una bola abierta cuyo único elemento de $X$ es $x.$ Si $X$ no tiene puntos aislados, entonces todos sus puntos son de acumulación. Es sencillo probar que para cada $x \in X$ el conjunto $\{x\}$ es nunca denso (ejercicio).

Toda bola abierta con $x$ tiene otro elemento en el interior

Si la unión de todos los conjuntos de puntos $\underset{x \in X}{\bigcup}\{x\}=X \,$ fuera numerable tendríamos un espacio completo que contradiga el teorema de Baire. Por lo tanto, si $X$ es completo y sin puntos aislados, entonces es no numerable.

Ejemplo: El espacio euclidiano $\mathbb{R}$ es completo y sin puntos aislados, por lo tanto es no numerable.

El teorema de Baire ha dado resultados fundamentales en el análisis. Los siguientes tres teoremas pueden consultarse en:
Kesavan, S., Functional Analysis (2a ed.). Chennai, India: Editorial Springer, 1996. Pág. 99 y 106.

Teorema de Banach-Steinhaus o de acotación uniforme. Sea $V$ un espacio de Banach y $W$ un espacio lineal normado. Sea $I$ un conjunto indexado para cada $i \in I$ sea $T_i \in \mathcal{L}(V,W).$ Entonces existe $M>0$ tal que

$\norm{T_i} \leq M$, para todo $i \in I$

o bien $\underset{i \in I}{sup} \, \norm{T_i(x)} = \infty$ para todo $x \in G_\delta \subset V.$

Teorema de la función abierta. Sean $V,W$ espacios de Banach y sea $T \in \mathcal{L}(V,W)$ suprayectivo. Entonces $T$ es una función abierta, esto es, si $A \subset V$ es abierto en $V$ entonces $T(A) \subset W$ es abierto en $W.$

Corolario. (También llamado teorema de la función inversa). Sean $V,W$ espacios de Banach y sea $T \in \mathcal{L}(V,W)$ biyectivo, entonces $T$ tiene inversa $T^{-1}$ y esta es continua.

El teorema de la función inversa también es conocido como el teorema de Banach sobre el operador inverso como puede observarse en el problema 3 de Kolmogorov, A.N., Fomin, S.V., Introductory Real Analysis. New York: Dover Publications Inc, 1975. Pág 238. En la página 229 del libro mencionado encontraremos también el:

Teorema Banach: Sea $A$ un operador lineal invertible y acotado que hace un mapeo de un espacio de Banach $E$ en otro espacio de Banach $E_1,$ entonces el operador inverso $A^{-1}$ también es acotado.

También recomendamos visualizar la conferencia
Pichardo, Roberto. «¿Teoría de Conjuntos?, ¡Pero si es bien fácil!». Instituto de Matemáticas de la UNAM. Publicado el 24 de marzo del 2017. YouTube video 59:57
https://www.youtube.com/watch?v=hLFit88zTYk

Roberto Pichardo comienza a describir la Hipótesis del Continuo en el minuto 14 hasta contarnos que esta es equivalente a la igualdad $c:=|\mathbb{R}| = \mathcal{N_1}.$ El teorema de Baire permite mostrar que

\begin{align*}
\mathcal{N_1} \leq cov(\mathcal{M}) \leq c \\
\mathcal{N_1} \leq non(\mathcal{M}) \leq c\\
\mathcal{N_1} \leq add(\mathcal{M}) \leq c
\end{align*}

Y en consecuencia, esos tres cardinales son iguales.

Más adelante…

Descubriremos que aunque un espacio no sea completo, es posible extenderlo a uno donde sí lo sea. tendremos así la llamada «completación de un espacio métrico.»

Tarea moral

  1. ¿Es un conjunto nunca denso un conjunto denso?
  2. Da un ejemplo de un conjunto denso que no sea nunca denso.
  3. En la demostración del teorema de Baire, argumenta por qué es posible elegir las bolas con el radio indicado.
  4. Demuestra que un conjunto $A$ es nunca denso, si y solo si $Int(\overline{A}) = \emptyset .$
  5. Prueba que si $x \in X$ con $X$ espacio métrico es un punto de acumulación, entonces $\{x\}$ es nunca denso.

Enlaces

Geometría Moderna II: Teorema de Miquel

Por Armando Arzola Pérez

Introducción

En geometría euclidiana existen los Teoremas de Miquel, dados por el matemático Auguste Miquel, los cuales son relacionados con circunferencias concurrentes.

Teoremas de Miquel

Teorema. Dado el triángulo $\triangle ABC$ y $DEF$ tres puntos cualesquiera en los lados $BC$, $CA$ y $AB$ respectivamente, entonces los circuncirculos de $AEF$, $BFD$ y $CDE$ se intersecan en un punto en común, este es el punto de Miquel.

Demostración. Sea el triángulo $\triangle ABC$ y sean los tres puntos $DEF$ en los lados de $BC$, $CA$ y $AB$ respectivamente, entonces los circuncirculos $CDE$ y $BFD$ se intersecan en un punto $M$. Solo falta demostrar que el cuadrilátero $AFOE$ es cíclico, ya que probaría que la circunferencia $AFE$ pasa por el punto $M$.

Teorema de Miquel 1

Tracemos $FM$, $ME$ y $MD$, de esta forma se tienen los tres cuadriláteros $FMDB$, $MECD$ y $FAEM$. Tenemos el ángulo $\angle AEM = \alpha $ donde el ángulo $\angle CEM = 180^o – \alpha$, como el cuadrilátero $MECD$ es cíclico entonces el ángulo $\angle MDC = \alpha $, por lo cual el ángulo $\angle MDB = 180 ^o – \alpha$.
Ahora, como el ángulo $\angle MDB = 180^o – \alpha$ y el cuadrilátero $FMDB$ es cíclico, entonces el ángulo $\angle BFM = \alpha$, por lo cual el ángulo $\angle MFA = 180 ^o – \alpha$.

Si observamos el cuadrilátero $FAEM$ sus dos ángulos opuestos $\angle MFA$ y $\angle AEM$ suman $180^o$, por lo cual el cuadrilátero $FAEM$ es cíclico. Por lo tanto, el circuncirculo de $FAE$ pasa por el punto $M$ y los tres circuncirculos se intersecan en el punto $M$ ($M$ es el punto de Miquel).

Teorema de Miquel 2

$\square$

El punto $M$ es el punto de Miquel con respecto al triángulo $\triangle ABC$
El triángulo $DEF$ cuando $D$, $E$ y $F$ no son colineales, es llamado un triángulo de Miquel $M$.
Los tres circuncirculos de $AEF$, $BFD$ y $CDE$ son llamadas las circunferencias de Miquel de los puntos $D$, $E$ y $F$.

Teorema. (Cuadrilátero Completo) Sea $ABCDEF$ un cuadrilátero completo, entonces las circunferencias circunscritas de los cuatro triángulos $EAD$, $EBC$, $FAB$ y $FDC$ tienen un punto en común, $M$ llamado punto de Miquel.

Demostración.

Teorema de Miquel

De los triángulos $AEF$ y $ACB$ trazamos sus circunferencias circunscritas que se cortan en un punto $M$.

Teorema de Miquel 4

Mostremos que el cuadrilátero $MECD$ es cíclico, ya que mostraría que su circunferencia circunscrita pasa por $M$.
Observemos el ángulo $\angle DCM = \alpha$ y $\angle MCB = 180 ^o – \alpha$, ahora tenemos el cuadrilátero cíclico $MCBA$ entonces el ángulo $\angle MAB = \alpha$, el cuadrilátero cíclico $MAFE$ tiene el ángulo $\angle MAF = \alpha$ entonces $\angle MEF = 180 ^o – \alpha$.

Como $\angle MEF = 180^o – \alpha$ entonces $\angle MED = \alpha$, ahora veamos el cuadrilátero $MECD$ tiene los ángulos $\angle MED = \alpha $ y $\angle DCM = \alpha$, lo que nos lleva a que el cuadrilátero $MECD$ es cíclico y su circunferencia circunscrita pasa por $M$.

Teorema de Miquel 6

Falta por demostrar que el cuadrilátero $MDBF$ es cíclico.
Sea el ángulo $\angle MFE = \gamma$, el cuadrilátero $MAFE$ es cíclico, entonces tiene un ángulo $\angle MAE = \gamma = \angle MFE$. Observemos ahora el cuadrilátero $MCBA$ cíclico, con su ángulo $\angle MAC = \gamma$ y como es cíclico entonces el ángulo $\angle MBC = \gamma$.
Notemos que el cuadrilátero $MDBF$ tiene los ángulos $\angle MFD = \gamma$ y $\angle MBD = \gamma$, por lo cual el cuadrilátero $MDBF$ es cíclico, entonces su circunferencia circunscrita pasa por $M$.

Por lo tanto, las circunferencias circunscritas de los cuatro triángulos $EAD$, $EBC$, $FAB$ y $FDC$ tienen un punto en común $M$ llamado punto de Miquel $M$.

$\square$

Círculo de Miquel

Respecto a las cuatro circunferencias del cuadrilátero completo con centros $O_1, O_2, O_3 $ y $O_4$ y el punto de Miquel $M$ son conciclicos. Por lo cual la circunferencia que contiene a estos cinco puntos se llama Círculo de Miquel.

Teoremas de la línea de Simson del punto de Miquel

Teorema. Sea una circunferencia circunscrita de un triángulo con un punto cualquiera de esta circunferencia, bajamos perpendiculares a los tres lados, entonces los pies de estas perpendiculares están en una línea recta (Línea de Simson).

Teorema. Los pies de las perpendiculares de $M$ de los cuatro lados del cuadrilátero completo son colineales.

Teoremas del pentágono y los seis círculos de Miquel

Teorema. (Pentágono) Sea $ABCDE$ un pentágono cualquiera, prolongando todos los lados, estos se intersecan en los puntos $F$, $G$, $H$, $I$ y $J$, entonces los puntos de intersección de las cinco circunferencias circunscritas $ABF$, $BCG$, $CDH$, $DEI$ y $EAJ$ son conciclicos.

Teorema. (Seis Círculos) Sean los puntos $A$, $B$, $C$ y $D$ de una circunferencia y las circunferencias que pasan por los pares de puntos adyacentes, las intersecciones de estas circunferencias en $E$, $F$, $G$ y $H$ se encuentran en una sexta circunferencia en común.

Más adelante…

Al igual que los Teoremas de Miquel, se abordarán ahora los Teoremas de Carnot.

Entradas relacionadas

Geometría Moderna II: Teorema de Stewart

Por Armando Arzola Pérez

Introducción

Se discutirán a través de esta unidad teoremas selectos debido a su importancia en la solución de otros problemas, en esta nota será el Teorema de Stewart.

Teorema de Stewart

Teorema. Sea el triángulo $ABC$ con lados $BC,CA,AB$ los cuales sus longitudes son $a,b,c$ respectivamente, y sea un punto $D$ cualquiera en $BC$ donde $BC=m$ y $DC=n$, además si la longitud de $AD=d$, entonces

$ad^2=mb^2+nc^2-amn.$

Teorema de Stewart 1

Demostración Aplicando la Ley de cosenos a los triángulos $\triangle ABD$ en el ángulo $\angle ADB $ y el $\triangle ADC$ en el ángulo $\angle ADB$, se tiene

$c^2=d^2+m^2-2dm cos \angle ADB$
y
$b^2=d^2+n^2+2dn cos \angle ADB.$

Si multiplicamos ambas ecuaciones por $n$ y $m$ respectivamente tenemos:

$nc^2=nd^2+nm^2-2dnm cos \angle ADB$
y
$mb^2=md^2+mn^2+2dnm cos \angle ADB.$

Sumando ambas ecuaciones se tiene:

$nc^2+mb^2=nd^2+md^2+nm^2+mn^2.$

Ahora como $m+n=a$, se tiene:

$nc^2+mb^2=(n+m)d^2+(n+m)mn$
$nc^2+mb^2=ad^2+amn.$

Por lo tanto, concluimos que:

$ad^2=mb^2+nc^2-amn.$

$\square$

Demostración. (Por Pitágoras) Se tiene la altura de $A$ a $BC$ que corta en el punto $H$, donde $AH=h$, $CH=x$, $HD=y$.

Teorema de Stewart 2

Aplicando el Teorema de Pitágoras al triángulo $\triangle AHC$, $\triangle AHD$ y al $\triangle AHB$ se tiene lo siguiente respectivamente:

$b^2=x^2+h^2$ , $d^2=h^2+y^2$ y $c^2=h^2+(m+y)^2.$

Además se tiene que $y+x=n$ entonces $x=n-y$. Si lo sustituimos en $b^2=h^2+x^2$ se tiene $b^2=h^2+(n-y)^2$ y lo multiplicamos por $m$:

$mb^2=mh^2+m(n-y)^2.$

De igual forma multipliquemos $c^2=h^2+(m+y)^2$ por $n$:

$nc^2=nh^2+n(m+y)^2.$

Entonces sumando $md^2 + nc^2$ se tiene:

$mb^2+nc^2=mh^2+m(n-y)^2+nh^2+n(m+y)^2$
$mb^2+nc^2=(m+n)h^2+m(n^2-2ny+y^2)+n(m^2+2my+y^2)$
$mb^2+nc^2=(m+n)h^2 + mn^2-2mny+my^2+nm^2+2mny+ny^2$
$mb^2+nc^2=(m+n)h^2+mn^2+nm^2+my^2+ny^2$
$mb^2+nc^2=mn(n+m)+(m+n)(y^2+h^2)$
$mb^2+nc^2=(m+n)[mn+y^2+h^2].$

Sustituyendo $d^2=h^2+y^2$ y $m+n=a$ en la ecuación resultante:

$mb^2+nc^2=a[mn+d^2].$

Por lo tanto,

$ad^2=mb^2+nc^2-amn.$

$\square$

Conclusión

Es gracias a este Teorema que se puede encontrar la longitud de la recta $AB$ cuando $D$ es un punto cualquiera en la recta $BC$ y se tiene la razón en la cual $D$ divide a $BC$, ya que se conocen las longitudes y signos de $BD$ y $DC$ en este caso.
De igual forma, las longitudes de las medianas, las simedianas y las bisectrices de los ángulos de un triángulo, se pueden encontrar usando el Teorema de Stewart.

Con el uso del teorema de Stewart se puede resolver el siguiente Teorema.

Teorema. Si las bisectrices de dos ángulos interiores de un triángulo son iguales, el triángulo es isósceles.

Más adelante…

Se abordará el Teorema de Miquel.

Entradas relacionadas