La medida exterior – Parte 1

Por César Mendoza

Introducción

Como lo habíamos adelantado, ya podemos definir una primera noción de medida. La idea es tomar «la mejor aproximación» de un conjunto que podamos hacer mediante cubiertas de rectángulos cerrados.

Un primer intento de definir medida: La medida exterior.

Definición. Dado $\Omega \subseteq \mathbb{R}^n$ definimos su medida exterior en $\mathbb{R}^n$, $\lambda^*(\Omega)$ como: $$\lambda^*(\Omega):=\inf \left\{ \sum_{i\in I} |R_i| \ : \ \Omega \subseteq \bigcup_{i\in I} R_i \right\} $$ Donde $R_1,R_2,\dots$ son rectángulos e $I$ es un conjunto de índices a lo más numerable.

Observación. En la definición anterior usamos la convención de que $\lambda^*(\Omega)=\infty$ si y sólo si $\sum_{i\in I} |R_i|$ diverge ($=\infty$) para cualquier cubierta numerable de rectángulos $\{ R_i\}_{i\in I}$ (i.e. «cuando el conjunto es demasiado grande»). Esta convención es compatible con todos los cálculos debajo.

Para que la definición tenga sentido, habría que asegurar que cualquier subconjunto de $\mathbb{R}^n$ se puede cubrir con una cantidad numerable de rectángulos. Esto siempre es posible, considera, por ejemplo, la sucesión de rectángulos anidados $[-k,k]^n$ para $k=1,2,\dots$.

Es fácil convencerse de la necesidad de considerar subcubiertas posiblemente infinitas en la definición. En general no es claro como se podrían aproximar «bien» subconjuntos no acotados con una cantidad finita de rectángulos; ni conjuntos «curvos» como bolas o cilindros. La restricción de que el conjunto de índices sea a lo más numereable es una tecnicalidad. No es obvio como definir una suma con una cantidad no numerable de elementos y con las formas usuales de hacerlo normalmente la suma diverge si hay una cantidad no numerable de términos positivos.

Por simplicidad, en esta entrada nos referiremos a los rectángulos cerrados simplemenete como rectángulos.

Primeras propiedades de la medida exterior.

Proposición.

  1. (No-negatividad) La medida exterior de cualquier subconjunto de $\mathbb{R}^n$ es no negativa.
  2. (Medida exterior del conjunto vacío) $\lambda^*(\emptyset)=0$.
  3. (Monotonía) Si $A\subseteq B\subseteq \mathbb{R}^n$ entonces $\lambda^*(A)\leq \lambda^*(B)$.
  4. (Invarianza bajo traslaciones) Si $A\subseteq \mathbb{R}^n$ y $x\in \mathbb{R}^N$, entonces $\lambda^*(A)=\lambda^*(x+A)$.
  5. (Dilataciones) Si $A\subseteq \mathbb{R}^n$ y $c\in \mathbb{R}$, entonces $\lambda^*(cA)=|c|^n\lambda^*(A)$ (donde $cA= \{ ca \ : \ a\in A \}$).

Demostración.

  1. Notemos que cualquier suma de volúmenes de rectángulos es $\geq 0$ pues el volumen de cualquier rectángulo es $\geq 0$. Por tanto, para cualquier $\Omega$, 0 es cota inferior del conjunto sobre el que tomamos ínfimo, de donde $0\leq \lambda^*(\Omega)$.
  2. Por vacuidad, cualquier rectángulo degenerado o con volumen arbitrariamente pequeño funge como cubierta para el vacío, por tanto, $\lambda^*(\emptyset)\leq 0$. Por no-negatividad, $\lambda^*(\emptyset)\geq 0$. Se sigue 2.
  3. Si $A\subseteq B$, cualquier cubierta de rectángulos para $B$ es una cubierta de rectángulos para $A$. Tomando ínfimos sobre todas las cubiertas posibles se sigue 3.
  4. A cualquier cubierta con rectángulos de $A$: $R_1,R_2,\dots$, le podemos asociar una cubierta «trasladada» para $x+A$: $x+R_1,x+R_2,\dots$. La suma de los volúmenes de los rectángulos sobre ambas cubiertas es igual debido a la invarianza bajo traslaciones del volumen de rectángulos. Inversamente a cualquier cubierta de $x+A$: $Q_1,Q_2,\dots$ le podemos asociar la cubierta de $A$: $-x+Q_1,-x+Q_2,\dots$ la suma de los volúmenes coincide por la misma razón. Se sigue 4. pues los conjuntos sobre los que tomamos ínfimos son de hecho iguales.
  5. Similarmente al inciso anterior, podemos biyectar las cubiertas de $A$ con las de $cA$: A la cubierta $R_1,R_2,\dots$ de $A$ le asociamos la cubierta $cR_1,cR_2,\dots$ de $cA$ y viceversa. Por las propiedades de dilatación del volumen de rectángulos: $$\sum_{k=1}^{\infty}|cR_k|=|c|^n\sum_{k=1}^{\infty}|R_k|.$$ Tomando ínfimos sobre el conjunto de cubiertas se sigue 5.

$\square$

De momento, hacemos la distinción entre volumen y medida exterior. Aunque es tentador pensar que $|R|=\lambda^*(R)$ si $R$ es un rectángulo cerrado (y de hecho es cierto), ¡hay que probarlo! La desigualdad $\lambda^*(R)\leq |R|$ es obvia al considerar la cubierta de $R$ con el propio $R$. Sin embargo la desigualdad opuesta requiere más trabajo. No es trivial probar que $|R|$ es cota inferior de las sumas de volumenes sobre cubiertas de rectángulos para $R$.

Algunos ejemplos básicos

En general, es bastante complicado calcular la medida exterior de un conjunto arbitrario. Sin herramientas más avanzadas, lo único que podemos hacer es dar cubiertas de rectángulos cuya suma de volumenes se aproxime cada vez más a cierto valor y probar que dicho valor es una cota inferior para cualquier tal suma.
Cuando un conjunto tiene medida exterior cero, este proceso se suele simplificar bastante pues ya sabemos a priori que 0 es una cota inferior, así que basta dar cubiertas de rectángulos tal que las sumas de volúmenes se hagan arbitrariamente pequeñas.
Veamos un par de ejemplos importantes de conjuntos con medida exterior cero (o conjuntos nulos). Próximamente, aplicaremos métodos similares para calcular la medida exterior de otros conjuntos sencillos, como rectángulos y triángulos. Las técnicas de teoría de integración facilitarán en gran medida el cálculo de la medida (exterior) de conjuntos mucho más complicados.

Ejemplo. La medida exterior de un punto $\{ x \}$ con $x\in \mathbb{R}^n$ es 0. Por no-negatividad $\lambda^*(\{ x \})\geq 0$. Como el propio $\{ x \}$ es un rectángulo de volumen 0 (degenerado), al considerar la cubierta trivial $\{ x \}$, por definición de ínfimo $\lambda^*(\{ x \} )\leq |\{ x\}|=0$.

$\triangle$

Ejemplo. La medida exterior de un hiperplano $H=\mathbb{R}^{n-1}\times\{ 0\}\subseteq \mathbb{R}^n$ es 0. Consideremos la cubierta con rectángulos degenerados $\{ R_k \}_{k=1}^{\infty}$ donde $$R_k= [-k,k]\times[-k,k]\times\dots\times [-k,k]\times \{ 0\}.$$ Es claro que $H=\bigcup_{k=1}^{\infty}R_k$ y $|R_k|=0$ para todo $k$. Así $$ 0\leq \lambda^*(H)\leq \sum_{k=1}^{\infty}|R_k|=\sum_{k=1}^{\infty}0=0.$$ De donde $\lambda^*(H)=0$.

$\triangle$

Ejemplo. La medida exterior de un conjunto numerable $S=\{x_1,x_2\dots \}$ es 0. Uno simplemente puede tomar la cubierta trivial con rectángulos degenerados $\{x_1\},\{x_2 \},\dots$ Como cada uno de estos tiene volumen 0, usando la no-negatividad y la definición de ínfimo: $$0\leq \lambda^*(S)\leq \sum_{k=1}^{\infty} |\{ x_k \}|=\sum_{k=1}^{\infty}0=0.$$ De manera alternativa (y posiblemente mas ilustrativa para lo que sigue) podemos aproximar usando solamente rectángulos no degenerados:

Sea $\varepsilon>0$ arbitrario. Para cada $k=1,2,\dots$ tomemos un rectángulo no degenerado $R_k$ tal que $x_k\in R_k$ y el volumen de $R_k$ sea $<\frac{\varepsilon}{2^{k}}$ (siempre podemos hacer esto, imitando por ejemplo el argumento en la aproximación mediante rectángulos abiertos). Consideremos la cubierta por rectángulos $S\subseteq \bigcup_{k=1}^{\infty} R_k$, luego: $$0\leq \lambda^*(S)\leq \sum_{k=1}^{\infty}|R_k|<\sum_{k=1}^{\infty} \frac{\varepsilon}{2^{k}}=\varepsilon.$$

Como lo anterior es cierto para cualquier $\varepsilon>0$ necesariamente $\lambda^*(S)=0$.

$\triangle$

El ejemplo anterior es un caso particular de un resultado más general que será útil en el futuro.

Proposición. Si $A_1,A_2,\dots$ son subconjuntos de $\mathbb{R}^n$ tales que $\lambda^*(A_k)=0$ para todo $k\in \mathbb{N}$, entonces $$\lambda^*\left( \bigcup_{k=1}^{\infty}A_k \right)=0.$$

Demostración. Fijemos $\varepsilon>0$. Como $\lambda^*(A_k)=0$, por definición de ínfimo podemos encontrar una colección de rectángulos $\{ R^k_j\}_{j=1}^{\infty}$ tales que $$A_k\subseteq \bigcup_{j=1}^{\infty} R^k_j$$ Y $$\sum_{j=1}^{\infty}|R^k_j|<\frac{\varepsilon}{2^k}.$$ Consideremos la cubierta de rectángulos $\{ R^k_j\}_{j,k\in \mathbb{N}}$. Notemos que $$\bigcup_{k=1}^{\infty}A_k\subseteq \bigcup_{k,j\in \mathbb{N}}R^k_j.$$ Por lo tanto \begin{align*} 0 &\leq \lambda^*\left( \bigcup_{k=1}^{\infty} A_k \right) \\ &\leq \sum_{j,k\in \mathbb{N}}|R^k_j| \\ &=\sum_{k=1}^{\infty}\sum_{j=1}^{\infty}|R^k_j| \\ &\leq \sum_{k=1}^{\infty} \frac{\varepsilon}{2^k} \\ &= \varepsilon.\end{align*}

Como lo anterior es cierto para cualquier $\varepsilon>0$, concluimos que $$\lambda\left( \bigcup_{k=1}^{\infty}A_k \right)=0.$$

$\square$

Más adelante…

Continuaremos estudiando la medida exterior. Veremos una definición equivalente de la medida exterior usando rectángulos abiertos. También probaremos que el volumen coincide con la medida exterior de un rectángulo.

Tarea moral

  • Sea $H^k_a$ un hiperplano de la forma $H^k_a=\{ (x_1,x_2,\dots, x_k,\dots, x_n) \ | \ x_k=a\}$. Demuestra que $\lambda^*(H^k_a)=0$.
  • Demuestra que si $A\subseteq B$ y $\lambda^*(B)=0$, entonces $\lambda^*(A)=0$.
  • Demuestra que para cualquier rectángulo $R$, $\lambda^*(\partial R)=0$, donde $\partial R$ denota la frontera del rectángulo. [SUGERENCIA: $\partial R$ está contenida en una unión finita de hiperplanos].

Rectángulos y su volumen

Por César Mendoza

Introducción

Si queremos construir una noción más general de integración, un requisito mínimo es que se debe ajustar a la idea intuitiva de que la integral (al menos en $\mathbb{R}$) es el «área bajon la curva» de una función. Es entonces natural pensar en que primero hay que definir de manera precisa y lo más general posible conceptos como longitud, área, volúmen, y sus análogos en dimensiones más altas. Ésta es precisamente la idea de medida en $\mathbb{R}^n$. Más adelante construiremos la integral de Lebesgue sobre este concepto.

Idealmente, nos gustaría asignarle a cada subconjunto $A\subseteq \mathbb{R}^n$ algún número no negativo $\lambda (A)$ (su medida en $\mathbb{R}^n$). Para que ésta noción tenga sentido, debería satisfacer ciertas propiedades «intuitivas» y a las que ya estamos acostumbrados en dimensiones bajas. Las siguientes son deseables:

  • Monotonía. Si $A\subseteq B$ son subconjuntos de $\mathbb{R}^n$, entonces $\lambda(A)\leq \lambda(B)$. Pues $B$ es «más grande» que $A$.
  • Aditividad. Si $A\cap B=\emptyset$ son subconjuntos ajenos, entónces $\lambda(A\cup B)=\lambda(A)+\lambda(B)$.
  • Normalización. La medida de un rectángulo generalizado, es decir un producto de intervalos $\prod_{i=1}^{n}[a_i,b_i]\subseteq\mathbb{R}^n$, debería ser el producto de las longitudes de sus lados: $\prod_{i=1}^{n}(b_i-a_i)$. Ésta idea coincide con el cálculo elemental de áreas de rectángulos y volúmenes de prismas rectangulares.

Podemos usar las ideas anteriores como punto de partida para intentar definir la medida de conjuntos más generales. El camino que seguiremos es: Tomar a los rectángulos como «unidades de medida» (simulando el punto 3) y buscar la mejor forma de aproximar un conjunto «por fuera» mediante rectángulos.

Rectángulos y su volumen.

Definición. Por intervalos (acotados) nos referimos a conjuntos no vacíos de $\mathbb{R}$ de la forma $[a,b]:=\{x\in \mathbb{R} \ : \ a\leq x \leq b \}$; $[a,b):=\{x\in \mathbb{R} \ : \ a\leq x < b \}$; $(a,b]:=\{x\in \mathbb{R} \ : \ a< x \leq b \}$; $(a,b):=\{x\in \mathbb{R} \ : \ a< x < b \}$, donde $a\leq b$ son números reales. Llamaremos a los intervalos de la forma $[a,b]$ como intervalos cerrados y a los de la forma $(a,b)$ como intervalos abiertos. Definimos la longitud $|I|$ de un intervalo $I=[a,b],[a,b),(a,b],(a,b)$ como $$|I|=b-a.$$ La longitud de un intervalo puede ser 0. A los intervalos de longitud 0 (i.e. que constan de un sólo elemento) los llamaremos «degenerados«.

Para esta parte, trabajaremos casi exclusivamente con intervalos cerrados o abiertos y acotados. Por brevedad nos referiremos a estos simplemente como intervalos.

Definición. Un rectángulo cerrado (abierto) en $\mathbb{R}^n$ es un producto cartesiano $$R:=I_1\times\ I_2\times \dots \times I_n.$$ Donde $I_1,I_2,\dots, I_n$ son intervalos cerrados (abiertos). Definimos el volúmen del rectángulo $R=I_1\times\ I_2\times \dots \times I_n$ como $$|R|=\prod_{k=1}^{n}|I_k|.$$ Si alguno de los intervalos componente de un rectángulo es degenerado, diremos también que el rectángulo es «degenerado».

Observaciones.

  • Para cualquier rectángulo $R$, su volumen es no negativo (posiblemente 0) y finito: $0\leq |R| < \infty$. Un rectángulo tiene volúmen 0 si y sólo si es degenerado.
  • Los intervalos cerrados/abiertos son rectángulos en $\mathbb{R}$. En este caso su volumen coincide con su longitud.
  • Si $R\subseteq Q$ son rectángulos, entónces $|R|\leq |Q|$. Pues la única posibilidad es que al descomponer $R$ y $Q$ como producto de intervalos, cada intervalo en la descomposición de $R$ sea un subintervalo del correspondiente a $Q$ y la monotonía es inmediata en el caso de intervalos.
  • La cerradura de un rectángulo $R$ es un rectángulo cerrado $\overline{R}$. Además $|R|=|\overline{R}|$.
  • Los rectángulos cerrados son subconjuntos cerrados y acotados en $\mathbb{R}^n$ (por ende compactos). Los rectángulos abiertos son subconjuntos abiertos de $\mathbb{R}^n$. La cerradura de un rectángulo abierto es un rectángulo cerrado del mismo volúmen.
  • El volúmen de un rectángulo, coincide con la noción de «medida» que nos da la integral de Riemann, a saber, la medida de Jordan: $J(R)=\int \chi_R = |R|$, donde $\int$ denota la integral de Riemann sobre algún rectángulo cerrado y no degenerado que contenga a $R$ y $\chi_R$ es la función característica de $R$.

Las siguientes propiedades del volúmen de los rectángulos nos serán útiles más adelante.

Proposición. (Aproximación por rectángulos abiertos y cerrados). Si $R$ es un rectángulo cerrado, entónces $$|R|=\inf \{|Q| \ :\ R\subseteq Q \text{ y $Q$ es un rectángulo abierto} \}.$$ Similarmente Si $R$ es abierto, entónces $$|R|=\sup \{|Q| \ :\ Q\subseteq R \text{ y $Q$ es un rectángulo cerrado}\ \}.$$

Demostración. Para el caso en el que $R=[a_1,b_1]\times [a_2,b_2]\times \dots \times [a_n,b_n]$ es cerrado, de las observaciones sabemos que $|R|\leq |Q|$ para cualquier rectángulo abierto tal que $R\subseteq Q$, de donde $$|R|\leq \inf\{|Q| :\ R\subseteq Q \text{ y $Q$ es un rectángulo abierto} \} .$$

Por otro lado, al definir el rectángulo abierto $$Q_{\varepsilon}=(a_1- \varepsilon,a_1+ \varepsilon ) \times (a_2-\varepsilon,a_2+\varepsilon)\times \dots \times (a_n-\varepsilon,a_n+\varepsilon)$$

Es claro que $R\subseteq Q_{\varepsilon}$ para todo $\varepsilon>0$. Usando la definición, $|Q_{\varepsilon}|$ se puede escribir como $$\prod_{k=1}^{n}(b_k-a_k)+\varepsilon f(\varepsilon)=|R|+\varepsilon f(\varepsilon)$$ Donde $f(\varepsilon)$ es algún polinomio en $\varepsilon$. Por continuidad se sigue que $\lim_{\varepsilon \to 0^+}|Q_{\varepsilon}|=|R|$. Concluimos $$|R|\geq \inf \{|Q| \ :\ R\subseteq Q \text{ y $Q$ es un rectángulo abierto} \}.$$ El argumento para rectángulos abiertos es similar.

$\square$

Proposición (Descomposición en subrectángulos preserva volúmen). Sea $R=[a_1,b_1]\times [a_2,b_2]\times \dots \times [a_n,b_n]$ un rectángulo cerrado y no degenerado. Supongamos que para cada $i=1,2,\dots ,n$ $$a_i=c_i^1<c_i^2<\dots <c_i^{m_i}=b_i.$$ Son puntos intermedios del intervalo $[a_i,b_i]$. Esto induce una descomposición de $R$ en subrectángulos: $$Q_{i_1,i_2,\dots, i_n}=[c_1^{i_1},c_1^{i_1+1}]\times [c_2^{i_2},c_2^{i_2+1}]\times \dots \times [c_n^{i_n},c_n^{i_n+1}].$$ Con $1\leq i_1 < m_1,1\leq i_2 < m_2, \dots ,1\leq i_n < m_n $. Entonces:
$$|R|=\sum_{i_1,i_2,\dots, i_n} |Q_{i_1,i_2,\dots, i_n}|.$$

Demostración. Denotemos por $J$ a las $n$-tuplas de la forma $(i_1,i_2,\dots, i_n)$ con $1\leq i_1 < m_1,1\leq i_2 < m_2, \dots 1\leq i_n < m_n $. Si definimos $d_k^j=(c_k^{j+1}-c_k^j)$ (los lados de los subrectangulos), tenemos que $(a_k-b_k)=\sum_{j=1}^{m_{i}-1} d_k^j$. Luego, lo anterior se reduce a probar:
$$\prod_{k=1}^{n}(b_k-a_k)=\prod_{k=1}^{n}\sum_{j=1}^{m_i-1}(d_k^j)=\sum_J \prod_{k=1}^{n}(d_k^{i_k}).$$

La ultima igualdad es inmediata por distributividad. (Para convencerte de esto, piensa que para desarrollar el producto de en medio, para cada $k$ hay que escoger un término $j=i_k$, multiplicar estos términos para obtener $d_1^{i_1}d_2^{i_2}\dots d_n^{i_n}$ y luego sumar sobre todas las posibles elecciones, que es precisamente el término derecho ).

$\square$

Proposición. Si $R$ es un rectángulo cerrado cubierto por una cantidad finita $N$ de rectángulos (cerrados o abiertos) no degenerados: $R\subseteq \bigcup_{k=1}^{N} Q_k$, entonces $$|R|\leq \sum_{k=1}^{N} |Q_k|.$$

Demostración. Tomando las cerraduras de $Q_1,Q_2,\dots, Q_N$ es suficiente probarlo cuando la cubierta consta de rectángulos cerrados. Al ser una cantidad finita de rectángulos, podemos encontrar un rectángulo $P$ suficientemente grande que contenga a $R,Q_1,Q_2,\dots, Q_N$. Proyectemos los extremos de los intervalos componente de cada uno de los rectángulos $R,Q_1,Q_2,\dots, Q_N$ sobre los intervalos componente de $P$. Por construcción, esto induce descomposiciones en subrectángulos en cada uno de $P,R,Q_1,Q_2,\dots, Q_n$ (observa la figura). Denotemos todos los subrectángulos (de $P$) como $S_1,S_2,\dots, S_M$. Como $R\subseteq \bigcup_{k=1}^{N} Q_k$, cada subrectángulo $S$ de $R$ debe ser también un subrectángulo de algún $Q_k$. Luego, por la proposición anterior:
$$|R|=\sum_{S_j\subseteq R} |S_j|\leq \sum_{k=1}^{N} \sum_{S_j\subseteq Q_k} |S_j|=\sum_{k=1}^{N}|Q_k|.$$

$\square$

Proposición (Invarianza bajo traslaciones). Si $R=I_1\times I_2\times \dots \times I_n$ es un rectángulo, entonces la traslación por $v=(v_1,v_2,\dots, v_n)\in \mathbb{R}^n$, $v+R$ es un rectángulo con el mismo volumen que $R$ (Donde definimos la traslación por el vector $x\in \mathbb{R}^n$ de un conjunto $B$ como $x+B=\{x+b\ : \ b\in B \}$).

Demostración. Lo anterior se cumple para intervalos abiertos/cerrados, por ejemplo si $x\in \mathbb{R}$, $x+[a,b]=[a+x,b+x]$ y $|I|=(b-a)=((b+x)-(a-x))=|x+I|$. El otro caso es similar.

Para el caso de rectángulos, es fácil ver que $v+R=(v_1+I_1)\times (v_2+I_2)\times \dots \times (v_n+I_n)$. De donde por el caso anterior: $$|R|=\prod_{k=1}^{n}|I_k|=\prod_{k=1}^{n}|v_k+I_k|=|v+R|.$$

$\square$

Proposición (Dilataciones). Si $R=I_1\times I_2\times \dots \times I_n$ es un rectángulo, entonces la dilatación $cR$ es un rectángulo con $$|cR|=|c|^n|R|. $$ (Donde definimos la dilatación por $c\in \mathbb{R}$ de un conjunto $B$ como $cB=\{cb\ : \ b\in B \}$).

Demostración. Sin pérdida de generalidad, supongamos que $R=[a_1,b_1]\times \dots \times [a_n,b_n]$ es un rectángulo cerrado. Si $c\geq 0$, es fácil ver que $cR=[ca_1,cb_1]\times \dots \times [ca_n,cb_n]$. De modo que: $$|cR|=c(b_1-a_1)\times \dots \times c(b_n-a_n)=c^n (b_1-a_1)\times \dots \times (b_n-a_n)=c^n|R|. $$

Si $c<0$, entonces $cR=[cb_1,ca_1]\times \dots \times [cb_n,ca_n]$. Luego $$|cR|=(-c)(b_1-a_1)\times \dots \times (-c)(b_n-a_n)=|c|^n (b_1-a_1)\times \dots \times (b_n-a_n)=|c|^n|R|. $$

$\square$

Más adelante…

Definiremos nuestra primera noción de medida: La medida exterior, en la que el volúmen de rectángulos juega un papel fundamental.

Tarea moral

  • Decimos que un conjunto $P\subseteq \mathbb{R}^n$ es un polígono especial si puede ser representado como una unión finita de rectángulos cerrados $R_1,R_2,\dots,R_m$: $$A=\bigcup_{k=1}^{m}R_k.$$
    • Demuestra que todo polígono especial $P$ se puede expresar como una unión finita de rectángulos cerrados y con interiores ajenos $P=\bigcup_{k=1}^{m’}Q_k$. ¿La descomposición es única?
    • Con $Q_1,Q_2,\dots,Q_{m’}$ como en el inciso anterior, definimos el volumen del polígono especial $P$ como: $$|P|=\sum_{k=1}^{m’}|Q_k|.$$ Demuestra que el volumen está bien definido, es decir, no depende de la colección de rectángulos con interiores ajenos $Q_1,Q_2,\dots,Q_{m’}$.
    • Sea $R_1,R_2,\dots, R_N$ una colección de rectángulos (no necesariamente cerrados), tales que $$P\subseteq \bigcup_{k=1}^{N}R_k.$$ Demuestra que $$|P|\leq \sum_{k=1}^{N}|R_k|.$$
    • Demuestra que si $P$ es un polígono especial, entonces $x+P$ y $cP$ son polígonos especiales para cualesquiera $x\in \mathbb{R}^n$ y $c\in \mathbb{R}$. Demuestra además que $|x+P|=|P|$ y $|cP|=|c|^n|P|$.
  • Demuestra que la tercer proposición de la entrada sigue siendo cierta aún si los rectángulos son degenerados.

Análisis matemático II: Introducción al curso.

Por César Mendoza

Introducción

Esta es la primera entrada correspondiente al curso de análisis matemático II. Para esta primera parte del curso estudiaremos la integración de Lebesgue, una noción de integral muy poderosa y sobre la que se construye gran parte del análisis matemático moderno. Veremos una forma precisa de definir conceptos como longitud, área, volumen y sus análogos en más dimensiones: La medida de Lebesgue, sobre la cual construiremos este concepto de integración. Luego, estudiaremos las principales propiedades de la integral de Lebesgue, su relación con la integral de Riemann y una serie de teoremas muy útiles para calcular y estimar integrales: Los teoremas de convergencia y el teorema de Fubini.

Motivación

En tus cursos anteriores seguramente te has encontrado con el concepto de integral de Riemann. Ésta es una herramienta computacional muy poderosa que, a grosso modo, nos ayuda a encontrar el «área bajo la curva» en una dimensión y sus análogos en dimensiones más altas. Sin embargo, tiene una serie de limitaciones que hacen deseable un concepto de integración más general. A modo de motivación, recapitulamos algunas de ellas:

La clase de funciones integrables en el sentido de Riemann es limitada.

Como ejemplo, considera la función de Dirichlet $\chi_{\mathbb{Q}}:[0,1] \to \mathbb{R}$ definida como:

\begin{equation*} \chi_{\mathbb{Q}}(x)= \begin{cases} 1 & \text{si } x \in \mathbb{Q}\\ 0 & \text{si } x \in \mathbb{R}\setminus\mathbb{Q} \end{cases} \end{equation*}

Observa que si $[a,b]\subseteq [0,1]$ con $a<b$ entonces $\inf_{x \in [a,b]} f(x)=0$ y $\sup_{x \in [a,b]} f(x)=1$, pues $[a,b]$ contiene números racionales e irracionales.

Recordemos que en el contexto de integrales de Riemann las sumas inferiores y superiores de la función $f$, sobre una partición $P=\{a=x_0 < x_1 < \dots < x_n=b \}$ se definen como:
$$L(f,P,[a,b])=\sum_{j=1}^{n}(x_j-x_{j-1})\inf_{[x_{j-1},x_j]}f$$ $$S(f,P,[a,b])=\sum_{j=1}^{n}(x_j-x_{j-1})\sup_{[x_{j-1},x_j]}f$$

Y se dice que la función es Riemman integrable si $$L(f,[a,b]):= \sup_P L(f,P,[a,b])$$ Y $$S(f,[a,b]):= \inf_P S(f,P,[a,b])$$ Coinciden. La integral de Riemann se define como el valor común: $$L(f,[a,b])=S(f,[a,b]).$$
En nuestro ejemplo, es fácil ver que $L(\chi_{\mathbb{Q}},P,[a,b])=0$, $S(\chi_{\mathbb{Q}},P,[a,b])=1$ para cualquier partición $P$, de modo que $$L(\chi_{\mathbb{Q}},[a,b])=0$$ Y $$S(\chi_{\mathbb{Q}},[a,b])=1.$$ Por lo que la función NO es Riemann integrable. Sin embargo, es natural pensar que la integral debería ser 0 pues hay «muy pocos racionales en comparación con los irracionales en $[0,1]$». El siguiente ejemplo refuerza esta intuición.

La integral de Riemann no se comporta bien bajo operaciones de límite.

Si consideramos alguna numeración de los números racionales en $\mathbb{Q}\cap [0,1]=\{ r_1,r_2, \dots\}$ y para cada $k\in \mathbb{Z^+}$ definimos $f_k:[0,1]\to\mathbb{R}$ como:

\begin{equation*} f_k(x)= \begin{cases} 1 & \text{si } x \in \{ r_1,r_2,\dots, r_k \}\\ 0 & \text{en otro caso } \end{cases} \end{equation*}

Se verifica que $f_k$ es Riemann integrable y $\int_0^1f_k(x) \mathrm{d} x=0$, pues $f$ es acotada y vale 0 salvo en una cantidad finita de puntos.

Observa que si $x$ es irracional, $f_k(x)=0$ $\forall k$; y si $x$ es racional, $x=r_N$ para algún $N$ de modo que $f_k(x)=1$ $\forall n\geq N$. Esto nos dice que $\chi_{\mathbb{Q}}$ es el límite puntual de la sucesión de funciones $f_k$ pero $\chi_{\mathbb{Q}}$ no es Riemann integrable.

En el ejemplo anterior la sucesión $f_k$ se puede modificar para hacerla continua o incluso suave. Piensa por ejemplo en sustituir las discontinuidades de salto por crestas de funciones lineales a pedazos o pulsos suaves cuya anchura se va haciendo arbitrariamente pequeña. En general, esto nos dice que la clase de funciones Riemann integrables no es cerrada bajo toma de límites (puntuales), ni siquiera si las funciones son «bien portadas».

Con nociones más fuertes de convergencia, por ejemplo convergencia uniforme (una hipótesis muy «fuerte»), se tienen mejores resultados respecto a toma de límites. El siguiente es bien conocido:

Teorema. Sea $f_k:[a,b]\to \mathbb{R}$, $k\in \mathbb{N}$, una sucesión de funciones Riemann integrables que convergen uniformemente a $f:[a,b]\to \mathbb{R}$. Entonces $f$ es Riemann integrable y además $$\lim_{k\to \infty}\int_a^b f_k(x) \ \mathrm{d}x=\int_a^b f(x) \ \mathrm{d}x.$$

$\square$

También en el contexto de toma de límites, otra pregunta relevante es ¿bajo qué condiciones la integral conmuta con un límite?, o al menos ¿se puede decir algo sobre la integral de un límite?. Estas son preguntas que surgen normalmente en áreas como ecuaciones diferenciales, análisis de Fourier o probabilidad, en la que muchos conceptos se definen precisamente como un límite (por ejemplo la derivada o las series de Fourier). El ejemplo anterior no es muy esperanzador pues puede que un límite puntual ni siquiera sea Riemann integrable. Bajo ciertas condiciones sí se puede decir algo, por ejemplo:

Teorema (de la convergencia acotada). Sea $f_k:[a,b] \to \mathbb{R}$ una sucesión de funciones Riemann integrables y acotadas tales que $\exists M\in \mathbb{R}$ tal que $|f_k(x)|\leq M$ para todo $k\in \mathbb{N}$ y $x\in [a,b]$. Si $f_k$ convergen puntualmente a $f$ y $f$ es Riemann integrable, entonces $$\lim_{k \to \infty} \int_{a}^{b} f_k(x) \ \mathrm{d} x=\int_{a}^{b} f(x) \ \mathrm{d} x.$$

$\square$

¿Habrá alguna noción de integración que sea más laxa respecto a toma de límites?¿Se podrán mejorar los resultados enunciados?

La integral de Riemann no maneja adecuadamente funciones no acotadas o dominios no acotados.

Por definición, la integral de Riemann se define para funciones acotadas sobre intervalos cerrados finitos. Para funciones no acotadas o dominios no acotados la forma clásica de abordar estos problemas es con integrales impropias. Considera los siguientes ejemplos:

Ejemplo. La función $f(x)=\frac{1}{\sqrt{x}}$ no está acotada en $[0,1]$, sin embargo podemos hablar de área bajo la curva con la integral impropia:

\begin{align*} \lim_{a\downarrow 0}\int_{a}^{1}f(x) \ \mathrm{d}x &= \lim_{a\downarrow 0}\int_{a}^{1}\frac{1}{\sqrt{x}}\mathrm{d}x \\ &= \lim_{a\downarrow 0} [2x^{\frac{1}{2}}]_{a}^{1} \\ &= \lim_{a\downarrow 0} [2-2\sqrt{a}] \\
&= 2
\end{align*}

$\triangle$

Ejemplo. Algo similar ocurre con $f(x)=\frac{1}{x^2}$ pero en el intervalo $[1,\infty)$:

\begin{align*} \lim_{N\to \infty}\int_{1}^{N}f(x) \ \mathrm{d}x &= \lim_{N\to \infty }\int_{1}^{N}\frac{1}{x^2}\mathrm{d}x \\ &= \lim_{N\to \infty} \left[-\frac{1}{x}\right]_{1}^{N} \\ &= \lim_{N\to \infty} \left[ 1-\frac{1}{N}\right] \\
&= 1
\end{align*}

$\triangle$

Integrales de este tipo suelen abundar en física y probabilidad. ¿Habrá algún modo de manejar este tipo de integrales de forma unificada?

Fue precisamente por esta clase de restricciones que a finales del siglo XIX se empezaron a buscar nociones distintas o más generales de integración. Fue precisamente Henri Lebesgue quien en 1901 publicó su famoso artículo Sur une généralisation de l’intégrale définie, en el que definía una noción de integración que generalizaba a la de Riemann y resolvía varias de las limitaciones que esta presentaba.

La teoría de integración de Lebesgue y la teoría de la medida han sido tremendamente exitosas en el análisis moderno y ha encontrado aplicaciones fundamentales en áreas como la probabilidad, las ecuaciones diferenciales, la física matemática, entre otras.

Bibliografía

El material presentado en estas notas se basa en elementos tomados de la siguiente bibliografía, todas excelentes fuentes de consulta.

  • Folland, Gerald B. Real analysis: modern techniques and their applications. John Wiley & Sons, 1999.
  • Jones, Frank. Lebesgue integration on Euclidean space. Jones & Bartlett Learning, 2001.
  • Stein, Elias M., and Rami Shakarchi. Real analysis: measure theory, integration, and Hilbert spaces. Princeton University Press, 2009.
  • Tao, Terence. Analysis II. Springer Singapore, 2016.
  • Wheeden, Richard Lee, and Antoni Zygmund. Measure and integral. Vol. 26. New York: Dekker, 1977.

Más adelante…

Abordaremos el problema de la medida sobre los conjuntos más sencillos: los rectángulos. Veremos algunos resultados técnicos que utilizaremos a lo largo de la construcción de la medida de Lebesgue.

Modelos Biomatemáticos I. Notas 1 — MATERIAL EN REVISIÓN

Por Mariana Paulin

1. La modelación matemática en las ciencias

La modelación matemática es la herramienta que sirve para representar sistemas naturales y entender cómo funcionan, además de predecir y analizar comportamientos y encontrar soluciones de problemas sobre sistemas complejos. 

1.1. ¿Qué es y para qué sirve un modelo matemático?

¿Qué es un modelo matemático?

Un modelo matemático es una representación abstracta de un sistema real. Utiliza variables, ecuaciones matemáticas, funciones o algoritmos para describir cómo interactúan estos elementos. Como se mencionó anteriormente, los modelos son herramientas para simplificar, entender, estudiar y predecir comportamientos de sistemas complejos, como los ecosistemas, el crecimiento de poblaciones, la difusión de enfermedades, entre otros. Por ejemplo, en biología, un modelo podría representar la dinámica de una población, utilizando factores como la tasa de natalidad, mortalidad y recursos disponibles.

¿Para qué sirve un modelo matemático?

  1. Predecir: los modelos matemáticos pueden predecir futuros comportamientos bajo condiciones específicas. Según Allman y Rhodes, “los modelos permiten entender las consecuencias que una ecuación puede tener a través del análisis matemático, para así poder comparar la formulación con observaciones biológicas” (Allman, p. 1). Por ejemplo, si se conoce la cantidad de individuos que tiene una población y cuántos nacen y mueren cada año, se puede predecir la población que habrá en algún momento del futuro. Esto es útil para la conservación de especies.
  2. Simular: se pueden crear diferentes escenarios para explorar los resultados de diferentes intervenciones, por lo que se puede practicar la «prueba y error» las veces necesarias sin consecuencias dañinas para un ecosistema. Por ejemplo, si se deseara saber qué pasaría si se introdujera un nuevo depredador en un ecosistema, un modelo puede ayudar a ver cómo esto afectaría a la población sin tener que hacer un experimento real que podría ser perjudicial.
  3. Optimizar: en algunos casos, los modelos se utilizan para encontrar la mejor estrategia o solución a un problema, como en el control de plagas, sin embargo, la optimización busca no solo eficiencia, sino también sostenibilidad y equilibrio en la gestión de recursos naturales, Britton señala que “las políticas de gestión de recursos pueden derivarse de modelos matemáticos” (Britton, p. 45). Por ejemplo, si se trabaja en la gestión de un área natural, es posible usar un modelo para determinar cómo distribuir los recursos de manera eficiente, asegurando tanto la salud del ecosistema como su sostenibilidad a largo plazo.
  4. Comprender: los modelos también son herramientas educativas, ayudan a visualizar y entender relaciones complejas. Según Kline, “las matemáticas nos permiten observar patrones y relaciones” (Kline, p. 5), al representar gráficamente los datos y las relaciones, se pueden observar patrones que no son obvios sólo al mirar los números.

1.2. De la biología al modelo y de regreso: Supuestos, limitaciones y predicciones verificables

Para pasar de un fenómeno biológico real a un modelo matemático se deben hacer suposiciones que son fundamentales para construir dicho modelo, pero es importante considerar que también imponen limitaciones sobre qué tan exacto o útil será en ciertos contextos. Los sistemas biológicos pueden involucrar una “gran cantidad de interacciones y predisposiciones que compiten entre sí, lo que puede dificultar la comprensión completa de un fenómeno en su totalidad” (Allman, p. 1). Por esta razón, los modelos matemáticos deben simplificar estos sistemas, enfocándose en los factores más relevantes, pero esta simplificación puede llevar a la omisión de detalles importantes y afectar la precisión de las predicciones en algunos escenarios.

Observación. Todo comienza con la observación, es importante prestar atención a todas las variables que pueden intervenir o afectar el desarrollo de un evento.

Supuestos. Al momento de realizar suposiciones se deben considerar aspectos como
Homogeneidad: suposición de que el sistema es uniforme en ciertas características, por ejemplo, asumir que todos los individuos de una población tienen la misma tasa de crecimiento.
Condiciones iniciales conocidas: los modelos suelen necesitar condiciones iniciales específicas para poder ser resueltos, por ejemplo, la cantidad inicial de individuos en una población.
Aislamiento de factores externos: a veces se puede asumir que el sistema es cerrado, es decir, que no influyen factores externos, para facilitar el análisis.

Limitaciones. Los modelos son abstracciones de la realidad que nunca podrán representar todos los factores posibles que influyen en un sistema biológico, por lo que es importante reconocer que todos los modelos tienen limitaciones.
Según Allman, “aunque muchos de los modelos que examinamos pueden parecer al principio simplificaciones burdas, su misma simplicidad es una fortaleza. Los modelos simples muestran claramente las implicaciones de nuestros supuestos más básicos» (Allman, p . 1). En otras palabras, aunque los modelos matemáticos omiten muchos detalles, esta simplificación les permite centrarse en los aspectos fundamentales del fenómeno. Por ejemplo, en un modelo de crecimiento poblacional tal  vez no se consideren detalles como la competencia entre especies o las interacciones con otras especies.
Otra limitación puede ser la escalabilidad; un modelo que funciona a pequeña escala (como en un laboratorio) puede no ser válido cuando se aplica a una escala mayor (por ejemplo, en un ecosistema natural).

Predicciones verificables. Los modelos matemáticos tienen que ser capaces de hacer predicciones que puedan ser verificadas empíricamente mediante experimentos u observaciones. Es fundamental que un modelo no solo explique o demuestre lo que ya se sabe, sino que también permita visualizar comportamientos futuros. Si las predicciones del modelo se verifican mediante datos reales, esto aumenta la confiabilidad del modelo. 

Ejemplo
Imagina que estás modelando el crecimiento de una población de bacterias. Supón que el modelo establece que la población crece de acuerdo con la ecuación de Malthus. Si realizas experimentos y observas que la población crece más lentamente debido a la competencia por recursos, tu modelo necesitará ajustarse para reflejar este nuevo factor (por ejemplo, usando un modelo logístico que limite el crecimiento cuando la población se acerca a la capacidad de carga).

Pasos para crear un modelo.
Supongamos que estamos interesados en modelar el crecimiento de una población de bacterias en un cultivo cerrado -es decir, sin interferencia externa- en un laboratorio, donde la bacteria se reproduce a través de divisiones celulares. Empezaremos desde la observación y avanzaremos paso a paso.

1. Observación. En este caso, se pueden hacer las siguientes observaciones:

  • Se sabe que las bacterias en un cultivo crecen a una tasa proporcional a su población actual.
  • En un principio, se tiene un número pequeño de bacterias (supongamos 100), y después de cierto tiempo, el número de bacterias aumenta.
  • No hay depredadores, no hay competencia por recursos en las primeras etapas, y el entorno es ideal para su crecimiento.

2. Identificación de Variables. En cualquier modelo, primero es necesario identificar las variables involucradas.

  • Variable dependiente (a modelar): N(t) es el número de bacterias en el tiempo t.
  • Variable independiente: t es el tiempo, generalmente en horas, días, o cualquier unidad pertinente.
  • Parámetro constante: r es la tasa de crecimiento de la población (la tasa de natalidad). Esto indica cuántas bacterias nuevas nacen por cada bacteria existente en un tiempo determinado.

3. Supuestos. Para simplificar el problema y poder construir un modelo matemático, necesitamos hacer algunos supuestos que describen cómo el sistema se comporta:

  • Supuesto 1: El entorno es ideal para el crecimiento bacteriano; no hay limitación de recursos.
  • Supuesto 2: La tasa de crecimiento r es constante durante todo el proceso.
  • Supuesto 3: Las bacterias se dividen de manera exponencial, es decir, cada bacteria produce exactamente dos hijas en un tiempo fijo.
  • Supuesto 4: El número de bacterias en el tiempo t = 0 es conocido, es decir, tenemos un número inicial $N_0$​ de bacterias.

4. Limitaciones. Ahora, debemos tener en cuenta algunas limitaciones que podrían afectar la validez de nuestro modelo:

  • Limitación 1: Este modelo no tiene en cuenta mutaciones o factores estocásticos (azar), como la posibilidad de que algunas bacterias no se reproduzcan debido a variabilidad genética o factores aleatorios.
  • Limitación 2: El modelo no incluye interacciones con otras especies, como bacterias depredadoras o interacciones simbióticas que podrían alterar el crecimiento.

5. Formulación del modelo. El siguiente paso es escribir la ecuación matemática que describe el fenómeno. Con base en nuestras observaciones, sabemos que el crecimiento bacteriano sigue una ley de crecimiento exponencial. En el capítulo 1, Britton discute el crecimiento de poblaciones y la ecuación diferencial $\frac{dN}{dt} = r N(t)$ –que es ampliamente utilizada para modelar este tipo de fenómenos–, donde:

  • $\frac{dN}{dt}$​ es la tasa de cambio de la población de bacterias con respecto al tiempo (es decir, cuántas bacterias están naciendo por unidad de tiempo),
  • r es la tasa de crecimiento de la población,
  • N(t) es el número de bacterias en el tiempo t.

Esta es una ecuación diferencial que describe cómo cambia la población de bacterias con el tiempo. Para obtener la expresión de N(t), resolvemos esta ecuación diferencial. La solución es:

$N(t) = N_0 e^{rt}$

donde

  • $N_0$ es el número inicial de bacterias en t = 0,
  • e es la base del logaritmo natural.

Este modelo nos dice que el número de bacterias crece exponencialmente en función del tiempo, con una tasa de crecimiento r.

6. Verificación del Modelo. Finalmente, se verifica el modelo utilizando datos reales o se realiza el experimento para comprobar si las predicciones del modelo son correctas.

Un caso práctico de verificación
Supongamos que, en un experimento real, comenzamos con una población de 100 bacterias (es decir, $N_0 = 100$) y que después de 2 horas ya hay 400 bacterias.
Para comprobar si el modelo puede predecir este comportamiento usamos la fórmula del modelo: 

$N(t) = N_0 e^{rt}$

Sabemos que $N_0 = 100$, t = 2 horas, y N(t) = 400. Sustituimos en la fórmula

$400 = 100 e^{r \cdot 2}$

Despejamos r

$4 = e^{2r}$

Tomamos el logaritmo natural en ambos lados

$\ln(4) = 2r$

$r = \frac{\ln(4)}{2} \approx 0.6931$

Ahora, sabemos que la tasa de crecimiento r es aproximadamente 0.6931 por hora. Podemos usar este valor para hacer más predicciones y compararlas con los datos reales.

Predicción adicional
Supongamos que queremos saber cuántas bacterias habrá después de 5 horas. Usamos el modelo con r = 0.6931:

$N(5) = 100 e^{0.6931 \cdot 5} = 100 e^{3.4655} \approx 100 \cdot 32 = 3200$

Esto nos da una predicción de que habrá 3200 bacterias después de 5 horas.

Si el número real de bacterias se acerca a este valor, podemos estar bastante seguros de que nuestro modelo está funcionando bien. Si no es así, será necesario ajustar el modelo, considerar efectos de límite de recursos (como el modelo logístico), o incorporar factores estocásticos.

Resumen del procedimiento:

  1. Observación: se identifica el fenómeno a estudiar (crecimiento de bacterias).
  2. Identificación de variables: se determina qué variables son importantes (número de bacterias, tiempo, tasa de crecimiento).
  3. Supuestos: se realizan suposiciones sobre el entorno ideal, el crecimiento exponencial y las condiciones iniciales.
  4. Limitaciones: se considera que el modelo tiene limitaciones como el crecimiento ilimitado y la falta de factores estocásticos.
  5. Formulación del modelo: se desarrolla una ecuación diferencial para modelar el crecimiento exponencial de las bacterias.
  6. Verificación: se comprueban las predicciones del modelo con datos reales del experimento.

1.3. Tipos de modelos: Deterministas vs. Estocásticos

Modelos deterministas. Son aquellos que producen resultados predecibles, es decir que están completamente definidos y se puede calcular exactamente lo que sucederá. En otras palabras, no hay incertidumbre; dado un conjunto de condiciones iniciales y parámetros, el modelo siempre dará el mismo resultado. Como menciona Britton, en un modelo determinista, “el estado del sistema en el tiempo t + 1 se determina completamente a partir del estado en el tiempo t» (Britton, p. 2). Estos modelos se suelen representar con ecuaciones diferenciales o sistemas algebraicos que describen el comportamiento del sistema en función del tiempo.

Por ejemplo, el modelo de crecimiento exponencial es un modelo determinista, donde la población crece de manera predecible si no hay factores limitantes: $N(t) = N_0 e^{rt}$ donde N(t) es el tamaño de la población en el tiempo t, $N_0$​ es el tamaño inicial de la población, y r es la tasa de crecimiento constante.

Modelos estocásticos. En estos modelos hay incertidumbre, el azar juega un papel importante. Los resultados pueden variar incluso con las mismas condiciones iniciales; el sistema no sigue un camino único, sino que puede tener varios resultados posibles debido a la inclusión de variables aleatorias o probabilísticas. Son útiles cuando se requiere modelar fenómenos como las fluctuaciones en una población debido a factores aleatorios (mutaciones genéticas, migración, dispersión). Un ejemplo claro puede ser la modelación de la propagación de una enfermedad infecciosa en una población, donde la tasa de infección no es constante, sino que depende de la probabilidad de contacto entre individuos. En un modelo estocástico, la distribución de probabilidades es clave.

Referencias bibliográficas

Allman, E. S. & J. A. Rhodes. 2007. Mathematical models in biology: an introduction. Cambridge University Press, Cambridge.
Britton, N. F. 2003. Essential mathematical biology. Springer, Cham.
Kline, M. 1967. Mathematics for the nonmatemathician. Dover, Nueva York.

Evaluación

1. Responde y haz lo que se indica

a. ¿Qué es un modelo matemático?
Escribe una definición simple de qué es un modelo matemático en el contexto de las ciencias. Explica brevemente por qué es útil tener un modelo en lugar de estudiar un fenómeno de forma directa.

b. Menciona al menos tres ventajas de usar modelos matemáticos en biología.

c. Define qué son los supuestos en un modelo matemático.
Da un ejemplo de un supuesto que podrías hacer si estás modelando el crecimiento de una población de bacterias.

d. ¿Por qué es importante conocer las limitaciones de un modelo matemático?
Explica qué podría suceder si un modelo no tiene en cuenta factores importantes (como la competencia entre especies o los recursos limitados en un ecosistema).

e. Explica la diferencia entre un modelo determinista y un modelo estocástico.
Usa un ejemplo sencillo para ilustrar la diferencia. Por ejemplo, si estás modelando el crecimiento de una población de bacterias, ¿cuál sería un modelo determinista y cuál uno estocástico?

f. Imagina que estás modelando el crecimiento de una población de animales en un hábitat. Si se incluye una probabilidad de que cada individuo muera debido a condiciones ambientales impredecibles, ¿cómo se llamaría este tipo de modelo? Justifica tu respuesta.

g. Imagina que tienes una población de 1000 bacterias en un cultivo cerrado. Esta población crece a una tasa constante de 0.2 por hora. Si se mantiene esta tasa de crecimiento, ¿cómo describirías el comportamiento de la población en términos matemáticos?

h. ¿Este es un modelo determinista o estocástico? ¿Por qué?

Respuesta modelo: Este modelo es determinista, ya que asume que la tasa de crecimiento es constante, r = 0.2, y que el crecimiento de la población depende únicamente de este parámetro, sin ningún componente aleatorio.

i. ¿Cuáles serían algunos supuestos de este modelo?
Piensa en qué asumes sobre el comportamiento de las bacterias, el ambiente, o cualquier otro factor relevante.

j. ¿Por qué es importante verificar las predicciones de un modelo matemático con datos reales o experimentales?
Explica cómo se puede hacer para comprobar si un modelo matemático está funcionando correctamente.

k. Si tienes un modelo de crecimiento de una población de plantas en un invernadero, ¿qué tipo de datos recolectarías para comparar con las predicciones del modelo?

Pregunta de Reflexión:

  • ¿Qué importancia tiene comprender los supuestos y las limitaciones de un modelo matemático cuando se usan para tomar decisiones en biología (por ejemplo, para la conservación de especies, el manejo de recursos naturales, etc.)?

Investigación de Operaciones: Soluciones básicas, factibles y no degeneradas (10)

Por Aldo Romero

Introducción

Ya hablamos de lo que es la forma canónica y la forma estándar de un problema lineal. Como platicamos, esto nos permitirá darle solución a los problemas siguiendo métodos que requieren tener el problema en alguna de estas dos formas. Lo que haremos ahora es reflexionar a qué nos referimos con resolver un problema de programación lineal. Para ello, recordemos los distintos tipos de soluciones que los problemas lineales pueden tener.

Tipos de soluciones y región de factibilidad

Recordemos los conceptos de soluciones factibles, soluciones básicas factibles (degeneradas y no degeneradas) y de región de factibilidad.

Supongamos que tenemos un problema de programación lineal en su forma canónica:

\begin{align*}
Max \quad z &= cx\\
s.a&\\
Ax &\leq b\\
x &\geq \bar 0\\
\end{align*}

donde usamos la misma notación que en la entrada anterior. Recordemos que $c$ es un vector fila en $\mathbb{R}^n$, $x$ es un vector columna en $\mathbb{R}^n$, $b$ es vector columna en $\mathbb{R}^m$ y $A$ es una matriz de $m\times n$. Recuerda que en la expresión anterior entendemos $\bar 0$ como un vector en $\mathbb{R}^n$ con entradas todas iguales a cero.

También recordemos la forma estándar de un problema de programación lineal:

\begin{align*}
Max \quad z &= cx\\
s.a&\\
Ax &=b\\
x &\geq \bar 0\\
\end{align*}

en donde $c$ es un vector fila en $\mathbb{R}^n$, $x$ es un vector columna en $\mathbb{R}^{n}$,$b$ es un vector columna en $\mathbb{R}^{m}$ y $A$ es una matriz de valores reales de $m \times n$.

Como recordatorio, tenemos las siguientes definiciones para los tipos de soluciones del problema lineal.

Definición. Una solución factible a un problema de programación lineal en forma estándar es un vector columna $x = x_1 + x_2 \ldots + x_n$ que satisface $Ax= b$ y $x\geq \bar 0$.

Definición. La región de factibilidad de un problema de programación lineal es el conjunto de todas las soluciones factibles.

Definición. Una solución básica es una solución $x$ correspondiente al problema en forma estándar con no más de $m$ componentes positivas. Es decir, tiene al menos $n-m$ entradas iguales a cero.

Definición. Una solución básica factible es una solución básica cuyas variables son todas no negativas.

Definición. Una solución básica factible no degenerada es una solución factible $x$ correspondiente a una solución $x$ del problema en forma estándar con exactamente $m$ componentes positivas. En otras palabras, $x$ tiene exactamente $n-m$ entradas iguales a cero.

Definición. Una solución básica factible degenerada es una solución factible correspondiente a una solución $x$ del problema en forma estándar con menos de $m$ componentes positivas. En otras palabras, $x$ tiene más de $n-m$ entradas iguales a cero.

La importancia de las soluciones básicas factibles y no degeneradas es que cumplen las siguientes:

  1. Se puede mostrar que si un problema de programación lineal tiene óptimo, entonces dicho óptimo se alcanza para alguna solución básica factible y no degenerada.
  2. Las soluciones básicas factibles y no degeneradas se pueden encontrar resolviendo sistemas de ecuaciones.
  3. Geométricamente, las soluciones básicas factibles y no degeneradas están en puntos extremos dentro de la región de factibilidad.

A continuación explicaremos algunos de estos puntos con un ejemplo detallado, que te ayudará a entender la intuición detrás de estas definiciones y de su importancia.

Ejemplos de región de factibilidad y tipos de solución

Consideremos el siguiente problema de programación lineal en su forma canónica:

\begin{align*}
Max. \quad z &= 2x_1 + 3x_2\\
s.a.&\\
&\begin{matrix}2x_1 &+ x_2 &\leq & 4\\
x_1 &+ 2x_2 &\leq &5\end{matrix}\\
&x_1, x_2 \geq 0.
\end{align*}

La región de factibilidad es el conjunto de todos los $(x_1,x_2)$ (en el plano $\mathbb{R}^2$) que cumplen las restricciones del problema, es decir, $2x_1 + x_2 \leq 4$, $x_1 + 2x_2 \leq 5$ y $x_1,x_2 \geq 0$. Para entender esto mejor, vamos a ilustrar cada restricción en $\mathbb{R}^2$ a continuación :

Región 1: La región $x_1\geq 0$, que son todos los elementos de $\mathbb{R}^2$ que se encuentran a la derecha del eje $Y$ incluyéndolo:

Región 2: La región $x_2\geq 0$, que son todos los elementos de $\mathbb{R}^2$ que se encuentran arriba del eje $X$ incluyéndolo:

Región 3: La región $2x_1 + x_2 \leq 4$, que son los elementos en $\mathbb{R}^2$ que están debajo de la recta $2x_1+x_2=4$ incluyéndola:

Región 4: La región $x_1+2x_2\leq 5$, que son los elementos en $\mathbb{R}^2$ que están debajo de la recta $x_1+2x_2=5$ incluyéndola:

Como queremos que se cumplan todas las restricciones al mismo tiempo, los puntos $(x_1,x_2) \in \mathbb{R}^2$ de la región de factibilidad que se encuentren en todas las regiones al mismo tiempo, es decir, los puntos que estén en la intersección. Al sobreponer las regiones que acabamos de ilustrar, obtenemos la región encerrada en la siguiente figura:

También puedes explorar el interactivo de Geogebra en donde se han coloreado los complementos de las regiones para más claridad. Puedes usar el cursor para mover la figura y las herramientas de lupa para hacer acercamientos y alejamientos.

Como hemos mencionado, el óptimo de un problema de programación lineal es una solución básica factible no degenerada y toda solución básica factible no degenerada se encuentra en algún vértice de la región de factibilidad. Entonces, el valor máximo de la función $2x_1+3x_2$ se alcanza en alguno de los vértices del polígono que es la región factible. Veamos dónde el álgebra nos dice esto.

Para ello, pensemos al problema en su forma estándar, tomando variables de holgura $s_1$ y $s_2$. Las restricciones que tienen las cuatro variables en conjunto son las siguientes.

\begin{align*}
2x_1 + x_2 + s_1 &= 4\\
x_1 + 2x_2 + s_2 &= 5\\
x_1, x_2, s_1, s_2 &\geq 0.
\end{align*}

La matriz $A’$ es $\begin{pmatrix}2 & 1 & 1 & 0 \\ 1 & 2 & 0 & 1 \end{pmatrix}$, que, se puede verificar, tiene rango $2$. Las soluciones básicas y no degeneradas corresponden a tener en ese sistema de ecuaciones exactamente $m=2$ variables positivas, de manera que necesitamos hacer exactamente $n-m=4-2=2$ de estas variables iguales a cero. Al hacer esto, podemos resolver para las $m=2$ variables restantes. Por ejemplo, si establecemos $x_1 = 0$ y $x_2 = 0$, las ecuaciones se convierten en:

\begin{align*}
s_1 = 4\\
s_2 = 5\\
x_1, x_2, s_1, s_2 \geq 0,
\end{align*}

que tiene solución única $(x_1,x_2,s_1,s_2)=(0,0,4,5)$. Así, la solución básica del problema en forma canónica es $(x_1,x_2)=(0,0)$. Hay que recordar la solución básica sólo para las variables originales, es decir, las del problema en forma canónica.

Esta solución corresponde al punto $A$ del interactivo de GeoGebra. Se puede determinar otra solución básica fijando $s_1 = 0$ y $s_2 = 0$, donde el sistema sería ahora

\begin{align*}
2x_1 + x_2 = 4\\
x_1 + 2x_2 = 5\\
x_1, x_2, s_1, s_2 \geq 0,
\end{align*}

Resolvamos este sistema de ecuaciones de forma rápida. Si multiplicamos la segunda ecuación por un $-2$ y sumamos ambas ecuaciones, la variable $x_1$ se eliminará y tendremos solo una ecuación: $-3x_2 = -6$ lo que es equivalente a $x_2 = 2$. Si sustituimos ahora este valor para $x_2$ en cualquiera de las ecuaciones, tras unos simples despejes tendremos que $x_1 = 1$.

Así, la solución básica que se obtiene es $(x_1,x_2)=(1,2)$, que es el punto $D$ del interactivo de GeoGebra.

Si seguimos considerando todas las posibilidades en las que dos variables son cero y resolvemos los ssistemas de ecuaciones resultantes, eso nos dará todas soluciones básicas no degeneradas. La solución óptima es la solución básica factible (punto extremo) con el mejor valor objetivo.

En este ejemplo tenemos $\binom{4}{2} = \frac{4!}{2!2!} = 6$ formas de volver dos de las $n$ variables iguales a cero. Ya para las variables $x_1$ y $x_2$, los puntos que obtenemos son los puntos $A$, $B$, $C$, $D$ que son puntos extremos de la región de factibilidad. Los puntos $E$ y $F$ del interactivo también son puntos básicos y no degenerados (son las otras dos intersecciones de las rectas que dibujamos), pero como no satisfacen la condición de factibilidad del problema, entonces no los podemos considerar y por lo tanto no son candidatos a dar el valor óptimo.

La siguiente tabla muestra todas las soluciones básicas factibles y no factibles de este problema:

Variables no básicas (cero)Variables básicasSolución para $(x_1,x_2)$Punto de extremo asociado¿Factible?Valor objetivo z
$(x_1, x_2) = (0,0)$$(s_1, s_2) = (4,5)$$(0, 0)$A0
$(x_1, s_1) = (0,0)$$(x_2, s_2) = (4,-3)$$(0, 4)$ENo ya que $s_2 < 0$12 (No factible)
$(x_1, s_2) = (0,0)$$(x_2, s_1) = (2.5,1.5) $$(0, 2.5)$B7.5
$(x_2, s_1) = (0,0)$$(x_1, s_2) = (2,3)$$(2, 0)$C4
$(x_2, s_2) = (0,0)$$(x_1, s_1) = (5, -6)$$(5, 0)$FNo ya que
$s_1 < 0$
10 (No factible)
$(s_1, s_2) = (0,0)$$(x_1, x_2) = (1,2)$$(1, 2)$D8 (óptimo)

Más adelante…

Notemos que a medida que el tamaño del problema se incrementa, enumerar todos los puntos esquina se volverá una tarea que tomaría mucho tiempo. Por ejemplo, si tuviéramos $20$ variables (ya con las de holgura) y $10$ restricciones, es necesario resolver considerar $\binom{20}{10}=184756$ formas de crear ecuaciones de $10\times 10$, y resolver cada una de ellas. Aunque esto es finito, son demasiadas operaciones. Y este en la práctica incluso es un ejemplo pequeño, ya que en la vida real hay problemas lineales que pueden incluir miles de variables y restricciones.

Por ello, se vuelve cruciar encontrar un método que atenúe esta carga computacional en forma drástica, que permita investigar sólo un subconjunto de todas las posibles soluciones factibles básicas no degeneradas (vértices de la región de factibilidad), pero que garantice encontrar el óptimo. Una idea intuitiva que debería servir es comenzar en un vértice y «avanzar en una dirección que mejore la función objetivo». Esto precisamente es la intuición detrás del método simplex, que repasaremos a continuación.

Tarea moral

  1. Considera el siguiente problema lineal en su forma canónica:

\begin{align*}
Min \quad z &= 2x_1 + 3x_2 \\
s.a.&\\
&\begin{matrix}x_1 &+ 3x_2 &\geq&6\\
3x_1 &+ 2x_2 &\geq &6\end{matrix}\\
&x_1, x_2 \geq 0.
\end{align*}

Usa el procedimiento descrito arriba para encontrar todas sus soluciones básicas no degeneradas y encontrar el óptimo del problema.

  1. Considera un problema de programación lineal en dos variables $x$ y $y$, en forma canónica y con $m$ restricciones (desigualdades), además de las restricciones $x\geq 0$ y $y\geq 0$. Explica con tus propias palabras por qué la región de factibilidad siempre es un polígono con a lo más $m+2$ lados, y por qué entonces basta evaluar la función objetivo en a lo más $m+2$ puntos para encontrar su máximo.
  2. Explica con tus palabras cómo se vería la región de factibilidad de un problema de programación lineal de maximización que no tenga máximo. ¿Qué cambios se le tendrían que hacer a las restricciones del primer ejemplo para que se volviera un problema de maximización sin máximo?

Respuestas

1.- Primero vamos a cambiar este problema a su forma estándar.

Definamos variables de holgura no negativas $s_1$ y $s_2$ tales que $x_1 + 3x_2 – s_1 = 6$ y $3x_1 +2x_2 – s_2 = 6$.

Entonces la forma estandar del problema sería de la siguiente manera:

\begin{align*}
Min \quad z &= 2x_1 + 3x_2 \\
s.a.&\\
&\begin{matrix}x_1 &+ 3x_2 &- s_1 = &6\\
3x_1 &+ 2x_2 &- s_2 = &6\end{matrix}\\
&x_1, x_2, s_1, s_2 \geq 0.
\end{align*}

Su matriz A asociado a las restricciones $\begin{pmatrix}1 & 3 & -1 & 0 \\ 3 & 2 & 0 & -1 \end{pmatrix}$ en una matriz de $2 \times 4$. Las soluciones básicas no degeneradas $x’$ en $\mathbb{R}^4$ tienen $4-2 = 2$ entradas iguales a 0.

Variables no básicas (cero)Variables básicasSolución para $(x_1,x_2)$Punto de extremo asociado¿Factible?Valor objetivo z
$(x_1, x_2) = (0,0)$$(s_1, s_2) = (-6,-6)$$(0, 0)$ANo ya que $s_1,s_2 < 0$0
$(x_1, s_1) = (0,0)$$(x_2, s_2) = (2,-2)$$(0, 2)$BNo ya que $s_2 < 0$6 (No factible)
$(x_1, s_2) = (0,0)$$(x_2, s_1) = (3,3)$$(0, 3)$C9
$(x_2, s_1) = (0,0)$$(x_1, s_2) = (6, 12) $$(6, 0)$D12
$(x_2, s_2) = (0,0)$$(x_1, s_1) = (2,-4)$$(2, 0)$ENo ya que
$s_1 < 0$
4 (No factible)
$(s_1, s_2) = (0,0)$$(x_1, x_2) = (6/7,12/7)$$(6/7,12/7)$F48/7 = 6 + 6/7 (óptimo)

Por lo que el óptimo se encuentra en el punto F = (6/7, 12/7).

En el siguiente interactivo de GeoGebra, verifica uno por uno los puntos extremos que se encontraron.

2.- Se podría argumentar tal vez que cada restricción de un problema de programación lineal representa un lado del polígono que forma la región factible. Y como tenemos m restricciones en el problema y las condiciones de no negatividad son 2 restricciones más, el polígono tendrá a lo más m+2 lados.

3.- La región de factibilidad se vería como una región no acotada en el primer cuadrante del plano. En esta región, dada un punto x dentro de ella, existe otro punto x’ tal que $z(x) < z(x’)$.

El que se tendría que hacer en el primer problema sería simplemente invertir las desigualdades de las restricciones:

\begin{align*}
Max. \quad z &= 2x_1 + 3x_2\\
s.a.&\\
&\begin{matrix}2x_1 &+ x_2 &\geq & 4\\
x_1 &+ 2x_2 &\geq &5\end{matrix}\\
&x_1, x_2 \geq 0.
\end{align*}

Se puede verificar haciendo los cambios en el primer interactivo que estos cambios nos cambiaran la región factible a una región no acotada.

Entradas relacionadas