Archivo del Autor: Lizbeth Fernández Villegas

Acerca de Lizbeth Fernández Villegas

Coordinadora en la OMM. Fiel creyente de que las matemáticas, al igual que el arte, son un camino de curiosidad, disciplina y pasión. Busco compartir ideas a través de un lenguaje visual y cercano.

El teorema de Arzelá-Ascoli

Por Lizbeth Fernández Villegas

Introducción

Como ya podrás haber notado, identificar la compacidad en un espacio métrico es una situación recurrente y de interés en cursos de Análisis. Naturalmente han surgido resultados que permiten identificarla con mayor facilidad en conjuntos cuya métrica no es tan sencilla de manejar, como los espacios de funciones.

En esta entrada veremos un teorema útil para trabajar en el espacio $\mathcal{C^0}(X,Y)$ donde $X$ es compacto y $Y$ es completo. Primero veamos si el siguiente conjunto de funciones es compacto.

Para cada $n \in \mathbb{N}$ considera la función $f_n:[0,2] \to \mathbb{R}$ dada por

\begin{equation*}
f_n(x):=\begin{cases} 1 -n^2|x-\frac{1}{n}|, \, &\text{si $|x-\frac{1}{n}|<\frac{1}{n^2}$}\\
\\
0 \, &\text{en otro caso}
\end{cases}
\end{equation*}

Gráficas de $f_1$ y $f_2.$
Las gráficas suben y bajan formando triángulos cada vez más angostos.

La familia de funciones $\mathcal{H}:= \{f_i \, | \, i \in \mathbb{N}\}$ no es compacta en el espacio $\mathcal{C}^0[0,2]$ porque no es totalmente acotada: Es sencillo ver que para cualesquiera dos funciones $f_l, f_m \in \mathcal{H}$ con $l \neq m,$ se cumple que $d_{\infty}(f_l,f_m)=1.$ De modo que no es posible cubrir $\mathcal{H}$ con una cantidad finita de bolas abiertas de radio $\frac{1}{2}.$ Esto se debe a que cualquier bola abierta $B(f, \frac{1}{2}) \subset \mathcal{C}^0[0,2]$ tiene a lo más un elemento de $\mathcal{H}:$ Si $f_l, f_m \in B(f, \frac{1}{2})$ se cumple que $d_{\infty}(f_l,f_m) \leq d_{\infty}(f_l,f)+d_{\infty}(f,f_m) < \frac{1}{2}+\frac{1}{2}= 1$ lo cual es una contradicción a la distancia entre ambas funciones. En consecuencia no será posible cubrir todos los elementos de $\mathcal{H}$ con una cantidad finita de bolas por lo que $\mathcal{H}$ no será totalmente acotado.

Las características de esta familia de funciones nos impiden «atraparlas» en bolitas pequeñitas. Como la distancia entre funciones está en función de las distancias en puntos del codominio, necesitaremos propiedades que restrinjan el comportamiento de alguna manera. Una propiedad que lo logra es, como vimos en la entrada anterior, la equicontinuidad en funciones. Puedes observar que $\mathcal{H}$ no es equicontinua, pues para $\varepsilon = \frac{1}{2}$ no existe ningún valor de $\delta$ que funcione. Conforme $n \to \infty$ la gráfica de las funciones genera un pico que sube y baja rápidamente en un intervalo, de tamaño $\frac{2}{n^2},$ que también se va haciendo más pequeño. Siempre será posible elegir una función donde el tamaño del intervalo es menor que $\delta.$ Habrá un punto $x$ y una función $f_k$ tal que $|x- \frac{1}{k}|< \delta$ pero $|f_k(x)-f_k(\frac{1}{k})| =|0-1|=1> \frac{1}{2}.$

Hay una función $f_k$ que forma un triángulo de base menor que $\delta.$ $\, f_k(\frac{1}{k})=1$ pero habrá un $x$ «fuera de la base», pero dentro del intervalo de tamaño $\delta,$ tal que $f_k(x)=0.$

¿Bastará la equicontinuidad de una familia de funciones para que esta sea compacta? No es así. Presentamos una familia de funciones equicontinuas que no es totalmente acotada.

Tomaremos funciones del espacio $\mathcal{C}^0([0,1],\ell_2).$ Donde $[0,1]$ es compacto y $\ell_2$ es completo. La prueba de esto puede consultarse en Bracamonte, M. R. (2024, 11 de octubre). lp es un espacio de Banach [Video]. YouTube.youtube.com.

Para cada $n \in \mathbb{N}$ y $x \in [0,1]$ sea $f_n(x):= e_n,$ donde $e_n$ es la sucesión que toma valor $1$ en la entrada i-ésima y $0$ en el resto. Entonces la familia $\mathcal{H}:= \{f_n \, | \, n \in \mathbb{N}\}$ es equicontinua pues, para todo $\varepsilon >0,$ (sin importar el valor de $\delta),$ para cualesquiera $x,y \in [0,1]$ se cumplirá para cualquier $f_n \in \mathcal{H}$ que $\norm{f_n(x)-f_n(y)}_2= \norm{e_n-e_n}_2 = 0 < \varepsilon.$

No obstante, esta familia no es totalmente acotada: Para cualesquiera dos funciones en $\mathcal{H},$ digamos $f_l, f_m, l \neq m$ tenemos que $d_{\infty}(f_l,f_m) = \norm{e_l-e_m}_2 = \sqrt{|1|^2+|1|^2} = \sqrt{2}.$ En consecuencia, no será posible cubrir $\mathcal{H}$ con una cantidad finita de bolas abiertas de radio $\frac{\sqrt{2}}{2}$ por lo que esta familia no es totalmente acotada.

Esta vez no bastó la equicontinuidad, incluso con funciones tan «estables» que son constantes. La falla radicó en que, al variar la función en la que evaluamos un punto $x$ del dominio, el conjunto dado por las imágenes de $\{x\}$ no es relativamente compacto.

Ahora veremos las condiciones necesarias y suficientes que debe tener una familia de funciones para ser relativamente compacta:

Teorema Arzelá-Ascoli. Sean $X$ un espacio métrico compacto y $Y$ un espacio métrico completo. Un subconjunto $\mathcal{H}$ de $\mathcal{C^0}(X,Y)$ es relativamente compacto en el espacio $\mathcal{C^0}(X,Y)$ si y solo si $\mathcal{H}$ es equicontinuo y los conjuntos definidos como $\mathcal{H}(x):= \{f(x) \, | \, f \in \mathcal{H}\}$ son relativamente compactos en $Y$ para cada $x \in X.$

Representación del teorema de Arzelá-Ascoli.

Demostración:
En Convergencia uniforme y continuidad concluimos que por las propiedades de $X$ y $Y, \,$ $\mathcal{C^0}(X,Y)$ es completo, así por lo visto en conjuntos relativamente compactos y totalmente acotados sabemos que como $\mathcal{H}$ es relativamente compacto en $\mathcal{C^0}(X,Y),$ esto implica que $\mathcal{H}$ es totalmente acotado.
Sea $\varepsilon >0.$ Existen funciones $g_1, \, g_2,…,g_m \in \mathcal{H}$ tales que
\begin{align}
\mathcal{H} \subset B_\infty \left(g_1, \, \frac{\varepsilon}{3} \right) \cup B_\infty \left(g_2, \, \frac{\varepsilon}{3} \right) \cup … \cup B_\infty \left(g_m, \, \frac{\varepsilon}{3} \right).
\end{align}
Donde $B_\infty$ denota bolas abiertas con la métrica uniforme en $\mathcal{C^0}(X,Y)$

En el dibujo las $g’s $ aunque son puntos representan funciones. La zona verde es el conjunto de funciones $\mathcal{H}.$ Las bolas abiertas descritas lo cubren.

Esto significa que cualquier función de $\mathcal{H}$ se aproxima mucho a alguna $g_i, \, i \in \{1,2,..,m\}.$ Sea $x \in X.$ Considera el conjunto
$$\mathcal{H}(x):= \{f(x) \, | \, f \in \mathcal{H}\}$$

La función $f$ es elemento de alguna de las bolas abiertas que cubren a $\mathcal{H}.$

Dado un $f(x) \in \mathcal{H}(x),$ por (1) sabemos que existe $i \in \{1,2,..,m\}$ tal que la función $f \in B_\infty \left(g_i, \, \frac{\varepsilon}{3} \right).$

La distancia entre dos puntos $f(x)$ y $g_i(x)$ es menor igual que la distancia entre ambas funciones.

De modo que $d_\infty (g_i,f) < \frac{\varepsilon}{3}. $ En particular para $x$ se cumple que $d_Y(g_i(x),f(x)) < \frac{\varepsilon}{3}$ por lo tanto
$$f(x) \in B_Y \left( g_i(x), \, \frac{\varepsilon}{3} \right)$$


De donde se sigue
\begin{align}
\mathcal{H}(x) \subset B_Y \left( g_1(x), \, \frac{\varepsilon}{3} \right) \cup B_Y \left( g_2(x), \, \frac{\varepsilon}{3} \right) \cup … \cup B_Y \left( g_m(x), \, \frac{\varepsilon}{3} \right)
\end{align}
lo que significa que $\mathcal{H}(x)$ es totalmente acotado. Como $Y$ es completo se sigue por la equivalencia de conjuntos relativamente compactos y totalmente acotados que $\mathcal{H}(x)$ es relativamente compacto en $Y.$

Para probar que $\mathcal{H}$ es equicontinuo tomemos en cuenta que $X$ es compacto y por lo visto en la entrada Continuidad uniforme sabemos que cada $g_i$ es uniformemente continua en $X.$ Entonces cada $g_i$ tiene su respectiva $\delta_i >0$ tal que para cualesquiera $x,z \in X,$ si $d_X(x,z)< \delta_i$ entonces
$$d_Y(g_i(x),g_i(z)) < \frac{\varepsilon}{3.}$$

Sea $\delta := min \{\delta_1,…,\delta_m\}.$
Sea $f \in \mathcal{H}.$ Dicho lo anterior y recordando que existe $i \in \{1,2,..,m\}$ tal que $f \in B_\infty \left(g_i, \, \frac{\varepsilon}{3} \right),$ tenemos que si $d_X(x,z) < \delta$ entonces

\begin{align}
\nonumber d_Y(f(x),f(z)) &\leq d_Y(f(x),g_i(x)) + d_Y(g_i(x),g_i(z))+ d_Y(g_i(z),f(z)) \\
\nonumber &< \frac{\varepsilon}{3}+\frac{\varepsilon}{3}+\frac{\varepsilon}{3} \\
&= \varepsilon
\end{align}

lo cual prueba que $\mathcal{H}$ es equicontinuo.

A continuación probaremos el regreso. Tengamos presentes las ideas: suponemos que $\mathcal{H}$ es equicontinuo y para cada $x \in X,$ los conjuntos definidos como $\mathcal{H}(x):= \{f(x) \, | \, f \in \mathcal{H}\}$ son relativamente compactos en $Y.$ Buscamos demostrar que $\mathcal{H}$ de $\mathcal{C^0}(X,Y)$ es relativamente compacto en el espacio $\mathcal{C^0}(X,Y).$

Dado que $\mathcal{C^0}(X,Y)$ es completo, por la equivalencia de conjuntos relativamente compactos y totalmente acotados basta con probar que $\mathcal{H}$ es totalmente acotado.

Sea $\varepsilon >0.$ Como $\mathcal{H}$ es equicontinuo, para cada $x \in X$ existe $\delta_x >0$ tal que para toda $f \in \mathcal{H}$ siempre que $d_X(x,z) < \delta_x,$ con $z \in X,$ se satisface
\begin{align}
d_Y(f(z),f(x)) < \frac{\varepsilon}{4}
\end{align}

Por supuesto que $\{B_X \left( x, \delta_x \right) \, | \, \, x \in X \}$ es una cubierta abierta de $X.$

$X$ cubierto por bolas abiertas con centro en cada punto de $X.$

Como es compacto, existen $x_1, \, x_2,…,x_n \, \in X$ tales que

\begin{align}
X \subset B_X \left( x_1, \delta_{x_1} \right) \cup B_X \left( x_2, \delta_{x_2} \right) \cup … \cup B_X \left( x_n, \delta_{x_n} \right)
\end{align}

$X$ cubierto por una cantidad finita de esas bolas.

y como cada $\mathcal{H}(x_i), \, i \in \{1,…,n\}$ es totalmente acotado, para cada $x_i$ existen $y^i_1,\ y^i_2,…,y^i_{k_i} \, \in Y$ tales que
\begin{align}
\mathcal{H}(x_i) \subset B_Y \left( y^i_1, \frac{\varepsilon}{4} \right) \cup B_Y \left( y^i_2, \frac{\varepsilon}{4} \right) \cup… \cup B_Y \left( y^i_{k_i}, \frac{\varepsilon}{4} \right)
\end{align}

Uniendo todos los $\mathcal{H}(x_i)$ y todas las bolas que cubren a estos conjuntos tenemos que, renombrando los centros, existen finitos $y_1,…,y_{m} \, \in Y$ que satisfacen

\begin{align}
\mathcal{H}(x_1) \cup … \cup \mathcal{H}(x_n) \subset B_Y \left( y_1, \frac{\varepsilon}{4} \right) \cup … \cup B_Y \left( y_{m}, \frac{\varepsilon}{4} \right)
\end{align}

Podemos pensar en clasificar las funciones de $\mathcal{H}$ dependiendo de a qué bola de radio $y_k,$ para algún $k \in \{1,…,m\}$ es enviado cada $x_i, \, i \in \{1,…,n\}.$ Como este comportamiento puede asignarse a través de una función $\sigma:\{1,2,…,n\} \to \{1,2,…,m\},$ definimos los conjuntos:

$$\mathcal{H_\sigma}:= \left\{ f \in \mathcal{H} \, \Big| \, \, f(x_i) \in B_Y\left(y_{\sigma(i)},\frac{1}{4}\right) \, \forall \, i=1,2,…,n\right\}.$$

Sea $S$ el conjunto de todas las funciones con dominio en $\{1,2,…,n\}$ e imagen en $\{1,2,…,m\}.$ Se cumple que

\begin{align}
\mathcal{H} \subset \underset{\sigma \in S}{\cup} \, \mathcal{H}_\sigma
\end{align}

Argumentando formalmente, si $f \in \mathcal{H}$ por la expresión (7) se asegura que cada $f(x_i)$ con $i \in \{1,2,…,n\}$ está en alguna bola $B_Y \left( y_k, \frac{\varepsilon}{4} \right)$ para algún $k \in \{1,2,…,m\}.$ Nota que la función que relaciona a cada $i$ con su respectiva $k,$ según esta descripción, es algún elemento $\sigma \in S,$ por lo tanto se cumple (8).

Ahora vamos a probar que cada $\mathcal{H}_\sigma$ está contenida en una bola de radio $\varepsilon$ con centro en $\mathcal{H}.$

Considera $f,g \in \mathcal{H}_\sigma$ y sea $x \in X.$ Por (5) $x$ pertenece a alguna bola abierta $B_X(x_i, \delta_{x_i})$ para algún $i \in \{1,2,…,n\}.$ Entonces $d_X(x,x_i)< \delta_{x_i}.$ Recordemos que esta $\delta_{x_i}$ se eligió de tal forma que satisface la definición de equicontinuidad en $x_i.$ Así, según (4) se sigue que para cada $h \in \mathcal{H}:$
$$d_Y(h(x),h(x_i)) < \frac{\varepsilon}{4}.$$

De esto y la desigualdad del triángulo tenemos:

\begin{align}
\nonumber d_Y(f(x),g(x)) &\leq d_Y(f(x),f(x_i)) + d_Y(f(x_i),g(x))\\
\nonumber &\leq d_Y(f(x),f(x_i)) + d_Y(f(x_i),y_{\sigma(i)})+ d_Y(y_{\sigma(i)},g(x))\\
\nonumber &\leq d_Y(f(x),f(x_i)) + d_Y(f(x_i),y_{\sigma(i)})+ d_Y(y_{\sigma(i)},g(x_i))+ d_Y(g(x_i),g(x))\\
\nonumber &< \frac{\varepsilon}{4} +\frac{\varepsilon}{4} +\frac{\varepsilon}{4} +\frac{\varepsilon}{4} \\
&= \varepsilon.
\end{align}

Si tomamos el máximo de las $x´s \in X$ concluimos que $d_\infty(f,g) < \varepsilon$ para cualesquiera $f,g \in \mathcal{H}_\sigma,$ en consecuencia el conjunto $\mathcal{H}_\sigma$ está contenido en una bola de radio $\varepsilon$ con centro en cualquiera de sus funciones. Es decir, para cualquier $g_\sigma \in \mathcal{H}_\sigma$

$$\mathcal{H}_\sigma \subset B_\infty(g_\sigma,\varepsilon)$$

De esta contención y la expresada en (8) obtenemos que

$$\mathcal{H} \subset \underset{\sigma \in S}{\cup}B_\infty(g_\sigma,\varepsilon).$$

Y como $S$ es finito, concluimos que $\mathcal{H}$ es totalmente acotado.

Terminemos esta sección con el siguiente:

Corolario. Sea $X$ un espacio métrico compacto. Un subconjunto $\mathcal{H}$ de $\mathcal{C}^0(X, \mathbb{R}^n)$ es relativamente compacto en $\mathcal{C}^0(X, \mathbb{R}^n)$ si y solo si $\mathcal{H}$ es equicontinuo y acotado en $\mathcal{C}^0(X, \mathbb{R}^n).$

Demostración:
Sea $\mathcal{H}$ un subconjunto relativamente compacto en $\mathcal{C}^0(X, \mathbb{R}^n).$ Por el teorema de Arzelá-Ascoli, $\mathcal{H}$ es equicontinuo. Como $\overline{\mathcal{H}}$ es compacto entonces es acotado en $\mathcal{C}^0(X, \mathbb{R}^n),$ por lo tanto $\mathcal{H}$ también es acotado en $\mathcal{C}^0(X, \mathbb{R}^n).$

Ahora supongamos que $\mathcal{H}$ es equicontinuo y acotado en $\mathcal{C}^0(X, \mathbb{R}^n).$ Entonces existen $f_0 \in \mathcal{H}$ y $M>0$ tales que para cada $f \in \mathcal{H}$

$$\norm{f-f_0}_\infty := \underset{x \in X}{max}\norm{f(x) \, – \, f_0(x)} \leq M$$

De aquí podemos concluir que para cada $x \in X,$ el conjunto $\mathcal{H}(x)$ está acotado en $\mathbb{R}^n$ entonces así lo es también su cerradura, por lo que $\overline{\mathcal{H}}$ es cerrado y acotado en $\mathbb{R}^n$ de modo que $\mathcal{H}(x)$ es relativamente compacto y por el teorema de Arzelá-Ascoli, se cumple que $\mathcal{H}$ es relativamente compacto en $\mathcal{C}^0(X, \mathbb{R}^n).$

Más adelante…

Terminaremos la sección de compacidad mostrando un concepto que sigue la misma idea de las bolas de radio $\varepsilon$ que son las $\varepsilon$-redes. Hablaremos de la métrica de Hausdorff y de cómo es posible entender la compacidad a través de conjuntos finitos.

Tarea moral

  1. Para cada $n \in \mathbb{N},$ sea $f_n:[0, \infty) \to \mathbb{R}$ tal que $f_n(x):= sen \sqrt{x + 4 \pi ^2 n ^2}.$ Demuestra que
    a) El conjunto $\mathcal{H} := \{f_n \, | \, n \in \mathbb{N} \}$ es equicontinuo.
    b) Para cada $x \in [0, \infty)$ el conjunto $\mathcal{H}(x)$ es relativamente compacto en $\mathbb{R}.$ Te sugerimos probar que la sucesión $(f_n)_{n \in \mathbb{N}}$ converge puntualmente a $0$ en $[0, \infty).$
    c) $\mathcal{H}$ no es un subconjunto compacto de $\mathcal{C}_b ^0([0, \infty), \mathbb{R}).$ Te sugerimos probar que la sucesión $(f_n)_{n \in \mathbb{N}}$ no converge uniformemente a $0$ en $[0, \infty).$
    Concluye que la compacidad de $X$ es necesaria en el teorema de Arzelá-Ascoli.
  2. Sea $X := \{ (x,y) \in \mathbb{R}^2 \, | \, (x,y) \neq (\frac{1}{2},0) \}$ y sea $f_n \in \mathcal{C}^0([0,1],X)$ tal que $f_n(x) := (x, \frac{1}{n} sen \pi x).$ Considera el conjunto $\mathcal{H} := \{f_n \, | \, n \in \mathbb{N}\}.$
    a) ¿Es $\mathcal{H}$ equicontinuo?
    b) ¿Es $\mathcal{H}$ acotado en $\mathcal{C}^0([0,1],X)?$
    c) ¿Es $\mathcal{H}$ relativamente compacto en $\mathcal{C}^0([0,1],X)?$

Bibliografía

Enlaces

Y para terminar, dos resultados fuertes de la integral de Riemann-Stieltjes

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

El contenido de esta sección se basa predominantemente en el libro
Wheeden, R.L., Zygmund, A., Measure and Integral. An Introduccion to Real Analysis. (2da ed.). New York: Marcel Dekker, 2015, págs 34-37.

En la entrada anterior vimos que para cualesquiera $P_1, P_2 \in \mathcal{P}_{[a,b]}$ se cumple que $\underline{S}_{P_1} \leq \overline{S}_{P_2},$ entonces

\begin{align}
-\infty < \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} \leq \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} < \infty.
\end{align}

Esto también ocurre con la integral de Riemann que se estudia en los cursos de Cálculo, donde además, cuando se da la igualdad $\, \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} \, $ se toma el valor del límite como el valor de la integral. (Ver Cálculo Diferencial e Integral II: Definición de la integral definida).

Nota que nosotros no hemos definido así la integral de Riemann-Stieltjes, sino tomando particiones cuyas normas tienden a cero. Aunque la intuición nos dice que particiones de intervalos muy pequeños se aproximan demasiado al valor de la integral, esto no siempre ocurre. Específicamente, incluso cuando se cumple que $\, \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} \,$ en el caso de las sumas inferior y superior de Riemann-Stieltjes, la integral podría no existir. Veamos un ejemplo.

Sean $f:[a,b] \to \mathbb{R}\,$ y $\, \alpha:[a,b] \to \mathbb{R}$ definidas como

\begin{equation*}
f(x) = \begin{cases}
0 &\text{ si } &-1 \leq x <0 \\
1 &\text{ si } &0 \leq x \leq 1.
\end{cases}
\end{equation*}

\begin{equation*}
\alpha (x) = \begin{cases}
0 &\text{ si } &-1 \leq x \leq 0 \\
1 &\text{ si } &0 < x \leq 1 .
\end{cases}
\end{equation*}

Observa que $f$ y $\alpha$ tienen un punto de discontinuidad común que provoca que $\int_{-1}^{1}f \, d\alpha$ no exista. En efecto, si $P= \{x_0=-1,…,x_n =1\}$ es una partición en la que $x_{j-1} < 0 < x_j$ para algún $j \in \{1,…,n\}$
se puede ver que $S(P,f,\alpha)= f(\xi_j)$ con $\xi_j \in [x_{j-1}, x_j],$ (queda como ejercicio) y así

$$S(P,f,\alpha)= 0\, \text{ o }\, S(P,f,\alpha)= 1$$
sin importar qué tan pequeños sean los intervalos de la partición, por lo que no existe $\underset{|P| \to 0}{lim} \, S(P,f,\alpha).$

Pese a lo anterior, es sencillo verificar que
$$ \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} = 1.$$

La siguiente proposición muestra hipótesis en las que la integral de Riemann-Stieltjes y los límites de las sumas sí coinciden.

Proposición. Sea $f:[a,b] \to \mathbb{R}$ acotada y $\alpha:[a,b] \to \mathbb{R}$ monótona creciente. Si $\int_{a}^{b}f \, d\alpha$ existe, entonces

$$\underset{|P| \to 0}{lim} \, \underline{S}_P \, \text{ y } \, \underset{|P| \to 0}{lim} \, \overline{S}_P$$

existen y

$$\underset{|P| \to 0}{lim} \, \underline{S}_P \, = \, \underset{|P| \to 0}{lim} \, \overline{S}_P = \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} = \int_{a}^{b}f \, d\alpha.$$

Demostración:
En el caso no trivial, supongamos que $\alpha$ no es constante en $[a,b].$

Sea $I = \int_{a}^{b}f \, d\alpha.$ Entonces dada $\varepsilon >0$ existe $\delta>0$ tal que si $|P|< \delta$ entonces $|I \, – \, S(P,f,\alpha)|< \varepsilon.$

Supongamos que $P= \{x_0 = a,…, x_n =b\}$ con $|P|< \delta.$ Tomemos $\xi_i, \, \eta_i \in [x_{i-1},x_i], \, i=1,…,n, \,$ tales que

\begin{align}
0 \leq M_i \, – \, f(\xi_i) &< \frac{\varepsilon}{\alpha(b) \, – \, \alpha(a)} \, \, \text{ y } \\
0 \leq f(\eta_i) \, – \, m_i &< \frac{\varepsilon}{\alpha(b) \, – \, \alpha(a)}
\end{align}

Sean

\begin{align}
S’_P&= \sum_{i=1}^{n}f(\xi_i) \, (\alpha(x_i) \, – \, \alpha(x_{i-1})) \, \, \text{ y } \\
S^{\prime \prime}_P&= \sum_{i=1}^{n}f(\eta_i) \, (\alpha(x_i) \, – \, \alpha(x_{i-1}))
\end{align}

entonces

\begin{align}
|I \, – \, S’_P|&< \varepsilon \, \, \text{ y}\\
|I \, – \, S^{\prime \prime}_P|&< \varepsilon.
\end{align}

Por otro lado, por (2),

\begin{align}
\nonumber 0 \leq \overline{S}_P \, – \, S’_P &= \sum_{i=1}^{n}M_i \, (\alpha(x_i) \, – \, \alpha(x_{i-1})) \, – \sum_{i=1}^{n}f(\xi_i) \, (\alpha(x_i) \, – \, \alpha(x_{i-1}))\\
\nonumber &= \sum_{i=1}^{n}[M_i \, – \, f(\xi_i)] \, (\alpha(x_i) \, – \, \alpha(x_{i-1})) \\
\nonumber &< \sum_{i=1}^{n}\frac{\varepsilon}{\alpha(b) \, – \, \alpha(a)}\, (\alpha(x_i) \, – \, \alpha(x_{i-1})) \\
\nonumber &= \frac{\varepsilon}{\alpha(b) \, – \, \alpha(a)}\, \sum_{i=1}^{n} (\alpha(x_i) \, – \, \alpha(x_{i-1})) \\
\nonumber &= \frac{\varepsilon}{\alpha(b) \, – \, \alpha(a)}\, (\alpha(b) \, – \, \alpha(a)) \\
&= \varepsilon.
\end{align}

Análogamente

\begin{align}
0 \leq S^{\prime \prime}_P \, – \, \underline{S}_P < \varepsilon.
\end{align}

De (6), (8) y la desigualdad del triángulo se sigue

$$|\overline{S}_P \, – \, I|\leq |\overline{S}_P\, – \, S’_P|+|S’_P \, – \, I|< \varepsilon + \varepsilon = 2 \varepsilon,$$

mientras que de (7), (9) y la desigualdad del triángulo tenemos

$$|\underline{S}_P \, – \, I|\leq |\underline{S}_P\, – \, S^{\prime \prime}_P|+|S^{\prime \prime}_P \, – \, I|< \varepsilon + \varepsilon = 2 \varepsilon,$$

por lo tanto

$$\underset{|P|\to 0}{lim}\, \overline{S}_P = I = \underset{|P|\to 0}{lim}\, \underline{S}_P .$$

Dado que

$$\underline{S}_P \leq \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} \leq \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} \leq \overline{S}_P$$

entonces también

$$\underset{|P|\to 0}{lim}\, \underline{S}_P =\underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} = \underset{|P|\to 0}{lim}\, \overline{S}_P$$

terminando así la prueba.

Para finalizar, veamos la siguiente:

Proposición. Sean $f:[a,b] \to \mathbb{R}$ acotada y $\alpha:[a,b] \to \mathbb{R}$ monótona creciente y continua, entonces

a)
$$\underset{|P| \to 0}{lim} \, \underline{S}_P \, \text{ y } \, \underset{|P| \to 0}{lim} \, \overline{S}_P$$

existen y se cumplen las siguientes igualdades:

\begin{align}
\underset{|P| \to 0}{lim} \, \underline{S}_P &= \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} \\
\underset{|P| \to 0}{lim} \, \overline{S}_P &= \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P}.
\end{align}

b) Si además $\underset{P \in \mathcal{P}_{[a,b]}}{sup} \, \underline{S}_P = \underset{P \in \mathcal{P}_{[a,b]}}{inf} \, \overline{S}_P$ entonces

$$\int_{a}^{b}f \, d\alpha$$

existe y

$$\underset{P \in \mathcal{P}_{[a,b]}}{sup} \, \underline{S}_P = \int_{a}^{b}f \, d\alpha= \underset{P \in \mathcal{P}_{[a,b]}}{inf} \, \overline{S}_P.$$

Demostración:
a) Será suficiente probar (10) y (11). Presentamos la demostración de (11). La igualdad faltante es análoga y se dejará como ejercicio al lector.

Para simplificar la notación, hagamos

$$\underset{P \in \mathcal{P}_{[a,b]}}{inf} \, \overline{S}_P := \overline{S}.$$

Nota que (11) se cumple si y solo si dado $\varepsilon>0$ existe $\delta>0$ tal que si $|P|< \delta$ entonces

\begin{align}
\nonumber &&|\overline{S}_P \, – \, \overline{S}| &< \varepsilon\\
\nonumber &\iff& \overline{S}_P \, – \, \overline{S} &< \varepsilon\\
&\iff& \overline{S}_P &< \overline{S} + \varepsilon
\end{align}

Tomemos $\hat{P}=\{\hat{x_0}=a,…,\hat{x_n}=b\}$ una partición de $[a,b]$ tal que

$$\overline{S}_{\hat{P}}<\overline{S}+ \frac{\varepsilon}{2}.$$

y sea
\begin{align}
\textcolor{RoyalBlue}{M= \underset{x \, \in \, [a,b]}{sup} \, |f(x)|.}
\end{align}

Ya que $\alpha$ es uniformemente continua en $[a,b],$ existe $\eta>0$ tal que si $|x \, – \, x’|< \eta$ entonces

\begin{align}
\textcolor{magenta}{|\alpha(x) \, – \, \alpha(x’)| < \frac{\varepsilon}{4(n+1)M}}.
\end{align}

Ahora tomemos $P=\{x_0=a,…,x_m=b\}$ partición de $[a,b]$ tal que $|P|< \eta$ y
$$|P|< \underset{i \in \{1,…,n\}}{min}\, (\hat{x_i}\, – \, \hat{x}_{i-1}).$$

Vamos a mostrar que $\overline{S}_P$ cumple (12).

Nota que

\begin{align}
\overline{S}_P &= \sum_{i=1}^{m}M_i \, (\alpha(x_i) \, – \, \alpha(x_{i-1}))\\
&= \sum’ + {\sum}^{\prime \prime}
\end{align}

donde $\sum’$ representa a los sumandos cuyos intervalos no tienen puntos de $\hat{P}\,$ y $\, \sum^{\prime \prime}$ representa a los que sí. Observa que, por como fueron elegidas $P$ y $\hat{P},$ cada intervalo generado por $P$ tiene a lo más un punto de $\hat{P},$ así

\begin{align}
\overline{S}_{P \cup \hat{P}} = \sum’ + {\sum}^{\prime \prime \prime}
\end{align}

donde $\sum^{\prime \prime \prime}$ resulta de reemplazar cada sumando en $\sum^{\prime \prime}$ que es de la forma

$$M_i \, (\alpha(x_i) \, – \, \alpha(x_{i-1}))$$

por la expresión

$$\underset{x \, \in \, [x_{i-1},\hat{x}_j]}{sup}f(x) \, (\alpha(\hat{x}_j) \, – \, \alpha(x_{i-1})) + \underset{x \, \in \, [\hat{x}_j, x_{i},]}{sup}f(x) \, (\alpha(x_i) \, – \, \alpha(\hat{x}_j) ) $$

donde $\hat{x}_j$ es el punto de $\hat{P}$ en $(x_{i-1}, x_i).$

Por lo tanto de (16) y (17) tenemos
$$\overline{S}_P \, – \, \overline{S}_{P \cup \hat{P}} = {\sum}^{\prime \prime} \, – \, {\sum}^{\prime \prime \prime}.$$

Observa que se satisface al menos una de las siguientes igualdades:

\begin{align}
M_i &= \underset{x \, \in \, [x_{i-1},\hat{x}_j]}{sup}f(x) \, \text{ o bien} \\
M_i &= \underset{x \, \in \, [\hat{x}_j, x_{i},]}{sup}f(x)
\end{align}

Si se cumple (18) entonces

\begin{align}
\nonumber M_i \, (\alpha(x_i) \, – \, \alpha(x_{i-1})) \, – \, [\underset{x \, \in \, [x_{i-1},\hat{x}_j]}{sup}f(x) \, (\alpha(\hat{x}_j) \, – \, \alpha(x_{i-1})) + \underset{x \, \in \, [\hat{x}_j, x_{i},]}{sup}f(x) \, (\alpha(x_i) \, – \, \alpha(\hat{x}_j) )] = \\
=\textcolor{RoyalBlue}{\left( M_i \, – \, \underset{x \, \in \, [\hat{x}_j, x_{i},]}{sup}f(x) \right)} \, \textcolor{magenta}{(\alpha(x_i) \, – \, \alpha(\hat{x}_j) )}
\end{align}

Pero si se cumple (19) se sigue que

\begin{align}
\nonumber M_i \, (\alpha(x_i) \, – \, \alpha(x_{i-1})) \, – \, [\underset{x \, \in \, [x_{i-1},\hat{x}_j]}{sup}f(x) \, (\alpha(\hat{x}_j) \, – \, \alpha(x_{i-1})) + \underset{x \, \in \, [\hat{x}_j, x_{i},]}{sup}f(x) \, (\alpha(x_i) \, – \, \alpha(\hat{x}_j) )] = \\
=\textcolor{RoyalBlue}{\left(M_i \, – \, \underset{x \, \in \, [x_{i-1},\hat{x}_j]}{sup}f(x) \right)} \, \textcolor{magenta}{(\alpha(\hat{x}_j) \, – \, \alpha(x_{i-1}) )}
\end{align}

En cualquier caso, de (13) y (14) la diferencia es a lo más
$$\frac{\textcolor{RoyalBlue}{2M}\textcolor{magenta}{\varepsilon}}{\textcolor{magenta}{4(n+1)M}} = \frac{\varepsilon}{2(n+1)}$$

Entonces.

$$\overline{S}_P \, – \, \overline{S}_{P \cup \hat{P}} \leq \frac{\varepsilon(n+1)}{2(n+1)} = \frac{\varepsilon}{2}.$$

Más aún

$$\overline{S}_{P \cup \hat{P}} \leq \overline{S}_\hat{P} < \overline{S}+\frac{\varepsilon}{2}$$

con lo cual queda demostrada la proposición.

b) Dado que para cualquier $P \in \mathcal{P}_{[a,b]}$

$$\underline{S}_P \leq S(P,f,\alpha) \leq \overline{S}_P$$
entonces haciendo $|P| \to 0$ concluimos:

$$\underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \int_{a}^{b}f \, d\alpha = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P}.$$

Más adelante…

¡Gracias por acompañarnos en la exposición de este curso! Si deseas continuar, puedes consultar el contenido correspondiente a Análisis Matemático II. La comunidad sigue creciendo y ya trabaja creando notas con ejercicios que motiven el aprendizaje. Pronto te las compartiremos.

Tarea moral

  1. En el ejemplo descrito al inicio, demuestra que
    a)
    $$S(P,f,\alpha)= f(\xi_j)$$
    con $\xi_j \in [x_{j-1}, x_j]$ donde $[x_{j-1}, x_j]$ es el intervalo de la partición que tiene al cero.
    Prueba también que para todo $\delta>0$ existe una partición $P$ con $|P|< \delta$ tal que
    $S(P,f,\alpha)= 0$ o $S(P,f,\alpha)= 1$
    dependiendo el punto $\xi_j$ elegido. Concluye que no existe $\underset{|P| \to 0}{lim} \, S(P,f,\alpha).$
    b) Verifica que
    $$ \underset{P \in \mathcal{P}_{[a,b]}}{sup \, \underline{S}_P} = \underset{P \in \mathcal{P}_{[a,b]}}{inf \, \overline{S}_P} = 1.$$
  2. Demuestra la igualdad (10).

Bibliografía

  • Wheeden, R.L., Zygmund, A., Measure and Integral. An Introduccion to Real Analysis. (2da ed.). New York: Marcel Dekker, 2015. Págs: 34-37.

Enlaces

Propiedades de la integral de Riemann-Stieltjes. Parte 1

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

El contenido de esta sección se basa predominantemente en el libro
Wheeden, R.L., Zygmund, A., Measure and Integral. An Introduccion to Real Analysis. (2da ed.). New York: Marcel Dekker, 2015, págs 26-30.

Mostraremos resultados formales de la integral de Riemann-Stieltjes. Recordemos que en la entrada anterior partimos de dos funciones acotadas $f:[a,b] \to \mathbb{R}$ y $\alpha:[a,b] \to \mathbb{R}$ y una partición $P=\{x_0 = a,…,x_n =b\}$ en $[a,b]$ con puntos $\xi_i \in [x_{i-1}, x_i].$ Definimos la suma de Riemann-Stieltjes como

$$S(P,f,\alpha) := \sum_{i=1}^{n}f(\xi_i)(\alpha(x_i) \, – \, \alpha(x_{i-1})).$$

Este resultado depende de $P, \, f$ y $\alpha.$ En esta ocasión, más que hacer $n \to \infty$ haremos que la norma de la partición tienda a cero. Cuando existe $I \in \mathbb{R}$ tal que para cada $\varepsilon >0,$ existe $\delta >0$ tal que si $|P|< \delta$
y para cualquier elección de los puntos $\xi_i$ se cumple que $|I \, – \, S(P,f,\alpha)|< \varepsilon,$ diremos que
$$I := \underset{|P| \to 0}{lim} \, S(P,f,\alpha).$$
Si es finito lo llamamos integral de Riemann-Stieltjes de $f$ con respecto a $\alpha$ en $[a,b].$ El valor de $I \,$ se denota como:
$$\int_{a}^{b}f(x) \, d\alpha := \int_{a}^{b}f \, d\alpha.$$

Por supuesto que este límite no siempre existe en $\mathbb{R}.$ Conozcamos una equivalencia que muestra cuando sí.

Proposición. Criterio de Cauchy para la integral de Riemann-Stieltjes. La integral $\int_{a}^{b}f \, d\alpha$ existe si y solo si para cada $\varepsilon>0$ existe $\delta>0$ tal que si $|P|, \, |Q|< \delta$ entonces
$$|S(P,f,\alpha) \, – \, S(Q,f,\alpha)|< \varepsilon.$$

Demostración:
La ida de la proposición es inmediata por la desigualdad del triángulo: Si la integral $I$ existe entonces para cada $\varepsilon > 0$, existe $\delta > 0$ tal que si $|P|, |Q| < \delta$, de modo que $|S(P,f,\alpha) – I| < \frac{\varepsilon}{2}$ y $|S(Q,f,\alpha) – I| < \frac{\varepsilon}{2}$. Por lo tanto:
$$|S(P,f,\alpha) – S(Q,f,\alpha)| \leq |S(P,f,\alpha) – I| + |I – S(Q,f,\alpha)| < \frac{\varepsilon}{2} + \frac{\varepsilon}{2} = \varepsilon.$$

En el regreso buscamos probar la existencia del límite $I$. Utilizaremos la completitud de los números reales.
Para cada $n \in \mathbb{N}$, sea $\varepsilon_n = \frac{1}{n}$. Por hipótesis, existe $\delta_n > 0$ tal que si $|P|, |Q| < \delta_n$, entonces $|S(P,f,\alpha) – S(Q,f,\alpha)| < \frac{1}{n}$.

Podemos construir una sucesión de particiones $(P_n)_{n \in \mathbb{N}} \,$ como sigue:

Elegimos $P_1 \in \mathcal{P}_{[a,b]}$ tal que $|P_1| < min\{\delta_1, 1\}.$

Elegimos $P_2 \in \mathcal{P}_{[a,b]}$ tal que $|P_2| < min\{\delta_2, \delta_1, \frac{1}{2}\}.$

Elegimos $P_3 \in \mathcal{P}_{[a,b]}$ tal que $|P_3| < min\{\delta_3, \delta_2, \delta_1, \frac{1}{3}\}.$

.

.

.

Elegimos $P_k \in \mathcal{P}_{[a,b]}$ tal que $|P_k| < min\{\delta_k,…\delta_2, \delta_1, \frac{1}{k}\}.$

Nota que la sucesión de números reales $(S(P_n, f, \alpha))_{n \in \mathbb{N}} \,$ es una sucesión de Cauchy, pues dado $\varepsilon > 0$, existe $N \in \mathbb{N}\, $ tal que $\frac{1}{N}< \varepsilon.$
Por otro lado, para $n, m \geq N$ se cumple que $\frac{1}{n}, \frac{1}{m} < \frac{1}{N}$,
en consecuencia, tanto $|P_n|$ como $|P_m|$ son menores que $\frac{1}{N}$ y menores que $\delta_N.$ Se sigue que:

$$|S(P_n,f,\alpha) \, – \, S(P_m,f,\alpha)|< \frac{1}{N} < \varepsilon.$$

Dado que $\mathbb{R}$ es completo, existe $I \in \mathbb{R}$ tal que $\underset{n \to \infty}{lim} S(P_n, f, \alpha) = I$.

Finalmente, veamos que $I$ es efectivamente el límite cuando $|P| \to 0$. Sea $\varepsilon > 0$. Elegimos $k \in \mathbb{N}$ tal que $\frac{1}{k} < \frac{\varepsilon}{2}$ y $|S(P_k, f, \alpha) – I| < \frac{\varepsilon}{2}$. Si tomamos $\delta = \delta_k$, entonces para cualquier partición $P$ con $|P| < \delta$, tenemos:
$$|S(P,f,\alpha) – I| \leq |S(P,f,\alpha) – S(P_k, f, \alpha)| + |S(P_k, f, \alpha) – I| < \frac{1}{k} + \frac{\varepsilon}{2} < \frac{\varepsilon}{2} + \frac{\varepsilon}{2} = \varepsilon.$$

Por lo tanto, la integral existe y es igual a $I$.

Ejemplos

  • Sean $f, \alpha :[a,b] \to \mathbb{R}$ con $f$ continua y $\alpha$ continuamente diferenciable, entonces
    $$\int_{a}^{b}f \, d\alpha = \int_{a}^{b}f \, \alpha’ \, dx$$
    De hecho, por el teorema del valor medio aplicado en $\alpha,$ para cada $i = 1,2,..,n$ existen $\eta_i \in [x_{i-1}, x_i]$ tales que
    \begin{align}
    S(P,f,\alpha) &= \sum_{i=1}^{n}f(\xi_i)(\alpha(x_i) \, – \, \alpha(x_{i-1})) \\
    &= \sum_{i=1}^{n}f(\xi_i)\alpha'(\eta_i)(x_i \, – \, x_{i-1}).
    \end{align}
Teorema del valor medio en $\alpha.$

Usando la continuidad uniforme de $\alpha’$ podemos asumir que, en intervalos muy pequeños, $\alpha'(\eta_i)= \alpha'(\xi_i),$ en consecuencia

$$\sum_{i=1}^{n}f(\xi_i)\alpha'(\eta_i)(x_i \, – \, x_{i-1})= \sum_{i=1}^{n}f(\xi_i)\alpha'(\xi_i)(x_i \, – \, x_{i-1})$$

Nota que esto ya es la común suma de Riemann y así:
$$\underset{|P| \to 0}{lim} \, S(P,f,\alpha)= \int_{a}^{b} f \, \alpha’ \, dx,$$

o bien

$$\int_{a}^{b}f \, d\alpha = \int_{a}^{b}f \, \alpha’ \, dx.$$

  • Ahora considera $f, \alpha: [a,b] \to \mathbb{R}$ donde

\begin{equation*}
\alpha(x) = \begin{cases}
1 \text{ si $x \geq 0$} \\
\\
0 \text{ si $x < 0$}
\end{cases}
\end{equation*}

Gráfica de $\alpha.$

y $f$ es una función continua en $0.$ Es sencillo demostrar que
$$\int_{-1}^{1}f \, d\alpha = f(0).$$

A continuación enunciaremos algunas propiedades de la integral de Riemann-Stieltjes. Las demostraciones las dejaremos como ejercicio.

Proposición. Sean $f, f_1, f_2, \alpha, \alpha_1$ y $\alpha_2$ funciones de $[a,b] \to \mathbb{R}$ y $c \in \mathbb{R},$ entonces se satisfacen:

a) Si $\int_{a}^{b} f \, d\alpha$ existe, entonces también existen tanto $\int_{a}^{b}cf \, d\alpha$ como $\int_{a}^{b}f \, d(c\alpha)$ y además
$$\int_{a}^{b}cf \, d\alpha = \int_{a}^{b}f \, d(c\alpha) = c \int_{a}^{b}f \, d\alpha.$$

b) Si tanto $\int_{a}^{b} f_1 \, d\alpha$ como $\int_{a}^{b} f_2 \, d\alpha$ existen, entonces también
$\int_{a}^{b} (f_1 + f_2) \, d\alpha$ existe y
$$\int_{a}^{b} (f_1 + f_2) \, d\alpha = \int_{a}^{b} f_1 \, d\alpha + \int_{a}^{b} f_2 \, d\alpha.$$

c) Si tanto $\int_{a}^{b} f \, d\alpha_1$ como $\int_{a}^{b} f \, d\alpha_2$ existen, entonces también
$\int_{a}^{b} f \, d(\alpha_1+ \alpha_2)$ existe y
$$\int_{a}^{b} f \, d(\alpha_1+ \alpha_2) = \int_{a}^{b} f \, d\alpha_1 + \int_{a}^{b} f \, d\alpha_2.$$

Para finalizar esta sección, veremos que es posible obtener la integral de Riemann-Stieltjes como equivalencia de la suma de integrales correspondientes a cada división del intervalo, como muestra la siguiente:

Proposición. Si $\int_{a}^{b} f \, d\alpha$ existe y $a \leq c \leq b,$ entonces

a) Tanto $\int_{a}^{c}f \, d\alpha$ como $\int_{c}^{b}f \, d\alpha$ existen y

b) $\int_{a}^{b}f \, d\alpha = \int_{a}^{c}f \, d\alpha + \int_{c}^{b} f \, d\alpha.$

Demostración:
Para simplificar la notación, hagamos $S_P[a,b] = S(P,f,\alpha)$ donde $P \in \mathcal{P}_{[a,b]}.$

Para mostrar que $\int_{a}^{c} f \, d\alpha$ existe, de acuerdo con el criterio de Cauchy para la integral de Riemann-Stieltjes encunciado arriba, será suficiente probando que para todo $\varepsilon>0$ existe $\delta>0$ tal que si $P_1, \, P_2 \in \mathcal{P}_{[a,c]}$ con $|P_1|, \, |P_2|< \delta,$ entonces

\begin{align}
|S_{P_1}[a,c] \, – \, S_{P_2}[a,c]| < \varepsilon.
\end{align}

Como $\int_{a}^{b}f \, d\alpha \,$ existe entonces dada $\varepsilon>0$ existe $\delta>0$ tal que para cualesquiera $P’_1, \, P’_2 \in \mathcal{P}_{[a,b]}$ con $|P’_1|, \, |P’_2|< \delta, \,$ tenemos
\begin{align}
|S_{P’_1}[a,b] \, – \, S_{P’_2}[a,b]| < \varepsilon.
\end{align}

Sean $P_1, \, P_2 \in \mathcal{P}_{[a,c]}$ tales que $|P_1|, \, |P_2|< \delta$ y toma $P \in \mathcal{P}_{[c,b]}$ tal que también $|P|< \delta.$

Definimos $P’_1 = P_1 \cup P \, $ y $\, P’_2 = P_2 \cup P.$ Nota que ambas son particiones de $[a,b]$ cuya norma es menor que $\delta$ y por tanto satisfacen (4).

Notemos que

\begin{align}
S_{P’_1}[a,b] &= S_{P_1}[a,c]+ S_{P}[c,b] \\
\text{y } S_{P’_2}[a,b] &= S_{P_2}[a,c]+ S_{P}[c,b]
\end{align}

así, restando (6) de (5)

\begin{align}
|S_{P_1}[a,c] \, – \, S_{P_2}[a,c] + \cancel{S_{P}[c,b] \, – \, S_{P}[c,b]}| = |S_{P’_1}[a,b] \, – \, S_{P’_2}[a,b]|
\end{align}

De (7) y (4) se cumple (3), por lo tanto

$\int_{a}^{c}f \, d\alpha$ existe.

Análogamente se puede probar que $\int_{c}^{b}f \, d\alpha$ existe, mientras que (5) y (6) permiten concluir que
$$\int_{a}^{b}f \, d\alpha = \int_{a}^{c}f \, d\alpha + \int_{c}^{b}f \, d\alpha$$
que es lo que queríamos demostrar.

Más adelante…

Veremos algunas propiedades más de la integral de Riemann-Stieltjes, por lo pronto desarrolla las ideas con los siguientes ejercicios.

Tarea moral

  1. Considera $f, \alpha: [a,b] \to \mathbb{R}$ donde
    \begin{equation*}
    \alpha(x) = \begin{cases}
    1 \text{ si $x \geq 0$} \\
    0 \text{ si $x < 0$}
    \end{cases}
    \end{equation*}
    y $f$ es una función continua en $0.$ Prueba que
    $$\int_{-1}^{1}f \, d\alpha = f(0).$$
  2. Sean $f, f_1, f_2, \alpha, \alpha_1$ y $\alpha_2$ funciones de $[a,b] \to \mathbb{R}$ y $c \in \mathbb{R}. \,$ Demuestra que se satisfacen:
    a) Si $\int_{a}^{b} f \, d\alpha$ existe, entonces también existen tanto $\int_{a}^{b}cf \, d\alpha$ como $\int_{a}^{b}f \, d(c\alpha)$ y además
    $$\int_{a}^{b}cf \, d\alpha = \int_{a}^{b}f \, d(c\alpha) = c \int_{a}^{b}f \, d\alpha.$$
    b) Si tanto $\int_{a}^{b} f_1 \, d\alpha$ como $\int_{a}^{b} f_2 \, d\alpha$ existen, entonces también
    $\int_{a}^{b} (f_1 + f_2) \, d\alpha$ existe y
    $$\int_{a}^{b} (f_1 + f_2) \, d\alpha = \int_{a}^{b} f_1 \, d\alpha + \int_{a}^{b} f_2 \, d\alpha.$$
    c) Si tanto $\int_{a}^{b} f \, d\alpha_1$ como $\int_{a}^{b} f \, d\alpha_2$ existe, entonces también
    $\int_{a}^{b} f \, d(\alpha_1+ \alpha_2)$ existe y
    $$\int_{a}^{b} f \, d(\alpha_1+ \alpha_2) = \int_{a}^{b} f \, d\alpha_1 + \int_{a}^{b} f \, d\alpha_2.$$
  3. Sean $f, \alpha:[a,b] \to \mathbb{R}$ funciones acotadas. Demuestra que si $[a’,b’] \subset [a,b]$ y $\int_{a}^{b} f \, d\alpha$ existe entonces también $\int_{a’}^{b’} f \, d\alpha$ existe.

Bibliografía

  • Wheeden, R.L., Zygmund, A., Measure and Integral. An Introduccion to Real Analysis. (2da ed.). New York: Marcel Dekker, 2015. Págs: 26-30.

Enlaces

Funciones de variación acotada. Parte 2

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

El contenido de esta sección se basa predominantemente en el libro
Wheeden, R.L., Zygmund, A., Measure and Integral. An Introduccion to Real Analysis. (2da ed.). New York: Marcel Dekker, 2015, págs 22-26.

Tal como lo hicimos en la entrada anterior, seguiremos hablando de las funciones de variación acotada. Notemos que en los resultados de esta teoría no suele pedirse que la función sea continua o acotada, más aún, esto pudiera no ser suficiente para que una función sea de variación acotada, tal como lo muestra un ejercicio de la tarea moral de esta sección. Veamos entonces qué hipótesis pudieran ser útiles. Comencemos con la siguiente:

Definición. Discontinuidades del primer tipo. Sea $f: \mathbb{R} \to \mathbb{R}$ y sea $x_0 \in \mathbb{R}.$ En los siguientes dos casos, $f$ no es continua en $x_0.$

a) Cuando $\underset{x \to x_0 ^+}{lim} \, f(x)$ y $\underset{x \to x_0 ^-}{lim} \, f(x)$ existen y son distintos de $\infty$ pero
$$\underset{x \to x_0 ^+}{lim} \, f(x) \neq\underset{x \to x_0 ^-}{lim} \, f(x).$$

El límite por la izquierda en $x_0$ es distinto al límite por la derecha.

b) Cuando $\underset{x \to x_0 ^+}{lim} \, f(x)$ y $\underset{x \to x_0 ^-}{lim} \, f(x)$ existen y son distintos de $\infty$ y además
$$\underset{x \to x_0 ^+}{lim} f(x) = \underset{x \to x_0 ^-}{lim} \, f(x)$$
pero $ \underset{x \to x_0 }{lim} f(x) \neq f(x_0).$

Existe el límite en $x_0$ pero la función no es continua ahí.

En cualquiera de estas situaciones, diremos que $f$ tiene una discontinuidad del primer tipo en $x_0.$

Proposición. Sea $f:[a,b] \to \mathbb{R} \,$ una función de variación acotada en $[a,b],$ entonces tiene a lo más una cantidad numerable de discontinuidades y todas son del primer tipo.

Demostración:
Sea $f$ de variación acotada. De acuerdo con la entrada anterior, $f$ es acotada en $[a,b].$ Veamos un caso bonito en el que $f$ es creciente.

El conjunto de discontinuidades de $f$ puede expresarse como
$$D := \underset{n \in \mathbb{N}}{\bigcup} \, \left\{x_0 \, \Big| \, \underset{x \to x_0 ^+}{lim} f(x) \, – \, \underset{x \to x_0 ^-}{lim} \, f(x) \geq \frac{1}{n} \right\}$$

pues el «tamaño del salto» en una discontinuidad siempre será mayor que algún $\frac{1}{n}$ suficientemente pequeño.

Representación de la distancia al evaluar $f$ en puntos antes y después de $x_0.$

Vamos a probar que cada uno de los conjuntos que compone la unión es o bien vacío o finito.

Supón por el contrario que para algún $k \in \mathbb{N}$ no es así, es decir, que el conjunto $\left\{x_0 \, \Big| \, \underset{x \to x_0 ^+}{lim} f(x) \, – \, \underset{x \to x_0 ^-}{lim} \, f(x) \geq \frac{1}{k} \right\} := D_k$ es infinito.

Como $f$ es creciente en $[a,b]$ se tiene que para cada punto de discontinuidad $x_0 \in D_k, \,$
$$\underset{x \to x_0 ^-}{lim} f(x) \leq f(x_0) \leq \underset{x \to x_0 ^+}{lim} \, f(x)$$
Nota además que podemos tomar dos puntos $x_1, x_3$ en $D_k$ tales que $\textcolor{JungleGreen}{f(x_3)}-\textcolor{JungleGreen}{f(x_1)} \geq \frac{1}{k},$ pues al ser $D_k$ infinito podemos tomar $x_1, \, x_2, \, x_3$ en $D_k$ tales que $x_1< x_2 < x_3.$ En consecuencia
$$\underset{x \to x_1 ^-}{lim} f(x) \leq \textcolor{JungleGreen}{f(x_1)} \leq \underset{x \to x_1 ^+}{lim} \, f(x) \leq \textcolor{magenta}{\underset{x \to x_2 ^-}{lim} f(x) \leq f(x_2) \leq \underset{x \to x_2 ^+}{lim} \, f(x)} \leq \underset{x \to x_3 ^-}{lim} f(x) \leq \textcolor{JungleGreen}{f(x_3)} \leq \underset{x \to x_3 ^+}{lim} \, f(x)$$

y como $\textcolor{magenta}{\underset{x \to x_2 ^+}{lim} f(x) – \underset{x \to x_2 ^-}{lim} \, f(x)} \geq \frac{1}{k}$ se sigue que
$\textcolor{JungleGreen}{f(x_3)}-\textcolor{JungleGreen}{f(x_1)} \geq \frac{1}{k}.$ Nota que esta propiedad la podemos garantizar con tantos puntos como queramos:

Sea $m \in \mathbb{N}$ con $ \textcolor{RoyalBlue}{m> [f(b) \, – \, f(a)]k}.$

Como $D_k$ es infinito, podemos elegir puntos $x_0, x_1,…,x_m \in D_k$ tales que $x_0 <x_1<…<x_m$ y $f(x_j)-f(x_{j-1}) \geq \frac{1}{k}, \, j = 1,2,…,m.$
Sea $P= \{a, x_0,…,x_m, b\}$ de modo que $P$ es partición de $[a,b]$ y
$$S_P \geq \sum_{j=1}^{m} |f(x_j)-f(x_{j-1})| \geq \textcolor{RoyalBlue}{m} \frac{1}{k} > \textcolor{RoyalBlue}{[f(b) \, – \, f(a)]k} \frac{1}{k} = f(b) \, – \, f(a).$$

Pero esto es una contradicción, pues de acuerdo con la entrada anterior, al ser $f$ monótona creciente debería cumplir $S_P = f(b) \, – \, f(a),$ por lo tanto $D_k$ es finito o vacío.
De esto se sigue que $D$ es contable.

Cada conjunto $\{ x_0: \underset{x \to x_0 ^+}{lim} f(x) \, – \, \underset{x \to x_0 ^-}{lim} \, f(x) \geq \frac{1}{k} \}$ es finito o vacío.

Ahora veamos el caso general. De acuerdo con el teorema de Jordan, visto al final de la entrada anterior,
$$f = f_1 \, – \, f_2,$$
con $f_1$ y $f_2$ funciones crecientes y acotadas que, por lo que acabamos de ver, tienen un número contable de discontinuidades del primer tipo, por lo tanto $f_1 \, – \, f_2 =f$ también cumple la condición.

Definición. Norma de $P.$ Sea $P=\{x_0=a , \, x_1, \, …, \, , x_n = b\}$ una partición de $[a,b].$ La norma de $P$ se define como la longitud del intervalo más grande de la partición y se denota como:

$$|P| := \underset{i \in \{1,…,n\}}{max } (x_i \, – \, x_{i-1}).$$

El resultado que veremos a continuación muestra condiciones con las que es posible aproximarse mucho a la variación a través de sumas $S_P,$ cuando los intervalos generados por la partición son chiquititos. Esto no siempre es así: el ejercicio 2 de la tarea moral de esta sección muestra una función donde $S_P$ no se acerca a $V,$ aun siendo $|P|$ menor que cualquier $\delta >0.$

Proposición. Si $f$ es una función continua en $[a,b]$ y $f$ es de variación acotada entonces
$$V=\underset{|P| \to 0}{lim} \, S_P,$$
es decir, dado $M<V,$ existe $\delta >0$ tal que $M < S_P$ para cualquier partición $P$ de $[a,b]$ con $|P|< \delta.$

Si $M < V$ entonces $M < S_P$ cuando $|P| < \delta.$

Demostración:

Sea $\mu>0$ tal que
$$M + \mu < V$$

Tomemos
$$\hat{P} = \{\hat{x}_0=a,…,\hat{x}_n=b\}$$
tal que
\begin{align}
M+ \mu < S_{\hat{P}}.
\end{align}

Como $f$ es continua en $[a,b]$ entonces es uniformemente continua en $[a,b].$ Sea $\delta_1 >0$ tal que si $|x \, – \, x^*|< \delta_1$ entonces
\begin{align}
|f(x) \, – \, f(x^*)| < \frac{\mu}{2(n+1)}
\end{align}

Nota que $\frac{\mu}{2(n+1)}$ sí es fijo, pues $n$ lo es por ser el número de intervalos de la partición $\hat{P}$ elegida.

Toma $\delta >0$ tal que
\begin{align}
\delta < min \left \{\delta_1, \underset{i \in \{1,…,n\}}{min}\{\hat{x}_i \, – \, \hat{x}_{i-1}\} \right\}.
\end{align}

Sea $P=\{x_0, \, x_1, \, …, \, , x_m\}$ una partición de $[a,b],$ tal que $|P|< \delta.$ Afirmamos que esta partición satisface lo deseado, es decir que
\begin{align}
M < S_P.
\end{align}

Partimos de la igualdad
\begin{align}
S_P[f;a,b] = \sum_{i=1}^{m}|f(x_i) \, -\, f(x_{i-1})|
\end{align}

Ahora separemos los términos del lado derecho sumando en $\sum’$ todos los sumandos donde no hay elementos de $\hat{P}$ en el intervalo de $P$ correspondiente y sumando en $\sum ´´$ aquellos donde sí los hay.

\begin{align}
S_P[f;a,b] &= \sum_{i=1}^{m}|f(x_i) \, -\, f(x_{i-1})|
&= \sum’ + \sum ´´
\end{align}

Por (3) todos estos intervalos son menores que cualquier intervalo de $\hat{P},$ entonces cada intervalo $[x_{i-1}, x_i]$ de $P$ contiene a lo más un término $\hat{x}_j$ de $\hat{P}$ y así $\sum ´´$ tiene a lo más $n+1$ sumandos.

Sea $Q = P \cup \hat{P},$ entonces $Q$ es un refinamiento de ambas particiones. Bajo este indicador podemos reemplazar cada sumando de $\sum ´´$
$$|f(x_i) \, -\, f(x_{i-1})|$$
por los sumandos que separa el término $\hat{x}_j$ de $\hat{P}$
$$|f(x_i) \, -\, f(\hat{x}_{j})|+|f(\hat{x}_j) \, -\, f(x_{i-1})|.$$
La suma de todos estos la representaremos con $\sum´´´.$

Por (2) y (3),
\begin{align}
\sum´´´ < 2(n+1) \frac{\mu}{2(n+1)} = \mu.
\end{align}

y como
\begin{align}
S_Q = \sum’ + \sum´´´ \\
\Rightarrow \sum’ = S_Q \, – \, \sum´´´
\end{align}

de (7) y (9) tenemos

\begin{align}
S_P > \sum’ > S_Q \, – \, \mu \geq S_{\hat{P}} – \mu > M
\end{align}

Por lo tanto $S_P > M$ que es lo que queríamos demostrar.

Corolario. Si $f$ tiene derivada continua $f’$ en $[a,b],$ se tiene que:

a) $V=\int_{a}^{b}|f'(x)|\, dx$

b) $S^+=\int_{a}^{b}(f'(x))^+ \, dx$

c) $S^-=\int_{a}^{b}(f'(x))^- \, dx$

Demostración:
a) Sea $P = \{x_0 =a,…,x_n =b\}$ una partición de $[a,b].$ Por el teorema del valor medio, aplicado en cada intervalo $[x_{i-1} \,, \, x_{i}]$ con $i = 1,…,n$ sabemos que existe $\xi_i \in [x_{i-1} , x_{i}]$ tal que

$$|f(x_i) \, – \, f(x_{i-1})| = |f'(\xi_i)|(x_i \, – \, x_{i-1})$$

Por el teorema que acabamos de demostrar concluimos que
\begin{align}
V = \underset{|P| \to 0}{lim} \, S_P = \underset{|P| \to 0}{lim} \, \sum_{i=1}^{n} |f'(\xi_i)|(x_i \, – \, x_{i-1}) = \int_{a}^{b} |f'(x)|\, dx.
\end{align}

b) A continuación usaremos un resultado visto en la entrada anterior y haremos también una sustitución en $V$ con la igualdad en a).

\begin{align}
\nonumber S^+ &= \frac{1}{2}(V \, + \, f(b) \, – \, f(a))\\
\nonumber &= \frac{1}{2}\left[\int_{a}^{b}|f'(x)|\, dx + \int_{a}^{b}f'(x) \, dx \right] \\
\nonumber &=\frac{1}{2} \int_{a}^{b} (|f'(x)|+f'(x)) \, dx \\
&= \int_{a}^{b} (f'(x))^+ \, dx.
\end{align}

c) La demostración es análoga a la anterior, partiendo de
$$S^- = \frac{1}{2}(V \, – \, f(b) \, + \, f(a))$$
y la proponemos como ejercicio.

Pasemos ahora a conocer las curvas rectificables, comenzando con aquellas que pertenecen al plano $\mathbb{R}^2.$

Definición. Curva en el plano y traza. Sean $\phi: [a,b] \to \mathbb{R}$ y $\psi: [a,b] \to \mathbb{R}$ dos ecuaciones paramétricas. Una curva en el plano $\mathbb{R}^2$ está dada por:
$\mathcal{C}(t)=(\phi(t), \, \psi(t))$ con $a \leq t \leq b.$

La traza de $\mathcal{C}$ es el conjunto $\{(x,y) \in \mathbb{R}^2 \, | \, x=\phi(t), \, y=\psi(t), \, a \leq t \leq b \}.$

Ejemplo de una traza.

Nota que en la definición no se excluye que la traza pueda tener intersecciones ni tampoco se dan las condiciones necesarias para que sea continua o acotada.

Definición. La longitud de $\mathcal{C}.$ Sea $P=\{t_0 =a, \, t_1,…,t_{n-1}, \, t_n= b\}$ una partición de $[a,b].$ Para cada $t_i, \, i= 0,…, n$ definimos $P_i := (\phi(x_i), \psi(x_i)).$ Pensemos en dibujar los puntos $P_i$ y las líneas que los conectan con su sucesor. La suma de la medida de cada una de estas líneas está dada por:

$$l(P)= \sum_{i=1}^{n} \, \sqrt{(\phi(t_i)-\phi(t_{i-1}))^2+(\psi(t_i)-\psi(t_{i-1}))^2}$$

y denota la longitud de la poligonal generada. Como esta longitud depende de la partición, presentamos la longitud de $\mathcal{C}$ como:

$$L=L(\mathcal{C})= \underset{P \in \mathcal{P}}{sup} \, \, l(P)$$

Entonces $0 \leq L \leq \infty.$

Representación de $l(P).$

Veamos bajo qué condiciones podemos hablar de una longitud finita.

Definición curva rectificable. Sea $\mathcal{C}$ una curva. Diremos que es rectificable si $L(\mathcal{C}) < \infty.$

Proposición. Sea $\mathcal{C}$ una curva. Entonces $\mathcal{C}$ es rectificable si y solo si tanto $\phi$ como $\psi$ son de variación acotada. Más aun.

$$V(\phi), \, V(\psi) \leq L \leq V(\phi) + V(\psi).$$

Demostración:
Supongamos que $\mathcal{C}$ es rectificable. Sea $P=\{t_0 =a, \, t_1,…,t_{n-1}, \, t_n= b\}$ una partición de $[a,b].$

Sabemos que para cualesquiera $A,B \in \mathbb{R},$
\begin{align}
|A| &\leq \sqrt{A^2 + B^2} \, \text{ y} \\
|B| &\leq \sqrt{A^2 + B^2}
\end{align}

Por definición

$$l(P)= \sum_{i=1}^{n} \, \sqrt{(\phi(t_i)-\phi(t_{i-1}))^2+(\psi(t_i)-\psi(t_{i-1}))^2} \leq L.$$

Usando (13) y (14) en cada término de $l(P)$
\begin{align}
\nonumber && \sum_{i=1}^{n} \, |\phi(t_i)-\phi(t_{i-1})|&\leq \sum_{i=1}^{n} \, \sqrt{(\phi(t_i)-\phi(t_{i-1}))^2+(\psi(t_i)-\psi(t_{i-1}))^2} \leq L \\
&\Rightarrow& V(\phi) &\leq L
\end{align}

Análogamente
\begin{align}
V(\psi) &\leq L
\end{align}

Es decir, $V(\phi) $ y $V(\psi)$ son de variación acotada. Recíprocamente, partiendo de este hecho y usando que para cualesquiera $A,B \in \mathbb{R}$ se cumple que
\begin{align}
\sqrt{A^2+B^2} \leq |A|+|B|
\end{align}

concluimos
\begin{align}
l(P) \leq \sum_{i=1}^{n} \, |\phi(t_i)-\phi(t_{i-1})|+\sum_{i=1}^{n} \, |\psi(t_i)-\psi(t_{i-1})| \leq V(\phi) + V(\psi)
\end{align}

Por lo tanto $L \leq V(\phi) + V(\psi)$ lo que significa que $\mathcal{C}$ es rectificable.

Al final de esta sección se te propone, en el ejercicio 4 de la tarea moral, una función que no es de variación acotada. De acuerdo con la proposición que acabamos de probar, la curva dada por $(f(t),f(t)), \, [0 \leq t \leq 1]$ no es rectificable aunque, curiosamente, tiene su traza en apenas un segmento de la línea $y =x$ en $\mathbb{R},$ lo que significa que la longitud de la traza de una curva no necesariamente coincide con la longitud de la curva.

Las curvas en $\mathbb{R}^n$

La idea de la curva en $\mathbb{R}^2$ también puede generalizarse en el caso $\mathbb{R}^n.$ A partir de $P=\{t_0 =a, \, t_1,…,t_{n-1}, \, t_m= b\}$ una partición de $[a,b]$ podemos definir la curva con puntos en $\mathbb{R}^n$ de la forma $(\phi_1(t), \, \phi_2(t),…, \phi_n(t))$ con $t \in [a,b]$ y donde cada $\phi_i$ es una ecuación paramétrica. La longitud de la curva está dada por:

$$l(P)= \sum_{i=1}^{m} \sqrt{ \sum_{j=1}^{n}(\phi_j(t_i) \, – \, \phi_j(t_i))^2 }.$$

También diremos que $L = \underset{P \in \mathcal{P}}{sup} \, \, l(P)$ y si $L \in \mathbb{R}$ definimos que la curva es rectificable.

Más adelante…

Presentaremos la integral de Riemann-Stieltjes motivándola con conceptos de Probabilidad, viendo su significado a través de la función distribución o la esperanza.

Tarea moral

  1. Construye una función $f: \mathbb{R} \to \mathbb{R}$ no decreciente, acotada que sea continua en los números irracionales y discontinua en los racionales como sigue: si $\{r_n : n \in \mathbb{N}\}$ es el conjunto de números racionales define $f(x) = \underset{n \, : \, r_n \leq x}{\sum} \, 2^{-n}.$ ¿Es de variación acotada?
  2. El tercer ejemplo de variación en funciones de la entrada anterior decía lo siguiente:
    Sea $[a,b]$ un intervalo con el $\, 0$ en su interior y $f:[a,b] \to \mathbb{R}$ tal que
    \begin{equation*}
    f(x) = \begin{cases}
    1 & \text{si $x = 0$} \\
    0 & \text{si $x \neq 0$}
    \end{cases}
    \end{equation*}
    Entonces $S_P = 2 \,$ o $\, S_P = 0,$ de modo que $V=2.$
    Da un valor $\varepsilon>0$ tal que para cada $\delta >0$ exista una partición $P_{\delta} \,$ donde $|S_{P_{\delta}} \, – \, V|> \varepsilon, \,$ aun siendo $|P_{\delta}|$ menor que $\delta.$
  3. Prueba que si $f$ tiene derivada continua, entonces $S^-=\int_{a}^{b}(f'(x))^- \, dx.$
  4. Sea $f:[0,1] \to \mathbb{R}$ tal que
    \begin{equation*}
    f(x)=\begin{cases}
    x \, sen(\frac{1}{x}), \, \text{ si $0<x \leq 1$} \\
    f(x) = 0, \, \text{ si $x=0$}
    \end{cases}
    \end{equation*}
    Muestra que $f$ es acotada y continua en $[0,1]$ pero $V = \infty.$
  5. Demuestra que también en el caso en que la curva está en $\mathbb{R}^n,$ $\mathbb{C}$ es rectificable si y solo si cada $\phi_j$ es de variación acotada.

Bibliografía

  • Wheeden, R.L., Zygmund, A., Measure and Integral. An Introduccion to Real Analysis. (2da ed.). New York: Marcel Dekker, 2015. Págs: 22-26.

Enlaces

Última parte de la demostración del teorema de Stone-Weierstrass

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

Usaremos los resultados vistos en las entradas anteriores Enunciado del teorema de Stone-Weierstrass y primera parte de la demostración y Segunda parte de la demostración del teorema de Stone-Weierstrass para culminar con la demostración del teorema de Stone-Weierstrass. Sin más preámbulo, recordemos lo que dice.

Teorema. Stone-Weierstrass. Sea $K$ un espacio métrico compacto. Sea $A \subset \mathcal{C}^0(K, \mathbb{R}),$ es decir, $A$ es un conjunto de funciones continuas de $K$ en $\mathbb{R}.$ Si $A$ satisface las siguientes propiedades:

a) Para cada $\lambda, \mu \, \in \mathbb{R}$ y $f,g \in A$ se cumple que $$\lambda f + \mu g \, \in A.$$ Esto es, $A$ es cerrado bajo combinaciones lineales.

b) Para cada $f,g \in A$ se cumple que $$f \cdot g \, \in A.$$ Esto es, $A$ es cerrado bajo producto de funciones.

c) $1 \in A,$ donde $1$ es la función constante que para cada $x \in K$ asigna el valor $1.$

d) Para cualesquiera $x_1, x_2 \in K$ tales que $x_1 \neq x_2$ existe una función $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi(x_2).$

Entonces $A$ es denso en $\mathcal{C}^0(K, \mathbb{R}),$ es decir, $\overline{A}=\mathcal{C}^0(K, \mathbb{R}).$

Demostración:
Sea $A$ como en las hipótesis. Para probar que $\overline{A}=\mathcal{C}^0(K, \mathbb{R})$ tomemos $f \in \mathcal{C}^0(K, \mathbb{R}).$
Sea $\varepsilon >0.$ Demostraremos que para toda $B(f,\varepsilon)$ se cumple que existe una función $\varphi \in A$ tal que $\varphi \in B(f,\varepsilon),$ es decir
$$d_\infty(f,\varphi)< \varepsilon.$$

Toda bola abierta con centro en $f$ tiene una función en $A,$ esto es, $f \in \overline{A}.$

Para que dicha $\varphi \in A$ exista, es suficiente demostrar que existe $\textcolor{purple}{\hat{\varphi}} \in \overline{A}$ tal que
$$d_\infty(f,\hat{\varphi}) < \frac{\varepsilon}{2}.$$

Si existe $\hat{\varphi} \in \overline{A}$ muy cerca de $f$ entonces también existe una función en $A$ muy cerca de $\hat{\varphi}$ y en consecuencia, de $f.$

Pues si esa $\hat{\varphi} \in \overline{A}$ existe, entonces por lo visto en la entrada Convergencia, existe también una sucesión $(\varphi_n)_{n \in \mathbb{N}}$ de funciones en $A$ tales que $\varphi_n \to \hat{\varphi}$ en $\mathcal{C}^0(K, \mathbb{R})$ y así existe $N \in \mathbb{N} \,$ tal que
$$d_\infty(\hat{\varphi},\varphi_N) < \frac{\varepsilon}{2}.$$
En consecuencia las desigualdades
\begin{align*}
d_\infty(f,\varphi_N) &\leq d_\infty(f,\hat{\varphi}) +d_\infty(\hat{\varphi},\varphi_N) \\
&< \frac{\varepsilon}{2} + \frac{\varepsilon}{2}\\
&= \varepsilon,
\end{align*}
evidenciarían la existencia de la $\varphi$ deseada. Procedamos entonces a justificar la existencia de la $\hat{\varphi} \in \overline{A}$ descrita arriba.

Fijemos $x \in K.$ Por el lema 1, visto en Enunciado del teorema de Stone-Weierstrass y primera parte de la demostración sabemos que para cada $y \in K$ existe $\varphi_{x,y} \in A$ (que depende de $x$ y de $y$) tal que
\begin{align}
\textcolor{blue}{\varphi_{x,y} (x)} & \textcolor{blue}{= f(x)}, \, \text{ y} \\
\textcolor{magenta}{\varphi_{x,y} (y)} &\textcolor{magenta}{= f(y)}.
\end{align}

Sea $\varepsilon >0.$ Como tanto $\varphi_{x,y}$ como $f$ son continuas en $K,$ entonces la función $\varphi_{x,y}\, – \, f$ es continua en $K.$ Así, para cada $y \in K$ existe $\delta_y >0$ tal que si $z \in B(y,\delta_y)$ entonces
\begin{align}
\nonumber &&|(\varphi_{x,y}\, – \, f)(z) \, – \, (\varphi_{x,y}\, – \, f)(y)| &< \varepsilon \\
\nonumber &\Rightarrow&|\varphi_{x,y}(z)\, – \, f(z) \,- \textcolor{magenta}{ ( \varphi_{x,y}(y)\, – \, f(y))}|&< \varepsilon \\
\nonumber &\Rightarrow&\ |\varphi_{x,y}(z)\, – \, f(z) \, \textcolor{magenta}{- 0}|&< \varepsilon \\
&\Rightarrow& |\varphi_{x,y}(z)\, – \, f(z)|&< \varepsilon
\end{align}

Si $z$ está «muy cerca» de $y$ entonces $\varphi_{x,y}(z)$ está «muy cerca» de $f(z).$

La colección de bolas abiertas de radio $\delta_y$ y centro en la respectiva $y \in K,$ es decir, $\, \{B(y, \delta_y) \, | \, y \in K \}$ es una cubierta abierta de $K$ que recordemos es compacto, por lo que tiene una subcubierta finita: existen

$y_1, \, y_2,…, y_n \in K$ con $n \in \mathbb{N} \,$ tales que $\{B(y_1, \delta_{y_1}), \, B(y_2, \delta_{y_2}),…,B(y_n, \delta_{y_n})\}$ es una cubierta abierta de $K.$

$K$ cubierto por una cantidad finita de bolas abiertas.

Sea

$$\varphi_x := min\{\varphi_{x,y_1}, \, \varphi_{x,y_2}, …, \varphi_{x,y_n}\}.$$
Demostraremos que esta función se acerca muchísimo a $f$ en cualquier punto, específicamente que
Para cada $z \in K, \, \varphi_x(z) \, – \, f(z) < \varepsilon.$

Esto ocurre porque si $z \in K$ entonces existe $j \in \mathbb{N} \,$ tal que $z \in B(y_j, \delta_{y_j}).$ Así:

\begin{align*}
&& \varphi_x(z) &\leq \varphi_{x,y_j}(z) \\
& \Rightarrow& \varphi_x(z) \, – \, f(z) &\leq \varphi_{x,y_j}(z) \, – \, f(z)
\end{align*}

Y por (3)
\begin{align}
& \Rightarrow& \varphi_x(z) \, – \, f(z) &< \varepsilon
\end{align}

Por el lema 4 de la entrada anterior sabemos que $\varphi_x$ es continua en $x.$ En consecuencia la función $\varphi_x \, – \, f$ también lo es, de modo que existe $\gamma_x >0$ tal que si $z \in B(x, \gamma_{x}),$ entonces por (1) tenemos

\begin{align}
\nonumber |(\varphi_x \, – \, f)(z)\, – \, (\varphi_x \, – \, f)(x)| < \varepsilon\\
\nonumber |(\varphi_x(z) \, – \, f(z))\, – \, \textcolor{blue}{(\varphi_x(x) \, – \, f(x))}| < \varepsilon\\
\nonumber |(\varphi_x(z) \, – \, f(z))\, – \, \textcolor{blue}{0}| < \varepsilon\\
|\varphi_x(z) \, – \, f(z)| < \varepsilon\\
\end{align}

Como $x$ es arbitraria, pensemos ahora en todas las $\varphi_x´s$ que podemos hacer con cada $x \in K.$ Nota que $\{B(x, \gamma_{x}) \, | \, x \in K\}$ es una cubierta abierta de $K$ compacto. Así, tiene una subcubierta finita es decir, existen

$x_1, \, x_2,…, x_m \in K$ con $m \in \mathbb{N} \,$ tales que $\{B(x_1, \gamma_{x_1}), \, B(x_2, \gamma_{x_2}),…,B(x_m, \gamma_{x_m})\}$ es una cubierta abierta de $K.$

$K$ cubierto por una cantidad finita de bolas abiertas.

Sea

$$\hat{\varphi} = max \{\varphi_{x_1}, \, \varphi_{x_2}, …, \varphi_{x_m}\}.$$

Como todas las funciones dentro del corchete están en $A,$ también pertenecen a $\overline{A}.$ Por el Lema 4, podemos decir que $\hat{\varphi} \in \overline{A},\, $ (ver tarea moral de esta sección).

A continuación demostraremos que $d_\infty (\hat{\varphi},f) < \varepsilon.$

Sea $z \in K.$

Por un lado, como existe $i \in \{1,2,…,m\}$ tal que $z \in B(x_i, \gamma_{x_i}).$ Sabemos que

\begin{align*}
&&\varphi_x(z) &\geq \varphi_{x_i}(z)\\
&\Rightarrow& \varphi_x(z) \, – \, f(z) &\geq \varphi_{x_i}(z) \, – \, f(z)
\end{align*}
Y por (5)
\begin{align}
\nonumber && \varphi_x(z) \, – \, f(z) &\geq \varphi_{x_i}(z) \, – \, f(z) &> -\varepsilon\\
\nonumber &\Rightarrow& \varphi_x(z) \, – \, f(z) & > -\varepsilon \\
&\Rightarrow& -\varepsilon & < \varphi_x(z) \, – \, f(z)
\end{align}

Como esto ocurre para cualquier $x,$ entonces ocurre para cada $x_k, \, k= 1,2,…,m.$ Se sigue que

\begin{align}
\nonumber && -\varepsilon & < \varphi_{x_k}(z) \, – \, f(z), k= 1,2,…,m\, \\
\nonumber &\Rightarrow& -\varepsilon <& \underset{k \in \{1,…,m\}}{max}( \varphi_{x_k}(z) \, – \, f(z))\\
\nonumber &\Rightarrow& -\varepsilon <& \underset{k \in \{1,…,m\}}{max} \varphi_{x_k}(z) \, – \, f(z) \\
&\Rightarrow& -\varepsilon <& \hat{\varphi}(z) \, – \, f(z) \\
\end{align}

Por otro lado, en la desigualdad (4) tenemos

\begin{align*}
& \Rightarrow& \varphi_x(z) \, – \, f(z) &< \varepsilon
\end{align*}

Como esto ocurre para cualquier $x,$ entonces ocurre para cada $x_k, \, k= 1,2,…,m.$ Se sigue que

\begin{align}
\nonumber & & \varphi_{x_k}(z) \, – \, f(z) &< \varepsilon, \, k= 1,2,…,m \\
\nonumber & \Rightarrow& \underset{k \in \{1,…,m\}}{max} ( \varphi_{x_k}(z) \, – \, f(z) ) &< \varepsilon \\
\nonumber & \Rightarrow& \underset{k \in \{1,…,m\}}{max} \varphi_{x_k}(z) \, – \, f(z) &< \varepsilon \\
& \Rightarrow& \hat{\varphi}(z) \, – \, f(z) &< \varepsilon
\end{align}

De (7) y (8) tenemos que para cada $z \in K$
\begin{align}
|\hat{\varphi}(z) \, – \, f(z)| < \varepsilon \\
\end{align}

Y así

\begin{align}
\nonumber &&\underset{z \in K}{sup}|\hat{\varphi}(z) \, – \, f(z)| < \varepsilon \\
&\Rightarrow& d_\infty(\hat{\varphi},f) < \varepsilon
\end{align}

Que es lo que queríamos demostrar.

Finalizamos esta sección con el siguiente:

Corolario. Sea $K \subset \mathbb{R}^n$ compacto y sea $A$ el conjunto de polinomios en $n$ variables que van de $K$ en $\mathbb{R}.$ Entonces toda función continua $f:K \to \mathbb{R}$ se puede aproximar con polinomios, es decir, existe una sucesión de polinomios $(p_n)_{n \in \mathbb{N}}$ tal que $(p_n) \to f$ con la métrica uniforme.

La demostración se deja como ejercicio.

Más adelante…

Complementaremos las ideas de aproximación notando que, para el caso de las funciones continuas en un intervalo cerrado, también es posible encontrar una aproximación a través de lo que llamaremos «función cuadrática por pedazos».

Tarea moral

  1. Sea $A$ como en las hipótesis del teorema de Stone-Weierstrass. Muestra que si $f_i \in \overline{A}, \, i=1,…,n,$ entonces la función $\underset{i \in \{1,…,n\}}{min} f_i$ también pertenece a $\overline{A}.$
  2. Prueba el corolario. Sugerencia: Demuestra que satisface las hipótesis del teorema de Stone-Weierstrass. Usa la función proyeccion, que es continua, para probar que cumple d).
  3. Demuestra que el conjunto de polinomios de grado impar de $[0,1] \to \mathbb{R}$ es denso en $\mathcal{C^0}[0,1].$ ¿Satisface las hipótesis del teorema?
  4. Sea $f \in \mathcal{C^0}[0,1]$ tal que para cada $n \in \mathbb{N} \cup \{0\}$
    $$\int_{0}^{1} f(x)x^ndx=0.$$
    Prueba que $\int_{0}^{1} f^2(x)dx=0$ y concluye que $f=0.$

Bibliografía

Enlaces