Segunda parte de la demostración del teorema de Stone-Weierstrass

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

En esta entrada conoceremos dos lemas más previos a la demostración del teorema de Stone-Weierstrass. Las hipótesis a usar serán las mismas que se mencionaron en la entrada anterior: $K$ es un espacio métrico compacto, $A \subset \mathcal{C}^0(K, \mathbb{R}),$ es decir, $A$ es un conjunto de funciones continuas que transforma valores en $K$ en valores reales. Supondremos también que $A$ satisface las propiedades:

a) Para cada $\lambda, \mu \, \in \mathbb{R}$ y $f,g \in A$ se cumple que $$\lambda f + \mu g \, \in A.$$ Esto es, $A$ es cerrado bajo combinaciones lineales.

b) Para cada $f,g \in A$ se cumple que $$f \cdot g \, \in A.$$ Esto es, $A$ es cerrado bajo producto de funciones.

c) $1 \in A,$ donde $1$ es la función constante que para cada $x \in K$ asigna el valor $1.$

d) Para cualesquiera $x_1, x_2 \in K$ tales que $x_1 \neq x_2$ existe una función $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi(x_2).$

Entonces se satisface el siguiente:

Lema 3. Si $\varphi \in \overline{A}$ entonces $|\varphi| \in \overline{A}.$

Demostración:
Sabemos que $\varphi: K \to \mathbb{R}$ es continua. Dado que $K$ es compacto, la imagen $\varphi(K)$ es compacta en $\mathbb{R}$, y por tanto es acotada, así $\varphi (K) \subset [a,b]$ para algún $a,b \in \mathbb{R}.$ Como la función valor absoluto restringida en $[a,b],$ que denotamos con $h: [a,b] \to \mathbb{R} \,$ tal que $\forall \, y \in \mathbb{R}, h(y) = |y|$ también es continua en su dominio, se sigue que la composición

$$h \circ \varphi (x)= |\varphi(x)|$$

es continua en $K$.

El siguiente diagrama muestra el comportamiento de las funciones.

Representación composición $h \circ \varphi.$

Por lo visto en la entrada tal podemos aproximar la función $h:[a,b] \to \mathbb{R}$ con polinomios de Bernstein. Sea

$$B_n(h,y)= a_0 + a_1y+…+a_ny^n$$

el polinomio de Bernstein de grado a lo más $n$ de $h$ con $y \in [a,b].$ Entonces

$$\underset{n \to \infty}{lim} \, \norm{B_n(h,y) \, – \, h}_{\infty} = 0.$$

Si $x \in K,$ $\, \varphi(x) \in [a,b].$ Evaluando el polinomio en $\varphi(x)$ tenemos:

$$B_n(h,\varphi(x))= a_0 + a_1\varphi(x)+…+a_n\varphi(x)^n.$$

De modo que la sucesión de polinomios $(B_n(h,\varphi(x)))_{n \in \mathbb{N}} \,$ converge a $h \circ \varphi = |\varphi|$ en $\mathcal{C}^0(K, \mathbb{R}).$

Veamos que cada sumando del polinomio está en $\overline{A}.$ Para ello usaremos los resultados del lema 2 visto en link.

La función constante $1 \in \overline{A},$ como $a_0 \in \mathbb{R}$ se sigue que el producto $1 \cdot a_0 = a_0 \in \overline{A}.$

Como $\varphi \in A \subset \overline{A}$ y $a_1 \in \mathbb{R}$ se sigue que el producto $a_1 \varphi \in \overline{A}.$

Como $\varphi \in A \subset \overline{A}$ entonces el producto $\varphi \cdot \varphi = \varphi ^2 \in \overline{A}.$ Como $a_2 \in \mathbb{R}$ se sigue que también $a_2 \varphi ^2 \in \overline{A}.$
.
.
.
Como $\varphi^{n-1} \in A \subset \overline{A}$ entonces el producto $\varphi^{n-1} \cdot \varphi = \varphi ^n \in \overline{A}.$ Como $a_n \in \mathbb{R}$ se sigue que el producto $a_n \varphi ^n \in \overline{A}.$

Ya que cada sumando está en $\overline{A}$ concluimos que para cada $n \in \mathbb{N}, \, B_n(h,\varphi(x)) \in \overline{A}.$ Por lo tanto $|\varphi| \in \overline{A}.$

Para finalizar esta sección veamos otro resultado.

Lema 4. Sean $\varphi, \gamma \in \overline{A}.$ Entonces las funciones

$$\text{máx}\{\varphi, \gamma\}(x):= \text{máx}\{\varphi(x), \gamma(x)\} \, \text{ y }$$

$$\text{mín}\{\varphi, \gamma\}(x):= \text{mín}\{\varphi(x), \gamma(x)\}$$

también están en $\overline{A}.$

Demostración:
Probemos que $\text{máx}\{\varphi, \gamma\}(x) \in \overline{A}.$ Nota que

$$\text{máx}\{\varphi(x), \gamma(x)\}=\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2},$$

pues en el caso en que $\varphi(x) \geq \gamma(x)$

\begin{align*}
\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2} &= \dfrac{\varphi(x)+\gamma(x)+(\varphi(x) \, – \, \gamma(x))}{2}\\
&= \dfrac{2\varphi(x)}{2}\\
&=\varphi(x)
\end{align*}

Caso $\varphi(x) \geq \gamma(x).$

Por otro lado, si $\gamma(x) \geq \varphi(x)$

\begin{align*}
\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2} &= \dfrac{\varphi(x)+\gamma(x)+(\gamma(x) \, – \, \varphi(x))}{2}\\
&= \dfrac{2\gamma(x)}{2}\\
&=\gamma(x)
\end{align*}

Ya que $\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2}$ puede verse como combinación lineal de funciones en $\overline{A}$ (por lo visto en lema 2 y lema 3) se sigue que

$\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2} = \text{máx}\{\varphi(x), \gamma(x)\} \, \in \overline{A}.$

Análogamente se puede probar que se satisface la igualdad

$\text{mín}\{\varphi(x), \gamma(x)\} = \dfrac{\varphi(x)+\gamma(x)-|\varphi(x) \, – \, \gamma(x)|}{2}$

Y así la función $\, \text{mín}\{\varphi(x), \gamma(x)\} \, \in \overline{A}.$ La prueba de este hecho se dejará como ejercicio.

Más adelante…

Terminaremos con la demostración del teorema prometido. Por lo pronto sugerimos algunos ejercicios.

Tarea moral

  1. Demuestra que $\text{mín}\{\varphi(x), \gamma(x)\} = \dfrac{\varphi(x)+\gamma(x)-|\varphi(x) \, – \, \gamma(x)|}{2}.$
  2. Identifica bajo qué condiciones las siguientes familias de funciones satisfacen las hipótesis del teorema de Stone-Weierstrass:
    a) Las poligonales.
    b) Las funciones infinitamente diferenciables en $\mathbb{R}.$
    c) Las funciones Lipschitz continuas.

Enlaces

Enunciado del teorema de Stone-Weierstrass y primera parte de la demostración

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

En la entrada anterior link aprendimos que es posible acercarnos a funciones continuas que tienen su dominio en un intervalo cerrado en $\mathbb{R}.$ En esta sección probaremos que esta idea puede generalizarse en funciones cuyo dominio es un espacio métrico compacto. Presentamos el teorema y la demostración de dos lemas que usaremos para probarlo.

Teorema. Stone-Weierstrass: Sea $K$ un espacio métrico compacto. Sea $A \subset \mathcal{C}^0(K, \mathbb{R}),$ es decir, $A$ es un conjunto de funciones continuas de $K$ en $\mathbb{R}.$ Si $A$ satisface las siguientes propiedades:

a) Para cada $\lambda, \mu \, \in \mathbb{R}$ y $f,g \in A$ se cumple que $$\lambda f + \mu g \, \in A.$$ Esto es, $A$ es cerrado bajo combinaciones lineales.

b) Para cada $f,g \in A$ se cumple que $$f \cdot g \, \in A.$$ Esto es, $A$ es cerrado bajo producto de funciones.

c) $1 \in A,$ donde $1$ es la función constante que para cada $x \in K$ asigna el valor $1.$

d) Para cualesquiera $x_1, x_2 \in K$ tales que $x_1 \neq x_2$ existe una función $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi(x_2).$

Entonces $A$ es denso en $\mathcal{C}^0(K, \mathbb{R}),$ es decir, $\overline{A}=\mathcal{C}^0(K, \mathbb{R}).$

Nota que esto significa que toda función continua $f: K \to \mathbb{R}$ está en la cerradura de $A$ y por lo visto en la entrada Convergencia, tenemos que $f$ puede aproximarse con funciones en $A$ según la métrica uniforme $d_\infty.$

La demostración de este teorema se hará a través de cuatro lemas. En el primero garantizaremos la existencia de una función que tome dos valores específicos en dos puntos específicos.

Lema 1: Sean $K$ y $A$ como en las hipótesis del teorema. Dados $x_1 \neq x_2 \in K$ y $c_1, c_2 \in \mathbb{R}$ existe $f \in A$ tal que $f(x_1) = c_1$ y $f(x_2) = c_2.$

Demostración:
De acuerdo con el inciso d), existe $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi (x_2).$

Representación $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi (x_2).$

Sin embargo buscamos $f$ que en $x_1$ vale específicamente $c_1$ y en $x_2$ vale $c_2.$

Representación de $f$ que en $x_1$ vale $c_1$ y en $x_2,$ $c_2.$

Veamos si dicha $f$ puede obtenerse como combinación lineal de $\varphi$ y la función constante $1,$ es decir que $f(x) = \lambda \varphi(x) + \mu 1$ para algunos $\lambda, \mu \in \mathbb{R}.$

Encontrar $\lambda$ y $\mu$ que satisfacen lo deseado equivale a resolver el sistema de ecuaciones

\begin{equation*}
\left\{
\begin{array}
\lambda \lambda \varphi(x_1) + \mu &= c_1 \\
\lambda \varphi(x_2) + \mu &= c_2
\end{array}
\right.
\end{equation*}

Según las fórmulas de Cramer para sistemas cuadrados, que pueden consultarse en Álgebra Lineal I: Determinantes en sistemas de ecuaciones lineales y regla de Cramer la solución existe y es única si y solo sí el determinante de la matriz de coeficientes dada por

\begin{equation*}
\left|
\begin{array}{cc}
\varphi(x_1) & 1 \\
\varphi(x_2) & 1
\end{array}
\right|
\end{equation*}

satisface:

\begin{equation*}
\left|
\begin{array}{cc}
\varphi(x_1) & 1 \\
\varphi(x_2) & 1
\end{array}
\right| = \varphi(x_1) \, – \, \varphi(x_2) \neq 0
\end{equation*}

Lo cual sí ocurre, pues $\varphi(x_1) \neq \varphi(x_2) \, \Rightarrow \, \varphi(x_1) \, – \, \varphi(x_2) \neq 0.$

Por lo tanto existe la solución única al sistema de ecuaciones y así existe $f \in A$ con $f(x) = \lambda \varphi(x) + \mu \,$ tal que $\, f(x_1) = c_1$ y $f(x_2) = c_2.$

Lema 2: Si $A \subset \mathcal{C}^0(K, \mathbb{R})$ es tal que tiene las propiedades a), b), c) del teorema, entonces $\overline{A}$ también las tiene.

Demostración:
a) Sean $\lambda, \mu \in \mathbb{R}$ y $\varphi, \, \gamma \in \overline{A},$ queremos probar que $\lambda \varphi + \mu \gamma$ también está en $\overline{A}.$

Como $\varphi \in \overline{A}$ entonces, por lo visto en Convergencia sabemos que existe una sucesión $(f_n)_{n \in \mathbb{N}} \,$ de elementos de $A$ tales que $f_n \to \varphi,$ es decir

\begin{align}
\underset{n \to \infty}{lim} \, f_n = \varphi.
\end{align}

De igual manera existe una sucesión $(g_n)_{n \in \mathbb{N}} \,$ de elementos de $A$ tales que $g_n \to \gamma,$ es decir

\begin{align}
\underset{n \to \infty}{lim} \, g_n = \gamma.
\end{align}

Ya que para cada $n \in \mathbb{N}$ se cumple que $\lambda f_n + \mu g_n \, \in A.$ Si demostramos que la sucesión $(\lambda f_n + \mu g_n)_{n \in \mathbb{N}} \, $ converge a $\lambda \varphi + \mu \gamma \,$ esto probaría que $ \lambda \varphi + \mu \gamma \in \overline{A}.$ Probemos que $d_\infty(\lambda f_n + \mu g_n, \, \lambda \varphi + \mu \gamma)=0.$ Sea $\varepsilon >0.$ Por 1) y 2) sabemos que existen $N_1$ y $N_2 \in \mathbb{N}$ tales que para cada $n \geq N_1,$

$$d_\infty(f_n, \varphi) < \frac{\varepsilon}{2|\lambda|}$$

Y así

\begin{align*}
\textcolor{blue}{|\lambda|d_\infty(f_n, \varphi) < \frac{\varepsilon}{2}}
\end{align*}

Y para cada $n \geq N_2,$

$$d_\infty(g_n, \gamma) < \frac{\varepsilon}{2|\mu|}$$

Y así

\begin{align*}
\textcolor{purple}{|\mu|d_\infty(g_n, \gamma) < \frac{\varepsilon}{2}}.
\end{align*}

Entonces para cada $n \geq \text{máx}\{N_1,N_2\}$ y para cada $x \in K$ tenemos:
\begin{align*}
d(\lambda f_n(x) + \mu g_n(x), \, \lambda \varphi(x) + \mu \gamma(x)) &= |\lambda f_n(x) + \mu g_n(x) \, – \, \lambda \varphi(x) \, – \, \mu \gamma(x)|\\
&= |\lambda f_n(x) \, – \, \lambda \varphi(x)+ \mu g_n(x) \, – \, \mu \gamma(x)|\\
&\leq |\lambda f_n(x) \, – \, \lambda \varphi(x)|+ |\mu g_n(x) \, – \, \mu \gamma(x)|\\
&= |\lambda|| f_n(x) \, – \, \varphi(x)|+ |\mu|| g_n(x) \, – \, \gamma(x)|\\
&\leq \textcolor{blue}{|\lambda|d_\infty(f_n,f)}+ \textcolor{purple}{|\mu|d_\infty(g_n, \gamma)}\\
&<\textcolor{blue}{\frac{\varepsilon}{2}}+\textcolor{purple}{\frac{\varepsilon}{2}}\\
&= \varepsilon.
\end{align*}

Por lo tanto $d_\infty(\lambda f_n + \mu g_n, \, \lambda \varphi + \mu \gamma)=0$ y así $(\lambda f_n + \mu g_n)_{n \in \mathbb{N}} \, \to \, \lambda \varphi + \mu \gamma$ lo que demuestra que $\lambda \varphi + \mu \gamma \, \in \overline{A}.$

b) Buscamos demostrar que para cualesquiera $\varphi, \, \gamma \in \overline{A}$ también se cumple que $\varphi \cdot \gamma \in \overline{A}.$

Ya que para cada $n \in \mathbb{N}$ se cumple que $f_n \cdot g_n \, \in A.$ Si demostramos que la sucesión $(f_n \cdot g_n)_{n \in \mathbb{N}} \, $ converge a $\varphi \cdot \gamma \,$ esto probaría que $ \varphi \cdot \gamma \in \overline{A}.$

Probemos entonces que $\, \underset{n \to \infty}{lim} \, d_\infty(f_n \cdot g_n, \, \varphi \cdot \gamma) = 0.$ Esto se logrará si conseguimos acotar el valor de $d(f_n (x) \cdot g_n(x), \, \varphi(x) \cdot \gamma(x)) \in \mathbb{R}$ para cada $x \in K.$

Dado que $\varphi, \, \gamma$ son continuas en un compacto, concluimos que son acotadas en el dominio. Así existen reales mayores que cero $M_1$ y $M_2$ tales que para cada $x \in K:$

\begin{align}
\textcolor{green}{|\varphi(x)|}&\leq \textcolor{green}{M_1}\, \, \text{ y }\\
|\gamma(x)|&\leq M_2.
\end{align}

Por otro lado, como $\underset{n \to \infty}{lim} \, g_n = \gamma,$ existe $N_3 \in \mathbb{N}$ tal que para cada $n \geq N_3, \, |g_n(x) \, – \, \gamma(x)| \leq 1.$ Entonces

\begin{align*}
&&-1 &\leq & &g_n(x) \, – \, \gamma(x)& &\leq 1\\
&\Rightarrow& -1+\gamma(x) &\leq& &g_n(x)& &\leq 1+\gamma(x)\\
&\Rightarrow& -1-M_2 \leq -1+\gamma(x) &\leq& &g_n(x)& &\leq 1+\gamma(x) \leq 1+M_2
\end{align*}

Por lo tanto si $n \geq N_3,$

\begin{align}
\textcolor{orange}{|g_n(x)|}\leq \textcolor{orange}{M_2 +1}.
\end{align}

Además, por 1) y 2) sabemos que para cada $\varepsilon >0$ existen $N_4$ y $N_5 \in \mathbb{N}$ tal que para cada $n \geq N_4$

$$\textcolor{purple}{d_\infty(f_n, \varphi) < \frac{\varepsilon}{2(M_2+1)}},$$

y para $n \geq N_5,$

$$\textcolor{magenta}{d_\infty(g_n, \gamma) < \frac{\varepsilon}{2M_1}}.$$

De lo anterior se sigue que para cada $n \geq \text{máx}\{N_3, N_4, N_5\}$

\begin{align*}
|f_n (x) \cdot g_n(x) \, – \, \varphi(x) \cdot \gamma(x)|&= |f_n (x) \cdot g_n(x) \, \textcolor{blue}{- \, \varphi(x) \cdot g_n(x)+\varphi(x) \cdot g_n(x)}- \, \varphi(x) \cdot \gamma(x)|\\
&\leq |f_n (x) \cdot g_n(x) \, – \, \varphi(x) \cdot g_n(x)|+|\varphi(x) \cdot g_n(x)- \, \varphi(x) \cdot \gamma(x)|\\
&= \textcolor{orange}{|g_n(x)|}\cdot|f_n(x) \, – \, \varphi(x)|+\textcolor{green}{|\varphi(x)|}\cdot |g_n(x)-\gamma(x)|\\
&\leq \textcolor{orange}{(M_2 +1)}\textcolor{purple}{|f_n(x) \, – \, \varphi(x)|} + \textcolor{green}{M_1} \textcolor{magenta}{|g_n(x)-\gamma(x)|}\\
&< (M_2 +1)\textcolor{purple}{\frac{\varepsilon}{2(M_2+1)}} + M_1\textcolor{magenta}{\frac{\varepsilon}{2M_1}}\\
&= \varepsilon
\end{align*}

Por lo tanto $\, \underset{n \to \infty}{lim} \, d_\infty(f_n \cdot g_n, \, \varphi \cdot \gamma) = 0$ y así $(f_n \cdot g_n)_{n \in \mathbb{N}} \, \to \, \varphi \cdot \gamma \,$ lo que demuestra que $\varphi \cdot \gamma \in \overline{A}.$

c) Dado que la función $1 \in A$ se sigue que $1 \in \overline{A}$ pues $A \subset \overline{A}.$

Más adelante…

Veremos dos lemas más que necesitamos en la demostración del teorema de Stone-Weierstrass. Por el momento sugerimos trabajar con los siguientes ejercicios para desarrollar más la idea de densidad.

Tarea moral

  1. Sea $X$ un espacio métrico y sean $Z$ y $Y$ tales que $Z \subset Y \subset X$ y $Z$ es denso en $X.$ Demuestra que $Y$ es denso en $X.$
  2. Sea $\phi: X \to Y$ continua y suprayectiva. Demuestra que si $A$ es denso en $X,$ entonces $\phi(A)$ es denso en $Y.$
  3. Antes dos definiciones:
    Un conjunto $A$ es a lo más numerable si existe una función inyectiva $f:A \to \mathbb{N}.$
    Un espacio métrico es separable si contiene un subconjunto que es a lo más numerable y denso en $X.$
    Demuestra que todo espacio métrico compacto es separable. Se recomienda tomar un conjunto finito de bolas de radio $\frac{1}{k}$ para cada $k \in \mathbb{N}$ cuya unión es $X.$

Enlaces

Polinomios de Bernstein

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

Es sabido que existen funciones que no es tan sencillo evaluar en todos los puntos de su dominio. Sin embargo, cuando la función $f$ es $n-$veces derivable en un punto $a$ podemos definir polinomios de Taylor $T_{n, \, a}$ (ver entrada Cálculo Diferencial e Integral I: Polinomios de Taylor (Parte 1)). Conforme aumentamos el grado del polinomio más nos acercamos al valor real de $f,$ incluso tenemos resultados en relación al residuo de Taylor (ver Cálculo Diferencial e Integral I: Polinomios de Taylor (Parte 2). Pero, ¿qué podemos hacer ante una función que no es derivable en ningún punto? En esta sección presentaremos una forma alternativa de estimar funciones continuas, útil para aquellas en las que no podemos identificar los polinomios de Taylor, pues recordemos que la continuidad no es una condición suficiente para que una función sea derivable. Por ejemplo, la función de Weierstrass dada por $f(x)=\sum_{n=0}^{∞}a^n \cos(b^n\pi x) \ \ \
\text{con } 0<a<1 \text{ y } ab>1+\frac{3}{2}\pi, \, \, b>1 \text{ entero impar},$
es continua en $\mathbb{R}$ pero no es diferenciable en ningún punto.

La función de Weierstrass, es continua y no diferenciable en ningún punto.

Las funciones con las que nos vamos a aproximar son conocidas como polinomios de Bernstein. Una forma de entenderlos es a través de la probabilidad. A continuación presentamos ideas tomadas del artículo de la Dra. Ana Meda cuya lectura sugerimos:
Meda A. (2005) Interpolar con volados, o los Polinomios de Bernstein. Miscelánea Matemática, 41, 1-12.

Sea $f:[0,1] \to \mathbb{R}$ una función continua y $n \in \mathbb{N}$. Supón además que conocemos los valores que toma esta función en los puntos $\frac{0}{n}, \, \frac{1}{n}, \, \frac{2}{n}, \, \frac{3}{n},… $ y sea $x \in [0,1].$ Para saber cuánto vale $f$ en $x$ vamos a tomar una moneda cuya probabilidad de arrojar águila al lanzarse sea precisamente $x.$ Ahora la vamos a lanzar $n$ veces mientras registramos las veces en que salió águila. Sea $k$ ese número de resultados. Identifiquemos el valor

\begin{align}
\textcolor{blue}{f \left( \frac{k}{n} \right)}.
\end{align}

Definimos $\varphi_k:[0,1] \to \mathbb{R},$ como
\begin{align}
\textcolor{purple}{\varphi_k(x) = \binom{n}{k}x^k(1-x)^{n-k}}.
\end{align}

Con
$$\binom{n}{k}= \frac{n!}{k!(n-k)!}.$$

Corresponde a la probabilidad de que $k$ de los lanzamientos sean águila con esa moneda cargada de probabilidad $x$.

Con (1) y (2) definimos

\begin{align}
B_n(f,x)= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \, \textcolor{purple}{\binom{n}{k} x^k (1-x)^{n-k}},
\end{align}

que es la esperanza de la variable aleatoria que acabamos de describir, debido a que corresponde a la suma de los valores que toma esta variable ponderada por la probabilidad de que los tome.

A lo largo de esta entrada mostraremos formalmente que esta estimación funciona. Comenzamos diciendo qué es «acercarse mucho» a una función continua. Presentamos la definición con polinomios, pues son funciones continuas y derivables, lo cual facilita su manejo.

Definición. Función continua aproximada por polinomios. Sea $f \in \mathcal{C}^0([0,1], \mathbb{R}).$ Si para cada $\varepsilon >0$ existe un polinomio $P_{\varepsilon}:[0,1] \to \mathbb{R}$ tal que

$$\norm{f-P_{\varepsilon}}_{\infty}= \underset{x \, \in \, [0,1]}{Sup} \,\{|f(x)- P_{\varepsilon}(x)|\} < \varepsilon,$$

diremos que la función $f$ puede aproximarse por polinomios. Demostraremos que toda función continua en $\mathcal{C}^0([0,1],\mathbb{R})$ tiene esta propiedad. Específicamente, los polinomios que usaremos en esa aproximación están dados por la siguiente:

Definición. El $n-$ésimo polinomio de Bernstein. Sea $f \in \mathcal{C}^0([0,1], \mathbb{R}).$ El $n-$ésimo polinomio de Bernstein de $f$ de grado a lo más $n$ es:
$$B_n(f,x)= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \, \textcolor{purple}{\binom{n}{k} x^k (1-x)^{n-k}}.$$

Que es la igualdad (3) definida arriba.

Mostremos el $n-$ésimo polinomio de Bernstein para tres funciones particulares.

El $n-$ésimo polinomio de Bernstein para la función constante, $f(x) = 1.$

Del teorema del binomio sabemos que
$$(s+t)^n = \sum_{k=0}^{n} \binom{n}{k} s^k t^{n-k}$$

Haciendo $s=x$ y $t=1-x$ tenemos que
$$1 = \sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k}$$

Si consideramos $f(x) =1$ entonces $f \left(\frac{k}{n} \right) =1$ y así
\begin{align*}
1 &= \sum_{k=0}^{n} \textcolor{blue}{1} \, \binom{n}{k} x^k (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \textcolor{blue}{f \left(\frac{k}{n} \right)} \, \binom{n}{k} x^k (1-x)^{n-k}
\end{align*}

Por lo tanto
$$B_n(f(x)=1,x) = 1.$$

El $n-$ésimo polinomio de Bernstein para la función identidad, $f(x) = x.$

Partiendo de
$$1 = \sum_{k=0}^{n} \, \binom{n}{k} x^k (1-x)^{n-k}$$

Reemplacemos $n$ por $n-1$ y $k$ por $j$ para obtener
\begin{align}
1 = \sum_{j=0}^{n-1} \binom{n-1}{j} x^j (1-x)^{n-(1+j)}
\end{align}

El siguiente resultado será usado en el cálculo del polinomio:

\begin{align*}
\binom{n-1}{k-1}&=\frac{(n-1)!}{(k-1)!(n-k)!}\\
&=\frac{n}{n} \frac{k}{k} \frac{(n-1)!}{(k-1)!(n-k)!}\\
&=\frac{k}{n} \frac{n(n-1)!}{k (k-1)!(n-k)!}\\
&=\frac{k}{n} \frac{n!}{k!(n-k)!}\\
&=\frac{k}{n} \binom{n}{k}
\end{align*}

Por lo tanto

\begin{align}
\binom{n-1}{k-1} =\frac{k}{n} \binom{n}{k}
\end{align}

Multipliquemos por $x$ ambos lados de la igualdad (4) y apliquemos la igualdad (5) en el coeficiente para tener

$$x = \sum_{j=0}^{n-1} \frac{j+1}{n} \binom{n}{j+1} x^{j+1} (1-x)^{n-(1+j)}$$
Haciendo $k=j+1$ y usando que $f(x)=x$ entonces $f(\frac{k}{n}) = \frac{k}{n}.$ Se sigue:
\begin{align}
x &= \sum_{k=1}^{n} \textcolor{blue}{\frac{k}{n}} \binom{n}{k} x^{k} (1-x)^{n-k}\\
\nonumber &= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \binom{n}{k} x^{k} (1-x)^{n-k}\\
\end{align}

Por lo tanto
$$B_n(f(x)=x,x) = x.$$

El $n-$ésimo polinomio de Bernstein para la función identidad, $f(x) = x^2.$

Partiendo de
$$1 = \sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k}$$

Reemplacemos $n$ por $n-2$ y $k$ por $j$ para obtener

\begin{align}
1 = \sum_{j=0}^{n-2} \binom{n-2}{j} x^j (1-x)^{n-(2+j)}
\end{align}

El siguiente resultado será usado en el cálculo del polinomio:

\begin{align*}
\binom{n-2}{k-2}&=\frac{(n-2)!}{(k-2)!(n-k)!}\\
&=\frac{n}{n} \frac{n-1}{n-1} \frac{k}{k} \frac{k-1}{k-1} \frac{(n-2)!}{(k-2)!(n-k)!}\\
&=\frac{k(k-1)}{n(n-1)} \frac{n(n-1)(n-2)!}{k(k-1)(k-2)!(n-k)!}\\
&=\frac{k(k-1)}{n(n-1)} \frac{n!}{k!(n-k)!}\\
&=\frac{k(k-1)}{n(n-1)} \binom{n}{k}
\end{align*}

Por lo tanto

\begin{align}
\binom{n-2}{k-2} = \frac{k(k-1)}{n(n-1)} \binom{n}{k}
\end{align}

Multipliquemos por $x^2$ ambos lados de la igualdad (7) y apliquemos la igualdad (8) en el coeficiente para tener
$$x^2 = \sum_{j=0}^{n-2} \frac{(j+2)(j+1)}{n(n-1)} \binom{n}{j+2} x^{j+2} (1-x)^{n-(j+2)}$$
Haciendo $k=j+2$ se sigue que:
\begin{align*}
x^2 &= \sum_{k=2}^{n} \frac{k(k-1)}{n(n-1)} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \frac{k(k-1)}{n(n-1)} \binom{n}{k} x^{k} (1-x)^{n-k}\\
\end{align*}

Entonces
\begin{align}
x^2(n^2-n) = \sum_{k=0}^{n} k(k-1) \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Al dividir ambos lados de la igualdad por $n^2$ se obtiene:
\begin{align*}
\left( 1 – \frac{1}{n} \right) x^2 &= \sum_{k=0}^{n} \frac{k(k-1)}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \left( \frac{k^2}{n^2}-\frac{k}{n^2} \right) \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \frac{k^2}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k} \, – \, \sum_{k=0}^{n} \frac{k}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \left( \frac{k}{n} \right) ^2 \binom{n}{k} x^{k} (1-x)^{n-k} \, – \, \frac{1}{n}\sum_{k=0}^{n} \frac{k}{n} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \left( \frac{k}{n} \right) ^2 \binom{n}{k} x^{k} (1-x)^{n-k} \, – \, \frac{1}{n}x
\end{align*}

De modo que
\begin{align*}
\left( 1 – \frac{1}{n} \right) x^2 + \frac{1}{n}x &= \sum_{k=0}^{n} \textcolor{blue}{\left( \frac{k}{n} \right) ^2} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align*}

Por lo tanto
$$B_n(x, f(x)= x^2) = \left( 1 – \frac{1}{n} \right) x^2 + \frac{1}{n}x.$$

Ahora daremos paso al

Teorema de aproximación de Bernstein. Sea $f: [0,1] \to \mathbb{R}$ continua. Entonces la sucesión de polinomios de Bernstein para $f$ converge uniformemente a $f$ en $[0,1].$

Demostración:
Partimos de
$$1 = \sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k}$$
Al multiplicar ambos lados de la igualdad por $f(x)$ obtenemos

$$f(x) = \sum_{k=0}^{n} f(x) \binom{n}{k} x^k (1-x)^{n-k}.$$

Por lo tanto

$$f(x) – B_n(f,x) = \sum_{k=0}^{n} \left( f(x)- f \left( \frac{k}{n} \right) \right) \binom{n}{k} x^k (1-x)^{n-k}.$$

Usando la desigualdad del triángulo y el hecho de que $x \in [0,1]$ implica que $ \binom{n}{k} x^k (1-x)^{n-k}>0,$ se sigue que

\begin{align}
|f(x) – B_n(f,x)| \leq \sum_{k=0}^{n} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k}
\end{align}

Nuestra intención ahora será mostrar que cuando $n \,$ tiende a infinito esta distancia se hace muy pequeña.

Sea $\varepsilon >0.$ Como $f$ es continua en $[0,1]$ entonces es uniformemente continua, así existe $\delta >0$ tal que
\begin{align}
\textcolor{RedOrange}{\text{ si } |s-t| < \delta \text{ entonces } |f(s) \, – \, f(t)|< \frac{\varepsilon}{2}}.
\end{align}

Sea $x \in [0,1].$ Considera $n \in \mathbb{N}$ tal que
$$n \geq \text{ máx }\left\{ \frac{1}{\delta ^4}, \, \frac{\norm{f}^2_\infty}{\varepsilon^2}\right\}.$$

Separemos los elementos de $\mathbb{N} \cup \{0\}$ en dos conjuntos como sigue:

\begin{align}
I_1 &= \left\{ k \in \mathbb{N} \cup \{0\}: 0 \leq k \leq n, \, \left| \frac{k}{n} -x \right|< \left( \frac{1}{n} \right) ^{\frac{1}{4}} \right\}, \\
I_2 &=\{k \in \mathbb{N} \cup \{0\}: 0 \leq k \leq n, \, k \notin I_1\},
\end{align}

Como $n \geq \frac{1}{\delta ^{4}}$ entonces
\begin{align*}
&& n^{\frac{1}{4}} &\geq \frac{1}{\delta}\\
&\Rightarrow& \delta &\geq \left(\frac{1}{n}\right)^\frac{1}{4}
\end{align*}

De modo que si $k \in I_1$ satisface $\left| \frac{k}{n} -x \right|< \left( \frac{1}{n} \right) ^{\frac{1}{4}} \leq \delta$ y por la desigualdad (11) se cumple que

\begin{align}
\nonumber \sum_{k \in I_1}^{} \textcolor{RedOrange}{\left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right|} \binom{n}{k} x^k (1-x)^{n-k} &\leq \sum_{k \in I_1}^{} \textcolor{RedOrange}{\frac{\varepsilon}{2}} \binom{n}{k} x^k (1-x)^{n-k}\\ \nonumber
&\leq \textcolor{RedOrange}{\frac{\varepsilon}{2}} \sum_{k =0}^{\infty} \binom{n}{k} x^k (1-x)^{n-k} \\
&= \textcolor{RedOrange}{\frac{\varepsilon}{2}}.
\end{align}

En cuanto a los $k’s \in I_2$ tenemos lo siguiente:

Si $k \in I_2$ entonces
\begin{align*}
&& \left( \frac{1}{n} \right)^\frac{1}{4} & \leq \left| x \, – \, \frac{k}{n}\right| \\
&\Rightarrow& \frac{1}{n} & \leq \left| x \, – \, \frac{k}{n}\right|^4 \\
&\Rightarrow& \left( x \, – \, \frac{k}{n}\right)^{-4} &\leq n \\
&\Rightarrow& \textcolor{PineGreen}{\left( x \, – \, \frac{k}{n}\right)^{-2}} &\leq \textcolor{PineGreen}{\sqrt{n}}.
\end{align*}

Usaremos la última desigualdad al final del siguiente grupo de ecuaciones.

\begin{align}
\nonumber \sum_{k \in I_2}^{} \textcolor{YellowOrange}{\left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right|} \binom{n}{k} x^k (1-x)^{n-k} &\leq \sum_{k \in I_2}^{} \textcolor{YellowOrange}{2\norm{f}_\infty} \binom{n}{k} x^k (1-x)^{n-k}\\ \nonumber
&= \textcolor{YellowOrange}{2\norm{f}_\infty} \sum_{k \in I_2}^{} \textcolor{PineGreen}{\frac{(x \, – \, \frac{k}{n})^2}{(x \, – \, \frac{k}{n})^2}} \binom{n}{k} x^k (1-x)^{n-k} \\
&\leq \textcolor{YellowOrange}{2\norm{f}_\infty} \textcolor{PineGreen}{\sqrt{n}} \sum_{k \in I_2}^{} \textcolor{PineGreen}{\left( x \, – \, \frac{k}{n} \right)^2} \binom{n}{k} x^k (1-x)^{n-k}
\end{align}

Ahora, partiendo de $1 =\sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k},$ tenemos:

\begin{align}
\nonumber && (x^2)1 &= \sum_{k=0}^{n} (x^2) \binom{n}{k} x^k (1-x)^{n-k} \\
&\Rightarrow& x^2 &= \sum_{k=0}^{n} x^2 \binom{n}{k} x^k (1-x)^{n-k}
\end{align}

Por la igualdad (9) tenemos:

\begin{align}
x^2(n^2-n) = \sum_{k=0}^{n} k(k-1) \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Partiendo de (6) se sigue:

\begin{align}
&& \nonumber (-2x)x &= \sum_{k=0}^{n} (-2x) \frac{k}{n} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&\Rightarrow& -2x^2 &= \sum_{k=0}^{n} -2 \frac{k}{n}x \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Y también que

\begin{align}
&& \nonumber (n)x &= \sum_{k=0}^{n} (n) \frac{k}{n} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&\Rightarrow& nx &= \sum_{k=0}^{n} k \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Sumando (17) con (19).

\begin{align}
\nonumber && x^2(n^2-n) + nx &= \sum_{k=0}^{n} (k(k-1) + k) \binom{n}{k} x^{k} (1-x)^{n-k}\\
\nonumber &\Rightarrow& x^2(n^2-n) + nx &= \sum_{k=0}^{n} k^2 \binom{n}{k} x^{k} (1-x)^{n-k}\\
\nonumber &\Rightarrow& \left(\frac{1}{n^2}\right) (x^2(n^2-n) + nx) &= \sum_{k=0}^{n} \left(\frac{1}{n^2}\right) k^2 \binom{n}{k} x^{k} (1-x)^{n-k} \\
&\Rightarrow& \left(1 \, – \, \frac{1}{n}\right) x^2 + \frac{1}{n}x &= \sum_{k=0}^{n} \frac{k^2}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Ahora sumemos (16), (18) y (20) para obtener:

\begin{align}
\frac{1}{n} (x \, – \, x^2) &= \sum_{k=0}^{n} \left(x \, – \, \frac{k}{n} \right)^2 \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Dado que $\underset{x \, \in \, [0,1]}{\text{máx }}(x \, – \, x^2) = \frac{1}{4}$ podemos concluir que

\begin{align}
\textcolor{Cerulean}{\sum_{k=0}^{n} \left(x \, – \, \frac{k}{n} \right)^2 \binom{n}{k} x^{k} (1-x)^{n-k}} &= \frac{1}{n} (x \, – \, x^2) \textcolor{Cerulean}{\leq} \left( \frac{1}{n} \right) \left(\frac{1}{4} \right) = \textcolor{Cerulean}{\frac{1}{4n}}
\end{align}

Ya que $n \geq \frac{\norm{f}^2_\infty}{\varepsilon^2}$ podemos concluir que $\textcolor{PineGreen}{\varepsilon \sqrt{n} \geq \norm{f}_\infty.}$ Se sigue de (15) y (22) que:

\begin{align}
\nonumber \sum_{k \in I_2}^{} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k} &\leq 2 \textcolor{PineGreen}{\norm{f}_\infty} \sqrt{n} \textcolor{Cerulean}{\sum_{k \in I_2}^{} \left( x \, – \, \frac{k}{n} \right)^2 \binom{n}{k} x^k (1-x)^{n-k}}\\
\nonumber &\leq 2 \, \textcolor{PineGreen}{\varepsilon \sqrt{n}} \sqrt{n} \textcolor{Cerulean}{\frac{1}{4n}}\\
&= \frac{\varepsilon}{2}.
\end{align}

Ahora, de (14) y (23) tenemos, finalmente que

\begin{align}
\nonumber |f(x) – B_n(f,x)| &\leq \sum_{k=0}^{n} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k}\\
\nonumber &= \sum_{k \in I_1}^{} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k} + \sum_{k \in I_2}^{} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k} \\
\nonumber &\leq \frac{\varepsilon}{2}+ \frac{\varepsilon}{2}\\
&= \varepsilon.
\end{align}

Lo cual demuestra que la sucesión de polinomios de Bernstein converge uniformemente a $f.$

Si bien, el teorema anterior aplica para funciones con dominio en $[0,1]$ se puede generalizar a cualquier intervalo cerrado en $\mathbb{R}$ según enunciamos a continuación.

Teorema. De aproximación de Weierstrass. Sea $f:[a,b] \to \mathbb{R}$ una función continua. Entonces existe una sucesión de polinomios que converge uniformemente a $f$ en $[a,b].$

Demostración:
Definimos $\rho:[0,1] \to [a,b]$ donde para cada $x \in [0,1], \, \rho(x) := (1-x)a + xb.$ En consecuencia, la función $g:= f \circ \rho$ es una función continua en $[0,1]$ y por el teorema anterior sabemos que la sucesión de polinomios de Bernstein de $g$ converge en $g,$ es decir, $B_n(g,x) \to g.$

Ahora definimos $p_n := B_n(g,x) \circ \rho ^{-1}.$ Nota que es un polinomio. Ocurre que

$\norm{p_n-f}_{\infty}:= \underset{t \, \in \, [a,b]}{\text{máx}}|p_n(t)-f(t)|= \underset{x \, \in \, [0,1]}{\text{máx}}|B_n(g,x)(x) \, – \, g(x)|= \norm{B_n(g,x) – g}_{\infty}.$

Por lo tanto se da la convergencia uniforme $p_n \to f$ en $\mathcal{C}^0[a,b].$

Más adelante…

Conoceremos condiciones bajo las que es posible acercarnos a funciones continuas que tienen su dominio en conjuntos más generales que un intervalo cerrado: los espacios compactos. Lo haremos a través del teorema de Stone-Weierstrass que enunciaremos en la siguiente sección.

Tarea moral

  1. Considera la función $\varphi_k$ definida en (2). Demuestra que $\varphi_k$ alcanza su máximo en el punto $\frac{k}{n}.$
  2. Desarrolla las funciones $\varphi_k$ para $k= 0, \, 1, \, 2$ para $n = 2.$
  3. Considera la función $f:[0,1] \to \mathbb{R}$ dada por $f(x) = sen( \pi x).$ Grafica los polinomios de Bernstein de $f$ para $n= 1, \, 2, \, 4, \, 8.$ Visualiza la gráfica para $f.$

Enlaces

Funciones semicontinuas

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

En la entrada Funciones continuas en espacios métricos vimos que una función $f: X \to \mathbb{R}\, $ con $X$ espacio métrico, es continua en un punto $x_0 \in X$ si dado $\varepsilon >0$ existe $\delta >0$ tal que si $x$ está en la bola abierta $B(x_0, \delta)$ entonces $f(x) \in B(f(x_0), \varepsilon).$

$f$ es continua en $x_0 \in X.$

Nota que esto significa que existe una bola abierta con centro $x_0$ que cumple que cualquiera de sus elementos $x$ satisface las siguientes desigualdades:

\begin{align}
f(x_0) \, – \, \varepsilon < &f(x). \\
&f(x) < f(x_0)+ \varepsilon.
\end{align}

Si bien, las funciones que no son continuas no cumplen ambas desigualdades, es posible concluir propiedades de las que sí hacen valer alguna de las dos.

Si se satisface (1), entonces $f(x_0) \, – \, \varepsilon < f(x).$ Como esto ocurre para cualquier $\varepsilon >0$ podemos hacer $f(x_0) \, – \, \varepsilon = c \,$ y así $c < f(x_0).$

Si se satisface (2), entonces $f(x) < f(x_0)+ \varepsilon.$ Como esto ocurre para cualquier $\varepsilon >0$ podemos hacer $f(x_0)+ \varepsilon = c \,$ y así $c > f(x_0).$

Este tipo de funciones se llaman «semicontinuas». Si permitimos que la función tome valores infinitos, las definimos como sigue:

Definición. Función semicontinua inferiormente. Sea $f:X \to (-\infty, \infty]$ una función, (nota que admite el valor $\infty$). Decimos que $f$ es semicontinua inferiormente en el punto $x_0 \in X$ si para toda $c<f(x_0)$ existe $\delta>0$ tal que si $d_X(x,x_0)< \delta$ entonces $c<f(x).$ Diremos que $f$ es semicontinua inferiormente si lo es en todo punto de $X.$

$f$ es semicontinua inferiormente en $x_0 \in X.$

Diremos que $f$ es semicontinua inferiormente si lo es en todo punto de $X.$

Definición. Función semicontinua superiormente. Sea $f:X \to [-\infty, \infty)$ una función, (nota que admite el valor $-\infty$). Decimos que $f$ es semicontinua superiormente en el punto $x_0 \in X$ si para toda $c>f(x_0)$ existe $\delta>0$ tal que si $d_X(x,x_0)< \delta$ entonces $f(x)<c.$ Diremos que $f$ es semicontinua inferiormente si lo es en todo punto de $X.$

$f$ es semicontinua superiormente en $x_0 \in X.$

Diremos que $f$ es semicontinua superiormente si lo es en todo punto de $X.$

Ejemplos:

  • La función piso
    $f(x) = \lfloor x \rfloor: \mathbb{R} \to \mathbb{R},$ donde
    \begin{align*}
    \lfloor x \rfloor = {\text{máx} \,} \{k \in \mathbb{Z} : k \leq x\}
    \end{align*}
    Es semicontinua superiormente.
  • $f$ aumentada en un punto de continuidad.
    Sea $f: X \to \mathbb{R}$ tal que $f$ es continua en $x_0.$ Sea $h>0.$ Considera la función \begin{equation*}
    g(x) = \begin{cases}
    f(x) &\text{si $x \neq x_0$}\\
    f(x_0) + h &\text{si $x = x_0$}
    \end{cases}
    \end{equation*}
    Entonces $g$ es una función semicontinua superiormente en $x_0.$
  • $f$ disminuida en un punto de continuidad.
    Sea $f: X \to \mathbb{R}$ tal que $f$ es continua en $x_0.$ Sea $h>0.$ Considera la función \begin{equation*}
    g(x) = \begin{cases}
    f(x) &\text{si $x \neq x_0$}\\
    f(x_0) \, – \, h &\text{si $x = x_0$}
    \end{cases}
    \end{equation*}
    Entonces $g$ es una función semicontinua inferiormente en $x_0.$
  • Si $f:X \to [-\infty, \infty)$ es una función semicontinua inferiormente, entonces la función $-f$ es semicontinua superiormente.

$\textcolor{orange}{\text{Queda como ejercicio al lector verificar que las funciones mencionadas son semicontinuas.}}$

Definición. Límite superior y límite inferior de $f$ en un punto $x_0.$ Considera $f:X \to \mathbb{R}.\, $ Sea $x_0 \in X.$ Pensemos en todos los valores que toma la función $f$ en puntos «muy cerquita» de $x_0 \,$ identificando así que es «lo más» que podría valer. Nos referimos al valor de
$$\overline{f}(x_0)= \underset{\varepsilon \to 0}{lim}\, \left[ \underset{x \in B(x_0, \varepsilon)}{sup} \, f(x) \right]$$
que podría ser finito o infinito y recibe el nombre de límite superior de $f$ en $x_0.$

En la función de Dirichlet $\overline{f}(x_0) = 1$ mientras que $\underline{f}(x_0)= 0$ para cualquier $x_0 \in \mathbb{R}.$

Análogamente, si pensamos en todos los valores que toma la función $f$ en puntos «muy cerquita» de $x_0 \,$ identificando así que es «lo menos» que podría valer. Nos referimos al valor de
$$\underline{f}(x_0)= \underset{\varepsilon \to 0}{lim}\, \left[ \underset{x \in B(x_0, \varepsilon)}{inf} \, f(x) \right]$$
que podría ser finito o infinito y recibe el nombre de límite inferior de $f$ en $x_0.$

Definición. Oscilación de la función $f$ en el punto $x_0.$ Sean $f:X \to \mathbb{R} \,$ y $\, x_0 \in X.$ La diferencia

$$\omega f(x_0) = \overline{f}(x_0) \, – \, \underline{f}(x_0)$$

si es que tiene sentido, es decir si al menos uno de los números $\overline{f}(x_0)$ o bien $\underline{f}(x_0)$ es finito, se llama oscilación de la función $f$ en el punto $x_0.$

Ejemplo

Si $f$ es la función de Dirichlet, la oscilación de $f$ en cualquier punto de $\, \mathbb{R} \,$ es $1.$

Proposición: Sean $f:X \to \mathbb{R} \,$ y $\, x_0 \in X.$ Entonces $f$ es continua en $x_0 \,$ si y solo si $\omega f(x_0) = 0,$ es decir
$$-\infty < \underline{f}(x_0) \,= \, \overline{f}(x_0) < \infty.$$

$\textcolor{orange}{\text{La demostración queda como ejercicio al lector.}}$

Nota que para cualquier función $f:X \to \mathbb{R} \,$ la función $\overline{f}(x)$ es semicontinua superiormente mientras que la función $\underline{f}(x)$ es semicontinua inferiormente. $\textcolor{orange}{\text{La demostración de estos hechos también se deja como ejercicio.}}$

Antes de continuar recordemos la entrada Espacios métricos de caminos. Vimos que un camino es una función continua $\gamma: [a,b] \to X$ con $X$ un espacio topológico. En algunos libros, como el de Mónica Clapp, esta definición se indica como trayectoria.

Si $X$ es un espacio métrico entonces a cada trayectoria $\gamma:[a,b] \to X$ se le puede asociar el valor dado por

$$L(\gamma) : = sup \left\{ \sum_{k=1}^{n} d(\gamma(t_{k-1}), \gamma(t_k)) : a=t_0 \leq t_1 \leq …\leq t_n = b, \, n \in \mathbb{N} \right\}$$

lo cual define una función $L:(\mathcal{C}^0[a,b],X) \to (-\infty, \infty]$ que satisface los axiomas de una longitud de caminos.

Otra cosa que podemos observar de $L$ es que no es continua cuando $X = \mathbb{R}^2.$ Como ejemplo un ejercicio al final de esta sección. La cuestión es que dada una trayectoria $\gamma$ puede haber trayectorias con longitud muy grande pese a ser cercanas a $\gamma$ en la métrica uniforme. No obstante, puede asegurarse que si las trayectorias son suficientemente cercanas a $\gamma$ entonces su longitud no podrá ser arbitrariamente menor que la de $\gamma$. En otras palabras:

La función $L$ es semicontinua inferiormente en $(\mathcal{C}^0[a,b],X)$

Proposición: Sean $\gamma \in (\mathcal{C}^0[a,b],X)\,$ y $c < L(\gamma).$ Entonces existe $\delta>0$ tal que si $d_\infty(\gamma,\sigma) < \delta$ se satisface
$$c < L(\sigma).$$
Demostración:
Tomemos $d_0 >0$ tal que $c+ \delta_0 < L(\gamma).$ Por definición de $L,$ existen $a=t_0, \leq t_1 \leq … \leq t_n = b\,$ en $\mathbb{R}$ tales que

$$c + \delta_0 < \sum_{k=1}^{n} d(\gamma(t_{k-1}), \gamma(t_k)).$$

Sea $\delta := \frac{\delta_0}{2m}. \,$ Si $\delta_\infty (\gamma, \sigma,) < \delta$ se sigue

\begin{align*}
d(\gamma(t_{k-1}), \gamma(t_k)) &\leq d(\gamma(t_{k-1}), \sigma(t_{k-1})) + d(\sigma(t_{k-1}),\gamma(t_k)) \\
&\leq d(\gamma(t_{k-1}), \sigma(t_{k-1})) + d(\sigma(t_{k-1}),\sigma (t_k)) + d(\sigma(t_k),\gamma(t_k)) \\
< \delta + d(\sigma(t_{k-1}),\sigma (t_k)) + \delta \\
= d(\sigma(t_{k-1}),\sigma (t_k)) + 2 \delta\\
= d(\sigma(t_{k-1}),\sigma (t_k)) + \frac{\delta_0}{m}.
\end{align*}

Si sumamos las desigualdades para todo $k = 1,…,n$ tenemos lo siguiente

\begin{align}
c + \delta_0 &< \sum_{k=1}^{n} d(\gamma(t_{k-1}), \gamma(t_k))\\
&< \sum_{k=1}^{n} d(\sigma(t_{k-1}), \sigma(t_k)) + \delta_0 \\
&\leq L(\sigma) + \delta_0.
\end{align}

De modo que $\, c< L(\sigma)$ que es lo que queríamos demostrar.

En la entrada Funciones en espacios topológicos compactos vimos que toda función continua $\, f:A \to \mathbb{R} \,$ en un espacio compacto $A$ alcanza su mínimo y máximo en $A.$ Los resultados siguientes muestran la generalización al caso de funciones semicontinuas.

Proposición: Sea $f:A \to \mathbb{R} \,$ una función semicontinua inferiormente sobre un espacio métrico compacto $A, \, $ entonces la imagen de $f$ está acotada inferiormente.

Demostración:
Supón por el contrario que $\underset{x \in A}{\text{ínf}} \, f(x) = – \infty.$ Entonces existe una sucesión $\{x_n\}_{n \in \mathbb{N}} \,$ de elementos en $A$ tal que para cada $n \in \mathbb{N}, \, f(x_n) < -n.$ Puesto que el espacio $A$ es compacto, el subconjunto infinito $\{x_n: n \in \mathbb{N}\} \,$ tiene al menos un punto de acumulación $x_0, \,$ en $A. \,$(Recuerda el problema 3 de la tarea moral de la entrada Compacidad en espacios métricos). Ya que $f$ es semicontinua inferiormente en $x_0, \,$ existe $\delta >0$ tal que para cada $x \in B(x_0, \delta)$ se cumple que $f(x) > f(x_0) \, – \, 1.$ Observa que $B(x_0, \delta)$ contiene a lo más una cantidad finita de puntos de la sucesión, pero esto contradice que $x_0$ sea punto de acumulación de $\{x_n: n \in \mathbb{N}\} \,$ por lo tanto la imagen de $f$ está acotada inferiormente.

Se puede probar el resultado análogo para una función semicontinua superiormente. $\textcolor{orange}{\text{Queda como ejercicio.}}$

Proposición: Sea $f:A \to \mathbb{R} \,$ una función semicontinua inferiormente sobre un espacio métrico compacto $A, \, $ entonces $f$ alcanza su mínimo en $A.$

Demostración:
Como $f$ es semicontinua inferiormente y por el resultado anterior, $f(A)$ tiene ínfimo en $\mathbb{R},$ podemos construir una sucesión $(x_n)_{n \in \mathbb{N}}$ de elementos en $A$ tal que para cada $n \in \mathbb{N}, \, f(x_n) \leq \underset{x \in A}{\text{ínf}} \, f(x) \, + \, \frac{1}{n}.$

Como $A$ es compacto, el conjunto $\{x_n: n \in \mathbb{N}\} \,$ tiene un punto de acumulación $x_0 \in A.$

Vamos a probar que $f$ alcanza su mínimo en $x_0,$ es decir que $f(x_0) = \underset{x \in A}{\text{ínf}} \, f(x).$
Supón por el contrario que $f(x_0) > \underset{x \in A}{\text{ínf}} \, f(x).$ Entonces existe $\varepsilon>0$ tal que $\underset{x \in A}{\text{ínf}} \, f(x) + \varepsilon \leq f(x_0).$ Como $f$ es semicontinua inferiormente en $x_0,$ existe $\delta>0$ tal que para cada $x \in B(x_0, \delta), \, f(x > \underset{x \in A}{\text{ínf}} \, f(x) + \varepsilon).$ Observa que $B(x_0, \delta)$ contiene a lo más una cantidad finita de puntos de la sucesión, pero esto contradice que $x_0$ sea punto de acumulación de $\{x_n: n \in \mathbb{N}\} \,$ por lo tanto $f(x_0) = \underset{x \in A}{\text{ínf}} \, f(x)$ y así, $f$ alcanza su mínimo en $A.$

Se puede probar el resultado análogo para una función semicontinua superiormente. $\textcolor{orange}{\text{Queda como ejercicio.}}$

Más adelante…

Conoceremos otro «tipo de continuidad» en las funciones. Esta vez lo haremos con una colección de ellas cuando la misma bola de radio $\delta$ y centro en $x_0$ asegura la cercanía con los puntos que cada función asigna a $x_0.$ Este concepto es equicontinuidad y se verá formalmente en la siguiente entrada.

Tarea moral

  1. Demuestra los resultados que se fueron indicando a lo largo de esta entrada.
  2. a) Prueba que la sucesión de trayectorias $\gamma_k: [0,1] \to \mathbb{R}^2,$
    $$\gamma_k = \left(x, \frac{1}{\sqrt{k}}sen(\pi k x) \right),$$
    converge a la trayectoria $\gamma(x) = (x,0)$ en el conjunto de funciones acotadas de $[0,1]$ en $\mathbb{R}^2$
    b) Prueba que $L(\gamma_k) \to \infty$
    c) Concluye que $L$ no es continua en $\mathcal{C}^0([a,b], \mathbb{R}).$

Enlaces

Equicontinuidad

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

Para probar el teorema de Arzelá-Ascoli que veremos más adelante, usaremos familias de funciones que tienen la propiedad de enviar puntos muy cercanos del dominio a puntos muy cercanos en el contradominio. Suena a funciones continuas, ¿verdad? No obstante, en esta ocasión será el mismo valor de delta el que haga válida la cercanía para cualquier función.

Ejemplo. Considera el conjunto de funciones $\{f_k: f_k \in \mathcal{C}^0([-1,1], \mathbb{R}), \, k \in \mathbb{N}\}, \,$ donde

\begin{equation*}
f_k(x) = \begin{cases}
-1 \, &\text{ si $x \in [-1, – \frac{1}{k}]$},\\
kx \, &\text{ si $x \in [-\frac{1}{k}, \frac{1}{k}]$}, \\
1 \, &\text{ si $x \in [\frac{1}{k},1]$}.
\end{cases}
\end{equation*}

Dejaremos como ejercicio demostrar que para cada $\delta >0$ (y menor que $1$) existe una función $f_k$ tal que $|f_k(x) \, – \, f_k(\frac{\delta}{2})|> \varepsilon = \frac{1}{2}$ de modo que no es posible encontrar un valor de $\delta$ que funcione para todas las funciones del conjunto.

La propiedad que estamos describiendo se conoce como equicontinuidad. Presentamos la definición de:
Simon, B., Real Analysis A Comprehensive Course in Analysis, Part 1,. USA: American Mathematical Society, 2015, pág 70.

Definición. Familia uniformemente equicontinua. Sean $(X,d_X)$ y $(Y,d_Y)$ espacios métricos y $\mathcal{H} \,$ una familia de funciones de $X$ en $Y.$ Diremos que $\mathcal{H} \,$ es uniformemente equicontinua si para cada $\varepsilon >0$ existe $\delta >0$ tales que para cualesquiera $x_1, x_2 \in X$ que cumplen que $d_X(x_1,x_2)< \delta\, $ entonces para cualquier $f \in \mathcal{H}, \,$ $d_Y(f(x_1),f(x_2)) < \varepsilon.$

En particular, si $Y$ es el espacio de los complejos con la métrica euclidiana tenemos la definición de:
Rudin, W., Principios de Análisis Matemático (3a ed.). México: McGraw–Hill, 1980, pág 167.

Definición. Familia equicontinua de funciones complejas. Sea $\mathcal{H}$ una familia de funciones complejas con dominio en un espacio métrico $(X,d_X).$ Diremos que $\mathcal{H} \,$ es equicontinua en $X$ si para cada $\varepsilon >0$ existe $\delta >0$ tales que para cualesquiera $x_1, x_2 \in X$ que cumplen que $d_X(x_1,x_2)< \delta\, $ entonces para cualquier $f \in \mathcal{H}, \,$ $\norm{f(x_1) \, – \, f(x_2)} < \varepsilon.$

Nota que toda función de una familia equicontinua es uniformemente continua.

Proposición. Sea $(X,d_X)$ un espacio métrico compacto y $(f_n)_{n \in \mathbb{N}}$ una sucesión de funciones en $\mathcal{C}^0(X, \mathbb{C})$ (continuas) tal que la sucesión converge uniformemente en $X.$ Entonces $\{ f_n \} _{n \in \mathbb{N} \,}$ (el conjunto de las funciones de la sucesión) es uniformemente equicontinua sobre $X.$

Demostración:
Sea $\varepsilon >0$. Como la sucesión de funciones $(f_n)_{n \in \mathbb{N}}\,$ converge uniformemente en $X,$ de acuerdo con la entrada Convergencia puntual y convergencia uniforme, como $\mathbb{C}$ es completo, $(f_n)_{n \in \mathbb{N}}\,$ es uniformemente de Cauchy, por lo tanto existe $N \in \mathbb{N}$ tal que para cada $n \geq N$ se cumple que

\begin{align}
\norm{f_n \, – \, f_N} _\infty < \frac{\varepsilon}{3}.
\end{align}

En la entrada Continuidad uniforme vimos que cada función continua con dominio compacto es uniformemente continua. En particular, para cada una de las primeras funciones de la sucesión, $f_1, \, f_2, …, f_N,$ existe su correspondiente $\delta_i, \, i=1,…,N$ tal que para cada $i = 1,…,N, \,$ siempre que $d_X(x_1,x_2) < \delta_i,$ tenemos:

\begin{align}
\norm{f_i(x_1) \, – \, f_i(x_2)} < \frac{\varepsilon}{3}.
\end{align}

Si hacemos
$$\delta < \text{mín} \{d_i : i=1,…,N\}$$
se sigue cumpliendo (2) para $i = 1,…,N$

mientras que si $n>N$ se concluye de la desigualdad del triángulo, de (1) y de (2) que

\begin{align*}
\norm{f_n(x_1) \, – \, f_n(x_2)} &\leq \norm{f_n(x_1) \, – \, f_N(x_1)} + \norm{f_N(x_1) \, – \, f_N(x_2)} + \norm{f_N(x_2) \, – \, f_n(x_2)} \\
&\leq \frac{\varepsilon}{3}+ \frac{\varepsilon}{3} + \frac{\varepsilon}{3} \\
&= \varepsilon.
\end{align*}

Por lo tanto el conjunto de funciones en $(f_n)_{n \in \mathbb{N}}$ es equicontinuo.

La definición a considerar en el teorema de Arzelá-Ascoli

En la sección Teorema de Arzelá-Ascoli link nuestra familia de funciones tendrá un dominio compacto y consideraremos la definición de equicontinuidad que aparece en
Clapp, M., Análisis Matemático. Ciudad de México: Editorial Papirhos, IM-UNAM, 2015, pág 125.
Nota que la propiedad se fija en un punto:

Definición. Familia equicontinua en un punto: Sea $(X,d_X)$ un espacio métrico compacto y $(Y,d_Y)$ un espacio métrico. Sea $\mathcal{H} \subset \mathcal{C^0}(X,Y)$ es decir, $\mathcal{H}$ es una familia de funciones continuas con dominio en $X$ e imagen en $Y$. Diremos que $\mathcal{H}$ es equicontinuo en el punto $x_0 \in X$ si para todo $\varepsilon>0,$ existe $\delta>0$ tal que para toda función $f$ en $\mathcal{H}$ se cumple que si $d_X(x,x_0)<\delta$ entonces $d_Y(f(x),f(x_0))<\varepsilon$.

Esta definición se relaciona con la primera en el siguiente sentido:

Proposición: Si $\mathcal{H}$ es uniformemente equicontinua entonces es equicontinua en cada punto de $X.$

Demostración:
Sea $x_0 \in X$ y $\varepsilon > 0. \,$ Como $\mathcal{H}$ es uniformemente equicontinua, existe $\delta >0$ tal que para cada $x_1, x_2 \in X$ si $d_X(x_1,x_2)< \delta$ entonces $d_Y(f(x_1),f(x_2))< \varepsilon$ para cualquier $f \in \mathcal{H}.$ En particular para cada $x \in X,$ si $d_X(x,x_0)< \delta$ entonces $d_Y(f(x),f(x_0))< \varepsilon$ para cualquier $f \in \mathcal{H} \,$ lo cual prueba que la familia de funciones es equicontinua en $x_0$.

El recíproco no es cierto. Ser equicontinua puntualmente no implica ser uniformemente equicontinua, la demostración queda como ejercicio.

Más adelante…

Anteriormente vimos algunos resultados de la compacidad en los conjuntos, en la siguiente sección mostraremos una herramienta para identificarla en espacios de funciones, presentando así, los últimos conceptos necesarios para conocer el teorema de Arzelá-Ascoli.

Tarea moral

  1. Resuelve los dos ejemplos de esta sección.
  2. Muestra un ejemplo de una familia equicontinua puntualmente en todos los puntos del dominio pero que no sea uniformemente equicontinua.

Enlaces