Archivo de la categoría: Sin clasificar

Última parte de la demostración del teorema de Stone-Weierstrass

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

Usaremos los resultados vistos en las entradas anteriores Enunciado del teorema de Stone-Weierstrass y primera parte de la demostración y Segunda parte de la demostración del teorema de Stone-Weierstrass para culminar con la demostración del teorema de Stone-Weierstrass. Sin más preámbulo, recordemos lo que dice.

Teorema. Stone-Weierstrass: Sea $K$ un espacio métrico compacto. Sea $A \subset \mathcal{C}^0(K, \mathbb{R}),$ es decir, $A$ es un conjunto de funciones continuas de $K$ en $\mathbb{R}.$ Si $A$ satisface las siguientes propiedades:

a) Para cada $\lambda, \mu \, \in \mathbb{R}$ y $f,g \in A$ se cumple que $$\lambda f + \mu g \, \in A.$$ Esto es, $A$ es cerrado bajo combinaciones lineales.

b) Para cada $f,g \in A$ se cumple que $$f \cdot g \, \in A.$$ Esto es, $A$ es cerrado bajo producto de funciones.

c) $1 \in A,$ donde $1$ es la función constante que para cada $x \in K$ asigna el valor $1.$

d) Para cualesquiera $x_1, x_2 \in K$ tales que $x_1 \neq x_2$ existe una función $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi(x_2).$

Entonces $A$ es denso en $\mathcal{C}^0(K, \mathbb{R}),$ es decir, $\overline{A}=\mathcal{C}^0(K, \mathbb{R}).$

Demostración:
Sea $A$ como en las hipótesis. Para probar que $\overline{A}=\mathcal{C}^0(K, \mathbb{R})$ tomemos $f \in \mathcal{C}^0(K, \mathbb{R}).$
Sea $\varepsilon >0.$ Demostraremos que para toda $B(f,\varepsilon)$ se cumple que existe una función $\varphi \in A$ tal que $\varphi \in B(f,\varepsilon),$ es decir
$$d_\infty(f,\varphi)< \varepsilon.$$

Para que dicha $\varphi \in A$ exista, es suficiente demostrar que existe $\textcolor{purple}{\hat{\varphi}} \in \overline{A}$ tal que
$$d_\infty(f,\hat{\varphi}) < \frac{\varepsilon}{2}.$$

Pues si esa $\hat{\varphi} \in \overline{A}$ existe, entonces por lo visto en la entrada Convergencia, existe también una sucesión $(\varphi_n)_{n \in \mathbb{N}}$ de funciones en $A$ tales que $\varphi_n \to \hat{\varphi}$ en $\mathcal{C}^0(K, \mathbb{R})$ y así existe $N \in \mathbb{N}$ tal que
$$d_\infty(\hat{\varphi},\varphi_N) < \frac{\varepsilon}{2}.$$
En consecuencia las desigualdades
\begin{align*}
d_\infty(f,\varphi_N) &\leq d_\infty(f,\hat{\varphi}) +d_\infty(\hat{\varphi},\varphi_N) \\
&< \frac{\varepsilon}{2} + \frac{\varepsilon}{2}\\
&< \varepsilon,
\end{align*}
evidenciarían la existencia de la $\varphi$ deseada. Procedamos entonces a justificar la existencia de la $\hat{\varphi} \in \overline{A}$ descrita arriba.

Fijemos $x \in K.$ Por el lema 1, visto en la entrada tal sabemos que para cada $y \in K$ existe $\varphi_{x,y} \in A$ (que depende de $x$ y de $y$) tal que
\begin{align}
\textcolor{blue}{\varphi_{x,y} (x)} & \textcolor{blue}{= f(x)}, \, \text{ y} \\
\textcolor{magenta}{\varphi_{x,y} (y)} &\textcolor{magenta}{= f(y)}.
\end{align}

Sea $\varepsilon >0.$ Como tanto $\varphi_{x,y}$ como $f$ son continuas en $K,$ entonces la función $\varphi_{x,y}\, – \, f$ es continua en $K.$ Así, para cada $y \in K$ existe $\delta_y >0$ tal que si $z \in B(y,\delta_y)$ entonces
\begin{align}
\nonumber &&|(\varphi_{x,y}\, – \, f)(z) \, – \, (\varphi_{x,y}\, – \, f)(y)| &< \varepsilon \\
\nonumber &\Rightarrow&|\varphi_{x,y}(z)\, – \, f(z) \,- \textcolor{magenta}{ ( \varphi_{x,y}(y)\, – \, f(y))}|&< \varepsilon \\
\nonumber &\Rightarrow&\ |\varphi_{x,y}(z)\, – \, f(z) \, \textcolor{magenta}{- 0}|&< \varepsilon \\
&\Rightarrow& |\varphi_{x,y}(z)\, – \, f(z)|&< \varepsilon
\end{align}

La colección de bolas abiertas de radio $\delta_y$ y centro en la respectiva $y \in K: \, $$\, \{B(y, \delta_y)\}_{y \in K}$ es una cubierta abierta de $K$ que recordemos es compacto. Así, existe una subcubierta finita de $ \{B(y, \delta_y)\}_{y \in K},$ es decir, existen

$y_1, \, y_2,…, y_n \in K$ con $n \in \mathbb{N}$ tales que $\{B(y_1, \delta_{y_1}), \, B(y_2, \delta_{y_2}),…,B(y_n, \delta_{y_n})\}$ es una cubierta abierta de $K.$

Sea

$$\varphi_x = \text{mín}\{\varphi_{x,y_1}, \, \varphi_{x,y_2}, …, \varphi_{x,y_n}\}.$$
Demostraremos que esta función se acerca muchísimo a $f$ en cualquier punto, específicamente que
Para cada $z \in K, \, \varphi_x(z) \, – \, f(z) < \varepsilon.$

Esto ocurre porque si $z \in K$ entonces existe $j \in \mathbb{N}$ tal que $z \in B(y_j, \delta_{y_j}).$ Así:

\begin{align*}
&& \varphi_x(z) &\leq \varphi_{x,y_j}(z) \\
& \Rightarrow& \varphi_x(z) \, – \, f(z) &\leq \varphi_{x,y_j}(z) \, – \, f(z)
\end{align*}

Y por (3)
\begin{align}
& \Rightarrow& \varphi_x(z) \, – \, f(z) &< \varepsilon
\end{align}

Por el lema 4 de la entrada anterior sabemos que $\varphi_x$ es continua en $x.$ En consecuencia la función $\varphi_x \, – \, f$ también lo es, de modo que existe $\gamma_x >0$ tal que si $z \in B(x, \gamma_{x}),$ entonces por (1) tenemos

\begin{align}
\nonumber |(\varphi_x \, – \, f)(z)\, – \, (\varphi_x \, – \, f)(x)| < \varepsilon\\
\nonumber |(\varphi_x(z) \, – \, f(z))\, – \, \textcolor{blue}{(\varphi_x(x) \, – \, f(x))}| < \varepsilon\\
\nonumber |(\varphi_x(z) \, – \, f(z))\, – \, \textcolor{blue}{0}| < \varepsilon\\
|\varphi_x(z) \, – \, f(z)| < \varepsilon\\
\end{align}

Como $x$ es arbitraria, pensemos ahora en todas las $\varphi_x´s$ que podemos hacer con cada $x \in K.$ Nota que $\{B(x, \delta_{\gamma_{x}})\}_{y \in K}$ es una cubierta abierta de $K$ compacto. Así, existe una subcubierta finita de $ \{B(y, \delta_y)\}_{y \in K},$ es decir, existen

$x_1, \, x_2,…, x_m \in K$ con $m \in \mathbb{N}$ tales que $\{B(x_1, \gamma_{x_1}), \, B(x_2, \gamma_{x_2}),…,B(x_n, \gamma_{x_m})\}$ es una cubierta abierta de $K.$

Sea

$$\hat{\varphi} = \text{máx}\{\varphi_{x_1}, \, \varphi_{x_2}, …, \varphi_{x_m}\}.$$

Como todas las funciones dentro del corchete están en $A,$ también pertenecen a $\overline{A}.$ Por el Lema 4, podemos decir que $\hat{\varphi} \in \overline{A},\, $ (ver tarea moral de esta sección).

A continuación demostraremos que $d_\infty (\hat{\varphi},f) < \varepsilon.$

Sea $z \in K.$

Por un lado, como existe $i \in \{1,2,…,m\}$ tal que $z \in B(x_i, \gamma_{x_i}).$ Sabemos que

\begin{align*}
&&\varphi_x(z) &\geq \varphi_{x_i}(z)\\
&\Rightarrow& \varphi_x(z) \, – \, f(z) &\geq \varphi_{x_i}(z) \, – \, f(z)
\end{align*}
Y por (5)
\begin{align}
\nonumber && \varphi_x(z) \, – \, f(z) &\geq \varphi_{x_i}(z) \, – \, f(z) &> -\varepsilon\\
\nonumber &\Rightarrow& \varphi_x(z) \, – \, f(z) & > -\varepsilon \\
&\Rightarrow& -\varepsilon & < \varphi_x(z) \, – \, f(z)
\end{align}

Como esto ocurre para cualquier $x,$ entonces ocurre para cada $x_k, \, k= 1,2,…,m.$ Se sigue que

\begin{align}
\nonumber && -\varepsilon & < \varphi_{x_k}(z) \, – \, f(z), k= 1,2,…,m\, \\
\nonumber &\Rightarrow& -\varepsilon <& \underset{k \in \{1,…,m\}}{\text{máx}}\{ \varphi_{x_k}(z)\} \, – \, f(z)\\
\nonumber &\Rightarrow& -\varepsilon <& \underset{k \in \{1,…,m\}}{\text{máx}}\{ \varphi_{x_k}(z)\} \, – \, f(z) \\
&\Rightarrow& -\varepsilon <& \hat{\varphi}(z) \, – \, f(z) \\
\end{align}

Por otro lado, en la desigualdad (4) tenemos

\begin{align*}
& \Rightarrow& \varphi_x(z) \, – \, f(z) &< \varepsilon
\end{align*}

Como esto ocurre para cualquier $x,$ entonces ocurre para cada $x_k, \, k= 1,2,…,m.$ Se sigue que

\begin{align}
\nonumber & & \varphi_{x_k}(z) \, – \, f(z) &< \varepsilon, \, k= 1,2,…,m \\
\nonumber & \Rightarrow& \underset{k \in \{1,…,m\}}{\text{máx}}\{ \varphi_{x_k}(z) \, – \, f(z) \} &< \varepsilon \\
\nonumber & \Rightarrow& \underset{k \in \{1,…,m\}}{\text{máx}}\{ \varphi_{x_k}(z)\} \, – \, f(z) &< \varepsilon \\
& \Rightarrow& \hat{\varphi}(z) \, – \, f(z) &< \varepsilon
\end{align}

De (7) y (8) tenemos que para cada $z \in K$
\begin{align}
|\hat{\varphi}(z) \, – \, f(z)| < \varepsilon \\
\end{align}

Y así

\begin{align}
\nonumber &&\underset{z \in K}{sup}|\hat{\varphi}(z) \, – \, f(z)| < \varepsilon \\
&\Rightarrow& d_\infty(\hat{\varphi},f) < \varepsilon
\end{align}

Que es lo que queríamos demostrar.

Finalizamos esta sección con el siguiente:

Corolario. Sea $K \subset \mathbb{R}^n$ compacto y sea $A$ el conjunto de polinomios en $n$ variables que van de $K$ en $\mathbb{R}.$ Entonces toda función continua $f:K \to \mathbb{R}$ se puede aproximar con polinomios, es decir, existe una sucesión de polinomios $(p_n)_{n \in \mathbb{N}}$ tal que $(p_n) \to f$ con la métrica uniforme.

La demostración se deja como ejercicio.

Más adelante…

Complementaremos las ideas de aproximación notando que, para el caso de las funciones continuas en un intervalo cerrado, también es posible encontrar una aproximación a través de lo que llamaremos «función cuadrática por pedazos».

Tarea moral

  1. Sea $A$ como en las hipótesis del teorema de Stone-Weierstrass. Muestra que si $f_i \in \overline{A}, \, i=1,…,n,$ entonces la función $\underset{i \in \{1,…,n\}}{\text{mín}} \{f_i\}$ también pertenece a $\overline{A}.$
  2. Prueba el corolario. Sugerencia: Demuestra que satisface las hipótesis del teorema de Stone-Weierstrass. Usa la función proyeccion, que es continua, para probar que cumple d).
  3. Demuestra que el conjunto de polinomios de grado impar de $[0,1] \to \mathbb{R}$ es denso en $\mathcal{C^0}[0,1].$ ¿Satisface las hipótesis del teorema?
  4. Sea $f \in \mathcal{C^0}[0,1]$ tal que para cada $n \in \mathbb{N} \cup \{0\}$
    $$\int_{0}^{1} f(x)x^ndx=0.$$
    Prueba que $\int_{0}^{1} f^2(x)dx=0$ y concluye que $f=0.$

Enlaces

Un ejemplo de aproximación con funciones cuadráticas por pedazos

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

En las entradas anteriores vimos que es posible aproximarnos a una función continua a través de polinomios (link Bernstein) y también que es posible generalizar el concepto en funciones continuas con dominio en un espacio compacto (link Stone-Weierstrass). No queremos pasar a otra sección sin hacer notar que, para el caso de las funciones continuas en un intervalo cerrado, también es posible encontrar una aproximación a través de una función cuadrática por pedazos.

Definición. Función cuadrática por pedazos. Sea $[a,b] \subset \mathbb{R}, \,$ decimos que $f:[a,b] \to \mathbb{R}$ es una función cuadrática por pedazos en $[a,b]$ si existen intervalos $[x_0 =a, x_1], \, [x_1,x_2], …,[x_n-1,x_n=b]$ donde $x_{i-1} < x_i, \, i=1,…,n \,$ tal que la función $\, f \,$ restringida en cada intervalo $[x_{i-1},x_i]$ es una función cuadrática.

Representación de una función cuadrática por pedazos

Antes de dar paso a la proposición recordemos que si tenemos tres puntos $P_1(-x_1,y_1), \, P_2(0,y_2), \, P_3(x_1,y_1) \,$ con $\, x_1, \, y_1, \, y_2 \in \mathbb{R} \,$ como muestra la imagen, entonces la parábola que pasa por ellos tiene a $P_2$ como vértice de la parábola y por tanto también como máximo o mínimo.

Dicha parábola está dada por la función $P(x) = \left( \dfrac{y_1 \, – \, y_2}{x_1^2} \right) x^2 + y_2.$

Una traslación nos muestra que esta propiedad se cumple para cualesquiera tres puntos del plano cuando uno de ellos tiene la primera coordenada en el punto medio de las primeras coordenadas de los otros dos.

Esta construcción la usaremos más adelante. Ahora sí, demos paso a la aproximación deseada.

Proposición: Sea $A$ el conjunto de las funciones cuadráticas por pedazos en el intervalo $[a,b] \subset \mathbb{R}, \,$ entonces $A$ es denso en $\mathcal{C}^0([a,b], \mathbb{R)}$ (el conjunto de las funciones continuas en $[a,b]$).

Demostración:
Sea $f \in \mathcal{C}^0([a,b], \mathbb{R)}$ y $\varepsilon >0.$ Para probar que $A$ es denso en $\mathcal{C}^0([a,b], \mathbb{R)}, \, $ buscamos $g \in A$ tal que
$$d_\infty(f,g) < \varepsilon.$$

Como $f$ es continua en $[a,b]$ entonces también es uniformemente continua, por lo tanto existe $\delta >0$ tal que para cada $x,y \in [a,b], \,$ si $|x-y| < \delta$ entonces
\begin{align}
|f(x) \, – \, f(y)|< \dfrac{\varepsilon}{2}.
\end{align}

Sea $\, n \in \mathbb{N} \,$ tal que $\dfrac{b-a}{n} < \delta$

Definimos $n$ intervalos de longitud $\dfrac{b-a}{n}$ en $[a,b]$ como sigue:

$\left[a, a + \dfrac{b-a}{n}\right], \left[a + \dfrac{b-a}{n} , a + 2\dfrac{b-a}{n}\right],…, \left[a + (n-1)\dfrac{b-a}{n} , a + n\dfrac{b-a}{n} = b \right]$

El intervalo se divide en $n \,$ subintervalos de igual longitud

Si $\, x_k = a + k\dfrac{b-a}{n},$ $k = 0,…,n, \,$ para cada intervalo $[x_{k-1},x_k]$ con $k = 1,…,n \,$ identifica la parábola que pasa por el punto $(x_{k-1}, f(x_{k-1})), \,$ el punto $(x_{k}, f(x_{k})) \,$ (motivados por la función $f$) y el punto $(x_{k}+ \frac{b-a}{n}, f(x_{k-1}))$ (simplemente reflejando al punto $(x_{k-1}, f(x_{k-1})$ en la recta $x=x_k$ ).

Representación del caso en que $f(x_k) \,$ es máximo en la parábola

Arriba describimos que existe una parábola $g_k$ que pasa por esos tres puntos y que hace que el punto $(x_{k}, f(x_{k})) \,$ sea vértice y así es también máximo o mínimo de la parábola. Consideremos únicamente la restricción de $g_k$ en el intervalo $[x_{k-1},x_k]$ y una concatenación de estas para definir una función $g,$ es decir

$$g(x) := \sum_{k=1}^{n} 1_{[x_{k-1},x_k]} \, g_k(x)$$

donde $1_{[x_{k-1},x_k]}$ es la función característica en el intervalo $[x_{k-1},x_k]$.

Representación de la función $g$

Ahora probemos que la distancia de $f$ a $g$ es menor que $\varepsilon.$ Sea $x \in [a,b],$ entonces $x \in [x_{k-1},x_k]$ para algún $k \in \{1,…,n\}.$

Por (1) sabemos que
$$|x \, – \, x_k|< \delta \, \Rightarrow \, |f(x) \, – \, f(x_k)|< \frac{\varepsilon}{2}$$

Por otro lado, como $g$ es creciente cuando $f(x_{k})$ es máximo (o decreciente si es mínimo), entonces se cumple

\begin{align*}
&& f(x_{k-1})= g(x_{k-1}) \leq & g(x) \leq g(x_{k}) = f(x_{k}) \\
&\text{o bien }& f(x_{k})= g(x_{k}) \leq & g(x) \leq g(x_{k-1}) = f(x_{k-1}),
\end{align*}

En cualquier caso $|f(x_k) \, – \, g(x)|< \frac{\varepsilon}{2}$

Representación de la distancia entre $f$ y $g$

Por lo tanto

$$ |f(x) \, – \, g(x)| \leq |f(x) \, – \, f(x_k)|+ |f(x_k) \, – \, g(x)| < \frac{\varepsilon}{2} + \frac{\varepsilon}{2} = \varepsilon$$

probando así que

$$d_\infty(f,g) < \varepsilon.$$

Más adelante…

Comenzaremos con la última sección del blog correspondiente a Análisis Matemático I. A través de definiciones y proposiciones llegaremos al concepto de la integral de Riemann-Stieltjes. Esta noción generaliza a la integral de Riemann, que suele verse en los cursos de Cálculo, pero que también es un caso particular de la integral de Lebesgue, la que se verá en el curso de Análisis Matemático II.

Tarea moral

  1. Sea $[a,b] \in \mathbb{R}$ y sea $A$ el conjunto de funciones lineales por pedazos en $[a,b].$ Muestra que $A$ es denso en $\mathcal{C}^0([a,b], \mathbb{R}).$

Enlaces

Segunda parte de la demostración del teorema de Stone-Weierstrass

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

En esta entrada conoceremos dos lemas más previos a la demostración del teorema de Stone-Weierstrass. Las hipótesis a usar serán las mismas que se mencionaron en la entrada anterior: $K$ es un espacio métrico compacto, $A \subset \mathcal{C}^0(K, \mathbb{R}),$ es decir, $A$ es un conjunto de funciones continuas que transforma valores en $K$ en valores reales. Supondremos también que $A$ satisface las propiedades:

a) Para cada $\lambda, \mu \, \in \mathbb{R}$ y $f,g \in A$ se cumple que $$\lambda f + \mu g \, \in A.$$ Esto es, $A$ es cerrado bajo combinaciones lineales.

b) Para cada $f,g \in A$ se cumple que $$f \cdot g \, \in A.$$ Esto es, $A$ es cerrado bajo producto de funciones.

c) $1 \in A,$ donde $1$ es la función constante que para cada $x \in K$ asigna el valor $1.$

d) Para cualesquiera $x_1, x_2 \in K$ tales que $x_1 \neq x_2$ existe una función $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi(x_2).$

Entonces se satisface el siguiente:

Lema 3. Si $\varphi \in \overline{A}$ entonces $|\varphi| \in \overline{A}.$

Demostración:
Sabemos que $\varphi: K \to \mathbb{R}$ es continua. Dado que $K$ es compacto, la imagen $\varphi(K)$ es compacta en $\mathbb{R}$, y por tanto es acotada, así $\varphi (K) \subset [a,b]$ para algún $a,b \in \mathbb{R}.$ Como la función valor absoluto restringida en $[a,b],$ que denotamos con $h: [a,b] \to \mathbb{R} \,$ tal que $\forall \, y \in \mathbb{R}, h(y) = |y|$ también es continua en su dominio, se sigue que la composición

$$h \circ \varphi (x)= |\varphi(x)|$$

es continua en $K$.

El siguiente diagrama muestra el comportamiento de las funciones.

Representación composición $h \circ \varphi.$

Por lo visto en la entrada tal podemos aproximar la función $h:[a,b] \to \mathbb{R}$ con polinomios de Bernstein. Sea

$$B_n(h,y)= a_0 + a_1y+…+a_ny^n$$

el polinomio de Bernstein de grado a lo más $n$ de $h$ con $y \in [a,b].$ Entonces

$$\underset{n \to \infty}{lim} \, \norm{B_n(h,y) \, – \, h}_{\infty} = 0.$$

Si $x \in K,$ $\, \varphi(x) \in [a,b].$ Evaluando el polinomio en $\varphi(x)$ tenemos:

$$B_n(h,\varphi(x))= a_0 + a_1\varphi(x)+…+a_n\varphi(x)^n.$$

De modo que la sucesión de polinomios $(B_n(h,\varphi(x)))_{n \in \mathbb{N}} \,$ converge a $h \circ \varphi = |\varphi|$ en $\mathcal{C}^0(K, \mathbb{R}).$

Veamos que cada sumando del polinomio está en $\overline{A}.$ Para ello usaremos los resultados del lema 2 visto en link.

La función constante $1 \in \overline{A},$ como $a_0 \in \mathbb{R}$ se sigue que el producto $1 \cdot a_0 = a_0 \in \overline{A}.$

Como $\varphi \in A \subset \overline{A}$ y $a_1 \in \mathbb{R}$ se sigue que el producto $a_1 \varphi \in \overline{A}.$

Como $\varphi \in A \subset \overline{A}$ entonces el producto $\varphi \cdot \varphi = \varphi ^2 \in \overline{A}.$ Como $a_2 \in \mathbb{R}$ se sigue que también $a_2 \varphi ^2 \in \overline{A}.$
.
.
.
Como $\varphi^{n-1} \in A \subset \overline{A}$ entonces el producto $\varphi^{n-1} \cdot \varphi = \varphi ^n \in \overline{A}.$ Como $a_n \in \mathbb{R}$ se sigue que el producto $a_n \varphi ^n \in \overline{A}.$

Ya que cada sumando está en $\overline{A}$ concluimos que para cada $n \in \mathbb{N}, \, B_n(h,\varphi(x)) \in \overline{A}.$ Por lo tanto $|\varphi| \in \overline{A}.$

Para finalizar esta sección veamos otro resultado.

Lema 4. Sean $\varphi, \gamma \in \overline{A}.$ Entonces las funciones

$$\text{máx}\{\varphi, \gamma\}(x):= \text{máx}\{\varphi(x), \gamma(x)\} \, \text{ y }$$

$$\text{mín}\{\varphi, \gamma\}(x):= \text{mín}\{\varphi(x), \gamma(x)\}$$

también están en $\overline{A}.$

Demostración:
Probemos que $\text{máx}\{\varphi, \gamma\}(x) \in \overline{A}.$ Nota que

$$\text{máx}\{\varphi(x), \gamma(x)\}=\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2},$$

pues en el caso en que $\varphi(x) \geq \gamma(x)$

\begin{align*}
\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2} &= \dfrac{\varphi(x)+\gamma(x)+(\varphi(x) \, – \, \gamma(x))}{2}\\
&= \dfrac{2\varphi(x)}{2}\\
&=\varphi(x)
\end{align*}

Caso $\varphi(x) \geq \gamma(x).$

Por otro lado, si $\gamma(x) \geq \varphi(x)$

\begin{align*}
\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2} &= \dfrac{\varphi(x)+\gamma(x)+(\gamma(x) \, – \, \varphi(x))}{2}\\
&= \dfrac{2\gamma(x)}{2}\\
&=\gamma(x)
\end{align*}

Ya que $\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2}$ puede verse como combinación lineal de funciones en $\overline{A}$ (por lo visto en lema 2 y lema 3) se sigue que

$\dfrac{\varphi(x)+\gamma(x)+|\varphi(x) \, – \, \gamma(x)|}{2} = \text{máx}\{\varphi(x), \gamma(x)\} \, \in \overline{A}.$

Análogamente se puede probar que se satisface la igualdad

$\text{mín}\{\varphi(x), \gamma(x)\} = \dfrac{\varphi(x)+\gamma(x)-|\varphi(x) \, – \, \gamma(x)|}{2}$

Y así la función $\, \text{mín}\{\varphi(x), \gamma(x)\} \, \in \overline{A}.$ La prueba de este hecho se dejará como ejercicio.

Más adelante…

Terminaremos con la demostración del teorema prometido. Por lo pronto sugerimos algunos ejercicios.

Tarea moral

  1. Demuestra que $\text{mín}\{\varphi(x), \gamma(x)\} = \dfrac{\varphi(x)+\gamma(x)-|\varphi(x) \, – \, \gamma(x)|}{2}.$
  2. Identifica bajo qué condiciones las siguientes familias de funciones satisfacen las hipótesis del teorema de Stone-Weierstrass:
    a) Las poligonales.
    b) Las funciones infinitamente diferenciables en $\mathbb{R}.$
    c) Las funciones Lipschitz continuas.

Enlaces

Enunciado del teorema de Stone-Weierstrass y primera parte de la demostración

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

En la entrada anterior link aprendimos que es posible acercarnos a funciones continuas que tienen su dominio en un intervalo cerrado en $\mathbb{R}.$ En esta sección probaremos que esta idea puede generalizarse en funciones cuyo dominio es un espacio métrico compacto. Presentamos el teorema y la demostración de dos lemas que usaremos para probarlo.

Teorema. Stone-Weierstrass: Sea $K$ un espacio métrico compacto. Sea $A \subset \mathcal{C}^0(K, \mathbb{R}),$ es decir, $A$ es un conjunto de funciones continuas de $K$ en $\mathbb{R}.$ Si $A$ satisface las siguientes propiedades:

a) Para cada $\lambda, \mu \, \in \mathbb{R}$ y $f,g \in A$ se cumple que $$\lambda f + \mu g \, \in A.$$ Esto es, $A$ es cerrado bajo combinaciones lineales.

b) Para cada $f,g \in A$ se cumple que $$f \cdot g \, \in A.$$ Esto es, $A$ es cerrado bajo producto de funciones.

c) $1 \in A,$ donde $1$ es la función constante que para cada $x \in K$ asigna el valor $1.$

d) Para cualesquiera $x_1, x_2 \in K$ tales que $x_1 \neq x_2$ existe una función $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi(x_2).$

Entonces $A$ es denso en $\mathcal{C}^0(K, \mathbb{R}),$ es decir, $\overline{A}=\mathcal{C}^0(K, \mathbb{R}).$

Nota que esto significa que toda función continua $f: K \to \mathbb{R}$ está en la cerradura de $A$ y por lo visto en la entrada Convergencia, tenemos que $f$ puede aproximarse con funciones en $A$ según la métrica uniforme $d_\infty.$

La demostración de este teorema se hará a través de cuatro lemas. En el primero garantizaremos la existencia de una función que tome dos valores específicos en dos puntos específicos.

Lema 1: Sean $K$ y $A$ como en las hipótesis del teorema. Dados $x_1 \neq x_2 \in K$ y $c_1, c_2 \in \mathbb{R}$ existe $f \in A$ tal que $f(x_1) = c_1$ y $f(x_2) = c_2.$

Demostración:
De acuerdo con el inciso d), existe $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi (x_2).$

Representación $\varphi \in A$ tal que $\varphi (x_1) \neq \varphi (x_2).$

Sin embargo buscamos $f$ que en $x_1$ vale específicamente $c_1$ y en $x_2$ vale $c_2.$

Representación de $f$ que en $x_1$ vale $c_1$ y en $x_2,$ $c_2.$

Veamos si dicha $f$ puede obtenerse como combinación lineal de $\varphi$ y la función constante $1,$ es decir que $f(x) = \lambda \varphi(x) + \mu 1$ para algunos $\lambda, \mu \in \mathbb{R}.$

Encontrar $\lambda$ y $\mu$ que satisfacen lo deseado equivale a resolver el sistema de ecuaciones

\begin{equation*}
\left\{
\begin{array}
\lambda \lambda \varphi(x_1) + \mu &= c_1 \\
\lambda \varphi(x_2) + \mu &= c_2
\end{array}
\right.
\end{equation*}

Según las fórmulas de Cramer para sistemas cuadrados, que pueden consultarse en Álgebra Lineal I: Determinantes en sistemas de ecuaciones lineales y regla de Cramer la solución existe y es única si y solo sí el determinante de la matriz de coeficientes dada por

\begin{equation*}
\left|
\begin{array}{cc}
\varphi(x_1) & 1 \\
\varphi(x_2) & 1
\end{array}
\right|
\end{equation*}

satisface:

\begin{equation*}
\left|
\begin{array}{cc}
\varphi(x_1) & 1 \\
\varphi(x_2) & 1
\end{array}
\right| = \varphi(x_1) \, – \, \varphi(x_2) \neq 0
\end{equation*}

Lo cual sí ocurre, pues $\varphi(x_1) \neq \varphi(x_2) \, \Rightarrow \, \varphi(x_1) \, – \, \varphi(x_2) \neq 0.$

Por lo tanto existe la solución única al sistema de ecuaciones y así existe $f \in A$ con $f(x) = \lambda \varphi(x) + \mu \,$ tal que $\, f(x_1) = c_1$ y $f(x_2) = c_2.$

Lema 2: Si $A \subset \mathcal{C}^0(K, \mathbb{R})$ es tal que tiene las propiedades a), b), c) del teorema, entonces $\overline{A}$ también las tiene.

Demostración:
a) Sean $\lambda, \mu \in \mathbb{R}$ y $\varphi, \, \gamma \in \overline{A},$ queremos probar que $\lambda \varphi + \mu \gamma$ también está en $\overline{A}.$

Como $\varphi \in \overline{A}$ entonces, por lo visto en Convergencia sabemos que existe una sucesión $(f_n)_{n \in \mathbb{N}} \,$ de elementos de $A$ tales que $f_n \to \varphi,$ es decir

\begin{align}
\underset{n \to \infty}{lim} \, f_n = \varphi.
\end{align}

De igual manera existe una sucesión $(g_n)_{n \in \mathbb{N}} \,$ de elementos de $A$ tales que $g_n \to \gamma,$ es decir

\begin{align}
\underset{n \to \infty}{lim} \, g_n = \gamma.
\end{align}

Ya que para cada $n \in \mathbb{N}$ se cumple que $\lambda f_n + \mu g_n \, \in A.$ Si demostramos que la sucesión $(\lambda f_n + \mu g_n)_{n \in \mathbb{N}} \, $ converge a $\lambda \varphi + \mu \gamma \,$ esto probaría que $ \lambda \varphi + \mu \gamma \in \overline{A}.$ Probemos que $d_\infty(\lambda f_n + \mu g_n, \, \lambda \varphi + \mu \gamma)=0.$ Sea $\varepsilon >0.$ Por 1) y 2) sabemos que existen $N_1$ y $N_2 \in \mathbb{N}$ tales que para cada $n \geq N_1,$

$$d_\infty(f_n, \varphi) < \frac{\varepsilon}{2|\lambda|}$$

Y así

\begin{align*}
\textcolor{blue}{|\lambda|d_\infty(f_n, \varphi) < \frac{\varepsilon}{2}}
\end{align*}

Y para cada $n \geq N_2,$

$$d_\infty(g_n, \gamma) < \frac{\varepsilon}{2|\mu|}$$

Y así

\begin{align*}
\textcolor{purple}{|\mu|d_\infty(g_n, \gamma) < \frac{\varepsilon}{2}}.
\end{align*}

Entonces para cada $n \geq \text{máx}\{N_1,N_2\}$ y para cada $x \in K$ tenemos:
\begin{align*}
d(\lambda f_n(x) + \mu g_n(x), \, \lambda \varphi(x) + \mu \gamma(x)) &= |\lambda f_n(x) + \mu g_n(x) \, – \, \lambda \varphi(x) \, – \, \mu \gamma(x)|\\
&= |\lambda f_n(x) \, – \, \lambda \varphi(x)+ \mu g_n(x) \, – \, \mu \gamma(x)|\\
&\leq |\lambda f_n(x) \, – \, \lambda \varphi(x)|+ |\mu g_n(x) \, – \, \mu \gamma(x)|\\
&= |\lambda|| f_n(x) \, – \, \varphi(x)|+ |\mu|| g_n(x) \, – \, \gamma(x)|\\
&\leq \textcolor{blue}{|\lambda|d_\infty(f_n,f)}+ \textcolor{purple}{|\mu|d_\infty(g_n, \gamma)}\\
&<\textcolor{blue}{\frac{\varepsilon}{2}}+\textcolor{purple}{\frac{\varepsilon}{2}}\\
&= \varepsilon.
\end{align*}

Por lo tanto $d_\infty(\lambda f_n + \mu g_n, \, \lambda \varphi + \mu \gamma)=0$ y así $(\lambda f_n + \mu g_n)_{n \in \mathbb{N}} \, \to \, \lambda \varphi + \mu \gamma$ lo que demuestra que $\lambda \varphi + \mu \gamma \, \in \overline{A}.$

b) Buscamos demostrar que para cualesquiera $\varphi, \, \gamma \in \overline{A}$ también se cumple que $\varphi \cdot \gamma \in \overline{A}.$

Ya que para cada $n \in \mathbb{N}$ se cumple que $f_n \cdot g_n \, \in A.$ Si demostramos que la sucesión $(f_n \cdot g_n)_{n \in \mathbb{N}} \, $ converge a $\varphi \cdot \gamma \,$ esto probaría que $ \varphi \cdot \gamma \in \overline{A}.$

Probemos entonces que $\, \underset{n \to \infty}{lim} \, d_\infty(f_n \cdot g_n, \, \varphi \cdot \gamma) = 0.$ Esto se logrará si conseguimos acotar el valor de $d(f_n (x) \cdot g_n(x), \, \varphi(x) \cdot \gamma(x)) \in \mathbb{R}$ para cada $x \in K.$

Dado que $\varphi, \, \gamma$ son continuas en un compacto, concluimos que son acotadas en el dominio. Así existen reales mayores que cero $M_1$ y $M_2$ tales que para cada $x \in K:$

\begin{align}
\textcolor{green}{|\varphi(x)|}&\leq \textcolor{green}{M_1}\, \, \text{ y }\\
|\gamma(x)|&\leq M_2.
\end{align}

Por otro lado, como $\underset{n \to \infty}{lim} \, g_n = \gamma,$ existe $N_3 \in \mathbb{N}$ tal que para cada $n \geq N_3, \, |g_n(x) \, – \, \gamma(x)| \leq 1.$ Entonces

\begin{align*}
&&-1 &\leq & &g_n(x) \, – \, \gamma(x)& &\leq 1\\
&\Rightarrow& -1+\gamma(x) &\leq& &g_n(x)& &\leq 1+\gamma(x)\\
&\Rightarrow& -1-M_2 \leq -1+\gamma(x) &\leq& &g_n(x)& &\leq 1+\gamma(x) \leq 1+M_2
\end{align*}

Por lo tanto si $n \geq N_3,$

\begin{align}
\textcolor{orange}{|g_n(x)|}\leq \textcolor{orange}{M_2 +1}.
\end{align}

Además, por 1) y 2) sabemos que para cada $\varepsilon >0$ existen $N_4$ y $N_5 \in \mathbb{N}$ tal que para cada $n \geq N_4$

$$\textcolor{purple}{d_\infty(f_n, \varphi) < \frac{\varepsilon}{2(M_2+1)}},$$

y para $n \geq N_5,$

$$\textcolor{magenta}{d_\infty(g_n, \gamma) < \frac{\varepsilon}{2M_1}}.$$

De lo anterior se sigue que para cada $n \geq \text{máx}\{N_3, N_4, N_5\}$

\begin{align*}
|f_n (x) \cdot g_n(x) \, – \, \varphi(x) \cdot \gamma(x)|&= |f_n (x) \cdot g_n(x) \, \textcolor{blue}{- \, \varphi(x) \cdot g_n(x)+\varphi(x) \cdot g_n(x)}- \, \varphi(x) \cdot \gamma(x)|\\
&\leq |f_n (x) \cdot g_n(x) \, – \, \varphi(x) \cdot g_n(x)|+|\varphi(x) \cdot g_n(x)- \, \varphi(x) \cdot \gamma(x)|\\
&= \textcolor{orange}{|g_n(x)|}\cdot|f_n(x) \, – \, \varphi(x)|+\textcolor{green}{|\varphi(x)|}\cdot |g_n(x)-\gamma(x)|\\
&\leq \textcolor{orange}{(M_2 +1)}\textcolor{purple}{|f_n(x) \, – \, \varphi(x)|} + \textcolor{green}{M_1} \textcolor{magenta}{|g_n(x)-\gamma(x)|}\\
&< (M_2 +1)\textcolor{purple}{\frac{\varepsilon}{2(M_2+1)}} + M_1\textcolor{magenta}{\frac{\varepsilon}{2M_1}}\\
&= \varepsilon
\end{align*}

Por lo tanto $\, \underset{n \to \infty}{lim} \, d_\infty(f_n \cdot g_n, \, \varphi \cdot \gamma) = 0$ y así $(f_n \cdot g_n)_{n \in \mathbb{N}} \, \to \, \varphi \cdot \gamma \,$ lo que demuestra que $\varphi \cdot \gamma \in \overline{A}.$

c) Dado que la función $1 \in A$ se sigue que $1 \in \overline{A}$ pues $A \subset \overline{A}.$

Más adelante…

Veremos dos lemas más que necesitamos en la demostración del teorema de Stone-Weierstrass. Por el momento sugerimos trabajar con los siguientes ejercicios para desarrollar más la idea de densidad.

Tarea moral

  1. Sea $X$ un espacio métrico y sean $Z$ y $Y$ tales que $Z \subset Y \subset X$ y $Z$ es denso en $X.$ Demuestra que $Y$ es denso en $X.$
  2. Sea $\phi: X \to Y$ continua y suprayectiva. Demuestra que si $A$ es denso en $X,$ entonces $\phi(A)$ es denso en $Y.$
  3. Antes dos definiciones:
    Un conjunto $A$ es a lo más numerable si existe una función inyectiva $f:A \to \mathbb{N}.$
    Un espacio métrico es separable si contiene un subconjunto que es a lo más numerable y denso en $X.$
    Demuestra que todo espacio métrico compacto es separable. Se recomienda tomar un conjunto finito de bolas de radio $\frac{1}{k}$ para cada $k \in \mathbb{N}$ cuya unión es $X.$

Enlaces

Polinomios de Bernstein

Por Lizbeth Fernández Villegas

$\textit{MATERIAL EN REVISIÓN}$

Introducción

Es sabido que existen funciones que no es tan sencillo evaluar en todos los puntos de su dominio. Sin embargo, cuando la función $f$ es $n-$veces derivable en un punto $a$ podemos definir polinomios de Taylor $T_{n, \, a}$ (ver entrada Cálculo Diferencial e Integral I: Polinomios de Taylor (Parte 1)). Conforme aumentamos el grado del polinomio más nos acercamos al valor real de $f,$ incluso tenemos resultados en relación al residuo de Taylor (ver Cálculo Diferencial e Integral I: Polinomios de Taylor (Parte 2). Pero, ¿qué podemos hacer ante una función que no es derivable en ningún punto? En esta sección presentaremos una forma alternativa de estimar funciones continuas, útil para aquellas en las que no podemos identificar los polinomios de Taylor, pues recordemos que la continuidad no es una condición suficiente para que una función sea derivable. Por ejemplo, la función de Weierstrass dada por $f(x)=\sum_{n=0}^{∞}a^n \cos(b^n\pi x) \ \ \
\text{con } 0<a<1 \text{ y } ab>1+\frac{3}{2}\pi, \, \, b>1 \text{ entero impar},$
es continua en $\mathbb{R}$ pero no es diferenciable en ningún punto.

La función de Weierstrass, es continua y no diferenciable en ningún punto.

Las funciones con las que nos vamos a aproximar son conocidas como polinomios de Bernstein. Una forma de entenderlos es a través de la probabilidad. A continuación presentamos ideas tomadas del artículo de la Dra. Ana Meda cuya lectura sugerimos:
Meda A. (2005) Interpolar con volados, o los Polinomios de Bernstein. Miscelánea Matemática, 41, 1-12.

Sea $f:[0,1] \to \mathbb{R}$ una función continua y $n \in \mathbb{N}$. Supón además que conocemos los valores que toma esta función en los puntos $\frac{0}{n}, \, \frac{1}{n}, \, \frac{2}{n}, \, \frac{3}{n},… $ y sea $x \in [0,1].$ Para saber cuánto vale $f$ en $x$ vamos a tomar una moneda cuya probabilidad de arrojar águila al lanzarse sea precisamente $x.$ Ahora la vamos a lanzar $n$ veces mientras registramos las veces en que salió águila. Sea $k$ ese número de resultados. Identifiquemos el valor

\begin{align}
\textcolor{blue}{f \left( \frac{k}{n} \right)}.
\end{align}

Definimos $\varphi_k:[0,1] \to \mathbb{R},$ como
\begin{align}
\textcolor{purple}{\varphi_k(x) = \binom{n}{k}x^k(1-x)^{n-k}}.
\end{align}

Con
$$\binom{n}{k}= \frac{n!}{k!(n-k)!}.$$

Corresponde a la probabilidad de que $k$ de los lanzamientos sean águila con esa moneda cargada de probabilidad $x$.

Con (1) y (2) definimos

\begin{align}
B_n(f,x)= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \, \textcolor{purple}{\binom{n}{k} x^k (1-x)^{n-k}},
\end{align}

que es la esperanza de la variable aleatoria que acabamos de describir, debido a que corresponde a la suma de los valores que toma esta variable ponderada por la probabilidad de que los tome.

A lo largo de esta entrada mostraremos formalmente que esta estimación funciona. Comenzamos diciendo qué es «acercarse mucho» a una función continua. Presentamos la definición con polinomios, pues son funciones continuas y derivables, lo cual facilita su manejo.

Definición. Función continua aproximada por polinomios. Sea $f \in \mathcal{C}^0([0,1], \mathbb{R}).$ Si para cada $\varepsilon >0$ existe un polinomio $P_{\varepsilon}:[0,1] \to \mathbb{R}$ tal que

$$\norm{f-P_{\varepsilon}}_{\infty}= \underset{x \, \in \, [0,1]}{Sup} \,\{|f(x)- P_{\varepsilon}(x)|\} < \varepsilon,$$

diremos que la función $f$ puede aproximarse por polinomios. Demostraremos que toda función continua en $\mathcal{C}^0([0,1],\mathbb{R})$ tiene esta propiedad. Específicamente, los polinomios que usaremos en esa aproximación están dados por la siguiente:

Definición. El $n-$ésimo polinomio de Bernstein. Sea $f \in \mathcal{C}^0([0,1], \mathbb{R}).$ El $n-$ésimo polinomio de Bernstein de $f$ de grado a lo más $n$ es:
$$B_n(f,x)= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \, \textcolor{purple}{\binom{n}{k} x^k (1-x)^{n-k}}.$$

Que es la igualdad (3) definida arriba.

Mostremos el $n-$ésimo polinomio de Bernstein para tres funciones particulares.

El $n-$ésimo polinomio de Bernstein para la función constante, $f(x) = 1.$

Del teorema del binomio sabemos que
$$(s+t)^n = \sum_{k=0}^{n} \binom{n}{k} s^k t^{n-k}$$

Haciendo $s=x$ y $t=1-x$ tenemos que
$$1 = \sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k}$$

Si consideramos $f(x) =1$ entonces $f \left(\frac{k}{n} \right) =1$ y así
\begin{align*}
1 &= \sum_{k=0}^{n} \textcolor{blue}{1} \, \binom{n}{k} x^k (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \textcolor{blue}{f \left(\frac{k}{n} \right)} \, \binom{n}{k} x^k (1-x)^{n-k}
\end{align*}

Por lo tanto
$$B_n(f(x)=1,x) = 1.$$

El $n-$ésimo polinomio de Bernstein para la función identidad, $f(x) = x.$

Partiendo de
$$1 = \sum_{k=0}^{n} \, \binom{n}{k} x^k (1-x)^{n-k}$$

Reemplacemos $n$ por $n-1$ y $k$ por $j$ para obtener
\begin{align}
1 = \sum_{j=0}^{n-1} \binom{n-1}{j} x^j (1-x)^{n-(1+j)}
\end{align}

El siguiente resultado será usado en el cálculo del polinomio:

\begin{align*}
\binom{n-1}{k-1}&=\frac{(n-1)!}{(k-1)!(n-k)!}\\
&=\frac{n}{n} \frac{k}{k} \frac{(n-1)!}{(k-1)!(n-k)!}\\
&=\frac{k}{n} \frac{n(n-1)!}{k (k-1)!(n-k)!}\\
&=\frac{k}{n} \frac{n!}{k!(n-k)!}\\
&=\frac{k}{n} \binom{n}{k}
\end{align*}

Por lo tanto

\begin{align}
\binom{n-1}{k-1} =\frac{k}{n} \binom{n}{k}
\end{align}

Multipliquemos por $x$ ambos lados de la igualdad (4) y apliquemos la igualdad (5) en el coeficiente para tener

$$x = \sum_{j=0}^{n-1} \frac{j+1}{n} \binom{n}{j+1} x^{j+1} (1-x)^{n-(1+j)}$$
Haciendo $k=j+1$ y usando que $f(x)=x$ entonces $f(\frac{k}{n}) = \frac{k}{n}.$ Se sigue:
\begin{align}
x &= \sum_{k=1}^{n} \textcolor{blue}{\frac{k}{n}} \binom{n}{k} x^{k} (1-x)^{n-k}\\
\nonumber &= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \binom{n}{k} x^{k} (1-x)^{n-k}\\
\end{align}

Por lo tanto
$$B_n(f(x)=x,x) = x.$$

El $n-$ésimo polinomio de Bernstein para la función identidad, $f(x) = x^2.$

Partiendo de
$$1 = \sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k}$$

Reemplacemos $n$ por $n-2$ y $k$ por $j$ para obtener

\begin{align}
1 = \sum_{j=0}^{n-2} \binom{n-2}{j} x^j (1-x)^{n-(2+j)}
\end{align}

El siguiente resultado será usado en el cálculo del polinomio:

\begin{align*}
\binom{n-2}{k-2}&=\frac{(n-2)!}{(k-2)!(n-k)!}\\
&=\frac{n}{n} \frac{n-1}{n-1} \frac{k}{k} \frac{k-1}{k-1} \frac{(n-2)!}{(k-2)!(n-k)!}\\
&=\frac{k(k-1)}{n(n-1)} \frac{n(n-1)(n-2)!}{k(k-1)(k-2)!(n-k)!}\\
&=\frac{k(k-1)}{n(n-1)} \frac{n!}{k!(n-k)!}\\
&=\frac{k(k-1)}{n(n-1)} \binom{n}{k}
\end{align*}

Por lo tanto

\begin{align}
\binom{n-2}{k-2} = \frac{k(k-1)}{n(n-1)} \binom{n}{k}
\end{align}

Multipliquemos por $x^2$ ambos lados de la igualdad (7) y apliquemos la igualdad (8) en el coeficiente para tener
$$x^2 = \sum_{j=0}^{n-2} \frac{(j+2)(j+1)}{n(n-1)} \binom{n}{j+2} x^{j+2} (1-x)^{n-(j+2)}$$
Haciendo $k=j+2$ se sigue que:
\begin{align*}
x^2 &= \sum_{k=2}^{n} \frac{k(k-1)}{n(n-1)} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \frac{k(k-1)}{n(n-1)} \binom{n}{k} x^{k} (1-x)^{n-k}\\
\end{align*}

Entonces
\begin{align}
x^2(n^2-n) = \sum_{k=0}^{n} k(k-1) \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Al dividir ambos lados de la igualdad por $n^2$ se obtiene:
\begin{align*}
\left( 1 – \frac{1}{n} \right) x^2 &= \sum_{k=0}^{n} \frac{k(k-1)}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \left( \frac{k^2}{n^2}-\frac{k}{n^2} \right) \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \frac{k^2}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k} \, – \, \sum_{k=0}^{n} \frac{k}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \left( \frac{k}{n} \right) ^2 \binom{n}{k} x^{k} (1-x)^{n-k} \, – \, \frac{1}{n}\sum_{k=0}^{n} \frac{k}{n} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \left( \frac{k}{n} \right) ^2 \binom{n}{k} x^{k} (1-x)^{n-k} \, – \, \frac{1}{n}x
\end{align*}

De modo que
\begin{align*}
\left( 1 – \frac{1}{n} \right) x^2 + \frac{1}{n}x &= \sum_{k=0}^{n} \textcolor{blue}{\left( \frac{k}{n} \right) ^2} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&= \sum_{k=0}^{n} \textcolor{blue}{f \left( \frac{k}{n} \right)} \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align*}

Por lo tanto
$$B_n(x, f(x)= x^2) = \left( 1 – \frac{1}{n} \right) x^2 + \frac{1}{n}x.$$

Ahora daremos paso al

Teorema de aproximación de Bernstein. Sea $f: [0,1] \to \mathbb{R}$ continua. Entonces la sucesión de polinomios de Bernstein para $f$ converge uniformemente a $f$ en $[0,1].$

Demostración:
Partimos de
$$1 = \sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k}$$
Al multiplicar ambos lados de la igualdad por $f(x)$ obtenemos

$$f(x) = \sum_{k=0}^{n} f(x) \binom{n}{k} x^k (1-x)^{n-k}.$$

Por lo tanto

$$f(x) – B_n(f,x) = \sum_{k=0}^{n} \left( f(x)- f \left( \frac{k}{n} \right) \right) \binom{n}{k} x^k (1-x)^{n-k}.$$

Usando la desigualdad del triángulo y el hecho de que $x \in [0,1]$ implica que $ \binom{n}{k} x^k (1-x)^{n-k}>0,$ se sigue que

\begin{align}
|f(x) – B_n(f,x)| \leq \sum_{k=0}^{n} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k}
\end{align}

Nuestra intención ahora será mostrar que cuando $n \,$ tiende a infinito esta distancia se hace muy pequeña.

Sea $\varepsilon >0.$ Como $f$ es continua en $[0,1]$ entonces es uniformemente continua, así existe $\delta >0$ tal que
\begin{align}
\textcolor{RedOrange}{\text{ si } |s-t| < \delta \text{ entonces } |f(s) \, – \, f(t)|< \frac{\varepsilon}{2}}.
\end{align}

Sea $x \in [0,1].$ Considera $n \in \mathbb{N}$ tal que
$$n \geq \text{ máx }\left\{ \frac{1}{\delta ^4}, \, \frac{\norm{f}^2_\infty}{\varepsilon^2}\right\}.$$

Separemos los elementos de $\mathbb{N} \cup \{0\}$ en dos conjuntos como sigue:

\begin{align}
I_1 &= \left\{ k \in \mathbb{N} \cup \{0\}: 0 \leq k \leq n, \, \left| \frac{k}{n} -x \right|< \left( \frac{1}{n} \right) ^{\frac{1}{4}} \right\}, \\
I_2 &=\{k \in \mathbb{N} \cup \{0\}: 0 \leq k \leq n, \, k \notin I_1\},
\end{align}

Como $n \geq \frac{1}{\delta ^{4}}$ entonces
\begin{align*}
&& n^{\frac{1}{4}} &\geq \frac{1}{\delta}\\
&\Rightarrow& \delta &\geq \left(\frac{1}{n}\right)^\frac{1}{4}
\end{align*}

De modo que si $k \in I_1$ satisface $\left| \frac{k}{n} -x \right|< \left( \frac{1}{n} \right) ^{\frac{1}{4}} \leq \delta$ y por la desigualdad (11) se cumple que

\begin{align}
\nonumber \sum_{k \in I_1}^{} \textcolor{RedOrange}{\left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right|} \binom{n}{k} x^k (1-x)^{n-k} &\leq \sum_{k \in I_1}^{} \textcolor{RedOrange}{\frac{\varepsilon}{2}} \binom{n}{k} x^k (1-x)^{n-k}\\ \nonumber
&\leq \textcolor{RedOrange}{\frac{\varepsilon}{2}} \sum_{k =0}^{\infty} \binom{n}{k} x^k (1-x)^{n-k} \\
&= \textcolor{RedOrange}{\frac{\varepsilon}{2}}.
\end{align}

En cuanto a los $k’s \in I_2$ tenemos lo siguiente:

Si $k \in I_2$ entonces
\begin{align*}
&& \left( \frac{1}{n} \right)^\frac{1}{4} & \leq \left| x \, – \, \frac{k}{n}\right| \\
&\Rightarrow& \frac{1}{n} & \leq \left| x \, – \, \frac{k}{n}\right|^4 \\
&\Rightarrow& \left( x \, – \, \frac{k}{n}\right)^{-4} &\leq n \\
&\Rightarrow& \textcolor{PineGreen}{\left( x \, – \, \frac{k}{n}\right)^{-2}} &\leq \textcolor{PineGreen}{\sqrt{n}}.
\end{align*}

Usaremos la última desigualdad al final del siguiente grupo de ecuaciones.

\begin{align}
\nonumber \sum_{k \in I_2}^{} \textcolor{YellowOrange}{\left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right|} \binom{n}{k} x^k (1-x)^{n-k} &\leq \sum_{k \in I_2}^{} \textcolor{YellowOrange}{2\norm{f}_\infty} \binom{n}{k} x^k (1-x)^{n-k}\\ \nonumber
&= \textcolor{YellowOrange}{2\norm{f}_\infty} \sum_{k \in I_2}^{} \textcolor{PineGreen}{\frac{(x \, – \, \frac{k}{n})^2}{(x \, – \, \frac{k}{n})^2}} \binom{n}{k} x^k (1-x)^{n-k} \\
&\leq \textcolor{YellowOrange}{2\norm{f}_\infty} \textcolor{PineGreen}{\sqrt{n}} \sum_{k \in I_2}^{} \textcolor{PineGreen}{\left( x \, – \, \frac{k}{n} \right)^2} \binom{n}{k} x^k (1-x)^{n-k}
\end{align}

Ahora, partiendo de $1 =\sum_{k=0}^{n} \binom{n}{k} x^k (1-x)^{n-k},$ tenemos:

\begin{align}
\nonumber && (x^2)1 &= \sum_{k=0}^{n} (x^2) \binom{n}{k} x^k (1-x)^{n-k} \\
&\Rightarrow& x^2 &= \sum_{k=0}^{n} x^2 \binom{n}{k} x^k (1-x)^{n-k}
\end{align}

Por la igualdad (9) tenemos:

\begin{align}
x^2(n^2-n) = \sum_{k=0}^{n} k(k-1) \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Partiendo de (6) se sigue:

\begin{align}
&& \nonumber (-2x)x &= \sum_{k=0}^{n} (-2x) \frac{k}{n} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&\Rightarrow& -2x^2 &= \sum_{k=0}^{n} -2 \frac{k}{n}x \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Y también que

\begin{align}
&& \nonumber (n)x &= \sum_{k=0}^{n} (n) \frac{k}{n} \binom{n}{k} x^{k} (1-x)^{n-k}\\
&\Rightarrow& nx &= \sum_{k=0}^{n} k \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Sumando (17) con (19).

\begin{align}
\nonumber && x^2(n^2-n) + nx &= \sum_{k=0}^{n} (k(k-1) + k) \binom{n}{k} x^{k} (1-x)^{n-k}\\
\nonumber &\Rightarrow& x^2(n^2-n) + nx &= \sum_{k=0}^{n} k^2 \binom{n}{k} x^{k} (1-x)^{n-k}\\
\nonumber &\Rightarrow& \left(\frac{1}{n^2}\right) (x^2(n^2-n) + nx) &= \sum_{k=0}^{n} \left(\frac{1}{n^2}\right) k^2 \binom{n}{k} x^{k} (1-x)^{n-k} \\
&\Rightarrow& \left(1 \, – \, \frac{1}{n}\right) x^2 + \frac{1}{n}x &= \sum_{k=0}^{n} \frac{k^2}{n^2} \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Ahora sumemos (16), (18) y (20) para obtener:

\begin{align}
\frac{1}{n} (x \, – \, x^2) &= \sum_{k=0}^{n} \left(x \, – \, \frac{k}{n} \right)^2 \binom{n}{k} x^{k} (1-x)^{n-k}
\end{align}

Dado que $\underset{x \, \in \, [0,1]}{\text{máx }}(x \, – \, x^2) = \frac{1}{4}$ podemos concluir que

\begin{align}
\textcolor{Cerulean}{\sum_{k=0}^{n} \left(x \, – \, \frac{k}{n} \right)^2 \binom{n}{k} x^{k} (1-x)^{n-k}} &= \frac{1}{n} (x \, – \, x^2) \textcolor{Cerulean}{\leq} \left( \frac{1}{n} \right) \left(\frac{1}{4} \right) = \textcolor{Cerulean}{\frac{1}{4n}}
\end{align}

Ya que $n \geq \frac{\norm{f}^2_\infty}{\varepsilon^2}$ podemos concluir que $\textcolor{PineGreen}{\varepsilon \sqrt{n} \geq \norm{f}_\infty.}$ Se sigue de (15) y (22) que:

\begin{align}
\nonumber \sum_{k \in I_2}^{} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k} &\leq 2 \textcolor{PineGreen}{\norm{f}_\infty} \sqrt{n} \textcolor{Cerulean}{\sum_{k \in I_2}^{} \left( x \, – \, \frac{k}{n} \right)^2 \binom{n}{k} x^k (1-x)^{n-k}}\\
\nonumber &\leq 2 \, \textcolor{PineGreen}{\varepsilon \sqrt{n}} \sqrt{n} \textcolor{Cerulean}{\frac{1}{4n}}\\
&= \frac{\varepsilon}{2}.
\end{align}

Ahora, de (14) y (23) tenemos, finalmente que

\begin{align}
\nonumber |f(x) – B_n(f,x)| &\leq \sum_{k=0}^{n} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k}\\
\nonumber &= \sum_{k \in I_1}^{} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k} + \sum_{k \in I_2}^{} \left| \left( f(x)- f \left( \frac{k}{n} \right) \right) \right| \binom{n}{k} x^k (1-x)^{n-k} \\
\nonumber &\leq \frac{\varepsilon}{2}+ \frac{\varepsilon}{2}\\
&= \varepsilon.
\end{align}

Lo cual demuestra que la sucesión de polinomios de Bernstein converge uniformemente a $f.$

Si bien, el teorema anterior aplica para funciones con dominio en $[0,1]$ se puede generalizar a cualquier intervalo cerrado en $\mathbb{R}$ según enunciamos a continuación.

Teorema. De aproximación de Weierstrass. Sea $f:[a,b] \to \mathbb{R}$ una función continua. Entonces existe una sucesión de polinomios que converge uniformemente a $f$ en $[a,b].$

Demostración:
Definimos $\rho:[0,1] \to [a,b]$ donde para cada $x \in [0,1], \, \rho(x) := (1-x)a + xb.$ En consecuencia, la función $g:= f \circ \rho$ es una función continua en $[0,1]$ y por el teorema anterior sabemos que la sucesión de polinomios de Bernstein de $g$ converge en $g,$ es decir, $B_n(g,x) \to g.$

Ahora definimos $p_n := B_n(g,x) \circ \rho ^{-1}.$ Nota que es un polinomio. Ocurre que

$\norm{p_n-f}_{\infty}:= \underset{t \, \in \, [a,b]}{\text{máx}}|p_n(t)-f(t)|= \underset{x \, \in \, [0,1]}{\text{máx}}|B_n(g,x)(x) \, – \, g(x)|= \norm{B_n(g,x) – g}_{\infty}.$

Por lo tanto se da la convergencia uniforme $p_n \to f$ en $\mathcal{C}^0[a,b].$

Más adelante…

Conoceremos condiciones bajo las que es posible acercarnos a funciones continuas que tienen su dominio en conjuntos más generales que un intervalo cerrado: los espacios compactos. Lo haremos a través del teorema de Stone-Weierstrass que enunciaremos en la siguiente sección.

Tarea moral

  1. Considera la función $\varphi_k$ definida en (2). Demuestra que $\varphi_k$ alcanza su máximo en el punto $\frac{k}{n}.$
  2. Desarrolla las funciones $\varphi_k$ para $k= 0, \, 1, \, 2$ para $n = 2.$
  3. Considera la función $f:[0,1] \to \mathbb{R}$ dada por $f(x) = sen( \pi x).$ Grafica los polinomios de Bernstein de $f$ para $n= 1, \, 2, \, 4, \, 8.$ Visualiza la gráfica para $f.$

Enlaces