Archivo de la categoría: Sin clasificar

Ejemplos – Teorema de Fubini

Por César Mendoza

Introducción

En esta entrada veremos varios ejemplos relacionados con el teorema de Fubini.

La condición de integrabilidad es necesaria en el Teorema de Fubini

En general, no podemos relajar las hipótesis de positividad o integrabilidad en el Teorema de Fubini. Veamos un ejemplo concreto.

Ejemplo. Consideremos $Q=(0,\infty)\times(0,\infty) $. Definamos $R\subseteq Q$ como la región acotada por las rectas $y=x$ y $y=x-1$, y $S\subseteq Q$ la región acotada por las rectas $y=x-1$, $y=x-2$ como se observa en la figura. Claramente $\lambda(R),\lambda(S)=\infty$.

Sea $f=\chi_R-\chi_S$. Ésta NO es una función integrable pues $f_+=\chi_R$ $\implies$ $\int f_+ \ \mathrm{d}\lambda=\int \chi_R \ \mathrm{d}\lambda=\infty$ y de manera similar $f_-=\chi_S$ $\implies$ $\int f_- \ \mathrm{d}\lambda=\int \chi_S \ \mathrm{d}\lambda=\infty$.

Ahora, para cada $x\geq 0$ consideremos la función: $$g(x)=\int_{0}^{\infty}f(x,y) \ \mathrm{d}y.$$ Es fácil ver que:

\begin{equation*}
g(x)=
\begin{cases}
x & \text{si } 0\leq x \leq 1 \\
2-x & \text{si } 1\leq x \leq 2 \\
0 & \text{si } 2\leq x
\end{cases}
\end{equation*}

Así que $g$ es claramente medible. Además:

$$\int_0^\infty g(x) \ \mathrm{d}x=\int_0^1 x \ \mathrm{d}x+\int_1^2 (2-x) \ \mathrm{d}x=\frac{1}{2}+\frac{1}{2}=1.$$

Por otro lado, consideremos:
$$h(y)=\int_{0}^{\infty}f(x,y) \ \mathrm{d}x.$$ Es fácil ver que en $(0,\infty)$: $$h\equiv 0 \ \implies \int_0^\infty h(y) \ \mathrm{d}y =0.$$

Es decir: $$\int_0^\infty \left( \int_0^\infty f(x,y) \ \mathrm{d}y \right) \mathrm{d}x=1\neq 0=\int_0^\infty \left( \int_0^\infty f(x,y) \ \mathrm{d}x \right) \mathrm{d}y.$$
De modo que las integrales iteradas ni siquiera coinciden.

$\triangle$

Algunos ejercicios resueltos

Veamos ahora algunos ejercicios resueltos, un poco más sofisticados, en los que el teorema de Fubini juega un papel fundamental.

Ejercicio. Calcular $$\int_R 2x^2+4xy+2x+2y^2-2y \ \mathrm{d}x\mathrm{d}y.$$ Donde $R$ es el conjunto de puntos $(x,y)\in \mathbb{R}^2$ tales que $|x|+|y|\leq 1$.

Solución. La región $R$ es un rombo con vértices $(1,0),(0,1),(-1,0),(0,-1)$, que no es un producto de conjuntos, así que no podemos usar el teorema de Fubini directamente.

Conviene entonces transformar la región de integración a una región en la que sea más sencillo aplicar el teorema de Fubini. Lo más natural es hacer un cambio de variable con una rotación de $\pm \frac{\pi}{4}$, pues de esta manera $R$ se transforma en un rectángulo, aunque por simplicidad algebráica proponemos : $$u=x+y; \ \ \ \ \ v=x-y.$$ O equivalentemente \begin{equation*}\begin{pmatrix}
u \\
v
\end{pmatrix} = \begin{pmatrix}
1 & 1 \\
1 & -1
\end{pmatrix} \begin{pmatrix}
x \\
y
\end{pmatrix}=T\begin{pmatrix}
x\\
y
\end{pmatrix}. \end{equation*}

Geométricamente $T$ es una rotación con ángulo $-\frac{\pi}{4}$, compuesta con una reflexión y una dilatación. Mediante este cambio, $R$ se transforma en un rectángulo $R’$ con vértices $(1,1),(1,-1),(-1,-1),(-1,1)$, es decir $R’=[-1,1]\times[-1,1]$.

Como $|\det T|=2$, se sigue por el teorema de cambio de variable y el teorema de Fubini:

\begin{align*}
\int_R 2x^2+4xy+2x+2y^2-2y \ \mathrm{d}x\mathrm{d}y &= 2\int_R (x+y)^2+(x-y) \ \mathrm{d}x\mathrm{d}y \\
&= \int_{R’} u^2+v \ \mathrm{d}u\mathrm{d}v \\
&= \int_{-1}^{1} \int_{-1}^{1} u^2+v \ \mathrm{d}u\mathrm{d}v \\
&= \int_{-1}^{1} \left[\frac{u^3}{3}\right]_{u=-1}^{u=1}+(1-(-1))v \ \mathrm{d}v \\
&= \int_{-1}^1 \frac{2}{3}+2v \ \mathrm{d}v \\
&= (1-(-1))\frac{2}{3}+2\left[\frac{v^2}{2} \right]_{v=-1}^{v=1} \\
&= \frac{4}{3}.
\end{align*}

$\triangle$

Ejercicio (Integral Gaussiana). Demuestra que $$\int_{\mathbb{R}^n} e^{-|x|^2} \ \mathrm{d}x=\pi^{\frac{n}{2}}. $$

Solución. Veamos primero el caso $n=1$: $\int_{\mathbb{R}} e^{-x^2} \ \mathrm{d}x=\sqrt{\pi} $. Notemos que la función $f(x)= e^{-x^2}$ es una función par (i.e. $f(x)=f(-x)$ $\forall x\in \mathbb{R}$) y no negativa. Haciendo el cambio de variable $y=-x$, es fácil ver que $\int_{-\infty}^{0} e^{-x^2} \ \mathrm{d}x=\int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x$, de donde $\int_{-\infty}^{\infty} e^{-x^2} \ \mathrm{d}x=2\int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x$, así que basta probar que $$\int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x=\frac{\sqrt{\pi}}{2}.$$

Para esto, calculemos $$I=\int_{(0,\infty)\times(0,\infty)} xe^{-x^2(1+y^2)} \ \mathrm{d}x\mathrm{d}y.$$ De dos formas distintas usando el teorema de Fubini. Por un lado:

\begin{align*}
I &= \int_{0}^{\infty} \int_{0}^{\infty} xe^{-x^2(1+y^2)} \ \mathrm{d}x \ \mathrm{d}y \\
&= \int_{0}^{\infty} \int_{0}^{\infty} \frac{-1}{2(1+y^2)} \left( -2x(1+y^2)e^{-x^2(1+y^2)} \right) \ \mathrm{d}x \ \mathrm{d}y \\
&= \int_{0}^{\infty} \frac{-1}{2(1+y^2)} \int_{0}^{\infty} \frac{\mathrm{d}}{\mathrm{d}x} \left( e^{-x^2(1+y^2)} \right) \ \mathrm{d}x \ \mathrm{d}y \\
&= \int_{0}^{\infty} \frac{-1}{2(1+y^2)} \left( \left[ e^{-x^2(1+y^2)} \right]_{x=0}^{x=\infty} \right) \ \mathrm{d}y \\ &= \int_{0}^{\infty} \frac{-1}{2(1+y^2)} \left( 0 – 1 \right) \ \mathrm{d}y \\
&= \int_{0}^{\infty} \frac{1}{2(1+y^2)} \ \mathrm{d}y \\
&= \frac{1}{2} \int_{0}^{\infty} \frac{\mathrm{d}}{\mathrm{d}y}\left( \arctan(y) \right) \ \mathrm{d}y \\
&= \frac{1}{2} \left[ \arctan(y) \right]_{y=0}^{y=\infty} \\
&= \frac{1}{2}[\frac{\pi}{2}-0] \\
&= \frac{\pi}{4}
\end{align*}

En la segunda igualdad multiplicamos y dividimos por $-2(1+y^2)$ para poder escribir el integrando como una derivada. En las demás, hacemos uso del teorema fundamental del cálculo, convergencia monótona y tomamos límites (ya hemos hecho este argumento varias veces así que omitimos los detalles).

Por otro lado:

\begin{align*}
I &= \int_{0}^{\infty} \int_{0}^{\infty} xe^{-x^2}e^{-x^2y^2} \ \mathrm{d}y \ \mathrm{d}x \\
&= \int_{0}^{\infty} xe^{-x^2} \int_{0}^{\infty} e^{-x^2y^2} \ \mathrm{d}y \ \mathrm{d}x \\
\end{align*}

Haciendo el cambio de variable: $z=xy$ en la integral de en medio:

\begin{align*}
&= \int_{0}^{\infty} xe^{-x^2} \int_{0}^{\infty} \frac{1}{x} e^{-z^2} \ \mathrm{d}z \ \mathrm{d}x \\
&= \int_{0}^{\infty} e^{-x^2} \int_{0}^{\infty} e^{-z^2} \ \mathrm{d}z \ \mathrm{d}x \\
&= \left( \int_{0}^{\infty} e^{-z^2} \ \mathrm{d}z \right) \left( \int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x \right) \\
&= \left( \int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x \right)^2
\end{align*}

$$\implies I=\left( \int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x \right)^2=\frac{\pi}{4}$$ $$\implies \int_{0}^{\infty} e^{-x^2} \ \mathrm{d}x = \frac{\sqrt{\pi}}{2}.$$

Esto completa el caso $n=1$. Ahora, para el caso general, simplemente notemos que:

\begin{align*}
\int_{\mathbb{R}^n} e^{-|x|^2} \ \mathrm{d}x &= \int_{\mathbb{R}} \int_{\mathbb{R}} \dots \int_{\mathbb{R}} e^{-x_1^2}e^{-x_2^2}\dots e^{-x_n^2} \ \mathrm{d}x_n \dots \mathrm{d}x_2 \mathrm{d}x_1 \\
&= \int_{\mathbb{R}} e^{-x_1^2}\left( \int_{\mathbb{R}} e^{-x_2^2} \left( \dots \int_{\mathbb{R}} e^{-x_n^2} \ \mathrm{d}x_n \dots \right) \mathrm{d}x_2 \right) \mathrm{d}x_1 \\
&= \left( \int_{\mathbb{R}} e^{-x_1^2} \ \mathrm{d}x_1 \right)\left( \int_{\mathbb{R}} e^{-x_2^2} \ \mathrm{d}x_2 \right)\dots \left( \int_{\mathbb{R}} e^{-x_n^2} \ \mathrm{d}x_n \right) \\
&= \left( \int_{\mathbb{R}} e^{-y^2} \ \mathrm{d}y \right)^n \\
&= \left( \sqrt{\pi} \right)^n \\
&= \pi^{\frac{n}{2}}.
\end{align*}

$\triangle$

Ejercicio. Sean $a_1,a_2,\dots,a_n>0$. Sea $J=(0,1)\times(0,1)\times \dots \times(0,1)$. Demuestra que $$\int_J\frac{1}{x_1^{a_1}+x_2^{a_2}+\dots+x_n^{a_n}} \ \mathrm{d}x<\infty \ \iff \ \sum_{i=1}^{n}\frac{1}{a_i}>1.$$

Antes de proceder, usaremos un lema sencillo, consecuencia del teorema fundamental del cálculo. Omitimos la demostración.

Lema. $\int_0^1 y^{s-1} \ \mathrm{d}y<\infty$ $\iff$ $s>0$.

Solución. Para cada $1\leq i \leq n$, consideremos $G_i= \{ x\in J \ | \ x_j^{a_j}\leq x_i^{a_i} $ para todo $ j \}$. Claramente $J=\bigcup_{i=1}^{n}G_i$. Además, para $x\in G_i$ se cumple $x_i^{a_i}\leq x_1^{a_1}+x_2^{a_2}+\dots+x_n^{a_n}\leq n x_i^{a_i}$. Esto nos garantiza que:
$$\int_{G_i}\frac{1}{nx_1^{a_1}} \ \mathrm{d}x\leq \int_{G_i}\frac{1}{x_1^{a_1}+x_2^{a_2}+\dots+x_n^{a_n}} \ \mathrm{d}x \leq \int_J\frac{1}{x_1^{a_1}+x_2^{a_2}+\dots+x_n^{a_n}} \ \mathrm{d}x.$$ Y de manera similar:
$$ \int_J\frac{1}{x_1^{a_1}+x_2^{a_2}+\dots+x_n^{a_n}} \ \mathrm{d}x\leq \sum_{i=1}^{n}\int_{G_i}\frac{1}{x_1^{a_1}+x_2^{a_2}+\dots+x_n^{a_n}} \ \mathrm{d}x\leq \sum_{i=1}^{n}\int_{G_i}\frac{1}{x_i^{a_i}} \ \mathrm{d}x.$$

Ahora, para cada $i=1,\dots,n$ podemos escribir:

$$\int_{G_i}\frac{1}{x_i^{a_i}} \ \mathrm{d}x=\int_0^1 \left( \int_0^1 \dots \int_0^1 \frac{1}{x_i^{a_i}} \chi_{G_i}(x_1\dots,x_n) \ \mathrm{d}x_1\dots \mathrm{d}x_{i-1}\mathrm{d}x_{i+1}\dots \mathrm{d}x_n \right) \mathrm{d}x_i.$$

Para $x_i\in (0,1)$ fijo, en la integral de en medio, $x_1$ varía entre $0$ y $x_i^{\frac{a_i}{a_1}}$; $x_2$ varía entre $0$ y $x_i^{\frac{a_i}{a_2}}$, etc. De manera que la integral se puede reescribir como:

$$\int_0^1 \left( \int_0^{x_i^{\frac{a_i}{a_1}}}\dots \int_0^{x_i^{\frac{a_i}{a_{i-1}}}} \int_0^{x_i^{\frac{a_i}{a_{i+1}}}}\dots \int_0^{x_i^{\frac{a_i}{a_{n}}}} \frac{1}{x_i^{a_i}} \ \mathrm{d}x_1\dots \mathrm{d}x_{i-1}\mathrm{d}x_{i+1}\dots \mathrm{d}x_n \right) \mathrm{d}x_i $$

$$=\int_0^1 \frac{1}{x_i^{a_i}} \left( \int_0^{x_i^{\frac{a_i}{a_1}}}\dots \int_0^{x_i^{\frac{a_i}{a_{i-1}}}} \int_0^{x_i^{\frac{a_i}{a_{i+1}}}}\dots \int_0^{x_i^{\frac{a_i}{a_{n}}}} 1 \ \mathrm{d}x_1\dots \mathrm{d}x_{i-1}\mathrm{d}x_{i+1}\dots \mathrm{d}x_n \right) \mathrm{d}x_i $$
$$ =\int_0^1 \frac{1}{x_i^{a_i}} \left( x_i^{\frac{a_i}{a_1}} \right) \dots \left( x_i^{\frac{a_i}{a_{i-1}}} \right)\left( x_i^{\frac{a_i}{a_{i+1}}} \right)\dots \left( x_i^{\frac{a_i}{a_n}} \right) \ \mathrm{d}x_i$$
$$ =\int_0^1 x_i^{a_i\left( \sum_{j=1}^n\frac{1}{a_j}-1 \right)-1} \ \mathrm{d}x_i.$$

Por tanto, los estimados anteriores se pueden reescribir como:

$$\frac{1}{n} \int_0^1 x_1^{a_1\left( \sum_{j=1}^n\frac{1}{a_j}-1 \right)-1} \ \mathrm{d}x_1 \leq \int_J \frac{1}{x_1^{a_1}+\dots+x_n^{a_n}} \ \mathrm{d}x\leq \sum_{i=1}^{n}\int_0^1 x_i^{a_i\left( \sum_{j=1}^n\frac{1}{a_j}-1 \right)-1} \ \mathrm{d}x_i.$$

Se sigue entonces del Lema que $\int_J \frac{1}{x_1^{a_1}+\dots+x_n^{a_n}} \ \mathrm{d}x<\infty$ $\iff$ $\sum_{j=1}^n\frac{1}{a_j}-1>0$ $\iff$ $\sum_{j=1}^n\frac{1}{a_j}>1$.

$\triangle$

Más adelante…

Daremos finalmente una prueba del Teorema de Fubini-Tonelli.

Tarea moral

  • Sea $R$ la región delimitada por las rectas $x+y=0$, $x+y=2$, $2x-y=0$ y $2x-y=3$. Calcula $$\int (2x+y) \ \mathrm{d}x\mathrm{d}y .$$ [SUGERENCIA: Utiliza el cambio de variable $u=x+y$, $v=2x-y$].
  • Sea $D=\{ (x,y)\in \mathbb{R}^2 \ | \ 0 \leq x \leq y \leq 1 \}.$ Calcula $$\int_D \frac{y}{x^2+y^2} \ \mathrm{d}x\mathrm{d}y.$$
  • Sean $a,b>0$. Prueba que $$\int_{0}^{\infty}\frac{e^{-ax}-e^{-bx}}{x} \ \mathrm{d}x=\log \frac{b}{a}.$$ [SUGERENCIA: Calcula de dos maneras la integral de $e^{-xy}$ sobre la franja $[0,\infty]\times [a,b]$].
  • (Convoluciones). La convolución de dos funciones $f,g:\mathbb{R}^n\to [-\infty,\infty]$ se define (cuando sea posible) como la función: $$(f*g)(x)=\int_{\mathbb{R}^n} f(x-y)g(y) \ \mathrm{d}y. $$
    • Prueba que si $f$ y $g$ son medibles sobre $\mathbb{R}^n$, entonces la función $f(x-y)g(y)$ es medible sobre $\mathbb{R}^{2n}$.
    • Prueba que si $f,g\in L^1(\mathbb{R}^n)$, entonces $f(x-y)g(y)$ es integrable sobre $\mathbb{R}^{2n}$.
    • Prueba que si $f$ y $g$ son integrables, entonces la convolución está definida en casi todo punto y $(f*g)\in L^1(\mathbb{R}^n)$ con $$\int |f*g| \ \mathrm{d}\lambda\leq \left( \int |f| \ \mathrm{d}\lambda \right) \left( \int |g| \ \mathrm{d}\lambda \right) .$$
    • Si $f,g,h\in L^1(\mathbb{R}^n)$, demuestra que $$f*g=g*f$$ Y $$(f*g)*h=f*(g*h).$$ En casi todo punto.
  • (Continuación del último ejercicio). Usaremos la notación del último ejercicio resuelto.
    • Definamos $J’=((0,\infty)\times \dots \times (0,\infty))\setminus J$. Prueba que $$\int_{J’}\frac{1}{x_1^{a_1}+x_2^{a_2}+\dots + x_n^{a_n}}<\infty \ \ \ \iff \ \ \ \sum_{i=1}^{n}\frac{1}{a_i}<1.$$ [SUGERENCIA: Imita la solución del último ejercicio resuelto].
    • Demuestra que existen constantes $c_1,c_2>0$ (que dependen solamente de $n$ y $a>0$) tales que para todo $x=(x_1,\dots,x_n)\in \mathbb{R}^n$: $$c_1(|x_1|^a+\dots+|x_n|^a)\leq \|x\|^a\leq c_2 (|x_1|^a+\dots+ |x_n|^a).$$ (Abusando de la notación, $|x|$ denota la norma usual en $\mathbb{R}^n$ y $|x_k|$ la norma en $\mathbb{R}$). [SUGERENCIA: Por compacidad, la función $f(x)=\frac{\sum_{i=1}^{n}|x_i|^a}{|x|}$ alcanza un máximo y un mínimo sobre la esfera unitaria $S_{n-1}= \{x \ | \ |x|=1 \}$].
    • Utiliza los incisos anteriores para probar que $$\int_{B_1(0)}\frac{1}{|x|^a} \ \mathrm{d}x < \infty \ \ \ \iff \ \ \ a<n;$$ $$\int_{B_1(0)^c}\frac{1}{|x|^a} \ \mathrm{d}x < \infty \ \ \ \iff \ \ \ a>n.$$

Fubini sobre subconjuntos

Por César Mendoza

Introducción

Anteriormente, enunciamos el Teorema de Fubini y analizamos algunas de sus consecuencias directas. En esta entrada estudiaremos cómo el teorema de Fubini nos puede ayudar a calcular integrales sobre regiones más complicadas.

Productos de conjuntos medibles

Antes de empezar, veamos un resultado bastante intuitivo pero no trivial que será útil para justificar nuestros desarrollos más adelante.

Proposición. Sean $A\subseteq \mathbb{R}^l$ y $B\subseteq \mathbb{R}^m$. Consideremos $A\times B\subseteq \mathbb{R}^l\times \mathbb{R}^m=\mathbb{R}^n$. Si $A\in \mathcal{L}_n$ y $B\in \mathcal{L}_m$, entonces $$A\times B \in \mathcal{L}_n.$$ Y además $$\lambda(A\times B)=\lambda(A)\lambda(B).$$

Demostración. El teorema es inmediato cuando $A$ y $B$ son ambos abiertos (o ambos cerrados), pues en este caso $A\times B$ es abierto (o cerrado) y en automático medible. Más aún, por Fubini:

\begin{align*}
\lambda(A\times B) &= \int_{\mathbb{R}^n}\chi_{A\times B} (x,y) \ \mathrm{d}x \mathrm{d}y \\
&= \int_{\mathbb{R}^n}\chi_A (x) \cdot \chi_B(y) \ \mathrm{d}x \mathrm{d}y \\
&= \int_{\mathbb{R}^m}\left (\int_{\mathbb{R}^l}\chi_A (x)\cdot \chi_B(y) \ \mathrm{d}x \right) \mathrm{d}y \\
&= \int_{\mathbb{R}^m} \chi_B(y) \left (\int_{\mathbb{R}^l}\chi_A (x) \ \mathrm{d}x \right) \mathrm{d}y \\
&= \left( \int_{\mathbb{R}^l}\chi_A (x) \ \mathrm{d}x \right) \left( \int_{\mathbb{R}^m} \chi_B(y) \ \mathrm{d}x\right) \\
&= \lambda(A)\lambda(B).
\end{align*}

De hecho, este último argumento es válido siempre que $A\times B\in \mathcal{L}_n$, así que sólo necesitamos probar que $A\times B$ es medible.

Más aún, basta probar el caso en el que $A$ y $B$ son medibles y de medida finita, pues cualesquiera $A’\in \mathcal{L}_l$ y $B’\in \mathcal{L}_m$ se pueden escribir como
$$A’=\bigcup_{k=1}^{\infty} A_k; \ \ \ \ \ \ \ \ \ B’=\bigcup_{k=1}^{\infty} B_k;$$ Donde los $A_k$ y $B_k$ son conjuntos medibles de medida finita (en $\mathbb{R}^l$ y $\mathbb{R}^m$ respectivamente). Y $$A’\times B’ = \bigcup_{j,k=1}^{\infty} A_k\times B_k.$$

Supongamos entonces que $A$ y $B$ son de medida finita. Por el teorema de caracterización de conjuntos medibles, podemos encontrar subconjuntos $F_1\subseteq \mathbb{R}^l$, $F_2\subseteq \mathbb{R}^m$ cerrados y $G_1\subseteq \mathbb{R}^l$, $G_2\subseteq \mathbb{R}^m$ abiertos tales que:
$$F_1\subseteq A \subseteq G_1,$$ $$F_2\subseteq B \subseteq G_2,$$
Y: $$\lambda(G_1\setminus F_1)<\varepsilon,$$ $$\lambda(G_2\setminus F_2)<\varepsilon.$$

De manera que $F_1\times F_2$ es cerrado (en $\mathbb{R}^n$) y $G_1\times G_2$ es abierto (en $\mathbb{R}^n$), con $$F_1\times F_2 \subseteq A\times B \subseteq G_1\times G_2.$$

Ahora, notemos que

\begin{align*}
(G_1\times G_2)\setminus (F_1\times F_2) &= [(G_1\setminus F_1)\times G_2]\cup [F_1\times(G_2\setminus F_2)] \\
&\subseteq [(G_1\setminus F_1)\times G_2]\cup [G_1\times (G_2\setminus F_2)].
\end{align*}

Notemos que éste último conjunto es unión de productos de abiertos. De modo que podemoes estimar:

\begin{align*}
\lambda((G_1\times G_2)\setminus (F_1\times F_2)) &\leq \lambda([(G_1\setminus F_1)\times G_2]\cup [G_1\times (G_2\setminus F_2)]) \\
&\leq \lambda([(G_1\setminus F_1)\times G_2]) + \lambda( [G_1\times (G_2\setminus F_2)]) \\
&\leq \varepsilon \lambda(G_2)+\lambda(G_1)\varepsilon \\
&\leq \varepsilon( \lambda(B)+\varepsilon )+\varepsilon(\lambda(A)+\epsilon) \\
&= \varepsilon(\lambda(A)+\lambda(B)) +2\varepsilon ^2.
\end{align*}

En resúmen, podemos encontrar $F’=F_1\times F_2$ cerrado y $G’=G_1\times G_2$ abierto tales que $$F’\subseteq A\times B \subseteq G’$$ Y $$\lambda(G’\setminus F’)$$ Sea tan pequeño como queramos. Esto garantiza que $A\times B$ es medible (teorema de caracterización de conjuntos medibles).

$\square$

Teorema de Fubini para productos de conjuntos

Con el resultado anterior en mente, es fácil establecer una versión del teorema de Fubini para productos de conjuntos.

Teorema (Fubini para productos de conjuntos). Sean $A\in \mathcal{L}_l$ y $B\in \mathcal{L}_m$ conjuntos medibles en $\mathbb{R}^l$ y $\mathbb{R}^m$ respectivamente. Sea $f:A\times B\to [-\infty,\infty]$ una función medible que satisface cualquiera de las hipótesis del teorema de Fubini ($f\geq 0$ o $f\in L^1(A\times B)$). Entonces: $$\int_{A\times B}f(x,y) \ \mathrm{d}x\mathrm{d}y=\int_B \left( \int_A f(x,y) \ \mathrm{d}x \right) \mathrm{d}y=\int_A \left( \int_B f(x,y) \ \mathrm{d}y \right) \mathrm{d}x.$$

Demostración. Por simplicidad, probaremos solamente la primera igualdad. La segunda es completamente análoga.

Por la proposición anterior, $A\times B\in \mathcal{L}_n$ es un conjunto medible, por lo que $f\chi_{A\times B}$ es una función medible. Como $f\chi_{A\times B}\geq 0$ si $f\geq 0$ o bien $|f\chi_{A\times B}|\in L^1(\mathbb{R}^n)$ si $f\in L^1(A\times B)$, concluimos que $f\chi_{A\times B}$ satisface las hipótesis del teorema de Fubini. Luego:

\begin{align*}
\int_{A\times B}f(x,y) \ \mathrm{d}x\mathrm{d}y &= \int_{\mathbb{R}^n}f(x,y)\chi_{A\times B}(x,y) \ \mathrm{d}x \mathrm{d}y \\
&= \int_{\mathbb{R}^m} \left( \int_{\mathbb{R}^l}f(x,y)\chi_A(x)\chi_B(y) \ \mathrm{d}x \right)\mathrm{d}y \\
&=\int_{\mathbb{R}^m} \chi_B(y) \left( \int_{\mathbb{R}^l}f(x,y)\chi_A(x) \ \mathrm{d}x \right)\mathrm{d}y \\
&= \int_B \left( \int_{A}f(x,y) \ \mathrm{d}x \right)\mathrm{d}y.
\end{align*}

$\square$

Integración sobre subconjuntos

El Teorema de Fubini resulta muy útil para calcular integrales sobre regiones complejas, especialmente cuando estas pueden expresarse como productos de conjuntos o están delimitadas por funciones. Veamos algunos ejemplos sencillos.

Ejercicio. Calcular $$\int_{[0,1]\times [1,2]}x-2y \ \mathrm{d}x\mathrm{d}y.$$

Solución. Antes de aplicar el teorema de Fubini, hay que asegurarnos que la función $(x,y)\to x-2y$ es $L^1([0,1]\times [1,2])$. En este caso es sencillo:

$$|x-2y|\leq |x|+2|y|\leq (1)+2(2)\leq 5 \ \ \ \ \forall (x,y)\in [0,1]\times[1,2].$$

$$\implies \int_{[0,1]\times[1,2]}|x-2y| \ \mathrm{d}x\mathrm{d}y\leq 5\int_{[0,1]\times[1,2]}1 \ \mathrm{d}x\mathrm{d}y=5\lambda([0,1]\times[1,2])=5<\infty.$$

Así, $f\in L^1([0,1]\times [1,2])$. Entonces, aplicando el teorema de Fubini (para productos de conjuntos):

\begin{align*}
\int_{[0,1]\times [1,2]} x-2y \ \mathrm{d}x\mathrm{d}y &= \int_1^2\left( \int_0^1 x-2y \ \mathrm{d}x \right) \mathrm{d}y \\ &= \int_1^2 \left( \left[ \frac{x^2}{2}\right]_{x=0}^{x=1}-2y(1-0) \right)\mathrm{d}y \\
&= \int_1^2 \left( \frac{1}{2}-2y \right)\mathrm{d}y \\
&= \frac{1}{2}(2-1)-2\left[ \frac{y^2}{2} \right]_{y=1}^{y=2} \\
&= \frac{1}{2}-2(\frac{3}{2}) \\
&= -\frac{5}{2}.
\end{align*}

$\triangle$

Ejercicio. Sea $D=\{ (x,y)\in \mathbb{R}^2 \ | \ 0\leq y \leq x \leq 2\}$. Calcular $$\int_D \frac{y}{1+x^2} \ \mathrm{d}x\mathrm{d}y.$$

Solución. $D$ es medible al ser un conjunto compacto y $f$ es medible al ser una función continua. Por lo anterior, se sigue también que $f$ es acotada sobre $D$, digamos $\sup_D |f|\leq M$. Luego $$\int_D |f| \ \mathrm{d}\lambda\leq M\cdot \lambda(D)<\infty. $$ Concluimos que $f\in L^1(D)$. Aplicando el teorema de Fubini: $$\int_D \frac{y}{1+x^2} \ \mathrm{d}x\mathrm{d}y=\int \left( \int \frac{y}{1+x^2} \cdot \chi_D(x,y) \ \mathrm{d}y \right) \mathrm{d}x. $$

Notemos que $\chi_D(x)=\chi_{[0,2]}(x)\chi_{\{0\leq y\leq x \}}(y)$, así que lo anterior se puede escribir como $$\int \left( \int \frac{y}{1+x^2} \cdot \chi_{[0,2]}(x)\chi_{\{0\leq y\leq x \}}(y) \ \mathrm{d}y \right) \mathrm{d}x=\int \chi_{[0,2]}(x) \left( \int \frac{y}{1+x^2} \cdot\chi_{\{0\leq y\leq x \}}(y) \ \mathrm{d}y \right) \mathrm{d}x$$ $$=\int_0^2\left(\int_0^x \frac{y}{1+x^2} \ \mathrm{d}y \right) \mathrm{d}x.$$

La integral interior es: $$\int_0^x \frac{y}{1+x^2} \ \mathrm{d}y=\frac{1}{1+x^2}\int_0^x y \ \mathrm{d}y=\frac{1}{1+x^2}\left[\frac{y^2}{2} \right]_{y=0}^{y=x}=\frac{x^2}{2(1+x^2)}.$$

Por lo que la integral exterior resulta: $$\int_0^2 \frac{x^2}{2(1+x^2)} \ \mathrm{d}x=\frac{1}{2}\int_0^2\left( 1-\frac{1}{1+x^2} \right) \ \mathrm{d}x=\frac{1}{2}\left[ x-\arctan (x) \right]_{x=0}^{x=2}=\frac{1}{2}(2-\arctan(2)).$$

$\triangle$

Más adelante…

Hemos enunciado el Teorema de Fubini junto con algunas de sus consecuencias.

En la siguiente entrada veremos un par de ejercicios resueltos para ver algunas aplicaciones del teorema de Fubini.

Tarea moral

  • Sean $f:\mathbb{R}^l \to [-\infty,\infty]$ y $g:\mathbb{R}^m\to [-\infty,\infty]$ funciones medibles. Prueba que la función $h:\mathbb{R}^l\times \mathbb{R}^m\to [-\infty,\infty]$ dada por $h(x,y)=f(x)g(y)$ es una función medible. [SUGERENCIA: Basta probar por separado que $h_1(x,y)=f(x)$ y $h_2(x,y)= g(y)$ son funciones medibles. ¿Quién es $h_1^{-1}([-\infty,t])$ y $h_2^{-1}([-\infty,t])$?].
  • Sea $E\in \mathcal{L}_n$ y $f: E \to [0,\infty]$ una función medible y no negativa sobre $E$. Considera la región bajo la gráfica de $f$: $G_f=\{(x,s)\in \mathbb{R}^{n+1} \ | \ 0\leq s \leq f(x) \}$.
    • Demuestra que $G_f$ es un conjunto medible y $$\lambda(G_f)=\int_{E}f(x) \ \mathrm{d}x.$$ [SUGERENCIA: Prueba primero el caso en el que $f=\chi_A$ es una función característica. Deduce el resultado para funciones simples y finalmente para funciones no negativas en general].
  • Sea $G_f$ como en el ejercicio anterior. Si $g:G_f \to [-\infty, \infty]$ es $\geq 0$ ó $L^1$, demuestra que $$\int_{G_f} g \ \mathrm{d}\lambda = \int_E \left( \int_0^{f(x)}g(x,s) \ \mathrm{d}s \right) \mathrm{d}x.$$
  • Sea $A= \{(x,y)\in [0,1]\times [0,1] \ | \ x\leq y^2 \}$. Calcula $\lambda(A)$.
  • Sea $A$ como en el ejercicio anterior. Calcula $$\int_A (x^2+y) \ \mathrm{d}x\mathrm{d}y.$$
  • Sea $f(x,y)=\frac{x^2-y^2}{(x^2+y^2)^2}$ sobre $(0,1)\times (0,1)$. Verifica que $$\int_0^1\left( \int_0^1 f(x,y) \ \mathrm{d}x \right) \mathrm{d}y\neq \int_0^1\left( \int_0^1 f(x,y) \ \mathrm{d}y \right) \mathrm{d}x .$$ ¿Porqué esto no contradice el teorema de Fubini?

El Teorema de Fubini

Por César Mendoza

Introducción

El Teorema de Fubini es una herramienta fundamental en la teoría de integración, ya que permite descomponer integrales múltiples en integrales iteradas más simples. Este resultado no solo facilita los cálculos, sino que también tiene implicaciones teóricas de gran relevancia. En esta sección, estudiaremos su enunciado y algunas consecuencias, proporcionando una base sólida para resolver problemas más avanzados.

Notación

Antes de comenzar, conviene establecer algo de notación para simplificar los desarrollos más adelante.

En ésta y en las próximas entradas, $l,m,n\in \mathbb{N}$ denotarán enteros con $n=l+m$. Podemos expresar el producto cartesiano $$\mathbb{R}^n=\mathbb{R}^l\times \mathbb{R}^m.$$

Denotaremos a los puntos en $\mathbb{R}^n$ como $$z=(x,y)\in \mathbb{R}^l\times\mathbb{R}^m=\mathbb{R}^n,$$ donde $x\in \mathbb{R}^l$ y $y\in \mathbb{R}^m$.

Si $f$ es una función sobre $\mathbb{R}^n=\mathbb{R}^l\times\mathbb{R}^m$ y $y\in \mathbb{R}^m$, definimos la $y$-sección de $f$ sobre $\mathbb{R}^l$, $f_y:\mathbb{R}^l\to [-\infty,\infty]$ como: $$f_y(x)=f(x,y) \ \ \ \forall x\in \mathbb{R}^l.$$

Dado $A\subseteq \mathbb{R}^n$, y $y\in \mathbb{R}^m$, definimos la $y$-sección de $A$ como $$A_y=\{ x\in \mathbb{R}^l \ | \ (x,y)\in A \}\subseteq \mathbb{R}^l.$$

Para el caso de una función característica $\chi_A$, con $A\subseteq \mathbb{R}^n$, notemos que

\begin{equation*}
(\chi_A)_y(x)=
\begin{cases}
1 & \text{si } (x,y) \in A\\
0 & \text{si } (x,y) \in A^c
\end{cases}
\end{equation*}

O equivalentemente, $$(\chi_A)_y=\chi_{A_y}.$$

Dado $x\in \mathbb{R}^l$, definimos análogamente las $x$ secciones $f_x$ y $A_x$.

Motivación

Consideremos una función integrable $f:\mathbb{R}^n\to [-\infty,\infty]$. Como $f$ es medible, es natural pensar que $f_y:\mathbb{R}^l\to [-\infty,\infty]$ «herede cierta regularidad». Supongamos momentáneamente que $f_y$ es integrable para cada $y$ y definamos $$F(y)=\int_{\mathbb{R}^l} f_y(x) \ \mathrm{d}x.$$ Por la misma razón, es esperable pensar que $F$ sea una función integrable.

Intuitivamente, $F(y)$ representa la «masa acumulada» de $f$ en la sección $\mathbb{R}^l\times{ y }$, de modo que la «masa total» de $f$ (i.e. $\int_{\mathbb{R}^n}f(z) \ \mathrm{d}z$) debería ser la «suma» de las contribuciones sobre cada sección. Interpretando a la integral como una «versión continua de la suma», es esperable que:

$$\int_{\mathbb{R}^n}f(z) \ \mathrm{d}z=\int_{\mathbb{R}^m}F(y) \ \mathrm{d}y=\int_{\mathbb{R}^m}\int_{\mathbb{R}^l} f_y(x) \ \mathrm{d}x \ \mathrm{d}y .$$

Esto es precisamente lo que establece el teorema de Fubini.

Por desgracia, es fácil construir ejemplos de funciones medibles $f$, en los que $f_y$ no sea medible para todo $y$.

Ejemplo. Sea $E\subseteq \mathbb{R}^l$ cualquier conjunto no medible y $y_0\in \mathbb{R}^m$ un punto arbitrario. Consideremos $A=E\times{ y_0}\subseteq \mathbb{R}^{l+m}$ y su respectiva función característica $\chi_A$.

Al estar contenido en algún hiperplano, $A$ es un conjunto de medida cero y en automático es medible. En particular $\chi_A$ es una función medible. A pesar de esto, $$f_{y_0}=\chi_{A_{y_0}}=\chi_E.$$ NO es medible sobre $\mathbb{\mathbb{R}}^l$.

$\triangle$

El ejemplo anterior muestra que hay que tener cuidado con la regularidad de las secciones. Afortunadamente, el concepto de casi donde sea nos da una alternativa para resolver este problema como veremos a continuación.

El Teorema de Fubini

Notación. Para enfatizar el hecho de que las integrales debajo son «iteradas», a la integral de una función $f:\mathbb{R}^n=\mathbb{R}^l\times\mathbb{R}^m\to [-\infty,\infty]$, la denotaremos también por $$\int_{\mathbb{R}^n}f(x,y) \ \mathrm{d}x\mathrm{d}y:=\int_{\mathbb{R}^n}f(z) \ \mathrm{d}z.$$ Es decir, solamente reemplazamos $z$ por $(x,y)$ y $\mathrm{d}z$ por $\mathrm{d}x \mathrm{d}y$.

Teorema (Fubini-Tonelli para funciones no negativas). Sea $f:\mathbb{R}^n\to[0,\infty]$ una función medible no negativa. Entonces para c.t.p. $y\in \mathbb{R}^m$, la función $$f_y:\mathbb{R}^l\to [0,\infty]$$ Es medible sobre $\mathbb{R}^l$. Más aún, la función definida en c.t.p. $$F(y)=\int_{\mathbb{R}^l}f_y(x) \ \mathrm{d}x$$ Es medible sobre $\mathbb{R}^m$ y $$\int_{\mathbb{R}^n}f(x,y) \ \mathrm{d}x \mathrm{d}y=\int_{\mathbb{R}^m}F(y) \ \mathrm{d}y=\int_{\mathbb{R}^m}\left( \int_{\mathbb{R}^l}f(x,y) \ \mathrm{d}x\right) \ \mathrm{d}y.$$

La demostración requiere varios pasos, así que la posponemos para futuras entradas. De momento, daremos por hecho el resultado.

Veamos primero un ejemplo sencillo para ver como el teorema de Fubini simplifica en gran medida el cálculo de integrales.

Ejercicio. Calcular la integral $$\int_{(0,\infty)\times(0,\infty)} e^{-(x+y)} \ \mathrm{d}x\mathrm{d}y.$$

Solución. Por definición, queremos calcular, $$\int_{\mathbb{R}^2} e^{-(x+y)}\cdot \chi_{(0,\infty)^2}(x,y) \ \mathrm{d}x\mathrm{d}y.$$
Notemos que podemos escribir $e^{-(x+y)}\cdot \chi_{(0,\infty)^2}(x,y)=e^{-x}\chi_{(0,\infty)}(x)\cdot e^{-y}\chi_{(0,\infty)}(y)$. Ésta es una función medible y no negativa, así que podemos aplicar el teorema de Fubini:

$$\int_{(0,\infty)^2}e^{-(x+y)} \ \mathrm{d}x\mathrm{d}y=\int_{\mathbb{R}}\left( \int_{\mathbb{R}} e^{-x}\chi_{(0,\infty)}(x)\cdot e^{-y}\chi_{(0,\infty)}(y) \ \mathrm{d}x \right) \mathrm{d}y$$

Ahora, en la integral de en medio, el factor $$e^{-y}\chi_{(0,\infty)}(y)$$ NO depende del integrando $x$, así que lo podemos tomar como una constante y «sacarlo de la integral» por linealidad:

$$=\int_{\mathbb{R}} e^{-y}\chi_{(0,\infty)}(y) \left( \int_{\mathbb{R}} e^{-x}\chi_{(0,\infty)}(x) \ \mathrm{d}x \right) \mathrm{d}y$$

$$=\int_{\mathbb{R}} e^{-y}\chi_{(0,\infty)}(y) \left( \int_0^{\infty} e^{-x} \ \mathrm{d}x \right) \mathrm{d}y$$
Ahora el factor $\left( \int_0^{\infty} e^{-x} \ \mathrm{d}x \right)$ NO depende de $y$, por lo que podemos «sacarlo» de la integral por linealidad:

$$=\left( \int_0^{\infty} e^{-x} \ \mathrm{d}x \right)\left( \int_{\mathbb{R}} e^{-y}\chi_{(0,\infty)}(y) \ \mathrm{d}y \right)$$
$$=\left( \int_0^{\infty} e^{-x} \ \mathrm{d}x \right)\left( \int_0^{\infty} e^{-y} \ \mathrm{d}y \right)$$ $$=\left( \int_0^{\infty} e^{-x} \ \mathrm{d}x \right)^2$$

Abreviando el argumento que ya hemos hecho con el teorema fundamental del cálculo y el teorema de la convergencia monótona : $ \int_0^{\infty} e^{-x} \ \mathrm{d}x =\int_0^{\infty} (-e^{-x})’ \ \mathrm{d}x=[-e^{-x}]_{x=0}^{x=\infty}=1$, por lo que: $$\int_{(0,\infty)^2}e^{-(x+y)} \ \mathrm{d}x\mathrm{d}y=1^2=1.$$

$\triangle$

Teorema de Fubini para funciones $L^1$

El teorema de Fubini se puede generalizar fácilmente para funciones en $L^1$.

Teorema (Fubini para funciones $L^1(\mathbb{R}^n)$). Sea $f\in L^1(\mathbb{R}^n)$, Entonces

  1. $f_y\in L^1(\mathbb{R}^l)$ para c.t.p. $y\in \mathbb{R}^l$. En particular $$F(y)=\int_{\mathbb{R}^l}f_y(x) \ \mathrm{d}x$$ Existe para casi todo $y\in \mathbb{R}^m$.
  2. $F\in L^1(\mathbb{R}^m)$ y $$\int_{\mathbb{R}^m}F(y) \ \mathrm{d}y=\int_{\mathbb{R}^n}f(x,y) \ \mathrm{d}x\mathrm{d}y.$$

Demostración. Escribamos $f=f_+-f_-$.

Por Fubini-Tonelli se sigue que $f_{\pm,y}$ son funciones medibles en $\mathbb{R}^l$ para casi todo $y\in \mathbb{R}^m$.

$$\implies H(y):=\int_{\mathbb{R}^l}f_{+,y}(x) \ \mathrm{d}x; \ \ \ \ \ \ \ \ \ \ \ G(y):=\int_{\mathbb{R}^l}f_{-,y}(x) \ \mathrm{d}x$$ Existen en c.t.p. $y\in \mathbb{R}^m$. Además de que $$\int_{\mathbb{R}^m}H(y) \ \mathrm{d}y=\int_{\mathbb{R}^n}f_{+}(x,y) \ \mathrm{d}x\mathrm{d}y<\infty$$
Y $$\int_{\mathbb{R}^l}G(y) \ \mathrm{d}y=\int_{\mathbb{R}^n}f_{-}(x,y) \ \mathrm{d}x\mathrm{d}y<\infty.$$

Como las integrales son finitas, se sigue que $H$ y $G$ son finitas para casi todo $y\in \mathbb{R}^m$ (resultado previo). Es decir

$$\int_{\mathbb{R}^l}f_{+,y}(x) \ \mathrm{d}x<\infty;$$ $$\int_{\mathbb{R}^l}f_{-,y}(x) \ \mathrm{d}x<\infty.$$ En c.t.p. $y\in \mathbb{R}^m$. O equivalentemente, que $f_y=f_{+,y}-f_{-,y}\in L^1(\mathbb{R}^l)$ en c.t.p. $y\in \mathbb{R}^m$. Ahora, para tales $y$ tenemos:

\begin{align*}
F(y) &= \int_{\mathbb{R}^l}f_{y}(x) \ \mathrm{d}x \\
&= \int_{\mathbb{R}^l}f_{+,y}(x) \ \mathrm{d}x-\int_{\mathbb{R}^l}f_{-,y}(x) \ \mathrm{d}x \\
&= H(y)-G(x)
\end{align*}

$$\therefore F\in L^1(\mathbb{R}^m)$$ Pues $F$ es igual en c.t.p. a la función $H-G\in L^1(\mathbb{R}^m)$. Además

\begin{align*}
\int_{\mathbb{R}^m}F(y) \ \mathrm{d}y &= \int_{\mathbb{R}^m}H(y) \ \mathrm{d}y-\int_{\mathbb{R}^m}G(y) \ \mathrm{d}y \\
&= \int_{\mathbb{R}^n}f_+(x,y) \ \mathrm{d}x\mathrm{d}y- \int_{\mathbb{R}^n}f_-(x,y) \ \mathrm{d}x\mathrm{d}y \\
&= \int_{\mathbb{R}^n}f(x,y) \ \mathrm{d}x\mathrm{d}y.
\end{align*}

Que es precisamente lo que queríamos probar.

$\square$

Corolario. Supongamos que $f:\mathbb{R}^n\to[-\infty,\infty]$ satisface las hipótesis del Teorema de Fubini (ya sea $f\geq 0$ ó $f\in L^1$). Entonces $$\int_{\mathbb{R}^n}f(x,y) \ \mathrm{d}x\mathrm{d}y=\int_{\mathbb{R}^m}\left( \int_{\mathbb{R}^l}f(x,y) \ \mathrm{d}x \right) \mathrm{d}y=\int_{\mathbb{R}^l}\left( \int_{\mathbb{R}^m}f(x,y) \ \mathrm{d}y \right) \mathrm{d}x.$$

Demostración. La primera igualdad es por supuesto el teorema de Fubini. La segunda igualdad no es más que el resultado de combinar el teorema de Fubini con el cambio de variable
$$(x_1,x_2,\dots,x_l,x_{l+1},\dots,x_n)\to(x_{l+1},\dots,x_n,x_1,x_2,\dots,x_l).$$

$\square$

Integrales iteradas

Mediante varias iteraciones del teorema de Fubini, una integral puede ser descompuesta en integrales iteradas de muchas formas. Por ejemplo, podemos descomponer

\begin{align*}
\int_{\mathbb{R}^n}f(z) \ \mathrm{d}z &= \int_{\mathbb{R}^{n-1}}\left(\int_{\mathbb{R}}f(x,y) \ \mathrm{d}x_1 \right)\mathrm{d}y \\
&= \int_{\mathbb{R}^{n-2}}\left( \int_{\mathbb{R}}\left(\int_{\mathbb{R}}f(x_1,x_2,y’) \ \mathrm{d}x_1 \right) \mathrm{d}x_2 \right) \mathrm{d}y’ \\
&= \dots \\
&= \int_{\mathbb{R}}\left( \int_{\mathbb{R}}\left( \dots \int_{\mathbb{R}} f(x_1,\dots,x_{n-1},x_n)
\ \mathrm{d}x_1 \right)\dots \mathrm{d}x_{n-1} \right) \mathrm{d}x_n
\end{align*}

De igual manera

\begin{align*}
\int_{\mathbb{R}^n}f(z) \ \mathrm{d}z &= \int_{\mathbb{R}}\left(\int_{\mathbb{R}^{n-1}}f(x_1,y) \ \mathrm{d}y \right)\mathrm{d}x_1 \\
&= \int_{\mathbb{R}^m}\left( \int_{\mathbb{R}^l}f(x,y) \ \mathrm{d}x \right) \mathrm{d}y \\
&= \int_{\mathbb{R}}\left( \dots \left( \int_{\mathbb{R}} f(x_1,\dots,x_n)
\ \mathrm{d}x_{\sigma(1)} \right)\dots \right) \mathrm{d}x_{\sigma(n)}
\end{align*}

Son todas descomposiciones válidas. (En este caso $\sigma$ representa una permutación cualquiera de coordenadas).

En general tenemos mucha libertad para descomponer una integral. A la hora de resolver algún problema, es conveniente buscar la descomposición que «nos brinde mayor información» o «mejor se adapte al contexto del problema».

Hasta ahora hemos estado haciendo un gran uso de los paréntesis dentro de las integrales, principalmente para enfatizar el hecho de que las integrales son iteradas. Esto no es del todo necesario y a partir de ahora trataremos de omitirlos para aligerar la notación.

Fubini ayuda a checar integrabilidad

Algo que ocurre con frecuencia es que nos interesa calcular la integral de alguna función $f$ que sólo sabemos que es medible, pero no es $\geq 0$ y no sabemos si pertenece a $L^1$. Es decir, a priori no podemos aplicar el teorema de Fubini.

La manera usual de proceder en estos casos es aplicar el teorema de Fubini a la función $|f|$ (que es no negativa). Con suerte seremos capaces de calcular o estimar: $$\int_{\mathbb{R}
^n}|f(z)| \ \mathrm{d}z=\int_{\mathbb{R}
^m}\int_{\mathbb{R}
^l} |f(x,y)| \ \mathrm{d}x\mathrm{d}y.$$
Para así asegurarnos de que $f\in L^1$ y poder usar Fubini sobre $f$.

Más adelante…

Veremos como el teorema de Fubini se especializa a productos de conjuntos, junto con algunas consecuencias.

Tarea moral

  • Calcula $$\int_{\mathbb{R}^2}\frac{1}{(x^2+1)(y^2+1)} \ \mathrm{d}x\mathrm{d}y.$$
  • Calcula $$\int_{[0,1]\times [0,\infty)}x e^{-x^2y} \ \mathrm{d}x\mathrm{d}y.$$
  • Calcula $$\int_{\mathbb{R}^n} e^{-(x_1+x_2+\dots+x_n)}\mathrm{d}x_1\mathrm{d}x_2\dots \mathrm{d}x_n.$$
  • Sean $f:\mathbb{R}^l\to [0,\infty]$ y $g: \mathbb{R}^m\to [0,\infty]$. Supón que la función $h:\mathbb{R}^n\to [0,\infty]$ dada por $h(x,y)=f(x)g(y)$ es medible (de hecho, esto siempre es cierto y es un ejercicio de la siguiente entrada). Demuestra que $$\int_{\mathbb{R}^n}h(x,y) \ \mathrm{d}x\mathrm{d}y=\left( \int_{\mathbb{R}^l} f(x) \ \mathrm{d}x \right) \left( \int_{\mathbb{R}^m} g(y) \ \mathrm{d}y \right).$$ Prueba que lo anterior también es válido si $f\in L^1(\mathbb{R}^l)$ y $g\in L^1(\mathbb{R}^m)$. [SUGERENCIA: Para la segunda parte, aplica primero el teorema de Fubini-Tonelli sobre $|f|$ y $|g|$ para asegurarte de que $h \in L^1(\mathbb{R}^n)$ y poder usar el teorema de Fubini sobre $h$].
  • Sea $f:\mathbb{R}^n\to [0,\infty)$ una función no negativa. Supón que la región bajo la gráfica de $f$, $G_f=\{(x,s)\in \mathbb{R}^n\times \mathbb{R} \ | \ 0\leq s \leq f(x)\}$, es un subconjunto medible de $\mathbb{R}^{n+1}$. Sea $g:\mathbb{R}^{n+1}\to [-\infty,\infty]$ una función medible que satisface las hipótesis del teorema de Fubini ($g\geq 0$ ó $g\in L^1(\mathbb{R}^{n+1})$). Demuestra que es posible escribir: $$\int_{G_{f}} g \ \mathrm{d}\lambda=\int_{\mathbb{R}^n}\int_0^{f(x)}g(x,s) \ \mathrm{d}s \mathrm{d}x.$$

Cambios de variable

Por César Mendoza

Introducción

En esta entrada enunciaremos y probaremos el teorema de cambio de variable lineal para integrales de Lebesgue. Éste es un análogo al cambio de variable para integrales de Riemann que nos permite transformar integrales a versiones más simples o manejables.

Cambio de variable lineal y afín

Teorema (Cambio de variable lineal). Sea $T\in M_{n\times n}(\mathbb{R})$ una matriz invertible de $n\times n$ . Para cada función $f:\mathbb{R}^n\to [-\infty,\infty]$. Consideremos $$f\circ T (x)=f(Tx).$$ Entonces:

  1. Si $f$ es medible $\implies$ $f\circ T$ es medible.
  2. Si $f\geq 0$ y $f$ es medible, entonces: $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ T \ \mathrm{d}\lambda.$$
  3. Si $f\in L^1(\mathbb{R}^n)$, entonces $f\circ T\in L^1(\mathbb{R}^n)$ y $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ T \ \mathrm{d}\lambda.$$

Demostración. Sea $A$ un conjunto medible. Notemos que $\chi_A\circ T=\chi_{T^{-1}A}$, pues $\chi_A\circ T(x)=1$ $\iff$ $T(x)\in A$ $\iff$ $x\in T^{-1}A$. Por el Teorema de invarianza de la medida de Lebesgue, se sigue que $T^{-1}A$ es un conjunto medible (en particular $\chi_A\circ T$ es medible) y además:

\begin{align*}
\int \chi_A\circ T \ \mathrm{d}\lambda &= \int \chi_{T^{-1}A} \ \mathrm{d}\lambda \\
&= \lambda(T^{-1}A) \\
&= |\det T^{-1}|\lambda(A) \\
&= \frac{1}{|\det T|} \int \chi_{A} \ \mathrm{d}\lambda.
\end{align*}

Es decir, $$\int \chi_A \ \mathrm{d}\lambda=|\det T|\int \chi_A\circ T \ \mathrm{d}\lambda.$$

Ahora, por linealidad, podemos concluir que para cualquier función simple y no negativa $s=\sum_{k=1}^{m}\alpha_k \chi_{A_k}\in S$, tenemos que $s\circ T$ es medible con $$\int s \ \mathrm{d}\lambda=|\det T|\int s\circ T \ \mathrm{d}\lambda.$$ Pues $$\int \sum_{k=1}^{m}\alpha_k \chi_{A_k} \ \mathrm{d}\lambda=|\det T|\int \sum_{k=1}^{m}\alpha_k (\chi_{A_k}\circ T) \ \mathrm{d}\lambda.$$

Para el caso general, consideremos $f\geq 0$ una función medible no negativa y $\{ s_k \}_{k=1}^{\infty}\subseteq S$ una sucesión de funciones simples tales que $s_k\uparrow f$. Es inmediato verificar que $s_k\circ T\uparrow f\circ T$, por lo que $f\circ T$ es medible al ser el límite de funciones medibles. Además, por el teorema de la convergencia monótona y el caso anterior:

\begin{align*}
\int f \ \mathrm{d}\lambda &= \lim_{k\to \infty} \int s_k \ \mathrm{d}\lambda \\
&= \lim_{k\to \infty} |\det T|\int s_k\circ T \ \mathrm{d}\lambda \\
&= |\det T| \int f\circ T \ \mathrm{d}\lambda.
\end{align*}

Finalmente, veamos el caso $f\in L^1(\mathbb{R}^n)$. Podemos escribir $f=f_+-f_-$ con $\int f_{\pm} \ \mathrm{d}\lambda<\infty$. Similarmente $f\circ T=f_+\circ T-f_-\circ T$. Por el caso anterior, tenemos: $$\int f_{\pm} \ \mathrm{d}\lambda=|\det T| \int f_{\pm}\circ T \ \mathrm{d}\lambda.$$

De donde $\int f_{\pm}\circ T \ \mathrm{d}\lambda<\infty$, es decir, $f\circ T \in L^1(\mathbb{R}^n)$. Más aún:

\begin{align*}
\int f \ \mathrm{d}\lambda &= \int f_+ \ \mathrm{d}\lambda-\int f_- \ \mathrm{d}\lambda \\
&= |\det T|
\int f_+\circ T \ \mathrm{d}\lambda-|\det T|\int f_-\circ T \ \mathrm{d}\lambda \\
&= |\det T|\left( \int f_+\circ T \ \mathrm{d}\lambda-\int f_-\circ T \ \mathrm{d}\lambda \right) \\
&= |\det T| \int f\circ T \ \mathrm{d}\lambda.
\end{align*}

$\square$

Tenemos un resultado similar para las transformaciones afínes. La demostración es casi idéntica a la del teorema anterior. Dejamos los detalles como tarea moral.

Teorema (Cambio de variable afín). Sea $G(x)=Tx+c$ una transformación afín, donde $T\in M_{n\times n}(\mathbb{R})$ es una matriz invertible de $n\times n$ y $c\in \mathbb{R}^n$ es un vector. Sea $f:\mathbb{R}^n\to [-\infty,\infty]$. Consideremos $$f\circ G (x)=f(Tx+c).$$ Entonces:

  1. Si $f$ es medible $\implies$ $f\circ G$ es medible.
  2. Si $f\geq 0$ y $f$ es medible, entonces: $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ G \ \mathrm{d}\lambda.$$
  3. Si $f\in L^1(\mathbb{R}^n)$, entonces $f\circ G\in L^1(\mathbb{R}^n)$ y $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ G \ \mathrm{d}\lambda.$$

$\square$

Podemos especializar el resultado anterior a integrales sobre subconjuntos:

Corolario (Cambio de variable afín sobre subconjuntos). Sea $G(x)=Tx+c$ una transformación afín, donde $T\in M_{n\times n}(\mathbb{R})$ es una matriz invertible de $n\times n$ y $c\in \mathbb{R}^n$ es un vector. Sea $f:E\to [-\infty,\infty]$ una función sobre un conjunto medible $E$. Consideremos $$f\circ G (x)=f(Tx+c).$$ La cual está definida en $G^{-1}(E)$. Entonces:

  1. Si $f$ es medible sobre $E$ $\implies$ $f\circ G$ es medible sobre $G^{-1}(E)$.
  2. Si $f\geq 0$ y $f$ es medible, entonces: $$\int_E f \ \mathrm{d}\lambda=|\det T|\int_{G^{-1}(E)} f\circ G \ \mathrm{d}\lambda.$$
  3. Si $f\in L^1(E)$, entonces $f\circ G\in L^1(G^{-1}(E))$ y $$\int_E f \ \mathrm{d}\lambda=|\det T|\int_{G^{-1}(E)} f\circ G \ \mathrm{d}\lambda.$$

Demostración. Por el teorema anterior, notemos que si $f$ es medible sobre $E$ $\implies$ $f\chi_E$ es medible $\implies$ $(f\chi_E)\circ G=f\circ G \cdot \chi_E\circ G=f\circ G \cdot \chi_{G^{-1}(E)}$ es medible $\implies$ $f\circ G$ es medible sobre $G^{-1}(E)$.

Si $f\geq 0$ sobre $E$, claramente $f\circ G\geq 0$ sobre $G^{-1}(E)$. Si $f\in L^1(E)$ $\implies$ $f\cdot \chi_E\in L^1(\mathbb{R}^n)$ $\implies$ $(f\cdot \chi_E)\circ G=f\circ G \cdot \chi_{G^{-1}(E)}\in L^1(\mathbb{R}^n)$ $\implies$ $f\circ G \in L^1(G^{-1}(E))$. En ambos casos:

\begin{align*}
\int_E f \ \mathrm{d}\lambda &= \int f\cdot \chi_E \ \mathrm{d}\lambda \\
&= |\det T| \int (f\cdot \chi_E)\circ G \ \mathrm{d}\lambda \\
&= |\det T| \int (f\circ G)\cdot (\chi_E\circ G) \ \mathrm{d}\lambda \\
&= |\det T| \int (f\circ G)\cdot \chi_{G^{-1}(E)} \ \mathrm{d}\lambda \\
&= |\det T| \int_{G^{-1}(E)} f\circ G \ \mathrm{d}\lambda.
\end{align*}

$\square$

El Teorema de Cambio de variable

Existe una versión más general de los resultados anteriores. La demostración es extensa así que sólo daremos la idea general. Puedes consultar la demostración completa que esbozamos aquí en (Folland, 1999). No usaremos esta versión en lo que resta del curso.

Definición. Sean $U,V\subseteq \mathbb{R}^n$ conjuntos abiertos. Decimos que $G=(g_1,\dots,g_n):U\to V$ es un difeomorfismo de clase $C^1$, si $G$ es biyectiva y $G$; $G^{-1}$ son de clase $C^1$ (es decir, funciones diferenciables con derivadas parciales continuas). Definimos el Jacobiano $J:U\to \mathbb{R}$ como la norma del determinante de la matriz jacobiana: $$J(x)=\left|\det \left[ \frac{\partial g_i}{\partial x_j} \right]\right|.$$

Teorema (Cambio de variable). Sean $U,V\subseteq \mathbb{R}^n$ abiertos y $G:U\to V$ un difeomorfismo de clase $C^1$.

  1. Si $f$ es medible sobre $V$ $\implies$ $f\circ G$ es medible sobre $V$.
  2. Si $f\geq 0$ y $f$ es medible, entonces: $$\int_V f(y) \ \mathrm{d}y=\int_{U} f\circ G(x) J(x) \ \mathrm{d}x.$$
  3. Si $f\in L^1(V)$, entonces $f\circ G \cdot J \in L^1(U)$ y $$\int_V f(y) \ \mathrm{d}y=\int_{U} f\circ G(x) J(x) \ \mathrm{d}x.$$

Idea de la demostración. La observación fundamental es que, localmente, $G$ es aproximadamente una transformación lineal (dada por su matriz jacobiana): $G(x)\approx \left[ \frac{\partial g_i}{\partial x_j} \right] x$.

Es posible probar directamente que si $N\subseteq U$ es nulo, entonces $G(N)\subseteq V$ es nulo. Esto nos permite modificar a $f$ en un conjunto de medida cero y asumir sin pérdida de generalidad que es Borel medible.

Una posible forma de proceder es probar primero que para cualquier cubo $Q$:

$$ \lambda(G(Q))\leq \int_Q J(x) \ \mathrm{d}x.$$ Esto se puede hacer diviediendo a $Q$ en cubos muy pequeños de tal manera que $G(x)\approx \left[ \frac{\partial g_i}{\partial x_j} \right] x$ en cada uno de ellos (en cierto sentido, con un error pequeño que puede ser estimado con el teorema de Taylor).

Como la desigualdad anterior es válida para cubos, entonces también se cumple para conjuntos abiertos (podemos dividir un conjunto abierto en una cantidad numerable de cubos que sólo se intersecten en las fronteras). Aproximando mediante abiertos, se sigue que la desigualdad es válida para cualquier conjunto de Borel $E$.

Mediante el argumento estandar de proposición para función característica $\implies$ proposición para función simple (linealidad) $\implies$ proposición para función $\geq 0$ (convergencia monótona), se sigue que $$ \int_V f(y) \ \mathrm{d}y\leq \int_U f\circ G (x) J(x) \ \mathrm{}dx.$$
Replicando el razonamiento anterior con $G$ reemplazado por $G^{-1}$ y por $f$ reemplazado por $f\circ G\cdot J$ y recordando que la matriz jacobiana de $G^{-1}$ es la inversa de la matriz jacobiana de $G$, se sigue: $$\int_U f\circ G (x) J(x) \ \mathrm{d}x\leq \int_V f\circ G\circ G^{-1}(y) J(G^{-1}(y))J^{-1}(G^{-1}(y)) \ \mathrm{d}y =\int_V f(y) \ \mathrm{d}y.$$

Lo que prueba la igualdad para $f\geq 0$. El caso $f\in L^1$ se sigue de escribir $f=f_+-f_-$ y aplicar el caso anterior a $f+$ y $f_-$.

$\square$

Algunos comentarios y ejemplos

Comentario. Los resultados anteriores son generalizaciones de los cambios de variable para integrales de Riemann. Las reglas mnemotécnicas para efectuar los cambios de variable en integrales de Riemann generalmente también aplican para integrales de Lebesgue y a menudo son útiles para facilitar los cálculos.
Por ejemplo, supongamos que $G(x)=Tx+c$ es afín y queremos simplificar la integral

$$\int_Ff(G(x)) \ \mathrm{d}x.$$ Mediante el cambio de variable $u=G(x)$. Para recordar la fórmula del cambio de variable, podemos escribir simbólicamente

\begin{align*}
u &= G(x)=Tx+c \\
\implies \mathrm{d}u &= |\det T| \ \mathrm{d}x \\
\implies \frac{1}{|\det T|} \ \mathrm{d}u &= \mathrm{d}x.
\end{align*}

Esto de hecho tiene una interpretación intuitiva: Por el teorema de invarianza, al aplicar $G$ a subconjuntos pequeños (que podemos pensar como «elementos infinitesimales de volúmen» $\mathrm{d}x$), sufren una deformación que modifica su volúmen por una razón de $|\det T|$ (es decir $\mathrm{d}u = |\det T| \ \mathrm{d}x$).

Para el cambio de dominio de integración, podemos pensar que «integrar sobre $x\in F$ equivale a integrar sobre $u=G(x)\in G(F)$». Sustituyendo simbólicamente las expresiones para $G(x)$ y $\mathrm{d}x$ en la integral y cambiando el dominio: $$\int_Ff(G(x)) \ \mathrm{d}x=\int_{G(F)}f(u) \ \frac{ \mathrm{d}u}{|\det T|}=\frac{1}{|\det T|}\int_{G(F)}f(u) \ \mathrm{d}u.$$
Que es precisamente la fórmula del corolario anterior con $F=G^{-1}E$.

Comentario. La idea detrás de los cambios de variable en integrales de Lebesgue es, en general, la misma que en las integrales de Riemann: simplificar el integrando para obtener una expresión más manejable o transformar el dominio de integración en una región más sencilla (aunque la segunda idea suele aplicarse en combinación con el teorema de Fubini, como veremos más adelante).

Veamos algunos ejemplos concretos.

Ejercicio. Calcular la integral: $$\int_0^\infty \frac{1}{4x^2+6x+9} \ \mathrm{d}x.$$

Solución. Hagamos el cambio de variable $u=2x+3=G(x)$. Notemos que $G[0,\infty)=[3,\infty)$ y el determinante de la transformación lineal asociada a $G$ (i.e. $x\to 2x$) es 2. Simbólicamente: $\mathrm{d}u=2 \ \mathrm{d}x$. Luego la integral se reduce a:

\begin{align*}
\int_0^\infty \frac{1}{4x^2+6x+9} \ \mathrm{d}x
&= \int_0^\infty \frac{1}{(G(x))^2} \ \mathrm{d}x \\
&= \frac{1}{2} \int_3^\infty \frac{1}{u^2} \ \mathrm{d}u \\
&=\frac{1}{2} \lim_{N\to \infty} \int_3^N \left(-\frac{1}{u}\right)’ \ \mathrm{d}u \\
&= \frac{1}{2}\lim_{N\to \infty}\left[ -\frac{1}{u}\right]_{u=3}^{u=N} \\ &= \frac{1}{2}\lim_{N\to \infty} \left[ \frac{1}{3}-\frac{1}{N}\right] \\
&=\frac{1}{6}.
\end{align*}

$\triangle$

Los cambios de variable a menudo son muy útiles para simplificar las regiones de integración y calcular integrales, aunque posponemos un ejemplo concreto hasta no haber estudiado el Teorema de Fubini a detalle.

Otro caso en el que puede ser útil el cambio de variable es cuando tenemos integrales con dominio variable. Para analizarlas, puede ser útil reescribirlas como integrales sobre dominios «fijos».

Ejemplo. Definamos

$$P(r)=\int_{B_{r}(x_0)}f(y) \ \mathrm{d}y. $$

Donde $B_r(x_0)$ denota la bola con centro $x_0$ y radio $r$. Para cada $r$ fijo, podemos hacer el cambio de variable $$y=rz+x_0.$$ para cambiar el dominio de integración a la bola unitaria. Observa que el determinate de la tranformación $z\to rz$ es $r^n$. Luego podemos reescribir $P(r)$ como:
$$P(r)=\int_{B_{r}(x_0)}f(y) \ \mathrm{d}y=r^n\int_{B_{1}(0)}f(rz+x_0) \ \mathrm{d}z.$$

$\triangle$

Más adelante…

Introduciremos el Teorema de Fubini: Un teorema fundamental en la teoría de integración que nos permite descomponer integrales sobre $\mathbb{R}^n$ en integrales iteradas más sencillas.

Tarea moral

  • Prueba el teorema de cambio de variable afín. [SUGERENCIA: Es suficiente probar el caso en el que $G(x)=x+c$ es una traslación. Para ello, imita la demostración del teorema de cambio de variable lineal, usando la invarianza de la medida de Lebesgue bajo traslaciones].
  • Calcula $$\int_1^3 \frac{2}{2x+2} \ \mathrm{d}x.$$
  • Calcula $$\int_0^\infty e^{-x^2+6x-9} \ \mathrm{d}x.$$
  • Supón que $f:\mathbb{R}\to [-\infty,\infty]$ satisface las hipótesis del teorema de cambio de variable ($f\geq 0$ o $f\in L^1$).
    • Decimos que $f$ es par si $f(-x)=f(x)$ para todo $x\in \mathbb{R}$. Prueba que si $f$ es par, entonces $$\int_{\mathbb{R}}f \ \mathrm{d}\lambda=2\int_0^{\infty}f \ \mathrm{d}\lambda.$$
    • Decimos que $f$ es impar si $f(-x)=-f(x)$ para todo $x\in \mathbb{R}$. Prueba que si $f$ es impar, entonces $$\int_{\mathbb{R}}f \ \mathrm{d}\lambda=0.$$
      [SUGERENCIA: Considera el cambio de variable $x\to -x$].
  • Sea $f:\mathbb{R}^n\to \mathbb{R}$ una función suave (i.e. con derivadas de todos los órdenes) y de soporte compacto (el soporte de una función se define como la cerradura de $\{x \ | \ f(x)\neq 0 \}$). Prueba que $$P(r)=\int_{B_{r}(x_0)}f(y) \ \mathrm{d}y. $$ Es diferenciable y expresa la derivada como una integral. [SUGERENCIA: Cambia de variables para llevar la integral a un dominio fijo. Las hipótesis sobre $f$ garantizan que puedes intercambiar derivadas con integrales].

Referencias

Folland, Gerald B. Real analysis: modern techniques and their applications. John Wiley & Sons, 1999.

Las integrales de Riemann y Lebesgue

Por César Mendoza

Introducción

En las entradas pasadas desarrollamos una gran cantidad de resultados asociados a la integral de Lebesgue que demuestran que ésta tiene propiedades analíticas muy interesantes. Sin embargo, quedan dos preguntas importantes por responder: ¿Cuál es la relación que existe entre la noción «clásica» de integración (i.e. la integral de Riemann) y la integral de Lebesgue? ¿Cómo podemos evaluar integrales de funciones «sencillas»? (por ejemplo polinomios, funciones trigonométricas y exponenciales).

En esta entrada responderemos esa pregunta. Veremos que una función Riemann integrable es automáticamente $L^1$ y que las dos nociones de integral coinciden. Esto tiene una consecuencia importante: Si la función es Riemann integrable, podemos reducir el cálculo de la integral de Lebesgue a una integral de Riemann y usar todas las herramientas que ya conocemos de estas para calcular integrales (por ejemplo el teorema fundamental del cálculo, cambios de variable, etc.).

Breve repaso de la integral de Riemann

Una partición $P$ de un intervalo cerrado $[a,b]$ es una secuencia de puntos $a=t_0<t_1<\dots< t_k=b$. Una partición de un rectángulo cerrado $A=[a_1,b_1]\times\dots\times [a_n,b_n]$ es una colección $P=(P_1,\dots,P_n)$ donde cada $P_i$ es una partición del intervalo $[a_i,b_i]$. Si $P_i$ divide a $[a_i,b_i]$ en $l_i$ intervalos consecutivos, entonces $P=(P_1,\dots,P_n)$ divide a $A$ en $l_1\cdot l_2\cdot \dots \cdot l_n$ subrectángulos (formados por productos de subintervalos inducidos por la partición). Denotaremos a la colección de dichos subrectángulos como $R_P$.

Definimos el diámetro de una partición $P=(P_1,\dots,P_n)$ como el supremo de los diámetros de los rectángulos inducidos: $$diam(P)=\sup_{S\in R_P} \{ diam(S) \}. $$

Sea $f:A\to \mathbb{R}$ una función acotada sobre un rectángulo $A$ y $P$ una partición de $A$. Para cada subrectángulo $S\in \mathcal{R}_P$ definimos

\begin{align*}
m_S &= \inf \{ f(x) \ | \ x\in S \} \\
M_S &= \sup \{f(x) \ | \ x\in S \}.
\end{align*}

Definimos las sumas inferiores y superiores de $f$ asociadas a la partición $P$ como:
$$L(f,P)=\sum_{S\in R_P}m_s|S|; \ \ \ U(f,P)=\sum_{S\in R_P}M_s|S|.$$
Donde $|S|=\lambda(S)$ es el volúmen (o equivalentemente medida) del rectángulo $S$.

Decimos que una partición $P’=(P_1′,\dots, P_n’)$ refina a $P=(P_1,\dots, P_n)$ si $P_k\subseteq P_k’$ para cada $k=1,2,\dots,n$. (Esto es, cada subrectángulo de $P’$ está contenido en un subrectángulo de $P$).

El siguiente Lema es estándar. Omitimos la demostración, ésta puede ser consultada en la mayoría de textos.

Lema. Si $P’$ refina a $P$, entonces $$L(f,P)\leq L(f,P’)\leq U(f,P’)\leq U(f,P).$$

Decimos que una función acotada $f:A\to \mathbb{R}$ es Riemann integrable si $$\sup_P \{ L(f,P) \}=\inf_P\{ U(f,P) \}.$$

El valor común $\sup_P \{ L(f,P) \}=\inf_P\{ U(f,P) \}$ es llamado la integral de Riemann de $f$ sobre $A$ y lo denotaremos provisionalmente como $$ \int_{\mathcal{R},A} f(x) \ \mathrm{d}x.$$

Una clase importante de funciones Riemann integrables son las funciones continuas:

Proposición. Si $f$ es una función continua sobre un rectángulo $A$ entonces $f$ es Riemann integrable.

Omitimos la demostración.

Las integrales de Riemann y Lebesgue

Teorema. Sea $f$ una función acotada sobre un rectángulo $A$.

  1. Si $f$ es Riemann integrable, entonces $f\in L^1(A)$. Además $$\int_{\mathcal{R},A} f(x) \ \mathrm{d}x=\int_A f \ \mathrm{d}\lambda .$$
  2. $f$ es Riemann integrable sobre $A$ si y sólo si $D=\{ x\ | \ f \ \text{es discontinua en } x\} $ tiene medida de Lebesgue cero.

Demostración. Supongamos que $f$ es Riemann integrable. Para cada partición $P$ definamos:

$$g_P=\sum_{S\in R_P}m_S \chi_{S}; \ \ \ G_P=\sum_{S\in R_P}M_S \chi_{S}.$$

Si bien los rectángulos $S\in R_P$ no son ajenos, sólo se intersectan en conjuntos de medida cero (sus fronteras). Usando que $\lambda(S)=|S|$, concluimos facilmente:

\begin{equation} \int_A g_P \ \mathrm{d}\lambda=L(f,P); \ \ \ \int_A G_P \ \mathrm{d}\lambda= U(f,P). \end{equation}

Como $\sup_P \{ L(f,P) \}=\inf_P\{ U(f,P) \}=\int_{\mathcal{R},A} f(x) \ \mathrm{d}x$, podemos encontrar una sucesión de particiones $P_1,P_2,\dots$ tales que $L(f,P_k),U(f,P_k)\longrightarrow \int_{\mathcal{R},A} f(x) \ \mathrm{d}x$ cuando $k\longrightarrow \infty$. Por el Lema podemos suponer sin pérdida de generalidad que para cada $k=1,2,\dots$, $P_{k+1}$ refina a $P_k$ y el diámetro de $P_k$ es menor a $\frac{1}{k}$.

Consideremos $$N_k=\bigcup_{S\in R_{P_k}}\partial S, $$ (Donde $\partial A$ denota la frontera del conjunto $A$ ).

Definamos $$N=\bigcup_{k\in \mathbb{N}}N_k.$$ Es decir, $N$ es el conjunto de puntos que está en la frontera de alguno de los rectángulos inducidos por $P_k$ para algún $k$. Cada $N_k$ es un conjunto nulo (pues está contenido en una cantidad finita de hiperplanos) $\implies$ $N$ es un conjunto nulo. $(2)$

Observemos que cualquier punto $x\notin N$ está estrictamente en el interior de cada rectángulo $S\in R_{P_k}$ al que pertenece. Esto nos garantiza que $g_{P_1}(x)\leq g_{P_2}(x)\leq \dots f$ y $G_{P_1}(x)\geq G_{P_2}(x)\geq \dots f$. Pues si $x\in T\subseteq S$ con $S\in R_{P_k}; T\in R_{P_{k+1}}$, entonces $g_{P_k}(x)=m_S\leq m_T=g_{P_{k+1}}(x)\leq f(x)$ y $G_{P_k}(x)=M_S\geq M_T=G_{P_{k+1}}(x)\geq f(x)$. Además $|g_{P_k}(x)|,|G_{P_k}(x)|\leq \sup_{ A} |f|$. $(3)$

Por lo anterior, deducimos que $g_{P_k}$ es una sucesión crecieciente y acotada en c.t.p. mientras que $G_{P_k}$ es una sucesión decreciente y acotada en c.t.p. Esto garantiza que $g_{P_k}$ y $G_{P_k}$ convergen a ciertas funciones $g$ y $G$ con $g\leq f \leq G$ en c.t.p. Además, ambas sucesiones están acotadas en norma por $\sup_{A} |f|$. Se sigue del teorema de la convergencia dominada y (1) que:

$$\int_{\mathcal{R},A} f(x) \ \mathrm{d}x=\lim_{k\to \infty}L(f,P_k)=\lim_{k\to \infty} \int_A g_{P_k} \ \mathrm{d}\lambda=\int_A g \ \mathrm{d}\lambda.$$ $$\int_{\mathcal{R},A} f(x) \ \mathrm{d}x=\lim_{k\to \infty}U(f,P_k)=\lim_{k\to \infty} \int_A G_{P_k} \ \mathrm{d}\lambda=\int_A G \ \mathrm{d}\lambda.$$

Como $G-g\geq 0$ (en c.t.p.) y $\int (G-g) \ \mathrm{d}\lambda=0$, se sigue que $G=g$ en c.t.p. $\implies$ $G=f=g$ en c.t.p. $\implies$ $f$ es medible. Más aún, $f\in L^1(A)$ pues es una función medible y acotada (en c.t.p.) de $A$. Por monotonía la única posibilidad es:

\begin{equation*}
\int f \ \mathrm{d}\lambda=\int g \ \mathrm{d}\lambda=\int G \ \mathrm{d}\lambda=\int_{\mathcal{R},A} f(x) \ \mathrm{d}x.
\end{equation*}

Se sigue 1.

Veamos la dirección ($\implies$) en 2. Supongamos que $f$ es Riemann integrable. Consideremos las funciones: $$h(x)=\lim_{\delta\to 0} \inf_{|y-x|\leq \delta}f(y); \ \ \ H(x)=\lim_{\delta\to 0} \sup_{|y-x|\leq \delta}f(y).$$

$h$ y $H$ están bien definidas pues $f$ es acotada. Desentrañando las definiciones es fácil ver que $H(x)=h(x)$ si y sólo si $f$ es continua en $x$.

Usando la notación del inciso anterior, definamos $N’=N\cup \{ x \ | \ g(x)\neq G(x) \}$. Anteriormente probamos que los dos uniendos son nulos, de modo que $N’$ es nulo.

Probaremos que si $x\notin N’$ $\implies$ $H(x)=h(x)$. Esto en particular prueba que $f$ es continua en c.t.p. Sea entonces $x\in A\setminus N’$.

Sea $\varepsilon>0$. Como $\lim_{k\to \infty} g_k(x)=g(x)=G(x)=\lim_{k\to \infty} G_k(x)$, podemos encontrar una $M\in \mathbb{N}$ suficientemente grande tal que $$G_M(x)-g_M(x)<\frac{\varepsilon}{2}.$$

Sea $S$ el rectángulo inducido por $P_M$ tal que $x\in S$. Como observamos anteriormente, $x$ está en el interior de $S$, de modo que podemos encontrar $\eta>0$ suficientemente pequeño tal que $$\{y \ | \ |x-y|<\eta \}\subseteq S.$$ Luego, $\forall \delta$ con $0<\delta\leq \eta$:
$$G_M(x)= \sup_{y\in S} f(y)\geq \sup_{|y-x|\leq \delta} f(y)\geq \inf_{|y-x|\leq \delta}f(y) \geq \inf_{y\in S} f(y) = g_M(x)$$ $$\implies \sup_{|y-x|\leq \delta} f(y)- \inf_{|y-x|\leq \delta}f(y)\leq G_M(x)-g_M(x)<\varepsilon.$$ Como esto se satisface para cualquier $\varepsilon>0$, necesariamente $$h(x)=\lim_{\delta\to 0} \inf_{|y-x|\leq \delta}f(y)=\lim_{\delta\to 0} \sup_{|y-x|\leq \delta}f(y)=H(x).$$ Esto prueba la implicación ($\implies$) de 2.

La implicación ($\impliedby$) es esencialmente revertir los pasos anteriores: Tomemos una sucesión de particiones $P_1\subseteq P_2\subseteq\dots$ cuyo diámetro se haga arbitrariamente pequeño y definamos $g_k,G_k,g,G,N,h,H$ como antes (notemos que las observaciones (2) y (3) siguen siendo ciertas). En este caso como $f$ es continua en c.t.p. $\implies$ $h=H$ en c.t.p.

Afirmamos que si $H(x)=h(x)$ con $x\notin N$ $\implies$ $g(x)=G(x)$: $\ \ \ (4)$

Dado $\varepsilon>0$, por la definición de $h,H$, podemos encontrar $\delta>0$ suficientemente pequeño tal que $\sup_{|y-x|\leq \delta} f(y)-\inf_{|y-x|\leq \delta} f(y)<\varepsilon$. Como el diámetro de las particiones se vuelve arbitrariamente pequeño, podemos encontrar $P_N$ con $N$ suficientemente grande tal que $x\in S \in R_{P_N}$ y $S\subseteq \{ y \ | \ |y-x|\leq \delta \}$.

Como $x\notin N$, sabemos que $g_{P_N}(x)=m_S$, $G_{P_N}(x)=M_S$. Luego, para $k\geq N$: \begin{align*}
G_{P_k}(x)-g_{P_k}(x) &\leq G_{P_N}(x)-g_{P_N}(x) \\
&= M_S-m_S \\
&= \sup_{S} f-\inf_{S} f\\
&\leq \sup_{|y-x|\leq \delta} f(y)-\inf_{|y-x|\leq \delta} f(y) \\
&< \varepsilon.
\end{align*} Como $x\notin N$, tenemos que $g_{P_k}(x)\uparrow g(x)$; $G_{P_k}(x)\downarrow G(x)$ (ver (3) ). Esto y la desigualdad anterior implican que $g(x)=G(x)$.

Como $h=H$ en c.t.p. y $N$ es nulo, se sigue de (4) que $g=G$ en c.t.p.

Finalmente, aplicando el teorema de la convergencia dominada y (1): \begin{align*}
\lim_{k\to \infty}L(f,P_k) &= \lim_{k\to \infty} \int_A g_{P_k} \ \mathrm{d}\lambda \\
&= \int_A g \ \mathrm{d}\lambda \\
&= \int_A G \ \mathrm{d}\lambda \\
&= \lim_{k\to \infty} \int_A G_{P_k} \ \mathrm{d}\lambda \\
&= \lim_{k\to \infty}U(f,P_k)
\end{align*}(Podemos aplicar el teorema de la convergencia dominada pues todas las funciones en cuestión están dominadas por $\sup |f|$).

Por lo anterior, concluimos que $f$ es Riemann integrable.

$\square$

Cálculo de integrales

El teorema de la sección anterior nos permite reducir el cálculo de integrales de Lebesgue al cálculo de integrales de Riemann mientras las funciones sean Riemann integrables. Esto puede simplificar en gran medida los cálculos pues nos posibilita usar las herramientas conocidas para la integral de Riemann, como el teorema fundamental del cálculo, la integración por partes, los cambios de variable, entre otros.

Esto se aprecia mejor con un ejemplo.

Ejercicio. Calcular la integral de Lebesgue $$\int_0^{\infty} e^{-x} \ \mathrm{d}x.$$

Solución. La sucesión $g_N(x)=e^{-x}\chi_{[0,N]}$ es una sucesión creciente de funciones medibles positivas. Claramente $\lim_{N\to \infty} g_N(x)=e^{-x}\chi_{[0,\infty)}$. Luego, por el teorema de la convergencia monótona:

$$\int_0^{\infty}e^{-x} \ \mathrm{d}x=\lim_{N\to \infty}\int_{\mathbb{R}}g_N(x) \ \mathrm{d}x=\lim_{N\to \infty}\int_0^Ne^{-x} \ \mathrm{d}x.$$

Al ser continuas, las funciones del lado derecho son Riemann integrables sobre $[0,N]$. Por el teorema anterior, el cálculo de estas integrales (de Lebesgue) se reduce al cálculo de las integrales de Riemann, por lo que podemos usar el teorema fundamental del cálculo:

\begin{align*}
\int_0^{\infty}e^{-x} \ \mathrm{d}x &= \lim_{N\to \infty}\int_0^Ne^{-x} \ \mathrm{d}x \\ &= \lim_{N\to \infty}\int_0^N (-e^{-x})’ \ \mathrm{d}x \\ &= \lim_{N\to \infty} \left[-e^{-x} \right]_{x=0}^{x=N} \\ &= \lim_{N\to \infty} [-e^{-N}+e^0] \\ &=1-\lim_{N\to \infty} e^{-N} \\ &=1.
\end{align*}

$\triangle$

Observación. El argumento usado en el ejercicio anterior para calcular integrales sobre intervalos no acotados mediante T.F.C. es bastante común: Por ejemplo si $g’\geq 0$ (ó $g’\in L^1(\mathbb{R})$), entonces por el Teorema de la convergencia monótona (o dominada) tenemos $$\int_{-\infty}^{\infty} g'(x) \ \mathrm{d}x=\lim_{N\to \infty} \int_{-N}^{N}g'(x) \ \mathrm{d}x=\lim_{N\to \infty} [g(N)-g(-N)]=\lim_{x\to \infty}g(x)-\lim_{x\to -\infty}g(x).$$

Por brevedad, abreviaremos el argumento anterior diciendo simplemente que $$\int_{-\infty}^{\infty} g'(x) \ \mathrm{d}x= [g(x)]_{x=-\infty}^{x=\infty}=g(\infty)-g(-\infty). $$

Haremos consideraciones similares para los demás tipos de intervalos no acotados.

$\square$

El criterio del teorema anterior nos da otro argumento para ver que la función de Dirichlet no es Riemann integrable.

Ejemplo. La función de Dirichlet $\chi_{\mathbb{Q}}$ no es Riemann integrable en $[0,1]$, pues no es continua en ningún punto de este intervalo.

Ejercicio. Probar que la función $f(x)=\frac{x}{(x^2+x+1)\ln(1+x)^2}\in L^1([1,\infty))$.

Solución. Observemos primero que $f\geq 0$ en $[1,\infty)$. En vez de calcular directamente $\int_1^{\infty}f(x) \ \mathrm{d}x$, es suficiente encontrar alguna función $g\in L^1([1,\infty))$ tal que $0\leq f\leq g$. Consideremos entonces $$g(x)=\frac{1}{(x+1)(\ln (x+1))^2}.$$ Como $x+1\leq \frac{x^2+x+1}{x}$ para $x\in [0,\infty)$ $\implies$ $f\leq g$ en $[0,\infty)$. Por el teorema fundamental del cálculo:

\begin{align*}
\int_1^{\infty} g(x) \ \mathrm{d}x &= \int_1^{\infty} \frac{1}{(x+1)(\ln (x+1))^2} \ \mathrm{d}x \\
&= \int_1^{\infty} \left( -\frac{1}{\ln(x+1)} \right)’ \ \mathrm{d}x \\
&= \left[ -\frac{1}{\ln(x+1)} \right]_{x=1}^{x=\infty} \\ &= \frac{1}{\ln(2)} -\lim_{x\to \infty} \frac{1}{\ln(x+1)} \\
&= \frac{1}{\ln(2)}-0\\
&= \frac{1}{\ln(2)}<\infty.\\
\end{align*}

(En las igualdades anteriores abreviamos la aplicación del teorema de la convergencia monótona como en la observación). Finalmente $$\int_1^{\infty} f(x) \ \mathrm{d}x=\int_1^{\infty} g(x) \ \mathrm{d}x=\frac{1}{\ln(2)}<\infty.$$

$\triangle$

Más adelante…

Veremos el teorema de cambio de variable para integrales de Lebesgue. Análoga al de las integrales de Riemann, nos permite «cambiar coordenadas» en las integrales para reescribirlas de manera conveniente.

Tarea moral

  • Calcula $$\int_{-\infty}^{\infty}\frac{1}{1+x^2} \ \mathrm{d}x.$$
  • Calcula $$\int_{0}^{1} \frac{1}{\sqrt{x}} \ \mathrm{d}x.$$
  • Sea $f(x)=x^{\alpha}$.
    • Demuestra que $f\in L^1((0,1))$ $\iff$ $\alpha<1$.
    • Demuestra que $f\in L^1([1,\infty))$ $\iff$ $\alpha>1$.
  • ¿Si una función es continua en casi todo punto de $\mathbb{R}$, podemos asegurar que $f$ es continua en todo $\mathbb{R}$?
  • Sea $f:[a,b]\to \mathbb{R}$ una función monótona. Demuestra que $f$ es discontinua en a lo más una cantidad numerable de puntos. Deduce que $f$ es Riemann integrable. [SUGERENCIA: Si $f$ es discontinua en $x_0$, la única posibilidad es que $s(x_0)=\inf_{x>x_0}\{ f(x)\}-\sup_{x<x_0}\{ f(x) \}>0$. Si hay una cantidad no numerable de discontinuidades, entonces existe algún $N\in \mathbb{N}$ tal que $\{y \ | \ s(y)>\frac{1}{N} \}$ es infinito. ¿Porqué esto es imposible? ].