Introducción
En esta entrada enunciaremos y probaremos el teorema de cambio de variable lineal para integrales de Lebesgue. Éste es un análogo al cambio de variable para integrales de Riemann que nos permite transformar integrales a versiones más simples o manejables.
Cambio de variable lineal y afín
Teorema (Cambio de variable lineal). Sea $T\in M_{n\times n}(\mathbb{R})$ una matriz invertible de $n\times n$ . Para cada función $f:\mathbb{R}^n\to [-\infty,\infty]$. Consideremos $$f\circ T (x)=f(Tx).$$ Entonces:
- Si $f$ es medible $\implies$ $f\circ T$ es medible.
- Si $f\geq 0$ y $f$ es medible, entonces: $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ T \ \mathrm{d}\lambda.$$
- Si $f\in L^1(\mathbb{R}^n)$, entonces $f\circ T\in L^1(\mathbb{R}^n)$ y $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ T \ \mathrm{d}\lambda.$$
Demostración. Sea $A$ un conjunto medible. Notemos que $\chi_A\circ T=\chi_{T^{-1}A}$, pues $\chi_A\circ T(x)=1$ $\iff$ $T(x)\in A$ $\iff$ $x\in T^{-1}A$. Por el Teorema de invarianza de la medida de Lebesgue, se sigue que $T^{-1}A$ es un conjunto medible (en particular $\chi_A\circ T$ es medible) y además:
\begin{align*}
\int \chi_A\circ T \ \mathrm{d}\lambda &= \int \chi_{T^{-1}A} \ \mathrm{d}\lambda \\
&= \lambda(T^{-1}A) \\
&= |\det T^{-1}|\lambda(A) \\
&= \frac{1}{|\det T|} \int \chi_{A} \ \mathrm{d}\lambda.
\end{align*}
Es decir, $$\int \chi_A \ \mathrm{d}\lambda=|\det T|\int \chi_A\circ T \ \mathrm{d}\lambda.$$
Ahora, por linealidad, podemos concluir que para cualquier función simple y no negativa $s=\sum_{k=1}^{m}\alpha_k \chi_{A_k}\in S$, tenemos que $s\circ T$ es medible con $$\int s \ \mathrm{d}\lambda=|\det T|\int s\circ T \ \mathrm{d}\lambda.$$ Pues $$\int \sum_{k=1}^{m}\alpha_k \chi_{A_k} \ \mathrm{d}\lambda=|\det T|\int \sum_{k=1}^{m}\alpha_k (\chi_{A_k}\circ T) \ \mathrm{d}\lambda.$$
Para el caso general, consideremos $f\geq 0$ una función medible no negativa y $\{ s_k \}_{k=1}^{\infty}\subseteq S$ una sucesión de funciones simples tales que $s_k\uparrow f$. Es inmediato verificar que $s_k\circ T\uparrow f\circ T$, por lo que $f\circ T$ es medible al ser el límite de funciones medibles. Además, por el teorema de la convergencia monótona y el caso anterior:
\begin{align*}
\int f \ \mathrm{d}\lambda &= \lim_{k\to \infty} \int s_k \ \mathrm{d}\lambda \\
&= \lim_{k\to \infty} |\det T|\int s_k\circ T \ \mathrm{d}\lambda \\
&= |\det T| \int f\circ T \ \mathrm{d}\lambda.
\end{align*}
Finalmente, veamos el caso $f\in L^1(\mathbb{R}^n)$. Podemos escribir $f=f_+-f_-$ con $\int f_{\pm} \ \mathrm{d}\lambda<\infty$. Similarmente $f\circ T=f_+\circ T-f_-\circ T$. Por el caso anterior, tenemos: $$\int f_{\pm} \ \mathrm{d}\lambda=|\det T| \int f_{\pm}\circ T \ \mathrm{d}\lambda.$$
De donde $\int f_{\pm}\circ T \ \mathrm{d}\lambda<\infty$, es decir, $f\circ T \in L^1(\mathbb{R}^n)$. Más aún:
\begin{align*}
\int f \ \mathrm{d}\lambda &= \int f_+ \ \mathrm{d}\lambda-\int f_- \ \mathrm{d}\lambda \\
&= |\det T|
\int f_+\circ T \ \mathrm{d}\lambda-|\det T|\int f_-\circ T \ \mathrm{d}\lambda \\
&= |\det T|\left( \int f_+\circ T \ \mathrm{d}\lambda-\int f_-\circ T \ \mathrm{d}\lambda \right) \\
&= |\det T| \int f\circ T \ \mathrm{d}\lambda.
\end{align*}
$\square$
Tenemos un resultado similar para las transformaciones afínes. La demostración es casi idéntica a la del teorema anterior. Dejamos los detalles como tarea moral.
Teorema (Cambio de variable afín). Sea $G(x)=Tx+c$ una transformación afín, donde $T\in M_{n\times n}(\mathbb{R})$ es una matriz invertible de $n\times n$ y $c\in \mathbb{R}^n$ es un vector. Sea $f:\mathbb{R}^n\to [-\infty,\infty]$. Consideremos $$f\circ G (x)=f(Tx+c).$$ Entonces:
- Si $f$ es medible $\implies$ $f\circ G$ es medible.
- Si $f\geq 0$ y $f$ es medible, entonces: $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ G \ \mathrm{d}\lambda.$$
- Si $f\in L^1(\mathbb{R}^n)$, entonces $f\circ G\in L^1(\mathbb{R}^n)$ y $$\int f \ \mathrm{d}\lambda=|\det T|\int f\circ G \ \mathrm{d}\lambda.$$
$\square$
Podemos especializar el resultado anterior a integrales sobre subconjuntos:
Corolario (Cambio de variable afín sobre subconjuntos). Sea $G(x)=Tx+c$ una transformación afín, donde $T\in M_{n\times n}(\mathbb{R})$ es una matriz invertible de $n\times n$ y $c\in \mathbb{R}^n$ es un vector. Sea $f:E\to [-\infty,\infty]$ una función sobre un conjunto medible $E$. Consideremos $$f\circ G (x)=f(Tx+c).$$ La cual está definida en $G^{-1}(E)$. Entonces:
- Si $f$ es medible sobre $E$ $\implies$ $f\circ G$ es medible sobre $G^{-1}(E)$.
- Si $f\geq 0$ y $f$ es medible, entonces: $$\int_E f \ \mathrm{d}\lambda=|\det T|\int_{G^{-1}(E)} f\circ G \ \mathrm{d}\lambda.$$
- Si $f\in L^1(E)$, entonces $f\circ G\in L^1(G^{-1}(E))$ y $$\int_E f \ \mathrm{d}\lambda=|\det T|\int_{G^{-1}(E)} f\circ G \ \mathrm{d}\lambda.$$
Demostración. Por el teorema anterior, notemos que si $f$ es medible sobre $E$ $\implies$ $f\chi_E$ es medible $\implies$ $(f\chi_E)\circ G=f\circ G \cdot \chi_E\circ G=f\circ G \cdot \chi_{G^{-1}(E)}$ es medible $\implies$ $f\circ G$ es medible sobre $G^{-1}(E)$.
Si $f\geq 0$ sobre $E$, claramente $f\circ G\geq 0$ sobre $G^{-1}(E)$. Si $f\in L^1(E)$ $\implies$ $f\cdot \chi_E\in L^1(\mathbb{R}^n)$ $\implies$ $(f\cdot \chi_E)\circ G=f\circ G \cdot \chi_{G^{-1}(E)}\in L^1(\mathbb{R}^n)$ $\implies$ $f\circ G \in L^1(G^{-1}(E))$. En ambos casos:
\begin{align*}
\int_E f \ \mathrm{d}\lambda &= \int f\cdot \chi_E \ \mathrm{d}\lambda \\
&= |\det T| \int (f\cdot \chi_E)\circ G \ \mathrm{d}\lambda \\
&= |\det T| \int (f\circ G)\cdot (\chi_E\circ G) \ \mathrm{d}\lambda \\
&= |\det T| \int (f\circ G)\cdot \chi_{G^{-1}(E)} \ \mathrm{d}\lambda \\
&= |\det T| \int_{G^{-1}(E)} f\circ G \ \mathrm{d}\lambda.
\end{align*}
$\square$
El Teorema de Cambio de variable
Existe una versión más general de los resultados anteriores. La demostración es extensa así que sólo daremos la idea general. Puedes consultar la demostración completa que esbozamos aquí en (Folland, 1999). No usaremos esta versión en lo que resta del curso.
Definición. Sean $U,V\subseteq \mathbb{R}^n$ conjuntos abiertos. Decimos que $G=(g_1,\dots,g_n):U\to V$ es un difeomorfismo de clase $C^1$, si $G$ es biyectiva y $G$; $G^{-1}$ son de clase $C^1$ (es decir, funciones diferenciables con derivadas parciales continuas). Definimos el Jacobiano $J:U\to \mathbb{R}$ como la norma del determinante de la matriz jacobiana: $$J(x)=\left|\det \left[ \frac{\partial g_i}{\partial x_j} \right]\right|.$$
Teorema (Cambio de variable). Sean $U,V\subseteq \mathbb{R}^n$ abiertos y $G:U\to V$ un difeomorfismo de clase $C^1$.
- Si $f$ es medible sobre $V$ $\implies$ $f\circ G$ es medible sobre $V$.
- Si $f\geq 0$ y $f$ es medible, entonces: $$\int_V f(y) \ \mathrm{d}y=\int_{U} f\circ G(x) J(x) \ \mathrm{d}x.$$
- Si $f\in L^1(V)$, entonces $f\circ G \cdot J \in L^1(U)$ y $$\int_V f(y) \ \mathrm{d}y=\int_{U} f\circ G(x) J(x) \ \mathrm{d}x.$$
Idea de la demostración. La observación fundamental es que, localmente, $G$ es aproximadamente una transformación lineal (dada por su matriz jacobiana): $G(x)\approx \left[ \frac{\partial g_i}{\partial x_j} \right] x$.
Es posible probar directamente que si $N\subseteq U$ es nulo, entonces $G(N)\subseteq V$ es nulo. Esto nos permite modificar a $f$ en un conjunto de medida cero y asumir sin pérdida de generalidad que es Borel medible.
Una posible forma de proceder es probar primero que para cualquier cubo $Q$:
$$ \lambda(G(Q))\leq \int_Q J(x) \ \mathrm{d}x.$$ Esto se puede hacer diviediendo a $Q$ en cubos muy pequeños de tal manera que $G(x)\approx \left[ \frac{\partial g_i}{\partial x_j} \right] x$ en cada uno de ellos (en cierto sentido, con un error pequeño que puede ser estimado con el teorema de Taylor).
Como la desigualdad anterior es válida para cubos, entonces también se cumple para conjuntos abiertos (podemos dividir un conjunto abierto en una cantidad numerable de cubos que sólo se intersecten en las fronteras). Aproximando mediante abiertos, se sigue que la desigualdad es válida para cualquier conjunto de Borel $E$.
Mediante el argumento estandar de proposición para función característica $\implies$ proposición para función simple (linealidad) $\implies$ proposición para función $\geq 0$ (convergencia monótona), se sigue que $$ \int_V f(y) \ \mathrm{d}y\leq \int_U f\circ G (x) J(x) \ \mathrm{}dx.$$
Replicando el razonamiento anterior con $G$ reemplazado por $G^{-1}$ y por $f$ reemplazado por $f\circ G\cdot J$ y recordando que la matriz jacobiana de $G^{-1}$ es la inversa de la matriz jacobiana de $G$, se sigue: $$\int_U f\circ G (x) J(x) \ \mathrm{d}x\leq \int_V f\circ G\circ G^{-1}(y) J(G^{-1}(y))J^{-1}(G^{-1}(y)) \ \mathrm{d}y =\int_V f(y) \ \mathrm{d}y.$$
Lo que prueba la igualdad para $f\geq 0$. El caso $f\in L^1$ se sigue de escribir $f=f_+-f_-$ y aplicar el caso anterior a $f+$ y $f_-$.
$\square$
Algunos comentarios y ejemplos
Comentario. Los resultados anteriores son generalizaciones de los cambios de variable para integrales de Riemann. Las reglas mnemotécnicas para efectuar los cambios de variable en integrales de Riemann generalmente también aplican para integrales de Lebesgue y a menudo son útiles para facilitar los cálculos.
Por ejemplo, supongamos que $G(x)=Tx+c$ es afín y queremos simplificar la integral
$$\int_Ff(G(x)) \ \mathrm{d}x.$$ Mediante el cambio de variable $u=G(x)$. Para recordar la fórmula del cambio de variable, podemos escribir simbólicamente
\begin{align*}
u &= G(x)=Tx+c \\
\implies \mathrm{d}u &= |\det T| \ \mathrm{d}x \\
\implies \frac{1}{|\det T|} \ \mathrm{d}u &= \mathrm{d}x.
\end{align*}
Esto de hecho tiene una interpretación intuitiva: Por el teorema de invarianza, al aplicar $G$ a subconjuntos pequeños (que podemos pensar como «elementos infinitesimales de volúmen» $\mathrm{d}x$), sufren una deformación que modifica su volúmen por una razón de $|\det T|$ (es decir $\mathrm{d}u = |\det T| \ \mathrm{d}x$).
Para el cambio de dominio de integración, podemos pensar que «integrar sobre $x\in F$ equivale a integrar sobre $u=G(x)\in G(F)$». Sustituyendo simbólicamente las expresiones para $G(x)$ y $\mathrm{d}x$ en la integral y cambiando el dominio: $$\int_Ff(G(x)) \ \mathrm{d}x=\int_{G(F)}f(u) \ \frac{ \mathrm{d}u}{|\det T|}=\frac{1}{|\det T|}\int_{G(F)}f(u) \ \mathrm{d}u.$$
Que es precisamente la fórmula del corolario anterior con $F=G^{-1}E$.
Comentario. La idea detrás de los cambios de variable en integrales de Lebesgue es, en general, la misma que en las integrales de Riemann: simplificar el integrando para obtener una expresión más manejable o transformar el dominio de integración en una región más sencilla (aunque la segunda idea suele aplicarse en combinación con el teorema de Fubini, como veremos más adelante).
Veamos algunos ejemplos concretos.
Ejercicio. Calcular la integral: $$\int_0^\infty \frac{1}{4x^2+6x+9} \ \mathrm{d}x.$$
Solución. Hagamos el cambio de variable $u=2x+3=G(x)$. Notemos que $G[0,\infty)=[3,\infty)$ y el determinante de la transformación lineal asociada a $G$ (i.e. $x\to 2x$) es 2. Simbólicamente: $\mathrm{d}u=2 \ \mathrm{d}x$. Luego la integral se reduce a:
\begin{align*}
\int_0^\infty \frac{1}{4x^2+6x+9} \ \mathrm{d}x
&= \int_0^\infty \frac{1}{(G(x))^2} \ \mathrm{d}x \\
&= \frac{1}{2} \int_3^\infty \frac{1}{u^2} \ \mathrm{d}u \\
&=\frac{1}{2} \lim_{N\to \infty} \int_3^N \left(-\frac{1}{u}\right)’ \ \mathrm{d}u \\
&= \frac{1}{2}\lim_{N\to \infty}\left[ -\frac{1}{u}\right]_{u=3}^{u=N} \\ &= \frac{1}{2}\lim_{N\to \infty} \left[ \frac{1}{3}-\frac{1}{N}\right] \\
&=\frac{1}{6}.
\end{align*}
$\triangle$
Los cambios de variable a menudo son muy útiles para simplificar las regiones de integración y calcular integrales, aunque posponemos un ejemplo concreto hasta no haber estudiado el Teorema de Fubini a detalle.
Otro caso en el que puede ser útil el cambio de variable es cuando tenemos integrales con dominio variable. Para analizarlas, puede ser útil reescribirlas como integrales sobre dominios «fijos».
Ejemplo. Definamos
$$P(r)=\int_{B_{r}(x_0)}f(y) \ \mathrm{d}y. $$
Donde $B_r(x_0)$ denota la bola con centro $x_0$ y radio $r$. Para cada $r$ fijo, podemos hacer el cambio de variable $$y=rz+x_0.$$ para cambiar el dominio de integración a la bola unitaria. Observa que el determinate de la tranformación $z\to rz$ es $r^n$. Luego podemos reescribir $P(r)$ como:
$$P(r)=\int_{B_{r}(x_0)}f(y) \ \mathrm{d}y=r^n\int_{B_{1}(0)}f(rz+x_0) \ \mathrm{d}z.$$
$\triangle$
Más adelante…
Introduciremos el Teorema de Fubini: Un teorema fundamental en la teoría de integración que nos permite descomponer integrales sobre $\mathbb{R}^n$ en integrales iteradas más sencillas.
Tarea moral
- Prueba el teorema de cambio de variable afín. [SUGERENCIA: Es suficiente probar el caso en el que $G(x)=x+c$ es una traslación. Para ello, imita la demostración del teorema de cambio de variable lineal, usando la invarianza de la medida de Lebesgue bajo traslaciones].
- Calcula $$\int_1^3 \frac{2}{2x+2} \ \mathrm{d}x.$$
- Calcula $$\int_0^\infty e^{-x^2+6x-9} \ \mathrm{d}x.$$
- Supón que $f:\mathbb{R}\to [-\infty,\infty]$ satisface las hipótesis del teorema de cambio de variable ($f\geq 0$ o $f\in L^1$).
- Decimos que $f$ es par si $f(-x)=f(x)$ para todo $x\in \mathbb{R}$. Prueba que si $f$ es par, entonces $$\int_{\mathbb{R}}f \ \mathrm{d}\lambda=2\int_0^{\infty}f \ \mathrm{d}\lambda.$$
- Decimos que $f$ es impar si $f(-x)=-f(x)$ para todo $x\in \mathbb{R}$. Prueba que si $f$ es impar, entonces $$\int_{\mathbb{R}}f \ \mathrm{d}\lambda=0.$$
[SUGERENCIA: Considera el cambio de variable $x\to -x$].
- Sea $f:\mathbb{R}^n\to \mathbb{R}$ una función suave (i.e. con derivadas de todos los órdenes) y de soporte compacto (el soporte de una función se define como la cerradura de $\{x \ | \ f(x)\neq 0 \}$). Prueba que $$P(r)=\int_{B_{r}(x_0)}f(y) \ \mathrm{d}y. $$ Es diferenciable y expresa la derivada como una integral. [SUGERENCIA: Cambia de variables para llevar la integral a un dominio fijo. Las hipótesis sobre $f$ garantizan que puedes intercambiar derivadas con integrales].
Referencias
Folland, Gerald B. Real analysis: modern techniques and their applications. John Wiley & Sons, 1999.
