Archivo de la etiqueta: cálculo

Cálculo Diferencial e Integral III: Polinomio de Taylor para campos escalares

Por Alejandro Antonio Estrada Franco

Introducción

Una intuición que se obtiene de un primer curso de cálculo diferencial e integral es que las funciones que tienen muchas derivadas «se parecen mucho a polinomios», en el sentido de que podemos aproximarlas apropiadamente con este tipo de expresiones. Esta intuición nos las da el teorema del polinomio de Taylor. En muchas aplicaciones, es conveniente estudiar polinomios en vez de funciones en general, así que sería ideal tener una versión de este mismo resultado para cálculo de varias variables. En esta entrada recordaremos un poco del caso unidimensional y luego enunciaremos la teoría correspondiente para el polinomio de Taylor.

Recordatorio de polinomio de Taylor en $\mathbb{R}$

Recordemos qué es lo que dice el teorema del polinomio de Taylor para el caso unidimensional. Esto nos ayudará pues lo usaremos posteriormente para enunciar una versión para varias variables.

Teorema. Sea $f:S\subseteq \mathbb{R}\to \mathbb{R}$ una función y $a\in int(S)$ de tal manera que existen $f^{\prime}(a),\dots ,f^{(k)}(a)$. Sea $$a_{\ell}=\frac{f^{(\ell)}(a)}{\ell!}$$ con $0\leq \ell \leq k$ y definamos a partir de esto $$T_{k,a}(x)=a_{0}+a_{1}(x-a)+\dots +a_{k}(x-a)^k,$$

al que llamamos el polinomio de Taylor de $f$ de grado $k$ alrededor de $a$.

Entonces $$\lim_{x \to a}\frac{f(x)-T_{k,a}(x)}{(x-a)^k}=0.$$

La demostración de este teorema la puedes encontrar en la entrada El Polinomio de Taylor (Parte 1) del curso de Cálculo I. Es recomendable que consultes esta entrada para recordar todo lo referente a este tema en una variable real.

Pidiendo un poco más de regularidad, se puede estudiar el residuo $$R_{k,a}(x):=f(x)-T_{k,a}(x).$$

Por ejemplo, se puede demostrar el siguiente teorema.

Teorema. Sea $f:S\subseteq \mathbb{R}\to\mathbb{R}$. Supongamos que $f^{\prime},\dots ,f^{(k+1)}$ están definidas sobre $[a,x]$. Entonces, se puede expresar el residuo del teorema de Taylor como

\begin{equation}
\label{eq:residuo}
R_{k,a}(x)=\frac{f^{(k+1)}(\xi)}{(k+1)!}(x-a)^{k+1}.
\end{equation}

para algún $\xi\in[a,x]$.

Para la demostración de este teorema y otras expresiones del residuo (por ejemplo, una expresión en términos de integrales), puedes visitar el curso de Cálculo II, en particular la entrada Series de Taylor y de Maclaurin.

Pensemos de momento que $f$ tiene derivadas parciales de todos los órdenes (es decir, que es $C^\infty$). En este caso, $f$ tiene polinomios de Taylor de todos los grados. De entrada, no tendría por qué suceder que $\lim_{k\to \infty} T_{k,a}(x)=f(x)$, y de hecho hay contraejemplos para ello. Pero si además tenemos que se tiene $\lim_{k \to \infty}R_{k,a}(x)=0$, entonces la igualdad anterior sí se cumple. En este caso, verdaderamente $f$ se puede expresar como un polinomio infinito (una serie de potencias) alrededor de $a$ de la siguiente manera:

\begin{equation}\label{eq:taylor-inf}f(x)=\sum_{i=0}^{\infty}\frac{f^{(i)}(a)}{i!}(x-a)^{i}.\end{equation}

Ejemplo. Calculemos en $0$ el polinomio de Taylor de $f(x)=e^x$. Para cada entero positivo $k$ se tiene:

$$\frac{f^{(k)}(0)}{k!}x^{k}=\frac{e^0}{k!}x^{k}=\frac{x^{k}}{k!}.$$

De aquí, por la forma que toma el residuo, existe $\xi\in [0,x]$ para el cual

$$R_{k,0}(x)=\frac{e^\xi}{(k+1)!}x^{k+1}.$$

aquí $e^\xi$ está acotado y el cociente $\frac{x^{k+1}}{(k+1)!}$ se va a cero conforme $k\to \infty$. De este modo, tenemos la igualdad

$$e^x=1+\frac{x}{1}+\frac{x^2}{2!}+\frac{x^3}{3!}+\frac{x^4}{4!}+\frac{x^5}{5!}+\dots.$$

$\triangle$

Preliminares para polinomio de Taylor para campos escalares

La manera en la cual generalizaremos el teorema del polinomio de Taylor será a través de evaluar nuestro campo escalar sobre un segmento, muy parecido a como generalizamos el teorema del valor medio. Pongamos la situación en contexto.

Tomemos un abierto $S\subseteq \mathbb{R}^n$ y un campo escalar $f:S\to \mathbb{R}$. Tomemos vectores
\begin{align*}
\bar{a}=(a_1,\ldots,a_n)\\
\bar{v}=(v_1,\ldots,v_n),
\end{align*}

y $t$ en el intervalo $[0,1]$. Supondremos además que para todo dicho $t$ se cumple $\bar{a}+t\bar{v}\in S$.

Podemos recorrer el segmento de $\bar{a}$ a $\bar{a}+\bar{v}$ mediante la trayectoria $\gamma : [0,1] \to \mathbb{R}^{n}$ dada por $\gamma (t)=\bar{a}+t\bar{v}$. Si componemos a esta trayectoria con la función $f$, obtenemos una función $G: [0,1] \to \mathbb{R}$ dada por $$G(t)=(f\circ \gamma )(t)=f(\bar{a}+t\bar{v}).$$

Por la hipótesis de diferenciabilidad de $f$, es una función derivable de una variable real. Por la regla de la cadena su derivada está dada por la siguiente expresión:

\begin{align*}
G^{\prime}(t)&=v_{1}\frac{\partial f}{\partial x_{1}}(\bar{a}+t\bar{v})+\dots +v_n\frac{\partial f}{\partial x_n}(\bar{a}+t\bar{v})
\end{align*}

Vamos a introducir una notación muy usada y útil para el desarrollo que estamos haciendo. Definiremos un operador con la expresión anterior simplemente como

\[ G^{\prime}(t)=(\bar{v}\cdot \triangledown )f(\bar{a}+t\bar{v}).\]

Esta expresión no se sigue de manera tan formal de cosas que hemos hecho antes, pero observa que tiene sentido. En la expresión $\bar{v}\cdot \triangledown$ estamos haciendo algo así como un «producto punto de operadores». En el fondo, este operador manda a cada función diferenciable $f$ a su derivada direccional en la dirección de $\bar{v}$.

Para poder hablar de Taylor, necesitamos derivar iteradamente. Podemos entonces tomar ahora $G’$ y derivarla nuevamente, de donde obtendríamos

\begin{align*}
G^{\prime \prime} (t) &= (\bar{v}\cdot \triangledown) G'(\bar{a}+t\bar{v})\\
&=(\bar{v}\cdot \triangledown)\left((\bar{v}\cdot \triangledown)f(\bar{a}+t\bar{v})\right)\\
&=\left((\bar{v}\cdot \triangledown)(\bar{v}\cdot \triangledown)\right) f(\bar{a}+t\bar{v}).
\end{align*}

Es importante que medites en por qué se da la redistribución de paréntesis que hicimos en la última igualdad. Simplificaremos la expresión $(\bar{v}\cdot \triangledown)(\bar{v}\cdot \triangledown )$ como $(\bar{v}\cdot \triangledown)^2$, y de manera similar definimos $(\bar{v}\cdot \triangledown)^k$ como componer el operador $k$ veces. Continuando como arriba, bajo las hipótesis adecuadas de diferenciabilidad llegamos al siguiente resultado.

Proposición. Sea $k$ un entero positivo y $f:S\subseteq \mathbb{R}^{n}\to \mathbb{R}$ con $S$ abierto y derivadas parciales continuas de orden $1,2,\ldots,k$. Sea $\bar{a}\in S$, y $\bar{v}$ un vector tal que $\bar{a}+t\bar{v}\in S$ para todo $t\in [0,1]$. Entonces:

\begin{equation}\label{eq:iteradas}\left( \frac{d}{dt} \right)^{k}f(\bar{a}+t\bar{v})=(\bar{v}\cdot \triangledown )^{k}f(\bar{a}+t\bar{v}).\end{equation}

Demostración. Queda como tarea moral. Se sugiere hacerlo por inducción.

$\square$

Algo sorprendente y curioso que sucede con las expresiones del estilo $(\bar{v}\cdot \triangle)^k$ es que «se vale el binomio de Newton» para ellas, o en general, cualquier fórmula para elevar a la $k$-ésima potencia. Esto se ve muy claro en el caso de $f:S\subset \mathbb{R}^2\to \mathbb{R}$ y derivadas de orden $2$. Si tenemos $\bar{v}=(v_1,v_2)$, entonces $\bar{v}\cdot \triangledown=v_1\frac{\partial}{\partial x} + v_2\frac{\partial}{\partial y}$. Se puede demostrar, por ejemplo, que si las $k$-ésimas parciales son continuas entonces

\[ \left( v_1\frac{\partial}{\partial x}+v_2\frac{\partial}{\partial y}\right)^{k}=\sum_{i
=0}^{k}\binom{k}{i}v_1^iv_2^{k-i}\frac{\partial ^{i}}{\partial x^{i}}\frac{\partial^{k-i}}{\partial y^{k-i}}.\]

Un caso particular sería el de $n=2$ y $k=2$, en el que se obtiene que:

\begin{equation} \label{eq:binomio} \left( v_1\frac{\partial}{\partial x}+v_2\frac{\partial}{\partial y} \right)^{2}=v_1^{2}\frac{\partial ^{2}}{\partial x^{2}}+2{v_1}{v_2}\frac{\partial ^{2}}{\partial x\partial y}+v_2^{2}\frac{\partial ^{2}}{\partial y^{2}}.\end{equation}

En la práctica esto nos permitirá encontrar las expresiones que necesitamos para el polinomio de Taylor para campos escalares. Observa que estas expresiones son también las que nos confirman que la expresión que obtendremos será un polinomio en $v_1,v_2$ (en general, en las entradas de $\bar{v}$), pues tras aplicar el operador en $f$ y evaluar en un punto, finalmente \eqref{eq:binomio} quedará escrito para ciertas constantes $A,B,C$ como $$Av_1^2+2Bv_1v_2+Cv_2^2,$$ lo cual en efecto es un polinomio (en este caso de grado $2$ y dos variables).

Polinomio de Taylor para campos escalares

Con la notación que hemos introducido, ahora sí podemos enunciar apropiadamente el polinomio de Taylor. Pensemos en que $f$ es $k+1$ veces diferenciable y que todas esas derivadas son continuas. En la sección anterior vimos que $G=f\circ \gamma$ también sería $k+1$ veces diferenciable y dimos fórmulas para sus derivadas en términos de la notación $\bar{v}\cdot \triangledown$.

Aplicando el teorema de Taylor con la versión de residuo dada en la ecuación \eqref{eq:residuo}, para la función $G$, en los puntos $a=0$, $x=1$, tenemos que existe $\xi\in[0,1]$ tal que se satisface lo siguiente:

\[ G(1)=G(0)+G^{\prime}(0)+\frac{G^{(2)}(0)}{2!}+\dots +\frac{G^{(k)}(0)}{k!}+\frac{G^{(k+1)}(\xi)}{(k+1)!}.\]

Al usar las fórmulas dadas por la ecuación \eqref{eq:iteradas}, obtenemos que

\begin{align*}
G^{(s)}(0)&=(\bar{v}\cdot \triangledown )^{s}f(\bar{a}) & \text{para $s\leq k$}\\
G^{(k+1)}(\xi)&=(\bar{v}\cdot \triangledown )^{k+1}f(\bar{a}+\xi \bar{v}).
\end{align*}

Así, reescribiendo todo en términos de $f$ obtenemos que:

\begin{equation}\label{eq:prepoly}f(\bar{a}+\bar{v})=f(\bar{a})+\frac{(\bar{v}\cdot \triangledown )f(\bar{a})}{1!}+\dots +\frac{(\bar{v}\cdot \triangledown)^{k}f(\bar{a})}{k!}+\frac{(\bar{v}\cdot \triangledown )^{k+1}f(\bar{a}+\tau \bar{v})}{(k+1)!}.\end{equation}

Si de esta expresión quitamos el último término (el correspondiente al residuo) y hacemos la sustitución $\bar{w}=\bar{a}+\bar{v}$, obtenemos la siguiente expresión:

\begin{equation} \label{eq:poltaylor}T_{k,\bar{a}}(\bar{w}):=f(\bar{a})+\frac{((\bar{w}-\bar{a})\cdot \triangledown )f(\bar{a})}{1!}+\dots +\frac{((\bar{w}-\bar{a})\cdot \triangledown)^{k}f(\bar{a})}{k!}\end{equation}

le llamamos el polinomio de Taylor de $f$ de grado $k$ alrededor de $\bar{a}$ y converge a $f(\bar{a})$ conforme $\bar{w}\to \bar{a}$.

Ejemplo de polinomio de Taylor para campos escalares

Ejemplo. Determinemos el polinomio de Taylor de grado 3 de la expresión $f(x,y)=e^{5x+3y}$ alrededor del punto $(0,0)$. Para ello, usaremos la expresión de la fórmula \eqref{eq:prepoly} quitando el residuo y fórmulas tipo «binomio de Newton» como la de la ecuación \eqref{eq:binomio}.

Comencemos con el término de grado $1$. Está dado por el operador

$$\left(v_1\frac{\partial}{\partial x}+v_2\frac{\partial}{\partial y}\right)$$

que aplicado a nuestra función es

$$((v_1,v_2)\cdot \triangledown)f(x,y)=5v_1e^{5x+3y}+3v_2e^{5x+3y}.$$

Necesitaremos su evaluación en $(x,y)=(0,0)$, que es $5v_1+3v_2$.

Para pasar al término de segundo grado, necesitamos

\[\left( v_1\frac{\partial}{\partial x}+v_2\frac{\partial}{\partial y} \right)^{2}=v_1^{2}\frac{\partial ^{2}}{\partial x^{2}}+2{v_1}{v_2}\frac{\partial ^{2}}{\partial x\partial y}+v_2^{2}\frac{\partial ^{2}}{\partial y^{2}}.\]

Al aplicar este operador en nuestra $f$, se obtiene:

$$((v_1,v_2)\cdot \triangledown)^2f(x,y)=25v_1^2e^{5x+3y}+30{v_1}{v_2}e^{5x+3y}+9v_2^2 e^{5x+3y}$$

Lo necesitaremos evaluado en $(0,0)$, que es $25v_1^2+30v_1v_2+9v_2^2$.

Finalmente, también requeriremos del término de orden $3$, para el cual es necesario calcular el siguiente operador

\[ \left( v_1\frac{\partial}{\partial x}+v_2\frac{\partial}{\partial y} \right)^{3}=v_1^{3} \frac{\partial}{\partial x^3}+3v_1^{2}{v_2}\frac{\partial}{\partial x^{2}\partial y}+3v_1v_2^{2}\frac{\partial}{\partial x \partial y^2}+v_2^3\frac{\partial}{\partial y^3},\]

y aplicarlo a nuestra $f$ para obtener

$$((v_1,v_2)\cdot \triangledown)^3f(x,y)=125v_1^3e^{5x+3y}+225v_1^2v_2e^{5x+3y}+135v_1v_2^2 e^{5x+3y}+27v_2^3e^{5x+3y}.$$

Una vez más, requerimos la evaluación en $(0,0)$, la cual es $125v_1^3+225v_1^2v_2+135v_1v_2^2+27v_2^3$.

Juntando todo esto, obtenemos que

\begin{align*}
f(v_1,v_2)&=f(0,0)+\frac{((x,y)\cdot \triangledown )f(0,0)}{1!}+\frac{((x,y)\cdot \triangledown )^{2}f(0,0)}{2!}+\frac{((x,y)\cdot \triangledown)^{3}f((0,0))}{3!}\\
&=1+5v_1+3v_2+\frac{25v_1^2+30v_1v_2+9v_2^2}{2}+\frac{125v_1^3+225v_1^2v_2+135v_1v_2^2+27v_2^3}{6}.
\end{align*}

$\square$

Observa que, en efecto, obtenemos un polinomio en dos variables y de grado tres.

Los casos especiales para grado $1$ y grado $2$

Las presentaciones más clásicas del polinomio de Taylor para campos escalares de varias variables son las versiones de primero y segundo grado. Para el polinomio de primer grado, tenemos la siguiente expresión:

$$T_{1,\bar{a}}(\bar{a}+\bar{v})=f(\bar{a})+\sum_{i=1}^{n}(v_i)\frac{\partial f}{\partial x_{i}}(\bar{a}).$$

En el caso de la presentación clásica para la fórmula de segundo orden tenemos

$$\frac{(\bar{v}\cdot \triangledown)^{2}f}{2!}(\bar{a})=\sum_{i=1}^n\sum_{j=1}^nv_{i}v_{j}\frac{\partial ^{2}f}{\partial x_{j}\partial x_{i}}(\bar{a})$$

Donde

$$T_{2,\bar{a}}(\bar{a}+\bar{v})=f(\bar{a})+\sum_{i=1}^{n}v_{i}\frac{\partial f}{\partial x_{i}}(\bar{a})+\frac{1}{2}\sum_{i=1}^n\sum_{j=1}^{n}v_{i}v_{j}\frac{\partial ^{2}f}{\partial x_{j}\partial x_{i}}(\bar{a}).$$

Esta suma tendrá utilidad especial hacia el final del curso, cuando hablemos de optimización. La expresión también puede ponerse en términos de otro objeto matemático que se llama la matriz Hessiana, la cual definiremos más adelante una vez que hayamos hecho un repaso de álgebra lineal, matrices y formas cuadráticas.

Mas adelante…

Con lo que hemos trabajado hasta ahora hemos desarrollado un muy buen entendimiento de las curvas y de los campos escalares, que respectivamente son funciones $f:\mathbb{R}\to \mathbb{R}^m$ y $f:\mathbb{R}^n\to \mathbb{R}$. Sin embargo, nos gustaría ahora poder hablar con mucha mayor generalidad y entender a las funciones del estilo $f:\mathbb{R}^n\to \mathbb{R}^m$. Ya entendimos un poco de cómo son en términos de continuidad, cuando hablamos de la topología de $\mathbb{R}^n$. Sin embargo, para poder hablar de su diferenciabilidad y de otros resultados teóricos será necesario hacer un repaso de algunos conceptos adicionales de álgebra lineal. Por esta razón, en la siguiente unidad hablaremos de temas como transformaciones lineales, matrices, sistemas de ecuaciones, formas lineales y bilineales.

Tarea moral

Encuentra el polinomio de Taylor de primer grado para las siguientes funciones:
- $f(x,y)=e^(x+y)$
- $f(x,y)=e^{sen(x+y)}$
- $f(x,y)=x^2y^2+x+y$
Calcula el polinomio de Taylor de segundo grado para los siguientes campos escalares en el punto dado:
- $f(x,y)=x^2+xy$ en el punto $(1,1)$.
- $f(x,y,z)=xsen(yz)$ alrededor del punto $(\pi ,\pi ,\pi)$.
Demuestra por inducción la fórmula \[\left( \frac{d}{dt} \right)^{k}f(\bar{a}+t\bar{v})=(\bar{v}\cdot \triangledown )^{k}f(\bar{a}+t\bar{v}).\]
Demuestra por inducción \[ \left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)^{k}=\sum_{i=1}^{k}\binom{k}{i}x^{i}y^{k-i}\frac{\partial ^{i}}{\partial x^{i}}\frac{\partial^{k-i}}{\partial y^{k-i}}.\]
En esta entrada sólo discutimos con detalle lo que pasa con el polinomio de Taylor «hasta cierto grado $k$». Sin embargo, no dimos una versión que generalice el polinomio de Taylor para cuando usamos todos los términos posibles (como en la ecuación \eqref{eq:taylor-inf}). Observa que en el recordatorio de una variable real sí pusimos el resultado para la serie de Taylor. Enuncia y demuestra una versión para campos escalares.

Entradas relacionadas

Ir a Cálculo Diferencial e Integral III
Entrada anterior del curso: Derivadas parciales de orden superior
Entrada siguiente del curso: Matrices

Cálculo Diferencial e Integral II: Recordatorio de derivadas

Por Moisés Morales Déciga

Deja un comentario

Introducción

Durante esta unidad se empezaron a estudiar las integrales indefinidas, como una generalización o una ampliación de la definición al empezar a considerarse como funciones, a la vez que se mencionaron e ilustraron las propiedades que éstas tienen.

Pero para poder seguir avanzando en el curso, es necesario recordar el proceso de derivación.

Muy seguramente haz escuchado que existe una relación entre la integral y la derivada, puede ser que incluso te hayan contado que la integral es la función inversa a la derivación o que son procesos opuestos y demás posibilidades.

Por otro lado, si aun no lo haz escuchado te comento que sí existe una relación entre ambos procesos pero no es formalmente correcto mencionarlo como inversos. Esto lo detallaremos más adelante.

Y como vamos a ilustrar esta relación, es necesario recordar la derivada y las reglas de derivación que se encontraron en el primer curso de cálculo.

La derivada

A partir de lo desarrollado en Cálculo I, se define coloquialmente a la derivada como la pendiente de la recta tangente a la curva en un punto o como la razón o velocidad de cambio de la función ante cambios de su variable independiente.

Formalmente, se define a la derivada como el siguiente límite.

$$f'(x) = \lim_{h \rightarrow 0} \frac{f(x+h) \ – \ f(x)}{h} $$

Donde $f'(x)$ es la derivada de $f(x)$.

Al igual que en la entrada anterior, la derivada tiene propiedades con las cuales nos facilita su manejo al momento de operar la transformación con diferentes funciones, entre las cuales tenemos las siguientes propiedades.

Para las propiedades señaladas a continuación, es necesario considerar lo siguiente:

Sean $f$ y $g$ dos funciones derivables en $x_0$, es decir, que existe $f'(x_0)$ y $g'(x_0)$.

Derivada de suma de funciones y producto por una constante

$ (f + g)'(x_0) = f'(x_0) + g'(x_0)$
$(cf)'(x_0) = c f'(x_0)$

Derivada de producto de funciones

$(f \cdot g)’ (x_0) = f(x_0) \cdot g'(x_0) + f'(x_0) \cdot g(x_0)$
Si $g(x_0) \neq 0$ y $g'(x_0) \neq 0$, entonces

$$\left( \frac{1}{g} \right) ^{‘} (x_0) = – g(x_0) \left( \frac{1}{(g(x_0))^{2}} \right) $$

Estas son las propiedades que se ilustraron en el curso de Cálculo I, si quieres recordar la entrada, sigue este enlace. En esta entrada se presentan unas demostraciones de las propiedades, así como unos ejemplos.

Pero en este caso, podemos utilizar la notación de la integral indefinida para mostrar las propiedades y las reglas de derivación, como se muestra adelante.

Reglas de derivación

Para todas las siguientes reglas de derivación, suponga que la función es derivable.

Multiplicación por una constante

$$ \phi(x)=cf(x), \Rightarrow \phi'(x)=cf'(x).$$

Derivada de una suma

$$\phi(x)=f(x)+g(x), \Rightarrow \phi'(x)=f'(x)+g'(x).$$

Derivada del producto

$$\phi(x)=f(x) g(x), \Rightarrow \phi'(x)=f(x)g'(x) + f'(x)g(x) .$$

Derivada de un cociente

$$\phi(x) = \frac{f(x)}{g(x)}, \Rightarrow \phi'(x) = \frac{g(x)f'(x) – f(x)g'(x) }{[g(x)]^2}.$$

Derivación directa

Una vez que recordamos la derivada, su definición y las reglas de derivación, podemos recordar las fórmulas de derivación para funciones particulares, lo que nos permite calcular la derivada de forma directa o inmediata.

Esto nos facilita el proceso, ya que una vez que vemos la función, sabemos de forma instantánea, cual es su diferencial.

Derivación de potencias

Este es un caso de la derivada de un producto.

En caso de tener una potencia de la forma $x^n$.

\begin{align*}
\frac{d}{dx}x^n=n \cdot x^{n-1}.
\end{align*}

En caso de tener una raíz, es decir, la función es de la forma $\sqrt[n]{x}$, también tiene un tratamiento de potencia, como se muestra adelante.

\begin{align*}
\frac{d}{dx}\sqrt[n]{x} & = \frac{d}{dx} x^{\frac{1}{n}} \\
& =\frac{1}{n} x^{({\frac{1}{n} \ – \ 1)}} .
\end{align*}

Y por último, si tenemos un caso combinado, se tiene la siguiente regla.

\begin{align*}
\frac{d}{dx}\sqrt[n]{x^m} & = \frac{d}{dx} x^{\frac{m}{n}} \\
& =\frac{m}{n} x^{({\frac{m}{n} \ – \ 1)}} .
\end{align*}

Derivación de funciones racionales

En general, es un caso de la derivada de cociente, pero también puede ser tratada como una potencia.

\begin{align*}
\frac{d}{dx} \frac{1}{{x^m}} & = \frac{d}{dx} x^{- \ m} \\
& = – \ m \ x^{- \ m – 1} \\
& =-\frac{m}{x^{m+1}}
\end{align*}

Derivación de funciones trigonométricas

$$\frac{d}{dx}sen(x)=cos(x).$$

$$\frac{d}{dx}cos(x)=-sen(x).$$

\begin{align*}
\frac{d}{dx}tan(x) & =\frac{1}{{cos^2}(x)} \\
& =sec^2(x) \\
& =1+tan^2(x).
\end{align*}

\begin{align*}
\frac{d}{dx}cot(x) & =-\frac{1}{sen^2(x)} \\
& =-cosec^2(x) \\
&=-(1+cot^2(x)).
\end{align*}

Derivación de funciones inversas trigonométricas

$$\frac{d}{dx}arcsen(x)=\frac{1}{\sqrt{(1-x^2)}}.$$

$$\frac{d}{dx}arccos(x)=-\frac{1}{\sqrt{(1-x^2)}}.$$

$$\frac{d}{dx}arctan(x)=\frac{1}{1+x^2}.$$

$$\frac{d}{dx}arccot(x)=-\frac{1}{1+x^2}.$$

Derivada de la función exponencial

$$\frac{d}{dx}a^x=log(a)a^x.$$

$$\frac{d}{dx}e^x=e^x.$$

Derivada de la función logaritmo

$$\frac{d}{dx} log(a)x=\frac{1}{x ln(a)}.$$

$$\frac{d}{dx} ln(x)=\frac{1}{x}.$$

Regla de la cadena

Esta regla se utiliza cuando estamos haciendo composición de funciones o la función que estamos derivado es producto de otra transformación. Esta propiedad nos especifica la derivación en estos casos.

Tenemos dos funciones $\phi$ y $g$ continuas en sus intervalos de definición, no necesariamente están definidas en el mismo intervalo.

Entonces, la función compuesta $f(x)=g[\phi(x)]$ es también continua.

Entonces, si queremos obtener la derivada de la función $f(x)$, aplicamos el siguiente teorema llamado como «regla de la cadena».

$$f'(x) = g'(\phi) \phi'(x).$$

Si quieres recordar a detalle la regla de la cadena, así como su demostración, puedes consultarlo en el siguiente enlace.

Más adelante…

Este ha sido un repaso muy corto y muy general sobre la derivada, en caso de querer recordarlo con mayor detalle o si tienes algún tema que te gustaría retomar con mayor detenimiento, puedes consultar la página de curso en el siguiente enlace, donde se enfoca en el cálculo diferencial.

Este pequeño recordatorio nos permitió introducir la diferencial a partir de la notación correspondiente de la integral indefinida, lo que nos ayuda de forma indirecta a ver la relación que tiene la derivada con la integral.

En la siguiente entrada se verá la introducción a los dos teoremas que tienen una alta importancia dentro del curso y que se emplearán en muchos cursos ya que, como su nombre lo dice, son fundamentales.

Estos teoremas explican formalmente la relación que existe entre el cálculo integral y el cálculo diferencial, así que nos van a facilitar cuando se tenga un problema que involucre ambos procesos.

Tarea moral

Encuentre las siguientes derivadas.

$\ y(x) = (x^3 + 4x^2 – 7)^6.$
$\ y(x) = sin^2(2x^3).$
$ \ y(x) = \frac{1}{6x} + e^{2x}.$
$\ y(x) = 3x cos(x^2) – (x^2+2x+1) tan(x) .$
$\ y(x) = 4 ln((x-2)^2). $

Entradas relacionadas

Página del curso: Cálculo Diferencial e Integral II
Entrada anterior: Propiedades de la integral indefinida
Entrada siguiente: Intuición de los teoremas fundamentales del cálculo

Cálculo Diferencial e Integral II: Introducción y método exhaustivo

Por Moisés Morales Déciga

Deja un comentario

Introducción

Este curso es la continuación de la materia Cálculo Diferencial e Integral I. En el primer curso de cálculo hablamos del cálculo diferencial. Nuestro principal objeto matemático fue la derivada y cómo se puede interpretar como la razón de cambio del objeto de análisis: la tangente de una curva, la velocidad y aceleración de una partícula, la variación de un objeto en su trayectoria, etc.

En este siguiente curso hablaremos de temas relacionados con el cálculo integral. Hablaremos un poco de sus orígenes, de los principales objetos matemáticos que estudia, de varios aspectos fundamentales de su teoría y de sus aplicaciones. El objetivo principal de esta rama matemática es el estudio de las integrales y las anti-derivadas. Una motivación importante es que ellas son una herramienta para la solución de problemas de cálculo de áreas y de volúmenes.

Así, el objeto matemático estelar del curso será la integral y la motivaremos mediante su gran utilidad para el cálculo de áreas. Sin embargo, esto no será lo único que haremos. La definiremos formalmente, probaremos las muchas propiedades matemáticas que tiene y veremos numerosas aplicaciones no sólo al cálculo de integrales, sino también a la construcción de otros objetos matemáticos fundamentales como la función exponencial.

Es muy probable que ya cuentes con una buena noción de área. En cursos de primaria, secundaria y bachillerato se explica un poco de esto y se dan fórmulas para calcular áreas. Sin embargo, estas fórmulas no salen de la nada. Pueden ser construidas a partir de nociones más básicas y por distintos métodos. Uno de ellos es la integración. Hasta que hagamos más precisiones formales, puedes aprovechar la intuición que ya tienes sobre las áreas y pensar en ellas intuitivamente como una magnitud que «mide» qué tan grande es una región contenida dentro de ciertos límites y cuyas unidades están «al cuadrado». Esto te ayudará a tener en qué cimentar tu intuición para cuando demos una definición más formal.

Algunas notas históricas

Históricamente, se han encontrado casos de utilización de de herramientas de cálculo diferencial en trabajos antiguos, por ejemplo, los trabajos de Arquímedes. Pero fue hasta los siglos XVI y XVII donde se tuvo un desarrollo sistemático, atribuido a Isaac Newton y Gottfried Leibniz, quienes son considerados como los dos grandes pioneros y más grandes representantes del Cálculo. Sin embargo, no fueron los únicos aportadores a éste.

Otra persona importante, Isaac Barrow, quién sería el profesor de Newton, tenía una comprensión sobre la reciprocidad entre la derivación e integración. Este concepto es el punto de partida del cálculo desarrollado por Newton y Leibnitz. Es primordial pues da pie a la introducción y demostración de los dos teoremas fundamentales del cálculo.

Método exhaustivo

A modo de introducción, platicaremos en esta entrada sobre el método exhaustivo. Es un método matemático que utiliza la geometría para aproximar algún resultado o aproximar a la solución un problema que tengamos. La característica que tiene el método es que, a la vez que aumenta el cálculo o las repeticiones, aumenta el grado de precisión de nuestra aproximación con respecto al resultado que queremos.

Arquímides desarrolló una de las aplicaciones de este método para el cálculo de áreas planas. Eudoxo también trabajó con este método, sólo que su objetivo era calcular el volumen de las pirámides de Egipto. En cierto sentido, también ya usamos este método cuando hablamos de la derivada de una función. Para pensar en la tangente en un punto $P$ a la gráfica de una función, la intuición (y de hecho, en cierto sentido la definición formal) consistió en tomar rectas secantes que pasaran por $P$ y otro punto $Q$ en la gráfica. Conforme $Q$ se acercaba a $P$ nos aproximábamos más y más a la tangente y, si cierto límite existía, justo esa era la definición de tangente.

Para ejemplificar nuevamente el método exhaustivo, veremos cómo encontrar de manera un poco informal el el área de un círculo. Sea $C$ un círculo y sea $M\geq 3$ un número natural. Tomemos $P_M$ un polígono regular de $M$ lados inscrito al círculo $C$ y $Q_M$ un polígono de $M$ lados circunscrito al círculo $C$. Para que dichos polígonos queden bien definidos, podemos pedir además que su lado inferior sea horizontal. Por ejemplo, en la figura a continuación se muestra el caso $M = 5$.

Notemos que los polígonos que definimos tienen dos áreas: una que incluye al área del círculo y otra que está incluida en el círculo.

Para cada valor de $M$ tenemos dos polígonos. De este modo, estamos generando dos sucesiones de polígonos: la de polígonos inscritos $\{P_M\}_{M\geq 3}$ y la de polígonos circunscritos $\{Q_M\}_{M\geq 3}$. Notemos que el área cada uno de los polígonos inscritos $P_M$ queda acotada superiormente por el área de cada uno de los polígonos $Q_M$; a su vez, el área de cada uno de los polígonos circunscritos $Q_M$ queda acotada inferiormente por el área de cada uno de los polígonos $P_M$. Además, no es muy difícil convencerse de que el área de los polígonos inscritos crece conforme $M$ aumenta y, en contraparte, el área de los circunscritos decrece conforme $M$ aumenta. Recordando del primer curso de cálculo lo que sabemos sobre supremos, ínfimos y sobre sucesiones monótonas y acotadas, tendríamos entonces que los siguientes dos límites existen:

\begin{align*}
p&=\lim_{M\to \infty} \text{área}(P_M)=\sup_{M\geq 3} \text{área}(P_M)\\
q&=\lim_{M\to \infty} \text{área}(Q_M)=\inf_{M\geq 3} \text{área}(Q_M).
\end{align*}

Además, $p\leq q$. De hecho, si el área del círculo $C$ que nos interesa es $c$, entonces por lo que mencionamos arriba tendríamos que $p \leq c \leq q$. Nuestra intuición nos dice que cuando la $M$ aumenta, generamos un polígono con más lados que van acercándose a la circunferencia, y que en el límite debemos obtener el área de la circunferencia. Por lo tanto, esperaríamos que $p=c=q$.

¿Qué sería suficiente para respaldar esta intuición? ¿Bastaría que calculáramos explícitamente $\lim_{M\to \infty} \text{área}(P_M)$ y $\lim_{M\to \infty} \text{área}(Q_M)$ (por ejemplo, dividiendo los polígonos en triángulos para encontrar una fórmula explícita) y que viéramos que son iguales? Esto seguro aumentaría mucho la confianza en nuestro procedimiento. Pero, ¿qué tal que aproximamos al círculo con otros polígonos que no son regulares? ¿nos dará lo mismo? Nuestra definición formal de área ayudará a resolver estas dudas.

En resumen, el método iterativo nos permite aproximar el área del círculo, encerrándolo entre 2 polígonos, de los cuales sabemos calcular el área mediante triángulos. Intuitivamente, mientras más fraccionemos los polígonos, la aproximación del área del círculo será mejor. Esta idea de «encerrar» el área que nos interesa entre dos áreas que sepamos (o acordemos) cómo calcular será clave cuando definamos la integral definida.

Más adelante…

En esta entrada hablamos brevemente sobre la conexión de este curso de cálculo con el anterior. Dimos unas pocas notas históricas e introducimos la idea del método exhaustivo. En la siguiente entrada comenzaremos a formalizar estas ideas para el cálculo de áreas entre la gráfica de una función y el eje $x$.

Tarea moral

Con las herramientas de geometría que has adquirido en la educación básica, intenta completar el ejemplo que comenzamos sobre el método exhaustivo. No te preocupes mucho por la formalización de límites, funciones trigonométricas, fórmulas de áreas de triángulos, etc. Es parte de lo que haremos en este curso. Entre otras cosas, tendrás que:
- Calcular explícitamente la distancia del centro de un círculo $C$ de radio $r$ a un vértice (y a un lado) del polígono inscrito (y circunscrito) en $C$ que es regular y de $n$ lados.
- Encontrar el área de $P_n$ y $Q_n$.
- Encontrar los límites de estas áreas conforme $n$ tiende a infinito.
Investiga más sobre los orígenes del cálculo integral.
Averigua sobre el método exhaustivo y otros usos históricos que se le ha dado.
El método exhaustivo puede ser algo peligroso si se usa apresuradamente. Por ejemplo, toma un cuadrado de lado $1$ y divídelo en cuadrados pequeños para formar un tablero de $n\times n$. Mediante un camino $C_n$ que sube y va a la derecha alternadamente, se puede comenzar en el vértice inferior izquierdo y llegar al vértice superior derecho. Intuitivamente, cuando $n$ tiende a infinito, este camino pareciera converger a la diagonal del cuadrado, la cual tiene longitud $\sqrt{2}$. Sin embargo, la longitud de cada camino $C_n$ siempre es $2$ pues en total avanza una unidad a la derecha y una hacia arriba. ¿Por qué la longitud de $C_n$ no tiende a $\sqrt{2}$ si aparentemente $C_n$ tiende a la diagonal del cuadrado?
Realiza un repaso de los teoremas principales de Cálculo Diferencial e Integral I. ¡Te serán sumamente útiles para este curso! En particular, sería bueno que revises los siguientes temas:
- Definición y propiedades de límites.
- Definición y propiedades de funciones contínuas.
- Definición y propiedades de derivadas.
- Reglas de derivación.
- El teorema del valor intermedio.
- El teorema del valor medio.

Entradas relacionadas

Ir a Cálculo Diferencial e Integral II
Siguiente entrada del curso: Motivación de la integral y sumas de Riemann

Cálculo Diferencial e Integral II: Teorema del valor medio para la integral

Por Moisés Morales Déciga

Deja un comentario

Introducción

En una entrada anterior, presentamos un ejemplo de integración por punto medio que sirve como introducción al tema del teorema del valor medio para la integral. En dicho ejemplo, aproximamos la integral mediante sumas de áreas de rectángulos cuyas bases eran todas iguales, y cuya altura estaba dada por la evaluación de una función en el punto medio de cada intervalo.

Esta manera de aproximar una integral usando algún punto arbitrario dentro de cada intervalo de una partición, y haciendo la suma de Riemann correspondiente, será el punto de partida para entender primero a la integral como un promedio, y luego para llevar ese entendimiento más allá y enunciar el teorema del valor medio para la integral. Lo que nos dirá este teorema es que cuando una integral de una función continua exista, entonces dicha integral siempre puede calcularse como la longitud del intervalo de integración, por la evaluación de la función en algún punto del intervalo.

A continuación formalizamos estas ideas.

Función promedio e intuición del teorema del valor medio

Quizás recuerdes la siguiente definición de tu educación básica.

Definición. Sean $z_1,\ldots,z_n$ números reales. Su promedio o media aritmética es el número

$$\frac{z_1 + z_2 + … + z_n}{n}.$$

De manera similar, si tomamos $x_1,\ldots,x_n$ números en un cierto intervalo $[a,b]$ y $f:[a,b]\to \mathbb{R}$, entonces podemos considerar a los valores $f(x_1),\ldots,f(x_n)$ y obtener su promedio:

$$\frac{f(x_1) + f(x_2) + … + f(x_n)}{n} .$$

A esto le llamamos el valor promedio de la función en $x_1,\ldots,x_n$.

Pensemos que tomamos una partición en $n$ partes del intervalo $[a,b]$. La longitud de cada celda sería $\Delta x_i = (b-a)/n$. Si tomamos a los puntos $x_1,\ldots,x_n$, uno en cada celda de dicha partición, entonces tendríamos que

\begin{align*}
\frac{f(x_1) + f(x_2) + … + f(x_n)}{n}&=\frac{b-a}{b-a} \sum_{i=1} ^n \frac{f(x_i)}{n}\\
&=\frac{1}{b-a} \sum_{i=1}^n f(x_i) \Delta x_i.
\end{align*}

A la derecha nos queda una suma de Riemann. Si la función fuera integrable en $[a,b]$, dicha suma convergería a $\frac{1}{b-a}\int_a^b f(x)\, dx$ conforme $n\to \infty$ (como recordatorio, revisa la entrada de definición de la Integral). Y el lado izquierdo, conforme $n$ crece, se vuelve el promedio de más y más puntos distribuidos homogéneamente en $[a,b]$. De aquí sale la siguiente intuición: «la integral entre $b-a$ es el valor promedio de la función en todo el intervalo».

Esta intuición es buena y conviene formalizarla con un nombre apropiado.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función acotada e integrable en un intervalo $[a,b]$, con $a<b$ reales. Definimos el promedio de $f$ en $[a,b]$ como el número $$\frac{1}{b-a}\int_a^b f(x)\, dx.$$

Observa que podemos poner a esta expresión como un cociente de integrales:

$$\frac{1}{b-a} \int \limits_{a}^{b} f(x) \ dx = \frac{ \int \limits_{a}^{b} f(x) \ dx }{ \int \limits_{a}^{b} 1 \ dx }.$$

Teorema del valor medio para la integral

El teorema del valor medio establece una relación muy importante entre una función continua y promedio en cierto intervalo $[a,b]$.

Teorema. Sea $f:\mathbb{R}\to \mathbb{R}$ una función que es continua en el intervalo $[a,b]$, con $a\leq b$ reales. Entonces, siempre existe $\xi\in[a,b]$ tal que

$$ \int \limits_{a}^{b} f(x) dx = f(\xi)(b-a).$$

Si $b>a$, podemos dividir entre $b-a$ y esto quiere decir que siempre podemos encontrar un valor $\xi\in [a,b]$ tal que $f(\xi)$ es igual al promedio de $f$ en $[a,b]$.

Demostración. Si $a=b$, entonces no hay nada que hacer, pues en ambos lados de la igualdad tenemos cero. Así, sean $a<b$ números reales y $f:\mathbb{R}\to \mathbb{R}$ función continua dentro del intervalo $[a,b]$.

Las funciones continuas tienen valor máximo y mínimo en intervalos cerrados y acotados. Así, existen $x_0$ y $y_0$ en $[a,b]$ tales que $f(x_0) = m$ es el mínimo de la función en el intervalo y, $f(y_0) = M$ es el máximo de la función en el intervalo. Como las funciones constantes son integrables y la integral respeta desigualdades, tenemos que:

\begin{align*}
m(b \ – \ a) &= f(x_0) (b \ – \ a)\\
&=\int_a^b f(x_0)\, dx\\
&\leq \int_a^b f(x)\, dx\\
&\leq \int_a^b f(y_0)\, dx\\
&=f(y_0) (b-a)\\
&=M (b-a).
\end{align*}

Nos importa recuperar de esta cadena de desigualdades que $$m(b-a)\leq \int_a^b f(x)\, dx \leq M(b-a),$$ y por lo tanto $$m\leq \frac{1}{b-a} \int_a^b f(x)\, dx \leq M.$$

De esta manera, $\frac{1}{b-a} \int_a^b f(x)$ es un valor entre $f(x_0)$ y $f(y_0)$. Pero por el teorema del valor intermedio, si una función continua toma dos valores, entonces toma cualquier valor entre ellos. Así, existe $\xi$ entre $x_0$ y $y_0$ tal que $$f(\xi)=\frac{1}{b-a} \int_a^b f(x)\, dx.$$

Multiplicando por $b-a$, obtenemos la igualdad deseada.

$ \square$

Para entender un poco mejor el teorema del valor medio para la integral, veamos un ejemplo.

Ejemplo. Veamos el teorema del valor medio en acción para la función $f(x)=x$ en el intervalo $[3,4]$.

Ya habíamos encontrado el valor de esta integral en la entrada «Definición de la Integral Definida». Dicho valor fue $\frac{7}{2}=3.5$.

Lo que nos diría el teorema del valor medio es que podemos encontrar un punto $\xi \in[3,4]$ tal que Sustituyendo en la expresión encontrada por el teorema, se tiene lo siguiente.

$$f(\xi)(4 \ – \ 3) = \int \limits_{3}^{4} f(x) dx=3.5,$$

es decir, tal que $f(\xi)=3.5$. Y en efecto, dicho punto es justamente $3.5$, pues $f(3.5)=3.5$. Notemos que, tal como se quería, tenemos que $3.5\in [3,4]$. Por lo tanto, el punto $\xi = 3.5 $ dentro del intervalo $[3,4]$ es tal que al evaluarlo en la función, da por resultado el promedio de $f$ en $[3,4]$.

$\triangle$

Teorema del valor medio generalizado para la integral

Hay otra versión del teorema del valor medio que generaliza la noción de promedio. Quizás en tu educación básica cursaste una materia en donde el $30\%$ de tu calificación eran tareas, el $20\%$ era participaciones y el $50\%$ el examen. En este caso, si sacaste $x,y,z$ en las tareas, participaciones y examen respectivamente, entonces tu calificación final era $0.3 x + 0.2 y + 0.5 z$. Este tipo de promedios en donde distintos números tienen distinto valor quedan reflejados en la siguiente definición.

Definición. Sean $z_1,\ldots,z_n$ números reales y $p_1,\ldots,p_n$ números positivos. La media aritmética ponderada con dichos pesos es el número real $$\frac{p_1z_1+p_2z_2+\ldots+p_nz_n}{p_1+p_2+\ldots+p_n}.$$

El promedio se recupera eligiendo todos los pesos $p_i$ iguales a $1$, es decir, dando la misma ponderación para todos los valores que tenemos dentro del conjunto, independientemente del valor que hayan tenido. Las medias aritméticas son importantes pues aparecen en las aplicaciones. Por ejemplo, en física podemos pensar que los $p_i$ son pesos de partículas localizadas en los puntos $z_i$. En este caso la media aritmética ponderada representará el centro de gravedad de dichos objetos.

Estas ideas pueden llevarse al contexto continuo. Se pueden pensar en las ideas del teorema del valor medio, pero donde ahora en cada punto ponderaremos de acuerdo a una función peso. Esto hará que ahora distintos puntos tengan distinta preferencia, y que a su vez ya no se tenga una media aritmética, sino una media aritmética ponderada.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función integrable en $[a,b]$ y sea $p:\mathbb{R}\to \mathbb{R}$ una función integrable en $[a,b]$ y no negativa, con integral positiva. Definimos el promedio ponderado de $f$ como el número

$$\frac{\int_a^b f(x) p(x) \, dx}{\int_a^b p(x)\, dx}.$$

Se puede demostrar el siguiente teorema, que generaliza al teorema del valor medio para la integral.

Teorema. Sea $f:\mathbb{R}\to \mathbb{R}$ una función continua en $[a,b]$ y sea $p:\mathbb{R}\to \mathbb{R}$ una función continua en $[a,b]$ y no negativa, con integral positiva. Entonces existe un valor $\xi\in [a,b]$ tal que:

$$\int \limits_{a}^{b} f(x) \ p(x) \ dx = f(\xi) \ \int \limits_{a}^{b} p(x) \ dx .$$

Observación. Si $p(x)$ es la función constante $1$, recuperamos el teorema del valor medio para la integral.

Ya tienes todas las herramientas para probar esta generalización. ¡Te espera en los problemas!

Más adelante…

A partir de la definición de la integral mediante sumas se obtienen teoremas y propiedades que nos permiten simplificar el cálculo de la integral y tener herramientas para resolver problemas mediante diferentes métodos.

Este teorema nos permite calcular la integral a partir del punto medio del intervalo, simplificando el proceso ya que no es necesario determinar el ínfimo o el supremo de cada partición.

Un poco después veremos algunas aplicaciones de este teorema. Será de suma importancia cuando enunciemos y mostremos los teoremas fundamentales del cálculo.

Tarea moral

Encuentra el valor promedio la función dada, en el intervalo dado. Luego, encuentra un valor $\xi$ en el intervalo dado tal que $f(\xi)$ sea la integral que encontraste.
- $f(x)=1 + x^2$ en $[-1,2]$.
- $f(x)=\sqrt x$ en el intervalo $[0,4]$.
- $f(x)=1+2x-x^2$ en el intervalo $[-2,2]$.
Determina el valor promedio ponderado de las siguientes funciones, usando la función ponderación dada.
- $f(x)=1+x^2$ en $[-1,2]$, con función ponderación $p(x)=x+1$.
- $f(x)=4x^2 – 2x$ en $[1,4]$, con función ponderación $p(x)=3$.
- $f(x)=(x-3)^2$ en en $[2,5]$, con función ponderación $p(x)=x-2$.
Demuestra el teorema del valor medio generalizado para la integral.
El teorema del valor medio es falso en general si la función no es continua. Considera la siguiente función $$f(x)=\begin{cases} 0 & \text{si $x\in [0,1]$}\\ 1 & \text{si $x\in[1,3].$}\end{cases}$$
- Demuestra que esta función es integrable en $[0,3]$.
- Encuentra explícitamente el valor de esa integral mediante la definición.
- Muestra que no existe ningún $\xi\in [0,3]$ tal que $f(\xi)=\frac{1}{3-0} \int_a^b f(x)\, dx.$
Sea $f:\mathbb{R}\to\mathbb{R}$ una función continua y tal que $f(x)\geq 3$ para todo $x$ en cierto intervalo $[a,b]$. Demuestra que si el promedio de $f$ en $[a,b]$ es $3$, entonces $f(x)=3$ para todo $x\in [a,b]$. ¿Fue importante que el número fuera $3$? Enuncia y demuestra una generalización.

Entradas relacionadas

Página del curso: Cálculo Diferencial e Integral II
Entrada anterior: Propiedades de la integral definida
Entrada siguiente: Funciones integrables con finitas discontinuidades

Cálculo Diferencial e Integral II: Definición de la integral definida

Por Moisés Morales Déciga

Deja un comentario

Introducción

En la entrada anterior se introdujo el problema de calcular el área que se encuentra en una región delimitada por ciertas líneas verticales, el eje $x$ y la gráfica de una función. Hablamos de cómo aproximar esta área cuando la función es «bien portada», pero aún no hemos dicho a qué se refiere esto. En esta entrada haremos una formalización de este concepto mediante la definición de integral definida.

La intuición que puedes tener a lo largo de la entrada es que para poder hablar de que una función sea integrable en cierto intervalo, intuitivamente necesitamos que las sumas de Riemann convergan a un valor conforme hacemos las celdas tender a cero en longitud. Esto diría que sin importar cómo hagamos la partición, las sumas de Riemann deben converger a un mismo valor conforme la partición se hace más y más fina. En particular, necesitaremos que las sumas superiores e inferiores cumplan esto. Como en ellas entendemos bien qué pasa con los refinamientos, entonces nos conviene más dar la definición en términos de ellas. Es lo más conveniente y, en particular, implica lo anterior.

Integral definida de Riemann

La definición clave que estudiaremos es la siguiente.

Definición. Sean $f:\mathbb{R}\to \mathbb{R}$ una funcion acotada y $a\leq b$ reales. Sea $\mathbf{P}$ el conjunto de las particiones de $[a,b]$. Definimos

\begin{align*}
\underline{S}(f) & = \sup \lbrace \underline{S(f,P)} \ | P \in \mathbf{P} \rbrace\\
\overline{S}(f) &= \inf \lbrace \overline{S(f,P)} \ | P \in \mathbf{P} \rbrace,
\end{align*}

es decir al supremo de las sumas inferiores y al ínfimo de las sumas superiores sobre todas las particiones posibles de $[a,b]$. Diremos que existe la integral definida de Riemann para $f$ en el intervalo $[a,b]$ si

$$ \underline{S(f)} = \overline{S(f)}.$$

En este caso, a este valor en común lo denotamos por $$\int \limits_{a}^{b} f(x) dx.$$

En otras palabras, para que $f$ sea integrable, necesitamos que el ínfimo de las sumas superiores sea igual al supremo de las sumas inferiores. A veces también decimos que $f$ es Riemann integrable en $[a,b]$ o, si el contexto es claro, simplemente que es integrable.

No todas las funciones son Riemann integrables. Hacia el final de esta unidad daremos ejemplos de funciones que no lo son. Sin embargo, por ahora nos enfocaremos en ver algunos ejemplos que sí son Riemann integrables y probar propiedades de la integral definida en los casos en los que sí exista.

Ejemplo de integral definida

Veamos un ejemplo sencillo de cómo se verifica la definición de integral definida.

Ejemplo. Tomemos la función $f:[0,1]\to \mathbb{R}$ dada por $f(x)=x$. Veamos que dicha función es integrable en el intervalo $[0,1]$. Para ello, demos la partición $P_n$ homogénea del intervalo $[0,1]$ en celdas de longitud $1/n$, con $n$ un entero positivo. Si hacemos esto, las celdas de la partición son

$$[0,1/n],[1/n,2/n],\ldots[(n-1)/n,1].$$

Los supremos de los valores de $f$ en dicho intervalo son

$$1/n, 2/n, \ldots, 1,$$

y los ínfimos son

$$0,1/n, \ldots, (n-1)/n.$$

De este modo, para esta partición la suma superior sería

\begin{align*}
\overline{S} (f,P_n) &= \frac{1}{n}\left(\frac{1}{n}+\frac{2}{n}+\ldots+\frac{n}{n}\right)\\
&=\frac{1}{n^2}(1+2+\ldots+n)\\
&=\frac{n(n+1)}{2n^2}\\
&=\frac{1}{2}+\frac{1}{2n}.
\end{align*}

y la suma inferior sería

\begin{align*}
\underline{S} (f,P_n) &= \frac{1}{n}\left(\frac{0}{n}+\frac{2}{n}+\ldots+\frac{n-1}{n}\right)\\
&=\frac{1}{n^2}(0+1+2+\ldots+(n-1))\\
&=\frac{(n-1)n}{2n^2}\\
&=\frac{1}{2}-\frac{1}{2n}.
\end{align*}

La sucesión de números $\frac{1}{2}+\frac{1}{2n}$ se acerca tanto como queramos a $\frac{1}{2}$ por arriba. Como el ínfimo $\overline{S}(f)$ que estamos buscando es cota inferior de todas las sumas inferiores, en particular es de estas que vienen de particiones homogéneas. Así, $\overline{S}(f)\leq \frac{1}{2}$. Pero además, por una proposición de la entrada anterior sabemos que cualquier suma inferior es cota inferior de todas las sumas inferiores. Como $\overline{S}(f)$ es la mayor cota inferior, tenemos que $\overline{S}(f)\geq \frac{1}{2}-\frac{1}{2n}$ para todo $n$, y entonces $\overline{S}(f)\geq \frac{1}{2}$. Todo esto nos permite concluir que $\overline{S}(f)=\frac{1}{2}$.

De manera totalmente análoga (que te sugerimos argumentar cuidadosamente), se tiene que $\underline{S}(f)=\frac{1}{2}$. Concluimos entonces que $f$ es integrable en $[0,1]$ y que $$\int_0^1 f(x)\, dx = \frac{1}{2}.$$

$\triangle$

Aunque este ejemplo tuvo un intervalo y una función muy sencillas, se volvió algo elaborado justificar la parte de los ínfimos y supremos. Es por ello que nos conviene enunciar y demostrar algunos resultados sobre funciones integrables que nos permitirán determinar la integrabilidad con más comodidad.

Integral definida mediante particiones homogéneas y la condición de Riemann

Lo primero que haremos es demostrar que para que una función sea integrable, nos basta estudiar a las particiones homogéneas.

Teorema. Sean $f:\mathbb{R}\to \mathbb{R}$ una funcion acotada y $a\leq b$ reales. Sea $P_n$ la partición homogéneas del intervalo $[a,b]$ en $n$ partes. Supongamos que se da la siguiente igualdad de límites:

$$\lim_{n\to \infty} \overline{S}(f,P_n) = \lim_{n\to \infty} \underline{S}(f,P_n).$$

Entonces, la integral existe y es igual a ese límite en común.

Demostración. $\Leftarrow)$ La demostración sigue argumentos muy parecidos al ejercicio que presentamos como ejemplo arriba. Supongamos que los límites para las particiones homogéneas existen y son iguales a $L$. Estudiemos $\overline{S}(f)$. Por ser ínfimo de todas las sumas superiores, tendríamos en particular para las particiones homogéneas que $$\overline{S}(f)\leq \overline{S}(f,P_n),$$

para todo entero positivo $n$. Haciendo tender $n$ a infinito, obtenemos $\overline{S}(f) \leq L$. Por otro lado, sabemos que cualquier suma inferior es cota inferior de cualquier suma superior, en particular, cada $\underline{S}(f,P_n)$ es una de estas cotas inferiores. Como $\overline{S}(f)$ es la mayor de las cotas inferiores, tendríamos que $$\overline{S}(f)\geq \underline{S}(f,P_n).$$

Haciendo tender $n$ a infinito, obtenemos $\overline{S}(f)\geq L$. Así, $\overline{S}(f)=L$. Un argumento análogo demuestra que $\underline{S}(f)=L$, y por lo tanto la función es integrable en $[a,b]$.

$\square$

Un siguiente resultado importante es la condición de Riemann, que nos dice que para que una función sea integrable, nos basta encontrar una partición en donde la suma superior y la inferior estén tan cerca como querramos. A esto se le conoce como la condición de Riemann.

Teorema. Sean $f:\mathbb{R}\to \mathbb{R}$ una funcion acotada y $a\leq b$ reales. Se tiene que $f$ es integrable en $[a,b]$ si y sólo si para todo $\epsilon >0$ existe una partición $P_\epsilon$ tal que:

$$\overline{S}(f,P_\epsilon) \ – \ \underline{S}(f,P_\epsilon) < \epsilon .$$

Demostración. $\Rightarrow )$ Sea $f$ integrable. Debemos mostrar que para cada $\epsilon>0$ existe una partición $P_\epsilon$ tal que $$\overline{S}(f,P_\epsilon) \ – \ \underline{S}(f,P_\epsilon) < \epsilon.$$

Para ello, tomemos $\epsilon^*=\epsilon/2$. Como $\overline{S}(f)$ es ínfimo de las sumas superiores, entonces $\overline{S}(f)+\epsilon^\ast$ ya no es cota inferior para dichas sumas superiores, por lo que existe una partición $P$ tal que $\overline{S}(f,P) < \overline{S}(f)+\epsilon^*$. Así mismo, existe una partición $P’$ tal que $\underline{S}(f,P’) > \underline{S}-\epsilon^*$. Si $P_\epsilon$ es un refinamiento mutuo de $P$ y $P’$, tendríamos entonces que

\begin{align*}
\overline{S}(f,P_\epsilon)&<\overline{S}(f,P)<\overline{S}(f)+\epsilon^*\\
\underline{S}(f,P_\epsilon)&>\underline{S}(f,Q)>\underline{S}(f)-\epsilon^*.
\end{align*}

Multiplicando la segunda igualdad por $-1$ y sumando ambas, obtenemos entonces que

\begin{align*}
\overline{S}(f,P_\epsilon) \ – \ \underline{S}(f,P_\epsilon) &< \overline{S}(f) + \epsilon^* \ – \ \underline{S}(f) + \epsilon^* \\
&= 2 \epsilon^* \\
&= \epsilon .
\end{align*}

Aquí usamos que $\overline{S}(f)=\underline{S}(f)$ por ser $f$ integrable.

$\Leftarrow)$ Supongamos ahora que para todo $\epsilon$ se puede encontrar la partición $P_\epsilon$ que satisface $\overline{S}(f,P_\epsilon) \ – \ \underline{S}(f,P_\epsilon) < \epsilon$. Veremos que a partir de esto se puede probar que $ \overline{S}(f) = \underline{S}(f) .$

Por ser $\overline{S}(f)$ el ínfimo de todas las sumas superiores, se tiene que

$$\overline{S}(f,P_\epsilon) > \overline{S}(f) .$$

$$ \underline{S}(f,P_\epsilon) < \underline{S}(f) \Longrightarrow – \underline{S}(f,P_\epsilon) > – \underline{S}(f) .$$

$$\Longrightarrow \epsilon > \overline{S}(f,P_\epsilon) \ – \ \underline{S}(f,P_\epsilon) > \overline{S}(f) \ – \ \underline{S}(f) .$$

Y $\epsilon$ es tan pequeño como lo queramos, por lo tanto.

$$ \overline{S}(f) = \underline{S}(f) .$$

$\square$

Ejemplos de integral definida con los resultados que probamos

Veamos algunos ejemplos de cómo utilizar los resultados que acabamos de mostrar para demostrar que ciertas integrales definidas existen, y para encontrar su valor.

Ejemplo. Calculemos la integral de la función $f(x)=x$ en el intervalo $[3,4]$

Usaremos la técnica de los límites de las particiones homogéneas. Estudiaremos con detalle el caso de las sumas superiores y dejaremos el de las inferiores como ejercicio. Si la partición $P_n$ del intervalo $[a,b]$ es homogénea y en $n$ partes, las celdas tienen longitud $\frac{b-a}{n}$ y entonces son:

$$\left[a,a+\frac{b-a}{n}\right], \left[a+\frac{b-a}{n}, a+2\frac{b-a}{n}\right], \ldots, \left[a+(n-1)\frac{b-a}{n},b\right].$$

La función $f(x)=x$ es creciente, y entonces los máximos se alcanzan al final de cada intervalo. Así, para el intervalo $[3,4]$ tenemos:

\begin{align*}
\overline{S}(f,P_n)&=\sum_{i=1}^{n} f \left( 3+i \cdot \frac{4-1}{n} \right) \frac{4-3}{n}\\
&=\sum_{i=1}^{n} \left(3+ \frac{i}{n}\right) \frac{1}{n}\\
&=\sum_{i=1}^{n} \left(\frac{3}{n}+ \frac{i}{n^2}\right)\\
&=\sum_{i=1}^{n} \left(\frac{3}{n}\right) + \sum_{i=1}^{n} \left(\frac{i}{n^2}\right)\\
&=\frac{3}{n} \cdot n + \frac{1}{n^2} \sum_{i=1}^n i\\
&=3 + \frac{n(n+1)}{2n^2} \\
&=3 + \frac{1}{2} + \frac{1}{2n}\\
&=\frac{7}{2}+\frac{1}{2n}.
\end{align*}

De este modo,

$$\lim_{n\to\infty} \overline{S}(f,P_n) = \lim_{n\to\infty} \left(\frac{7}{2} + \frac{1}{2n}\right) = \frac{7}{2}.$$

Por tu cuenta, revisa que que también se cumple lo siguiente

$$\lim_{n\to\infty} \underline{S}(f,P_n) = \frac{7}{2}.$$

Así, por la proposición que mostarmos arriba, tenemos que la integral en el intervalo $[3,4]$ existe y por lo tanto:

$$ \int \limits_{3}^{4} x \, dx = \frac{7}{2}.$$

$\triangle$

Ejemplo. Ahora calculemos la integral de la función $f(x)=-x^2 + 3$ en el intervalo $[1,3]$ . Al hacer una figura, obtenemos la siguiente gráfica.

Observa que en este caso tenemos 2 áreas: del eje $x$ y otra por debajo del eje $x$. Todo lo que hemos hecho funciona tanto para funciones positivas, como negativas. Pero obtendremos algo interesante de la conclusión de este problema.

Para ver que la integral existe, usaremos nuevamente la técnica de las particiones homogéneas. Ahora haremos las sumas inferiores. Como la función es decreciente, los valores más chicos aparecen al final de cada intervalo. Tenemos entonces que:

\begin{align*}
\underline{S}(f,P)&=\sum_{i=1}^{n} \left( – \ \left( 1+i\cdot \left(\frac{3-1}{n}\right) \right)^2+3 \right) \left(\frac{3-1}{n} \right) \\
&=\sum_{i=1}^{n} \left(- \ \left(1+i\cdot \left(\frac{2}{n}\right)\right)^2+3\right) \left(\frac{2}{n}\right)\\
&=\sum_{i=1}^{n} \left( – \ \left(1+ \frac{4i}{n} + \frac{4 i^2}{n^2}\right)+3\right) \left(\frac{2}{n}\right)\\
&=\sum_{i=1}^{n} \left(\frac{ 4}{n} – \frac{8i} {n^2} – \frac{8 i^2}{n^3}\right)\\
&=\frac{4}{n} \sum_{i=1}^{n} – \frac{8}{n^2} \sum_{i=1}^{n} i – \frac{8}{n^3}\sum_{i=1}^{n} i^2\\
&=\frac{4}{n} \cdot n – \frac{8}{n^2} \frac{n(n+1)}{2} – \frac{8}{n^3} \frac{n(n+1)(2n+1)}{6} \\
&=4 \ – \ \frac{8n^2}{2n^2} \ – \ \frac{8n}{2n^2} \ – \ \frac{8 \cdot 2n^3}{6n^3} \ – \ \frac{8 \cdot 3n^2}{6n^3} \ – \ \frac{8n}{6n^3} \\
&= – \ \frac{8}{3} \ – \ \frac{8n}{2n^2} \ – \ \frac{8 \cdot 3n^2}{6n^3} \ – \ \frac{8n}{6n^3} .
\end{align*}

Así, $$\lim_{n\to\infty} \underline{S}(f,P)=-\frac{8}{3}.$$

Se puede mostrar que el límite de las sumas superiores para las particiones homogéneas también es $-\frac{8}{3}$ (verifícalo), así que la integral buscada tiene este valor. De esta forma,

$$ \int \limits_{1}^{3} -x^2 +3 \, dx = – 8/3 .$$

$\triangle$

¿Áreas negativas?

Se comentó que la integral se utiliza para el cálculo de áreas bajo la curva, entonces, ¿Por qué el resultado del ejemplo anterior es negativo? ¿Hay áreas negativas? Intuitivamente, no debería haber áreas negativas. Sin embargo, el procedimiento que usamos para definir a la integral definida sí nos puede dar números negativos. Puedes pensarlo como sigue: el área que estamos calculando va del eje $x$ a la gráfica de la función $f$. Si esa gráfica está por debajo, entonces estámos yendo en dirección negativa. En el último ejemplo hay tanto una región por encima del eje $x$, como una por debajo. El número que nos salió es la diferencia de ambas áreas: el área por arriba del eje $x$, menos el área por debajo del eje $x$. Como el resultado que obtuvimos fue negativo, entonces el área por debajo del eje $x$ era mayor en magnitud.

Esta es una propiedad un poco antintuitiva, pero es importante preservarla. El cálculo de áreas es sólo una de las aplicaciones que tiene la integral. En otras aplicaciones, es importante que la integral mida qué tanto estuvimos por encima del eje $x$ y qué tanto estuvimos por debajo.

¿Y si queremos realmente entender la suma de las dos áreas de la figura y no la resta? En ese caso, tendremos que hacer una figura para entender cómo hacer las cuentas. Si hay área que está por debajo del eje $x$, deberemos agregar un signo $-$ para contarla correctamente como área positiva. Pero entonces tendremos que partir nuestro intervalo de integración en varios intervalos de acuerdo a cuándo la gráfica de $f$ cruza al eje $x$.

Con esto en mente, retomemos el ejemplo anterior.

Ejemplo. Encontremos el área en valor absoluto que genera la función $f(x)=-x^2 + 3$ en el intervalo $[1,3]$.

Lo primeo que haremos es obtener el punto donde la función cruza al eje $x$. Para ello, se requiere que $-x^2+3=0$, que en dicho intervalo sucede en $x=\sqrt{3}$.

Una vez encontrado el punto raíz o la raíz de la función, ahora podemos partir el área absoluta que nos interesa en dos intervalos: el $[1,\sqrt{3}]$ y el $[\sqrt{3},3]$.

Pensando en que queremos calcular el área absoluta, necesitamos dividir la formula que se planteó anteriormente en los intervalos correspondientes, y en el intervalo $[\sqrt{3},3]$ será necesario agregar un signo menos para que el área que se calcula como negativa, ahora se cuente de manera positiva. De esta manera, tendríamos:

$$ F_1^3 = \int \limits_{1}^{\sqrt 3} -x^2 +3 \, dx \ – \ \int \limits_{\sqrt 3}^{3} -x^2 +3 \, dx .$$

Ahora queda replicar el proceso que vimos en la suma anterior con estos 2 nuevos intervalos y juntarlos considerando el cambio de signo. Desarrollando los cálculos, se encuentra que el área generada por la función es de:

$$F_1^ 3= 4 \sqrt 3 \ – \ \frac{8}{3}.$$

$\triangle$

Nota. En este ejemplo partimos el intervalo en dos subintervalos, pero el intervalo puede quedar partido tantas veces como la función $f$ lo requiera, de acuerdo a la cantidad de veces que se cruza el eje $x$.

Más adelante…

En esta entrada dimos la definición formal de que una función sea integrable en cierto intervalo. O mejor dicho, que sea Riemann integrable. En cursos más avanzados de matemáticas se definen y estudian otras nociones de integrabilidad, pero por ahora esta es la que nos interesa. Para que la integral de Riemann exista, necesitamos que coindidan el ínfimo de las sumas superiores y el supremo de las sumas inferiores de la función dada. En ese caso, el valor de la integral es ese valor en común.

Ya dada la definición, dimos algunos resultados que nos ayudarán a determinar cuándo una función es integrable. En siguientes entradas daremos más propiedades que nos ayudarán entender mejor la integrabilidad y la integral. Varias entradas despuésse hablará de las integrales indefinidas y del teorema fundamental del cálculo, que daran pie a numerosas técnicas de integración.

Lo último que hicimos en esta entrada es notar que hay casos en donde el valor de la integral que se encuentra es negativo. Esto contradice un poco nuestra intuición de que la integral es un área. Sin embargo, ya platicamos qué hacer en este caso si queremos realmente el «área positiva». Seguiremos explorando esta idea de integrales negativas un poco más adelante. Por ahora, lo que puedes hacer es identificar los intervalos en los que la función tiene determinado signo.

Tarea moral

Completa las cuentas que quedaron pendientes en cada uno de los ejercicios.
Expresa la siguiente expresión como una integral en el intervalo $[0,\pi]$. $$\lim_{n \rightarrow \infty} \sum_{i=1}^n (x_i^3 + x_i ~ sin (x_i)) \triangle x .$$
Encuentra el área delimitada por la curva $f(x)=x^2 +2 $ y el eje $x$ en el intervalo $[1,4]$.

4. Encuentra el valor del área delimitada por la gráfica de la función$f(x)= x^3-6x$ en el intervalo $[0,3]$, que es la zona sombreada. Realiza las cuentas tanto con áreas absolutas, tanto con áreas con signo.

5. Encuentra el área de la función $f(x)=\sqrt {1-x^2}$ en el intervalo $[0,1]$.

Entradas relacionadas

Página del curso: Cálculo Diferencial e Integral II
Entrada anterior: Motivación de integral, sumas superiores e inferiores
Entrada siguiente: Propiedades de la integral definida