Archivo de la etiqueta: límites

Cálculo Diferencial e Integral III: Derivadas parciales de segundo orden

Por Alejandro Antonio Estrada Franco

Introducción

En las entradas anteriores definimos qué quiere decir que un campo escalar sea diferenciable. Así mismo, definimos las derivadas parciales y el gradiente. Ya usamos estas herramientas para hablar de dirección de cambio máximo y de puntos críticos. Además demostramos una versión del teorema del valor medio para este caso, lo que nos permitió poner un poco de orden a nuestra teoría: una función es diferenciable en un punto cuando existen sus parciales en ese punto y son continuas. Es momento de hablar de derivadas parciales de segundo orden. Cualquiera de las derivadas parciales es por sí misma un campo escalar, así que podemos preguntarnos si tiene o no sus propias derivadas parciales. Exploraremos esta idea.

Derivadas parciales de segundo orden

Las derivadas parciales de un campo escalar $f$ nos originan nuevos campos escalares. Supongamos que $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}$ es un campo escalar para el cual existe la $k$-ésima derivada parcial en un conjunto abierto $S’\subseteq S$. Entonces, obtenemos un nuevo campo escalar $\frac{\partial f}{\partial x_{k}}:S’\rightarrow \mathbb{R}$.

Este campo escalar puede o no tener $j$-ésima derivada parcial. Suponiendo que la tiene en algún $U\subseteq S’$ podríamos escribirla como

$$\frac{\partial\left(\frac{\partial f}{\partial x_k}\right)}{\partial x_j}.$$

Sin embargo, esta notación es engorrosa, y por ello optamos o bien por escribir la expresión como sigue

\[ \frac{\partial}{\partial x_{j}}\left( \frac{\partial f}{\partial x_{k}}\right)\]

o todavía más compacto, como

\[ \frac{\partial ^{2}f}{\partial x_{j}\partial x_{k}}.\]

A esto le llamamos una derivada parcial de segundo orden. Si $j=k$, introducimos la notación

\[ \frac{\partial ^{2}f }{\partial x_{k}^{2}}.\]

Las derivadas parciales de segundo orden vuelven a ser, una vez más, cada una de ellas un campo escalar. Esto permite seguir iterando la idea: podríamos hablar de derivadas parciales de segundo, tercero, cuarto, … , $k$-ésimo, … orden. Daremos una definición un poco más formal en una siguente entrada, pero por ahora trabajemos en entender a las derivadas parciales de segundo orden.

Un ejemplo de derivadas parciales de segundo orden

Ejemplo. Consideremos el campo escalar $f(x,y,z)=x^{2}yz$. Para este campo escalar tenemos que sus derivadas parciales con respecto a $x$, $y$ y $z$ son:

\begin{align*}
\frac{\partial f}{\partial x}(x,y,z)&=2xyz,\\
\frac{\partial f}{\partial y}(x,y,z)&=x^{2}z\\
\frac{\partial f}{\partial z}(x,y,z)&=x^{2}y.
\end{align*}

Cada una de estas expresiones es a su vez un campo escalar. Cada una de ellas es derivable con respecto a $x$ en todo $\mathbb{R}^3$. Al derivarlas con respecto a $x$ obtenemos:

\begin{align*}
\frac{\partial ^{2}f}{\partial x^{2}}(x,y,z)&=2yz,\\
\frac{\partial ^{2}f}{\partial x\partial y}(x,y,z)&=2xz,\\
\frac{\partial ^{2}f}{\partial x\partial z}(x,y,z)&=2xy.
\end{align*}

Por otro lado, las derivadas parciales de primer orden también podríamos haberlas derivado con respecto a $y$. En este caso, hubieramos obtenido.

\begin{align*}
\frac{\partial ^{2}f}{\partial y \partial x}(x,y,z)&=2xz,\\
\frac{\partial ^{2}f}{\partial y ^2}(x,y,z)&=0,\\
\frac{\partial ^{2}f}{\partial y\partial z}(x,y,z)&=x^2.
\end{align*}

También podríamos derivar a las derivadas parciales de primer orden con respecto a $z$ para obtener las tres derivadas de orden dos faltantes. En total tenemos tres derivadas parciales de primer orden y nueve derivadas parciales de segundo orden.

$\triangle$

Igualdad de las derivadas parciales de segundo orden mixtas

En numerosos campos escalares de interés tenemos una propiedad muy peculiar: que los operadores «obtener la derivada parcial con respecto a $x$» y «obtener la derivada parcial con respecto a $y$» conmutan. Es decir, varias veces podemos intercambiar el orden de derivación de las parciales y obtener el mismo resultado. En el ejemplo anterior quizás hayas notado que

\[ \frac{\partial ^{2}f}{\partial y\partial x}=2xz=\frac{\partial ^{2}f}{\partial x\partial y}.\]

Esto no siempre pasa, pero hay criterios de suficiencia sencillos de verificar. Por ejemplo, basta que las parciales mixtas existan y sean continuas para que sean iguales. El siguiente teorema formaliza el resultado.

Teorema. Sea $f:S\subseteq \mathbb{R}^{2}\rightarrow \mathbb{R}$ un campo escalar tal que las derivadas parciales $\frac{\partial f}{\partial x}$, $\frac{\partial f}{\partial y}$, $\frac{\partial^{2} f}{\partial y\partial x}$, $\frac{\partial ^{2}f}{\partial x\partial y}$ existen en un conjunto abierto $U$. Si $(a,b)\in U$ es tal que $\frac{\partial^{2} f}{\partial y\partial x}$, $\frac{\partial ^{2}f}{\partial x\partial y}$ son continuas en $(a,b)$, entonces dichas derivadas mixtas de segundo orden son iguales en $(a,b)$.

Demostración. Sean $h,k\neq 0$ suficientemente chicos para que los puntos en el plano $(a,b)$, $(a,b+k)$, $(a+h,b)$, y $(a+h,b+k)$ estén en $U$.

Definamos la función $\Gamma (x)=f(x,b+k)-f(x,b)$ para $x\in [a,a+h]$ y definamos

\begin{equation} \Delta (h,k)=\Gamma (a+h)-\Gamma (a).\end{equation}

Notemos que $\Gamma$ es una función de $\mathbb{R}$ en $\mathbb{R}$ cuya derivada es $$\Gamma'(x)=\frac{\partial f}{\partial x}(x,b+k)-\frac{\partial f}{\partial x}(x,b).$$ Así, se le puede aplicar el teorema del valor medio con extremos en $a$ y $a+h$ para concluir que existe $\xi _{1}\in [a,a+h]$ que nos permite escribir $\Delta(h,k)$ de la siguiente manera:

\begin{align*}
\Delta(h,k)&=\Gamma (a+h)-\Gamma (a)\\
&= h\Gamma'(\xi _{1})\\
&=h\left[ \frac{\partial f}{\partial x}(\xi _{1},b+k)-\frac{\partial f}{\partial x}(\xi _{1},b) \right]
\end{align*}

Ahora podemos aplicar el teorema del valor medio en la función $y\mapsto \frac{\partial f}{\partial x} (\xi _{1},y)$ con extremos $b$ y $b+k$. Esto nos permite continuar la cadena de igualdades anterior mediante un $\eta _{1}\in [b,b+k]$ que cumple

\begin{equation}\label{eq:primerdelta} \Delta (h,k)=hk\frac{\partial ^{2}f}{\partial y\partial x}(\xi _{1},\eta _{1}).\end{equation}

Como $(\xi _{1},\eta _{1})\in [a,a+h]\times[b,b+k]$, se tiene que $(\xi _{1},\eta _{1})\to (a,b)$ conforme $(h,k)\to \bar{0}$.

Ahora consideremos análogamente a la función $\varLambda (y)=f(a+h,y)-f(a,y)$. Mediante un procedimiento similar al que acabamos de hacer, pero aplicado a $\varLambda$ en vez de a $\Gamma$, se tiene otra forma de expresar a $\Delta(h,k)$:

\begin{equation}\label{eq:segundodelta}\Delta(h,k)=hk\frac{\partial ^{2} f}{\partial x\partial y}(\xi _{2},\eta _{2}),\end{equation} donde $(\xi _{2},\eta _{2})\in [a,a+h]\times[b,b+k]$. Nuevamente, $(\xi _{2},\eta _{2})\to (a,b)$ conforme $(h,k)\to (0,0)$.

Igualando las expresiones en \eqref{eq:primerdelta} y \eqref{eq:segundodelta}, tenemos lo siguiente:

\[ \frac{\partial f}{\partial y\partial x}(\xi _{1},\eta _{1})=\frac{\partial f}{\partial x\partial y}(\xi _{2},\eta _{2}).\]

El resultado se sigue de hacer tender $(h,k)\to (0,0)$, ya que dado que las derivadas parciales les estamos pidiendo que sean continuas, tenemos que:

\begin{align*}
\frac{\partial ^{2} f}{\partial y\partial x}(a,b)&=\lim\limits_{(h,k)\to (0,0)}\frac{\partial ^{2} f}{\partial y\partial x}(\xi _{1},\eta _{1})\\
&=\lim\limits_{(h,k)\to (0,0)}\frac{\partial ^{2}f}{\partial x\partial y}(\xi _{2},\eta _{2})\\
&=\frac{\partial ^{2}f}{\partial x\partial y}(a,b).
\end{align*}

Así concluimos nuestro resultado.

$\square$

Más adelante…

En esta entrada hablamos de las derivadas parciales de segundo orden y vimos que bajo condiciones razonables podemos elegir las variables de derivación en el orden que queramos. Estas ideas son más generales, y a continuación nos llevarán a definir las derivadas parciales de cualquier orden $k$. Después, usaremos estas derivadas parciales para generalizar otro de los teoremas de cálculo unidimensional: el teorema de Taylor.

Tarea moral

  1. Para las siguientes funciones calcula $\frac{\partial ^{2}f}{\partial x^{2}}$:
    • $f(x,y)=x^{2}+y^{2}cos(xy)$
    • $f(x,y)=e^{x}cos(y)$
    • $f(x,y,z)=\textup{log}(x^{2}+2y^{2}-3z^{2})$
  2. En el teorema que afirma que las derivadas parciales mixtas son iguales usamos cuatro veces el teorema del valor medio (¿cuáles 4 son?). Asegúrate de que en verdad lo podamos usar.
  3. Calcula $\frac{\partial ^{2}f}{\partial y^{2}}$, y $\frac{\partial ^{2}f}{\partial x\partial y}$ para las funciones del punto 1. Explica por qué no es necesario calcular de manera separada $\frac{\partial ^{2}f}{\partial y\partial x}$
  4. Investiga de un ejemplo en el que las derivadas parciales $\frac{\partial ^{2}f}{\partial x\partial y}$ y $\frac{\partial ^{2}f}{\partial y\partial x}$ no sean iguales. Realiza las cuentas para verificar que en efecto tienen valores distintos en algún punto.
  5. El teorema que enunciamos está muy limitado. Sólo nos habla de campos escalares de $\mathbb{R}^2$ en $\mathbb{R}$. Sin embargo, debería también funcionar si $f:\mathbb{R}^n\to \mathbb{R}$. Enuncia y demuestra un resultado similar que te permita garantizar que $$\frac{\partial^{2} f}{\partial x_i\partial x_j}=\frac{\partial ^{2}f}{\partial x_j\partial x_i}.$$

Entradas relacionadas

Cálculo Diferencial e Integral III: Teorema del valor medio para campos escalares

Por Alejandro Antonio Estrada Franco

Introducción

Ya hemos definido qué es el gradiente $\nabla f$ de un campo escalar $f$. Hemos visto cómo está relacionado con las derivadas direccionales. Así mismo, mostramos que conocer este gradiente nos permite dar información sobre los máximos y mínimos del campo escalar. En esta entrada mostraremos una propiedad más del gradiente: que nos ayuda a dar una generalización del teorema del valor medio de Cálculo I, pero para campos escalares. Este será un resultado fundamental para demostrar otras propiedades de los campos escalares. Como ejemplo, también damos en esta entrada un criterio suficiente para que un campo escalar sea diferenciable.

Teorema del valor medio para funciones de $\mathbb{R}$ en $\mathbb{R}$

Para facilitar la lectura de este material, recordemos lo que nos dice el teorema del valor medio sencillo, es decir, el de $\mathbb{R}$ en $\mathbb{R}$.

Teorema. Sean $a<b$ reales. Sea $f:[a,b]\to\mathbb{R}$ una función continua en el intervalo $[a,b]$ y diferenciable en el intervalo $(a,b)$. Entonces existe algún punto $c\in (a,b)$ tal que $$f'(c)=\frac{f(b)-f(a)}{b-a}.$$

Una vez que uno interpreta el teorema gráficamente, se vuelve muy intuitivo. Considera la siguiente figura.

Intuición geométrica del teorema del valor medio

El término $$\frac{f(b)-f(a)}{b-a}$$ es la pendiente del segmento que une los puntos $(a,f(a))$ y $(b,f(b))$ El término $f'(c)$ va marcando la pendiente de la recta tangente a $f$ en cada punto $c$. En términos geométricos, lo que nos dice este teorema es que para algún valor de $c$, la pendiente de la recta tangente en $c$ es la pendiente del segmento entre los extremos.

Lo que haremos a continuación es dar una generalización apropiada para funciones de $\mathbb{R}^n$ a $\mathbb{R}$.

Teorema del valor medio para funciones de $\mathbb{R}^n$ en $\mathbb{R}$

Para generalizar el teorema del valor medio a funciones de $\mathbb{R}^n$ a $\mathbb{R}$, necesitaremos cambiar un poco las hipótesis. El segmento $[a,b]$ que usábamos ahora será un segmento (multidimensional) que conecte a dos vectores $\bar{x}$ y $\bar{y}$ en $\mathbb{R}^n$. La diferenciabilidad la pediremos en todo un abierto que contenga al segmento. El enunciado apropiado se encuentra a continuación.

Teorema (del valor medio para campos escalares). Sea $S$ un abierto de $\mathbb{R}^n$. Tomemos $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}$ un campo escalar diferenciable. Sean $\bar{x}$ y $\bar{y}$ en $S$ tales que el segmento que une a $\bar{x}$ con $\bar{y}$ se queda contenido en $S$. Entonces, existe $c \in (0,1)$ tal que $$\nabla f((1-c )\bar{x}+c \bar{y})\cdot (\bar{y}-\bar{x})=f(\bar{y})-f(\bar{x}).$$

En este caso no podemos «pasar dividiendo $\bar{y}-\bar{x}$» pues no tiene sentido dividir entre vectores. Pero en el caso $n=1$ sí se puede, y justo obtenemos de vuelta el teorema del valor medio de $\mathbb{R}$ en $\mathbb{R}$. Uno podría pensar que entonces esta es una manera alternativa de demostrar el teorema para funciones de $\mathbb{R}$ en $\mathbb{R}$. Sin embargo, como veremos a continuación, la demostración de la versión para campos escalares usa la versión para funciones reales.

Demostración. Consideremos la función $\gamma:[0,1] \to \mathbb{R}^{n}$ dada $\gamma (t)=(1-t)\bar{x}+t\bar{y}$. Notemos que $\gamma$ es diferenciable, con $\gamma’ (t)=\bar{y}-\bar{x}$. Además, por hipótesis $f$ es diferenciable en $S$. Así, $f\circ \gamma:[0,1]\to \mathbb{R}$ también es diferenciable, y por regla de la cadena

\begin{align*}
(f\circ \gamma)'(t)&=\nabla f(\gamma(t))\cdot \gamma'(t)\\
&=\nabla f(\gamma(t))\cdot (\bar{y}-\bar{x}).
\end{align*}

¡Pero $f\circ \gamma$ ya es una función de $\mathbb{R}$ en $\mathbb{R}$! Así, podemos aplicarle el teorema del valor medio real (verifica las hipótesis como tarea moral). Al hacer esto, obtenemos que existe una $c\in (0,1)$ tal que
\begin{align*}
(f\circ \gamma)'(c) &= \frac{(f\circ \gamma)(1)-(f\circ \gamma)(0)}{1-0}\\
&=f(\bar{y})-f(\bar{x}).
\end{align*}

Usando la fórmula que obtuvimos por regla de la cadena para $(f\circ \gamma)’$ y la definición de $\gamma$ obtenemos que

$$ \nabla f((1-c)\bar{x}+c\bar{y})\cdot (\bar{y}-\bar{x})=f(\bar{y})-f(\bar{x}),$$

tal y como buscábamos.

$\square$

En el teorema anterior estamos pidiendo que $f$ sea diferenciable. Sin embargo, basta con que exista la derivada de la composición en el segmento que nos interesa y el resultado también se sigue. Es decir, tenemos la siguiente versión con una hipótesis más débil. La enunciamos pues la usaremos en la siguiente sección.

Teorema (del valor medio para campos escalares, hipótesis debilitada). Sea $S$ un abierto de $\mathbb{R}^n$. Tomemos $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}$ un campo escalar. Sean $\bar{x}$ y $\bar{y}$ en $S$ tales que el segmento que une a $\bar{x}$ con $\bar{y}$ se queda contenido en $S$ y tales que para toda $c\in[0,1]$ se cumple que la derivada (real) de $f((1-c)\bar{x}+c\bar{y}))$ existe. Entonces, existe $c \in (0,1)$ tal que $$\nabla f((1-c )\bar{x}+c \bar{y})\cdot (\bar{y}-\bar{x})=f(\bar{y})-f(\bar{x}).$$

La demostración es exactamente la misma.

Aplicación del teorema del valor medio

Como primera aplicación del teorema del valor medio para campos escalares mostraremos un criterio de diferenciabilidad muy útil, al que llamaremos el teorema de diferenciabilidad y derivadas parciales.

Teorema. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}$ un campo escalar. Supongamos que para cierto punto $\bar{a}\in S$ y cierta vecindad $B_r(\bar{a})\subset S$ existen las derivadas parciales $\frac{\partial f}{\partial x_{1}},\dots ,\frac{\partial f}{\partial x_{n}}$ y son continuas en $\bar{a}$. Entonces $f$ es diferenciable en $\bar{a}$.

Demostración. Elijamos un vector $\bar{u}=u_1\hat{e}_1+\dots +u_n\hat{e}_n$ de norma $1$ y tomemos $\bar{v}=\lambda \bar{u}$ con $\lambda$ suficientemente chico como para que $\bar{a}+\bar{v}$ esté en $B_{r}(\bar{a})$. Definamos los siguientes vectores:

\begin{align*}
\bar{v}_0&=\bar{0}\\
\bar{v}_1&=u_1\hat{e}_1\\
\bar{v}_2&=u_1\hat{e}_1+u_2\hat{e}_2\\
&\vdots\\
\bar{v}_n&=u_1\hat{e}_1+u_2\hat{e}_2+\ldots+u_n\hat{e}_n=\bar{u}.
\end{align*}

Con ellos creamos la siguiente suma telescópica para expresar a $f(\bar{a}+\bar{v})-f(\bar{a})$

\begin{align}
f(\bar{a}+\bar{v})-f(\bar{a})&=f(\bar{a}+\lambda \bar{u})-f(\bar{a}) \nonumber\\
&=\sum_{k=1}^{n}[f(\bar{a}+\lambda \bar{v}_{k})-f(\bar{a}+\lambda \bar{v}_{k-1})] \label{eq:telescopica}
\end{align}

Notemos que el $k$-ésimo término de esta suma puede ser escrito como $$f(\bar{a}+\lambda \bar{v}_{k-1}+\lambda u_{k}\hat{e}_{k})-f(\bar{a}+\lambda \bar{v}_{k-1}).$$ Para simplificar, definimos $\bar{b}_{k}=\bar{a}+\lambda \bar{v}_{k-1}$ y reescribiendo el $k$-ésimo término tenemos $$f(\bar{b}_{k}+\lambda u_{k}\hat{e}_{k})-f(\bar{b}_{k}).$$

Aplicando el teorema del valor medio con hipótesis debilidada para campos escalares a los puntos $\bar{b}_{k}$ y $\bar{b}_{k}+\lambda u_{k}\hat{e}_{k}$ (verifica las hipótesis), tenemos que para cada $k$ existe $\xi_k \in (0,1)$ tal que

\begin{align*}
f(\bar{b}_{k}+\lambda u_{k}\hat{e}_{k})-f(\bar{b}_{k})&=\triangledown f((1-\xi_k )\bar{b}_{k}+\xi_k (\bar{b}_{k}+\lambda u_{k}\hat{e}_{k}))\cdot (\lambda u_{k}\hat{e}_{k})\\
&=\lambda u_{k}\frac{\partial f}{\partial x_{k}}(\bar{c}_{k}),
\end{align*}

en donde hemos definido $\bar{c}_k:=(1-\xi_k )\bar{b}_{k}+\xi_k (\bar{b}_{k}+\lambda u_{k}\hat{e}_{k})$, que es un punto en el segmento que une a $\bar{b}_k$ con $\bar{b}_k+\lambda u_k\hat{e}_k$.

Tenemos pues que podemos escribir al $k$-ésimo término como:

$$f(\hat{b}_{k}+\lambda u_{k}\hat{e}_{k})-f(\bar{b}_{k})=\lambda u_{k}\frac{\partial f}{\partial x_{k}}(\bar{c}_{k}).$$

Notemos además que si $\lambda \to 0$, entonces $\bar{b}_{k}\to \bar{a}$, $\bar{c}_{k} \to a$ y $\bar{v}\to \bar{0}$.

Escribimos entonces la ecuación \eqref{eq:telescopica} como:

\begin{equation}
\label{eq:resumen}
f(\bar{a}+\bar{v})-f(\bar{a})=\lambda \sum_{k=1}^{n}u_k\frac{\partial f}{\partial x_{k}}(\bar{c}_{k})
\end{equation}

En unos momentos usaremos esta expresión. Antes de ello, estudiemos otro de los términos involucrados en la diferenciabilidad. Tenemos que:

\begin{align}
\triangledown f(\bar{a})\cdot \bar{v}&=\triangledown f(\bar{a})\cdot \lambda u \nonumber\\
&=\lambda \triangledown f(\bar{a})\cdot u \nonumber\\
&=\lambda \sum_{k=1}^{n}u_{k}\frac{\partial f}{\partial x_{k}}(\bar{a}) \label{eq:ppunto}.
\end{align}

Empecemos entonces a combinar lo visto hasta ahora para entender los términos en la definición de diferenciabilidad. Tenemos juntando \eqref{eq:resumen} y \eqref{eq:ppunto} que

\begin{align*}
f(\bar{a}+\bar{v})-f(\bar{a})-\triangledown f(\bar{a})\cdot v&=\lambda \sum_{k=1}^{n}u_{k}\frac{\partial f}{\partial x_{k}}(\bar{c}_{k})-\lambda \sum_{k=1}^{n}u_{k}\frac{\partial f}{\partial x_{k}}(\bar{a})\\&=\lambda \sum_{k=1}^{n}u_{k}\left[ \frac{\partial f}{\partial x_{k}}(\bar{c}_{k})-\frac{\partial f}{\partial x_{k}}(\bar{a}) \right].
\end{align*}

Como mencionamos, si $\lambda \to 0$ entonces $\bar{v}\to \bar{0}$. Además, $||\bar{v}||=|\lambda|$. Así:

\[ \lim\limits_{\bar{v}\to \bar{0}} \frac{|f(\bar{a}+\bar{v})-f(\bar{a})-\triangledown f(\bar{a})\cdot \bar{v}|}{||\bar{v}||}=\lim\limits_{\lambda \to 0} \left|\sum_{k=1}^{n}\left[ \frac{\partial f}{\partial x_{k}}(\bar{c}_{k})-\frac{\partial f}{\partial x_{k}}(\bar{a}) \right]u_{k}\right|.\]

Veamos qué más sucede cuando $\lambda \to 0$. Ya notamos que $\bar{c}_k\to \bar{a}$, así que usando la continuidad de las derivadas parciales tenemos:

\[ \lim\limits_{\lambda \to 0}\frac{\partial f}{\partial x_{k}}(\bar{c}_{k})=\lim\limits_{\bar{c}_{k}\to \bar{a}}\frac{\partial f}{\partial x_{k}}(\bar{c}_{k})=\frac{\partial f}{\partial x_{k}}(\bar{a}).\]

Aplicando desigualdad del trángulo en la suma, el límite buscado es menor o igual a

\[ \lim\limits_{\lambda \to 0}\sum_{k=1}^{n}\left|\left[ \frac{\partial f}{\partial x_{k}}(\bar{c}_{k})-\frac{\partial f}{\partial x_{k}}(\bar{a}) \right]u_{k}\right|=0.\]

Y aquí cada sumando se va a $0$. La conclusión final es que

\[ \lim\limits_{\bar{v}\to \bar{0}}\frac{|f(\bar{a}+\bar{v})-f(\bar{a})-\triangledown f(\bar{a})\cdot \bar{v}|}{||\bar{v}||}=0,\]

de modo que $f$ es diferenciable en $\bar{a}$.

$\square$

El regreso del teorema anterior no se vale

El teorema de diferenciabilidad nos dice que si las derivadas parciales existen y son continuas, entonces la función es diferenciable. Sin embargo, el regreso de este teorema no se vale, en el sentido de que existen funciones diferenciables cuyas derivadas parciales no son continuas. En otras palabras, si las derivadas parciales no son continuas, no podemos descartar la diferenciablidad de una función.

A continuación esbozamos un ejemplo que deberás completar como tarea moral.

Ejemplo. Consideremos la función

$$f(x,y)=\begin{cases} (x^2+y^2)\sin\left(\frac{1}{\sqrt{x^2+y^2}}\right) &\text{si $(x,y)\neq (0,0)$}\\ 0 & \text{si $(x,y)=(0,0)$}\end{cases}$$

Se puede demostrar que $f$ es diferenciable en $(0,0)$. De manera intuitiva, la función queda entre las funciones $(x,y)\to x^2+y^2$ y $(x,y)\to -x^2-y^2$. Se puede usar un argumento de acotamiento para mostrar que el plano tangente coincide entonces con el de estas funciones en $(0,0)$ que es el plano $z=0$. Verifica los detalles de tarea moral.

Así mismo, se puede ver que las derivadas parciales en $(0,0)$ existen y que de hecho se satisface $$\frac{\partial f}{\partial x} (0,0) = \frac{\partial f}{\partial y} (0,0) = 0.$$

Finalmente, se puede ver que las derivadas parciales no convergen a $0$. Fuera del $(0,0)$, tenemos por reglas de derivación que

\begin{align*} \frac{\partial f}{\partial x}(x,y) &= 2 x \sin \left(\frac{1}{\sqrt{x^2+y^2}}\right)-\frac{x \cos \left(\frac{1}{\sqrt{x^2+y^2}}\right)}{\sqrt{x^2+y^2}}\\ \frac{\partial f}{\partial y}(x,y) &= 2 y \sin \left(\frac{1}{\sqrt{x^2+y^2}}\right)-\frac{y \cos \left(\frac{1}{\sqrt{x^2+y^2}}\right)}{\sqrt{x^2+y^2}}. \end{align*}

Una manear de ver que estas no son contínuas es aproximándonos por un eje. Por ejemplo, puedes verificar que sobre el eje $x$, conforme $x\to 0$, tenemos que la primera parcial oscila entre $-1$ y $1$.

$\triangle$

Más adelante…

Hemos enunciado y demostrado una versión del teorema del valor medio para campos escalaras. Gracias a ella hemos podido mostrar que si un campo escalar tiene derivadas parciales continuas, entonces es diferenciable. Las aplicaciones del teorema del valor medio para campos escalares van más allá. En la siguiente entrada hablaremos de las derivadas parciales de orden superior. El teorema del valor medio para campos escalares nos permitirá demostrar que bajo ciertas condiciones, en cierto sentido estas derivadas parciales «conmutan».

Tarea moral

  1. ¿Qué dice el teorema del valor medio para campos escalares para la función $f(x,y)=\sin(x)\cos(y)$ tomando como extremos los puntos $\left(0,\frac{\pi}{2}\right)$ y $\left(\frac{\pi}{2},0\right)$? Verifica si puedes aplicar las hipótesis.
  2. En la demostración del teorema del valor medio que dimos, verifica que la función $f\circ \gamma$ dada en efecto satisface las hipótesis del teorema del valor medio real.
  3. Supongamos que $f:\mathbb{R}^n\to \mathbb{R}$ es diferenciable en un abierto $S$ que contiene al segmento cuyos extremos son ciertos vectores $\bar{x}$ y $\bar{y}$ de $\mathbb{R}^n$. Supongamos que $f(\bar{x})=f(\bar{y})$. ¿Será cierto siempre que $\nabla f$ se anula en algún vector del segmento que une $x$ con $y$? Ten cuidado, pues hay un producto escalar involucrado. En caso de que no siempre sea cierto, ¿Qué es lo que sí puedes garantizar?
  4. En la demostración del teorema de diferenciabilidad, verifica que se pueden usar las hipótesis del teorema del valor medio para campos escalares con hipótesis debilitada. Necesitarás ver que la derivada real que tiene que existir es justo una parcial de las que suponemos que existen, completa los detalles. Luego, verifica que en efecto la conclusión que obtuvimos es justo la que se obtiene. Observa además que no podemos usar el teorema del valor medio para campos diferenciables con la hipótesis usual pues necesitaríamos saber que $f$ es diferenciable, lo cual es justo lo que queremos mostrar.
  5. Completa el contraejemplo al regreso del teorema de diferenciabilidad. Entre otras cosas, tienes que hacer lo siguiente:
    • Verificar que en efecto la función es diferenciable en $(0,0)$. Puedes proceder por definición o acotando como se sugiere.
    • Revisar que las parciales en $(0,0)$ en efecto existen y coinciden con lo que sabemos a partir de que el plano tangente en el origen es $(0,0)$.
    • Obtener paso a paso la fórmula que dimos para las parciales, usando lo que sabes de regla de la cadena, derivadas en $\mathbb{R}$, etc.
    • Verificar que ninguna de las dos derivadas parciales es continua, completando el argumento de que al acercarnos por los ejes tenemos oscilaciones.

Entradas relacionadas

Cálculo Diferencial e Integral I: Definición intuitiva de límite de una función

Por Juan Manuel Naranjo Jurado

Introducción

La definición de límite de una función suele ser uno de los conceptos más retadores dentro del cálculo y es por ello que, antes de entrar a su análisis formal, queremos dar una introducción con la finalidad de desarrollar la intuición necesaria para lograr el dominio de esta definición.

Idea intuitiva de límite de una función

Consideremos la función $f(x) = 5x$.

Supongamos que en este caso $x_0 = 7$ y, por tanto, $L = f(x_0) = 35$. Sabemos que $f(x)$ se aproxima a $35$ mientras más cerca estemos de $7$.

¿Podemos encontrar un valor de $x$ lo suficientemente cercano a $7$, sin ser $7$, tal que $f(x)$ esté a una distancia menor de $11$ del $35$, es decir, $|f(x) – 35| < 11$?

Sí. Si consideramos $x = 5$, entonces $f(5) = 25$ y $|f(5) – 35| = |25 – 35| = 10 < 11$

¿Podemos encontrar un valor de $x$ lo suficientemente cercano a $7$, sin ser $7$, tal que $f(x)$ esté a una distancia menor de $7$ del $35$, es decir, $|f(x) – 35| < 7$?

Nuevamente la respuesta es sí, y podemos considerar $x=8$. De esta forma $|f(8) – 35| = |40 – 35| = 5 < 7$.

Hasta este momento se han encontrado valores puntuales que nos permiten aproximarnos a $35$ mediante $f$, pero para nuestro estudio requerimos más que solo un punto, buscamos más bien un intervalo de $x$, específicamente un intervalo de $x$ al rededor de $x_0$, que en este caso es $7$. A partir de ahora nos enfocaremos en encontrar dicho intervalo.

¿Qué pasa si ahora queremos encontrar un intervalo de $x$ al rededor de $7$ para tener una distancia menor a $\frac{1}{1000}$ en nuestra aproximación, es decir, $|f(x) – 35| < \frac{1}{1000}$?

Un poco menos inmediato, pero definitivamente podemos resolver el problema. Buscamos lo siguiente:

\begin{gather*}
|f(x) – 35| < \frac{1}{1000} \\
\Rightarrow |5x – 35|< \frac{1}{1000} \\
\Rightarrow |x – 7| < \frac{1}{5000} \text{, al dividir entre } 5
\end{gather*}

Lo que indica que para que $f(x)$ esté a una distancia menor $\frac{1}{1000}$ de $35$, entonces $x$ debe estar a una distancia menor de $\frac{1}{5000}$ respecto al $7$. Después de este último ejercicio, parece que podemos aproximarnos arbitrariamente a $35$ y a este valor arbitrario le llamaremos $\epsilon$, el cual puede ser cualquier número positivo. Haciendo las cuentas de forma análoga para una distancia $\epsilon > 0$, llegamos a la siguiente expresión:

$$|x – 7| < \frac{\epsilon}{5}.$$

Es decir, para aproximar arbitrariamente ($\epsilon$) $f(x)$ al valor $35$, $x$ debe estar a una distancia menor de $\frac{\epsilon}{5}$ del valor de $7$.

Generalizando un poco la idea construida a través de este ejemplo obtenemos la siguiente definición intuitiva.

Definición intuitiva. Decimos que la función $f$ se aproxima al límite $L$ cerca de $x_0$ si $f(x)$ se aproxima arbitrariamente a $L$ si $x$ está lo suficientemente de $x_0$ pero es distinto de $x_0$.

Después de esta definición intuitiva, veamos otro ejemplo y tratemos de usarla.

Consideremos ahora la función $f(x) = x^2$.

Veremos que $f(x)$ se aproxima al límite $16$ cerca de $4$. En esta ocasión queremos que $f$ esté más próximo que $\epsilon$ a $16$, es decir, queremos que

\begin{gather*}
|f(x) – 16| < \epsilon \\
|x^2 – 16| < \epsilon \\
|(x-4)(x+4)| < \epsilon \\
|x-4||x+4| < \epsilon
\end{gather*}

A diferencia del caso anterior, parece que no es tan directo llegar a nuestro objetivo, pero notemos que particularmente podemos pedir que $|x-4| < 1$, entonces

\begin{gather*}
-1< x-4 < 1 \\
\Rightarrow 3 < x < 5 \\
\Rightarrow 7 < x+4<9
\end{gather*}

En resumen, si $|x-4|<1$, entonces $|x+4| < 9$. Lo cual implica que
$$|x^2 – 16| = |x-4||x+4| < 9|x-4|$$
Si además restringimos la distancia de $x$ respecto a $4$ de tal manera que $|x-4| < \frac{\epsilon}{9}$ y retomando la expresión anterior llegamos a lo siguiente:

\begin{gather*}
|x^2 – 16| = |x-4||x+4| < 9|x-4| < 9 \cdot \frac{\epsilon}{9} = \epsilon \\
\therefore |x^2 – 16| < \epsilon
\end{gather*}

Esto siempre que $|x-4|$ sea menor que $1$ y $\frac{\epsilon}{9}$, es decir, siempre que $|x-4| < min\{1, \frac{\epsilon}{9} \}$.


De los dos ejemplos revisados en esta entrada, podemos notar que logramos que $f$ se aproxime arbitrariamente ($\epsilon$) a $L$ siempre que logremos que $x$ esté lo suficientemente cerca de $x_0$ y para lograr esto último acotamos $x-x_0$ en términos de un valor positivo que depende de $\epsilon$ (para el primer ejemplo fue $\frac{\epsilon}{5}$ y para el segundo $min\{1, \frac{\epsilon}{9} \}$), vale la pena entonces darle un nombre a este valor positivo: $\delta$.

Refraseando: Logramos que $f$ se aproxime arbitrariamente ($\epsilon$) a $L$ siempre que logremos que $x$ esté lo suficientemente cerca ($\delta$) de $x_0$.

Este último refraseo nos da un indicio muy importante, para probar que $f$ se aproxima arbitrariamente a $L$ en $x_0$, habrá que dar un valor arbitrario positivo $\epsilon > 0$ para el cual necesitaremos encontrar otro valor positivo $\delta > 0$ que acote a $x$ al rededor de $x_0$, es decir, $|x-x_0|<\delta$ y que si $x$ cumple tal condición, entonces también se tenga que $|f(x)-L| < \epsilon$. Adicionalmente pedíamos que $x \neq x_0$, tal condición puede ser compactada de la siguiente forma $0 < |x-x_0| < \delta$, pues que la distancia entre $x$ y $x_0$ sea mayor que cero implica directamente que son distintos.

Antes de finalizar con esta entrada es conveniente aclarar que no siempre tendremos funciones tan amigables en las cuales podamos evaluar directamente el valor de $x_0$ en $f$ para encontrar $L$ e incluso habrá ocasiones en las cuales no nos podamos aproximar de la manera en la que lo hicimos en estos ejemplos, pero por ahora no daremos muchos detalles extra al respecto, será tema para entradas posteriores.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más a profundidad la teoría vista.

Para corroborar que la idea intuitiva de límite de una función se ha comprendido, se queda como ejercicio realizar un análisis similar al expuesto en esta entrada. Consideremos la función $f(x) = \frac{1}{x}$ definida para todo $x \neq 0$. En este caso, tomaremos $x_0=1$ y $L = f(x_0) = \frac{1}{1} =1$.

  • Grafica $f(x)$ para $x >0$.
  • Encuentra un valor de $x$ tal que $|f(x)-1| < \frac{1}{2}$.
  • Encuentra un valor de $x$ tal que $|f(x)-1| < \frac{1}{10}$.
  • Encuentra un intervalo de $x$ al rededor de $x_0 = 1$ tal que $|f(x)-1| < \frac{1}{100}$.
  • Encuentra un intervalo de $x$ al rededor de $x_0 = 1$ tal que $|f(x)-1| < \epsilon$, con $\epsilon > 0$.

Más adelante…

En la siguiente entrada daremos la definición formal de límite de una función y veremos varios ejemplos de funciones cuyo límite existe. Una vez dominemos la definición podremos incursionar en varias de sus propiedades y podremos tomar ventaja de estos conocimientos para tener una mayor comprensión sobre el comportamiento de diversas funciones de interés.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: Continuidad y diferenciabilidad de polinomios reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

Al inicio de esta unidad, hablamos de las propiedades algebraicas de $\mathbb{R}[x]$, definimos sus operaciones y argumentamos por qué se puede usar la notación de potencias. Luego hablamos de las propiedades aritméticas de los polinomios cuando hablamos de divisibilidad, máximo común divisor y factorización en irreducibles. Vimos una aplicación de esto a la solución de desigualdades. Lo que queremos hacer ahora es pensar a los polinomios como funciones de $\mathbb{R}$ en $\mathbb{R}$ y entender las propiedades analíticas que tienen, es decir en términos de cálculo. Nos interesa saber qué les sucede cuando su entrada es grande, la continuidad y la diferenciabilidad de polinomios.

Estas propiedades tienen consecuencias algebraicas importantes. La continuidad de polinomios nos permite encontrar raíces reales en ciertos intervalos. La diferenciabilidad de polinomios nos ayuda a encontrar la multiplicidad de las raíces. Supondremos que manejas conocimientos básicos de cálculo y de manipulación de límites, pero de cualquier forma recordaremos algunas definiciones y daremos esbozos de la demostración de algunos resultados.

Límites a reales y límites a infinito

Recordemos dos definiciones de cálculo, que se aplican para funciones arbitrarias definidas en todos los reales.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función y $a, b$ reales. Decimos que $$\lim_{x\to a} f(x) = b$$ si para todo $\epsilon >0$ existe un $\delta > 0 $ tal que cuando $0<|x-a|<\delta$, entonces $|f(x)-b|<\epsilon$. En palabras, decimos que el límite de $f$ cuando $x$ tiende a $a$ es $b$.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función. Decimos que $$\lim_{x\to \infty} f(x) = \infty$$ si para todo $M>0$ existe un $r > 0 $ tal que cuando $x>r$, entonces $f(x)>M$. En palabras, decimos que el límite de $f$ cuando $x$ tiende a infinito es infinito.

De manera análoga se pueden definir límites cuando $x$ tiende a menos infinito, y definir qué quiere decir que el límite sea menos infinito. La siguiente proposición se prueba en textos de cálculo.

Proposición (propiedades de límites). Sean $f:\mathbb{R}\to \mathbb{R}$ y $g:\mathbb{R}\to \mathbb{R}$ funciones y $a$, $b$, $c$ reales. Si $$\lim_{x\to a} f(x) = b \quad \text { y } \quad \lim_{x\to a} g(x)= c,$$ entonces:

  • «El límite de la suma es la suma de los límites», en símbolos, $$\lim_{x\to a} (f+g)(x) = b+c.$$
  • «El límite del producto es el producto de los límites», en símbolos, $$\lim_{x\to a} (fg)(x)=bc.$$

La proposición anterior es sólo para cuando los límites son reales. Hay resultados para cuando algunos de los límites son infinitos, pero en general hay que tener cuidado.

La primer propiedad analítica de los polinomios es saber cómo es su comportamiento cuando $x$ se hace infinito o menos infinito. Si el polinomio es constante, entonces este límite es simplemente su valor en cualquier punto. Para polinomios de grado mayor o igual a $1$, su comportamiento queda resumido en la siguiente proposición.

Proposición (límites a infinito). Tomemos al polinomio $p(x)$ en $\mathbb{R}[x]$ dado por $$p(x)=a_0+a_1x+a_2x^2+\ldots+a_nx^n,$$ en donde $n\geq 1$ y $a_n\neq 0$.

  • Si $a_n>0$ y $p(x)$ es de grado par entonces $$\lim_{x\to \infty} p(x) = \lim_{x\to-\infty} p(x)= \infty,$$
  • Cuando $a_n>0$ y $p(x)$ es de grado impar entonces $$\lim_{x\to \infty} p(x) = \infty \quad \text { y } \quad \lim_{x\to -\infty} p(x)=-\infty$$
  • Si $a_n<0$ y $p(x)$ es de grado par entonces $$\lim_{x\to \infty} p(x) = \lim_{x\to-\infty} p(x)= -\infty,$$
  • Cuando $a_n<0$ y $p(x)$ es de grado impar entonces $$\lim_{x\to \infty} p(x) = -\infty \quad \text { y } \quad \lim_{x\to -\infty} p(x)=\infty.$$

Demostración. Vamos a hacer una de las demostraciones. Mostraremos que para cuando $a_n>0$ y el grado es par, entonces $$\lim_{x\to \infty} p(x) = \infty.$$ Las demás se siguen haciendo cambios de signo cuidadosos y usando que una potencia impar de un real negativo es un real negativo, y una potencia par es siempre un real positivo. Pensar en estas demostraciones queda como tarea moral.

Tomemos entonces $p(x)$ un polinomio de grado par y con coeficiente principal $a_n>0$. Intuitivamente, tenemos que mostrar que si $x$ es muy grande, entonces $p(x)$ es tan grande como queramos. Tomemos un real $M>0$. Como haremos $x$ grande, podemos suponer que $x>1$.

Como el término $a_nx^n$ es positivo, basta mostrar como resultado auxiliar que si $x$ es suficentemente grande, entonces $$a_nx^n >M+|a_0+a_1x+\ldots+a_{n-1}x^{n-1}|,$$ ya que si esto sucede, tendríamos que:
\begin{align*}
a_nx^n&>M+|a_0+a_1x+\ldots+a_{n-1}x^{n-1}|\\
&=M+|-a_0-a_1x-\ldots-a_{n-1}x^{n-1}|\\
&>M-a_0-a_1x-\ldots-a_{n-1}x^{n-1},
\end{align*}

y de aquí, pasando todo excepto a $M$ a la izquierda, tendríamos $p(x)>M$

Para probar el resultado auxiliar, tomemos $A$ como el máximo de los valores absolutos $|a_0|,\ldots,|a_{n-1}|$. Por la desigualdad del triángulo y usando $x>1$ tenemos que

\begin{align*}
M+|a_0&+a_1x+\ldots+a_{n-1}x^{n-1}|\\
&\leq M+|a_0|+|a_1 x| + \ldots + |a_{n-1}x^{n-1}|\\
&\leq M+A(1+x+\ldots+x^{n-1})\\
&< M+nA\\
&<(M+nA)x^{n-1}
\end{align*}

De esta forma, para mostrar nuestra desigualdad auxiliar basta mostrar que para $x$ suficientemente grande, tenemos que $(M+nA)x^{n-1}<a_nx^n$. Pero como $x>0$, esta desigualdad es equivalente a $x>\frac{M+nA}{a_n}$.

Recapitulando, para cualquier $M>0$, si $x>\frac{M+nA}{a_n}$, entonces $p(x)>M$. Esto termina la demostración.

$\square$

Podemos usar la proposición anterior para comparar polinomios cuando su variable tiende a infinito.

Ejemplo. Mostraremos que existe una $M$ suficientemente grande tal que si $x>M$, entonces $$\frac{1}{2}x^7-x^6-x-1>x^6+1000x^5+1000000.$$ Pasando todo del lado izquierdo, nos queda la desigualdad equivalente $$\frac{1}{2}x^7-2x^6-1000x^5-x-999999>0.$$ Aquí tenemos un polinomio $p(x)$ de grado impar y coeficiente principal positivo. Por la proposición anterior, $\lim_{x\to \infty} p(x) = \infty$, de modo que la $M$ que estamos buscando existe.

$\square$

Continuidad de polinomios

Antes de llegar a diferenciabilidad de polinomios, haremos un paso intermedio. Recordemos otra definición de cálculo.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función y $a$ un real. Decimos que $f$ es continua en $a$ si $$\lim_{x\to a} f(x) = f(a).$$ Decimos que $f$ es continua si es continua en todo real.

Por la proposición de propiedades de límites, la suma o producto de funciones continuas es continua. Las funciones constantes son continuas. La función identidad $I:\mathbb{R}\to \mathbb{R}$ dada por $I(x)=x$ es continua. Estos tres hechos nos ayudan a demostrar que todos los polinomios son funciones continuas sin tener que recurrir a la definición de límite.

Teorema. Cualquier polinomio $p(x)$ en $\mathbb{R}[x]$ pensado como una función $p:\mathbb{R}\to \mathbb{R}$ es una función continua.

Demostración. Supongamos que $p(x)$ está dado por $$p(x)=a_0+a_1x+\ldots+a_nx^n.$$

Para toda $i$ de $0$ a $n$ tenemos que la función $x\mapsto a_i$ es constante y por lo tanto es continua. Si $i>0$, la función $x\mapsto x^i$ es producto de $i$ veces la identidad consigo misma. Como la identidad es continua y producto de continuas es continua, entonces $x\mapsto x^i$ es continua.

De nuevo, usando que producto de funciones continuas es continua, tenemos que $x\mapsto a_ix^i$ es una función continua. De esta forma, $p(x)$ es la suma de $n+1$ funciones continuas, y por lo tanto es una función continua.

$\square$

El resultado anterior nos ayuda a usar teoremas versátiles de cálculo en nuestro estudio de polinomios. Recordemos el teorema del valor intermedio.

Teorema (del valor intermedio). Sea $f:\mathbb{R}\to \mathbb{R}$ una función continua. Sean $a<b$ dos reales. Entonces entre $a$ y $b$, la función $f$ toma todos los valores entre $f(a)$ y $f(b)$.

Veamos cómo el teorema del valor intermedio nos permite encontrar raíces de polinomios.

Problema. Muestra que el polinomio $p(x)=x^7-5x^5+x^2+3$ tiene por lo menos una raíz en el intervalo $[0,2]$.

Solución. Al evaluar al polinomio en cero, obtenemos $p(0)=3$. Al evaluarlo en $2$, obtenemos
\begin{align*}
p(2)&=2^7-5\cdot 2^5+x^2 + 3\\
&=128-160+4+3\\
&=-25.
\end{align*}

Como los polinomios son funciones continuas, podemos aplicar el teorema del valor intermedio. Concluimos que $p(x)$ toma todos los valores de $-25$ a $2$ en el intervalo $[0,2]$. En particular, existe un real $r$ en $[0,2]$ tal que $p(r)=0$.

$\square$

El teorema del valor intermedio nos ayuda a demostrar que un polinomio tiene una raíz en cierto intervalo. Sin embargo, no es de tanta utilidad para decir exactamente cuál es esa raíz. Es un resultado existencial en vez de ser constructivo. Veamos un ejemplo más, que muestra una proposición que quedó pendiente en una entrada anterior.

Problema. Sea $p(x)$ un polinomio cuadrático, mónico e irreducible en $\mathbb{R}[x]$. Muestra que $p(r)>0$ para todo real $r$.

Solución. Procedamos por contradicción. Supongamos que $p(r)\leq 0$ para algún real $r$.

Como $p(x)$ es mónico, su coeficiente principal es $1$, que es positivo. Como $p(x)$ es cuadrático, es de grado par. Por la proposición de límites a infinito, existe un real $t>r$ tal que $p(t)>0$. Por el teorema del valor intermedio, existiría un real $s$ en el intervalo $[r,t]$ tal que $p(s)=0$. Pero esto es imposible, pues entonces por el teorema del factor $x-s$ divide a $p(x)$ y esto contradice que $p(x)$ es irreducible.

$\square$

Como muestra el problema anterior, se pueden combinar los límites de polinomios a infinito y menos infinito, y sus propiedades de continuidad. Otra aplicación es mostrar que todo polinomio de grado impar tiene por lo menos una raíz real. Esto se verá en otra entrada.

Por supuesto, otros resultados de continuidad también se pueden usar en todos los polinomios, como el teorema del valor extremo. Aplicándolo directamente, concluimos lo siguiente.

Proposición. Sean $a<b$ reales y $p(x)$ un polinomio en $\mathbb{R}$. Entonces $p(x)$ está acotado en el intervalo $[a,b]$ y existen reales $r$ y $s$ en dicho intervalo tales que $p(r)$ y $p(s)$ son el mínimo y máximo de $p(x)$ en $[a,b]$, respectivamente.

Diferenciabilidad de polinomios

Es momento de hablar de diferenciabilidad de polinomios. Recordemos una última definición de cálculo.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función. Decimos que $f$ es diferenciable en $a$ si el límite $$\lim_{h\to 0} \frac{f(a+h)-f(a)}{h}$$ existe. En este caso, a ese límite lo denotamos por $f'(a)$. Una función es diferenciable si es diferenciable en todo real. A la función $f’:\mathbb{R}\to \mathbb{R}$ le llamamos la derivada de $f$.

Al igual que en el caso de continuidad, la suma y producto de funciones diferenciales es diferenciable. Si $f:\mathbb{R}\to \mathbb{R}$ y $g:\mathbb{R}\to \mathbb{R}$ son diferenciables, entonces la derivada de $f+g$ está dada por $$(f+g)'(x)=f'(x)+g'(x)$$ y la derivada de $fg$ está dada por la regla de la cadena $$(fg)'(x)=f'(x)g(x)+f(x)g'(x).$$

Las funciones constantes son diferenciables, y su derivada es la función constante $0$. La función identidad es diferenciable, y su derivada es la función constante $1$. Esto es sencillo de mostrar y queda como tarea moral.

Proposición. Sea $n\geq 1$ un entero. El polinomio $p(x)=x^n$ es diferenciable, y su derivada es la función $p'(x)=nx^{n-1}$.

Demostración. Haremos la prueba por inducción. Si $n=1$, el polinomio es $p(x)=x$, y su derivada es $p'(x)=1=1\cdot x^0$, como queremos. Supongamos que el resultado es cierto para el entero $n\geq 1$ y tomemos $p(x)=x^{n+1}=x^n\cdot x$. Por hipótesis inductiva, $x\mapsto x^n$ es diferenciable. Como $p(x)$ es producto de dos funciones diferenciables, entonces es diferenciable.

Usando la regla de la cadena, la hipótesis inductiva de la fórmula y la derivada de $x\mapsto x$, tenemos que $$p'(x)=(nx^{n-1})(x)+(x^n)(1)=(n+1)x^n.$$ Esto termina la demostración.

$\square$

Con todos estos ingredientes podemos mostrar la diferenciabilidad de todos los polinomios. Los detalles quedan como tarea moral.

Teorema (diferenciabilidad de polinomios). Sea $p(x)$ un polinomio en $\mathbb{R}[x]$ dado por $$p(x)=a_0+a_1x+\ldots+a_nx^n,$$ Entonces $p(x)$ pensado como función es diferenciable y su derivada es un polinomio. Si $p(x)$ es constante, su derivada es el polinomio $0$. En otro caso, su derivada es el polinomio $$a_1+2a_2x+3a_3x^2+\ldots+na_nx^{n-1}.$$

Ejemplo. El polinomio $x^7+3x^2-1$ es diferenciable. Su derivada es el polinomio $7x^6+6x$.

$\square$

Ya que sabemos que los polinomios son diferenciables, podemos usar todas las herramientas de cálculo diferencial, como:

No profundizaremos en esto, pues es el contenido de un buen curso de cálculo, o bien de material de algún texto en el área, como el libro de Cálculo de Spivak.

A nosotros nos interesa una consecuencia algebraica de que los polinomios tengan derivada. Como la derivada de un polinomio es otro polinomio, entonces la derivada es diferenciable. Por ello, un polinomio $p(x)$ se puede derivar iteradamente tantas veces como se quiera. Al polinomio obtenido de derivar $n$ veces le llamamos la $n$-ésima derivada y lo denotamos por $p^{(n)}(x)$. En la siguiente entrada veremos cómo la repetida diferenciabilidad de polinomios nos ayuda a detectar la multiplicidad de sus raíces.

Más adelante…

En la siguiente sección nos encargaremos de realizar varios problemas para repasar las definiciones y propiedades que acabamos de enunciar, y posteriormente ocuparemos todo lo aprendido para explotar el conocimiento que tenemos de los polinomios.

En particular, nos será útil el concepto de diferenciabilidad pues con este podemos dar una definición precisa de lo que significa que la raíz de un polinomio sea múltiple.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Estudia el resto de los casos de la proposición de límites de polinomios cuando la entrada va a menos infinito y a infinito.
  2. Muestra usando la definición de límite que las funciones constantes y la función identidad son continuas.
  3. Demuestra por definición que las funciones constantes son diferenciables y que su derivada es la función constante $0$. Demuestra por definición que la función identidad es diferenciable y que su derivada es la función constante $1$.
  4. Muestra que existe un real $x$ en el cual los polinomios $p(x)=x^5+x^3+x$ y $q(x)=100x^4+10x^2$ son iguales. Sugerencia. Reescribe esta igualdad en términos de encontrar una raíz de un sólo polinomio.
  5. Completa los detalles del teorema de diferenciabilidad de polinomios.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Seminario de Resolución de Problemas: Problemas de cálculo variados

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores ya tratamos varios temas de cálculo y cómo se combinan con heurísticas para resolver problemas de cálculo. Veremos ahora otros problemas para repasar las técnicas que hemos aprendido hasta ahora y explorar algunas nuevas ideas.

Los primeros dos ejemplos son del libro Problem Solving through Problems de Loren Larson. Los últimos dos son de un concurso universitario: la Competencia Iberoamericana Interuniversitaria de Matemáticas.

El método del factor de integración

Para resolver problemas de cálculo, también es útil tener algunas ideas de ecuaciones diferenciales. Un método muy útil en la resolución de problemas es el método de factor de integración, que ayuda a resolver ecuaciones diferenciales de la forma $$y’+a(x)y=b(x).$$

La idea para resolver esta ecuación diferencial en $y$ (es decir, despejar a $y$ en términos de $a$ y $b$) es multiplicar ambos lados de la ecuación por $I(x)=e^{\int a(x)\, dx$ y observar que por regla de la cadena, la regla del producto y el teorema fundamental del cálculo, tenemos la ecuación diferencial equivalente $$(yI(x))’ =I(x)b(x).$$

De aquí, podemos integrar de ambos lados en un intervalo $[c,x]$. Por el teorema fundamental del cálculo, existe una constante $C$ tal que $$yI(x)=\int_{c}^x I(t) b(t)\, dt + C,$$ y ya de aquí podemos despejar $$y=I(x)^{-1}\left( \int_{c}^x I(t) b(t)\, dt + C\right).$$

A $I(x)$ se le conoce como el factor de integración.

Problema. Sea $f:(0,\infty)\to \mathbb{R}$ una función diferenciable y supongamos que $$\lim_{x\to \infty} f(x)+f'(x) = 0.$$ Muestra que $$\lim_{x\to 0} f(x) = 0.$$

Sugerencia pre-solución. Define $g(x)=f(x)+f'(x)$ y usando el método de integración «despeja» a $f$ en términos de $g$.

Solución. Definamos $g(x)=f(x)+f'(x)$. La hipótesis dice que $\lim_{x\to 0} g(x) = 0$, así que para obtener información de $f$ en términos de $g$, podemos usar el método de factor de integración. Por la discusión antes de este párrafo, tenemos que $$f(x)=e^{-x}\int_a^x e^t g(t) \,dt + Ce^{-x}.$$

Tomemos un $\epsilon>0$. Como $g(x)\to 0$ cuando $x\to \infty$, podemos tomar un $a$ tal que $|g(x)|<\epsilon$ para todo $x>a$. Usando desigualdad del triángulo en sumas e integrales, tenemos que para $x>a$
\begin{align*}
|f(x)|&\leq e^{-x}\left|\int_a^x e^t g(t)\right|+|Ce^{-x}|\\
&\leq e^{-x}\int_a^x e^t|g(t)|\, dt + |C|e^{-x}\\
&\leq \epsilon e^{-x}\int e^t\, dt + |C|e^{-x}\\
&=\epsilon e^{-x}(e^x-e^a)+|C|e^{-x}\\
&=\epsilon(1-e^{a-x})+|C|e^{-x}
\end{align*}

Tenemos que $\lim_{x\to \infty} e^{a-x} = 0$ y que $\lim_{x\to \infty} e^{-x}=0$, de modo que si $x$ es suficientemente grande, la expresión anterior nos dice $|f(x)|<2\epsilon$. En otras palabras, $f(x)\to 0$ cuando $x\to \infty$, como queríamos.

$\square$

Una integral con doble derivada

Problema. Sea $f:[0,1]\to \mathbb{R}$ una función dos veces diferenciable que cumple $f(0)=f(1)=0$ y tal que $f(x)>0$ para $x$ en $(0,1)$. Muestra que $$\int_0^1 \left| \frac{f»(x)}{f(x)} \, dx \right| > 4.$$

Sugerencia pre-solución. Tenemos ya varias técnicas para evaluar o estimar integrales. Si con un método llegas a una pared, intenta usar otro método. Necesitarás el teorema del valor extremo, el teorema del valor medio y el teorema fundamental del cálculo.

Solución. Por el teorema del valor extremo, existe un valor $c$ en $(0,1)$ tal que $y=f(c)$ es un máximo de $f$. Por el teorema del valor medio, existen puntos $a$ en $(0,c)$ y $b$ en $(c,1)$ tales que $$f'(a)=\frac{f(c)-f(0)}{c}=\frac{y}{c}$$ y $$f'(b)=\frac{f(1)-f(c)}{1-c}=\frac{-y}{1-c}.$$

Usando que $f$ alcanza su máximo $y$ en $c$

\begin{align*}
\int_0^1 \left| \frac{f»(x)}{f(x)} \, dx \right|&\geq \int_a^b \left| \frac{f»(x)}{f(x)} \, dx \right| \\
&\geq \frac{1}{y} \int_a^b \left| f»(x) \, dx \right|,
\end{align*}

de modo que aplicando el teorema fundamental del cálculo a la última integral, obtenemos que

\begin{align*}
\int_0^1 \left| \frac{f»(x)}{f(x)} \, dx \right| &\geq \frac{1}{y} \int_0^1 \frac{1}{y}|f'(b)-f'(a)|\\
&=\frac{1}{y} \left|\frac{-y}{1-c}-\frac{y}{c}\right|\\
&=\left|\frac{1}{c(1-c)}\right|.
\end{align*}

Para terminar, notamos que la función $h(x)=x(1-x)$ es diferenciable en $(0,1)$ y continua en $[0,1]$, de modo que alcanza su máximo en $0$, en $1$ o en donde la derivada $h'(x)=1-2x$ es $0$, es decir, en $1/2$. Tenemos que $h(1/2)=1/4$ y que $h(0)=h(1)=0$, de modo que el máximo es $1/4$. Con esto, concluimos que $$\left|\frac{1}{c(1-c)}\right| \geq 4,$$ de donde se completa la cadena de desigualdades que queremos.

$\square$

En el problema anterior usamos el teorema del valor medio como paso intermedio. Es recomendable que pienses qué hubiera pasado si nos hubiéramos saltado este paso y hubiéramos usado el mínimo directamente, sin limitarnos primero al intervalo $[a,b]$. En los problemas de cálculo a veces es muy importante el orden en el que se hacen las cosas.

Dos problemas de cálculo de competencias

Veamos ahora algunos problemas de cálculo que han aparecido en concursos a nivel universitario. El siguiente problema apareció en la Competencia Iberoamericana Interuniversitaria de Matemáticas, en 2015, como Problema 4.

Problema. Sea $f:\mathbb{R}\to \mathbb{R}$ una función continua y $\alpha$ un número real. Sabemos que $\lim_{x\to \infty} f(x) = \lim_{x\to -\infty} = \alpha$. Muestra que para cualquier real positivo $r$ existen reales $x$ y $y$ tales que $y-x=r$ y $f(x)=f(y)$.

Sugerencia pre-solución. Modifica el problema, construyendo una función que te ayude a resolverlo. Necesitarás el teorema del valor intermedio. También, una parte de la solución necesita que se use inducción.

Solución. Tomemos cualquier valor $r$ y consideremos la función $h(x)=f(x+r)-f(x)$. Como $f$ es continua, la función $h$ es continua. Si $h(x)>0$ para todo real, entonces podemos mostrar inductivamente que para cualesquiera enteros positivos $m$ y $n$ tenemos que $$f(x-mr)<f(x)<f(x+r)<f(x+nr).$$

Haciendo $n$ y $m$ ir a infinito, tendríamos que $$\alpha\leq f(x) < f(x+r) \leq \alpha,$$ lo cual es una contradicción.

Así, $h(x)$ toma valores menores o iguales a $0$. De modo similar, podemos mostrar que $h(x)$ toma valores mayores o iguales a $0$. Como $h$ es continua, por el teorema del valor intermedio debe tomar el valor $0$ para algún $c$, de modo que $f(c+r)-f(c)=h(c)=0$ y así, tomando $x=c$ y $y=c+r$ tenemos $y-x=r$ y $$f(y)=f(c+r)=f(c)=f(x).$$

$\square$

El siguiente problema apareció en la Competencia Iberoamericana Interuniversitaria de Matemáticas, en 2010, como Problema 4.

Problema. Sea $f:[0,1]\to [0,1]$ una función continua, creciente, diferenciable en $[0,1]$ y tal que $f'(x)<1$ en cada punto. La sucesión de conjuntos $A_1, A_2, \ldots$ se define recursivamente como $A_1=f([0,1])$ y para $n\geq 2$, $A_n=f(A_{n-1})$. Muestra que el diámetro de $A_n$ converge a $0$ conforme $n\to \infty$.

El diámetro de un conjunto $X$ es $\sup_{x,y \in X} |x-y|$.

Sugerencia pre-solución. Para una primer parte del problema que te ayudará a entender a los $A_i$, necesitarás el teorema del valor intermedio y el principio de inducción. Luego, necesitarás usar el teorema del valor medio y que las funciones continuas preservan límites de sucesiones convergentes.

Solución. Por conveniencia, nombramos $A_0=[0,1]$. Sea $d_n$ el diámetro de $A_n$. Tenemos $d_0=1$. Como $f$ es creciente, tenemos que $f(0)<f(1)$ y que no hay ningún valor fuera del intervalo $[f(0),f(1)]$ que se tome. Como $f$ es continua, se toman todos esos valores. Así, $A_1=[f(0),f(1)]$ y su diámetro es $d_1=f(1)-f(0)$. Inductivamente, podemos mostrar que $A_n= [f^n(0),f^n(1)]$ y que $d_n=f^{n}(1)-f^{n}(0)$.

Notemos que la sucesión $f^{n}(0)$ es creciente y acotada, de modo que converge a un real $a$. Como $f$ es contínua, tenemos que \begin{align*}f(a)&=f(\lim_{n\to \infty} f^{n}(0)) \\&= \lim_{n\to \infty} f^{n+1}(0) \\&= a.\end{align*} Análogamente, $f^n(1)$ converge a un real $b$ tal que $f(b)=b$. Como $f^n(0)\leq f^n(1)$, tenemos que $a\leq b$. Afirmamos que $a=b$. Si no, por el teorema del valor medio existiría un $c\in[a,b]$ tal que $$f'(c)=\frac{f(b)-f(a)}{b-a}=\frac{b-a}{b-a}=1,$$ contradiciendo la hipótesis de la cota de la derivada.

Esto muestra que $a=b$, y por lo tanto
\begin{align*}
\lim_{n\to \infty} d_n &= \lim_{n\to \infty} f^n(1)-f^n(0) \\
&=b-a\\
&= 0.
\end{align*}

$\square$

En este problema es muy importante primero mostrar que los extremos de los intervalos convergen a puntos fijos de $f$ y después usar el teorema del valor intermedio. Podría ser tentador usar el teorema del valor intermedio en cada intervalo $[f^n(0),f^n(1)]$, pero con ello no se llega al resultado deseado.

Más problemas

En todas estas entradas hemos platicado acerca de problemas de temas de cálculo. Se pueden encontrar muchos más problemas de este tema en el Capítulo 6 del libro Problem Solving through Problems de Loren Larson.

Además, puedes encontrar otros problemas resueltos en la sección de Material para practicar de este blog, que ayuda a prepararse para competencias internacionales de matemáticas a nivel universitario.