Archivo de la etiqueta: función continua

Álgebra Superior II: Continuidad y diferenciabilidad de polinomios reales

Introducción

Al inicio de este unidad, hablamos de las propiedades algebraicas de \mathbb{R}[x], cuando definimos sus operaciones y argumentamos por qué se puede usar la notación de potencias. Luego hablamos de las propiedades aritméticas de los polinomios, cuando hablamos de divisibilidad, máximo común divisor y factorización en irreducibles. Vimos una aplicación de esto a solución de desigualdades. Lo que queremos hacer ahora es pensar a los polinomios como funciones de \mathbb{R} en \mathbb{R} y entender las propiedades analíticas que tienen, es decir en términos de cálculo. Nos interesa qué les sucede cuando su entrada es grande, la continuidad y la diferenciabilidad de polinomios.

Estas propiedades tienen consecuencias algebraicas importantes. La continuidad de polinomios nos permite encontrar raíces reales en ciertos intervalos. La diferenciabilidad de polinomios nos ayuda a encontrar la multiplicidad de las raíces. Supondremos que manejas conocimientos básicos de cálculo y de manipulación de límites, pero de cualquier forma recordaremos algunas definiciones y daremos esbozos de la demostración de algunos resultados.

Límites a reales y límites a infinito

Recordemos dos definiciones de cálculo, que se aplican para funciones arbitrarias definidas en todos los reales.

Definición. Sea f:\mathbb{R}\to \mathbb{R} una función y a, b reales. Decimos que

    \[\lim_{x\to a} f(x) = b\]

si para todo \epsilon >0 existe un \delta > 0 tal que cuando |x-a|<\delta, entonces |f(x)-b|<\epsilon. En palabras, decimos que el límite de f cuando x tiende a a es b.

Definición. Sea f:\mathbb{R}\to \mathbb{R} una función. Decimos que

    \[\lim_{x\to \infty} f(x) = \infty\]

si para todo M>0 existe un r > 0 tal que cuando x>r, entonces f(x)>M. En palabras, decimos que el límite de f cuando x tiende a infinito es infinito.

De manera análoga se pueden definir límites cuando x tiende a menos infinito, y definir qué quiere decir que el límite sea menos infinito. La siguiente proposición se prueba en textos de cálculo.

Proposición (propiedades de límites). Sean f:\mathbb{R}\to \mathbb{R} y g:\mathbb{R}\to \mathbb{R} funciones y a, b, c reales. Si

    \[\lim_{x\to a} f(x) = b \quad \text { y } \quad \lim_{x\to a} g(x)= c,\]

entonces:

  • “El límite de la suma es la suma de los límites”, en símbolos,

        \[\lim_{x\to a} (f+g)(x) = b+c.\]

  • “El límite del producto es el producto de los límites”, en símbolos,

        \[\lim_{x\to a} (fg)(x)=bc.\]

La proposición anterior es sólo para cuando los límites son reales. Hay resultados para cuando algunos de los límites son infinitos, pero en general hay que tener cuidado.

La primer propiedad analítica de los polinomios es saber cómo es su comportamiento cuando x se hace infinito o menos infinito. Si el polinomio es constante, entonces este límite es simplemente su valor en cualquier punto. Para polinomios de grado mayor o igual a 1, su comportamiento queda resumido en la siguiente proposición.

Proposición (límites a infinito). Tomemos al polinomio p(x) en \mathbb{R}[x] dado por

    \[p(x)=a_0+a_1x+a_2x^2+\ldots+a_nx^n,\]

en donde n\geq 1 y a_n\neq 0.

  • Si a_n>0 y p(x) es de grado par entonces

        \[\lim_{x\to \infty} p(x) = \lim_{x\to-\infty} p(x)= \infty,\]

  • Cuando a_n>0 y p(x) es de grado impar entonces

        \[\lim_{x\to \infty} p(x) = \infty \quad \text { y } \quad \lim_{x\to -\infty} p(x)=-\infty\]

  • Si a_n<0 y p(x) es de grado par entonces

        \[\lim_{x\to \infty} p(x) = \lim_{x\to-\infty} p(x)= -\infty,\]

  • Cuando a_n<0 y p(x) es de grado impar entonces

        \[\lim_{x\to \infty} p(x) = -\infty \quad \text { y } \quad \lim_{x\to -\infty} p(x)=\infty.\]

Demostración. Vamos a hacer una de las demostraciones. Mostraremos que para cuando a_n>0 y el grado es par, entonces

    \[\lim_{x\to \infty} p(x) = \infty.\]

Las demás se siguen haciendo cambios de signo cuidadosos y usando que una potencia impar de un real negativo es un real negativo, y una potencia par es un real negativo. Pensar en estas demostraciones queda como tarea moral.

Tomemos entonces p(x) un polinomio de grado par y con coeficiente principal a_n>0. Intuitivamente, tenemos que mostrar que si x es muy grande, entonces p(x) es tan grande como queramos. Tomemos un real M>0. Como haremos x grande, podemos suponer que x>1.

Como el término a_nx^n es positivo, basta mostrar como resultado auxiliar que si x es suficentemente grande, entonces

    \[a_nx^n >M+|a_0+a_1x+\ldots+a_{n-1}x^{n-1}|,\]

ya que si esto sucede, tendríamos que:

    \begin{align*}a_nx^n&>M+|a_0+a_1x+\ldots+a_{n-1}x^{n-1}|\\&=M+|-a_0-a_1x-\ldots-a_{n-1}x^{n-1}|\\&>M-a_0-a_1x-\ldots-a_{n-1}x^{n-1},\end{align*}

y de aquí, pasando todo excepto a M a la izquierda, tendríamos p(x)>M

Para probar el resultado auxiliar, tomemos A como el máximo de los valores absolutos |a_0|,\ldots,|a_{n-1}|. Por la desigualdad del triángulo y usando x>1 tenemos que

    \begin{align*}M+|a_0&+a_1x+\ldots+a_{n-1}x^{n-1}|\\&\leq M+|a_0|+|a_1 x| + \ldots + |a_{n-1}x^{n-1}|\\&\leq M+A(1+x+\ldots+x^{n-1})\\&< M+nAx^{n-1}\\&<(M+nA)x^{n-1} \end{align*}

De esta forma, para mostrar nuestra desigualdad auxiliar basta mostrar que para x suficientemente grande, tenemos que (M+nA)x^{n-1}<a_nx^n. Pero como x>0, esta desigualdad es equivalente a x>\frac{M+nA}{a_n}.

Recapitulando, para cualquier M>0, si x>\frac{M+nA}{a_n}, entonces p(x)>M. Esto termina la demostración.

\square

Podemos usar la proposición anterior para comparar polinomios cuando su variable tiende a infinito.

Ejemplo. Mostraremos que existe una M suficientemente grande tal que si x>M, entonces

    \[\frac{1}{2}x^7-x^6-x-1>x^6+1000x^5+1000000.\]

Pasando todo del lado izquierdo, nos queda la desigualdad equivalente

    \[\frac{1}{2}x^7-2x^6-1000x^5-x-999999>0.\]

Aquí tenemos un polinomio p(x) de grado impar y coeficiente principal positivo. Por la proposición anterior, \lim_{x\to \infty} p(x) = \infty, de modo que la M que estamos buscando existe.

\square

Continuidad de polinomios

Antes de llegar a diferenciabilidad de polinomios, haremos un paso intermedio. Recordemos otra definición de cálculo.

Definición. Sea f:\mathbb{R}\to \mathbb{R} una función y a un real. Decimos que f es continua en a si

    \[\lim_{x\to a} f(x) = f(a).\]

Decimos que f es continua si es continua en todo real.

Por la proposición de propiedades de límites, la suma o producto de funciones continuas es continua. Las funciones constantes son continuas. La función identidad I:\mathbb{R}\to \mathbb{R} dada por I(x)=x es continua. Estos tres hechos nos ayudan a demostrar que todos los polinomios son funciones continuas sin tener que recurrir a la definición de límite.

Teorema. Cualquier polinomio p(x) en \mathbb{R}[x] pensado como una función p:\mathbb{R}\to \mathbb{R} es una función continua.

Demostración. Supongamos que p(x) está dado por

    \[p(x)=a_0+a_1x+\ldots+a_nx^n.\]

Para toda i de 0 a n tenemos que la función x\mapsto a_i es constante y por lo tanto es continua. Si i>0, la función x\mapsto x^i es producto de i veces la identidad consigo misma. Como la identidad es continua y producto de continuas es continua, entonces x\mapsto x^i es continua.

De nuevo, usando que producto de funciones continuas es continua, tenemos que x\mapsto a_ix^i es una función continua. De esta forma, p(x) es la suma de n+1 funciones continuas, y por lo tanto es una función continua.

\square

El resultado anterior nos ayuda a usar teoremas versátiles de cálculo en nuestro estudio de polinomios. Recordemos el teorema del valor intermedio.

Teorema (del valor intermedio). Sea f:\mathbb{R}\to \mathbb{R} una función continua. Sean a<b dos reales. Entonces entre a y b, la función f toma todos los valores entre f(a) y f(b).

Veamos cómo el teorema del valor intermedio nos permite encontrar raíces de polinomios.

Problema. Muestra que el polinomio p(x)=x^7-5x^5+x^2+3 tiene por lo menos una raíz en el intervalo [0,2].

Solución. Al evaluar al polinomio en cero, obtenemos p(0)=3. Al evaluarlo en 2, obtenemos

    \begin{align*}p(2)&=2^7-5\cdot 2^5+x^2 + 3\\&=128-160+4+3\\&=-25.\end{align*}

Como los polinomios son funciones continuas, podemos aplicar el teorema del valor intermedio. Concluimos que p(x) toma todos los valores de -25 a 2 en el intervalo [0,2]. En particular, existe un real r en [0,2] tal que p(r)=0.

\square

El teorema del valor intermedio nos ayuda a demostrar que un polinomio tiene una raíz en cierto intervalo. Sin embargo, no es de tanta utilidad para decir exactamente cuál es esa raíz. Es un resultado existencial en vez de ser constructivo. Veamos un ejemplo más, que muestra una proposición que quedó pendiente en una entrada anterior.

Problema. Sea p(x) un polinomio cuadrático, mónico e irreducible en \mathbb{R}[x]. Muestra que p(r)>0 para todo real r.

Solución. Procedamos por contradicción. Supongamos que p(r)\leq 0 para algún real r.

Como p(x) es mónico, su coeficiente principal es 1, que es positivo. Como p(x) es cuadrático, es de grado par. Por la proposición de límites a infinito, existe un real t>r tal que p(t)>0. Por el teorema del valor intermedio, existiría un real s en el intervalo [r,t] tal que p(s)=0. Pero esto es imposible, pues entonces por el teorema del factor x-s divide a p(x) y esto contradice que p(x) es irreducible.

\square

Como muestra el problema anterior, se pueden combinar los límites de polinomios a infinito y menos infinito, y sus propiedades de continuidad. Otra aplicación es mostrar que todo polinomio de grado impar tiene por lo menos una raíz real. Esto se verá en otra entrada.

Por supuesto, otros resultados de continuidad también se pueden usar en todos los polinomios, como el teorema del valor extremo. Aplicándolo directamente, concluimos lo siguiente.

Proposición. Sean a<b reales y p(x) un polinomio en \mathbb{R}. Entonces p(x) está acotado en el intervalo [a,b] y existen reales r y s en dicho intervalo tales que p(r) y p(s) son el mínimo y máximo de p(x) en [a,b], respectivamente.

Diferenciabilidad de polinomios

Es momento de hablar de diferenciabilidad de polinomios. Recordemos una última definición de cálculo.

Definición. Sea f:\mathbb{R}\to \mathbb{R} una función. Decimos que f es diferenciable en a si el límite

    \[\lim_{h\to 0} \frac{f(a+h)-f(a)}{h}\]

existe. En este caso, a ese límite lo denotamos por f'(a). Una función es diferenciable si es diferenciable en todo real. A la función f':\mathbb{R}\to \mathbb{R} le llamamos la derivada de f.

Al igual que en el caso de continuidad, la suma y producto de funciones diferenciales es diferenciable. Si f:\mathbb{R}\to \mathbb{R} y g:\mathbb{R}\to \mathbb{R} son diferenciables, entonces la derivada de f+g está dada por

    \[(f+g)'(x)=f'(x)+g'(x)\]

y la derivada de fg está dada por la regla de la cadena

    \[(fg)'(x)=f'(x)g(x)+f(x)g'(x).\]

Las funciones constantes son diferenciables, y su derivada es la función constante 0. La función identidad es diferenciable, y su derivada es la función constante 1. Esto es sencillo de mostrar y queda como tarea moral.

Proposición. Sea n\geq 1 un entero. El polinomio p(x)=x^n es diferenciable, y su derivada es la función p'(x)=nx^{n-1}.

Demostración. Haremos la prueba por inducción. Si n=1, el polinomio es p(x)=x, y su derivada es p'(x)=1=1\cdot x^0, como queremos. Supongamos que el resultado es cierto para el entero n\geq 1 y tomemos p(x)=x^{n+1}=x^n\cdot x. Por hipótesis inductiva, x\mapsto x^n es diferenciable. Como p(x) es producto de dos funciones diferenciables, entonces es diferenciable.

Usando la regla de la cadena, la hipótesis inductiva de la fórmula y la derivada de x\mapsto x, tenemos que

    \[p'(x)=(nx^{n-1})(x)+(x^n)(1)=(n+1)x^n.\]

Esto termina la demostración.

\square

Con todos estos ingredientes podemos mostrar la diferenciabilidad de todos los polinomios. Los detalles quedan como tarea moral.

Teorema (diferenciabilidad de polinomios). Sea p(x) un polinomio en \mathbb{R}[x] dado por

    \[p(x)=a_0+a_1x+\ldots+a_nx^n,\]

Entonces p(x) pensado como función es diferenciable y su derivada es un polinomio. Si p(x) es constante, su derivada es el polinomio 0. En otro caso, su derivada es el polinomio

    \[a_1+2a_2x+3a_3x^2+\ldots+na_nx^{n-1}.\]

Ejemplo. El polinomio x^7+3x^2-1 es diferenciable. Su derivada es el polinomio 7x^6+6x.

\square

Ya que sabemos que los polinomios son diferenciables, podemos usar todas las herramientas de cálculo diferencial, como:

No profundizaremos en esto, pues es el contenido de un buen curso de cálculo, o bien de material de algún texto en el área, como el libro de Cálculo de Spivak.

A nosotros nos interesa una consecuencia algebraica de que los polinomios tengan derivada. Como la derivada de un polinomio es otro polinomio, entonces la derivada es diferenciable. Por ello, un polinomio p(x) se puede derivar iteradamente tantas veces como se quiera. Al polinomio obtenido de derivar n veces le llamamos la n-ésima derivada y lo denotamos por p^{(n)}(x). En la siguiente entrada veremos cómo la repetida diferenciabilidad de polinomios nos ayuda a detectar la multiplicidad de sus raíces.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Estudia el resto de los casos de la proposición de límites de polinomios cuando la entrada va a menos infinito y a infinito.
  • Muestra usando la definición de límite que las funciones constantes y la función identidad son continuas.
  • Demuestra por definición que las funciones constantes son diferenciables y que su derivada es la función constante 0. Demuestra por definición que la función identidad es diferenciable y que su derivada es la función constante 1.
  • Muestra que existe un real x en el cual los polinomios p(x)=x^5+x^3+x y q(x)=100x^4+10x^2 son iguales. Sugerencia. Reescribe esta igualdad en términos de encontrar una raíz de un sólo polinomio.
  • Completa los detalles del teorema de diferenciabilidad de polinomios.

Seminario de Resolución de Problemas: Funciones diferenciables y la derivada

Introducción

En entradas anteriores hemos platicado acerca de funciones continuas. A partir de ahí, platicamos de dos teoremas importantes para esta clase de funciones: el teorema del valor intermedio y el teorema del valor extremo. La siguiente clase de funciones que nos interesa es la de funciones diferenciables. Hablaremos de esta clase de funciones y de la derivada.

Como recordatorio, si A\subset \mathbb{R} y a es un punto en el interior de A, decimos que f:A\to \mathbb{R} es diferenciable en a si el límite

    \[\lim_{h\to 0} \frac{f(a+h)-f(a)}{h}\]

existe y es finito.

En ese caso, llamamos f'(a) al valor de ese límite. Cuando A es abierto y f es diferenciable en todo punto a de A, entonces simplemente decimos qur f es diferenciable y podemos definir a la derivada f' de f como la función f':A\to \mathbb{R} tal que a cada punto lo manda al límite anterior.

Mencionaremos algunas propiedades básicas de funciones diferenciables y cómo se pueden usar para resolver problemas. Como en ocasiones anteriores, no hacemos mucho énfasis en la demostración de las propiedades básicas, pues se pueden encontrar en libros de texto, como el Cálculo de Spivak.

Propiedades básicas de funciones diferenciables

En la definición de diferenciabilidad, se calcula el límite

    \[\lim_{h\to 0} \frac{f(x+h)-f(x)}{h}.\]

Sin embargo, en algunas ocasiones es más sencillo calcular el límite

    \[\lim_{y\to x} \frac{f(x)-f(y)}{x-y}.\]

Estos dos límites son equivalentes, pues sólo difieren en el cambio de variable y=x+h. Dependiendo del problema que se esté estudiando, a veces conviene usar una notación u otra para simplificar las cuentas.

Como en el caso de la continuidad, la diferenciabilidad se comporta bien con las operaciones básicas.

Proposición. Si f:(a,b)\to \mathbb{R} y g:(a,b)\to \mathbb{R} son diferenciables, entonces f+g, f-g y fg son diferenciables. Tenemos que sus derivadas son

    \begin{align*}(f+g)'=f'+g'\\(f-g)'=f'-g'\\ (fg)'=f'g+fg'.\end{align*}

Si g(x)\neq 0, entonces f/g también es diferenciable en x, con derivada

    \[(f/g)'=\frac{f'g-fg'}{g^2}.\]

La proposición anterior se puede probar directamente de las definiciones. Se demuestra en un curso usual de cálculo, pero es un ejercicio recomendable hacer las demostraciones de nuevo.

La tercera igualdad se llama la regla del producto y la última la regla del cociente. En la regla del producto tenemos simetría, así que no importa cuál función derivamos primero. En la regla del cociente sí importa que derivemos primero a f en el numerador. Para acordarse de ello, es fácil acordarse que g va “al cuadrado” y como va al cuadrado, es “más fuerte”, y “no se deja derivar primero”.

Las funciones diferenciables son continuas, en el sentido de la siguiente proposición.

Proposición. Si f:A\to \mathbb{R} es una función diferenciable en x, entonces es continua en x.

Demostración. En efecto,

    \begin{align*}\lim_{h\to 0}& f(a+h)-f(a) \\= &\lim_{h\to 0} \frac{f(a+h)-f(a)}{h} \cdot h\\=&\lim_{h\to 0} \frac{f(a+h)-f(a)}{h} \cdot \lim_{h\to 0} h\\= &f'(a)\cdot 0 = 0,\end{align*}

de modo que

    \[\lim_{h\to 0}f(a+h) = f(a),\]

en otras palabras,

    \[\lim_{x\to a} f(x)=f(a),\]

así que f es continua en a.

\square

Una propiedad más es que las funciones diferenciables alcanzan su máximo en puntos en donde la derivada se anula. Damos un esbozo de la demostración de una parte de la proposición, pero recomendamos completar con cuidado el resto de la prueba, sobre todo cuidando que al pasar términos negativos multiplicando o dividiendo, se invierta la desigualdad correctamente.

Proposición. Si f:(a,b)\to \mathbb{R} tiene un máximo o un mínimo en x, entonces f'(x)=0.

Sugerencia pre-demostración. Supón que f'(x)\neq 0. Divide en casos de acuerdo a si f'(x)>0 ó f'(x)<0. También, haz una figura que te ayude a entender lo que está sucediendo: si la derivada existe y es mayor que 0 en un punto x, entonces cerca de x la función se ve como si “tuviera pendiente positiva” y entonces tantito a la derecha crece y tantito a la izquierda decrece.

Esbozo de demostración. Procedemos por contradicción. Si f'(x)=c>0, entonces para h>0 suficientemente pequeño tenemos que

    \[\left|\frac{f(x+h)-f(x)}{h}-c\right|<c/2,\]

de modo que \frac{f(x+h)-f(x)}{h}>c/2, de donde f(x+h)>f(x)+\frac{hc}{2}>f(x), lo que muestra que x no es un máximo.

Del mismo modo, tomando h<0 suficientemente cercano a 0, tenemos que x no es un mínimo. Los casos en los que f'(x)=c<0 son parecidos.

\square

La proposición anterior nos permite usar la derivada para estudiar los valores extremos de una función, aunque no esté definida en un intervalo abierto. Si f:[a,b]\to \mathbb{R} es diferenciable en (a,b) y es continua en [a,b], entonces sus valores extremos forzosamente están o bien en los extremos del intervalo (en a o b), o bien en un punto x\in (a,b) en donde la derivada es 0. Esta es la estrategia que usaremos para mostrar los teoremas de Rolle y del valor medio.

Problemas resueltos de funciones diferenciables

Veamos algunos problemas en los que podemos aplicar las propiedades anteriores de funciones diferenciables.

Problema. Supongamos que la función xf(x) es diferenciable en un punto x_0\neq 0 y que la función f es continua en x_0. Muestra que f es diferenciable en x_0.

Sugerencia pre-solución. Para mostrar que la expresión es diferenciable, usa la definición de diferenciabilidad con límite x\to x_0. En vez de tratar de encontrar el límite del cociente directamente, cambia el problema multiplicando y dividiendo por xx_0.

Solución. Primero, como xf(x) es diferenciable en x_0, tenemos que el siguiente límite existe y es finito

    \[A:=\lim_{x\to x_0}\frac{xf(x)-x_0f(x_0)}{x-x_0}.\]

Tenemos que mostrar que el límite

    \[\lim_{x\to x_0}\frac{f(x)-f(x_0)}{x-x_0}\]

existe. Para ello tomamos una x suficientemente cerca de x_0, de modo que x\neq 0, y multiplicamos el numerador y denominador por xx_0, y luego sumamos y restamos x_0^2f(x_0) en el numerador para obtener lo siguiente:

    \begin{align*}&\frac{f(x)-f(x_0)}{x-x_0} &\\= &\frac{xx_0 f(x)-xx_0 f(x_0)}{xx_0 (x-x_0)}\\=&\frac{xx_0 f(x)-x_0^2f(x_0)-xx_0 f(x_0)+x_0^2f(x_0)}{xx_0 (x-x_0)}\\=&\frac{1}{x}\left(\frac{xf(x)-x_0f(x_0)}{x-x_0}\right) -\frac{f(x_0)}{x}.\end{align*}

Tomando el límite cuando x\to x_0, tenemos que el primer sumando converge a \frac{A}{x_0}, por la diferenciabilidad de xf(x) y que el segundo sumando converge a \frac{f(x_0)}{x_0}. De esta forma, f es diferenciable en x_0.

\square

Problema. Sea n un entero positivo y a_1,\ldots, a_n números reales. Consideremos la función

    \[f(x)=a_1\sin x + a_2\sin 2x + \ldots + a_n \sin nx.\]

Muestra que si |f(x)|\leq |\sin x| para todos los reales x, entonces

    \[|a_1+2a_2+\ldots+na_n|\leq 1.\]

Sugerencia pre-solución. Se puede hacer una prueba por inducción. Intenta hacerlo así. Luego, intenta modificar el problema poniendo a la expresión final del enunciado en términos de la derivada de f en algún valor específico.

Solución. La derivada de f es

    \[a_1\cos x+ 2a_2\cos 2x + \ldots + n a_n\cos nx,\]

que en 0 es

    \[a_1+2a_2+\ldots+na_n,\]

que es precisamente el lado izquierdo de la desigualdad que queremos.

Por definición de derivada, tenemos que

    \begin{align*}|f'(0)|&=\lim_{x\to 0}\left|\frac{f(x)-f(0)}{x-0}\right|\\&=\lim_{x\to 0} \left|\frac{f(x)}{x}\right|.\end{align*}

Por la hipótesis del problema, la última expresión dentro del límite es menor o igual a \left|\frac{\sin x}{x}\right |. Como el límite de \frac{\sin x}{x} cuando x \to 0 es 1, tenemos que

    \[|f'(0)|\leq 1,\]

como queríamos.

\square

Problema. Supongamos que f:\mathbb{R}\to \mathbb{R} es una función que satisface la ecuación funcional f(x+y)=f(x)+f(y) para todo x y y en \mathbb{R} y que f es diferenciable en 0. Muestra que f es una función de la forma f(x)=cx para c un real.

Sugerencia pre-solución. Usa como paso intermedio para el problema mostrar que f es diferenciable en todo real. Recuerda que una función que satisface la ecuación funcional del problema debe satisfacer que f(x)=f(1)x para todo racional x. Esto se probaba con división por casos e inducción. Usa propiedades de funciones continuas.

Solución. Tomando x=y=0, tenemos que f(0)=2f(0), de modo que f(0)=0. Mostremos que f es diferenciable en todo real.

Como f es diferenciable en 0, tenemos que

    \[L:=\lim_{h\to 0} \frac{f(h)-f(0)}{h}=\lim_{h\to 0} \frac{f(h)}{h}\]

existe y es finito. Tomemos ahora cualquier real r. Por la ecuación funcional, tenemos que

    \begin{align*}f(r+h)-f(r)&=f(r)+f(h)-f(h)\\&=f(r),\end{align*}


de modo que

    \[\lim_{h\to 0} \frac{f(r+h)-f(r)}{h}=\lim_{h\to 0} f(h)=L.\]

Así, f es diferenciable en todo real r. Por lo tanto, f es contínua en todo real.

Anteriormente, cuando hablamos de inducción y de división por casos, vimos que una función que satisface la ecuación funcional f(x+y)=f(x)+f(y) debe satisfacer que f(x)=f(1) x para todo número racional x. Para cualquier real r podemos encontrar una sucesión de racionales \{x_n\} que convergen a r. Como f es continua, tenemos que

    \begin{align*}f(r)&=\lim_{n\to \infty} f(x_n) \\&= \lim_{n\to \infty} f(1) x_n \\&= f(1) r.\end{align*}

Esto muestra lo que queremos.

\square

Más problemas

Hay más ejemplos de problemas relacionados con la derivada en la Sección 6.3 del libro Problem Solving through Problems de Loren Larson.

Seminario de Resolución de Problemas: El teorema del valor intermedio

Introducción

El teorema del valor intermedio nos dice que si f: [a, b] \to \mathbb{R} es una función continua, entonces para todo y entre f(a) y f(b), existe un número c \in [a, b] tal que f(c)=y. La forma de pensar este teorema es que “las funciones continuas no se pueden saltar valores que quedan entre dos valores que ya tomaron”, o bien “las funciones continuas no dan brincos en su imagen”.

Veamos algunos problemas que se resuelven usando este teorema

Una aplicación directa del teorema del valor intermedio

Problema 1. Muestra que la ecuación 2x^3+7x^2-27x=-18 tiene una solución en el intervalo [-7,-5].

Sugerencia pre-solución. Formula un problema equivalente definiendo una función continua f para la cual si f(x)=0, entonces x es solución a la ecuación.

Solución. La ecuación la podemos ver como 2x^3+7x^2-27x+18=0. Consideremos la función

    \[f(x)=2x^3+7x^2-27x+18.\]

Como f(x) es una función polinomial, sabemos que es continua en \mathbb{R}, así que es continua en el intervalo [-7,-5]. Lo que queremos ver es que existe un c entre -7 y -5, tal que f(c)=0. Para esto, tenemos que evaluar la función en -7 y en -5.

Tenemos que:

f(-7)=-136 y f(-5)=78.

Tenemos que 0 está entre -136 y 78. Así, por el teorema del valor intermedio, debe de existir un número c entre -7 y -5 de tal forma que f(c)=0. Por lo tanto 2x^3+7x^2-27x=-18 tiene una solución entre -5 y -7.

\square

Notemos que no se encontró el valor de la raíz de la ecuación, sin embargo mostramos la existencia de esta. Esta es una de las características del teorema del valor intermedio: exhibir la existencia de algo sin necesidad de encontrarlo explícitamente.

Definir una buena función

En ocasiones podemos definir dos funciones para un problema y hacerlas interactuar para obtener una sola función continua que nos permite resolver un problema.

Problema 2. Un montañista empezó a escalar una montaña el sábado a las 8:00 hrs y llegó a la cima a las 18:00 hrs del mismo día. Decidió pasar la noche en la cima de la montaña. El día domingo empezó a descender a las 8:00 hrs y llegó al punto de partida a las 18:00 hrs. Prueba que hubo una hora en la que en ambos días estuvo a la misma altura de la montaña.

Sugerencia pre-solución. Plantea el problema usando dos funciones continuas que denoten la altura conforme pasa el tiempo en ambos días. Tienes mucha flexibilidad, así que usa notación efectiva para simplificar los cálculos.

Solución. Veamos que para este problema, podemos establecer dos funciones continuas para describir el cambio de altura con respecto al tiempo en horas, una para el ascenso y otra para el descenso del montañista en ambos días.

Sean h_1(t), y h_2(t) las funciones que representan el ascenso y el descenso del montañista respectivamente. En otras palabras, h_1(t) y h_2(t) denotan la altura en la que está el montañista tras t horas después de haber comenzado su ascenso y descenso, respectivamente. Como amabas funciones son continuas en el intervalo de tiempo [0, 10] (esto es porque tardó 10 horas para ascender y 10 horas para descender), tenemos que la función g(t)=h_2(t)-h_1(t) tiene que ser continua en [0, 10] también.

Ahora bien, sea M la altura en la cima de la montaña. Tenemos lo siguiente:

h_1(0)=0, h_1(10)=M y h_2(0)=M, h_2(10)=0.

Así, g(0)=M y g(10)=-M. A su vez, 0 está entre -M y M, por lo que aplicando el teorema del valor intermedio, debe de existir un t_0 en el intervalo [0, 10] tal que g(t_0)=0.

Y como

g(t)=h_2(t)-h_1(t),

entonces

g(t_0)=h_2(t_0)-h_1(t_0)

0=h_2(t_0)-h_1(t_0)

h_1(t_0)=h_2(t_0).

Con esto podemos concluir que en el tiempo t_0 el día domingo estuvo a la misma altura que el día sábado al tiempo t_0.

\square

Definir un buen intervalo

En algunas ocasiones no es directo qué valores tenemos que usar como los extremos del intervalo al que aplicaremos el teorema del valor intermedio. Un ingrediente adicional que se necesita en el siguiente problema es elegir de manera correcta el extremo derecho.

Problema 3. Prueba que si n es un entero positivo y x_0 > 0, entonces existe un único número positivo x tal que x^n=x_0.

Sugerencia pre-solución. Necesitarás modificar el problema un poco. Se quiere encontrar una solución a x^n=x_0. Limítate a encontrarla en el intervalo [0,c] para una buena elección de c.

Solución. Sea c un número mayor que 1 de tal forma que 0<x_0<c. Si consideramos la función f(x)=x^n, tenemos que dicha función es continua en el intervalo [0, c], y tenemos que

f(0)=0 y f(c)=c^n.

Como

    \[0<x_0<c<c^n,\]

tenemos que x_0 está en el intervalo (0,c), y por el teorema del valor intermedio, tenemos que existe x en el intervalo (0,c) tal que f(x)=x_0, que usando la definición de f quiere decir que

    \[x^n=x_0.\]

No puede existir otro además de x_0 ya que la función f(x)=x^n es creciente en el intervalo [0,c].

\square

Más ejemplos

Puedes encontrar más problemas que se pueden resolver usando el teorema del valor intermedio en el libro Problem Solving Strategies de Loren Larson, en la Sección 6.2.

Seminario de Resolución de Problemas: Funciones continuas

Introducción

En entradas anteriores platicamos de propiedades aritméticas de los números enteros, del anillo de enteros módulo n y de los números complejos. Vimos cómo pueden ser de utilidad para resolver problemas de matemáticas de distintos tipos. Ahora veremos temas de funciones continuas.

En esta entrada, y las subsecuentes, entraremos al mundo del cálculo y de la continuidad. En el transcurso de diez entradas veremos cómo aprovechar distintas herramientas de continuidad, cálculo diferencial e integral.

Seguiremos con la costumbre de no demostrar los teoremas principales que usemos, pero podemos recomendar al lector las siguientes fuentes para consultar los fundamentos

El orden de presentación de los temas viene del libro Problem Solving Strategies de Loren Larson.

Recordatorio de límites y continuidad

Sea A un subconjunto de \mathbb{R} y f:A\to \mathbb{R} una función. Intuitivamente, el límite de f(x) cuando x tiende a a es c si al acercarnos a x en A tenemos que f(x) se acerca a c.

De manera formal, tenemos que

    \[\lim_{x\to a} f(x) = c\]

si para todo \epsilon>0 tenemos que existe un \delta >0 tal que si x\in A y |x-a|<\delta, entonces |f(x)-c|<\epsilon. Esta es la definición épsilon-delta. Otra forma de denotar lo mismo es decir que f(x)\to c cuando x\to a. Los límites se comportan bien con las operaciones.

Proposición. Sean f:A\to \mathbb{R} y g:A\to \mathbb{R} funciones. Sea a\in A. Si f(x)\to c y g(x)\to d cuando x\to a, entonces

  • f(x)+g(x)\to c+d cuando x\to a
  • f(x)g(x)\to cd cuando x\to a
  • Si d\neq 0, f(x)/g(x)\to c/d cuando x\to a

Definición. Sea f:A\to \mathbb{R} una función real y a\in A. Decimos que f es continua

  • en a si f(x)\to f(a) cuando x\to a.
  • en S\subset A si es continua en todo a\in S.

Si f es continua en A, simplemente decimos que es continua.

Como los límites se comportan bien con las operaciones, tenemos que las funciones continuas también se comportan bien con las operaciones.

Proposición. Sean f:A\to \mathbb{R} y g:A\to \mathbb{R} funciones. Sea a\in A. Si f y g son continuas en a, entonces

  • f+g es continua en a
  • fg es continua en a
  • Si g(a)\neq 0, f/g es continua en a

Ejercicio. Muestra que \frac{x^2+3x+1}{x+1} es continua para todo x\neq -1.

Sugerencia. No uses la definición épsilon-delta directamente en la función, pues será complicado. Demuestra que f(x)=x es continua con la definición epsilon-delta y de ahí usa las demás propiedades enunciadas en las proposiciones.

Funciones continuas y sucesiones

Las funciones continuas y las sucesiones están cercanamente relacionadas. Recuerda que una sucesión de reales es un conjunto ordenado de reales, uno por cada entero positivo, al cual denotaremos así:

    \[\{x_n\}=\{x_1,x_2,x_3,x_4,\ldots\}.\]

Decimos que la sucesión \{x_n\} converge a c, en símbolos

    \[\lim_{n\to \infty} x_n = c\]

si para cada \epsilon >0 existe un natural N tal que si n\geq N, entonces |x_n-c|<\epsilon. También decimos esto como x_n\to c cuando n\to \infty, o simplemente x_n\to c.

Teorema. La función f:A\to \mathbb{R} es continua en a\in A si y sólo si para toda sucesión de reales \{x_n\} en A tal que \{x_n\}\to a se tiene que f(x_n)\to f(a).

Este teorema tiene múltiples usos. Nos dice que para verificar que una sucesión sea continua en un punto a, nos basta ver qué le hace a todas las sucesiones que convergen a a. Si alguna de ellas no converge a f(a), entonces la función no es continua. Si todas ellas convergen a f(a), entonces la función sí es continua. Veamos un ejemplo de su aplicación

Problema. Considera la función f:[0,1]\to \mathbb{R} la función tal que a cada irracional le asigna 0 y a cada racional p/q (expresado con p y q positivos y primos relativos) le asigna 1/q. Estudia la continuidad de esta función.

Sugerencia pre-solución. La continuidad de la función se comporta distinto para los racionales y para los irracionales. Para ver qué sucede en los racionales, acércate con una sucesión de irracionales.

Solución. Demostraremos que f es continua en los irracionales y no es continua en los racionales.

Tomemos un racional r=p/q<1. Observa que la sucesión x_n=r+\frac{\sqrt{3}}{n} para n suficientemente grande cae en [0,1] y x_n\to r. Cada término de la sucesión es irracional. Así, f(x_n)=0 para todo término, de modo que f(x_n)\to 0\neq 1/q = f(r). Esto muestra que f no es continua en r. Para r=1 podemos hacer el mismo truco con x_n=r-\frac{\sqrt{3}}{n} para ver que no es continua.

Tomemos ahora un número irracional r\in[0,1]. Tenemos que f(r)=0. Mostraremos que para toda sucesión \{x_n\} tal que x_n\to r, tenemos que f(x_n)\to 0. Tomemos M un entero positivo. Consideremos el conjunto A_M de todos los números racionales en [0,1] con denominador a lo más M.

Como r es irracional, las distancias de r a los números de A_M son todas positivas, así que su mínimo es un real positivo \epsilon. Como x_n\to r, existe un N tal que si n\geq N, entonces |x_n-r|<\epsilon. Así, para n\geq N, no se puede que x_n esté en A_M. De este modo, para n\geq N tenemos que |f(x_n)|<1/M. Esto muestra que f(x_n)\to 0. Así, f es continua en los irracionales.

\square

Por supuesto, algunas veces es útil regresar a la definición epsilon-delta para funciones continuas.

Problema. Sea f:\mathbb{R}\to\mathbb{R} una función inyectiva y continua tal que f(2x-f(x))=x y tal que tiene por lo menos un punto fijo. Muestra que f(x)=x para todo x\in \mathbb{R}.

Sugerencia pre-solución. Antes de intentar cualquier idea de cálculo, hay que demostrar que si se cumple f(y)=y+r, entonces f(y+nr)=(y+nr)+r. Para demostrar esto para n negativa, usa inducción. Para n positiva necesitarás jugar un poco con la hipótesis. Aplica la hipótesis f(2x-f(x))=x para x=f(z) y usa la inyectividad. De ahí obtendrás una igualdad que te servirá para encontrar f(y+nr) para n positivas.

Solución. La primera observación es que el conjunto de puntos fijos de una función continua es cerrado, pues si \{x_n\} es una sucesión de puntos fijos que converge a un punto c, entonces por un lado \{f(x_n)\}=\{x_n\} también converge a c, y por otro por continuidad converge a f(c). Como los límites, cuando existen, son únicos, tenemos que f(c)=c.

Si f(y)\neq y para alguna y\in \mathbb{R}, entonces tendremos f(y)=y+r para alguna r\neq 0. Mostraremos que f(y+nr)=(y+nr)+r para todo entero n. Aplicando la hipótesis f(2x-f(x))=x para x=y, obtenemos que f(y-r)=y=(y-r)+r, de modo que inductivamente tenemos f(y-nr)=(y-nr)+r para n entero positivo.

Aplicando la hipótesis f(2x-f(x))=x para x=f(x) obtenemos f(2f(z)-f(f(z)))=f(z), de modo que por inyectividad tenemos 2f(z)-f(f(z))=z. Usando esta ecuación para z=y obtenemos que 2f(y)-f(f(y))=y, de donde f(y+r)=2(y+r)-y=(y+r)+r, y de aquí inductivamente f(y+nr)=(y+nr)+r para n enteros positivos. De esta forma, f(y+nr)=(y+nr)+r para todo entero.

Ahora sí viene la parte en la que usamos la continuidad. Supongamos que f(x)\neq x. Sea \epsilon=|f(x)-x|>0. Como f es continua en x, existe un \delta>0 que podemos suponer menor a \frac{\epsilon}{4} tal que si |z-x|<\delta, entonces |f(z)-f(x)|<\frac{\epsilon}{4}.

Sea x_0 un punto frontera del conjunto de puntos fijos. Como f es continua en x_0, podemos encontrar un \alpha>0 y \alpha<\delta tal que si |w-x_0|<\alpha, entonces |f(w)-f(x_0)|<\delta. Como el conjunto de puntos fijos es cerrado, x_0 está en él. Ya que x_0 es punto frontera, existe un y tal que f(y)\neq y y |x_0-y|\leq \alpha. Para este y tenemos por las cotas que hemos encontrado y la desigualdad del triángulo que

    \[|f(y)-y|\leq |f(y)-f(x_0)|+|x_0-y|\leq \delta +\alpha <2\delta.\]

Así, r=f(y)-y es un número de norma entre 0 y 2\delta, de modo que existe una n para la cual y+nr \in (x-\delta,x+\delta). Por lo que probamos previamente, f(y+nr)=(y+nr)+r. A partir de todo esto concluimos que:

    \begin{align*}\epsilon&=|f(x)-x|\\&\leq |f(x)-f(y+nr)|+|f(y+nr)-x|\\&<\frac{\epsilon}{4}+|(y+nr)-x|+|r|\\&<\frac{\epsilon}{4}+3\delta\\&<\frac{\epsilon}{4}+\frac{3\epsilon}{4}=\epsilon.\end{align*}

Esto es una contradicción, así que todos los reales deben ser puntos fijos de f.

\square

Dos teoremas importantes de continuidad

Las funciones continuas satisfacen dos propiedades muy importantes.

Teorema (teorema del valor intermedio). Sea f:[a,b]\to \mathbb{R} una función continua. Entonces para todo y entre f(a) y f(b) existe un real c \in [a,b] tal que f(c)=y.

Aquí, si f(a)\leq f(b) entonces “entre f(a) y f(b)” quiere decir en el intervalo [f(a),f(b)] y si f(b)\leq f(a), quiere decir en el intervalo [f(b),f(a)]. Dicho en otras palabras, si una función continua toma dos valores, entonces toma todos los valores entre ellos.

Teorema (teorema del valor extremo). Sea f:[a,b] \to \mathbb{R} una función continua. Entonces existen números c y d en [a,b] para los cuales f(c)\leq f(x) \leq f(d) para todos los x en [a,b].

Dicho de otra forma, una función continua definida en un intervalo cerrado “alcanza su máximo y su mínimo”.

En siguientes entradas hablaremos de aplicaciones de estos teoremas. Por el momento sólo los enunciamos, y en la siguiente sección demostraremos uno de ellos.

El método de la bisección de intervalos

Una de las herramientas más útiles para trabajar con reales y con funciones continuas es el método de la bisección de intervalos. Se trata a grandes rasgos de lo siguiente:

  • Se comienza con un intervalo [a,b]. Definimos a_0=a y b_0=b.
  • Partimos ese intervalo por su punto medio m_0=m en dos intervalos [a,m] y [m,b]. En alguno de esos dos pasa algo especial. Si es en el primero, definimos a_1=a, b_1=m. Si es en el segundo, definimos a_1=m, b_1=b, para conseguir un intervalo [a_1,b_1]\subset [a_0,b_0] especial.
  • Continuamos recursivamente. Ya que definimos al intervalo [a_n,b_n], consideramos a su punto medio m_n. De entre los intervalos [a_n,m_n] y [m_n,b_n] elegimos a uno de ellos que sea “especial” para definir [a_{n+1},b_{n+1}].

Los a_i forman una sucesión no decreciente acotada superiormente por b y los b_i una sucesión no creciente acotada inferiormente por a. De esta forma, ambas sucesiones tienen un límite. Además, notemos que |b_n-a_n|=|b-a|/2^n, de modo que |b_n-a_n|\to 0, por lo que ambas situaciones convergen al mismo límite L, y este límite está en todos los intervalos [a_n,b_n]. Si elegimos a los intervalos [a_n,b_n] de manera correcta, podemos hacer que este límite L tenga propiedades especiales.

Veamos cómo aplicar esta idea para demostrar el teorema del valor extremo.

Demostración (teorema del valor extremo). Comenzamos con una función contínua f:[a,b]\to \mathbb{R}. Basta con probar que f alcanza su máximo, pues para ver que alcanza su mínimo basta aplicar las siguientes ideas a -f.

Usaremos el método de bisección de intervalos. Definimos a_0=a y b_0=b. Suponiendo que ya definimos a_n y b_n, consideremos el punto medio m_n del intervalo [a_n,b_n].

  • Si algún x en [a_n,m_n] cumple que f(x)\geq f(y) para todo y\in [m_n,b_n], elegimos a_{n+1}=a_n y b_{n+1}=m_n.
  • En otro caso, para todo x en [a_n,m_n] tenemos algún y\in [m_n,b_n] que cumple f(x)<f(y) y elegimos a_{n+1}=m_n y b_{n+1}=b_n.

En cualquier caso, notemos que se cumple que “para cualquier x en el intervalo no elegido hay una y en el intervalo sí elegido tal que f(y)\geq f(x)“.

Como discutimos anteriormente, las sucesiones \{a_n\} y \{b_n\} convergen a un mismo límite d. Afirmamos que f(d)\geq f(x) para todo x en [a,b]. Si x=d, esto es claro. Si no, x\neq d y definimos x_0=x.

Vamos a definir recursivamente una sucesión \{x_n\} para la cual

    \[f(x_0)\leq f(x_1)\leq f(x_2)\leq f(x_3)\leq \ldots\]

mediante un proceso que haremos mientras x_n\neq d.

Ya que definimos x_n tal que x_n\neq d, notemos que d y x_n están en el mismo intervalo [a_0,b_0], pero como son distintos existe un primer m\geq 1 tal que en el intervalo [a_m,b_m] está d pero x_n no. Como es la menor m, sí están ambos en el intervalo [a_{m-1},b_{m-1}].

Por cómo definimos la elección de intervalos, hay un y en el intervalo [a_m,b_m] tal que f(y)\geq f(x_n). Si y=d, terminamos (por la cadena de desigualdades). Si no, definimos x_{n+1} como este y. Así, cuando el proceso se detiene, terminamos por la cadena de desigualdades. Si el proceso no se detiene, tenemos una sucesión infinita \{x_n\} que converge a d, de modo que f(d)=\lim{f(x_n)}\geq f(x_0)=f(x), pues cada término es mayor o igual a f(x_0). Esto muestra la desigualdad f(d)\geq f(x) que queríamos.

\square

Más problemas

Se pueden encontrar más problemas de este tema en la Sección 6.1 del libro Problem Solving through Problems de Loren Larson.