Archivo de la etiqueta: derivadas

Álgebra Superior II: El teorema de derivadas y multiplicidad

Introducción

En entradas anteriores definimos qué quiere decir que un real sea una raíz de un polinomio. Luego, vimos que mediante el teorema del factor se puede definir una relación entre las raíces de un polinomio y los polinomios lineales que lo dividen. Sin embargo, es posible que un real sea una raíz de un polinomio «más de una vez», que fue un concepto que formalizamos en la entrada de desigualdades de polinomios. En esta entrada veremos que a través de las derivadas de polinomios, podemos determinar la multiplicidad de sus raíces.

Como recordatorio, la multiplicidad de una raíz r de un polinomio p(x) en \mathbb{R}[x] es el mayor entero m tal que (x-r)^m divide a p(x) en \mathbb{R}[x]. También, en esta entrada haremos uso de la regla del producto para derivadas.

El teorema de derivadas y multiplicidad

El siguiente resultado es fundamental para la detección de raíces múltiples. Su demostración es sencilla pues usamos varios de los resultados que hemos obtenido anteriormente.

Teorema (derivadas y multiplicidad). Sea r una raíz del polinomio p(x) en \mathbb{R}[x] de multiplicidad m. Si m>1, entonces r es una raíz de la derivada p'(x), y es de multiplicidad m-1. Si m=1, entonces r no es raíz de p'(x).

Demostración. Como r es una raíz de p(x) de multiplicidad m, entonces se puede escribir p(x)=(x-r)^m q(x), en donde q(x) es un polinomio que ya no es divisible entre x-r. Derivando, por regla del producto tenemos que

    \begin{align*}p'(x)&=m(x-r)^{m-1}q(x) + (x-r)^m q'(x)\\&=(x-r)^{m-1}(mq(x)+(x-r)q'(x)).\end{align*}

Afirmamos que x-r no divide a mq(x)+(x-r)q'(x). Si lo dividiera, como divide a (x-r)q'(x) entonces también tendría que dividir a mq(x) y por lo tanto a q(x). Pero esto sería una contradicción con la elección de q(x).

De esta forma, si m=1 entonces x-r no divide a p'(x) y por el teorema del factor entonces r no es raíz de p'(x). Y si m>1, entonces (x-r)^{m-1} divide a p'(x) por la expresión que encontramos de la derivada, pero (x-r)^m no pues x-r no divide al segundo factor. Esto termina la prueba.

\square

Ejemplo. Consideremos al polinomio p(x)=(x-3)^3(x+1). Tanto 3 como -1 son raíces de p(x). La multiplicidad de la raíz 3 es tres y la multiplicidad de la raíz -1 es uno. Si derivamos a p(x) usando la regla del producto, tenemos que

    \begin{align*}p'(x)&=3(x-3)^2(x+1)+(x-3)^3\\&=3(x-3)^2(x+1+x-3)\\&=3(x-3)^2(2x-2)\\&=6(x-3)^2(x-1)\end{align*}

Observa que p'(x) en efecto tiene a 3 como raíz de multiplicidad dos y ya no tiene a 1 como raíz.

\square

Es muy importante respetar la hipótesis de que r sea raíz de p(x). Por ejemplo, en el ejemplo anterior 1 es raíz de p'(x) de multiplicidad 1, pero 1 no es raíz de p(x) (y mucho menos de multiplicidad 2).

El teorema de derivadas y multiplicidad es interesante, pero todavía no es útil en aplicaciones prácticas. Sin embargo, tiene dos consecuencias que sí se pueden usar para estudiar polinomios concretos.

Encontrar la multiplicidad de una raíz

El teorema de derivadas y multiplicidad nos dice que la multiplicidad de una raíz «baja en uno» al pasar de un polinomio a su derivada, pero aún no nos dice cuál es esa multiplicidad. Sin embargo, lo podemos aplicar repetidamente para obtener esta información. Recuerda que para k un entero no negativo y p(x) en \mathbb{R}[x], usamos p^{(k)}(x) para denotar k-ésima derivada de un polinomio. Aquí p^{(0)}(x) es simplemente p(x).

Proposición. Sea r una raíz del polinomio p(x) en \mathbb{R}[x] de multiplicidad m. Si k el mayor entero positivo tal que r es raíz de

    \[p^{(0)}(x), p^{(1)}(x),\ldots,p^{(k)}(x),\]

entonces m=k+1.

Demostración. Usando el teorema anterior de manera inductiva, tenemos que para cada entero 0\leq \ell<m, se tiene que r es raíz de multiplicidad m-\ell de p^{(\ell)}(x) En particular, es raíz de todas estas derivadas. Además, por el mismo teorema, se tiene que r ya no es raíz de p^{(m)}(x). De esta forma, tenemos que k=m-1, de donde se obtiene el resultado deseado.

\square

La proposición anterior ahora sí nos da una manera de encontrar la multiplicidad de una raíz de un polinomio.

Ejemplo. Sabiendo que 3 es una raíz del polinomio

    \[p(x)=x^5-9x^4+28x^3-36x^2+27x-27,\]

vamos a encontrar su multiplicidad.

Para esto, vamos a calcular sus derivadas:

    \begin{align*}p'(x)&=5x^4-36x^3+84x^2-72x+27\\p''(x)&=20x^3-108x^2+168x-72\\p^{(3)}(x)&=60x^2-216x+168\\p^{(4)}(x)&=120x-216\\p^{(5)}(x)&=120\\p^{(6)}(x)&=0\end{align*}

Tenemos que

    \begin{align*}p'(3)&=5\cdot 81 - 36 \cdot 27 +84 \cdot 9 -72\cdot 3 + 27\\&=405-972+756-216+27\\&=0.\end{align*}

Hasta aquí, sabemos que 3 es raíz de multiplicidad al menos dos. Tenemos también que

    \begin{align*}p''(3)(3)&=20\cdot 27-108\cdot 9 +168 \cdot 3 - 72\\&=540-972+504-72\\&=0.\end{align*}

Hasta aquí, sabemos que 3 es raíz de multiplicidad al menos tres. Siguiendo,

    \begin{align*}p^{(3)}&=60\cdot 9-216\cdot 3 +168\\&=720-648+168\\&=240.\end{align*}

Como la tercera derivada ya no se anuló en 3, la multiplicidad de 3 como raíz es exactamente tres.

\square

Es importante que revisemos todas las derivadas, y que sea una por una. En el ejemplo anterior, p^{(6)}(3)=0, pero eso no quiere decir que 3 sea raíz de multiplicidad 7, pues la evaluación falla desde la tercera derivada.

Simplificar un polinomio para encontrarle sus raíces

Hay otra consecuencia práctica del teorema de multiplicidades y derivadas, que puede ser de utilidad en algunos problemas. Recuerda que para polinomios p(x) y q(x) en \mathbb{R}[x] usamos \MCD{p(x),q(x)} para denotar al máximo común divisor de dos polinomios. En particular, divide a p(x) en \mathbb{R}[x], de modo que

    \[\frac{p(x)}{\MCD{p(x),q(x)}}\]

es un polinomio en \mathbb{R}[x].

Proposición. Sea p(x) un polinomio en \mathbb{R}[x] y p'(x) su derivada. El polinomio

    \[q(x):=\frac{p(x)}{\MCD{p(x),p'(x)}}\]

es un polinomio en \mathbb{R}[x], con las mismas raíces reales que p(x), pero todas ellas tienen multiplicidad 1.

Demostración. Factoricemos a todas las raíces reales de p(x) con sus multiplicidades correspondientes para escribir

    \[p(x)=(x-r_1)^{m_1}\cdot \ldots \cdot (x-r_n)^{m_n} r(x),\]

en donde r(x) ya no tiene raíces reales. De acuerdo al teorema de derivadas y multiplicidad, podemos escribir

    \[p'(x)=(x-r_1)^{m_1-1}\cdot \ldots \cdot (x-r_n)^{m_n-1} s(x),\]

en donde ningún x-r_i divide a s(x). Es sencillo entonces mostrar, y queda como tarea moral, que \MCD{p(x),p'(x)} es

    \[(x-r_1)^{m_1-1}\cdot \ldots \cdot (x-r_n) \cdot \MCD{r(x),s(x)}.\]

A partir de esto, concluimos que

    \begin{align*}q(x)&=\frac{p(x)}{\MCD{p(x),p'(x)}}\\&= (x-r_1)\cdot \ldots \cdot (x-r_n) \cdot \frac{r(x)}{\MCD{r(x),s(x)}}.\end{align*}

De aquí se ve que r_1,\ldots,r_n son raíces de multiplicidad 1 de q(x). No hay más raíces reales en \frac{r(x)}{\MCD{r(x),s(x)}}, pues si hubiera una raíz \alpha, entonces por el teorema del factor x-\alpha dividiría a este polinomio, y por lo tanto a r(x), de donde \alpha sería raíz de r(x), una contradicción.

\square

La proposición anterior se puede usar de manera práctica como sigue:

  • Para empezar, tomamos un polinomio arbitrario p(x).
  • Luego, lo derivamos para obtener p'(x).
  • Después, usando el algoritmo de Euclides, encontramos al polinomio \MCD{p(x),q(x)}.
  • Ya con el máximo común divisor, hacemos división polinomial para encontrar q(x)=\frac{p(x)}{\MCD{p(x),q(x)}}.
  • Si p(x) tenía raíces repetidas, entonces ahora q(x) será de grado menor, y quizás más fácil de estudiar. Encontramos las raíces de q(x). Estas son las raíces de f(x).
  • Finalmente, usamos el teorema de la sección anterior para encontrar la multiplicidad de cada raíz.

Veamos un problema interesante en el que se conjuntan varias ideas de esta entrada.

Problema. Factoriza en \mathbb{R}[x] al polinomio

    \[-x^5+5x^4+5x^3-45x^2+108.\]

Solución. Este es un polinomio de grado cinco, para el cual hasta antes de ahora no teníamos muchas herramientas para estudiarlo. Vamos a aplicar el método explicado arriba. Lo primero que haremos es factorizar un -1 para volver este polinomio mónico. Recordaremos poner este signo al final. Tomemos entonces

    \[p(x)=x^5-5x^4-5x^3+45x^2-108.\]

Su derivada es

    \[p'(x)=5x^4-20x^3+15x^2+90x,\]

Se puede verificar, y queda como tarea moral, que el máximo común divisor de p(x) y p'(x) es el polinomio

    \[M(x)=x^3-4x^2-3x+18.\]

Haciendo la división polinomial, tenemos que

    \[\frac{p(x)}{M(x)}=x^2-x-6=(x+2)(x-3).\]

Como este polinomio tiene las mismas raíces que p(x), concluimos que -2 y 3 son las raíces de p(x).

Usando la proposición para multiplicidades de raíces (que también queda como tarea moral), se puede verificar que -2 es raíz de multiplicidad dos y que 3 es raíz de multiplicidad 3. Como p(x) es un polinomio de grado 5 y es mónico, entonces se debe de dar la igualdad

    \[p(x)=(x+2)^2(x-3)^3.\]

Al regresar al polinomio original, debemos agregar un signo menos. Concluimos que la factorización del polinomio del problema es

    \[-(x+2)^2(x-3)^3.\]

\square

Esta proposición nos da una manera de encontrar raíces. En las siguientes dos entradas veremos otras dos formas de encontrarlas. Para cuando los polinomios son de grado 3 y 4, podemos encontrar las raíces de manera explícita. Para cuando los polinomios tienen coeficientes enteros, podemos encontrar una cantidad finita de candidatos a ser raíces racionales.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Verifica que 1 es raíz del polinomio

        \[x^8-x^7-9x^6+19x^5+5x^4-51x^3+61x^2-31x+6\]

    y encuentra su multiplicidad.
  • En la demostración de la última proposición, muestra la igualdad

        \[\MCD{p(x),p'(x)}=(x-r_1)^{m_1-1}\cdot \ldots \cdot (x-r_n) \MCD{r(x),s(x)}.\]

  • En el último ejemplo, aplica el algoritmo de Euclides a p(x) y p'(x) para mostrar que el máximo común divisor es el que se afirma.
  • Aplica la proposición de multiplicidad de raíces en el último ejemplo para verificar que en efecto las multiplicidades de 2 y 3 son las que se afirman.
  • Aplica el mismo método que en la última sección para factorizar el polinomio

        \[x^6+8x^5+18x^4-4x^3-47x^2-12x+36.\]

Teorema de la función inversa: motivación y ejemplo

Introducción

Imagina, por un momento, que en un futuro trabajas en la Agencia Espacial Mexicana (AEM). De repente, llega la directora y trae una función en las manos. «Para una misión crítica necesito que me conviertas esta función en una función invertible, cuanto antes posible». Te da la función. Le respondes «Ok, directora y, ¿cómo la quiere o qué?». Pero es demasiado tarde. Ya salió y hay que ponerse a trabajar. Entonces tomas la función, la pones en el gis y comienzas a estudiarla en el pizarrón.

Resulta que es una función de varias variables. Específicamente, es la función que pasa de coordenadas polares a coordenadas cartesianas. Es decir, es la función F:\mathbb{R}^2 \to \mathbb{R}^2 dada por:

    \[F(r,\theta)=(r\cos\theta, r \sin\theta).\]

La función sí es suprayectiva, así que ya va parte del trabajo hecho. Pero el problema es que no es inyectiva. Por ejemplo,

    \[F\left(1,\frac{\pi}{2}\right)=\left(\cos\frac{\pi}{2},\sin\frac{\pi}{2}\right)=(0,1)=F\left(1,\frac{5\pi}{2}\right).\]

Peor aún, para todo \theta \in \mathbb{R} se tiene que F(0,\theta)=(0,0).

Pero la situación no es tan terrible. Una forma de solucionarla es restringir el dominio de la función. Si en vez de pensarla en una función F:\mathbb{R}^2\to \mathbb{R}^2 la pensamos como una restricción F:U\to V para algunos conjuntos U y V, entonces muy posiblemente la podamos «convertir» en una función biyectiva.

No podemos ser demasiado arbitrarios. Por ejemplo, si tomamos U=\{(0,0)\} y V=\{(0,0)\}, entonces claramente la restricción es una biyección, pero está muy chafa: sólo nos quedamos con un punto. Por esta razón, vamos a poner una meta un poco más ambiciosa y a la vez más concreta: lograr que U y V sean conjuntos abiertos alrededor de los puntos x y y:=F(x) para algún x\in \mathbb{R}^2. Si lo logramos, habremos encontrado una biyección «cerquita de x» en conjuntos «más gorditos». Para algunos puntos x lo podemos hacer, y para algunos otros puntos x es imposible. Veamos ejemplos de ambas situaciones.

Si x=\left(\sqrt{2},\frac{\pi}{4}\right), entonces y=\left(\sqrt{2}\cos \frac{\pi}{4}, \sqrt{2}\sin\frac{\pi}{4}\right)=(1,1). En este caso, podemos elegir una vecindad pequeña U alrededor de x y tomar V:=F(U), pues los otros puntos w con F(x)=F(w) están lejos (están a brincos verticales de tamaño 2\pi de x). Para resolver el problema de la AEM, basta restringir F a U.

Sin embargo, si x=\left(0, \frac{\pi}{4}\right), entonces y=\left(0,0). Sin importar qué tan pequeña tomemos la vecindad abierta U alrededor de x, vamos a seguir tomando puntos w sobre la recta r=0, para los cuales sucede F(x)=0=F(w). Si la directora de la AEM insiste en que haya un punto con r=0, entonces no hay invertibilidad en todo un abierto alrededor de este punto. Esperemos que la misión no dependa de eso.

Aplicando el teorema de la función inversa

El teorema de la función inversa es una herramienta que da condiciones suficientes para que una función F:\mathbb{R}^n\to \mathbb{R}^n pueda invertirse localmente «cerca» de un punto de su dominio. Podemos utilizar este resultado cuando la función que estudiamos es «bien portada», donde esto quiere decir que sea continuamente diferenciable. Si bien hay ligeras variantes en la literatura, el enunciado que presento aquí es el siguiente:

Teorema de la función inversa

Sea F:\mathbb{R}^n\to \mathbb{R}^n una función de clase \mathcal{C}^1 con matriz Jacobiana DF. Supongamos que F(a)=b y que DF(a) es invertible. Entonces existen vecindades abiertas U y V de a y b respectivamente para las cuales:

a) F:U\to V es una biyección,
b) su inversa F^{-1}:V\to U es de clase \mathcal{C}^1 y
c) DF^{-1}(b)=DF(a)^{-1}.

En otra entrada hablo de la intuición de este teorema, así como de su demostración. Por el momento sólo me enfocaré en dar un ejemplo de cómo podemos usarlo.

Regresemos al ejemplo de la Agencia Espacial Mexicana. La función que tenemos es F:\mathbb{R}^2\to \mathbb{R}^2 que está dada por

    \[F(r,\theta)=(F_1(r,\theta),F_2(r,\theta))=(r\cos\theta, r \sin\theta).\]

Para usar el teorema de la función inversa, tenemos que estudiar la invertibilidad de DF, su matriz Jacobiana. Esta está construida a partir de las derivadas parciales de las funciones coordenadas como sigue:

    \[DF(r,\theta)= \begin{pmatrix}\frac{\partial F_1}{\partial r}(r,\theta) & \frac{\partial F_1}{\partial \theta}(r,\theta)\\\frac{\partial F_2}{\partial r}(r,\theta) & \frac{\partial F_2}{\partial \theta}(r,\theta)\end{pmatrix}= \begin{pmatrix}\cos \theta & -r\sin \theta\\\sin \theta & r \cos \theta.\end{pmatrix}\]

Para estudiar su invertibilidad, notamos que su determinante es

    \begin{align*}\det(DF(r,\theta))&=\cos \theta \cdot r\cos \theta - \sin \theta \cdot (-r\sin \theta) \\&= r\cos^2\theta+r\sin^2\theta \\&= r,\end{align*}

y que es distinto de 0 si y sólo si r\neq 0. Esto coincide con las observaciones que hicimos «a mano»: la función es invertible localmente en (r,\theta) si r\neq 0. Cuando r=0, la invertibilidad no está garantizada.

El teorema de la función inversa tiene más implicaciones. Nos dice además que la inversa F^{-1} también es continuamente diferenciable y que su derivada es la inversa de F. Como ejemplo, consideremos el punto \left(\sqrt{2},\frac{\pi}{4}\right). Tenemos que

    \[F\left(\sqrt{2},\frac{\pi}{4}\right) = (1,1),\]

que

    \[DF\left(\sqrt{2},\frac{\pi}{4}\right) = \begin{pmatrix}\frac{1}{\sqrt{2}}& -1\\ \frac{1}{\sqrt{2}} & 1\end{pmatrix},\]

y que \det\left(DF\left(\sqrt{2},\frac{\pi}{4}\right)\right)=\sqrt{2}.

Así, F es invertible localmente alrededor de \left(\sqrt{2},\frac{\pi}{4}\right), su inversa es continuamente diferenciable y además

    \[D(F^{-1})(1,1)=DF\left(\sqrt{2},\frac{\pi}{4}\right)^{-1} =\frac{1}{\sqrt{2}} \begin{pmatrix}1 & 1\\-\frac{1}{\sqrt{2}}& \frac{1}{\sqrt{2}}\end{pmatrix}.\]

Esto termina la motivación y el ejemplo del teorema de la función inversa. Si quieres entender un poco mejor la intuición detrás del teorema, así como su demostración, puedes darte una vuelta por esta otra entrada.

¿Ahora qué?

Si te gustó esta entrada, puedes compartirla o revisar otras relacionadas con matemáticas a nivel universitario:

Generalizar el problema

HeuristicasA veces tener un problema concreto es más difícil que tener un problema más general. En los problemas concretos puede haber números grandes, o un brinco muy difícil, o bien simplemente no existen herramientas para atacarlo por separado. Cuando generalizamos podemos aprovechar más teoría, por ejemplo el principio de inducción.

En estos videos veremos algunos ejemplos en los cuales es más fácil resolver un problema que aparentemente debería de ser más difícil.

Ir a los videos…