Archivo de la etiqueta: derivada

Cálculo Diferencial e Integral III: Regla de la cadena para campos vectoriales

Por Alejandro Antonio Estrada Franco

Introducción

Tenemos ya la definición de diferenciabilidad, y su versión manejable: la matriz jacobiana. Seguiremos construyendo conceptos y herramientas del análisis de los campos vectoriales muy importantes e interesantes. A continuación, enunciaremos una nueva versión de la regla de la cadena, que nos permitirá calcular las diferenciales de composiciones de campos vectoriales entre espacios de dimensión arbitraria. Esta regla tiene numerosas aplicaciones y es sorprendentemente fácil de enunciar en términos de producto de matrices.

Primeras ideas hacia la regla de la cadena

La situación típica de regla de la cadena es considerar dos funciones diferenciables que se puedan componer. A partir de ahí, buscamos ver si la composición también es diferenciable y, en ese caso, intentamos dar la derivada de la composición en términos de las derivadas de las funciones. Veamos qué pasa en campos vectoriales.

Pensemos en f:SfRmRn, g:SgRlRm y en su composición h=fg definida sobre alguna vecindad VSg de a¯ y tal que g(V)Sf. Pensemos que g es diferenciable en a¯ con derivada Ga¯ y que f es diferenciable en b¯:=g(a¯) con derivada Fb¯.

Exploremos la diferenciabilidad de la composición h en el punto a¯. Para ello, tomemos un y¯Rl tal que a¯+y¯V y consideremos la siguiente expresión:

h(a¯+y¯)h(a¯)=f(g(a¯+y¯))f(g(a¯)).

Tomando v¯=g(a¯+y¯)g(a¯), tenemos b¯+v¯=g(a¯)+v¯=g(a¯+y¯). De esta forma,

f(g(a¯+y¯))f(g(a¯))=f(b¯+v¯)f(b¯).

Por la diferenciabilidad de g en a¯, tenemos que podemos escribir

v¯=Ga¯(y¯)+||y¯||Eg(a¯;y¯), con limy¯0¯Eg(a¯;y¯)=0.

Usando la diferenciabilidad de f en b¯, y la linealidad de su derivada Fb¯, tenemos entonces que:

f(b¯+v¯)f(b¯)=Fb¯(v¯)+||v¯||Ef(b¯;v¯)=Fb¯(Ga¯(y¯)+||y¯||Eg(a¯;y¯))+||v¯||Ef(b¯;v¯)=(FbGa¯)(y¯)+||y¯||(Fb¯Eg(a¯;y¯))+||v¯||Ef(b¯;v¯),

con limy¯0¯Ef(b¯;v¯)=0.

Concatenando nuestras igualdades, podemos reescribir esto como

h(a¯+y¯)h(a¯)=(Fb¯Ga¯)(y¯)+||y¯||Eh(a¯;y¯), en donde hemos definido

Eh(a¯;y¯)=(Fb¯Eg)(a¯;y¯)+||v¯||||y¯||Ef(b¯;v¯). Si logramos demostrar que limy¯0¯Eh(a¯;y¯)=0, entonces tendremos la diferenciabilidad buscada, así como la derivada que queremos. Dejemos esto en pausa para enunciar y demostrar un lema auxiliar.

Un lema para acotar la norma de la derivada en un punto

Probemos el siguiente resultado.

Lema. Sea ϕ:SRlRm un campo vectorial diferenciable en un punto c¯S y Tc¯ su derivada. Entonces, para todo v¯Rl, se tiene:

||Tc¯(v¯)||k=1m||ϕk(c¯)||||v¯||.

Donde ϕ(v¯)=(ϕ1(v¯),,ϕm(v¯))

Demostración. Procedemos con desigualdad del triángulo como sigue:

||Tc¯(v¯)||=||k=1m(ϕk(c¯)v¯)ek||k=1m||(ϕk(c¯)v¯)ek||=k=1m|ϕk(c¯)v¯|

y luego usamos la desigualdad de Cauchy-Schwarz en cada sumando para continuar como sigue

k=1m||ϕk(c¯)||||v¯||,

que es lo que buscábamos.

◻

Conclusión del análisis para regla de la cadena

Retomando el análisis para Eh(a¯;y¯), dividamos el límite en los dos sumandos.

Primer sumando:

Como Fb¯ es lineal, entonces es continua. También, sabemos que limy¯0¯Eg(a¯;y¯)=0. Así,

limy¯0¯(Fb¯Eg)(a¯;y¯)=Fb¯(limy¯0¯Eg(a¯;y¯))=Fb¯(0¯)=0.

Segundo sumando:

Retomando la definición de v¯, aplicando desigualdad del triángulo y el lema que demostramos,

||v¯||=||Ga¯(y¯)+||y¯||Eg(a¯;y¯)||||Ga¯(y¯)||+||y¯||||Eg(a¯;y¯)||(k=1m||gk(a¯)||||y¯||)+||y¯||||Eg(a¯;y¯)||.

Dividiendo ambos lados entre ||y¯||, obtenemos entonces que

||v¯||||y¯||k=1m||gk(a¯)||+||Eg(a¯;y¯)||.

De aquí se ve que conforme y¯0¯, la expresión ||v¯||||y¯|| está acotada superiormente por la constante A:=k=1m||gk(a¯)||. Además, si y¯0¯, entonces v¯0¯. Así,

0limy¯0¯||v¯||||y¯||Ef(b¯,v¯)Alimy¯0¯Ef(b¯,v¯)=0 pues limy¯0¯v¯=0¯ implica limy¯0¯Ef(b¯,v¯).

Hemos concluido que h(a¯+y¯)h(a¯)=(Fb¯Ga¯)(y¯)+||y¯||Eh(a¯;y¯),

con limy¯0¯Eh(a¯;y¯)=0. Esto precisamente es la definición de h=fg es diferenciable en a¯, y su derivada en a¯ es la transformación lineal dada por la composición de transformaciones lineales Fb¯Ga¯.

Recapitulación de la regla de la cadena

Recapitulamos toda la discusión anterior en el siguiente teorema.

Teorema (Regla de la cadena). Sean f:SfRmRn, g:SgRlRm campos vectoriales. Supongamos que la composición fg está definida en todo un abierto SSg. Supongamos que g es diferenciable en un punto a¯S con derivada Ga¯ y f es diferenciable en b¯:=g(a¯) con derivada Fb¯. Entonces, h es diferenciable en a¯ con derivada Fb¯Ga¯.

Dado que la representación matricial de la composición de dos transformaciones lineales es igual al producto de estas, podemos reescribir esto en términos de las matrices jacobianas como el siguiente producto matricial: Dh(a¯)=Df(b¯)Dg(a¯).

Usos de la regla de la cadena

Hagamos algunos ejemplos de uso de regla de la cadena. En el primer ejemplo que veremos a continuación, la función f es un campo escalar.

Ejemplo 1. Tomemos g:SRnRm campo vectorial, y f:URmR campo escalar. Consideremos h=fg y supongamos que se satisfacen las hipótesis del teorema de la regla de la cadena. Tenemos: Df(b¯)=(fx1(b¯)fxm(b¯)) y Dg(a¯)=(g1x1(a¯)g1xn(a¯)gmx1(a¯)gmxn(a¯)).

Por la regla de la cadena tenemos Dh(a¯)=Df(b¯)Dg(a¯) esto implica (hx1(a¯)hxn(a¯))=(fx1(b¯)fxm(b¯))(g1x1(a¯)g1xn(a¯)gmx1(a¯)gmxn(a¯)).

Así (hx1(a¯)hxn(a¯))=(i=1mfxi(b¯)gix1(a¯)i=1mfxi(b¯)gixn(a¯)).

En otras palabras, tenemos las siguientes ecuaciones para calcular cada derivada parcial de h: hxj(a¯)=i=1mfxi(b¯)gixj(a¯).

Ejemplo 2. Sean a¯=(s,t) y b¯=(x,y) puntos en R2. Pensemos que las entradas de b¯ están dadas en función de las entradas de a¯ mediante las ecuaciones x=g1(s,t) y y=g2(s,t). Pensemos que tenemos un campo escalar f:R2R, y definimos h:R2R mediante h(s,t)=f(g1(s,t),g2(s,t)).

Por el ejemplo anterior hs=fxxs+fyys y ht=fxxt+fyyt. Como tarea moral queda que reflexiones qué significa x cuando aparece en el «numerador» y qué significa cuando aparece en el «denominador».

Ejemplo 3. Para un campo escalar f(x,y) consideremos un cambio de coordenadas x=rcosθ, y=rsenθ es decir tomemos la función ϕ(r,θ)=f(rcosθ,rsenθ).

Por el ejemplo anterior tenemos ϕr=fxxr+fyyr y ϕθ=fxxθ+fyyθ donde, haciendo las derivadas parciales tenemos: xr=cosθ,yr=senθ y xθ=rsenθ,yθ=rcosθ. Finalmente obtenemos: ϕr=fxcosθ+fysenθ y ϕθ=fxrsenθ+fyrcosθ que son las derivadas parciales del cambio de coordenadas en el dominio de f.

Mas adelante…

En la siguiente entrada comenzaremos a desarrollar la teoría para los importantes teoremas de la función inversa e implícita si tienes bien estudiada esta sección disfrutaras mucho de las siguientes.

Tarea moral

  1. Considera el campo escalar F(x,y,z)=x2+ysen(z). Imagina que x,y,z están dados por valores u y v mediante las condiciones x=u+v, y=vu, z=u. Calcula Fu, Fv.
  2. Sea g(x,y,z)=(xy,x), y f(x,y)=(2x,xy2,y). Encuentra la matriz jacobiana del campo vectorial gf. Encuentra también la matriz jacobiana del campo vectorial fg.
  3. En la demostración del lema que dimos, hay un paso que no justificamos: el primero. Convéncete de que es cierto repasando el contenido de la entrada anterior Diferenciabilidad.
  4. Imagina que sabemos que la función f:RnRn es invertible y derivable en a¯ con derivada Ta¯. Imagina que también sabemos que su inversa f1 es derivable en b¯=f(a¯) con derivada Sb¯. De acuerdo a la regla de la cadena, ¿Qué podemos decir de Ta¯Sb¯? En otras palabras, ¿Cómo son las matrices jacobianas entre sí, en términos de álgebra lineal?
  5. Reflexiona en cómo todas las reglas de la cadena que hemos estudiado hasta ahora son un corolario de la regla de la cadena de esta entrada.

Entradas relacionadas

Cálculo Diferencial e Integral III: Diferenciabilidad en campos vectoriales

Por Alejandro Antonio Estrada Franco

Introducción

Después de haber abordado a modo de repaso las herramientas que usaremos de álgebra lineal, estamos listos para estudiar la diferenciabilidad en funciones más generales. Ya estudiamos la diferenciabilidad en curvas (funciones f:SRRm) y en campos escalares (funciones f:SRnR). Ahora podemos estudiar la diferenciabilidad en campos vectoriales, que recuerda que ahora sí son funciones f:SRnRm para cualesquiera m y n enteros positivos.

Intuición de diferenciabilidad en campos vectoriales

Con anterioridad, hemos discutido la intuición geométrica de lo que quiere decir que un campo escalar f:RnR sea diferenciable. A grandes rasgos, estamos pidiendo que cerca de un punto a¯ la función f(a¯) cambie «como una función lineal». Esto quiere decir que la gráfica de la función se parece mucho a un hiperplano en Rn+1 cerca del punto a¯, tanto que de hecho podemos dar un hiperplano tangente a la gráfica en a¯. Bajo suficiente regularidad, esta función lineal estaba dada por las derivadas parciales y estaba muy relacionada con el gradiente f.

La situación para campos vectoriales es parecida. Si tenemos una función f:RnRm, entonces está dada por funciones coordenada que la expresan de la manera f(x¯)=(f1(x¯),,fm(x¯)) para cada x¯Rn. La diferenciabilidad que buscaremos ahora deberá suceder coordenada a coordenada, y por ello lo que pensaremos como derivada tendrá algo así como un gradiente por cada coordenada. Esto nos daría m gradientes, pero una mejor forma de pensar en resumen a la derivada es como una transformación lineal T:RnRm que nos diga con mucha precisión cuándo cambia la funciíon f (cuando esto sea posible).

Para tener clara idea de lo que queremos hacer recordemos el ejemplo de campos escalares, y de aquí construiremos una generalización a campos vectoriales: Observa la Figura 1. A la izquierda, hemos dibujado dos copias de Rn (pero que puedes pensar como R2). A la derecha, hemos dibujado la gráfica de dos funciones. Una es una función cualquiera f:RnRm. La otra es una transformación lineal T:RnRm que ha sido trasladada sobre el plano xy y sobre el eje z con la función G(v¯)=T(v¯a¯)+f(a¯). Estas gráficas son objetos en Rn×Rm (ponemos un punto por cada pareja (x¯,f(x¯)) con x¯Rn).

Como T es lineal, cumple T(0¯)=0. Al hacer la traslación, obtenemos G(a¯)=T(0¯)+f(a¯)=f(a¯). Así, T traslada un subespacio H de dimensión n a un subespacio afín de dimensión n que pasa por f(a¯). Lo que buscaremos al pedir que la función f sea diferenciable con derivada T es que la gráfica de f se parezca mucho a este subespacio H+f(a¯), tanto que de hecho dicho subespacio lo podremos pensar como tangente a la gráfica en el punto (a¯,f(a¯)).

Figura 1

Definición de diferenciabilidad para campos vectoriales

¿Cuál es la condición algebraica que pediremos? Será muy similar a lo que pasaba en campos escalares. Lo que queremos es que el cambio f(a¯+v¯)f(a¯) se parezca mucho a T(v¯) cuando v¯ es pequeño. De hecho, tiene que parecerse tanto, tanto, que f(a¯+v¯)f(a¯) debe parecerse a T(v¯) más rápido de lo que v¯ se va a 0¯. Esto nos lleva a plantear que la condición buscada sea la siguiente:

limv¯0¯||(f(a¯+v¯)f(a¯))T(v¯)||||v¯||=0. La Figura 2 tiene un diagrama que ayuda a entender esto un poco mejor. Queremos que la flecha indicada en amarillo acabe muy cerca de f(a¯+v¯).

El vector T(v¯a¯)+f(a¯) es el vector T(v¯) transportado hasta el plano tangente el cual está en color rosa. La idea es que f(a¯+v¯)f(a¯), que es el vector señalado con amarillo abajo, se aproxime mucho en el sentido señalado por el límite mencionado en el párrafo de arriba. De esta manera tenemos la mejor aproximación lineal. Esta definición se inspira en el polinomio de Tylor de grado 1 para funciones de una variable real.

Por supuesto, la discusión que hemos tenido sólo aplica para cuando estamos trabajando cerca del punto a¯, así que más bien la transformación lineal de la que estamos hablando dependerá del punto a¯. Todo esto nos lleva a nuestra primera definición formal de diferenciabilidad.

Definición. Sea f:SRnRm un campo vectorial. Decimos que f es diferenciable en a¯Int(S) si existe una transformación lineal Ta¯:RnRm tal que

limv¯0¯||f(a¯+v¯)f(a¯)Ta¯(v¯)||||v¯||=0.

En este caso, a Ta¯ le llamamos la derivada de f en el punto a¯.

Antes de empezar a demostrar propiedades de esta noción, nos conviene tener una versión alternativa y totalmente equivalente.

Definición. Sea f:SRnRm un campo vectorial. Decimos que f es diferenciable en a¯Int(S) si existe una transformación lineal Ta¯:RnRm y una función E:Rn×RnRm de manera que f(a¯+v¯)=f(a¯)+Ta¯(v¯)+||v¯||E(a¯;v¯) con lim||v¯||0E(a¯;v¯)=0.

Esta definición es equivalente a la anterior pues si despejamos tenemos: E(a¯;v¯)=f(a¯+v¯)f(a¯)Ta¯(v¯)||v¯||, de donde se puede verificar que se cumple una definición si y sólo si se cumple la otra. Los detalles quedan como tarea moral.

Ejemplo. Consideremos la función f(x,y)=(x2y2,xy) y tomemos el punto a=(1,1). ¿Será f diferenciable en a? Afirmamos que sí, que la función lineal Ta(x,y)=(2x+2y,x+y) cumple con la definición de límite que se pide. Veamos esto en la primera versión de la definición. Tendríamos, usando v¯=(h,k), que

f((1,1)+(h,k))f(1,1)Ta(h,k)=((h+1)2(k+1)2,(h+1)(k+1))(1,1)(2h+2k,h+k)=(h2k2+2h2k+2hk2+h2+k2+4hk,hk)

Dividiendo entre h2+k2 que es la norma de v, y haciendo manipulaciones algebraicas, se obtiene

(h2k2+2h2k+2hk2+h2+k2+4hkh2+k2,hkh2+k2).

Por la desigualdad entre la media cuadrática y la media geométrica, |hk|h2+k2|hk|2,

de modo que cuando (h,k)(0,0), la segunda coordenada del vector que nos interesa converge a cero. La primera coordenada también se puede ver que converge a cero: el primero, segundo, tercero y sexto sumandos se acotan de manera similar, pues tienen factores h o k adicionales. El cuarto y quinto sumando se acotan notando que h2+k2h2+k2=h2+k2, que también converge a cero con h y k. Los detalles quedan de tarea moral.

Diferenciabilidad implica continuidad

En el caso de las funciones de una variable real teníamos claramente que diferenciabilidad implica continuidad. Como es de esperarse, lo mismo se cumple para campos vectoriales, ya que una función diferenciable es más «suave» que una continua.

Teorema. Supongamos f:SRnRm es un campo vectorial diferenciable en un punto a¯ de S. Entonces f es continuo en a¯.

Demostración. Si f es diferenciable en a¯ entonces cumple con la ecuación f(a¯+v¯)=f(a¯)+Ta¯(v¯)+||v¯||E(a¯;v¯) con E(a¯;v¯) una función tal que limv¯0¯E(a¯;v¯)=0 (¿Por qué es válida esta última afirmación?). Por ello:

limv¯0¯f(a¯+v¯)=limv¯0¯(f(a¯)+Ta¯(v¯)+||v¯||E(a¯;v¯))=limv¯0¯f(a¯)+limv¯0¯Ta¯(v¯)+limv¯0¯||v¯||E(a¯;v¯).

El primer sumando no depende de v¯, así que es f(a¯). El segundo se va a cero pues las transformaciones lineales son continuas. Finalmente, el tercer sumando se va a cero por lo que sabemos de E(a¯,v¯). Así, limv¯0¯f(a¯+v¯)=f(a¯). Por lo tanto f es continua.

◻.

Derivadas direccionales y derivadas parciales

Si bien tenemos dos definiciones de diferenciabilidad, aún no tenemos una manera muy práctica de encontrar o describir a la transformación lineal Ta¯, que es la mejor aproximación lineal. En el ejemplo después de nuestra definición, nos dieron la transformación y funcionó, pero hasta donde hemos platicado, todavía es un misterio cómo obtenerla.

Nos gustaría tener una descripción más explícita pues queremos resolver problemas específicos como encontrar, por ejemplo, la ecuación de un hiperplano tangente. Este problema ya lo habíamos resuelto para campos escalares: si tenemos suficiente regularidad, entonces podemos construir la derivada a través de las derivadas parciales (que a su vez son derivadas direccionales). La teoría que ya desarrollamos prácticamente se puede copiar, considerando que ahora tendremos derivadas en cada función coordenada.

Lo primero que notaremos es que así como para campos escalares, para campos vectoriales también podemos definir la noción de derivadas direccionales. Pensemos en una función f:SRnRn. Tomemos un vector fijo a¯Int=(S). Coloquemos una flecha que comience en a¯ y tenga dirección dada por otro vector dado y¯Rn. Si multiplicamos a y¯ por un escalar h positivo, esto estira o encoge al vector y¯, pero lo deja con la misma dirección. En el ejemplo de la Figura 3, al variar sobre todos los valores de h se genera la recta a¯+hy¯. Si a los puntos de esta recta le aplicamos la función f, se obtiene un cierto lugar geométrico f(a¯+hy¯)=(f1(a¯+hy¯),,fm(a¯+hy¯)), conforme se varían los valores de h. Lo que definiremos como derivada direccional nos permitirá hablar de un espacio afín tangente de dimensión m a este lugar geométrico en el punto f(a¯).

Figura 3

A continuación tenemos nuestra definición de derivada direccional para campos vectoriales.

Definición. Sea f:SRnRm un campo vectorial. Tomemos a¯Int(S), y¯Rn. Definimos la derivada direccional de f en a¯ en la dirección y¯ como: f(a¯;y¯)=limh0f(a¯+hy¯)f(a¯)h, siempre y cuando el límite exista.

Notemos que f(a¯;y¯) es un vector de Rm.

En los campos escalares teníamos derivadas parciales. En este caso también las tenemos y describen a las derivadas direccionales en el mismo sentido que en el caso escalar. Para formalizar las cosas, damos la definición a continuación.

Definición. Sea f:SRnRm un campo vectorial. Tomemos a¯Int(S), y¯Rn. Definimos la derivada direccional de f en la coordenada xi en a como la derivada parcial f(a¯;e^i), donde e^i es el i-ésimo vector de la base canónica, siempre y cuando esta exista.

Como en el caso de los campos escalares, las derivadas direccionales pueden entenderse en términos de las derivadas parciales bajo suficiente regularidad. Tomemos e^1,,e^n la base canónica de Rn. Tomemos f:SRnRm. Pensemos que todas las derivadas parciales de f existen en un punto dado a¯ y que son continuas. Expresemos a y¯ como y¯=α1e^1+α2e^2++αne^n con e^1,,e^n la base canónica de Rn. En esta entrada discutiremos hacia el final que bajo estas condiciones tendremos que f(a¯;y¯) existe y de hecho que f(a¯;y¯)=i=1nαif(a¯;e¯i).

El tener derivadas parciales continuas resultará una hipótesis muy fuerte y de hecho implicará todavía más que la existencia de derivadas direccionales. De hecho, como en el caso de campos escalares, esta hipótesis implicará diferenciabilidad. Antes de discutir esto, veremos en la siguiente sección qué pasa componente a componente.

Si las derivadas parciales no son continuas, no deberíamos esperar que las derivadas direccionales existan: ¡hay muchas posibles direcciones y sólo sabemos que pasa en dos de ellas! Como tarea moral, puedes pensar en un contraejemplo de un campo escalar f:R2R2 con derivadas parciales en cierto punto a¯, pero sin alguna (o algunas) derivadas direccionales en a¯.

Derivadas por componente

Las derivadas direccionales pueden entenderse mediante las derivadas parciales, pero también, como en el caso de las trayectorias, pueden entenderse mediante las derivadas por componente. Para pensar en ello, tomemos e^1,,e^m la base canónica de Rm. Tomemos f:SRnRm con funciones coordenadas f(x¯)=(f1(x¯),,fm(x¯)). Pensemos que las derivadas direccionales de f1,,fm en a¯ en la dirección y¯ existen.

Tenemos entonces:

limh0f(a¯+hy¯)f(a¯)h=limh0(f1(a¯+hy¯),,fm(a¯+hy¯))(f1(a¯),,fm(a¯))h=limh0(f1(a¯+hy¯)f1(a¯)h,,fm(a¯+hy¯)fm(a¯)h)=limh0i=1mfi(a¯+hy¯)fi(a¯)he^i=i=1mlimh0fi(a¯+hy¯)fi(a¯)he^i=i=1mfi(a¯;y¯)e^i.

En la última igualdad estamos usando la suposición de que las derivadas existen componente a componente. Como mostramos que el límite planteado inicialmente existe, obtenemos entonces que
(1)f(a¯;y¯)=i=1mfi(a¯;y¯)e^i.

Lo que tenemos aquí es que la derivada direccional de f en a¯ en dirección de y¯ es la suma vectorial de cada vector de la base escalado por la derivada direccional del campo escalar fi en a¯ con respecto a la dirección de y¯.

Diferenciabilidad implica derivadas direccionales

La noción de diferenciabilidad que dimos implica la diferenciabilidad de cada una de las funciones componente fi de una función f:RnRm. Es decir, si el campo vectorial es diferenciable, entonces cada uno de los campos escalares f1,,fm componentes son también diferenciables, pues el límite limv¯0¯||f(a¯+v¯)f(a¯)Ta¯(v¯)||||v¯||=0 se cumple, y por lo tanto se cumple componente a componente. En el caso de Ta¯ el i-ésimo componente es precisamente hacer el producto interior del i-ésimo renglon de la matriz que representa a Ta¯ con v¯, y entonces la derivada fi(a¯) del campo escalar fi está dada precisamente por dicho i-ésimo renglón.

A su vez, sabemos que si un campo escalar es diferenciable, entonces existen todas las derivadas parciales. Por lo que hemos platicado en unidades anteriores, si y¯Rn se escribe en la base canónica como y¯=j=1nyje^j, al aplicar fi(a¯) obtenemos

fi(a¯)(y¯)=j=1nyjfi(a¯)(e^j)=j=1nyjfixj(a¯),

lo cual abreviamos como

fi(a¯;y¯)=(fix1(a¯),,fixn(a¯))y¯.

Usando esta igualdad para cada i y sustituyendo la ecuación (1) que obtuvimos al analizar componente por componente, obtenemos entonces que

f(a¯;y¯)=i=1m((fix1(a¯),,fixn(a¯))y¯)e^i.

¡Pero esto se puede denotar de manera mucho más compacta mediante un producto matricial! Reflexiona un poco por qué la expresión anterior dice exactamente lo mismo que la siguiente:

f(a¯;y¯)=(f1y1(a¯)f1yn(a¯)fmx1(a¯)fmxn(a¯))(y1yn).

Como tarea moral, tendrás que verificar que en un campo vectorial diferenciable en a¯ se debe cumplir que f(a¯;y¯)=Ta¯(y¯). Por lo discutido, debe pasar entonces para cada y que Ta¯(y¯)=(f1x1(a¯)f1xn(a¯)fmx1(a¯)fmxn(a¯))(y1yn).

Esto precisamente nos está diciendo que si f es diferenciable en a, entonces sus derivadas parciales deben existir y se debe cumplir que la forma matricial de Ta¯ en las bases canónicas de Rn y Rm debe ser (2)(f1x1(a¯)f1xn(a¯)fmx1(a¯)fmxn(a¯)).

Matriz jacobiana

Toda la discusión anterior nos lleva a lo siguiente.

Definición. Dado un campo vectorial f:SRnRm diferenciable en un punto a¯Int(S) con derivada Ta¯, a la matriz que representa a Ta¯ en las bases canónicas la denotamos por Df(a¯) y le llamamos la matriz jacobiana de f en a¯.

Por lo discutido en la sección anterior,

Df(a¯)=(f1x1(a¯)f1xn(a¯)fmx1(a¯)fmxn(a¯)).

Escribiremos Df(a¯)(x¯) para referirnos al producto de la matriz Df(a¯) con el vector (columna) x¯, que precisamente coincide con Ta¯(x¯). Así, bajo la hipótesis de diferenciabilidad, hemos recuperado entonces lo que hace Ta¯ como una multiplicación matricial, donde la matriz tiene como elementos a las derivadas parciales de las funciones coordenada en el punto a¯.

Ejemplos de diferenciabilidad en campos vectoriales

Con todo lo discutido hasta ahora, obtenemos un método para obtener la derivada para campos vectoriales, lo que nos permitirá, por ejemplo, encontrar la transformación lineal de forma explícita y encontrar hiperplanos tangentes.

Ejemplo. Consideremos f(x,y)=(x2,xy,y2). Calculemos su diferencial en el punto (1,1). Las funciones coordenada son

f1(x,y)=x2f2(x,y)=xyf3(x,y)=y2,

de donde tenemos: f1x(1,1)=2x|(1,1)=2;f1y(1,1)=0;f2x(1,1)=y|(1,1)=1; f2y(1,1)=x|(1,1)=1;f3x(1,1)=0;f3y(1,1)=2y|(1,1)=2. Así Df(1,1)=(f1x(1,1)f1y(1,1)f2x(1,1)f2y(1,1)f3x(1,1)f3y(1,1))=(201102).

Ejemplo. Ahora obtengamos el plano tangente a una superficie dada en un punto dado. Sea S la superficie de R3 descrita por la imagen de la función f(x,y)=(x,y,xy2). Vamos a determinar el plano tangente a dicha superficie en el punto (1,1,1). Comencemos calculando Df(1,1). En primer lugar calculemos las parciales: f1x(1,1)=1;f1y(1,1)=0;f2x(1,1)=0 f2y(1,1)=1;f3y(1,1)=1;f3y(1,1)=2.

Por lo tanto Df(1,1)=(100112).

Esta transformación manda al punto (x,y) del plano R2 al punto(100112)(xy)=(xyx+2y).

De modo que el plano centrado en el origen es el conjunto H={(x,y,x+2y)R3|(x,y)R2}.

Pero este plano debemos todavía trasladarlo por el vector (1,1,1) para que pase por el punto f(1,1). Concluimos entonces que el plano tangente buscado es el conjunto

{(x+1,y+1,x+2y+1)R3|(x,y)R2}.

En la Figura 4 tenemos la en rojo la imagen del campo vectorial de este ejemplo y en verde la del plano tangente, el punto negro es el punto (1,1,1).

Figura 4

¿Y derivadas parciales implica diferenciabilidad?

Cuando un campo vectorial es diferenciable, existen todas las derivadas parciales de todos sus campos escalares coordenados. El regreso no es cierto. Sin embargo, sí se vale bajo una condición adicional de regularidad.

Definición. Diremos que un campo vectorial f:SRnRm es de clase C1 (o simplemente es C1) en un punto a¯S si todas las derivadas parciales de todas las funciones componentes de f existen y son continuas en a¯. Definimos de manera análoga lo que significa que f sea de clase C1 en todo S.

Teorema. Si f:SRnRm es un campo vectorial, a¯S y f es C1 en a¯, entonces f es diferenciable y su derivada Ta tiene como forma matricial a la matriz jacobiana (2).

La prueba de este resultado se hace coordenada a coordenada, aplicando en cada una de ellas el teorema de diferenciabilidad y derivadas parciales para campos escalares que demostramos en la entrada del teorema del valor medio para campos escalares.

Más adelante

En esta entrada introdujimos el concepto de diferenciabilidad, de derivadas parciales, direccionales y por componente. Además, mostramos que cuando una función es diferenciable, entonces su derivada tiene una forma matricial muy sencilla, dada por las derivadas parciales de las componentes. Esto es nuestra primera señal de que las derivadas y las matrices están muy relacionadas entre sí. Lo que veremos en la siguiente entrada es que esta conexión se sigue dando, y de hecho nos permitirá enunciar de manera muy elegante la regla de la cadena para campos vectoriales: ¡será una multiplicación de matrices!

Después de entender mejor la diferenciabilidad, presentaremos y demostraremos teoremas clásicos e importantes de campos vectoriales: el teorema de la función inversa, y el teorema de la función implícita.

Tarea moral

  1. Completa los detalles faltantes del primer ejemplo que dimos de diferenciabilidad.
  2. Calcula la matriz jacobiana de la función g(x,y,z)=(xz,xy,x2y2z2). Úsala para encontrar la ecuación del espacio tangente a la gráfica en el punto g(2,1,0).
  3. Halla el campo vectorial cuya imagen es el plano tangente a la superficie dada por la ecuación F(x,y)=x2y2+1 en el punto (1,1). Como ayuda al graficar F en R3 nos dibuja la misma superficie que obtenemos de la imagen del campo vectorial f(x,y)=(x,y,x2y2+1) que esta contenida en R3.
  4. Verifica que en efecto las dos definiciones de diferenciabilidad que dimos son equivalentes.
  5. Demuestra que si las parciales de cada componente de un campo vectorial existen, y son continuas, entonces la función es diferenciable. Tendrás que seguir la sugerencia dada en la última sección. Después, justifica la igualdad que dimos que escribe a las derivadas direccionales en términos de las parciales.
  6. Explica a detalle por qué la expresión a la que llegamos para f(a¯;y¯) en efecto se puede pensar como el producto matricial mencionado.
  7. Encuentra un ejemplo de campo vectorial f:R2R2 en donde las derivadas parciales existen en algún punto a¯, pero no todas las derivadas direccionales existen.

Entradas relacionadas

Cálculo Diferencial e Integral III: Derivadas parciales de segundo orden

Por Alejandro Antonio Estrada Franco

Introducción

En las entradas anteriores definimos qué quiere decir que un campo escalar sea diferenciable. Así mismo, definimos las derivadas parciales y el gradiente. Ya usamos estas herramientas para hablar de dirección de cambio máximo y de puntos críticos. Además demostramos una versión del teorema del valor medio para este caso, lo que nos permitió poner un poco de orden a nuestra teoría: una función es diferenciable en un punto cuando existen sus parciales en ese punto y son continuas. Es momento de hablar de derivadas parciales de segundo orden. Cualquiera de las derivadas parciales es por sí misma un campo escalar, así que podemos preguntarnos si tiene o no sus propias derivadas parciales. Exploraremos esta idea.

Derivadas parciales de segundo orden

Las derivadas parciales de un campo escalar f nos originan nuevos campos escalares. Supongamos que f:SRnR es un campo escalar para el cual existe la k-ésima derivada parcial en un conjunto abierto SS. Entonces, obtenemos un nuevo campo escalar fxk:SR.

Este campo escalar puede o no tener j-ésima derivada parcial. Suponiendo que la tiene en algún US podríamos escribirla como

(fxk)xj.

Sin embargo, esta notación es engorrosa, y por ello optamos o bien por escribir la expresión como sigue

xj(fxk)

o todavía más compacto, como

2fxjxk.

A esto le llamamos una derivada parcial de segundo orden. Si j=k, introducimos la notación

2fxk2.

Las derivadas parciales de segundo orden vuelven a ser, una vez más, cada una de ellas un campo escalar. Esto permite seguir iterando la idea: podríamos hablar de derivadas parciales de segundo, tercero, cuarto, … , k-ésimo, … orden. Daremos una definición un poco más formal en una siguente entrada, pero por ahora trabajemos en entender a las derivadas parciales de segundo orden.

Un ejemplo de derivadas parciales de segundo orden

Ejemplo. Consideremos el campo escalar f(x,y,z)=x2yz. Para este campo escalar tenemos que sus derivadas parciales con respecto a x, y y z son:

fx(x,y,z)=2xyz,fy(x,y,z)=x2zfz(x,y,z)=x2y.

Cada una de estas expresiones es a su vez un campo escalar. Cada una de ellas es derivable con respecto a x en todo R3. Al derivarlas con respecto a x obtenemos:

2fx2(x,y,z)=2yz,2fxy(x,y,z)=2xz,2fxz(x,y,z)=2xy.

Por otro lado, las derivadas parciales de primer orden también podríamos haberlas derivado con respecto a y. En este caso, hubieramos obtenido.

2fyx(x,y,z)=2xz,2fy2(x,y,z)=0,2fyz(x,y,z)=x2.

También podríamos derivar a las derivadas parciales de primer orden con respecto a z para obtener las tres derivadas de orden dos faltantes. En total tenemos tres derivadas parciales de primer orden y nueve derivadas parciales de segundo orden.

Igualdad de las derivadas parciales de segundo orden mixtas

En numerosos campos escalares de interés tenemos una propiedad muy peculiar: que los operadores «obtener la derivada parcial con respecto a x» y «obtener la derivada parcial con respecto a y» conmutan. Es decir, varias veces podemos intercambiar el orden de derivación de las parciales y obtener el mismo resultado. En el ejemplo anterior quizás hayas notado que

2fyx=2xz=2fxy.

Esto no siempre pasa, pero hay criterios de suficiencia sencillos de verificar. Por ejemplo, basta que las parciales mixtas existan y sean continuas para que sean iguales. El siguiente teorema formaliza el resultado.

Teorema. Sea f:SR2R un campo escalar tal que las derivadas parciales fx, fy, 2fyx, 2fxy existen en un conjunto abierto U. Si (a,b)U es tal que 2fyx, 2fxy son continuas en (a,b), entonces dichas derivadas mixtas de segundo orden son iguales en (a,b).

Demostración. Sean h,k0 suficientemente chicos para que los puntos en el plano (a,b), (a,b+k), (a+h,b), y (a+h,b+k) estén en U.

Definamos la función Γ(x)=f(x,b+k)f(x,b) para x[a,a+h] y definamos

(3)Δ(h,k)=Γ(a+h)Γ(a).

Notemos que Γ es una función de R en R cuya derivada es Γ(x)=fx(x,b+k)fx(x,b). Así, se le puede aplicar el teorema del valor medio con extremos en a y a+h para concluir que existe ξ1[a,a+h] que nos permite escribir Δ(h,k) de la siguiente manera:

Δ(h,k)=Γ(a+h)Γ(a)=hΓ(ξ1)=h[fx(ξ1,b+k)fx(ξ1,b)]

Ahora podemos aplicar el teorema del valor medio en la función yfx(ξ1,y) con extremos b y b+k. Esto nos permite continuar la cadena de igualdades anterior mediante un η1[b,b+k] que cumple

(4)Δ(h,k)=hk2fyx(ξ1,η1).

Como (ξ1,η1)[a,a+h]×[b,b+k], se tiene que (ξ1,η1)(a,b) conforme (h,k)0¯.

Ahora consideremos análogamente a la función Λ(y)=f(a+h,y)f(a,y). Mediante un procedimiento similar al que acabamos de hacer, pero aplicado a Λ en vez de a Γ, se tiene otra forma de expresar a Δ(h,k):

(5)Δ(h,k)=hk2fxy(ξ2,η2), donde (ξ2,η2)[a,a+h]×[b,b+k]. Nuevamente, (ξ2,η2)(a,b) conforme (h,k)(0,0).

Igualando las expresiones en (4) y (5), tenemos lo siguiente:

fyx(ξ1,η1)=fxy(ξ2,η2).

El resultado se sigue de hacer tender (h,k)(0,0), ya que dado que las derivadas parciales les estamos pidiendo que sean continuas, tenemos que:

2fyx(a,b)=lim(h,k)(0,0)2fyx(ξ1,η1)=lim(h,k)(0,0)2fxy(ξ2,η2)=2fxy(a,b).

Así concluimos nuestro resultado.

◻

Más adelante…

En esta entrada hablamos de las derivadas parciales de segundo orden y vimos que bajo condiciones razonables podemos elegir las variables de derivación en el orden que queramos. Estas ideas son más generales, y a continuación nos llevarán a definir las derivadas parciales de cualquier orden k. Después, usaremos estas derivadas parciales para generalizar otro de los teoremas de cálculo unidimensional: el teorema de Taylor.

Tarea moral

  1. Para las siguientes funciones calcula 2fx2:
    • f(x,y)=x2+y2cos(xy)
    • f(x,y)=excos(y)
    • f(x,y,z)=log(x2+2y23z2)
  2. En el teorema que afirma que las derivadas parciales mixtas son iguales usamos cuatro veces el teorema del valor medio (¿cuáles 4 son?). Asegúrate de que en verdad lo podamos usar.
  3. Calcula 2fy2, y 2fxy para las funciones del punto 1. Explica por qué no es necesario calcular de manera separada 2fyx
  4. Investiga de un ejemplo en el que las derivadas parciales 2fxy y 2fyx no sean iguales. Realiza las cuentas para verificar que en efecto tienen valores distintos en algún punto.
  5. El teorema que enunciamos está muy limitado. Sólo nos habla de campos escalares de R2 en R. Sin embargo, debería también funcionar si f:RnR. Enuncia y demuestra un resultado similar que te permita garantizar que 2fxixj=2fxjxi.

Entradas relacionadas

Cálculo Diferencial e Integral I: La derivada

Por Juan Manuel Naranjo Jurado

Introducción

Anteriormente se revisó el concepto de continuidad, característica de la cual emanaban diversas propiedades útiles tal como el teorema del valor intermedio. En esta ocasión, daremos inicio con la séptima unidad que estará enfocada al aspecto teórico de uno de los conceptos más conocidos dentro de las matemáticas: la derivada.

El objetivo de esta entrada es entender este nuevo concepto para que posteriormente podamos analizar las propiedades y aplicaciones que posee.

Interpretación geométrica

Comenzaremos estudiando la interpretación geométrica para construir la definición formal. Pensemos en la siguiente función y notemos los dos puntos marcados.

Considerando que el punto gris está dado por P=(x,f(x)) y el punto negro por P0=(x0,f(x0)), podríamos obtener fácilmente la pendiente de la recta que pasa por ambos puntos.

(1)m=f(x)f(x0)xx0.

¿Qué sucede si dejamos a P0 como un punto fijo y «movemos» el punto P de tal forma que estos puntos comienzan a estar cada vez más cerca? (En la gráfica, el «movimiento» de P se plasma mediante los puntos P1, P2, y P3)

Si tales puntos están cada vez están más cerca, el concepto de límite entra en juego, pues estaríamos buscando PP0. Así, podríamos calcular la pendiente de la recta tangente en el punto P0. De esta forma, el límite deseado es el siguiente:

limxx0f(x)f(x0)xx0.

La derivada

Definición. La función f es derivable en x0 si el siguiente límite existe

limxx0f(x)f(x0)xx0.

En este caso, denotaremos al límite anterior como f(x0) y le llamaremos derivada de f en x0.

También es común encontrar la siguiente definición equivalente de la derivada.

Definición. La función f es derivable en x0 si el siguiente límite existe

limh0f(x0+h)f(x0)h.

Ahora que conocemos la definición de derivada, es momento de ponerla en práctica y revisar algunas funciones que sean derivables.

Ejemplo 1. Prueba que la función f(x)=c, con cR, es derivable para cualquier x0R.

Demostración

Sea x0R. Veremos que limxx0f(x)f(x0)xx0 sí existe.

Notemos que si xx0, entonces

f(x)f(x0)xx0=ccxx0=0xx0=0.

Por lo anterior, se sigue que

limxx0f(x)f(x0)xx0=0.

Por lo tanto, f es derivable en R y f(x)=0.

◻

Ejemplo 2. Prueba que la función f(x)=ax+b es derivable para cualquier x0R.

Demostración

Sea x0R. Bastará probar que el límite limxx0f(x)f(x0)xx0 sí existe.

Para ello, primero veamos que si xx0, entonces

f(x)f(x0)xx0=ax+b(ax0+b)xx0=axax0xx0=a(xx0)xx0=a.

Por lo anterior, se sigue que

limxx0f(x)f(x0)xx0=a.

Por lo tanto, f es derivable en R y f(x)=a.

◻

Continuemos con un segundo ejemplo sencillo para acostumbrarnos a este nuevo concepto.

Ejemplo 3. Prueba que la función f(x)=x2 es derivable para cualquier xR.

Demostración.

Sea x0R.
Procederemos a calcular el límite directamente.

limxx0f(x)f(x0)xx0=limxx0x2x02xx0=limxx0(xx0)(x+x0)xx0=limxx0x+x0=2x0.

Por lo tanto, f es derivable para cualquier xR y f(x)=2x.

◻

Ejemplo 4. Prueba que la función f(x)=x es derivable para cualquier x0>0.

Demostración

Sea x0>0. Para esta demostración, usaremos la segunda definición de límite.

Notemos que si h0, entonces

f(x0+h)f(x0)h=x0+hx0h=x0+hx0hx0+h+x0x0+h+x0=x0+hx0h(x0+h+x0)=hh(x0+h+x0)=1x0+h+x0.

Por lo anterior, se sigue que

limh0f(x0+h)f(x0)xx0=12x0.

Por lo tanto, f es derivable para cualquier x>0 y f(x)=12x.

◻

Es momento de revisar una función que no sea derivable. Para este propósito, emplearemos la función valor absoluto, la cual hemos revisado anteriormente y será conveniente que tengas presente su gráfica, pues este tipo de funciones que generan un «pico» en su gráfica, no son derivables en tal punto.

Ejemplo 5. Sea f:RR, f(x)=|x|. Prueba que f no es derivable en x0=0.

Demostración.

Notemos que limxx0|x|0x0=limxx0|x|x.

Consideremos las sucesiones {an}, {bn} donde an=1n y bn=1n. Tenemos que an, bnR para todo nN. Además, an, bn0 para todo nN y limnan=0=limnbn.

Pero se tiene que

limn|an|an=limn|1n|1n=limn1n1n=1.

Además
limn|bn|bn=limn|1n|1n=limn1n1n=1.

De lo que se concluye que el límite limxx0|x|0x0 no existe.

Por tanto, f no es derivable en x0=0.

◻

Intuitivamente, podemos notar que si tratáramos de encontrar una «recta tangente» en x0=0 moviéndonos por la derecha, será distinta a la «recta tangente» a generada por la izquierda. Esto hace que el límite no exista, sin embargo, podemos ser menos restrictivos en la definición.

Derivadas laterales

De forma complementaria, podemos definir la derivada en términos de la forma en que xx0, es decir, a través de los límites laterales. Así, tenemos las siguientes definiciones.

Definición.

  1. La función f es derivable por la derecha en x0 si el siguiente límite existe

    limxx0+f(x)f(x0)xx0.

    En este caso, denotaremos al límite anterior como f(x0+) y le llamaremos derivada por la derecha de f en x0.
  2. La función f es derivable por la izquierda en x0 si el siguiente límite existe

    limxx0f(x)f(x0)xx0.

    En este caso, denotaremos al límite anterior como f(x0) y le llamaremos derivada por la derecha de f en x0.

Más adelante…

En la siguiente entrada revisaremos la relación existente entre la derivabilidad y la continuidad. Además, revisaremos algunas propiedades que nos permitirán obtener la derivada de una función con mayor facilidad.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Da un ejemplo de función que no sea derivable en un punto x0.
  • Prueba que la función f:RR definida por f(x)=ax2+bx+c es derivable en todo R.
  • Prueba que la función f:RR definida por f(x)=x38 es derivable en todo R.
  • Demuestra que f(x)=|x| es derivable para todo x0.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: Continuidad y diferenciabilidad de polinomios reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

Al inicio de esta unidad, hablamos de las propiedades algebraicas de R[x], definimos sus operaciones y argumentamos por qué se puede usar la notación de potencias. Luego hablamos de las propiedades aritméticas de los polinomios cuando hablamos de divisibilidad, máximo común divisor y factorización en irreducibles. Vimos una aplicación de esto a la solución de desigualdades. Lo que queremos hacer ahora es pensar a los polinomios como funciones de R en R y entender las propiedades analíticas que tienen, es decir en términos de cálculo. Nos interesa saber qué les sucede cuando su entrada es grande, la continuidad y la diferenciabilidad de polinomios.

Estas propiedades tienen consecuencias algebraicas importantes. La continuidad de polinomios nos permite encontrar raíces reales en ciertos intervalos. La diferenciabilidad de polinomios nos ayuda a encontrar la multiplicidad de las raíces. Supondremos que manejas conocimientos básicos de cálculo y de manipulación de límites, pero de cualquier forma recordaremos algunas definiciones y daremos esbozos de la demostración de algunos resultados.

Límites a reales y límites a infinito

Recordemos dos definiciones de cálculo, que se aplican para funciones arbitrarias definidas en todos los reales.

Definición. Sea f:RR una función y a,b reales. Decimos que limxaf(x)=b si para todo ϵ>0 existe un δ>0 tal que cuando 0<|xa|<δ, entonces |f(x)b|<ϵ. En palabras, decimos que el límite de f cuando x tiende a a es b.

Definición. Sea f:RR una función. Decimos que limxf(x)= si para todo M>0 existe un r>0 tal que cuando x>r, entonces f(x)>M. En palabras, decimos que el límite de f cuando x tiende a infinito es infinito.

De manera análoga se pueden definir límites cuando x tiende a menos infinito, y definir qué quiere decir que el límite sea menos infinito. La siguiente proposición se prueba en textos de cálculo.

Proposición (propiedades de límites). Sean f:RR y g:RR funciones y a, b, c reales. Si limxaf(x)=b y limxag(x)=c, entonces:

  • «El límite de la suma es la suma de los límites», en símbolos, limxa(f+g)(x)=b+c.
  • «El límite del producto es el producto de los límites», en símbolos, limxa(fg)(x)=bc.

La proposición anterior es sólo para cuando los límites son reales. Hay resultados para cuando algunos de los límites son infinitos, pero en general hay que tener cuidado.

La primer propiedad analítica de los polinomios es saber cómo es su comportamiento cuando x se hace infinito o menos infinito. Si el polinomio es constante, entonces este límite es simplemente su valor en cualquier punto. Para polinomios de grado mayor o igual a 1, su comportamiento queda resumido en la siguiente proposición.

Proposición (límites a infinito). Tomemos al polinomio p(x) en R[x] dado por p(x)=a0+a1x+a2x2++anxn, en donde n1 y an0.

  • Si an>0 y p(x) es de grado par entonces limxp(x)=limxp(x)=,
  • Cuando an>0 y p(x) es de grado impar entonces limxp(x)= y limxp(x)=
  • Si an<0 y p(x) es de grado par entonces limxp(x)=limxp(x)=,
  • Cuando an<0 y p(x) es de grado impar entonces limxp(x)= y limxp(x)=.

Demostración. Vamos a hacer una de las demostraciones. Mostraremos que para cuando an>0 y el grado es par, entonces limxp(x)=. Las demás se siguen haciendo cambios de signo cuidadosos y usando que una potencia impar de un real negativo es un real negativo, y una potencia par es siempre un real positivo. Pensar en estas demostraciones queda como tarea moral.

Tomemos entonces p(x) un polinomio de grado par y con coeficiente principal an>0. Intuitivamente, tenemos que mostrar que si x es muy grande, entonces p(x) es tan grande como queramos. Tomemos un real M>0. Como haremos x grande, podemos suponer que x>1.

Como el término anxn es positivo, basta mostrar como resultado auxiliar que si x es suficentemente grande, entonces anxn>M+|a0+a1x++an1xn1|, ya que si esto sucede, tendríamos que:
anxn>M+|a0+a1x++an1xn1|=M+|a0a1xan1xn1|>Ma0a1xan1xn1,

y de aquí, pasando todo excepto a M a la izquierda, tendríamos p(x)>M.

Para probar el resultado auxiliar, tomemos A como el máximo de los valores absolutos |a0|,,|an1|. Por la desigualdad del triángulo y usando x>1 tenemos que

M+|a0+a1x++an1xn1|M+|a0|+|a1x|++|an1xn1|M+A(1+x++xn1)<M+nA<(M+nA)xn1

De esta forma, para mostrar nuestra desigualdad auxiliar basta mostrar que para x suficientemente grande, tenemos que (M+nA)xn1<anxn. Pero como x>0, esta desigualdad es equivalente a x>M+nAan.

Recapitulando, para cualquier M>0, si x>M+nAan, entonces p(x)>M. Esto termina la demostración.

◻

Podemos usar la proposición anterior para comparar polinomios cuando su variable tiende a infinito.

Ejemplo. Mostraremos que existe una M suficientemente grande tal que si x>M, entonces 12x7x6x1>x6+1000x5+1000000. Pasando todo del lado izquierdo, nos queda la desigualdad equivalente 12x72x61000x5x999999>0. Aquí tenemos un polinomio p(x) de grado impar y coeficiente principal positivo. Por la proposición anterior, limxp(x)=, de modo que la M que estamos buscando existe.

Continuidad de polinomios

Antes de llegar a diferenciabilidad de polinomios, haremos un paso intermedio. Recordemos otra definición de cálculo.

Definición. Sea f:RR una función y a un real. Decimos que f es continua en a si limxaf(x)=f(a). Decimos que f es continua si es continua en todo real.

Por la proposición de propiedades de límites, la suma o producto de funciones continuas es continua. Las funciones constantes son continuas. La función identidad I:RR dada por I(x)=x es continua. Estos tres hechos nos ayudan a demostrar que todos los polinomios son funciones continuas sin tener que recurrir a la definición de límite.

Teorema. Cualquier polinomio p(x) en R[x] pensado como una función p:RR es una función continua.

Demostración. Supongamos que p(x) está dado por p(x)=a0+a1x++anxn.

Para toda i de 0 a n tenemos que la función xai es constante y por lo tanto es continua. Si i>0, la función xxi es producto de i veces la identidad consigo misma. Como la identidad es continua y producto de continuas es continua, entonces xxi es continua.

De nuevo, usando que producto de funciones continuas es continua, tenemos que xaixi es una función continua. De esta forma, p(x) es la suma de n+1 funciones continuas, y por lo tanto es una función continua.

◻

El resultado anterior nos ayuda a usar teoremas versátiles de cálculo en nuestro estudio de polinomios. Recordemos el teorema del valor intermedio.

Teorema (del valor intermedio). Sea f:RR una función continua. Sean a<b dos reales. Entonces entre a y b, la función f toma todos los valores entre f(a) y f(b).

Veamos cómo el teorema del valor intermedio nos permite encontrar raíces de polinomios.

Problema 1. Muestra que el polinomio p(x)=x75x5+x2+3 tiene por lo menos una raíz en el intervalo [0,2].

Solución. Al evaluar al polinomio en cero, obtenemos p(0)=3. Al evaluarlo en 2, obtenemos
p(2)=27525+x2+3=128160+4+3=25.

Como los polinomios son funciones continuas, podemos aplicar el teorema del valor intermedio. Concluimos que p(x) toma todos los valores de 25 a 2 en el intervalo [0,2]. En particular, existe un real r en [0,2] tal que p(r)=0.

El teorema del valor intermedio nos ayuda a demostrar que un polinomio tiene una raíz en cierto intervalo. Sin embargo, no es de tanta utilidad para decir exactamente cuál es esa raíz. Es un resultado existencial en vez de ser constructivo. Veamos un ejemplo más, que muestra una proposición que quedó pendiente en una entrada anterior.

Problema 2. Sea p(x) un polinomio cuadrático, mónico e irreducible en R[x]. Muestra que p(r)>0 para todo real r.

Solución. Procedamos por contradicción. Supongamos que p(r)0 para algún real r.

Como p(x) es mónico, su coeficiente principal es 1, que es positivo. Como p(x) es cuadrático, es de grado par. Por la proposición de límites a infinito, existe un real t>r tal que p(t)>0. Por el teorema del valor intermedio, existiría un real s en el intervalo [r,t] tal que p(s)=0. Pero esto es imposible, pues entonces por el teorema del factor xs divide a p(x) y esto contradice que p(x) es irreducible.

Como muestra el problema anterior, se pueden combinar los límites de polinomios a infinito y menos infinito, y sus propiedades de continuidad. Otra aplicación es mostrar que todo polinomio de grado impar tiene por lo menos una raíz real. Esto se verá en otra entrada.

Por supuesto, otros resultados de continuidad también se pueden usar en todos los polinomios, como el teorema del valor extremo. Aplicándolo directamente, concluimos lo siguiente.

Proposición. Sean a<b reales y p(x) un polinomio en R. Entonces p(x) está acotado en el intervalo [a,b] y existen reales r y s en dicho intervalo tales que p(r) y p(s) son el mínimo y máximo de p(x) en [a,b], respectivamente.

Diferenciabilidad de polinomios

Es momento de hablar de diferenciabilidad de polinomios. Recordemos una última definición de cálculo.

Definición. Sea f:RR una función. Decimos que f es diferenciable en a si el límite limh0f(a+h)f(a)h existe. En este caso, a ese límite lo denotamos por f(a). Una función es diferenciable si es diferenciable en todo real. A la función f:RR le llamamos la derivada de f.

Al igual que en el caso de continuidad, la suma y producto de funciones diferenciales es diferenciable. Si f:RR y g:RR son diferenciables, entonces la derivada de f+g está dada por (f+g)(x)=f(x)+g(x) y la derivada de fg está dada por la regla de la cadena (fg)(x)=f(x)g(x)+f(x)g(x).

Las funciones constantes son diferenciables, y su derivada es la función constante 0. La función identidad es diferenciable, y su derivada es la función constante 1. Esto es sencillo de mostrar y queda como tarea moral.

Proposición. Sea n1 un entero. El polinomio p(x)=xn es diferenciable, y su derivada es la función p(x)=nxn1.

Demostración. Haremos la prueba por inducción. Si n=1, el polinomio es p(x)=x, y su derivada es p(x)=1=1x0, como queremos. Supongamos que el resultado es cierto para el entero n1 y tomemos p(x)=xn+1=xnx. Por hipótesis inductiva, xxn es diferenciable. Como p(x) es producto de dos funciones diferenciables, entonces es diferenciable.

Usando la regla de la cadena, la hipótesis inductiva de la fórmula y la derivada de xx, tenemos que p(x)=(nxn1)(x)+(xn)(1)=(n+1)xn. Esto termina la demostración.

◻

Con todos estos ingredientes podemos mostrar la diferenciabilidad de todos los polinomios. Los detalles quedan como tarea moral.

Teorema (diferenciabilidad de polinomios). Sea p(x) un polinomio en R[x] dado por p(x)=a0+a1x++anxn, Entonces p(x) pensado como función es diferenciable y su derivada es un polinomio. Si p(x) es constante, su derivada es el polinomio 0. En otro caso, su derivada es el polinomio a1+2a2x+3a3x2++nanxn1.

Ejemplo. El polinomio x7+3x21 es diferenciable. Su derivada es el polinomio 7x6+6x.

Ya que sabemos que los polinomios son diferenciables, podemos usar todas las herramientas de cálculo diferencial, como:

No profundizaremos en esto, pues es el contenido de un buen curso de cálculo, o bien de material de algún texto en el área, como el libro de Cálculo de Spivak.

A nosotros nos interesa una consecuencia algebraica de que los polinomios tengan derivada. Como la derivada de un polinomio es otro polinomio, entonces la derivada es diferenciable. Por ello, un polinomio p(x) se puede derivar iteradamente tantas veces como se quiera. Al polinomio obtenido de derivar n veces le llamamos la n-ésima derivada y lo denotamos por p(n)(x). En la siguiente entrada veremos cómo la repetida diferenciabilidad de polinomios nos ayuda a detectar la multiplicidad de sus raíces.

Más adelante…

En la siguiente sección nos encargaremos de realizar varios problemas para repasar las definiciones y propiedades que acabamos de enunciar, y posteriormente ocuparemos todo lo aprendido para explotar el conocimiento que tenemos de los polinomios.

En particular, nos será útil el concepto de diferenciabilidad pues con este podemos dar una definición precisa de lo que significa que la raíz de un polinomio sea múltiple.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Estudia el resto de los casos de la proposición de límites de polinomios cuando la entrada va a menos infinito y a infinito.
  2. Muestra usando la definición de límite que las funciones constantes y la función identidad son continuas.
  3. Demuestra por definición que las funciones constantes son diferenciables y que su derivada es la función constante 0. Demuestra por definición que la función identidad es diferenciable y que su derivada es la función constante 1.
  4. Muestra que existe un real x en el cual los polinomios p(x)=x5+x3+x y q(x)=100x4+10x2 son iguales. Sugerencia. Reescribe esta igualdad en términos de encontrar una raíz de un sólo polinomio.
  5. Completa los detalles del teorema de diferenciabilidad de polinomios.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»