Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Cálculo Diferencial e Integral I: Localización de máximos y mínimos. Regiones de convexidad y puntos de inflexión

Por Karen González Cárdenas

Introducción

En la sección anterior vimos cómo encontrar los máximos y mínimos de una función haciendo uso del Criterio de la primera derivada. En esta entrada veremos un criterio más que nos ayudará a localizar los puntos críticos de una función haciendo uso de la segunda derivada. Además, veremos los conceptos de convexidad, concavidad y puntos de inflexión.

Criterio de la segunda derivada

Teorema (Criterio de la segunda derivada): Sea $f:(a,b) \rightarrow \r$ una función de clase $C^{(2)}$ en un punto $x_0 \in (a,b)$ y $f'(x_0)=0$.

  1. Si $f \dquote (x_0)>0 \Rightarrow x_0$ es un mínimo local de $f$.
  2. Si $f \dquote (x_0)<0 \Rightarrow x_0$ es un máximo local de $f$.

Observación: una función $f$ es de clase $C^{(k)}$ si su k-ésima derivada existe y sus $k$ derivadas son continuas.

Demostración 2:
Para este punto queremos demostrar que existe un intervalo $(x_0-r,x_0+r)$ donde:

  • $f'(x)>0$ para toda $x \in (x_0-r, x_0)$.
  • $f'(x)<0$ para toda $x \in (x_0, x_0+r)$.

Y así por el criterio de la primera derivada tendríamos que $x_0$ es máximo local.

Por hipótesis tenemos que $f \dquote (x_0)<0$, lo que por definición de derivada sería:
$$\lim_{h \to 0}\frac{f'(x_0+h)-f'(x_0)}{h}<0$$
Así sabemos que existe una $\delta$ tal que para toda $h \in (-\delta,\delta)$ ocurre que:
$$ \frac{f'(x_0+h)-f'(x_0)}{h}<0 $$

Veamos qué ocurre en los siguientes dos casos:
Caso 1: $h<0$ entonces tendríamos que $x_0+h<x_0$ y de la desigualdad anterior se seguiría que
\begin{align*}
\frac{f'(x_0+h)-f'(x_0)}{h}<0 &\Rightarrow f'(x_0+h)-f'(x_0)>0\\
&\Rightarrow f'(x_0+h)>0\tag{donde $f'(x_0)=0$}\\
\end{align*}

Caso 2: $h>0$ se tiene que $x_0+h >x_0$ análogamente vemos que
\begin{align*}
\frac{f'(x_0+h)-f'(x_0)}{h}<0 &\Rightarrow f'(x_0+h)-f'(x_0)<0\\
&\Rightarrow f'(x_0+h)<0\tag{donde $f'(x_0)=0$}\\
\end{align*}

Concluyendo la prueba del inciso 2.

$\square$

Detengámonos un momento a realizar la siguiente observación del teorema anterior:
Observación: si $f\dquote (x)=0$ no podemos concluir nada, ya que el criterio no logra determinar si se trata de un máximo, un mínimo o ninguno de los anteriores. En este caso es necesario hacer uso de otros resultados como el Criterio de la primera derivada.

Esto sucede por ejemplo con la función $f(x)=x^{3}$ cuando $x_0=0$, ya que al evaluar su segunda derivada en $x_0$ obtenemos:
$$f \dquote (x_0)=0.$$
Al ver la gráfica de la función cúbica notamos que en el punto $x_0=0$ no tenemos un máximo local, así como no tenemos un mínimo local.

Ahora veamos que al considerar $f(x)=x^{4}$ con $x_0=0$ y su segunda derivada evaluada en $ x_0$ también ocurre que $f\dquote (x_0)=0$. Si recurrimos a visualizar su gráfica tenemos en este caso que $x_0$ es un mínimo local de $f$. Un camino alterno para determinarlo podría ser utilizar el Criterio de la primera derivada visto en la entrada anterior.

De este modo después de aplicar el Criterio de la segunda derivada al obtener $f \dquote (x_0)=0$ es necesario realizar un análisis más profundo valiéndonos de otros recursos y resultados.

Ejemplo

Utilizando el Criterio de la segunda derivada encuentra los máximos y mínimos de la siguiente función:
$$f(x)=x^{3}-3x^{2}-9x+1.$$

Solución:
Paso 1: Obtenemos la primera derivada de la función
\begin{align*}
f'(x)&=3x^{2}-6x-9\\
&= x^{2}-2x-3\\
&=(x-3)(x+1)\\
\therefore f'(x)&=(x-3)(x+1).
\end{align*}
Paso 2: Igualamos a cero la primera derivada para obtener los puntos críticos
\begin{align*}
f'(x)=0 &\Leftrightarrow (x-3)(x+1)=0\\
&\Leftrightarrow x- 3=0 & &\text{o} \quad (x+1)=0\\
&\Leftrightarrow x=3 & &\text{o} \quad x=-1
\end{align*}

Paso 3: Ahora obtenemos la segunda derivada de $f$
$$f \dquote (x)=2x-2.$$

Paso 4: Sustituimos los valores de los puntos críticos obtenidos en el paso 2 y aplicamos el Criterio de la segunda derivada

  • Sustituimos $x=3$ en $f \dquote (x)$:
    $$f\dquote (3)=2(3)-2=4$$
    El resultado obtenido nos dice que $f\dquote (3)>0$ por lo que $f$ tiene un mínimo en $(3,-26)$
  • Ahora para $x=-1$:
    $$f\dquote (-1)=2(-1)-2=-4$$
    Vemos que $f\dquote (-1)<0$ obteniendo un máximo de $f$ en $(-1,6)$

Convexidad y concavidad

Definición (función convexa): Sea $f:[a,b]\rightarrow \r$ una función. Decimos que $f$ es convexa en [a,b] si para cualesquiera $x,y \in [a,b]$ con $x<y$ se cumple que para todo $z\in[x,y]$:
$$f(z) \leq \frac{f(x)-f(y)}{x-y}(z-y)+f(y).$$

Lo que esta definición nos dice es que todos los puntos de la recta secante que une a $(y,f(y))$ con $(x,f(x))$ cuando $x<y$ se encuentran por arriba de la gráfica como se ve en la siguiente imagen.

Observación: Recordemos que, en el contexto de funciones y gráficas, una recta secante es una línea recta que intercepta a una curva en dos puntos distintos.

Una definición equivalente sería que para cualquier $\alpha \in (0,1)$ se cumple:
$$f(\alpha x+(1-\alpha)y)\leq \alpha f(x)+(1-\alpha)f(y).$$

Para ver que la definición implica esto, notemos que si $z=\alpha x+(1-\alpha)y$ con $\alpha\in (0,1)$, entonces $z\leq y$ y $z\geq x$. Así, por definición, tendríamos que

\begin{align*}
f(\alpha x + (1-\alpha) y)&=f(z)\\
&\leq \frac{f(x)-f(y)}{x-y}(z-y)+f(y)\\
&=\frac{f(x)-f(y)}{x-y}(\alpha x – \alpha y) + f(y)\\
&=\alpha(f(x)-f(y))+f(y)\\
&=\alpha f(x) + (1-\alpha) f(y),
\end{align*}

como afirmamos. Por otro lado, si se cumple lo que afirmamos que es una equivalencia, entonces cualquier $z\in (x,y)$ puede ser escrito como $z=\alpha x+(1-\alpha)y$ con $\alpha \in (0,1)$ (esto se puede probar, por ejemplo, por teorema del valor intermedio, pues $\alpha \mapsto \alpha x+(1-\alpha)y$ es continua, en $\alpha=0$ vale $y$ y en $\alpha=1$ vale $x$). Así, suponiendo la segunda versión tendríamos

\begin{align*}
f(z)&=f(\alpha x + (1-\alpha) y)\\
&\leq \alpha f(x)+(1-\alpha)f(y)\\
&=\frac{f(x)-f(y)}{x-y}(z-y)+f(y),
\end{align*}

en donde en la última igualdad se hacen cuentas similares a las hechas arriba.

Otras definiciones son las siguientes:

  • Definición (función estrictamente convexa): Sea $f:[a,b]\rightarrow \r$ una función. Se dice que $f$ es estrictamente convexa si cumple la desigualdad:
    $$f(\alpha x+(1-\alpha)y)< \alpha f(x)+(1-\alpha)f(y),$$ para $\alpha\in (0,1)$.
  • Definición (función estrictamente cóncava): Decimos que $f$ es estrictamente cóncava si $-f$ es estrictamente convexa.
  • Definición (función cóncava): Decimos que $f$ es cóncava si $-f$ es convexa.

La derivada y la convexidad

Teorema: Consideremos $f:(a,b)\rightarrow \r$ una función. Si $f'(x)$ es no decreciente en $(a,b)$ entonces $f$ es convexa en $(a,b)$.

Demostración:

Consideremos $x,y \in (a,b)$. Queremos demostrar que para cualquier $\alpha \in (0,1)$ se cumple la desigualdad:
$$f(\alpha x + (1- \alpha)y)\leq \alpha f(x)+ (1- \alpha)f(y).$$

Así tomemos $\alpha_0 \in [0,1]$ y probemos que:
$$f(\alpha_0 x + (1- \alpha_0)y)\leq \alpha_0 f(x)+ (1- \alpha_0)f(y).$$

Por el teorema del valor medio para la derivada tenemos que existe $p\in (x,z)$ donde podemos considerar $ z=\alpha_0x+(1-\alpha_0)y$ tal que:
$$f'(p)=\frac{f(z)-f(x)}{z-x}.$$
Análogamente existe $q \in (z,y)$ que:
$$f'(q)=\frac{f(y)-f(z)}{y-z}.$$

Por hipótesis vemos que:
$$f'(p)\leq f'(q).$$
Es decir:
$$\frac{f(z)-f(x)}{z-x}\leq \frac{f(y)-f(z)}{y-z}.$$

Y como $ z=\alpha_0x+(1-\alpha_0)y$:
\begin{align*}
&\Rightarrow \frac{f(z)-f(y)}{(\alpha_0-1)x+(1-\alpha_0)y}\leq \frac{f(y)-f(z)}{y-\alpha_0 x-(1- \alpha_0)y}\\
&\Rightarrow \frac{f(z)-f(y)}{(y-x)(1-\alpha_0)}\leq \frac{f(y)-f(z)}{\alpha_0 (y-x)}\\
&\Rightarrow \alpha_0 (f(z)-f(x)) \leq (1- \alpha_0)(f(y)-f(z))
\end{align*}
Por lo tanto si desarrollamos lo anterior:
\begin{align*}
\alpha_0 f(z)+ (1-\alpha_0)f(z)&\leq \alpha_0f(x)+(1-\alpha_0)f(y)\\
\therefore f(z)&\leq \alpha_0 f(x)+(1-\alpha_0)f(y)\\
\end{align*}
Recordando que $z=\alpha_0x+(1-\alpha_0)y$ concluimos que:
$$f(\alpha_0x+(1-\alpha_0)) \leq \alpha_0 f(x)+(1-\alpha_0)f(y).$$

$\square$

Una consecuencia del teorema anterior es el siguiente corolario:
Corolario: Sea $f: (a,b) \rightarrow \r$ una función.

  • Si $f \dquote (x) \geq 0$ entonces $f$ es convexa.
  • Si $f \dquote (x)\leq 0$ entonces $f$ es cóncava.

Así vemos que la segunda derivada nos puede ayudar a determinar los intervalos donde una función es convexa o cóncava.

Puntos de inflexión de una función

Definición (punto de inflexión): Decimos que $x_0$ es un punto de inflexión si en él la función cambia de convexa a cóncava ó de cóncava a convexa.
Para poder identificarlos usando la derivada tenemos que si $f\dquote(x_0)=0$ y $f \dquote (x_0)\neq 0$ entonces $x_0$ es un punto de inflexión.

En el siguiente ejemplo utilizaremos este criterio para identificar los puntos de inflexión de la función vista en el ejercicio anterior.

Ejemplo

Recordemos que estamos trabajando con la función:
$$f(x)=x^{3}-3x^{2}-9x+1 .$$
Cuyas segunda y tercera derivada son:
$$f \dquote (x)=2x-2$$
$$f ^{\prime \prime \prime}(x)=2$$
Para identificar a sus puntos de inflexión igualaremos a cero su segunda derivada y encontraremos las raíces de la misma:
\begin{align*}
f\dquote(x)=0 &\Rightarrow 2x-2=0\\
&\Rightarrow x-1=0\\
&\Rightarrow x=1
\end{align*}
Sustituimos $x=1$ en la función original:
$$f(1)=(1)^{3}-3(1)^{2}-9(1)+1=-10$$
Además, como $f^{\prime \prime \prime}((1)=2$, podemos concluir que $f$ tiene un punto de inflexión en $(1,-10)$.

Ahora para definir donde la función es convexa debemos resolver la siguiente desigualdad:
\begin{align*}
f\dquote(x)>0 &\Rightarrow x-1>0\\
&\Rightarrow x>1
\end{align*}
Así $f$ es convexa en $(1, \infty)$

Y para ver donde es cóncava utilizamos:
\begin{align*}
f\dquote (x)<0 &\Rightarrow x-1<0\\
&\Rightarrow x<1
\end{align*}
Por lo que $f$ es cóncava en $(-\infty,1)$

Más adelante

Ahora que hemos visto dos criterios importantes haciendo uso de la derivada para localizar máximos y mínimos de una función, en la siguiente entrada donde hablaremos de problemas de optimización, será esencial poder identificarlos.

Tarea moral

Para cada una de las siguientes funciones obtén:

  • Máximos y mínimos.
  • Intervalos donde crece y decrece la función.
  • Intervalos donde es convexa o cóncava.
  • Puntos de inflexión.
  • Gráfica.
  1. $f(x)=x^{2}+\frac{1}{x^{2}}$
  2. $f(x)= x^{3}(x+2)$
  3. $f(x)=\sqrt{x^{2}+36}$
  4. $f(x)=-2x^{3}+9x^{2}+60x$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Geometría Moderna I: Cuadrángulo ortocéntrico

Por Rubén Alexander Ocampo Arellano

Introducción

En esta entrada veremos que los cuatro triángulos que se forman con los vértices de un cuadrángulo ortocéntrico, tienen la misma circunferencia de los nueve puntos y derivaremos algunas otras propiedades.

Cuadrángulo ortocéntrico

Definición. Un cuadrángulo ortocéntrico es el conjunto de puntos formado por los vértices de un triángulo y su ortocentro.

Nos referiremos a los cuatro triángulos que se pueden formar con los cuatro puntos de un cuadrángulo ortocéntrico como grupo ortocéntrico de triángulos.

Teorema 1. Cualquier punto de un cuadrángulo ortocéntrico es el ortocentro del triángulo formado por los otros tres puntos y los triángulos de este grupo ortocéntrico tienen el mismo triangulo órtico.

Demostración. Sea $\triangle ABC$ y $H$ su ortocentro.

Figura 1

Notemos que el ortocentro de $\triangle BHC$ es $A$ pues $AB \perp HC$, $AH \perp BC$ y $AC \perp HB$.

De manera análoga podemos ver que $B$ es el ortocentro de $\triangle AHC$ y $C$ es el ortocentro de $\triangle AHB$.

Por otro lado, los pares de rectas perpendiculares $AH$, $BC$; $BH$, $AC$ y $CH$, $AB$, se intersecan en $D$, $E$ y $F$, respectivamente.

Por lo tanto, estos tres puntos son fijos, así el triángulo órtico es el mismo para los cuatro triángulos $\triangle ABC$, $\triangle HAB$, $\triangle HAC$ y $\triangle HBC$.

$\blacksquare$

Corolario 1. Las circunferencias de los nueve puntos de un grupo ortocéntrico de triángulos coinciden y sus circunradios son iguales.

Demostración. Como el circuncírculo del triángulo órtico de un triángulo dado es la circunferencia de los nueve puntos, por el teorema 1, los triángulos de un grupo ortocéntrico tienen la misma circunferencia de los nueve puntos.

En la entrada anterior vimos que el radio de la circunferencia de los nueve puntos es igual a la mitad del circunradio de su triángulo de referencia.

Por lo tanto, $\triangle ABC$, $\triangle HAB$, $\triangle HAC$ y $\triangle HBC$ tienen el mismo circunradio (figura 1).

$\blacksquare$

Circuncentros

Teorema 2. Los circuncentros de un grupo ortocéntrico de triángulos forman un cuadrángulo ortocéntrico.

Demostración. Por el teorema 2 de la entrada anterior, sabemos que el circuncentro de un triángulo es la reflexión de su ortocentro respecto de $N$, el centro de los nueve puntos.

Como los triángulos de un grupo ortocéntrico tienen el mismo centro de los nueve puntos, los circuncentros $O_a$, $O_b$, $O_c$ y $O$ de $\triangle HBC$, $\triangle HAC$, $\triangle HAB$ y $\triangle ABC$ son las reflexiones de $A$, $B$, $C$ y $H$ respectivamente respecto a $N$.

Figura 2

Dado que una reflexión es una homotecia de razón $-1$ entonces las figuras $ABCH$ y $O_aO_bO_cO$ son congruentes y por lo tanto $O_aO_bO_cO$ es un cuadrángulo ortocéntrico.

$\blacksquare$

Corolario 2. Un grupo ortocéntrico de triángulos y el grupo ortocéntrico de triángulos formado por sus circuncentros tienen la misma circunferencia de los nueve puntos.

Demostración. Como las figuras $ABCH$ y $O_aO_bO_cO$ son simétricas respecto a $N$ entonces también sus circunferencias de los nueve puntos son simétricas respecto a $N$.

Como $N$ es el centro de una de estas circunferencias, entonces coinciden.

Observación. Notemos que como $O_aO_bO_cO$ es un grupo ortocéntrico de triángulos, entonces la reflexión de sus ortocentros respecto al centro de los nueve puntos $N$ será el conjunto de sus circuncentros.

Entonces $A$, $B$, $C$ y $H$ son los circuncentros de $\triangle O_bO_cO$, $\triangle O_aO_cO$, $\triangle O_aO_bO$ y $\triangle O_aO_bO_c$ respectivamente.

$\blacksquare$

Problema. Construye un triángulo $\triangle ABC$ dados el centro de los nueve puntos $N$ y los circuncentros $O_b$ y $O_c$ de los triángulos $\triangle CAH$ y $\triangle ABH$ respectivamente donde $H$ es el ortocentro de $\triangle ABC$.

Solución. $O_b$ y $O_c$ son los ortocentros de $\triangle O_aO_cO$ y $\triangle O_aO_bO$ respectivamente y si los reflejamos respecto a $N$ obtendremos a los circuncentros de sus respectivos triángulos, estos son los vértices $B$ y $C$ del triángulo requerido.

Ahora tenemos dos vértices y el centro de los nueve puntos, este problema lo resolvimos en la entrada anterior.

$\blacksquare$

Centroices

Teorema 3. Los cuatro centroides de un grupo ortocéntrico de triángulos forman un cuadrángulo ortocéntrico.

Demostración. Sea $\triangle ABC$ y $H$ su ortocentro.

Sabemos que el centro de los nueve puntos $N$ de $\triangle ABC$ divide internamente al segmento $HG$ en razón $3:1$, donde $G$ es el centroide de $\triangle ABC$.

Figura 3

Como el grupo ortocéntrico de triángulos $\triangle ABC$, $\triangle HBC$, $\triangle HAC$, $\triangle HAB$ tienen el mismo centro de los nueve puntos $N$, entonces sus respectivos centroides $G$, $G_a$, $G_b$, $G_c$ están en homotecia con $H$, $A$, $B$, $C$ respectivamente desde $N$ y la razón de homotecia es $-3$.

Como dos figuras homotéticas son semejantes, entonces $GG_aG_bG_c$ es un cuadrángulo ortocéntrico.

$\blacksquare$

Corolario 3. La circunferencia de los nueve puntos de un grupo ortocéntrico de triángulos y la circunferencia de los nueve puntos del grupo ortocéntrico formado por sus centroides son concéntricas.

Demostración. Como las figuras $HABC$ y $GG_aG_bG_c$ están en homotecia desde el centro de los nueve puntos $N$ de $\triangle ABC$ entonces sus respetivas circunferencias de los nueve puntos también están en homotecia desde $N$.

Como $N$ es el centro de una de ellas, entonces son concéntricas.

$\blacksquare$

Corolario 4. Dado un cuadrángulo ortocéntrico, el cuadrángulo ortocéntrico formado por sus circuncentros y el cuadrángulo ortocéntrico formado por sus centroides tienen el mismo centro de los nueve puntos y además existe una homotecia entre ellos con centro en este punto.

Demostración. Por los corolarios 2 y 3, $OO_aO_bO_c$ y $GG_aG_bG_c$ tienen el mismo centro de los nueve puntos que $HABC$ y son homotéticos con este último precisamente desde $N$ en razón $-1$ y $-3$ respectivamente.

Figura 4

Por lo tanto, existe una homotecia con centro en $N$ y razón $3$ que lleva a $GG_aG_bG_c$ en $OO_aO_bO_c$.

$\blacksquare$

Incentro y excentros

Teorema 4. El incentro y los excentros de un triángulo dado forman un cuadrángulo ortocéntrico y el circuncírculo del triángulo dado es la circunferencia de los nueve puntos de este grupo ortocéntrico de triángulos.

Demostración. Como las bisectrices interna y externa de los ángulos de un triángulo $\triangle ABC$ son perpendiculares entre si entonces el incentro $I$ es el ortocentro del triángulo formado por los excentros $\triangle I_aI_bI_c$ y el triángulo $\triangle ABC$ es el triángulo órtico de $\triangle I_aI_bI_c$.

Figura 5

Entonces, por el teorema 1 y corolario 1, $I_aI_bI_cI$ es un grupo ortocéntrico de puntos y su circunferencia de los nueve puntos es el circuncírculo de $\triangle ABC$.

$\blacksquare$

Proposición. El segmento que une el ortocentro de un triángulo dado con el circuncentro del triángulo formado por los excentros del triángulo dado es bisecado por el incentro del triángulo medial del triángulo dado.

Demostración. Sea $\triangle ABC$ un triángulo, $I$, $I_a$, $I_b$, $I_c$, el incentro y sus respectivos excentros, $O$ y $O_e$ los circuncentros de $\triangle ABC$ y $\triangle I_aI_bI_c$ respectivamente.

Figura 6

Por el teorema anterior, $I$ y $O$ son el ortocentro y el centro de los nueve puntos respectivamente de $\triangle I_aI_bI_c$, por lo tanto, $O$ es el punto medio de $IO_e$.

Sean $H$ y $G$ el ortocentro y el centroide respectivamente de $\triangle ABC$, como $H$, $G$ y $O$ son colineales y $G$ triseca el segmento $OH$, entonces, $G$ es el centroide de $\triangle IO_eH$.

Por lo tanto, $IG$ biseca a $O_eH$ en $I’$ y $\dfrac{IG}{2} = GI’$.

Por otro lado, sabemos que existe una homotecia con centro en $G$ y razón $\dfrac{-1}{2}$, que lleva a $\triangle ABC$, a su triangulo medial $\triangle A’B’C’$, por lo que sus respectivos incentros $I$ y $I_m$ son puntos homólogos de esta homotecia, es decir $I$, $G$ y $I_m$ son colineales y $G$ triseca al segmento $II_m$.

Como $I’$ cumple con estas características entonces $I’ = I_m$.

$\blacksquare$

Más adelante…

En la próxima entrada estudiaremos otra recta notable del triángulo, la recta de Simson, veremos que la intersección de dos rectas de Simson se intersecan en la circunferencia de los nueve puntos y que cierto conjunto de rectas de Simson forman un cuadrángulo ortocéntrico.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Muestra que las rectas de Euler de los cuatro triángulos de un grupo ortocéntrico son concurrentes.
  2. Demuestra que el simétrico del circuncentro de un triángulo con respecto a uno de los lados del triángulo coincide con el simétrico del vértice opuesto al lado considerado respecto al centro de los nueve puntos del triángulo.
  3. Muestra que los vértices de un grupo ortocéntrico de triángulos pueden ser considerados como los centroides de otro grupo ortocéntrico de triángulos.
  4. Sea $\triangle ABC$ un triángulo rectángulo con $\angle A = \dfrac{\pi}{2}$, $D$ el pie de la altura por $A$, las bisectrices de $\angle BAD$ y $\angle DAC$ intersecan a $BC$ en $P$ y $P’$ respectivamente. Las bisectrices de $\angle DBA$ y $\angle ACD$ intersecan a $AD$ en $Q$ y $Q’$ respectivamente.
    $i)$ Muestra que $PP’QQ’$ es un cuadrángulo ortocéntrico,
    $ii)$ si $I$, $J$ y $K$ son los incentros de $\triangle ABC$, $\triangle ABD$ y $\triangle ADC$, muestra que $AIJK$ es un cuadrángulo ortocéntrico.
  5. Prueba que la suma de los cuadrados de dos segmentos no adyacentes que unen vértices de un cuadrángulo ortocéntrico es igual al cuadrado del circundiámetro de los triángulos de este grupo ortocéntrico.
  6.  Construye un triángulo $\triangle ABC$ dados su circuncentro $O$, y los circuncentros de los triángulos $\triangle II_bI_c$ y $\triangle II_aI_c$, donde $I$, $I_a$, $I_b$ y $I_c$ es el incentro y los excentros de $\triangle ABC$.

Entradas relacionadas

Fuentes

  • Altshiller, N., College Geometry. New York: Dover, 2007, pp 109-115.
  • Johnson, R., Advanced Euclidean Geometry. New York: Dover, 2007, pp 165-167.
  • Shively, L., Introducción a la Geómetra Moderna. México: Ed. Continental, 1961, pp 58.

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Geometría Moderna I: Circunferencia de los nueve puntos

Por Rubén Alexander Ocampo Arellano

Introducción

En esta ocasión veremos que nueve puntos notables del triángulo son concíclicos, a saber, los puntos medios de los lados, los pies de las alturas y los puntos medios de los segmentos que unen al ortocentro con los vértices del triángulo. A esta circunferencia se le conoce como circunferencia de los nueve puntos y su centro se encuentra en la recta de Euler del triángulo considerado.

Triángulo de Euler

Definición 1. A los puntos medios de los segmentos que unen los vértices de un triángulo dado con su ortocentro se les conoce como puntos de Euler, y el triángulo que tiene como vértices los puntos de Euler es el triángulo de Euler del triángulo dado.

Observación. Por la definición anterior, un triángulo y su triángulo de Euler son homotéticos (figura 1), con centro de homotecia en el ortocentro y razón de homotecia $\dfrac{1}{2}$.

Proposición 1. El triángulo de Euler y el triángulo medial de todo triángulo son congruentes y sus respectivos lados son paralelos.

Demostración. Sean $\triangle A’B’C’$ el triángulo medial y $\triangle PQR$ el triángulo de Euler de $\triangle ABC$, (figura 1).

Figura 1

$C’$ y $B’$ son puntos medios de $AB$ y $AC$ respectivamente, así que $C’B’$ es un segmento medio de $\triangle ABC$, de igual manera $QR$ es un segmento medio de $\triangle HBC$, donde $H$ es el ortocentro de $\triangle ABC$.

Por lo tanto, $C’B’ \parallel BC \parallel QR$, y $2C’B’ = BC = 2QR$.

De manera análoga podemos ver que $A’C’ = RP$ y $A’B’ = QP$, por criterio de congruencia LLL, $\triangle A’B’C’ \cong \triangle PQR$.

$\blacksquare$

Circunferencia de los nueve puntos

Teorema 1. El triángulo de Euler, el triángulo medial y el triángulo órtico de todo triángulo tienen el mismo circuncírculo.

Demostración. Por la proposición 1 y empleando la misma notación de esta, sabemos que $\square C’QRB’$ es un paralelogramo (figura 2).

$C’Q$ es un segmento medio de $\triangle BAH$, así que $C’Q \parallel AH$ $\Rightarrow C’Q \perp BC$.

Figura 2

Y como $QR \parallel BC$, entonces, $\square C’QRB’$ es un rectángulo, lo que significa que las diagonales $C’R$ y $QB’$ tienen la misma longitud y se cortan en su punto medio, $N$.

De manera análoga podemos probar que $\square PC’A’R$ es un rectángulo y que $PA’$ y $C’R$ tienen la misma longitud y se cortan en su punto medio.

Como el punto medio de $C’R$ es $N$, entonces, los puntos $A’$, $B’$, $C’$, $P$, $Q$ y $R$ son equidistantes a $N$.

Sean $D$, $E$ y $F$ los pies de las alturas por $A$, $B$ y $C$ respectivamente.

Como $A’P$, $B’Q$ y $C’R$ son diámetros de esta circunferencia y además $\angle A’DP = \angle QEB’ = \angle RFC’ = \dfrac{\pi}{2}$, es decir estos diámetros subtienden ángulos rectos en los puntos $D$, $E$ y $F$ respectivamente, entonces $D$, $E$ y $F$ se encuentran en la misma circunferencia.

$\blacksquare$

Definición 2. Nos referiremos al centro de la circunferencia de los nueve puntos de un triángulo como el centro de los nueve puntos y los denotaremos como $N$.

Teorema 2. El radio de la circunferencia de los nueve puntos de un triángulo es igual a la mitad del circunradio y el centro de los nueve puntos biseca al segmento que une al circuncentro con el ortocentro.

Demostración. Recordemos que todo triángulo está en homotecia con su triángulo medial, esto implica que son semejantes, con razón $\dfrac{-1}{2}$ y centro de homotecia en el centroide $G$ del triángulo.

Figura 3

Por lo tanto, el radio de la circunferencia de los nueve puntos de un triángulo es la mitad del circunradio de este.

De la relación de homotecia también tenemos que $G$ triseca el segmento $ON$ de los circuncentros $O$ y $N$ de $\triangle ABC$ y $\triangle A’B’C’$, su triángulo medial, esto es, $OG = 2GN$.

Y sabemos que $2OG = GH$, donde $H$ es el ortocentro.

Por lo tanto, $HN = ON$.

$\blacksquare$

Triángulo tangencial

Teorema 3. El circuncentro del triángulo tangencial de un triángulo dado se encuentra en la recta de Euler del triángulo dado.

Demostración. Recordemos que el triángulo tangencial $\triangle D’E’F’$ y el triángulo órtico $\triangle DEF$ de un triángulo $\triangle ABC$ están en homotecia desde un punto $K$ que se encuentra en la recta de Euler de $\triangle ABC$.

Figura 4

Ahora, como los circuncentros de los triángulos tangencial y el triángulo órtico, $T$ y $N$, respectivamente, son puntos correspondientes de esta homotecia, entonces $T$ es colineal con $N$ y $K$.

Por el teorema 2, $N$ esta en la recta de Euler de $\triangle ABC$, por lo tanto, $T$ está en la recta de Euler de $\triangle ABC$.

$\blacksquare$

Corolario 1. El circuncentro de un triángulo dado se encuentra en la recta de Euler del triángulo formado por los puntos de tangencia del incírculo con los lados del triángulo dado.

Demostración. Notemos que todo triángulo es el triángulo tangencial del triángulo formado por los puntos de tangencia de su incírculo con sus lados.

El resultado se sigue al aplicar el teorema 3.

$\blacksquare$

Corolario 2. El cuadrado del circunradio de un triángulo es dos veces el producto del inradio de su triángulo órtico por el circunradio de su triángulo tangencial.

Demostración. Sean $R$, $p$ y $q$ los circunradios de $\triangle ABC$, de su triángulo tangencial $\triangle D’E’C’$ y el inradio de su triángulo órtico $\triangle DEF$, respectivamente.

Como $\triangle D’E’F’$ y $\triangle DEF$ son homotéticos entonces la razón entre sus inradios y la razón entre sus circunradios son iguales a su razón de homotecia y por lo tanto son iguales entre si, además por el teorema 2, $R$ es dos veces el circunradio de $\triangle DEF$.

$\dfrac{R}{q} = \dfrac{p}{\dfrac{R}{2}}$
$\Rightarrow R^2 = 2pq$

$\blacksquare$

Ejemplos

Proposición 2. La recta determinada por el ortocentro de un triángulo y el punto medio de uno de sus lados pasa por el punto diametralmente opuesto, en su circuncírculo, al vértice opuesto del lado considerado.

Demostración. Sean $\triangle ABC$, $(O, R)$ su circuncírculo, $X$ el punto diametralmente opuesto a $A$, $H$ el ortocentro, $A’$ el punto medio de $BC$ y $P$ el punto de Euler entre $A$ y $H$.

Figura 5

$PO$ es un segmento medio de $\triangle AHX$, por lo tanto, $HX \parallel PO$.

Por la proposición 6 de la entrada anterior tenemos que $PH = OA’$ y ambos son perpendiculares a $BC$, por lo tanto, $\square PHA’O$ es un paralelogramo, es decir, $HA’ \parallel PO$.

Como la paralela a una recta por un punto exterior a ella es única, entonces $H$, $A’$ y $X$ son colineales.

$\blacksquare$

Proposición 3. Sean $A$, $B$ y $C$ los centros de tres circunferencias distintas, con el mismo radio y que tienen un punto $O$ en común.

Consideremos los otros puntos en común, $D = (B, r) \cap (C, r)$, $E = (A, r) \cap (C, r)$ y $F = (A, r) \cap (B, r)$, entonces el circunradio de $\triangle DEF$ es igual al de las tres circunferencias dadas y su circuncentro es el ortocentro de $\triangle ABC$.

Demostración. Notemos primero que $OA = OB = OC = r$, por lo tanto, el circuncentro de $\triangle ABC$ es $O$ y su circunradio es $r$.

Como $\square AFBO$ y $\square OBDC$ son rombos entonces $AF = BO = CD$ y $AF \parallel BO \parallel CD$.

Por tanto, $\square AFDC$ es paralelogramo y así $\Rightarrow AC = DF$ y $AC \parallel DF$.

Figura 6

De manera análoga podemos ver que $AB = DE$, $AB \parallel DE$ y $BC = EF$ y $BC \parallel EF$

Por lo tanto, $\triangle ABC$ y $\triangle DEF$ son congruentes por criterio LLL y sus respectivos lados son paralelos.

Como $\square OBDC$ es un rombo entonces, $OD \perp BC$ además $OD$ y $BC$ se intersecan en su punto medio, $A’$.

De manera análoga podemos ver $AB \perp OF$, se bisecan en $C’$ y $AC \perp OE$, se bisecan en $B’$.

De lo anterior se sigue que $\triangle A’B’C’$ es el triángulo medial de $\triangle ABC$, que $DO$, $EO$ y $FO$ son las alturas de $\triangle DEF$.

Por lo tanto $O$ es el ortocentro de $\triangle DEF$ y $\triangle A’B’C’$ es el triángulo de Euler de $\triangle DEF$.

En consecuencia, la circunferencia de los nueve puntos es la misma para $\triangle ABC$ y $\triangle DEF$, por el teorema 2, se sigue que sus circunradios son iguales, por lo tanto, el circunradio de $\triangle DEF$ es $r$.

También por el teorema 2, sabemos que el centro de los nueve puntos biseca al segmento que une ortocentro con el circuncentro.

Como el centro de los nueve puntos es el mismo para $\triangle ABC$ y $\triangle DEF$, y ya que el circuncentro de $\triangle ABC$ coincide con el ortocentro de $\triangle DEF$ entonces el circuncentro de $\triangle ABC$ coincide con el ortocentro de $\triangle DEF$.

$\blacksquare$

Problema. Construir un triángulo $\triangle ABC$ dados dos vértices $B$, $C$ y el centro de los nueve puntos, $N$.

Solución. Trazamos $BC$ y su punto medio $A’$,

Con el radio $NA’$ de la circunferencia de los nueve puntos, obtenemos el circunradio de $\triangle ABC$, $2NA’$.

Figura 7

Ahora podemos encontrar al circuncentro de $\triangle ABC$ que se encuentra en la mediatriz de $BC$, trazando una circunferencia con centro en $B$ o en $C$ y radio $2NA’$.

El simétrico de $A’$ respecto a $N$ será $P$, el punto de Euler que se encuentra entre $N$ y el vértice buscado. Como la perpendicular a $BC$ por $P$ es la altura por $A$, entonces su intersección con el circuncírculo $(O, 2NA’)$ de $\triangle ABC$, es el vértice faltante.

$\blacksquare$

Más adelante…

En la próxima entrada veremos como cierto conjunto de triángulos al que llamaremos grupo ortocéntrico de triángulos tienen la misma circunferencia de los nueve puntos y otros resultados relacionados.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Muestra que el triángulo de Euler $\triangle PQR$ y el triangulo $\triangle C’B’D$ son congruentes, (figura 2).
  2. Por los puntos medios de un triángulo dado traza paralelas a las bisectrices externas de los correspondientes ángulos opuestos. Prueba que el triángulo formado por estas paralelas y el triángulo dado tienen la misma circunferencia de los nueve puntos.
  3. Muestra que las paralelas a las bisectrices internas de un triángulo dado trazadas por los respectivos puntos de Euler del triángulo dado son concurrentes, también prueba que la recta que pasa por el punto de concurrencia y el centro de los nueve puntos del triángulo dado es paralela con la recta que pasa por el circuncentro y el incentro del triángulo dado.
  4. Demuestra que la circunferencia de los nueve puntos biseca cualquier segmento que une al ortocentro con un punto en el circuncírculo.
  5.  Construye un triángulo dados un vértice, el ortocentro y el centro de los nueve puntos.

Entradas relacionadas

Fuentes

  • Altshiller, N., College Geometry. New York: Dover, 2007, pp 103-105.
  • Coxeter, H. y Greitzer, L., Geometry Revisited. Washington: The Mathematical Association of America, 1967, pp 20-22.
  • Gomez, A. y Bulajich, R., Geometría. México: Instituto de Matemáticas, 2002, pp 69-70.

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Ecuaciones Diferenciales I: Ecuaciones lineales de segundo orden con coeficientes variables – Soluciones en series de potencias respecto a puntos ordinarios

Por Omar González Franco

El mundo de las matemáticas no es un lugar aburrido en el que estar.
Es un lugar extraordinario; merece la pena pasar el tiempo allí.
– Marcus du Sautoy

Introducción

Hasta este punto de la unidad dos hemos desarrollado distintos métodos para resolver ecuaciones diferenciales lineales de orden superior, en particular de segundo orden con coeficientes constantes a excepción de la ecuación de Cauchy – Euler.

Para finalizar con la segunda unidad es el turno de estudiar las ecuaciones diferenciales lineales de segundo orden con coeficientes variables. Estas ecuaciones suelen ser mucho más complicadas de resolver ya que no se resuelven en términos de funciones elementales, sino que tienen forma de serie de potencias infinitas.

Nos parece adecuado comenzar esta entrada con un repaso sobre series de potencias, posteriormente veremos su utilidad en los métodos de resolución de las ecuaciones diferenciales antes mencionadas, así mismo, introduciremos algunos conceptos nuevos relacionados con el tipo de solución que tienen estas ecuaciones diferenciales.

Series de potencias

Algunas propiedades y conceptos importantes que debemos recordar son los siguientes.

Toda serie de potencias tiene un intervalo de convergencia.

Si $R> 0$, entonces la serie de potencias (\ref{1}) converge para $|x -a| < R$ y diverge para $|x -a| > R$.

Si la serie converge sólo en su centro $a$, entonces $R = 0$.

Si la serie converge para toda $x$, entonces se escribe $R = \infty$.

Una serie de potencias podría converger o no en los puntos extremos $a -R$ y $a + R$ de este intervalo.

El radio de convergencia también se puede determinar con las siguientes expresiones.

$$R = \left( \lim_{n \to \infty} \sqrt[n]{|c_{n}|} \right)^{-1} \hspace{1cm} o \hspace{1cm} R = \lim_{n \to \infty} \left| \dfrac{c_{n}}{c_{n + 1}} \right| \label{4} \tag{4}$$

Realicemos un ejemplo.

Ejemplo: Hallar el radio de convergencia y el intervalo de convergencia de la serie de potencias

$$\sum_{n = 1}^{\infty} \dfrac{n^{2}}{2^{n}} \left( x -1 \right)^{n}$$

Solución: Para determinar el radio de convergencia utilicemos la segunda expresión de (\ref{4}). De la serie de potencias identificamos que

$$c_{n} = \dfrac{n^{2}}{2^{n}} \hspace{1cm} y \hspace{1cm} c_{n + 1} = \dfrac{(n + 1)^{2}}{2^{n + 1}}$$

Calculemos el límite.

$$R = \lim_{n \to \infty} \left| \dfrac{c_{n}}{c_{n + 1}} \right| = \lim_{n \to \infty} \left| \dfrac{\dfrac{n^{2}}{2^{n}}}{\dfrac{(n + 1)^{2}}{2^{n + 1}}} \right| = 2 \lim_{n \to \infty} \left| \dfrac{n^{2}}{(n + 1)^{2}} \right|$$

Sabemos que

$$\lim_{n \to \infty} \left| \dfrac{n^{2}}{(n + 1)^{2}} \right| = 1$$

Por lo tanto, el radio de convergencia es $R = 2$.

Para determinar el intervalo de convergencia utilicemos la expresión (\ref{5}).

\begin{align*}
\lim_{n \to \infty} \left| \dfrac{c_{n + 1}(x -a)^{n + 1}}{c_{n}(x -a)^{n}} \right| &= \lim_{n \to \infty} \left| \dfrac{\dfrac{(n + 1)^{2}}{2^{n + 1}}(x -1)^{n + 1}}{\dfrac{n^{2}}{2^{n}}(x -1)^{n}} \right| \\
&= |x -1| \lim_{n \to \infty} \dfrac{2^{n}(n + 1)^{2}}{2^{n + 1}n^{2}} \\
&= \dfrac{1}{2} |x -1| \lim_{n \to \infty} \dfrac{n^{2} + 2n + 1}{n^{2}} \\
&= L
\end{align*}

Es claro que

$$\lim_{n \to \infty} \dfrac{n^{2} + 2n + 1}{n^{2}} = 1$$

Entonces,

$$\dfrac{1}{2} |x -1| = L$$

La condición de convergencia nos indica que $L < 1$, considerando esto tenemos que

\begin{align*}
\dfrac{1}{2} |x -1| &< 1 \\
|x -1| &< 2 \\
-2 < x -1 &< 2 \\
-1 < x &< 3
\end{align*}

Por lo tanto, el intervalo de convergencia es $I = (-1, 3)$.

Notemos que la mitad de la longitud del intervalo de convergencia efectivamente corresponde al valor del radio de convergencia obtenido.

$$R = \dfrac{3 -(-1)}{2} = \dfrac{4}{2} = 2$$

$\square$

Series de potencias como funciones

Nota: La convergencia en un extremo se podría perder por derivación o ganar por integración. Algo similar ocurre con los índices de una serie, supongamos que

$$y = \sum_{n = 0}^{\infty}c_{n}x^{n}$$

es una serie de potencias en $x$, las primeras dos derivadas están dadas como

$$\dfrac{dy}{dx} = \sum_{n = 0}^{\infty} n x^{n -1} \hspace{1cm} y \hspace{1cm} \dfrac{d^{2}y}{dx^{2}} = \sum_{n = 0}^{\infty}n(n -1)x^{n -2}$$

Sin embargo, notemos que el primer término en la primera derivada y los dos primeros términos de la segunda derivada son cero, entonces los podemos omitir y correr el índice para escribir

$$\dfrac{dy}{dx} = \sum_{n = 1}^{\infty} n x^{n -1} \hspace{1cm} y \hspace{1cm} \dfrac{d^{2}y}{dx^{2}} = \sum_{n = 2}^{\infty}n(n -1)x^{n -2}\label{7} \tag{7}$$

Un concepto de bastante importancia y utilidad en las próximas entradas es el siguiente.

Podemos hacer operaciones con series de potencias, a continuación se muestran algunas de ellas.

  • Suma: Dos series de potencias pueden sumarse término a término.

Sean

$$f(x) = \sum_{n = 0}^{\infty}c_{n}(x -a)^{n} \hspace{1cm} y \hspace{1cm} g(x) = \sum_{n = 0}^{\infty}b_{n}(x -a)^{n}$$

dos series de potencias con radio de convergencia $R> 0$, entonces

$$f(x) + g(x) = \sum_{n = 0}^{\infty}(c_{n} + b_{n})(x -a)^{n} \label{9} \tag{9}$$

Para toda $|x -a| < R$.

  • Producto: Dos series de potencias pueden multiplicarse término a término (cada término de la primera por cada término de la segunda).

Sean

$$f(x) = \sum_{n = 0}^{\infty}c_{n}(x -a)^{n} \hspace{1cm} y \hspace{1cm} g(x) = \sum_{n = 0}^{\infty}b_{n}(x -a)^{n}$$

dos series de potencias con radio de convergencia $R> 0$, entonces

$$f(x)g(x) = \sum_{n = 0}^{\infty}(c_{0}b_{n} + c_{1}b_{n -1} + \cdots + c_{n}b_{0})(x -a)^{n} \label{10} \tag{10}$$

Para toda $|x -a| < R$.

  • Derivación: Una serie de potencias puede derivarse término a término.

Sea

$$f(x) = \sum_{n = 0}^{\infty}c_{n}(x -a)^{n}$$

una serie de potencias convergente para $|x -a| < R$ con $R> 0$. La derivada de la serie $f$ es

$$F(x) = \dfrac{df}{dx} = \sum_{n = 1}^{\infty}nc_{n}(x -a)^{n -1} \label{11} \tag{11}$$

y también es convergente y tiene el mismo radio de convergencia que $f(x)$.

  • Integración: Una serie de potencias puede integrarse término a término.

Sea

$$f(x) = \sum_{n = 0}^{\infty}c_{n}(x -a)^{n}$$

una serie de potencias convergente para $|x -a| < R$ con $R> 0$. La integral de la serie $f$ es

$$F(x) = \int_{0}^{x}f(t)dt = \sum_{n = 0}^{\infty}\dfrac{c_{n}}{n + 1}(x -a)^{n + 1} \label{12} \tag{12}$$

y tiene a $R$ como radio de convergencia.

A lo largo de ésta y las siguientes entradas será de suma importancia y utilidad simplificar la suma de dos o más series de potencias, cada una expresada en notación de suma, en una sola expresión de suma, muchas veces esto implica que se deba hacer un cambio en el índice de la suma.

Para poder sumar dos series en necesario que ambos índices de las sumas comiencen con el mismo número y las potencias de $x$ sean las mismas y estén en fase. Por ejemplo, consideremos las siguientes dos series

$$f(x) = \sum_{n = 1}^{\infty} = \dfrac{n}{n+2}x^{n + 1} \hspace{1cm} y \hspace{1cm} g(x) = \sum_{n = 1}^{\infty} = \dfrac{1}{n^{2} + 1}x^{n + 1}$$

Como ambas series comienzan con el mismo número $n = 1$ y en ambas la potencia de $x$ es la misma $n + 1$, entonces podemos combinar ambas series en una sola de acuerdo a la expresión (\ref{9})

\begin{align*}
f(x) + g(x) &= \sum_{n = 1}^{\infty} \left[ \dfrac{n}{n+2} + \dfrac{1}{n^{2} + 1} \right]x^{n + 1} \\
&= \sum_{n = 1}^{\infty} \dfrac{n^{3} + 2n + 2}{n^{3} + 2n^{2} + n + 2}x^{n + 1}
\end{align*}

¿Pero que ocurre si no comienzan con el mismo número y/o las potencias de $x$ no coinciden?. En estos casos será necesario hacer un cambio en el índice de la suma y por tanto en la potencia de $x$. A continuación se muestra un ejemplo en el que describimos la forma de hacerlo.

Ejemplo: Reescribir la expresión

$$f(x) = \sum_{n = 1}^{\infty}2nc_{n}x^{n -1} + \sum_{n = 0}^{\infty}6c_{n}x^{n + 1}$$

como una sola serie de potencias cuyo término general tenga $x^{k}$.

Solución: Notemos que la potencia de $x$ en la primer serie para $n = 1$ es $x^{0}$, mientras que en la segunda serie para $n = 0$ es $x^{1}$, como ambas potencias son distintas decimos que no están en fase, para corregir esto y hacer que estén en fase extraemos el primer término de la primer serie.

$$\sum_{n = 1}^{\infty}2nc_{n}x^{n -1} = 2c_{1} + \sum_{n = 2}^{\infty}2nc_{n}x^{n -1}$$

Así, la potencia de $x$ para $n = 2$ es $x^{1}$. Con esto hemos logrado que ambas series estén en fase a pesar de que tengan distintas potencias en $x$ y comiencen con distintos números para $n$.

Procedemos a hacer el cambio de índice, para ello se toman como guía los exponentes de $x$. Para la primer serie tomamos $k = n -1$, de donde $n = k + 1$. Si $n = 2$, entonces $k = 1$ con esto podemos escribir a la primer serie de la siguiente manera.

$$\sum_{n = 1}^{\infty}2nc_{n}x^{n -1} = 2c_{1} + \sum_{k = 1}^{\infty}2(k + 1)c_{k + 1}x^{k}$$

Para la segunda serie tomamos $k = n + 1$, de donde $n = k -1$, si $n = 0$, entonces $k = 1$, así la segunda serie se puede escribir de la siguiente manera.

$$\sum_{n = 0}^{\infty}6c_{n}x^{n + 1} = \sum_{k = 1}^{\infty}6c_{k -1}x^{k}$$

Ahora podemos escribir

$$\sum_{n = 1}^{\infty}2nc_{n}x^{n -1} + \sum_{n = 0}^{\infty}6c_{n}x^{n + 1} = 2c_{1} + \sum_{k = 1}^{\infty}2(k + 1)c_{k + 1}x^{k} + \sum_{k = 1}^{\infty}6c_{k -1}x^{k}$$

Observemos que ambas series ya comienzan con el mismo número $k = 1$ y la potencia de $x$ es $k$ para ambas, entonces ya podemos combinar las series en una sola, de tal manera que

$$f(x) = 2c_{1} + \sum_{k = 1}^{\infty} \left[ 2(k + 1)c_{k + 1} + 6c_{k -1} \right] x^{k}$$

$\square$

En el caso de una sola serie es mucho mas sencillo pues basta tomar a $k$ como la potencia de $x$ y evaluar el valor del primer número en la serie, por ejemplo para la serie

$$\sum_{n = 1}^{\infty}nc_{n}x^{n + 2}$$

Si queremos que el termino $x$ tenga potencia $k$ hacemos $k = n + 2$, de donde $n = k -2$, la serie comienza en $n = 1$, sustituyendo en $k$ obtenemos que $k = 3$, por lo tanto la serie en términos del índice $k$ se puede escribir de la siguiente manera.

$$\sum_{n = 1}^{\infty}nc_{n}x^{n + 1} = \sum_{k = 3}^{\infty}(k -2)c_{k -2}x^{k}$$

Puedes desglosar ambas sumas para convencerte de la igualdad.

Hasta aquí concluimos nuestro repaso de series de potencias, es momento de aplicarlo en la resolución de ecuaciones diferenciales.

Soluciones en series de potencias de ecuaciones diferenciales

Las ecuaciones diferenciales lineales de segundo orden con coeficientes variables tienen la forma

$$a_{2}(x)\dfrac{d^{2}y}{dx^{2}} + a_{1}(x) \dfrac{dy}{dx} + a_{0}(x)y = g(x) \label{13} \tag{13}$$

Comenzaremos por considerar que $g(x) = 0$.

$$a_{2}(x)\dfrac{d^{2}y}{dx^{2}} + a_{1}(x) \dfrac{dy}{dx} + a_{0}(x)y = 0 \label{14} \tag{14}$$

Si dividimos la ecuación por $a_{2}(x) \neq 0$ y definimos

$$P(x) = \dfrac{a_{1}(x)}{a_{2}(x)} \hspace{1cm} y \hspace{1cm} Q(x) = \dfrac{a_{0}(x)}{a_{2}(x)}$$

podemos escribir la ecuación (\ref{14}) en su forma estándar.

$$\dfrac{d^{2}y}{dx^{2}} + P(x) \dfrac{dy}{dx} + Q(x)y = 0 \label{15} \tag{15}$$

En base a la ecuación estándar (\ref{15}) establecemos las siguientes definiciones.

De acuerdo a estas definiciones notamos que un punto singular $x_{0}$ es un punto no ordinario.

Realicemos un ejemplo.

Ejemplo: Hallar los puntos ordinarios y singulares de la ecuación diferencial

$$x^{2}(x -1)\dfrac{d^{2}y}{dx^{2}} + x^{3}(x^{2} -1)\dfrac{dy}{dx} + xy = 0$$

Solución: El primer paso es escribir a la ecuación diferencial en su forma estándar, para ello dividimos toda la ecuación por el coeficiente de la segunda derivada suponiendo que es distinto de cero.

\begin{align*}
\dfrac{d^{2}y}{dx^{2}} + \dfrac{x^{3}(x^{2} -1)}{x^{2}(x -1)} \dfrac{dy}{dx} + \dfrac{x}{x^{2}(x -1)}y &= 0 \\
\dfrac{d^{2}y}{dx^{2}} + x(x + 1) \dfrac{dy}{dx} + \dfrac{1}{x(x -1)}y &= 0
\end{align*}

Identificamos que

$$P(x) = x(x + 1) \hspace{1cm} y \hspace{1cm} Q(x) = \dfrac{1}{x(x -1)}$$

Para el caso de la función $P(x)$ notamos que es analítica para toda $x \in \mathbb{R}$, mientras que la función $Q(x)$ no está definida en $x = 0$ ni $x = 1$, es decir, no es analítica en dichos puntos.

Por lo tanto, los puntos ordinarios de la ecuación diferencial son todas las $x \in \mathbb{R}$ excepto $x = 0$ y $x = 1$, éstos puntos corresponde a los puntos singulares de la ecuación.

$\square$

Una observación interesante es que la ecuación de Cauchy-Euler

$$ax^{2} \dfrac{d^{2}y}{dx^{2}} + bx \dfrac{dy}{dx} + cy = 0 \label{16} \tag{16}$$

en su forma estándar

$$\dfrac{d^{2}y}{dx^{2}} + \dfrac{b}{ax} \dfrac{dy}{dx} + \dfrac{c}{ax^{2}}y = 0 \label{17} \tag{17}$$

nos muestra que las funciones

$$P(x) = \dfrac{b}{ax} \hspace{1cm} y \hspace{1cm} Q(x) = \dfrac{c}{ax^{2}}$$

no están definidas en $x = 0$, por tanto $x = 0$ es un punto singular y todos los demás puntos (reales o complejos) son puntos ordinarios, es por ello que toda la teoría realizada en la entrada correspondiente fue para $x > 0$.

De acuerdo al título de esta entrada, nos enfocaremos en soluciones respecto a puntos ordinarios, sin embargo, cabe mencionar que en la siguiente entrada estudiaremos soluciones respecto a puntos singulares y será necesario hacer una distinción entre dos tipos de puntos singulares que definiremos como punto singular regular y punto singular irregular. Estos conceptos los revisaremos en la siguiente entrada.

Como ya hemos mencionando, las soluciones de la ecuación diferencial (\ref{15}) son soluciones en forma de series de potencias. Si una ecuación diferencial es analítica en un punto $x_{0}$, entonces su solución también lo es en $x_{0}$, y como dicha solución será una función desarrollable en series de potencias, podemos suponer que, en forma general, tendrá la siguiente forma.

$$y(x) = \sum_{n = 0}^{\infty}c_{n}(x -x_{0})^{n} \label{18} \tag{18}$$

donde $c_{n}$ cambia para cada función específica.

A continuación enunciamos el teorema que establece la existencia y forma de las soluciones de (\ref{15}).

Una solución en serie converge, por lo menos, en un intervalo definido por $|x -x_{0}| < R$, donde $R$ es la distancia desde $x_{0}$ al punto singular más cercano, es decir, es el valor mínimo o límite inferior del radio de convergencia de las soluciones en serie de la ecuación diferencial respecto a $x_{0}$.

La demostración a este teorema suele ser bastante larga pero intuitiva. En esta ocasión no lo demostraremos y en su lugar desarrollaremos varios ejemplos que ilustran el resultado. Sin embargo, en la sección de videos de este mismo curso se puede encontrar con todo detalle la demostración de este teorema, además del método para hallar el radio de convergencia de la solución en serie de potencias cerca de un punto ordinario.

Método de resolución

Si bien, en la demostración del teorema de existencia y forma de la solución en series de potencias se describe el método de resolución, nosotros vamos a describirlo de manera breve y realizaremos algunos ejemplos para que quede bastante claro.

Recordemos que el método de coeficientes indeterminados desarrollado para ecuaciones diferenciales lineales no homogéneas de segundo orden con coeficientes constantes ya involucraba soluciones en forma de series de potencias y lo que hacíamos al final del método era igualar los coeficientes de ambos lados de la ecuación para satisfacer la igualdad, la diferencia ahora es que el lado derecho de la ecuación es cero y no una función $g(x)$, sin embargo el procedimiento es bastante similar.

Debido a que se trata de un método bastante laborioso, por simplicidad encontraremos soluciones en series de potencias sólo con respecto al punto ordinario $x_{0} = 0$. Así, las soluciones serán de la forma

$$y(x) = \sum_{n = 0}^{\infty}c_{n}x^{n} \label{19} \tag{19}$$

La descripción del método se muestra a continuación:

  • El método de resolución implica considerar la solución (\ref{19}) y su primera y segunda derivada (\ref{7}) para sustituirlas en la ecuación diferencial (\ref{14}).

$$a_{2}(x) \left[ \sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n -2} \right] + a_{1}(x) \left[ \sum_{n = 1}^{\infty}nc_{n}x^{n -1} \right] + a_{0}(x) \left[ \sum_{n = 0}^{\infty}c_{n}x^{n} \right] = 0$$

  • El siguiente paso es reescribir toda la ecuación en una sola serie lo que, en la mayoría de los casos, requerirá de hacer cambios de índices para que se tenga la misma potencia de $x$.
  • Como el resultado será idénticamente cero será necesario que el coeficiente de cada potencia de $x$ se iguale a cero. Como veremos más adelante, esto nos generará una ecuación general para los coeficientes de $y(x)$, dicha expresión se conoce como relación de recurrencia.
  • La tarea final será usar la relación de recurrencia para obtener el valor de los coeficientes $c_{n}$ de (\ref{19}) y con ello la forma de la solución de la ecuación diferencial en cuestión.

Es importante aclarar que la sola suposición de la solución (\ref{19}) conduce a dos conjuntos de coeficientes, de manera que se tendrán dos series de potencias distintas $y_{1}$ y $y_{2}$, ambas desarrolladas respecto al punto ordinario $x_{0}$. Se puede demostrar que la solución general de la ecuación diferencial (\ref{14}) es

$$y(x) = C_{1}y_{1}(x) + C_{2}y_{2}(x) \label{20} \tag{20}$$

en donde $C_{1} = c_{0}$ y $C_{2} = c_{1}$, es decir, los primeros coeficientes de la serie (\ref{19}).

Este método no solo es aplicable a ecuaciones de la forma (\ref{14}), sino que se puede aplicar a distintas ecuaciones que satisfagan las propiedades necesarias descritas a lo largo de la entrada.

Para comprender el método resolvamos una ecuación bastante sencilla de primer orden y veamos que resultado obtenemos.

Ejemplo: Determinar la solución de la ecuación diferencial

$$\dfrac{dy}{dx} -y = 0$$

usando series de potencias respecto al punto ordinario $x_{0} = 0$.

Solución: La solución debe ser de la forma

$$y = \sum_{n = 0}^{\infty}c_{n}x^{n}$$

La derivada de esta función es

$$\dfrac{dy}{dx} = \sum_{n = 1}^{\infty}nc_{n}x^{n -1}$$

Sustituimos en la ecuación diferencial.

$$\sum_{n = 1}^{\infty}nc_{n}x^{n -1} -\sum_{n = 0}^{\infty}c_{n}x^{n} = 0$$

Hay que reescribir esta ecuación en una sola serie en la que la potencia de $x$ sea $k$.

Guiándonos en los exponentes de $x$, en la primer serie tomamos $k = n -1$, de donde $n = k + 1$, si la serie comienza en $n = 1$, entonces $k = 1 -1 = 0$. En el caso de la segunda serie basta hacer $k = n$, entonces tenemos que

$$\sum_{k = 0}^{\infty}(k + 1)c_{k + 1}x^{k} -\sum_{k = 0}^{\infty}c_{k}x^{k} = 0$$

Ahora si podemos unir las series en una sola de acuerdo a (\ref{9})

$$\sum_{k = 0}^{\infty} \left[(k + 1)c_{k + 1} -c_{k} \right] x^{k} = 0$$

Como $x^{k}\neq 0$ por ser la solución propuesta, entonces necesariamente

$$(k + 1)c_{k + 1} -c_{k} = 0$$

Como $k$ es un número entero que comienza en cero hacía infinito, entonces $k$ no puede ser negativo, lo que significa que no hay valor de $k$, tal que $k + 1 = 0$, es así que podemos despejar a $c_{k + 1}$ de la expresión anterior sin problema.

$$c_{k + 1} = \dfrac{c_{k}}{k + 1}, \hspace{1cm} k = 0, 1, 2, 3, \cdots$$

Ésta última expresión corresponde a la relación de recurrencia, de la que se obtiene cada una de las constantes para cada uno de los términos de la serie solución.

Comencemos con $k = 0$.

$$c_{1} = \dfrac{c_{0}}{0 + 1} =c_{0}$$

Para $k = 1$, tenemos

$$c_{2} = \dfrac{c_{1}}{1 + 1} = \dfrac{c_{0}}{2}$$

$k = 2$.

$$c_{3} = \dfrac{c_{2}}{2 + 1} = \dfrac{c_{0}}{6}$$

$k = 3$.

$$c_{4} = \dfrac{c_{3}}{3 + 1} = \dfrac{c_{0}}{24}$$

Etcétera, entonces la solución va teniendo la siguiente forma.

\begin{align*}
y(x) &= c_{0} + c_{1}x + c_{2}x^{2} + c_{3}x^{3} + c_{4}x^{4} + \cdots \\
&= c_{0} + c_{0}x + \dfrac{c_{0}}{2}x^{2} + \dfrac{c_{0}}{6}x^{3} + \dfrac{c_{0}}{24}x^{4} + \cdots \\
&= c_{0} \left[1 + x + \dfrac{x^{2}}{2} + \dfrac{x^{3}}{6} + \dfrac{x^{4}}{24} + \cdots \right] \\
&= c_{0} \left[ 1 + x + \dfrac{x^{2}}{2!} + \dfrac{x^{3}}{3!} + \dfrac{x^{4}}{4!} + \cdots \right]
\end{align*}

En algunas ocasiones las series de potencias resultan ser series conocidas, como lo es en este caso, pues sabemos que

$$e^{x} = \sum_{n = 0}^{\infty}\dfrac{x^{n}}{n!} = 1 + x + \dfrac{x^{2}}{2!} + \dfrac{x^{3}}{3!} + \dfrac{x^{4}}{4!} + \cdots$$

Por lo tanto, si definimos $c = c_{0}$, la solución de la ecuación diferencial es

$$y(x) = ce^{x}$$

Para asegurarnos del resultado se puede sustituir en la ecuación diferencial y ver que la satisface, o bien, podemos usar separación de variables para resolver la ecuación y verificar el resultado.

\begin{align*}
\dfrac{dy}{dx} -y &= 0 \\
\dfrac{dy}{dx} &= y \\
\dfrac{1}{y} \dfrac{dy}{dx} &= 1 \\
\int{\dfrac{dy}{y}} &= \int{dx} \\
\ln(y) &= x + k \\
y &= e^{x + k} \\
y &= e^{k}e^{x} \\
y(x) &= ce^{x}
\end{align*}

¡Verificado!. Interesante ¿no?.

$\square$

Con este ejemplo se espera que se comprenda la noción del método, como se puede notar es un proceso largo a pesar de ser una ecuación muy simple. Concluiremos esta entrada resolviendo dos ecuaciones diferenciales de las que si estamos interesados en resolver, es decir, de la forma (\ref{14}).

Ejemplo: Resolver la ecuación diferencial

$$\dfrac{d^{2}y}{dx^{2}} + xy = 0$$

respecto al punto ordinario $x_{0} = 0$.

Solución: Debido a que no hay puntos singulares, el teorema garantiza dos soluciones en serie de potencias centradas en $x_{0} = 0$, convergentes para $|x|< \infty$.

Consideremos la solución

$$y = \sum_{n = 0}^{\infty}c_{n}x^{n}$$

y su segunda derivada

$$\dfrac{d^{2}y}{dx^{2}} = \sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n -2}$$

Sustituyamos en la ecuación diferencial.

\begin{align*}
\dfrac{d^{2}y}{dx^{2}} + xy &= \left[ \sum_{n = 2}^{\infty}c_{n}n(n -1)x^{n -2} \right] + x \left[ \sum_{n = 0}^{\infty}c_{n}x^{n} \right] \\
&= \sum_{n = 2}^{\infty}c_{n}n(n -1)x^{n -2} + \sum_{n = 0}^{\infty}c_{n}x^{n + 1}
\end{align*}

Para que practiques muestra que

$$\sum_{n = 2}^{\infty}c_{n}n(n -1)x^{n -2} + \sum_{n = 0}^{\infty}c_{n}x^{n + 1} = 2c_{2} + \sum_{k = 1}^{\infty} \left[ (k + 1)(k + 2)c_{k + 2} + c_{k -1} \right] x^{k}$$

Por lo tanto,

$$2c_{2}x^{0} + \sum_{k = 1}^{\infty} \left[ (k + 1)(k + 2)c_{k + 2} + c_{k -1} \right] x^{k} = 0$$

Para que esta igualdad se cumpla es necesario que el coeficiente de cada potencia de $x$ se iguale a cero. Para el caso de la potencia $k = 0$ tenemos que $2c_{2} = 0$, de donde $c_{2} = 0$, para el resto de potencias formamos la relación de recurrencia.

$$(k + 1)(k + 2)c_{k + 2} + c_{k -1} = 0, \hspace{1cm} k = 1, 2, 3, \cdots$$

Esta expresión determina los coeficientes $c_{k}$ que buscamos. Como $(k + 1)(k + 2) \neq 0$ para los valores de $k$, podemos escribir $c_{k + 2}$ en términos de $c_{k -1}$.

$$c_{k + 2} = -\dfrac{c_{k -1}}{(k + 1)(k + 2)}, \hspace{1cm} k = 1, 2, 3, \cdots$$

Esta relación genera coeficientes consecutivos de la solución propuesta una vez que $k$ toma los valores enteros sucesivos indicados.

Comencemos con $k = 1$.

$$c_{3} = -\dfrac{c_{0}}{2\cdot 3}$$

Para $k = 2$, se tiene

$$c_{4} = -\dfrac{c_{1}}{3 \cdot 4}$$

Para $k = 3$ hacemos uso de que $c_{2} = 0$.

$$c_{5} = -\dfrac{c_{2}}{4 \cdot 5} = 0$$

A partir de $k = 4$ hacemos uso de los valores previos.

$$c_{6} = -\dfrac{c_{3}}{5 \cdot 6} = -\left( -\dfrac{c_{0}}{2\cdot 3} \right) \dfrac{1}{5 \cdot 6} = \dfrac{1}{2 \cdot 3 \cdot 5 \cdot 6} c_{0}$$

$k = 5$.

$$c_{7} = -\dfrac{c_{4}}{6 \cdot 7}=-\left( -\dfrac{c_{1}}{3 \cdot 4} \right) \dfrac{1}{6 \cdot 7} = \dfrac{1}{3 \cdot 4 \cdot 6 \cdot 7}c_{1}$$

Para $k = 6$ recordamos que $c_{5} = 0$.

$$c_{8} = -\dfrac{c_{5}}{7 \cdot 8} = 0$$

$k = 7$.

$$c_{9} = -\dfrac{c_{6}}{8 \cdot 9} = \dfrac{1}{2 \cdot 3 \cdot 5 \cdot 6 \cdot 8 \cdot 9}c_{0}$$

$k = 8$.

$$c_{10} = -\dfrac{c_{7}}{9 \cdot 10} = \dfrac{1}{3 \cdot 4 \cdot 6 \cdot 7 \cdot 9 \cdot 10}c_{1}$$

$k = 9$.

$$c_{11} = -\dfrac{c_{8}}{10 \cdot 11} = 0$$

Podemos hacer estos cálculos para la $k$ que deseemos, el objetivo es intentar determinar que tipo de serie numérica es la que se logra formar. En este caso nos detendremos hasta $k = 9$, con ello hemos logrado obtener los primeros $11$ coeficientes de la solución que buscamos (recordemos que $c_{0}$ y $c_{1}$ tienen valores arbitrarios).

\begin{align*}
y(x) &= c_{0} + c_{1} x + c_{2}x^{2} + c_{3}x^{3} +c_{4}x^{4} + c_{5}x^{5} + c_{6}x^{6} \\
&+ c_{7}x^{7} + c_{8}x^{8} + c_{9}x^{9} + c_{10}x^{10} + c_{11}x^{11} + \cdots
\end{align*}

Sustituyamos los coeficientes obtenidos.

\begin{align*}
y(x) &= c_{0} + c_{1}x + 0 -\dfrac{c_{0}}{2 \cdot 3}x^{3} -\dfrac{c_{1}}{3 \cdot 4}x^{4} + 0 + \dfrac{c_{0}}{2 \cdot 3 \cdot 5 \cdot 6}x^{6} + \dfrac{c_{1}}{3 \cdot 4 \cdot 6 \cdot 7}x^{7} + 0 \\
&-\dfrac{c_{0}}{2 \cdot 3 \cdot 5 \cdot 6 \cdot 8 \cdot 9}x^{9} -\dfrac{c_{1}}{3 \cdot 4 \cdot 6 \cdot 7 \cdot 9 \cdot 10}x^{10} + 0 + \cdots
\end{align*}

Para obtener la solución general

$$y(x) = c_{0}y_{1}(x) + c_{1}y_{2}(x)$$

agrupemos los términos que contienen $c_{0}$ y por otro lado los que tienen $c_{1}$.

\begin{align*}
y(x) &= c_{0} \left[ 1 -\dfrac{1}{2 \cdot 3}x^{3} + \dfrac{1}{2 \cdot 3 \cdot 5 \cdot 6}x^{6} -\dfrac{1}{2 \cdot 3 \cdot 5 \cdot 6 \cdot 8 \cdot 9}x^{9} + \cdots \right] \\
&+ c_{1} \left[ x -\dfrac{1}{3 \cdot 4}x^{4} + \dfrac{1}{3 \cdot 4 \cdot 6 \cdot 7}x^{7} -\dfrac{1}{3 \cdot 4 \cdot 6 \cdot 7 \cdot 9 \cdot 10}x^{10} + \cdots \right]
\end{align*}

Por lo tanto,

\begin{align*}
y_{1}(x) &= 1 -\dfrac{1}{2 \cdot 3}x^{3} + \dfrac{1}{2 \cdot 3 \cdot 5 \cdot 6}x^{6} -\dfrac{1}{2 \cdot 3 \cdot 5 \cdot 6 \cdot 8 \cdot 9}x^{9} + \cdots \\
&= 1 + \sum_{k = 1}^{\infty}\dfrac{(-1)^{k}}{2 \cdot 3 \cdots (3k -1)(3k)}
\end{align*}

y

\begin{align*}
y_{2}(x) &= x -\dfrac{1}{3 \cdot 4}x^{4} + \dfrac{1}{3 \cdot 4 \cdot 6 \cdot 7}x^{7} -\dfrac{1}{3 \cdot 4 \cdot 6 \cdot 7 \cdot 9 \cdot 10}x^{10} + \cdots \\
&= x + \sum_{k = 1}^{\infty}\dfrac{(-1)^{k}}{3 \cdot 4 \cdots (3k)(3k + 1)}x^{3k + 1}
\end{align*}

Con esto hemos concluido el ejercicio. Los coeficientes $c_{0}$ y $c_{1}$ quedan completamente indeterminados de manera que se pueden elegir de forma arbitraria.

Por el teorema de existencia y forma de la solución también se puede deducir que las series que forman a $y_{1}$ y $y_{2}$ convergen para $|x|< \infty$.

$\square$

Como dato interesante, la ecuación diferencial que acabamos de resolver es una forma de lo que se conoce como ecuación de Airy y se encuentra en el estudio de la difracción de la luz, la difracción de ondas de radio alrededor de la superficie de la tierra, la aerodinámica y la deflexión de una columna vertical delgada uniforme que se curva bajo su propio peso.

Realicemos un ejemplo más en el que los coeficientes de la ecuación no sean polinomios, esto nos permitirá poner en práctica la multiplicación de dos series de potencias.

Ejemplo: Resolver la ecuación diferencial

$$\dfrac{d^{2}y}{dx^{2}} + \cos (x) y = 0$$

respecto al punto ordinario $x_{0} = 0$.

Solución: Se puede comprobar que la función coseno es analítica en $x = 0$, esto verifica que efectivamente $x_{0} = 0$ es un punto ordinario. De hecho, al ser analítica en $x = 0$ su serie de Maclaurin es

\begin{align*}
\cos (x) &= 1 -\dfrac{x^2}{2!} + \dfrac{x^4}{4!} -\cdots + \dfrac{(-1)^kx^{2k}}{(2k)!} + \cdots \\
&= \sum_{n = 0}^{\infty} \dfrac{(-1)^nx^{2n}}{(2n)!}
\end{align*}

Resolvamos la ecuación. Consideremos la solución

$$y = \sum_{n = 0}^{\infty}c_{n}x^{n}$$

y su segunda derivada

$$\dfrac{d^{2}y}{dx^{2}} = \sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n -2}$$

Sustituyamos en la ecuación diferencial.

$$\dfrac{d^{2}y}{dx^{2}} + \cos (x) y = \sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n -2} + \left[ \sum_{n = 0}^{\infty} \dfrac{(-1)^nx^{2n}}{(2n)!} \right] \sum_{n = 0}^{\infty}c_{n}x^{n} = 0$$

En este caso no intentaremos reescribir la ecuación en una sola serie ya que puede ser más complicado al tratarse de un producto de series, en su lugar vamos a determinar el valor de los coeficientes de cada $x^{k}$, $k = 0, 1, 2, 3, \cdots$, realizando las operaciones correspondientes, para ello desglosemos las sumas para los primeros términos. Por un lado

$$\sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n -2} = 2c_{2} + 6c_{3}x + 12c_{4}x^{2} + 20c_{5}x^{3} + \cdots$$

Por otro lado,

$$\left[ \sum_{n = 0}^{\infty} \dfrac{(-1)^nx^{2n}}{(2n)!} \right] \sum_{n = 0}^{\infty}c_{n}x^{n} = \left( 1 -\dfrac{x^{2}}{2!} + \dfrac{x^{4}}{4!} + \cdots \right) \left( c_{0} + c_{1}x + c_{2}x^{2} + c_{3}x^{3} + \cdots \right)$$

Si se hacen las cuentas correspondientes podremos obtener los coeficientes de cada $x^{k}$, $k = 0, 1, 2, 3, \cdots$.

Hasta $k = 3$ se obtiene lo siguiente.

$$(2c_{2} + c_{0}) + (6c_{3} + c_{1})x +\left( 12c_{4} + c_{2} -\dfrac{1}{2}c_{0} \right) x^{2} + \left( 20c_{5} + c_{3} -\dfrac{1}{2}c_{1} \right)x^{3} + \cdots = 0$$

Igualamos cada coeficiente a cero.

\begin{align*}
2c_{2} + c_{0} &= 0 \\
6c_{3} + c_{1} &= 0 \\
12c_{4} + c_{2} -\dfrac{1}{2}c_{0} &= 0 \\
20c_{5} + c_{3} -\dfrac{1}{2}c_{1} &= 0 \\
&\vdots
\end{align*}

etcétera. Esto nos da como resultados

\begin{align*}
c_{2} &= -\dfrac{1}{2}c_{0} \\
c_{3} &= -\dfrac{1}{6}c_{1} \\
c_{4} &= \dfrac{1}{12}c_{0} \\
c_{5} &= \dfrac{1}{30}c_{1} \\
&\vdots
\end{align*}

En este caso no se obtuvo una relación de recurrencia, pero $c_{0}$ y $c_{1}$ siguen siendo coeficientes indeterminados que pueden tomar valores arbitrarios. Sustituyendo los valores determinados en la solución propuesta se obtiene

\begin{align*}
y(x) &= c_{0} + c_{1}x -\dfrac{c_{0}}{2}x^{2} -\dfrac{c_{1}}{6}x^{3} + \dfrac{c_{0}}{12}x^{4} + \dfrac{c_{1}}{30}x^{5} + \cdots \\
&= c_{0} \left[ 1 -\dfrac{1}{2}x^{2} + \dfrac{1}{12}x^{4} + \cdots \right] + c_{1}\left[ x -\dfrac{1}{6}x^{3} + \dfrac{1}{30}x^{5} + \cdots \right]
\end{align*}

Recordando que la solución general es

$$y(x) = c_{0}y_{1}(x) + c_{1}y_{2}(x)$$

entonces,

$$y_{1}(x) = 1 -\dfrac{1}{2}x^{2} + \dfrac{1}{12}x^{4} + \cdots$$

y

$$y_{2}(x) = x -\dfrac{1}{6}x^{3} + \dfrac{1}{30}x^{5} + \cdots$$

Ambas series de potencias convergen para $|x| < \infty$.

$\square$

Con esto concluimos esta entrada.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  1. Determinar el radio de convergencia y el intervalo de convergencia de las siguientes series de potencias.
  • $\sum_{n = 1}^{\infty}\dfrac{2^{n}}{n}x^{n}$
  • $\sum_{n = 1}^{\infty}\dfrac{n}{n + 2}x^{n}$
  • $\sum_{n = 1}^{\infty}\dfrac{(x -1)^{n}}{n!}$
  1. Reescribir la siguiente expresión como una sola serie de potencias cuyo término general tenga $x^{k}$.
  • $\sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n} + 2 \sum_{n = 2}^{\infty}n(n -1)c_{n}x^{n -2} + 3 \sum_{n = 1}^{\infty}nc_{n}x^{n}$
  1. Comprobar por sustitución directa que la siguiente serie de potencias es una solución particular de la ecuación diferencial dada.
  • $y(x) = \sum_{n = 0}^{\infty}\dfrac{(-1)^{n}}{2^{2n}(n!)^{2}}x^{2n}, \hspace{1cm} x\dfrac{d^{2}y}{dx^{2}} + \dfrac{dy}{dx} + xy = 0$
  1. Encontrar la solución general en series de potencias de las siguientes ecuaciones diferenciales respecto al punto ordinario $x_{0} = 0$.
  • $\dfrac{d^{2}y}{dx^{2}} + x^{2} \dfrac{dy}{dx} + xy = 0$
  • $\dfrac{d^{2}y}{dx^{2}} + \sin (x) y = 0$
  1. Usar el método de series de potencias para resolver el siguiente problema con valores iniciales.
  • $(x + 1) \dfrac{d^{2}y}{dx^{2}} -(2 -x) \dfrac{dy}{dx} + y = 0, \hspace{1cm} y(0) = 2, \hspace{0.5cm} y^{\prime}(0) = -1$

Más adelante…

En esta entrada aprendimos a resolver ecuaciones diferenciales de segundo orden con coeficientes variables respecto al punto ordinario $x_{0} = 0$.

En la siguiente entrada resolveremos ecuaciones diferenciales del mismo tipo, pero ahora con respecto a puntos singulares. El método de resolución es conocido como Método de Frobenius.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Ecuaciones Diferenciales I: Oscilaciones mecánicas

Por Omar González Franco

Las matemáticas comienzan a parecerse demasiado a resolver un puzzle. La física también,
pero son puzzles creados por la naturaleza, no por la mente del hombre.
– Maria Goeppert Mayer

Introducción

En esta entrada estudiaremos algunos tipos de oscilaciones mecánicas con el propósito de poner en práctica los métodos desarrollados hasta este momento de la segunda unidad.

Consideraremos varios sistemas dinámicos lineales en los que cada modelo matemático será una ecuación diferencial de segundo orden con coeficientes constantes acompañada de condiciones iniciales especificadas en un tiempo que tomaremos como $t = 0$.

$$a \dfrac{d^{2}x}{dt^{2}} + b \dfrac{dx}{dt} + cx = g(t); \hspace{1cm} x(0) = x_{0}, \hspace{0.5cm} x^{\prime}(0) = x_{1} \label{1} \tag{1}$$

Con respecto a la notación, denotaremos con $x$ a la variable dependiente que físicamente representará la posición de un objeto, mientras que $t$ será la variable independiente y representara al tiempo, ya que nuestro propósito es describir el movimiento oscilatorio de un objeto a través del tiempo.

A la función $g(x)$ de (\ref{1}) la llamaremos entrada o función forzada del sistema. Una solución $x(t)$ de (\ref{1}) en un intervalo $\delta$ que contiene a $t = 0$ y satisface las condiciones iniciales se le llama salida o respuesta del sistema.

El sistema dinámico que estudiaremos será el de resorte – objeto y los tipos de movimiento que describiremos será el movimiento libre no amortiguado, el movimiento libre amortiguado y el movimiento forzado.

Movimiento libre no amortiguado

Consideremos un resorte de longitud $l$ suspendido verticalmente de un soporte rígido y en la parte inferior del resorte se encuentra un objeto de masa $m$, el peso del objeto hace que el resorte se elongue una distancia $s$. En la posición de equilibrio establecemos que $x = 0$, tal como se muestra en la siguiente figura.

Resorte sin objeto y resorte con el objeto de masa $m$ en la posición de equilibrio.

Es claro que la cantidad de alargamiento o elongación del resorte depende de la masa, además el resorte mismo ejerce una fuerza restauradora $F$ opuesta a la dirección de elongación y proporcional a la cantidad de elongación $s$, esta característica corresponde a la ley de Hooke y matemáticamente se expresa como

$$F = ks \label{2} \tag{2}$$

donde $k$ es una constante de proporcionalidad llamada constante de resorte.

Una vez colocado el objeto de masa $m$, el resorte se alarga una distancia $s$ y mantiene una posición de equilibrio en el que el peso $W$ del objeto se equilibra con la fuerza restauradora $F$ del resorte. Recordando que el peso de un objeto es

$$W = mg \label{3} \tag{3}$$

con $m$ la masa del objeto y $g$ la aceleración de la gravedad, podemos establecer que en el equilibrio ocurre que

$$W = F \label{4} \tag{4}$$

o bien,

$$mg -ks = 0 \label{5} \tag{5}$$

Si el objeto se desplaza una cantidad $x$ de su posición de equilibrio, la fuerza restauradora del resorte será

$$F_{x} = k(s + x) \label{6} \tag{6}$$

Objeto en reposo y objeto en movimiento desplazado una distancia $x$.

Como estamos analizando un movimiento no amortiguado, vamos a suponer que no hay fuerzas restauradoras que actúen sobre el sistema y que el objeto oscila libre de otras fuerzas externas. Entonces podemos igualar la segunda ley de Newton con la fuerza resultante de la fuerza restauradora y el peso.

$$m \dfrac{d^{2}x}{dt^{2}} = -k(s + x)+ mg = -kx + mg -ks$$

Considerando (\ref{5}) obtenemos que

$$m \dfrac{d^{2}x}{dt^{2}} = -kx \label{7} \tag{7}$$

El signo negativo indica que la fuerza restauradora del resorte actúa en dirección opuesta a la dirección del movimiento, además se toma la convención de que la dirección hacia abajo de la posición de equilibrio es positiva.

Si dividimos entre $m$ la ecuación (\ref{7}) y reordenamos obtenemos la ecuación diferencial

$$\dfrac{d^{2}x}{dt^{2}} + \dfrac{k}{m}x = 0 \label{8} \tag{8}$$

Veremos más adelante la razón por la que es conveniente definir la constante

$$\omega^{2} = \dfrac{k}{m} \label{9} \tag{9}$$

Usando esta definición podemos escribir la ecuación (\ref{8}) como

$$\dfrac{d^{2}x}{dt^{2}} + \omega^{2}x = 0 \label{10} \tag{10}$$

La ecuación diferencial (\ref{10}) se dice que describe el movimiento armónico simple o movimiento libre no amortiguado. Dos condiciones iniciales claras son el desplazamiento inicial

$$x(0) = x_{0}$$

y la velocidad inicial

$$x^{\prime}(0) = x_{1}$$

del objeto. Por ejemplo, si $x_{0} > 0$, entonces indica que el objeto parte de un punto por debajo de la posición de equilibrio lo que provocará una velocidad impartida hacia arriba, es decir, $x_{1} < 0$. Cuando $x^{\prime}(0) = 0$ el objeto se libera a partir del reposo. Y si por ejemplo $x_{0} < 0$ y $x_{1} = 0$, entonces indica que el objeto se libera desde el reposo pero desde una posición arriba de la posición de equilibrio.

La ecuación (\ref{10}) representa el modelo matemático que describe el fenómeno, pero ahora estamos interesados en conocer la ecuación de movimiento, así que es momento de aplicar lo aprendido y resolver la ecuación diferencial.

Se trata de una ecuación diferencial de segundo orden con coeficientes constantes, así que proponemos una solución de la forma

$$x(t) = e^{rt} \label{11} \tag{11}$$

Utilizamos la letra $r$ y no $k$ para no confundirnos con la constante de resorte. Al sustituir esta solución y su segunda derivada en (\ref{10}) se obtiene la ecuación auxiliar

$$r^{2} + \omega^{2} = 0 \label{12} \tag{12}$$

Las raíces son

$$r_{1} = i \omega \hspace{1cm} y \hspace{1cm} r_{2} = -i \omega$$

Identificamos que $\alpha = 0$ y $\beta = \omega$, Por lo tanto, la solución general es

$$x(t) = c_{1} \cos(\omega t) + c_{2} \sin(\omega t) \label{13} \tag{13}$$

Esta solución corresponde a la ecuación general de movimiento del objeto sujeto al resorte considerando que no hay amortiguación.

Si se aplican las condiciones iniciales y se determinan las constantes $c_{1}$ y $c_{2}$, entonces habremos encontrado la ecuación de movimiento del sistema en particular. Notemos que la solución efectivamente describe un movimiento oscilatorio ya que se encuentran presentes las funciones seno y coseno.

La constante

$$\omega = \sqrt{\dfrac{k}{m}} \label{14} \tag{14}$$

se llama frecuencia circular del sistema y nos permite definir algunas cantidades. $\omega$ se mide en radianes por segundo.

La cantidad

$$T = \dfrac{2 \pi}{\omega} \label{15} \tag{15}$$

determina el periodo del movimiento descrito por (\ref{13}), es decir, representa el tiempo que tarda el objeto en hacer un ciclo de movimiento. Un ciclo es una oscilación completa del objeto. Podemos decir que el periodo $T$ es el tamaño del intervalo de tiempo entre dos máximos sucesivos (o mínimos sucesivos) de $x(t)$. De acuerdo a nuestra convención, un máximo es el desplazamiento positivo del objeto en el que alcanza su distancia máxima debajo de la posición de equilibrio, mientras que un mínimo es el desplazamiento negativo en el que alcanza su altura máxima arriba de la posición de equilibrio. En cualquier caso decimos que hay un desplazamiento extremo del objeto.

La cantidad

$$f = \dfrac{1}{T} = \dfrac{\omega}{2 \pi} \label{16} \tag{16}$$

es la frecuencia de movimiento y representa el número de ciclos completados cada segundo.

Existe una forma alterna de la solución (\ref{13}) en la que se hace explícita la amplitud $A$ de las oscilaciones. Si en la solución (\ref{13}) $c_{1} \neq 0$ y $c_{2} \neq 0$, se define la amplitud como

$$A = \sqrt{c^{2}_{1} + c^{2}_{2}} \label{17} \tag{17}$$

y se define el ángulo de fase $\phi$, tal que

$$\sin(\phi) = \dfrac{c_{1}}{A}, \hspace{1cm} \cos(\phi) = \dfrac{c_{2}}{A} \hspace{1cm} \Rightarrow \hspace{1cm} \tan(\phi) = \dfrac{c_{1}}{c_{2}} \label{18} \tag{18}$$

Notemos lo siguiente

\begin{align*}
x(t) &= c_{1} \cos(\omega t) + c_{2} \sin(\omega t) \\
&= A \dfrac{c_{1}}{A} \cos(\omega t) + A \dfrac{c_{2}}{A} \sin(\omega t) \\
&= [A \sin(\phi)] \cos(\omega t) + [A \cos(\phi)] \sin(\omega t) \\
&= A \sin(\omega t) \cos(\phi) + A \cos(\omega t) \sin(\phi)
\end{align*}

Si en la última expresión aplicamos la identidad trigonométrica

$$\sin(a + b) = \sin(a) \cos(b) + \cos(a) \sin(b) \label{19} \tag{19}$$

entonces obtenemos la solución (\ref{13}) en una forma alterna más simple.

$$x(t) = A \sin(\omega t + \phi) \label{20} \tag{20}$$

En resumen, la ecuación que describe el movimiento armónico simple o movimiento libre no amortiguado es

$$\dfrac{d^{2}x}{dt^{2}} + \omega^{2}x = 0$$

Y las soluciones que representan el movimiento del objeto son

$$x(t) = c_{1} \cos(\omega t) + c_{2} \sin(\omega t)$$

o bien,

$$x(t) = A \sin(\omega t + \phi)$$

Movimiento libre amortiguado

Es claro que el movimiento libre no amortiguado es un movimiento ideal, pues el movimiento descrito por (\ref{13}) o (\ref{20}) supone que no hay fuerzas retardadoras actuando sobre el objeto y sabemos que, a menos que el objeto este suspendido en un vacío perfecto, siempre habrá por lo menos una fuerza de resistencia debido al medio circundante, por ejemplo la resistencia del aire.

El propósito ahora, al igual que antes, es determinar la ecuación diferencial o modelo matemático que describe al sistema cuando existen fuerzas de amortiguamiento, para posteriormente determinar la ecuación general de movimiento.

Consideremos nuevamente un objeto de masa $m$ suspendido sobre un resorte con constante $k$, pero en esta ocasión consideremos que existe una fuerza externa de amortiguamiento actuando sobre el objeto. En el estudio de la mecánica, las fuerzas de amortiguamiento que actúan sobre un cuerpo se consideran proporcionales a una potencia de la velocidad instantánea $\dfrac{dx}{dt}$. En nuestro caso supondremos que la fuerza de amortiguamiento esta dada por un múltiplo constante de la velocidad, esto es

$$F_{am} = \eta \dfrac{dx}{dt} \label{21} \tag{21}$$

donde $\eta$ es una constante de amortiguamiento positiva. De esta manera, cuando ninguna otra fuerza actúa sobre el sistema, de la segunda ley de Newton se tiene que

$$m \dfrac{d^{2}x}{dt^{2}} = -kx -\eta \dfrac{dx}{dt} \label{22} \tag{22}$$

El signo negativo en la fuerza de amortiguamiento indica que dicha fuerza actúa en dirección opuesta al movimiento.

Si dividimos la ecuación diferencial (\ref{22}) por $m$ y reordenamos, obtenemos

$$\dfrac{d^{2}x}{dt^{2}} + \dfrac{\eta}{m} \dfrac{dx}{dt} + \dfrac{k}{m}x = 0 \label{23} \tag{23}$$

Recordemos que

$$\omega^{2} = \dfrac{k}{m}$$

y por convención definimos

$$2\rho = \dfrac{\eta}{m} \label{24} \tag{24}$$

Así podemos reescribir la ecuación (\ref{23}) como

$$\dfrac{d^{2}x}{dt^{2}} + 2 \rho \dfrac{dx}{dt} + \omega^{2} x = 0 \label{25} \tag{25}$$

Esta ecuación corresponde al modelo matemático que describe al fenómeno. La utilidad de $2\rho$ se hace evidente al momento de intentar resolver la ecuación, pues si se considera la solución

$$x(x) = e^{rt}$$

y se sustituye en la ecuación (\ref{25}) junto con las derivadas correspondientes se obtiene la ecuación auxiliar

$$r^{2} + 2\rho r + \omega^{2} = 0 \label{26} \tag{26}$$

De donde se obtienen las siguientes dos raíces.

$$r_{1} = -\rho + \sqrt{\rho^{2} -\omega^{2}} \hspace{1cm} y \hspace{1cm} r_{2} = -\rho -\sqrt{\rho^{2} -\omega^{2}} \label{27} \tag{27}$$

Hay tres casos posibles dependiendo del valor del discriminante

$$\Delta = \rho^{2} -\omega^{2} \label{28} \tag{28}$$

Estudiemos cada caso.

Caso 1: $\rho^{2} -\omega^{2} > 0$

En este caso decimos que el sistema se encuentra sobreamortiguado porque el coeficiente de amortiguamiento $\rho$ es más grande que la constante del resorte $k$. Como las raíces son reales y distintas, la solución de la ecuación (\ref{25}), en este caso, es

$$x(t) = c_{1} e^{r_{1}t} + c_{2} e^{r_{2}t}$$

Si sustituimos los valores de (\ref{27}) podemos reescribir la solución como

$$x(t) = e^{-\rho t} \left( c_{1} e^{\sqrt{\rho^{2} -\omega^{2}}t} + c_{2} e^{ -\sqrt{\rho^{2} -\omega^{2}}t} \right) \label{29} \tag{29}$$

Esta ecuación representa un movimiento uniforme y no oscilatorio.

Caso 2: $\rho^{2} -\omega^{2} = 0$

En este caso cualquier ligera disminución en la fuerza de amortiguamiento daría como resultado un movimiento oscilatorio, decimos que el sistema está críticamente amortiguado. Como las raíces son reales e iguales, la solución de la ecuación (\ref{25}) es

$$x(t) = c_{1} e^{r_{1}t} + c_{2}t e^{r_{1}t}$$

Si sustituimos $r_{1} = -\rho$, la solución se puede reescribir como

$$x(t) = e^{-\rho t} \left( c_{1} + c_{2}t \right) \label{30} \tag{30}$$

Caso 3: $\rho^{2} -\omega^{2} < 0$

En este caso se dice que el sistema esta subamortiguado ya que el coeficiente de amortiguamiento es más pequeño que la constante del resorte. Las raíces son complejas y están dadas de la siguiente forma

$$r_{1} = -\rho + i\sqrt{\omega^{2} -\rho^{2}} \hspace{1cm} y \hspace{1cm} r_{2} = -\rho -i\sqrt{\omega^{2} -\rho^{2}} \label{31} \tag{31}$$

Identificamos que

$$\alpha = -\rho \hspace{1cm} y \hspace{1cm} \beta = \sqrt{\omega^{2} -\rho^{2}}$$

Entonces la solución está dada por

$$x(t) = e^{-\rho t} \left[ c_{1} \cos \left( \sqrt{\omega^{2} -\rho^{2}}t \right) + c_{2} \sin \left( \sqrt{\omega^{2} -\rho^{2}}t \right) \right] \label{32} \tag{32}$$

El movimiento descrito por (\ref{32}) es oscilatorio, pero debido al coeficiente $e^{-\rho t}$ las amplitudes de oscilación tienden a cero cuando $t \rightarrow \infty$.

En todos los casos la solución contiene el factor de amortiguamiento $e^{-\rho t}$, $\rho > 0$, lo que indica que los desplazamientos del objeto se vuelven despreciables conforme el tiempo $t$ aumenta.

De manera totalmente análoga que en el caso sin amortiguamiento, cualquier solución de la forma (\ref{32}) se puede escribir de forma alterna como

$$x(t) = Ae^{-\rho t} \sin \left( \sqrt{\omega^{2} -\rho^{2}} t + \phi \right) \label{33} \tag{33}$$

donde $A$ es la amplitud de las oscilaciones y el ángulo de fase $\phi$ se determina de las ecuaciones de (\ref{18}). El coeficiente $Ae^{-\rho t}$ se denomina amplitud amortiguada de oscilaciones y debido a que (\ref{33}) no es una función periódica, el número

$$T_{c} = \dfrac{2 \pi}{\sqrt{\omega^{2} -\rho^{2}}} \label{34} \tag{34}$$

se llama cuasi periodo y es el intervalo de tiempo entre dos máximos sucesivos de $x(t)$, así mismo, el número

$$f_{c} = \dfrac{\sqrt{\omega^{2} -\rho^{2}}}{2 \pi} \label{35} \tag{35}$$

se llama cuasi frecuencia.

En resumen, la ecuación que describe el movimiento libre amortiguado es

$$\dfrac{d^{2}x}{dt^{2}} + 2 \rho \dfrac{dx}{dt} + \omega^{2} x = 0$$

Y las soluciones que representan el movimiento del objeto, dependiendo del valor del discriminante de la ecuación auxiliar, son

  • Si $\rho^{2} -\omega^{2} > 0 \hspace{1cm} \rightarrow \hspace{1cm} x(t) = e^{-\rho t} \left( c_{1} e^{\sqrt{\rho^{2} -\omega^{2}}t} + c_{2} e^{ -\sqrt{\rho^{2} -\omega^{2}}t} \right)$
  • Si $\rho^{2} -\omega^{2} = 0 \hspace{1cm} \rightarrow \hspace{1cm} x(t) = e^{-\rho t} \left( c_{1} + c_{2}t \right)$
  • Si $\rho^{2} -\omega^{2} < 0 \hspace{1cm} \rightarrow \hspace{1cm} x(t) = Ae^{-\rho t} \sin \left( \sqrt{\omega^{2} -\rho^{2}} t + \phi \right)$

Movimiento forzado

Imaginemos que ahora, adicional a las situaciones anteriores, se ejerce una fuerza externa sobre el soporte del resorte. En los dos casos anteriores considerábamos al soporte fijo, pero en esta ocasión pensamos en una fuerza motriz que causa un movimiento vertical oscilatorio del soporte del resorte. Sea $F_{ext}(t)$ dicha fuerza externa, usando la segunda ley de Newton, la ecuación diferencial queda de la siguiente forma.

$$m \dfrac{d^{2}x}{dt^{2}} = -kx -\eta \dfrac{dx}{dt} + F_{ext}(t) \label{36} \tag{36}$$

Si dividimos la ecuación por $m$ y definimos

$$g(t) = \dfrac{F_{ext}(t)}{m} \label{37} \tag{37}$$

además de considerar las definiciones anteriores (\ref{9}) y (\ref{24}), podemos escribir la ecuación diferencial como

$$\dfrac{d^{2}x}{dt^{2}} + 2\rho \dfrac{dx}{dt} + \omega^{2}x = g(t) \label{38} \tag{38}$$

La ecuación (\ref{38}) representa el modelo matemático que describe al sistema con movimiento forzado. Esta ecuación es no homogénea, de manera que puede resolverse usando el método de coeficientes indeterminados o el de variación de parámetros.

Cuando $g$ es una función periódica, como

$$g(t) = g_{0} \sin(\lambda t) \hspace{1cm} o \hspace{1cm} g(t) = g_{0} \cos(\lambda t)$$

con $\lambda$ una constante, la solución general de (\ref{38}) para $\rho > 0$ es la suma de una función no periódica $x_{np}(t)$ (solución complementaria o solución de la ecuación homogénea asociada) y una función periódica $x_{p}(t)$ (solución particular de la ecuación no homogénea), en la que $x_{np}(t)$ se desvanece a medida que el tiempo incrementa, es decir,

$$\lim_{t \to \infty} x_{np}(t) = 0 \label{39} \tag{39}$$

Esta propiedad nos indica que para valores grandes de tiempo, los desplazamientos del objeto se aproximan mediante la solución particular $x_{p}(t)$.

La función complementaria $x_{np}(t)$ se denomina término transitorio o solución transitoria, mientras que la solución particular $x_{p}(t)$ se denomina término de estado estable o solución de estado estable.

Realicemos un ejemplo en el que apliquemos cada caso

Ejemplo: Considerar un resorte sujeto de manera vertical a un soporte. El resorte se estira $50 cm$ al aplicarle una fuerza de $4N$. En la parte inferior del resorte se coloca un objeto con peso de $19.6 N$. Al objeto se le aleja de su posición de equilibrio jalándolo $1 m$ hacia abajo, si se suelta sin aplicarle una velocidad inicial, estudiar el movimiento del objeto en los siguientes casos:

  • No hay resistencia del aire (movimiento libre no amortiguado).
  • Hay resistencia del aire y es de $F_{am} = 8\dfrac{dx}{dt}$ (movimiento libre amortiguado).
  • Además de la resistencia del aire, hay una fuerza aplicada al soporte de $F_{ext}(t) = 80\sin(2t)$ (movimiento forzado).

Solución: El peso del objeto es

$$W = 19.6 N$$

entonces su masa es

$$m = \dfrac{W}{g} = \dfrac{19.6}{9.8}$$

Es decir, $m = 2 kg$. Por otro lado, si el resorte se estira

$$s = 0.5 m$$

aplicando una fuerza de

$$F = 4N$$

por la ley de Hooke tenemos que la constante del resorte es

$$k = \dfrac{F}{s} = \dfrac{4}{0.5}$$

Es decir, $k = 8 N/m$. Las condiciones iniciales son $x(0) = 1$ (posición fuera de la posición de equilibrio) y $x^{\prime}(0) = 0$ (sin velocidad inicial).

Para la primera situación sabemos que

$$F_{am} = 0 \hspace{1cm} y \hspace{1cm} F_{ext} = 0$$

De manera que la ecuación que describe al sistema es (\ref{10}) con

$$\omega^{2} = \dfrac{k}{m} = \dfrac{8}{2} = 4$$

Así, la ecuación a resolver es

$$\dfrac{d^{2}x}{dt^{2}} + 4x = 0$$

La ecuación auxiliar es

$$r^{2} + 4 = 0$$

Las raíces son $r_{1} = i2$ y $r_{2} = -i2$. Identificamos que $\alpha = 0$ y $\beta = 2$. Por lo tanto, la solución general es

$$x(t) = c_{1} \cos(2t) + c_{2} \sin(2t)$$

Para aplicar las condiciones iniciales debemos conocer la expresión de la primera derivada de la solución, dicha expresión es

$$\dfrac{dx}{dt} = -2c_{1} \sin(2t) + 2c_{2} \cos(2t)$$

Aplicando las condiciones iniciales, tenemos

$$x(0) = c_{1} = 1 \hspace{1cm} y \hspace{1cm} x^{\prime}(0) = 2c_{2} = 0$$

De donde $c_{1} = 1$ y $c_{2} = 0$. Por lo tanto, la ecuación de movimiento es

$$x(t) = \cos(2t)$$

Esta solución representa un movimiento armónico de amplitud

$$A = 1 m$$

periodo

$$T = \dfrac{2 \pi}{2} = \pi seg$$

y frecuencia

$$f = \dfrac{1}{\pi } = 0.318 \dfrac{ciclos}{segundo}$$

A continuación se muestra una gráfica con el movimiento descrito por el objeto.

Función de movimiento del objeto.

De la gráfica observamos que el objeto siempre se mantendrá oscilando de la misma manera para $t \to \infty$ y tiene sentido ya que no existe ninguna fuerza exterior que lo amortigüe.

Consideremos ahora la resistencia del aire

$$F_{am} = 8 \dfrac{dx}{dt}$$

En este caso la ecuación a resolver es de la forma (\ref{22}) y es

$$m \dfrac{d^{2}x}{dt^{2}} + kx + 8\dfrac{dx}{dt} = 0$$

que adaptando a nuestros datos se tiene

$$\dfrac{d^{2}x}{dt^{2}} + 4 \dfrac{dx}{dt} + 4x = 0$$

La ecuación auxiliar es

$$r^{2} + 4r + 4 = 0$$

Las raíces son $r_{1} = r_{2}= -2$, como son iguales, entonces la solución es de la forma

$$x(t) = e^{-2t}(c_{1} + c_{2}t)$$

La derivada es

$$\dfrac{dx}{dt} = -2e^{-2t}(c_{1} + c_{2}t) + c_{2}e^{-2t}$$

Apliquemos las condiciones iniciales.

$$x(0) = c_{1} = 1 \hspace{1cm} y \hspace{1cm} x^{\prime}(0) = -2c_{1} + c_{2} = 0$$

de donde obtenemos que $c_{1} = 1$ y $c_{2} = 2$. Por lo tanto, la ecuación de movimiento es

$$x(t) = e^{-2t}(1 + 2t)$$

El factor de amortiguamiento es $e^{-2t}$.

A continuación se muestra una gráfica con el movimiento descrito por el objeto.

Función de movimiento del objeto.

De la gráfica observamos que no hay movimiento oscilatorio, sino que el objeto llega a la posición de equilibrio y se mantiene, esto se debe al factor de amortiguamiento.

Para la situación final tenemos un movimiento forzado con una fuerza externa

$$F_{ext}(t) = 80 \sin(2t)$$

La ecuación diferencial que tenemos en este caso es

$$m \dfrac{d^{2}x}{dt^{2}} = -kx -8 \dfrac{dx}{dt} + 80 \sin(2t)$$

o bien

$$\dfrac{d^{2}x}{dt^{2}} + 4 \dfrac{dx}{dt} + 4x = 40 \sin(2t)$$

La solución de la ecuación homogénea ya la conocemos, ya que corresponde a la solución transitoria obtenida anteriormente.

$$x_{np}(t) = e^{-2t}(c_{1} + c_{2}t)$$

Para el caso no homogéneo se puede aplicar variación de parámetros o coeficientes indeterminados, apliquemos el segundo método.

Estamos en condiciones del punto 3. Proponemos una solución de la forma

$$x(t) = A \cos(2t) + B \sin(2t)$$

La primera y segunda derivada están dadas de la siguiente forma.

$$\dfrac{dx}{dt} = -2A \sin(2t) + 2B \cos(2t) \hspace{1cm} y \hspace{1cm} \dfrac{d^{2}x}{dt^{2}} = -4A \cos(2t) -4B \sin(2t)$$

Sustituimos en la ecuación diferencial.

\begin{align*}
\left[ -4A \cos(2t) -4B \sin(2B) \right] &+ 4 \left[ -2A \sin(2t) + 2B \cos(2t) \right] + 4 \left[ A \cos(2t) + B \sin(2t) \right] \\
&= 40 \sin(2t)
\end{align*}

\begin{align*}
-8A \sin(2t) + 8B \cos(2t) &= 40 \sin(2t) \\
-A \sin(2t) + B \cos(2t) &= 5 \sin(2t)
\end{align*}

Para que se cumpla la igualdad debe ocurrir que $A = -5$ y $B = 0$, entonces la solución de estado estable es

$$x_{p}(t) = -5 \cos(2t)$$

Por lo tanto, la solución general es

$$x(t) = x_{np}(t) + x_{p}(t) = e^{-2t}(c_{1} + c_{2}t) -5 \cos(2t)$$

Vemos que

$$\dfrac{dx}{dt} = -2e^{-2t}(c_{1} + c_{2}t) + c_{2}e^{-2t} + 10 \sin(2t)$$

Apliquemos las condiciones iniciales.

$$x(0) = c_{1} -5 = 1 \hspace{1cm} y \hspace{1cm} x^{\prime}(0) = -2c_{1} + c_{2} = 0$$

de donde $c_{1} = 6$ y $c_{2} = 12$. Entonces la ecuación de movimiento es

$$x(t) = e^{-2t}(6 + 12t) -5 \cos(2t)$$

A continuación se muestra una gráfica con el movimiento descrito por el objeto.

Función de movimiento del objeto.

Inicialmente el resorte sufre un estiramiento muy grande generando un movimiento transitorio y procede a amortiguarse hasta llegar al equilibrio entre la fuerza externa y la fuerza amortiguadora describiendo un movimiento estable.

La parte $e^{-2t}(6 + 12t)$ representa el movimiento transitorio, mientras que $-5 \cos(2t)$ representa el movimiento estable.

También se puede observar que las amplitudes (el estiramiento del resorte) son bastante grandes comparado con las dos situaciones anteriores.

$\square$

Resonancia

Resolvamos un problema de valores iniciales que nos permitirá definir el concepto de resonancia.

Resolver la ecuación

$$\dfrac{d^{2}x}{dt^{2}} + \omega^{2}x = g_{0} \sin(\lambda t) \label{40} \tag{40}$$

donde $g_{0}$ y $\lambda \neq \omega$ son constantes y los valores iniciales son $x(0) = 0$ y $x^{\prime}(0) = 0$.

Solución: Resolviendo la ecuación homogénea puedes verificar que la solución complementaria es

$$x_{c}(t) = c_{1} \cos(\omega t) + c_{2} \sin(\omega t) \label{41} \tag{41}$$

Para obtener una solución particular proponemos una solución de la forma

$$x_{p}(t) = A \cos(\lambda t) + B \sin(\lambda t)$$

y aplicamos el método de coeficientes indeterminados. Vemos que

$$\dfrac{dx_{p}}{dt} = -A \lambda \sin(\lambda t) + B \lambda \cos(\lambda t) \hspace{1cm} y \hspace{1cm} \dfrac{d^{2}x_{p}}{dt^{2}} = -A \lambda^{2} \cos(\lambda t) -B \lambda^{2} \sin(\lambda t)$$

Sustituyamos en la ecuación diferencial.

\begin{align*}
\left[ -A \lambda^{2} \cos(\lambda t) -B \lambda^{2} \sin(\lambda t) \right] &+ \omega^{2} \left[A \cos(\lambda t) + B \sin(\lambda t) \right] \\
&= A (\omega^{2} -\lambda^{2}) \cos(\lambda t) + B (\omega^{2} -\lambda^{2}) \sin(\lambda t) \\
&= g_{0} \sin(\lambda t)
\end{align*}

Es claro que para que se cumpla la igualdad se debe satisfacer que

$$A = 0 \hspace{1cm} y \hspace{1cm} B = \dfrac{g_{0}}{\omega^{2} -\lambda^{2}}$$

Por tanto, la solución particular es

$$x_{p}(t) = \dfrac{g_{0}}{\omega^{2} -\lambda^{2}} \sin(\lambda t) \label{42} \tag{42}$$

Y la solución general es

$$x(t) = c_{1} \cos(\omega t) + c_{2} \sin(\omega t) + \dfrac{g_{0}}{\omega^{2} -\lambda^{2}} \sin(\lambda t) \label{43} \tag{43}$$

Verifica que aplicando las condiciones iniciales se obtiene que

$c_{1} = 0 \hspace{1cm} y \hspace{1cm} c_{2} = -\dfrac{\lambda g_{0}}{\omega (\omega^{2} -\lambda^{2})}$

Por lo tanto, para $\lambda \neq \omega$, la solución es

$$x(t) = \dfrac{g_{0}}{\omega (\omega^{2} -\lambda^{2})} \left[-\lambda \sin(\omega t) + \omega \sin(\lambda t) \right] \label{44} \tag{44}$$

Este resultado no esta definido para $\lambda = \omega$, sin embargo podemos obtener su valor límite conforme $\lambda \rightarrow \omega$, esto produciría en (\ref{44}) un incremento de forma sustancial de las amplitudes de oscilación.

Para $\lambda = \omega$ se define la solución como el límite $\lambda \to \omega$ de la ecuación (\ref{44}).

$$x(t) = \lim_{\lambda \to \omega} g_{0} \dfrac{-\lambda \sin(\omega t) + \omega \sin(\lambda t)}{\omega (\omega^{2} -\lambda^{2})} \label{45} \tag{45}$$

Para resolver el límite apliquemos la regla de L´Hôpital.

La derivada del numerador con respecto a $\lambda$ es

$$\dfrac{d}{d \lambda} \left[ -\lambda \sin(\omega t) + \omega \sin(\lambda t) \right] = -\sin(\omega t) + t \omega \cos(\lambda t)$$

Y la derivada del denominador con respecto a $\lambda$ es

$$\dfrac{d}{d \lambda} \left[ \omega^{3} -\omega \lambda^{2} \right] = -2 \omega \lambda$$

Sustituyendo en el límite (\ref{45}) obtenemos

\begin{align*}
x(t) &= g_{0} \lim_{\lambda \to \omega} \dfrac{-\sin(\omega t) + t \omega \cos(\lambda t)}{-2 \omega \lambda} \\
&= g_{0} \dfrac{-\sin(\omega t) + t \omega \cos(\omega t)}{-2 \omega^{2}} \\
&= \dfrac{g_{0}}{2 \omega^{2}} \sin(\omega t) -\dfrac{g_{0}}{2 \omega}t \cos(\omega t)
\end{align*}

Por lo tanto, para $\lambda = \omega$ la solución es

$$x(t) = \dfrac{g_{0}}{2 \omega^{2}} \left[ \sin(\omega t) -t \omega \cos(\omega t) \right] \label{46} \tag{46}$$


Conforme $t \to \infty$ los desplazamientos del objeto se vuelven más largos, de hecho, $|x(t_{n})| \to \infty$ cuando $t_{n} = \dfrac{n \pi}{\omega}$ para $n = 1, 2, 3, \cdots$.

Este fenómeno se conoce como resonancia pura.

Una gráfica que muestra el comportamiento de (\ref{46}) es la siguiente.

Resonancia pura.

No profundizaremos más en el concepto de resonancia, pero cabe mencionar que la resonancia pura es una situación ideal, pues físicamente las oscilaciones grandes del objeto forzarían en algún momento al resorte más allá de su límite elástico, además en el desarrollo realizado no se han toman en cuenta efectos retardadores de las fuerzas de amortiguamiento que siempre están presentes.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

Resolver los siguientes problemas:

  1. Un resorte cuelga verticalmente; su extremo superior está fijo y del inferior pende una caja que pesa $196 N$. Una vez en equilibrio se tira de la caja hacia abajo haciéndola desplazar $0.25 m$ y se suelta. Sabiendo que $k = 80 N/m$ y que la resistencia del aire es despreciable, hallar:
  • La ecuación de movimiento de la caja.
  • El tiempo necesario para que la caja se mueva desde la posición inicial hasta $0.0625 m$ por debajo de la posición de equilibrio.
  1. Una masa de $98 N$ de peso se cuelga de un resorte con lo que éste interrumpe su estado de reposo. Sabiendo que $k = 4.9 N/m$, hallar el movimiento de la masa si al soporte del resorte se le imprime una fuerza $F_{ext}(t) = \sin(\sqrt{2g}t)$.
  1. Se suspende una masa de $10 kg$ de un resorte, el cual se alarga $0.6533 m$. La masa se pone en movimiento desde la posición de equilibrio con una velocidad inicial $1 m/s$, dirigida hacia arriba. Hallar el movimiento resultante si la fuerza debida al aire es $F_{am} = 80 \dfrac{dx}{dt}$.
  1. De un resorte que tiene una constante $k = 50$ se suspende un peso de $49 N$. El peso se pone en movimiento desde el reposo estirándolo $0.98 m$ hacia abajo de la posición de equilibrio y aplicando una fuerza externa $F_{ext}(t) = 10\sin(2t)$. Si no hay resistencia del aire, hallar el movimiento del peso.
  1. Se cuelga de un resorte una masa de $2 kg$, de tal manera que el resorte se alarga $0.6125 m$. A esta masa se le aleja de su posición de equilibrio jalándola $1 m$ hacia arriba y se suelta. Hallar el movimiento resultante de la masa sabiendo que hay una resistencia del aire de $F_{am} = 16 \dfrac{dx}{dt}$.

Más adelante…

Es momento de estudiar el caso en el que los coeficientes no son constantes, es decir, estudiaremos ecuaciones diferenciales de la forma

$$a(x) \dfrac{d^{2}y}{dx^{2}} + b(x) \dfrac{dy}{dx} + c(x) = g(x)$$

Donde $a(x)$, $b(x)$ y $c(x)$ son funciones de la variable independiente $x$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»