En las entradas anteriores demostramos que para cualquier matriz nilpotente existe (y es única) una matriz similar muy sencilla, hecha por lo que llamamos bloques de Jordan de eigenvalor cero. Lo que haremos ahora es mostrar una versión análoga de este resultado para una familia mucho más grande de matrices. De hecho, en cierto sentido tendremos un resultado análogo para todas las matrices.
Pensando en ello, lo que haremos en esta entrada es lo siguiente. Primero, generalizaremos nuestra noción de bloques de Jordan para contemplar cualquier eigenvalor. Estudiaremos un poco de los bloques de Jordan. Luego, enunciaremos el teorema que esperamos probar. Finalmente, daremos el primer paso hacia su demostración. En la siguiente entrada terminaremos la demostración y hablaremos de aspectos prácticos para encontrar formas canónicas de Jordan.
Enunciado del teorema de la forma canónica de Jordan
A continuación definimos a los bloques de Jordan para cualquier eigenvalor y tamaño.
Definición. Sea un campo. El bloque de Jordan de eigenvalor y tamaño es la matriz en cuyas entradas son todas , a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, con
También podemos expresarlo de la siguiente manera:
en donde estamos pensando que la matriz es de .
Una última manera en la que nos convendrá pensar a es en términos de los bloques de Jordan de eigenvalor cero: .
Definición. Una matriz de bloques de Jordan en es una matriz diagonal por bloques en la que cada bloque en la diagonal es un bloque de Jordan.
Lo que nos gustaría demostrar es el siguiente resultado. En él, piensa en como algún orden total fijo de (para es el orden usual, pero otros campos no necesariamente tienen un orden natural asociado).
Teorema. Sea un espacio vectorial de dimensión finita sobre el campo y una transformación lineal tal que se divide sobre . Entonces, existen únicos valores en y únicos enteros tales que para los cuales existe una base de en la cual tiene como forma matricial a la siguiente matriz de bloques de Jordan:
Por supuesto, este teorema también tiene una versión matricial, la cuál tendrás que pensar cómo escribir.
Un teorema de descomposición de kernels
Ya tenemos uno de los ingredientes que necesitamos para dar la demostración de la existencia de la forma canónica de Jordan: su existencia para las transformaciones nilpotentes. Otro de los ingredientes que usaremos es el teorema de Cayley-Hamilton. El tercer ingrediente es un resultado de descoposición de kernels de transformaciones evaluadas en polinomios.
Proposición. Sea un espacio vectorial sobre . Sea una transformación lineal. Y sean polinomios en cuyo máximo común divisor de cualesquiera dos de ellos es el polinomio . Entonces,
Demostración. Para cada consideraremos a como el polinomio que se obtiene de multiplicar a todos los polinomios dados, excepto . Y por comodidad, escribiremos . Notemos que entonces para cualquier .
Primero probaremos un resultado polinomial auxiliar. Veremos que tienen como máximo común divisor al polinomio . En caso de no ser así, un polinomio no constante dividiría a todos ellos. Sin pérdida de generalidad, es irreducible (tomando, por ejemplo de grado mínimo con esta propiedad). Como es irreducible y divide a , entonces debe dividir a alguno de los factores de , que sin pérdida de generalidad (por ejemplo, reetiquetando), es . Pero también divide a , así que debe dividir a alguno de sus factores , sin pérdida de generalidad a . Pero entonces divide a y , lo cual contradice las hipótesis. Así, tienen como máximo común divisor al polinomio . Por el lema de Bézout para polinomios (ver tarea moral), existen entonces polinomios tales que
Estamos listos para pasar a los argumentos de álgebra lineal. Veamos primero que cualquier elemento en la suma de la derecha está en el kernel de . Tomemos con . Al aplicar obtenemos
Esto muestra que , de donde se obtiene la primera contención que nos interesa.
Veamos ahora la segunda contención, que . Tomemos . Al aplicar en y evaluar en obtenemos que
Pero esto justo expresa a como elemento de pues para cada tenemos
de modo que expresamos a como suma de vectores en .
Ya demostramos la igualdad de conjuntos, pero recordemos que en la igualdad de suma directa hay otra cosa que hay que probar: que el cero tiene una forma única de expresarse como suma de elementos de cada subespacio (aquella en donde cada elemento es cero). Supongamos entonces que con para cada . Si aplicamos en esta igualdad, como tiene todos los factores con obtenemos
Por otro lado, al aplicar nuevamente en y evaluar en
De esta forma, en efecto tenemos que los espacios están en posición de suma directa, que era lo último que nos faltaba verificar.
Existencia de la forma canónica de Jordan
Estamos listos para demostrar la existencia de la forma canónica de Jordan. Supongamos que es un espacio vectorial de dimensión finita sobre y que es una transformación lineal cuyo polinomio característico se divide en . Sabemos entonces que es de la siguiente forma:
donde son eigenvalores distintos de y son las multiplicidades algebraicas respectivas de estos eigenvalores como raíces de .
Por el teorema de Cayley-Hamilton, sabemos que , de modo que . Por la proposición de descomposición de la sección anterior aplicada a los polinomios (verifica que son primos relativos dos a dos) para tenemos entonces que
Pero, ¿cómo es la transformación restringida a cada ? ¡Es nilpotente! Precisamente por construcción, se anula totalmente en este kernel. Así, por la existencia de la forma canónica de Jordan para matrices nilpotentes, hay una base para cada tal que restringida a ese kernel tiene como forma matricial una matriz de bloques de Jordan de eigenvalor cero. Pero entonces (restringida a dicho kernel) tiene como forma matricial a , que es una matriz de bloques de Jordan de eigenvalor .
Con esto terminamos: como es la suma directa de todos esos kernel, la unión de bases es una base para la cual tiene como forma matricial a una matriz de bloques de Jordan.
Más adelante…
Hemos demostrado la existencia de la forma canónica de Jordan, pero aún nos falta demostrar su unicidad. Además de esto, también necesitaremos un mejor procedimiento para encontrarla. Haremos eso en la siguiente entrada.
Tarea moral
Enuncia el teorema de la forma canónica de Jordan versión matrices.
Investiga más sobre el lema de Bézout para polinomios y cómo se demuestra. Después de esto, expresa al polinomio como combinación lineal de los polinomios .
Verifica que los polinomios de la demostración de la existencia de la forma canónica de Jordan cumplen las hipótesis de la proposición de descomposición de kernels.
Sea un campo y elementos en . Sea un entero. Demuestra que los bloques de Jordan y en conmutan.
Siguiendo las ideas de la demostración de existencia, encuentra la forma canónica de Jordan de la matriz
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»
En la entrada anterior estudiamos de manera un poco más sistemática las matrices y transformaciones lineales nilpotentes. Lo que haremos ahora es enunciar el teorema de la forma canónica de Jordan para matrices nilpotentes. Este es un teorema de existencia y unicidad. En esta entrada demostraremos la parte de la existencia. En la siguiente entrada hablaremos de la unicidad y de cómo encontrar la forma canónica de Jordan de matrices nilpotentes de manera práctica.
El teorema de Jordan para nilpotentes
El teorema que queremos demostrar tiene dos versiones: la de transformaciones y la matricial. La versión en transformaciones dice lo siguiente.
Teorema. Sea un espacio vectorial de dimensión finita y una transformación lineal nilpotente. Entonces existen únicos enteros tales que y para los cuales existe una base de en la cual tiene como forma matricial a la siguiente matriz de bloques:
La versión en forma matricial dice lo siguiente.
Teorema. Sea una matriz nilpotente en . Entonces existen únicos enteros tales que y para los cuales es similar a la siguiente matriz de bloques:
A esta matriz de bloques (ya sea para una transformación, o para una matriz) le llamamos la forma canónica de Jordan de .
En vista de que dos matrices son similares si y sólo si representan a la misma transformación lineal en distintas bases, entonces ambos teoremas son totalmente equivalentes. Así, basta enfocarnos en demostrar una de las versiones. Haremos esto con la versión para transformaciones lineales.
Trasnformaciones nilpotentes y unos vectores linealmente independientes
En esta sección enunciaremos un primer resultado auxiliar para demostrar la existencia de la forma canónica de Jordan. Veremos que a partir de una transformación lineal nilpotente podemos obtener algunos vectores linealmente independientes.
Proposición. Sea un espacio vectorial de dimensión finita y una transformación lineal de índice . Sea un vector tal que , el cual existe ya que no es la transformación lineal cero. Entonces:
Los vectores , , , son linealmente independientes.
El subespacio que generan es de dimensión y es estable bajo .
La transformación restringida a en la base , , , , tiene como matriz al bloque de Jordan . Ojo. Aquí los vectores los escribimos en orden contrario, empezando con la mayor potencia de aplicada.
Demostración. Probemos las afirmaciones una por una. Para empezar, supongamos que para ciertos escalares tenemos que
Vamos a probar inductivamente de a que . Para mostrar que , aplicamos a la combinación lineal anterior para obtener:
Aquí estamos usando en todos los sumandos, excepto el primero, que . Como , concluimos que . Suponiendo que ya hemos mostrado , la combinación lineal con la que empezamos queda como Aplicando y usando un argumento similar al anterior se llega a que . Esto muestra que la única combinación lineal de los vectores que da cero es la combinación lineal trivial, así que son linealmente independientes.
De manera inmediata obtenemos entonces que esos vectores generan un subespacio de dimensión . Para ver que es estable, tomemos un elemento en , es decir para algunos escalares . Debemos ver que está nuevamente en . Haciendo las cuentas y usando nuevamente que obtenemos:
Este vector de nuevo es combinación lineal de los vectores que nos interesan, así que está en , como queríamos.
La afirmación de la forma matricial es inmediata pues precisamente
de donde se lee que las columnas de dicha forma matricial justo son las del bloque de Jordan .
El teorema anterior da otra demostración de algo que ya habíamos mostrado en la entada anterior: el índice de una matriz en (o de una transformación nilpotente en un espacio vectorial de dimensión ) no puede exceder .
Encontrar un subespacio complementario y estable
Ahora veremos otro resultado auxiliar que necesitaremos para demostrar la existencia de la forma canónica de Jordan. A partir de él podemos conseguirnos un «subespacio complementario y estable» que en la prueba de la existencia nos ayudará a proceder inductivamente. Este truco ya lo hemos visto antes en la clasificación de matrices ortogonales y el la demostración del teorema espectral.
Proposición. Sea un espacio vectorial de dimensión finita y una transformación lineal nilpotente de índice . Tomemos un vector tal que . Sea el subespacio generado por . Entonces, existe un subespacio estable bajo y tal que .
La principal dificultad para probar esta proposición es una cuestión creativa: debemos saber de dónde sacar el espacio . Para ello, haremos uso de la transformación transpuesta y de un espacio ortogonal por dualidad. Como recordatorio, si es una transformación lineal, entonces su transformación transpuesta es una transformación lineal para la cual para cualquier forma lineal y cualquier vector en .
Demostración. Primero, nos enfocamos en construir . Para ello procedemos como sigue. Como , entonces existe una forma lineal tal que . Se puede mostrar que también es nilpotente de índice . Por la proposición de la sección anterior, tenemos entonces que son vectores linealmente independientes en y por lo tanto que generan un subespacio de dimensión . El espacio que propondremos será .
Debemos mostrar que:
En efecto .
En efecto es estable.
Para la primer parte, usando teoría de espacios ortogonales tenemos que así que los subespacios tienen la dimensión correcta para ser complementarios. Además, si , entonces es combinación lineal de digamos y se anula por , lo que quiere decir que se anula por . Esto permite probar iterativamente que , de modo que . Con esto, y son de intersección trivial y dimensiones complementarias, lo cual basta para que .
Para terminar, debemos ver que es estable. Tomemos un en , es decir, tal que se anula por . Al aplicar , tenemos que también se anula por todas estas transformaciones. Esto se debe a que para con se anula ya que por cómo tomamos y para se anula pues es nilpotente de índice .
Existencia de forma canónica de Jordan para nilpotentes
La idea para encontrar la forma canónica de Jordan debe ser clara a estas alturas: se procederá por inducción, el caso base será sencillo, asumiremos la hipótesis inductiva y para hacer el paso inductivo descomponeremos al espacio mediante la proposición de la sección anterior. Veamos los detalles.
Demostración (existencia de forma canónica de Jordan para nilpotentes). Estamos listos para probar la existencia de la forma canónica de Jordan para una transformación lineal nilpotente con un espacio vectorial de dimensión finita . Procederemos por inducción en la dimensión. Si , entonces es generado por un vector y la transformación lineal debe mandarlo al vector para ser nilpotente. En esta base, y la matriz que representa a es entonces .
Supongamos que existe la forma canónica de Jordan para cuando es de cualquier dimensión menor a un entero positivo dado . Tomemos un espacio vectorial de dimensión y una transformación lineal nilpontente. Si es de índice , entonces son linealmente independientes y por lo tanto son una base de . La forma matricial de en esta base es el bloque de Jordan , en cuyo caso terminamos.
De otra forma, el índice es un número . Entonces, generan un subespacio estable de dimensión . Por la proposición de la sección anterior, podemos encontrar un subespacio complementario de dimensión y estable bajo . Como la restricción de a tiene codominio , es nilpotente y , entonces por hipótesis inductiva tiene una base bajo la cual la restricción de a tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo . Al completar con , obtenemos una base de en la cual tiene como forma matricial una matriz diagonal por bloques con puros bloques de Jordan del estilo (que vienen de la hipótesis inductiva) y un bloque de Jordan . Salvo quizás un reordenamiento de la base para ordenar los y , obtenemos exactamente lo buscado.
Más adelante…
Ya demostramos una parte fundamental del teorema que nos interesa: la existencia de la forma canónica de Jordan para transformaciones (y matrices) nilpotentes. Nos falta otra parte muy importante: la de la unicidad. Las demostraciones de unicidad típicamente son sencillas, pero en este caso no es así. Para decir de manera explícita cuál es la forma canónica de Jordan de una transformación (o matriz) nilpotente, deberemos hacer un análisis cuidadoso del rango de las potencias de la transformación (o matriz). Veremos esto en las siguientes entradas.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
Verifica que la siguiente matriz es nilpotente: Siguiendo las ideas de la demostración de existencia de esta entrada, ¿cómo podrías dar la forma canónica de Jordan de esta matriz? Intenta hacerlo.
Sea un espacio vectorial de dimensión finita y una transformación lineal nilpotente de índice . Demuestra que también es una transformación lineal nilpotente de índice . ¿Cuál sería el resultado análogo para matrices?
Sea un espacio vectorial de dimensión finita y una transformación lineal tal que para cualquier en existe algún entero tal que . Estos pueden ser distintos para distintos . Muestra que es nilpotente.
Considera el subespacio de polinomios reales con grado a lo más y la transformación lineal derivar. Da, de manera explícita, espacios y como en las proposición de encontrar el subespacio complementario estable.
Hay varios detalles que quedaron pendientes en las demostraciones de esta entrada. Revisa la entrada para encontrarlos y da las demostraciones correspondientes.
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»
Ninguna investigación humana puede ser llamada verdadera ciencia si no puede ser demostrada matemáticamente. – Leonardo da Vinci
Introducción
En la entrada anterior estudiamos algunas propiedades de las soluciones de las ecuaciones diferenciales ordinarias, en particular vimos que una ecuación diferencial puede tener infinitas soluciones y el intervalo de solución puede ser cualquiera en el que la función esté definida, sea derivable veces y cuyas derivadas sean continuas. En esta entrada estudiaremos cómo obtener una solución particular de una solución general dados unos valores prescritos conocidos como condiciones iniciales y veremos la importancia de saber elegir el intervalo de solución en estos casos particulares.
En esta entrada también estudiaremos algunos problemas del mundo real que involucran ecuaciones diferenciales, a través de estos problemas introduciremos la idea de ecuación diferencial como modelo matemático. Los problemas que estudiaremos tienen el objetivo de presentar el análisis que debemos hacer al intentar modelar un problema usando ecuaciones diferenciales y no con el propósito de resolver el problema mismo, pues resolverlo significa determinar las soluciones de las ecuaciones diferenciales que surjan y hasta este momento aún no hemos visto métodos de resolución.
Problema con valores iniciales
Definición: En algún intervalo que contiene a , el problema de resolver la ecuación diferencial sujeto a que se cumpla donde son contantes reales arbitrarias dadas, se llama problema con valores iniciales (PVI), o problema con valores iniciales de -ésimo orden.
Definición: Los valores de y de sus derivadas en el punto , es decir se llaman condiciones iniciales.
De manera resumida podemos decir que un problema con valores iniciales es la ecuación diferencial acompañada de condiciones iniciales.
En el caso de ecuaciones diferenciales de primer y segundo orden tendríamos el siguiente PVI respectivamente:
Resolver sujeto a
Resolver sujeto a y
Geométricamente un PVI de primer orden significa que estamos buscando una solución de la ecuación diferencial en un intervalo que contenga a tal que su gráfica pase por el punto .
En el caso del PVI de segundo orden estamos buscando una solución de la ecuación diferencial en un intervalo que contenga a de tal manera que su gráfica no sólo pase por el punto , sino que también la pendiente a la curva en ese punto tenga como valor .
En la entrada anterior vimos que las soluciones generales tienen constantes arbitrarias, las condiciones iniciales de un PVI nos permitirá determinar el valor de dichas contantes para obtener una solución particular, pues con frecuencia resolver un problema con valores iniciales de -ésimo orden implica primero determinar una familia -paramétrica de soluciones de la ecuación diferencial dada y después usando las condiciones iniciales en determinar los valores numéricos de las constantes de la familia. Es importante mencionar que la solución particular obtenida debe estar definida en algún intervalo que contenga al punto inicial . Veamos un ejemplo.
Ejemplo: Considerar la solución general
de la ecuación diferencial
(Más adelante en el curso estudiaremos la forma de obtener este tipo de soluciones). Encontrar la solución particular dadas las siguientes condiciones iniciales:
Solución: Como tarea moral verifica que en efecto la función dada es solución de la ecuación diferencial, por ahora asumiremos que lo es.
Tenemos un problema con valores iniciales, así que la solución está sujeta a las condiciones iniciales, lo que debemos hacer para obtener la solución particular no es más que aplicar las condiciones iniciales. En este caso , la primera condición inicial nos dice que se debe satisfacer , entonces evaluemos la solución en y el resultado lo igualamos a .
El resultado de aplicar la primera condición inicial es
Para aplicar la segunda condición inicial necesitamos la derivada de la solución general, dicha función es
Apliquemos la segunda condición inicial, .
El resultado de aplicar la segunda condición inicial es
Finalmente, para aplicar la tercera condición inicial necesitamos la segunda derivada de la solución general, esto es
Apliquemos la condición inicial .
El resultado de aplicar la tercera condición inicial es
De las ecuaciones obtenidas de aplicar las condiciones iniciales formamos el siguiente sistema de ecuaciones.
Intenta resolver el sistema de ecuaciones usando el método que gustes. Una vez que lo resuelvas notarás que los valores para las incógnitas son:
Sólo basta sustituir estos valores en la solución general de la ecuación diferencial para obtener la solución particular. Por lo tanto, la solución particular sujeta a las condiciones iniciales es:
En la entrada anterior vimos que el intervalo de solución no es necesariamente el dominio de la función, sino que podemos tomar cualquier intervalo en el que la solución es derivable veces con derivadas continuas en ese intervalo, en el caso de los problemas con valores iniciales es necesario que el punto pertenezca al intervalo de solución , esto en ocasiones establecerá un intervalo limitado para la solución, así que debemos tener cuidado con los valores en los que la solución particular está definida. Para visualizar este hecho retomemos el ejemplo visto en la entrada anterior donde mostramos que la función
es solución de la ecuación diferencial
Realicemos este mismo ejercicio, pero ahora visto como un problema de valores iniciales y veamos la importancia de elegir correctamente el intervalo solución.
Ejemplo: La ecuación diferencial
tiene como solución general a la función
Determinar la solución particular dada la condición inicial
Solución: La solución general es
Aplicando la condición inicial obtenemos lo siguiente.
De la última igualdad obtenemos , sustituyendo en la solución general se tiene
Así que la solución particular
corresponde a un PVI de con la condición inicial . En la entrada anterior mostramos la gráfica de esta función.
Gráfica de la función .
Pero ahora el intervalo de solución debe ser aquel en el que . El intervalo más grande que puede tomar la solución particular es , pues es el intervalo donde está el punto y donde la solución es continua. ¡La condición inicial ha restringido el intervalo de solución!
Punto que satisface la condición inicial .
Con este ejemplo vemos que las condiciones iniciales establecen un intervalo de solución especifico, en ocasiones (como en el primer ejemplo visto en esta entrada) no habrá mayor problema con el intervalo si la función es derivable y por tanto continua es todo su dominio. Es recomendable primero determinar en donde la solución está definida (encontrar su dominio) y posteriormente revisar si se trata sólo de una solución general o si hay condiciones iniciales que determinarán una solución particular.
Existencia de una solución única
Al trabajar con problemas con valores iniciales debemos hacernos dos preguntas importantes. ¿Existe la solución del problema? y si existe la solución, ¿es única?. Más adelante estudiaremos las ecuaciones diferenciales de primer orden y retomaremos con mayor profundidad este tema, por ahora sólo vamos a enunciar un teorema que da las condiciones suficientes para garantizar la existencia y unicidad de una solución de un PVI de primer orden.
Teorema: Dada una ecuación diferencial de primer orden donde está definida en una región rectangular en el plano , la región está definida por , y contiene al punto en su interior. Si satisface las condiciones:
es continua en y
es continua en
Entonces existe algún intervalo , , contenido en , y una función única , definida en , que satisface la condición inicial .
Dicho de otra manera, las condiciones para la existencia de soluciones son:
Continuidad de en .
Acotamiento de por .
Y las condiciones para la unicidad son:
Continuidad de y en .
Acotamiento de y por .
Estas condiciones son suficientes, pero no necesarias, puede existir una solución única que satisface , pero que no cumple con alguna de las condiciones anteriores o que no cumple con ninguna.
Problemas que se modelan con ecuaciones diferenciales
Las matemáticas permiten modelar muchos de los fenómenos que ocurren en en mundo real, a esta descripción matemática de un sistema de fenómenos se le denomina modelo matemático y se construyen con la intención de representar algunas características del fenómeno para después hacer predicciones. Es cierto que esto puede ser un proceso muy difícil ya que implica que las hipótesis que hagamos deben ser descritas en fórmulas muy precisas que nos permitan predecir lo que ocurrirá. Una vez construido un modelo, las predicciones se deben comparar con los datos del sistema, dependerá de la compatibilidad entre las hipótesis y las predicciones lo que defina si debemos confiar en el modelo o debemos mejorar nuestras suposiciones.
En el caso de las ecuaciones diferenciales, éstas nos permiten modelar sistemas que evolucionan con el tiempo o sistemas que implican una razón de cambio de una o más variables. En este curso consideraremos a un modelo matemático como una ecuación diferencial o un sistema de ecuaciones diferenciales que describen el comportamiento de un fenómeno que estemos estudiando. Una vez que hemos formulado un modelo matemático surge el reto de resolver las ecuaciones diferenciales para saber si la solución es consistente con los hechos conocidos acerca del comportamiento del sistema y si no lo es debemos repetir un proceso de modelado en el que vamos ajustando las hipótesis, identificamos nuevas variables o incluso incluimos leyes empíricas que se puedan aplicar al sistema.
Hasta ahora ya hemos estudiado algunas ecuaciones diferenciales, sabemos cómo verificar cuando una función es solución y hemos estudiado algunas de sus propiedades. Para concluir esta entrada vamos a analizar algunos problemas del mundo real que son modelados con ecuaciones diferenciales. En esta parte nos enfocaremos en la forma en la que surgen las ecuaciones dado un problema y no nos preocuparemos por resolverlas, pues esto es algo que aún desconocemos.
Propagación de una enfermedad contagiosa
Recientemente hemos tenido la experiencia de observar cómo es que una enfermedad contagiosa se puede propagar en la población. En términos muy generales intentemos modelar la propagación de una enfermedad contagiosa a través de una comunidad de personas que han estado en contacto con personas enfermas.
Definamos a como el número de personas que están enfermos en un cierto tiempo y sea el número de personas que aún no han sido expuestas al contagio en ese momento . Es claro que la razón con la que se propaga la enfermedad debe ser proporcional al número de encuentros o interacciones entre los dos grupos de personas. Si suponemos que el número de interacciones es conjuntamente proporcional a y , entonces un modelo puede ser
donde es la constante de proporcionalidad. Consideremos una comunidad con una población fija de personas, si inicialmente nadie tiene la enfermedad entonces , pero si a esa comunidad llega una persona enferma , entonces podemos construir la siguiente relación.
de donde podemos despejar a como
y sustituir en el modelo.
Esta última ecuación sería el modelo que describe la propagación de la enfermedad a través del tiempo. Una condición inicial sería que en el momento en el que llego la persona enferma a la comunidad comenzó a propagarse la enfermedad, esto es, .
Ley de enfriamiento de Newton
La ley de enfriamiento de Newton establece que la razón de cambio de la temperatura de un cuerpo con respecto al tiempo es proporcional a la diferencia entre la temperatura del cuerpo y la temperatura del medio ambiente . Esta ley puede ser modelada con la siguiente ecuación diferencial.
donde es la contante de proporcionalidad y es la temperatura del medio ambiente considerada también una constante. Si podemos resolver esta ecuación encontraríamos una función que podría predecir la temperatura del cuerpo en cualquier tiempo .
Sin embargo, sin resolver la ecuación podemos notar que si , entonces , lo que significa que el cuerpo se estaría enfriando, pues la función sería una función decreciente mientras avanza el tiempo. Por otro lado, si , entonces , es decir la función sería una función creciente en el tiempo lo que físicamente significa que el cuerpo se esta calentando.
Cuerpos en caída
Consideremos un objeto que es lanzado desde lo alto de un edificio, el problema que queremos analizar es hallar la forma de conocer la posición del objeto con respecto al suelo en algún tiempo después de ser lanzado y antes de tocar el suelo. Por convención consideremos que la dirección hacía arriba es positiva.
Analicemos la situación. Consideremos un edificio de altura , desde esa altura se lanza un objeto de masa , la velocidad inicial con la que es lanzado es . El objeto al caer esta sometido a la fuerza de gravedad, la segunda ley de Newton nos dice que cuando la fuerza neta que actúa sobre un cuerpo no es cero, entonces la fuerza neta es proporcional a su aceleración , estas cantidades están relacionadas por la ecuación
con la masa del cuerpo, si el objeto esta en caída la fuerza neta será su peso.
El signo menos es porque el peso del objeto es una fuerza dirigida hacia abajo. Recordando que el peso está dado como
donde es la masa del objeto y es la aceleración debido a la gravedad de la tierra, usando entonces la segunda ley de Newton podemos establecer que
es decir . Recordemos que la aceleración de un objeto corresponde a la tasa de cambio de la velocidad y que a su vez la velocidad es la tasa de cambio de la posición del objeto, es decir, la aceleración es la segunda derivada de la posición con respecto al tiempo, si es la posición del objeto, entonces
Por lo tanto, la ecuación diferencial que modela nuestro problema es
Las condiciones iniciales son claras, al tiempo el objeto se encuentra en la posición mas alta del edificio es decir y la velocidad con la que es lanzada al tiempo es . Resolviendo la ecuación diferencial y obteniendo la solución particular podremos predecir la posición del objeto con respecto al suelo a cualquier tiempo antes de caer por completo.
Modelo logístico de la población
Este es uno de los modelos más estudiados y representativos al estudiar ecuaciones diferenciales. Lo que se quiere estudiar es el crecimiento de una población, queremos crear un modelo que prediga el crecimiento que puede haber en una población en función de su entorno y los recursos limitados a los que están sujetos. Para comenzar con este estudio se pueden considerar las siguientes hipótesis.
Si la población es pequeña, la tasa de crecimiento de la población es proporcional a su tamaño.
Si la población es demasiado grande para ser soportada por su entorno y recursos, la población disminuirá, en este caso la tasa de crecimiento será negativa.
Las variables involucradas en este problema son las siguientes:
Por supuesto el tiempo es la variable independiente en la que queremos predecir. Otra variable es la población , esta variable es dependiente del tiempo , será el parámetro que corresponde a la razón de crecimiento en el caso de poblaciones pequeñas y será otro parámetro que establece cuando la población comienza a ser demasiado grande. El parámetro se conoce como capacidad de soporte del entorno. De acuerdo a las hipótesis anteriores, estamos suponiendo que crece si y decrece si . Ahora que conocemos las variables que estarán presente en el modelo, matemáticamente podemos escribir a las hipótesis como:
si es pequeña.
si es grande, tal que
Queremos una expresión (ecuación diferencial) que involucre ambas hipótesis. Supongamos que la ecuación que buscamos es de la forma
Donde es una función que debe acoplarse a las hipótesis. Para que satisfaga la primea hipótesis debe ocurrir que sea cercano a cuando es pequeño y que cuando . La expresión más simple que satisface esto es
Podemos notar que si , entonces y si , entonces . Por lo tanto, la ecuación diferencial que describe esta situación es:
Éste es el modelo logístico de la población con velocidad de crecimiento y capacidad de soporte . Como podemos notar es una ecuación diferencial no lineal y su solución la analizáremos con detalle más adelante en el curso.
Sistemas Depredador – Presa
Para concluir estudiemos otro de los modelos más estudiados en ecuaciones diferenciales, el modelo depredador – presa. En el mundo ninguna especie vive aislada y sus interacciones pueden proporcionar algunos de los modelos más interesantes por estudiar. El problema que analizaremos es en el que una especie se come a otra, con fines ilustrativos consideremos a la especie depredador como zorros y a la especie presa como conejos. Llamemos a la variable dependiente que describe el número de zorros que hay en una cierta región y sea otra variable dependiente que describe el número de conejos que hay en esa misma región, ambas funciones son dependientes del tiempo . Nuestras hipótesis tienen que ser tales que describan el aumento o disminución de ambas poblaciones de acuerdo a las interacciones que hay entre zorros y conejos, es claro que si hay muchos conejos los zorros tendrán alimento y su población crecerá, mientras que la de conejos disminuirá y por otro lado, si hay pocos conejos la población de zorros disminuirá (morirán por falta de alimento), mientras que la de conejos aumentará. Las hipótesis que consideraremos son las siguientes:
Si no hay zorros presentes, los conejos se reproducen a una tasa proporcional a su población y no les afecta la sobrepoblación.
Los zorros se comen a los conejos y la razón a la que los conejos son devorados es proporcional a la tasa a la que los zorros y conejos interactúan.
Sin conejos que comer, la población de zorros disminuirá a una tasa proporcional a ella misma.
La tasa de nacimientos de los zorros crece en proporción al número de conejos comidos por zorros que, por la segunda hipótesis, es proporcional a la tasa a la que los zorros y conejos interactúan.
Las variables que tenemos hasta ahora son el tiempo y las poblaciones y , para satisfacer las hipótesis necesitamos de parámetros que las modelen. Los parámetros que consideraremos son los siguientes:
es el coeficiente de la tasa de crecimiento de conejos.
es la constante de proporcionalidad que mide el número de interacciones conejos-zorros en las que el conejo es devorado.
es el coeficiente de la tasa de muertes de zorros.
es la constante de proporcionalidad que mide el beneficio a la población de zorros de un conejo devorado.
Tomaremos la convención de que todos estos parámetros son positivos. En este caso particular tenemos dos variables dependientes del tiempo por lo tanto será necesario encontrar dos ecuaciones que modelen al sistema. Para que sea más intuitivo entender el modelo vamos a mostrar las ecuaciones que modelan el sistema y veamos por qué son así.
La primer hipótesis nos habla de una relación proporcional en el crecimiento de la población de conejos cuando no hay zorros presentes, de ahí el término de la primer ecuación, lo mismo ocurre con la tercera hipótesis, pero en este caso se trata de un decremento de población de zorros tras la falta de conejos, por ello el signo menos en el término de la segunda ecuación. Por otro lado, la segunda y cuarta hipótesis nos habla de una interacción entre los zorros y los conejos, esta interacción puede ser modelada con el producto , con este producto hacemos que la interacción aumente si o aumentan, pero desaparece si o , así en el caso de la segunda hipótesis los conejos son devorados de manera proporcional a la interacción entre zorros y conejos, por ello agregamos el término en la primer ecuación, el signo menos indica que el número de conejos debe disminuir, pues están siendo devorados, así mismo, la cuarta hipótesis nos habla de un crecimiento en el número de zorros al comer conejos, esta interacción es modelada con el término , en este caso es positivo ya que los zorros están aumentando en número. Este análisis es lo que le da sentido al modelo () que hemos creado.
Algo interesante que notamos es que ahora tenemos dos ecuaciones diferenciales que modelan el fenómeno. Cuando hay dos o más ecuaciones diferenciales decimos que es un sistema de ecuaciones diferenciales, en este caso este sistema de ecuaciones lo llamamos sistema de primer orden de ecuaciones diferenciales ordinarias, se dice también que el sistema es acoplado porque las tasas de cambio y dependen tanto de como de . Los sistemas de ecuaciones diferenciales será un tema que estudiaremos en la tercera unidad del curso.
Una solución al modelo que hemos construido consiste en encontrar un par de funciones y que describan las poblaciones de conejos y zorros como funciones del tiempo. Como el sistema es acoplado, no podemos determinar cada una de esas funciones de forma aislada, sino que debemos resolver ambas ecuaciones diferenciales de forma simultánea, sin embargo en este caso no es posible determinar de modo explícito formulas para y , no pueden ser expresadas en términos de funciones conocidas tales como polinomios, senos, cosenos, exponenciales, etcétera. Más adelante veremos que las funciones y existen, pero entonces, ¿cómo conocerlas?. En la siguiente entrada estudiaremos un método cualitativo de las ecuaciones diferenciales que puede ser un método que nos ayude en estos casos, por ejemplo.
Por supuesto estos son sólo algunos problemas ilustrativos en los que las ecuaciones diferenciales modelan algún fenómeno natural, pero la cantidad de fenómenos que involucran ecuaciones diferenciales son enormes y un tanto el objetivo es que conforme vayamos aprendiendo seamos capaces de construir nuestros propios modelos sobre algún fenómeno que observemos a nuestro alrededor.
Tarea moral
Los siguientes ejercicios no forman parte de la evaluación del curso, pero servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.
Dada la ecuación diferencial y su solución general, verificar que la función es solución, determinar la solución particular dadas las condiciones iniciales y determinar el intervalo de solución en donde puede estar definida dicha solución.
.
.
.
Considerar el modelo de población
donde es la población en el tiempo .
¿Para qué valores de está en equilibrio la población?.
¿Para qué valores de está creciendo la población?.
¿Para qué valores de está decreciendo la población?.
El sistema
ha sido propuesto como un modelo para un sistema depredador – presa de dos especies particulares de microorganismos (con , y parámetros positivos).
¿Qué variable, o , representa a la población depredadora? y ¿qué variable representa a la población presa?.
¿Qué le pasa a la población depredadora si la presa se extingue?.
Más adelante…
Más adelante aprenderemos a resolver ecuaciones diferenciales ordinarias de primer orden de forma analítica, una vez que estemos listos puede ser conveniente regresar a esta entrada e intentar resolver las ecuaciones diferenciales que modelan cada uno de los problemas vistos para extrapolar en los resultados.
Pero antes de estudiar métodos analíticos estudiaremos un método geométrico o mejor conocido como método cualitativo de las ecuaciones diferenciales que nos permitirá describir las soluciones sin conocer explícitamente la forma analítica de las funciones solución.
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»
Terminamos esta serie de técnicas de resolución de problemas con una de las técnicas más finas y más usadas en las matemáticas: las pruebas por contradicción.
La idea es la siguiente. Por un momento suponemos que lo que queremos demostrar es falso. Después trabajaremos haciendo todo lo demás correctamente. La idea es llegar a una contradicción con las hipótesis del problema, o bien a algo que sabemos que es imposible. De esta forma, sabemos que debe haber un error en la demostración de eso imposible. Y como lo único que hicimos mal fue suponer que lo original era falso, debemos tener que en realidad es verdadero.
En estos videos veremos varios ejemplos de este argumento para acostumbrarnos. Es súper útil pensar en estos argumentos casi automáticamente.