Entrada destacada

Teorema del valor medio para funciones de $\mathbb{R}^{n}\rightarrow \mathbb{R}$

Por Angélica Amellali Mercado Aguilar

Introducción

El Teorema del valor medio es un resultado fundamental del cálculo diferencial. En cálculo de una variable nos dice que en algún punto del intervalo, la pendiente de la tangente a la curva (es, decir la derivada) es igual a la pendiente de la recta secante que une los puntos extremos $(a,f(a))$ y $(b,f(b))$. En esta sección estudiaremos para el caso en más dimensiones.

Recordemos el teorema del valor medio para funciones de $\mathbb{R}\rightarrow \mathbb{R}$

Suponga que $f:[a,b]\rightarrow\mathbb{R}$ es derivable en $(a,b)$ y continua en $[a,b]$ entonces existe $c\in(a,b)$ tal que
$$f'(c)=\frac{f(b)-f(a)}{b-a}$$

En esta sección se presenta el caso en la versión para funciones de $\mathbb{R}^{n}$ en $\mathbb{R}$. De esta manera el caso general se ve de la siguiente manera:

Teorema. Sea $f:A\subset\mathbb{R}^{n} \rightarrow \mathbb{R}$
una función definida en el conjunto abierto $A$ de $\mathbb{R}^{n}$. Si $x_{0},y_{0} \in A$ se pide que el conjunto $A$ sea tal que $[x_0,y_0]=\left\{x_{0}+t(y_{0}-x_{0})~|~t\in[0,1]\right\}\subset A$. Sea $u$ un vector unitario en la dirección del vector $y_{0}-x_{0}$. Si la función $f$ es continua en los puntos del segmento $[x_0,y_0]$ y
tiene derivadas direccionales en la dirección del vector $u$ en los puntos del segmento $(x_0,y_0)$, entonces existe $\theta$ , $0<\theta<1$ tal que $f(x_0+hu)-f(x_0)=\displaystyle\frac{\partial f}{\partial u}(x_0+\theta
hu)h$ donde $h=|y_0-x_0|$.

Una consecuencia del teorema anterior es el teorema
Teorema. Sea $f:A\subset\mathbb{R}^{n} \rightarrow \mathbb{R}$
una función definida en el conjunto abierto $A$ de $\mathbb{R}^{n}$. Si las derivadas parciales $\displaystyle{\frac{\partial f}{\partial x_{i}}~~\forall i=1,..,n}$ son continuas en $x_{0}\in A$ entonces f es diferenciable en $x_{0}\in A$
Vamos a dar una idea de la demostración para el caso n=2

Teorema del Valor Medio para Funciones de $\mathbb{R}^{2}\rightarrow \mathbb{R}$

Teorema. Sea $f:A\subset\mathbb{R}^{2} \rightarrow \mathbb{R}$ una función definida en el conjunto abierto $A$ de $\mathbb{R}^{2}$. Si $x_{0},y_{0} \in A$ se pide que el conjunto $A$ sea tal que $[x_0,y_0]=\left\{x_{0}+t(y_{0}-x_{0})~|~t\in[0,1]\right\}\subset A$. Sea $u$ un vector unitario en la dirección del vector $y_{0}-x_{0}$. Si la función
$f$ es continua en los puntos del segmento $[x_0,y_0]$ y tiene derivadas direccionales en la dirección del vector $u$ en los puntos del segmento $(x_0,y_0)$, entonces existe
$\theta$ \, $0<\theta<1$ tal que $f(x_0+hu)-f(x_0)=\displaystyle\frac{\partial f}{\partial u}(x_0+\theta hu)h$ donde $h=|y_0-x_0|$.

Demostración. Considere la función $\phi:[0,h]\rightarrow
\mathbb{R}$ dada por $\phi(t)=f(x_0+tu)$ ciertamente
la función $\phi$ es continua en $[0,h]$ pues $f$ lo es en $[x_0,y_0]$. Ademas

[\begin{array}{ll}
\phi'(t) & =\displaystyle\lim_{h \rightarrow 0}
\frac{\phi(t+h)-\phi(t)}{h} \\
\, & = \displaystyle\lim_{h \rightarrow 0}
\frac{f(x_0+(t+h)u)-f(x_0+tu)}{h} \\
\, & = \displaystyle\lim_{h \rightarrow 0}
\frac{f(x_0+tu+hu)-f(x_0+tu)}{h} \\
\, & = \displaystyle\frac{\partial f}{\partial
u}(x_0+tu)
\end{array}]

de modo que para $t \in (0,h)$, $\phi'(t)$ existe y es la derivada direccional de $f$ en $x_0+tu \in (x_0,y_0)$ en la dirección del vector $u$. Aplicando entonces el teorema del valor medio a la función $\phi$, concluimos que existe un múmero $\theta \in (0,1)$ que da $\phi(h)-\phi(0)=\phi'(\theta h)h$\ es decir de modo que $$f(x_0+hu)-f(x_0)=\frac{\partial f}{\partial u}(x_0+\theta hu)h$$

Ahora para la verisón del teorema 3

Teorema 5. Sea $f:A\subset\mathbb{R}^{2} \rightarrow \mathbb{R}$
una función definida en el conjunto abierto $A$ de $\mathbb{R}^{n}$. Si las derivadas parciales $\displaystyle{\frac{\partial f}{\partial x},~~\frac{\partial f}{\partial y}}$ son continuas en $(x_{0},y_{0})\in A$ entonces f es diferenciable en $(x_{0},y_{0}\in A$

Demostración. Vamos a probar que $$f((x_{0},y_{0})+(h_{1},h_{2}))=f(x_{0},y_{0})+\frac{\partial f}{\partial x}(x_{0},y_{0})h_{1}+\frac{\partial f}{\partial y}(x_{0},y_{0})h_{2}+r(h_{1},h_{2})$$donde $$\lim_{(h_{1},h_{2})\rightarrow(0,0)}\frac{r(h_{1},h_{2})}{|(h_{1},h_{2})|}=0$$

para ello tenemos que
$$r(h_{1},h_{2})=f((x_{0},y_{0})+(h_{1},h_{2}))-f(x_{0},y_{0})-\frac{\partial f}{\partial x}(x_{0},y_{0})h_{1}-\frac{\partial f}{\partial y}(x_{0},y_{0})h_{2}$$
sumando un cero adecuado
$$r(h_{1},h_{2})=f((x_{0},y_{0})+(h_{1},h_{2}))-\textcolor{Red}{f(x_{0},y_{0}+h_{2})}+\textcolor{Red}{f(x_{0},y_{0}+h_{2})}-f(x_{0},y_{0})-\frac{\partial f}{\partial x}(x_{0},y_{0})h_{1}-\frac{\partial f}{\partial y}(x_{0},y_{0})h_{2}$$
trabajaremos

$$f((x_{0},y_{0})+(h_{1},h_{2}))-\textcolor{Red}{f(x_{0},y_{0}+h_{2})}$$Considerando la función $\varphi(x)=f(x,y_{0}+h_{2})$ por lo tanto tenemos que $$\varphi'(x)=\lim_{h_{1}\rightarrow0}\frac{\varphi(x+h_{1})-\varphi(x)}{h_{1}}=\lim_{h_{1}\rightarrow0}\frac{f(x+h_{1},y_{0}+h_{2})-f(x,y_{0}+h_{2})}{h_{1}}$$
este limite existe y nos dice que $\varphi$ es es continua en este caso en el intervalo $[x_{0},x_{0}+h_{1}]$. Por lo tanto aplicando el TVM en dicho intervalo se obtiene
$$\varphi(x_{0}+h_{1})-\varphi(x_{0})=\varphi'(x_{0}+\theta_{1} h_{1})h_{1}~p.a.~\theta_{1}\in(0,1)$$
es decir
$$f((x_{0}+h_{1},y_{0}+h_{2})-\textcolor{Red}{f(x_{0},y_{0}+h_{2})}=\frac{\partial f}{\partial x}(x_{0}+\theta_{1} h_{1},y_{0}+h_{2})h_{1}$$
Analogamente

$$\textcolor{Red}{f(x_{0},y_{0}+h_{2})}-f(x_{0},y_{0})$$Considerando la función $\varphi(y)=f(x_{0},y)$ por lo tanto tenemos que $$\varphi'(y)=\lim_{h_{2}\rightarrow0}\frac{\varphi(x_{0},y_{0}+h_{2})-\varphi(y_{0}+h_{2})}{h_{2}}=\lim_{h_{2}\rightarrow0}\frac{f(x_{0},y_{0}+h_{2})-f(y_{0}+h_{2})}{h_{2}}$$
este limite existe y nos dice que $\varphi$ es es continua en este caso en el intervalo $[y_{0},y_{0}+h_{2}]$. Por lo tanto aplicando el TVM en dicho intervalo se obtiene
$$\varphi(y_{0}+h_{2})-\varphi(y_{0})=\varphi'(y_{0}+\theta_{2} h_{2})h_{2}~p.a.~\theta_{2}\in(0,1)$$
es decir
$$f((x_{0},y_{0}+h_{2})-\textcolor{Red}{f(x_{0},y_{0})}=\frac{\partial f}{\partial y}(x_{0},y_{0}+\theta_{2}h_{2})h_{2}$$

Sustituimos en
$$r(h_{1},h_{2})=f((x_{0},y_{0})+(h_{1},h_{2}))-\textcolor{Red}{f(x_{0},y_{0}+h_{2})}+\textcolor{Red}{f(x_{0},y_{0}+h_{2})}-f(x_{0},y_{0})-\frac{\partial f}{\partial x}(x_{0},y_{0})h_{1}-\frac{\partial f}{\partial y}(x_{0},y_{0})h_{2}$$y obtenemos
$$r(h_{1},h_{2})=\frac{\partial f}{\partial x}(x_{0}+\theta_{1} h_{1},y_{0}+h_{2})h_{1}-\frac{\partial f}{\partial x}(x_{0},y_{0})h_{1}+\frac{\partial f}{\partial y}(x_{0},y_{0}+\theta_{2}h_{2})h_{2}-\frac{\partial f}{\partial y}(x_{0},y_{0})h_{2}$$

es decir
$$r(h_{1},h_{2})=\left(\frac{\partial f}{\partial x}(x_{0}+\theta_{1} h_{1},y_{0}+h_{2})-\frac{\partial f}{\partial x}(x_{0},y_{0})\right)h_{1}+\left(\frac{\partial f}{\partial y}(x_{0},y_{0}+\theta_{2}h_{2})-\frac{\partial f}{\partial y}(x_{0},y_{0})\right)h_{2}$$
por lo tanto
$$\frac{r(h_{1},h_{2})}{|(h_{1},h_{2})|}=\left(\frac{\partial f}{\partial x}(x_{0}+\theta_{1} h_{1},y_{0}+h_{2})-\frac{\partial f}{\partial x}(x_{0},y_{0})\right)\frac{h_{1}}{|(h_{1},h_{2})|}+\left(\frac{\partial f}{\partial y}(x_{0},y_{0}+\theta_{2}h_{2})-\frac{\partial f}{\partial y}(x_{0},y_{0})\right)\frac{h_{2}}{|(h_{1},h_{2})|}$$
ahora bien si $\displaystyle{|(h_{1},h_{2})|\rightarrow(0,0)}$ se tiene
$$\left(\frac{\partial f}{\partial x}(x_{0}+\theta_{1} h_{1},y_{0}+h_{2})-\frac{\partial f}{\partial x}(x_{0},y_{0})\right)\rightarrow0$$
y
$$\frac{h_{1}}{|(h_{1},h_{2})|}<1$$
Analogamente
$$\left(\frac{\partial f}{\partial y}(x_{0},y_{0}+\theta_{2}h_{2})-\frac{\partial f}{\partial y}(x_{0},y_{0})\right)\rightarrow0$$
y
$$\frac{h_{2}}{|(h_{1},h_{2})|}<1$$
en consecuencia
$$\lim_{(h_{1},h_{2})\rightarrow(0,0)}\frac{r(h_{1},h_{2})}{|(h_{1},h_{2})|}=0$$por lo tanto f es diferenciable en $(x_{0},y_{0})$

Más adelante

Estudiremos la definición del vector gradiente, el cual, contiene las derivadas parciales de una función real y veremos su importancia en relación a una dirección (vector) dado para analizar el crecimiento de una función.

Tarea Moral

Mostrar que la siguiente función es diferenciable en cada punto de su dominio.

1.- $f(x,y)= \displaystyle{\dfrac{2xy}{(x^2+y^2)^2}}$

2.-$f(x,y)=\dfrac{x}{y}+\dfrac{y}{x}$

3.-$f(r,\theta)=\dfrac{1}{2}rsen2\theta$, $r>0$

4.-$f(x,y)=\dfrac{xy}{\sqrt{x^2+y^2}}$

5.-$f(x,y)=\dfrac{x^2y}{x^4+y^2}$

Enlaces

Entrada destacada

Geometría Analítica I: Introducción al curso

Por Leonardo Ignacio Martínez Sandoval

Introducción

Bienvenido al curso de Geometría Analítica I. A través de esta serie de entradas cubriremos el temario oficial del programa de la materia tal y como se requiere en la Facultad de Ciencias de la UNAM. Esto incluye desarrollar no sólo habilidades para ejecutar procedimientos («hacer cuentitas»), sino también aquellas que nos permitan deducir los resultados que obtendremos a través de razonamientos lógicos («demostrar»).

Pre-requisitos del curso

En la mayoría de las entradas seguiremos un flujo matemático, en el cual escribiremos definiciones, proposiciones, ejemplos, teoremas y otro tipo de enunciados matemáticos. Siempre que digamos que algo sucede, es importante argumentar o justificar por qué es esto, es decir, que demos una demostración. Las demostraciones nos ayudarán a justificar que ciertos procedimientos (para encontrar distancias, ángulos, etc.) son válidos.

Para entender un poco más al respecto, te recomendamos leer las siguientes dos entradas, o incluso llevar a la par un curso de Álgebra Superior I:

Además de estos pre-requisitos de pensamiento lógico, haremos un repaso de algunos conceptos fundamentales de geometría, como los has visto en etapas anteriores de tu educación (punto, línea, segmento, triángulo, distancia, etc.). Si bien el objetivo es que más adelante todo lo construiremos «desde cero», el recordar estos conceptos te ayudará mucho en la intuición de por qué ciertas cosas las definimoxs como lo haremos, y por qué ciertos enunciados que planteamos «deben ser ciertos».

Finalmente, también supondremos que sabes manejar a buen nivel las operaciones y propiedades en $\mathbb{R}$ (los números reales). Por ejemplo, que la suma es conmutativa ($a+b=b+a$), que se distribuye con el producto ($a(b+c)=ab+ac$), etc. Si bien en otros cursos se definen a los reales con toda formalidad, para este curso sólo será importante que sepas hacer estas operaciones.

La idea fundamental

La geometría se trata de figuras, de ver, de medir. El álgebra se trata de sumar, de operar, de comparar. La idea clave que subyace a la geometría analítica, como la veremos en este curso, es la siguiente:

La geometría y el álgebra son complementarias e inseparables, ninguna con más importancia sobre la otra. Podemos entender al álgebra a partir de la geometría, y viceversa.

Un ejemplo muy sencillo que se ve desde la educación básica es que la suma de reales se corresponde con «pegar segmentos». Si en la recta real tenemos un segmento de longitud $a$ y le pegamos un segmento de longitud $b$ (iniciando el segundo donde termina el primero), entonces el segmento que se obtiene tiene longitud $a+b$. Si bien es obvio, cuando estemos estableciendo los fundamentos tendremos que preguntarnos, ¿por qué pasa? ¿qué es pegar segmentos?

Nuestro objetivo será entender a profundidad muchas de estas equivalencias.

Interactivos

En este curso procuraremos incluir interactivos para que explores las ideas que vayamos introduciendo. Si bien un interactivo no reemplaza a una demostración, lo cierto es que sí ayuda muchísimo a ver más casos en los cuales una proposición o teorema se cumple. Nuestros interactivos están hechos en GeoGebra y necesitarás tener activado JavaScript en tu navegador.

En el siguiente interactivo puedes mover los puntos $A$, $B$ y $C$. Observa como la suma de las longitudes de dos segmentos siempre es igual a la longitud del tercero. ¿Qué pasa si $B$ «se pasa de $C$»? ¿Cuál segmento es la suma de los otros dos?

Te recomendamos fuertemente que dediques por lo menos un rato a jugar con los interactivos: intenta ver qué se puede mover, qué no, qué cosas piensas que suceden siempre y para cuales crees que haya ejemplos que fallen.

Como sugerencia, en el interactivo de GeoGebra puedes hacer clic en el ícono de pantalla completa, para que tengas más espacio para explorar:

Una vez que termines tu exploración, para salir puedes pulsar la tecla ESC, o bien usar el botón de salir de pantalla completa:

Más adelante…

En esta entrada platicamos de cómo son las notas del curso en general. Platicamos de pre-requisitos y de la idea fundamental que subyace al curso. A partir de la siguiente entrada comenzaremos con un repaso de objetos y resultados geométricos con los que probablemente estés familiarizado, debido a que se estudian en etapas educativas previas.

Más adelante, cuando iniciemos con el tratamiento teórico de la materia, hablaremos de dos visiones de geometría: la sintética y la analítica. Veremos un primer resultado que nos dice que, en realidad, ambas están muy relacionadas entre sí.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Escribe en una hoja de papel o en un documento digital qué significan para ti los siguientes términos: punto, línea, círculo, plano, semiplano, elipse, intersección, alineado, longitud, ángulo, dirección, vector. ¿En cuáles de estas palabras tuviste que usar las otras? ¿En cuáles no? Más adelante formalizaremos cada una de estas.
  2. Explora el inicio del siguiente libro digital: Euclides de Byrne.
  3. Si aprendes a manejar GeoGebra por tu cuenta, podrás hacer interactivos tú mismo. Si te interesa esto, revisa el siguiente curso de GeoGebra.
  4. ¿Cómo le harías para a cada punto del plano asociarle una pareja de números reales? ¿Cómo le harías para a cada pareja de números reales asociarle un punto en el plano?
  5. Si la suma de números corresponde a pegar segmentos, ¿a qué corresponde la multiplicación de números?

Entradas relacionadas

5.1 Material en revisión: ¿Por qué no hay norma – p para $p \in (0,1)$?

Por Mariana Perez

Observa que la bola unitaria no es convexa, es decir, que hay dos puntos en la bola $(1,0)$ y $(0,1)$ tales que el segmento $(1-t)(1,0) + t(0,1)$ no está contenido en la bola unitaria. En particular, para $t= \frac{1}{2}$

$$\frac{1}{2} (1,0) + \frac{1}{2} (0,1)=\Big(\frac{1}{2}, \frac{1}{2} \Big)$$

pero observa que el punto $\Big(\frac{1}{2}, \frac{1}{2}\Big)$ no está en la bola unitaria y debería estar,

ya que si $ \|(x,y)\|=(x^{\frac{1}{2}} + y^{\frac{1}{2}})^2$ fuera norma, entonces se debería cumplir que $$\Big\| \Big(\frac{1}{2}, \frac{1}{2} \Big) \Big\| = \Big\| \frac{1}{2} (1,0) + \frac{1}{2} (0,1) \Big\| \leq \frac{1}{2} \| (1,0) + (0,1) \| = 1 $$ pero eso no ocurre en este caso, ya que $ \Big( \big(\frac{1}{2} \big)^{\frac{1}{2}} + \big(\frac{1}{2} \big)^{\frac{1}{2}} \Big)^2 > 1$.

Por este motivo, no hay norma – p para cuando $p \in (0,1)$.

52.2 Material de prueba: Derivadas parciales continuas implican funciones continua

Por Mariana Perez

Teorema

Sea $f : \mathbb{R}^2 \rightarrow \mathbb{R}$, con $A$ abierto, tal que existen las derivadas parciales en $A$ y son acotadas, entonces $f$ es continua en $A$.

Demostración:

Sea $(x_0, y_0) \in A.$

$\Big[$ por demostrar : $f$ es continua en $(x_0, y_0) \Big]$

Basta demostrar que existe $L = \lim_{(x, y) \rightarrow (x_0, y_0)} f (x, y)$ y $ L = f (x_0, y_0).$

Sea $\epsilon > 0.$

Basta demostrar que existe $\delta > 0 $ tal que si

$\| (x, y) \, – \, (x_0, y_0) \| < \delta \Rightarrow |f (x, y) \, – \, f (x_0, y_0)|< \epsilon$

Como $\| (x, y) \, – \, (x_0, y_0) \| < \delta$

Sean $ h = x \, – \, x_0 $ y $ k = y \, – \, y_0 $ entonces, si $\| (h, k) \| < \delta \Rightarrow |f (x_0 + h, y_0 + k) \, – \, f (x_0, y_0) | < \epsilon$

$f (x_0 + h, y_0 + k) \, – \, f (x_0, y_0) = f (x_0 + h, y_0 + k) \, – \, f (x_0 , y_0 + k) \, + \, f (x_0, y_0 + k) \, – \, f (x_0, y_0) $

$f (x_0 + h, y_0 + k) \, – \, f (x_0, y_0) = \dfrac{\partial f}{\partial x} (x_0 + \theta_1 h, y_0 + k) h + \dfrac{\partial f}{\partial y} (x_0 , y_0 + \theta_2 k) k$ para algún $\theta_1, \theta_2 \in (0, 1)$

Sean $\xi = x_0 + \theta_1 h \; \in [x_0, x_0 + h]$

y $\eta = y_0 + \theta_2 k \; \in [y_0, y_0 + k]$

$\dfrac{\partial f}{\partial x}(\xi, y_0+k) = \dfrac{\Delta f}{h}$

$\dfrac{\partial f}{\partial y}(\xi, y_0+k)h = \Delta f$

Tomando el valor absoluto y aplicando la desigualdad del triángulo tenemos que:

$\Big| f (x_0 + h, y_0 + k) \, – \, f ( x_0, y_0) \Big| \leq \Bigg| \dfrac{\partial f}{\partial x}(x_0 + \theta_1h, y_0 + k) \Bigg| \Big|h \Big| + \Bigg| \dfrac{\partial f}{\partial y}(x_0 , y_0 + \theta_2k) \Bigg| \Big|k \Big| \leq M \Big| h \Big| + M \Big| k \Big| < \epsilon$

Para que $M \Big| h \Big| + M \Big| k \Big| < \epsilon$ se debe cumplir que

$$\big| h \big| \leq \sqrt{h^2 + k^2 } = \big\| (h, k) \big\|$$

$$\big| k \big| \leq \sqrt{h^2 + k^2 } = \big\| (h, k) \big\|$$

Luego $$\big| h \big| + \big| k \big| \leq 2 \sqrt{h^2 + k^2 } = 2 \big\| (h, k) \big\|$$

Entonces, para que se cumpla que $ 2M \big\| (h, k) \big\| < \epsilon$ basta pedir que

$$ \big\| (h, k) \big\| < \delta = \dfrac{\epsilon}{2M} \; _{\blacksquare}$$

Matemáticas Financieras: Antecedentes y su relación con el Sistema Financiero Mexicano

Por Erick de la Rosa

Introducción

En este apartado, se abordarán los orígenes que dieron lugar al nacimiento de las matemáticas financieras, las primeras operaciones en las que fueron utilizadas, la aparición del concepto de interés, la descripción de las variables y cómo fueron evolucionando a través de los años y se hablara de forma general acerca del sistema financiero mexicano, tema indispensable para poder llevar a cabo cualquier actividad económica.

Las matemáticas financieras están presentes en la vida cotidiana, tanto de empresas como de personas ya que, muchas de las actividades que se realizan a diario, y sobre todo las que tienen que ver con decisiones que involucra dinero, se llevan a cabo gracias al uso de la matemática, aunque en la gran mayoría de veces lo hagamos de forma inconsciente.

Y es que justamente la matemática, nos proporciona una gran cantidad de herramientas que nos permiten modelar, al mismo tiempo que nos otorgan información para tomar mejores decisiones, cuando nos enfrentamos a algún problema de índole económico.

Historia

El origen del concepto de interés, se puede ubicar a lo largo de la historia, desde el momento en el que, el ser humano, comenzó ha prestar sus bienes o posesiones a otro; exigiendo que se le devuelve el bien o recurso inicial, más aparte una cantidad extra.

A lo largo de miles de años y en diversas culturas como la fenicia, hebrea, griega, egipcia y china, ha sido una práctica común y equitativa recibir una compensación cuando una persona presta un bien, servicio o una suma de dinero a otra persona. Esto nos lleva a pensar que en la idea de que se tiene que hacer un pago en agradecimiento a por haber hecho uso de un bien ajeno. Este pago de compensación, a menudo denominado interés, se fundamenta en el hecho de que el prestamista está cediendo temporalmente su propiedad a favor del prestatario. Durante este período, el prestamista se priva del uso de ese bien, lo que justifica recibir una recompensa que compense esta privación.

En el Siglo XVIII, Jeremy Bentham (1748-1832) formuló la teoría utilitarista, en la que planteaba que todo individuo que prestaba un bien, también sacrificaba la utilidad de que él mismo había podido darle si hubiera decidido conservarlo. De ésta idea surge, que es razonable que al finalizar el dicho préstamo, la persona que había sido beneficiada, otorgará una cantidad extra como por haberse privado de dicho bien o recurso.

Éstas ideas fueron adoptadas por los economistas del siglo XX, en particular por Irving Fisher, el cual desarrollo la teoría del interés, en la que plantea la razón de la exigencia de intereses en la devolución de cualquier préstamo, agregando que dicha compensación no solamente se basa en la utilidad del bien, sino que también agrego la cantidad de tiempo en que fue prestado. Es decir, no sólo tenían que ver aspectos cuantitativos, sino también temporales. Es Fisher quien comienza a introducir la noción de tasas de interés.

Objetivo de las Matemáticas Financieras

El objetivo principal de las Matemáticas Financieras es desarrollar modelos matemáticos, que describan este fenómeno social que hemos mencionado. Para lograrlo, examinaremos cómo se realizan los pagos de intereses y analizaremos las variables involucradas en esta actividad, considerando cómo interactúan a lo largo del tiempo.

Definición de Finanzas

Las finanzas es un concepto que de acuerdo con la RAE, es una palabra que tiene sus orígenes del frances «finance» y significa como una obligación que asume una persona para responder a la obligación de otra. La relación que salta a la vista, es muy estrecha con el concepto de interés mencionado anteriormente. En otras palabras Finanzas se define como una rama de la economía que se enfoca en la administración científica y el desarrollo futuro de recursos que comprenden dinero, créditos y activos, con el fin de obtener un máximo beneficio y equilibrado para los dueños, socios, trabajadores de las empresas, y de la sociedad.

Sistema Financiero Mexicano

En la actualidad, para que dichas operaciones se puedan llevar a cabo, es necesario contar con un sistema que regule cada una de ellas, en ése entendido de ideas, el sistema que nos permite realizarlas de forma sana y equitativa posible. El Sistema Financiero Mexicano es el encargado de regular todas las operaciones financieras que se realizan en nuestro país. Dicho Sistema Financiero está formado por intermediarios financieros que captan, administran canalizando el ahorro y la inversión para prestarlo a quien requieren el dinero. Dentro de este sistema se encuentran también incluidas, autoridades financieras las cuales se encargan de regular, supervisar y proteger dichos recursos económicos, En otras palabras el sistema financiero mexicano, es el que se encarga de generar las condiciones necesarias para poder desarrollar cualquier actividad económica tales como producir o consumir, y que el dinero que resulta de realizar dicha actividad, pueda tener los medios para llegar a las personas que necesitan dichos recursos.

En términos formales, se define como Sistema Financiero Mexicano al conjunto de instituciones públicas, del sector gubernamental, privadas y del sector empresarial, a través de las cuales se llevan a cabo y se regulan las actividades en las operaciones de otorgación y obtención de créditos, la realización de inversiones, prestación de diversos servicios bancarios, emisión y colocación de instrumentos bursátiles y todas aquellas relativas a la actividad financiera.*

Las personas que cuentan con dinero pero no lo necesitan en un corto plazo, son las que se encuentran en posición de poder prestarlo, de esta manera las personas que t necesitan más dinero del que poseen, ya sea porque se encuentran realizando un proyecto de emprendimiento (un negocio, poner una panadería por ejemplo), tiene la forma de poder obtenerlo, y en tal situación; se comprometen a devolver esos recursos después de un tiempo determinado con una compensación adicional. Para poder llevarlo a la practica dichas actividades, los bancos y las tasas de interés tienen un papel un importante.

El sistema financiero mexicano esta conformado por Banco de México y la Secretaría de Haciendo y Crédito Publico.

Banco de México

La función del Banco de México es promover las condiciones para que se dé un sano desarrollo de las actividades económicas, que se accesible para los usuarios y que opere en un ambiente regulado, supervisado, así como competitivo.

Su función principal es procurar la estabilidad del poder adquisitivo del dinero (cuidar que el dinero no pierda su valor, capacidad de compra), con el que se realizan cualquier actividad económica. abasteciendo de papel moneda (billetes, monedas) al país, y propiciar un buen funcionamiento de los sistemas de pago; ésta ultima se logra a través de la ejecución de políticas monetarias y cambiarias. Es importante señalar que cualquier cambio que se realice a dichas políticas tienen su afectación directa en los precios que se pactan en los mercados financieros, como las tasas de interés, que para efectos prácticos se traducen en los costos que se pagan por adquirir créditos, rendimientos que se obtienen de inversiones, regular el cobro de comisiones por parte de los bancos, por mencionar algunos.

Secretaria de Hacienda y Crédito Público (SHCP)

Coordina la regulación y supervisión de las autoridades financieras, para asegurarse que el sistema financiero mexicano funcione de manera correcta; dichas autoridades son las siguientes:

  • Comisión Nacional Bancaria y de Valores (CNBV): Supervisa a todos los bancos, que cumplan con la normativa vigente, además emite los permisos para poder abrir nuevos bancos y en caso de que no cumplan con los requisitos tiene la facultad de cerrarlos.
  • Comisión Nacional de Seguros y Fianzas (CNSF): Se encarga de vigilar a las instituciones de seguros y fianzas, que tengan los recursos suficientes para poder hacer frente a sus obligaciones adquiridas respectivamente. Emite los permisos para poder abrir una compañía de seguros o para cerrar a todas las que no cumplen los requisitos para operar de acuerdo con la ley.
  • Comisión Nacional para la Protección y Defensa de los Usuarios de Servicios Financieros: Autoridad que protege a los usuarios del sistema financiero mexicano, por ejemplo, en caso de existir alguna queja en contra de un banco, ellos te pueden asesorar para resolver dicha situación.
  • Comisión Nacional del Sistema de Ahorro para el Retiro (CONSAR): tiene la función de vigilar a las Administradoras de Fondos para el Retiro (AFORES), que son instituciones encargadas de administrar los ahorros para el retiro de los trabajadores para que después de haber trabajado por muchos años, puedan garantizar un ingreso futuro a través de su pensión.
  • Instituto para la Protección del Ahorro Bancario (IPAB): Se encarga de generar un seguro de cada uno de los depósitos bancarios, es decir; si al banco le pasa algo que quiebre y tenga que cerrar, y al dinero que tengas ahorrado no le pase nada, esta protegido (hasta cierta cantidad).
Sistema Financiero Mexicano, obtenido de Marco Jurídico de las Finanzas, Quintana Adriano, Instituto de Invest. Jurídicas, UNAM, pag. 4

Intermediarios financieros

Son instituciones que actúan como puente entre quienes tienen dinero (ahorradores/inversores) y quienes lo necesitan (prestatarios/empresas), facilitando la realización de las actividades económicas.ofrecen servicios como depósitos, préstamos, seguros y gestión de inversiones, siendo esenciales para el desarrollo económico. Incluyen bancos, aseguradoras, casas de cambio, afores, casas de bolsa.

  • Bancos: Empresas que son intermediarios entre las personas que quieren ahorrar su dinero y los clientes que quieren prestarlo.
  • Aseguradoras: Se dedican a la emisión de pólizas de seguros mediante la cual, ofrecen cubrir gastos imprevistos como daños algún bien (seguro de auto) o la salud (seguro de gastos médicos), a cambio de una cantidad de dinero conocida como prima.
  • Casas de cambio: Es el lugar donde se puede adquirir otras divisas (dinero de otro país) o cambio de moneda a pesos mexicanos. Por ejemplo si quieres salir de viaje y necesitas dolares, entonces acudes a una cas de cambio y puedes cambiar los pesos mexicanos en dolares.
  • Afores: Como ya se menciono, son las instituciones encargadas de administrar los ahorros de los trabajadores para que en un futuro puedan vivir de ellos a través de una pensión
  • Casa de Bolsa: Es la institución que se encarga de llevar a cabo la compra y venta de acciones, así como de otros instrumentos financieros. Es mediante este proceso que las personas pueden hacer inversiones mediante la compra de acciones lo que les da derecho a tener un porcentaje de las utilidades que genere la empresa.

La importancia que tiene abordar estos temas, radica en el hecho que porque el dinero nos conecta como sociedad ya que todos los días lo usamos para poder solventar nuestras necesidades; y saber como funciona el sistema financiero nos ayudara mucho para poder determinar estrategias sanas de consumo de productos, bienes, servicios, créditos, etc. Entender como funciona el dinero como medio de pago, de ahorro, permite conocer los puntos de mejora en las finanzas personales de cada individuo, así como identificar las fortalezas y oportunidades para un mejor manejo.

En el siguiente link se puede consultar el organigrama completo del sistema financiero mexicano: chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://www.gob.mx/cms/uploads/attachment/file/23187/Estructura_del_Sistema_Financiero_Mexicano_2015.pdf

*Obtenido de Marco Jurídico de las Finanzas, Quintana Adriano, Instituto de Investigaciones Jurídicas, UNAM, https://archivos.juridicas.unam.mx/www/bjv/libros/11/5140/16.pdf

Más adelante…

Se abordara el concepto de interés simple, su construcción del modelo matemático que lo describe, así como las variables que interviene y la forma en que se aplica.

Ir a Matemáticas Financieras

Ir a Interés Simple

$\varepsilon-$ redes

Por Lizbeth Fernández Villegas

MATERIAL EN REVISIÓN

Introducción

El concepto de $\varepsilon -$ red está naturalmente relacionado con la distancia de Hausdorff.

Dado un espacio métrico $(X,d)$ y un subconjunto $S \subset X,$ es inmediato verificar que si $d_{H}(S,X) < \varepsilon$ entonces $S$ es una $\varepsilon -$ red en $X$ y viceversa.

Esta reformulación además hace aparente un hecho conceptualmente interesante:

Si $X$ es compacto entonces para cada $\varepsilon >0$ podemos encontrar $S_{\varepsilon} \subset X$ una $\varepsilon -$ red finita.

Sin pérdida de generalidad, podemos suponer que para $\varepsilon _1 < \varepsilon _2,$ se tiene que $S_{\varepsilon_1}$ refina a $S_{\varepsilon_2},$ de modo que:

$d_{H} (S_{\varepsilon},X) \to 0$ cuando $\varepsilon \to 0$

En otras palabras, $X$ se puede aproximar por conjuntos finitos, (es decir, existe una sucesión que converge a $X$ en $d_{H}$). ¡La compacidad se puede ver como una generalización de la finitud!

Para ponerlo de otra forma, los espacios métricos compactos son aquellos que le siguen en complejidad a los espacios finitos, en cierto sentido.

Es interesante mencionar que M. Cassarla probó que también se puede aproximar en el caso compacto a $X$ por otros objetos llamados «gráficas métricas» (que representa, a grandes rasgos un grafo dotado de una métrica) si $X$ es geodésico; la construcción básicamente se reduce a colocar aristas entre los puntos de las $\varepsilon -$ redes de manera inteligente.

Para este resultado y otra generalización aproximada por superficies suaves, ver cita artículo de Cassarla «Approximating compact inner spaces by surfaces».

Podemos sacarle aún más jugo a este análisis. Si ahora nos enfocamos en la llamada distancia de Gromov-Hausdorff (ver Burago-Burago-Ivanov capítulo 6), ¡el mismo razonamiento nos dice que la clase de espacios finitos es $d_{GH}$ -densa en la clase de espacios compactos!

Esto además de ser bonito, tiene consecuencias geniales; en esencia, toda propiedad geométrica que se pueda formular en términos de las distancias entre configuraciones finitas de puntos, es estable bajo convergencia en Gromov-Hausdorff. Por ejemplo, para aquellos que hayan llevado un curso de Geometría Diferencial, es posible describir la condición
$$sec \geq k$$
en términos de triángulos. Por lo tanto $sec \geq k$ es estable bajo $d_{GH},$ lo cual ayuda a definir el concepto de curvatura seccional en espacios métricos que no sean variedades diferenciables. (Para ver más al respecto ver Burago-Burago-Ivanov).

Más adelante

Tarea moral

Enlaces

Modelos Biomatemáticos I. Notas 6 (parte 4) — MATERIAL EN REVISIÓN

Por Mariana Paulin

6.6 Aplicaciones de matrices en modelos biológicos

Sustitución de nucleótidos en evolución

La evolución molecular analiza cómo cambian las secuencias de ADN y proteínas a lo largo del tiempo, donde uno de los procesos más importantes es la sustitución de nucleótidos, que consiste en el reemplazo de una base nitrogenada (adenina, citosina, guanina o timina) por otra dentro de la cadena de ADN. Gracias a estas mutaciones puntuales se da buena parte de la diversidad genética y conforman la base para estudiar la divergencia entre especies, reconstruir árboles filogenéticos y comprender los patrones evolutivos a nivel molecular.
Para modelar estos cambios, se utilizan procesos estocásticos, en particular cadenas de Markov, que permiten describir la probabilidad de transición de una base a otra  en un intervalo de tiempo mediante matrices de transición. (Yang, 2014)

Modelo matricial de sustitución de nucleótidos

Para modelar cómo cambia un nucleótido a otro a lo largo del tiempo, se supone que:
• El estado futuro de una base (por ejemplo, si una A mutará a G, C o T) depende únicamente del estado actual.
• Las probabilidades de sustitución entre bases son constantes en el tiempo (modelo homogéneo).
• El sistema se representa mediante una matriz de transición de tamaño 4×4, donde las filas corresponden al estado actual (base presente) y las columnas al estado futuro (base que puede ser).

Una matriz de transición $P$ tiene la forma

$P = \begin{bmatrix} p_{AA} & p_{AC} & p_{AG} & p_{AT} \\ p_{CA} & p_{CC} & p_{CG} & p_{CT} \\ p_{GA} & p_{GC} & p_{GG} & p_{GT} \\ p_{TA} & p_{TC} & p_{TG} & p_{TT} \\ \end{bmatrix}$

donde $p_{ij}$​ representa la probabilidad de que la base $i$ cambie a la base $j$ en un tiempo determinado.

Una propiedad de estas matrices es que cada fila debe sumar 1:

$$\sum_{j} p_{ij} = 1 \quad \forall i \in \{A,C,G,T\}$$

Esto es porque las probabilidades de cambiar de la base $i$ a cualquiera de las cuatro bases (incluyendo la misma) cubren todas las posibilidades y, por lo tanto, deben sumar 1.  Las matrices que cumplen esto se llaman matrices estocásticas por filas. (Rodríguez et al., 1990)

Ejemplo
Supongamos que una población de virus de ARN muta durante la replicación y que la sustitución entre nucleótidos se representa con la siguiente matriz de transición:

$M = \begin{bmatrix} 0.85 & 0.05 & 0.05 & 0.05 \\ 0.10 & 0.80 & 0.05 & 0.05 \\ 0.10 & 0.05 & 0.80 & 0.05 \\ 0.15 & 0.05 & 0.05 & 0.75 \\ \end{bmatrix}$

De modo que la fila 1 corresponde a A, la fila 2 a C, la 3 a G y la 4 a T. Entonces, por ejemplo, un nucleótido A tiene una probabilidad de 85 % de seguir siendo A, y 5 % de mutar a C, G o T.
Además, se sabe que en la secuencia hay 1000 nucleótidos distribuidos en un estado inicial como

$\mathbf{x}(0) = \begin{bmatrix} 300 \\ 200 \\ 300 \\ 200 \end{bmatrix}$

Se desea estimar la frecuencia esperada de cada nucleótido después de una generación.

Respuesta esperada
Como las frecuencias pueden ser expresadas  como proporciones, podemos dividir entre el total

$\mathbf{x}(0) = \begin{bmatrix} 0.3 \\ 0.2 \\ 0.3 \\ 0.2 \end{bmatrix}$

Para obtener el estado después de una generación, multiplicamos

$\mathbf{x}(1) = \mathbf{x}(0) \cdot M$

$\Rightarrow \mathbf{x}(1) = \begin{bmatrix} 0.3 \\ 0.2 \\ 0.3 \\ 0.2 \end{bmatrix} \cdot \begin{bmatrix} 0.85 & 0.05 & 0.05 & 0.05 \\ 0.10 & 0.80 & 0.05 & 0.05 \\ 0.10 & 0.05 & 0.80 & 0.05 \\ 0.15 & 0.05 & 0.05 & 0.75 \\ \end{bmatrix}$

• Componente A:
$0.3(0.85) + 0.2(0.10) + 0.3(0.10) + 0.2(0.15)$
$ = 0.255 + 0.02 + 0.03 + 0.03 = 0.335$
• Componente C:
$0.3(0.05) + 0.2(0.80) + 0.3(0.05) + 0.2(0.05)$
$ = 0.015 + 0.16 + 0.015 + 0.01 = 0.2$
• Componente G:
$0.3(0.05) + 0.2(0.05) + 0.3(0.80) + 0.2(0.05)$
$ = 0.015 + 0.01 + 0.24 + 0.01 = 0.275$
• Componente T:
$0.3(0.05) + 0.2(0.05) + 0.3(0.05) + 0.2(0.75)$
$ = 0.015 + 0.01 + 0.015 + 0.15 = 0.19$

Entonces

$\mathbf{x}(1) = \begin{bmatrix} 0.335 \\ 0.2 \\ 0.275 \\ 0.19 \end{bmatrix}$

Después de una generación de mutaciones, se espera que la proporción de nucleótidos cambie ligeramente: aumenta la proporción de A, de 30 % a 33.5 %; disminuye G, de 30 % a 27.5 %; C y T se mantienen igual o disminuyen levemente.

Ejemplo
Supongamos que estamos estudiando la evolución de una región específica del ADN en una población de bacterias. Queremos entender cómo las bases nitrogenadas cambian a lo largo de generaciones bajo un modelo simple donde todas las sustituciones son igualmente probables, excepto que la base puede permanecer igual con una probabilidad mayor.
Un modelo clásico para este caso es el modelo de Jukes-Cantor, que asume que todas las sustituciones de una base a otra tienen la misma probabilidad y el proceso es homogéneo y estacionario en el tiempo.

Supongamos que para un intervalo de tiempo $t$, la matriz de transición es:

$M = \begin{bmatrix} 0.7 & 0.1 & 0.1 & 0.1 \\ 0.1 & 0.7 & 0.1 & 0.1 \\ 0.1 & 0.1 & 0.7 & 0.1 \\ 0.1 & 0.1 & 0.1 & 0.7 \\ \end{bmatrix}$​​

Esto significa, por ejemplo, que si en la generación actual la base es A, en la siguiente generación hay un 70 % de probabilidad de que siga siendo A, y un 10 % de cambiar a C, G o T respectivamente.
Si comenzamos con una población en la que la base en una posición es A con probabilidad 1 (seguro), ¿cuál será la distribución de bases después de un intervalo de tiempo?
La distribución inicial es

$\mathbf{x}(0) = \begin{bmatrix} 1 \\ 0 \\ 0 \\ 0 \end{bmatrix}$

Para obtener la distribución en la siguiente generación, multiplicamos por la matriz $M$

$\mathbf{x}(1) = \mathbf{x}(0) \cdot M = \begin{bmatrix} 1 \\ 0 \\ 0 \\ 0 \end{bmatrix} \cdot \begin{bmatrix} 0.7 & 0.1 & 0.1 & 0.1 \\ 0.1 & 0.7 & 0.1 & 0.1 \\ 0.1 & 0.1 & 0.7 & 0.1 \\ 0.1 & 0.1 & 0.1 & 0.7 \\ \end{bmatrix} = \begin{bmatrix} 0.7 \\ 0.1 \\ 0.1 \\ 0.1 \end{bmatrix}$

Por lo que después de ese intervalo, la base tiene un 70 % de seguir siendo A y un 10 % de ser cada una de las otras bases.

Ejercicio
Se tiene la siguiente matriz de transición para las sustituciones de nucleótidos en una población de virus:

$M = \begin{bmatrix} 0.6 & 0.2 & 0.1 & 0.1 \\ 0.1 & 0.7 & 0.1 & 0.1 \\ 0.2 & 0.1 & 0.6 & 0.1 \\ 0.1 & 0.2 & 0.1 & 0.6 \\ \end{bmatrix}$

Si inicialmente la base es G con probabilidad 1, ¿cuál será la distribución de bases después de un intervalo de tiempo?
Supón que el vector de estado inicial es $\mathbf{x}(0) = \begin{bmatrix} 0 \\ 0 \\ 1 \\ 0 \end{bmatrix}$

Respuesta esperada
Multiplicamos

$\mathbf{x}(1) = \mathbf{x}(0) \cdot M = \begin{bmatrix} 0 \\ 0 \\ 1 \\ 0 \end{bmatrix} \cdot \begin{bmatrix} 0.6 & 0.2 & 0.1 & 0.1 \\ 0.1 & 0.7 & 0.1 & 0.1 \\ 0.2 & 0.1 & 0.6 & 0.1 \\ 0.1 & 0.2 & 0.1 & 0.6 \\ \end{bmatrix} = \begin{bmatrix} 0.2 \\ 0.1 \\ 0.6 \\ 0.1 \end{bmatrix}$

Luego, después del intervalo, la base será A con probabilidad 0.2, C con 0.1, G con 0.6, y T con 0.1.

Modelo SIR en epidemiología 

El modelo SIR es un modelo matemático que describe cómo se propaga una enfermedad infecciosa en una población. Se llama SIR porque divide a la población en tres clases: susceptibles, individuos sanos que pueden enfermar si tienen contacto con una persona infectada; infectados, individuos que actualmente tienen la enfermedad y pueden contagiarla; recuperados, individuos que ya no están enfermos y no pueden contagiar ni contagiarse.

Los cambios se modelan con ecuaciones diferenciales, que indican cómo varía cada grupo en función del tiempo.

$\begin{aligned} \frac{dS}{dt} &= -\beta S I \\ \frac{dI}{dt} &= \beta S I-\gamma I \\ \frac{dR}{dt} &= \gamma I \end{aligned}$

donde
• $\beta$ es la tasa de transmisión (contacto entre susceptibles e infectados),
• $\gamma$ es la tasa de recuperación.

Este modelo describe el cambio de una epidemia en el tiempo, siendo no lineal debido al término $\beta S I$. No obstante, se puede linealizar el sistema y representarlo en forma matricial.
Para simular paso a paso (por ejemplo, día a día), sin usar derivadas directamente, usaremos el método de aproximaciones de Eüler: dada una unidad de tiempo $\Delta t$ tenemos que

$\begin{aligned} S(t + \Delta t) &\approx S(t) + \Delta t \cdot \frac{dS}{dt}(t), \\ I(t + \Delta t) &\approx I(t) + \Delta t \cdot \frac{dI}{dt}(t), \\ R(t + \Delta t) &\approx R(t) + \Delta t \cdot \frac{dR}{dt}(t). \end{aligned}$

Sustituimos las derivadas del modelo SIR y queda que

$\begin{aligned} S(t + \Delta t) &\approx S(t)-\Delta t \cdot \beta S(t) I(t), \\ I(t + \Delta t) &\approx I(t) + \Delta t \cdot ( \beta S(t) I(t)-\gamma I(t) ), \\ R(t + \Delta t) &\approx R(t) + \Delta t \cdot \gamma I(t). \end{aligned}$

Ahora, para formular esto como una multiplicación matricial del tipo

$\mathbf{x}(t + \Delta t) = A \cdot \mathbf{x}(t),$

donde

$\mathbf{x}(t) = \begin{bmatrix} S(t) \\ I(t) \\ R(t) \end{bmatrix},$

queremos una matriz $A$ tal que al multiplicar por $\mathbf{x}(t)$ resulten las expresiones anteriores. Una manera es asumir que durante ese pequeño intervalo de tiempo $\Delta t$, el término no lineal $\beta S(t) I(t)$ se puede “incorporar” en la matriz, si mantenemos $I(t)$ como constante en ese momento para la construcción de la matriz (Suryanto, 2014).

Tomamos $\Delta t = 1$ para tener que

$\begin{aligned} S(t+1) &= (1-\beta I(t)) \, S(t), \\ I(t+1) &= \beta I(t) \, S(t) + (1-\gamma) I(t), \\ R(t+1) &= \gamma I(t) + R(t). \end{aligned}$

Esto corresponde a decir que

$\begin{bmatrix} S(t+1) \\ I(t+1) \\ R(t+1) \end{bmatrix} = \begin{bmatrix} 1-\beta I(t) & 0 & 0 \\ \beta I(t) & 1-\gamma & 0 \\ 0 & \gamma & 1 \end{bmatrix} \cdot \begin{bmatrix} S(t) \\ I(t) \\ R(t) \end{bmatrix}​$

donde $I_0$ representa una cantidad inicial de infectados en la primera fase. Esta matriz permite ver cómo cambian los compartimentos en pequeños intervalos discretos  (Bonhoeffer & Schafroth, 2020).

Ejemplo
Supongamos que en una población cerrada de 1000 personas, 780 son susceptibles, 220 están infectadas y 0 se han recuperado; y la enfermedad tiene
• Tasa de transmisión $\beta = 0.03$
• Tasa de recuperación $\gamma = 0.1$
¿Cuántas personas habrá en cada grupo al día siguiente?

Respuesta esperada
El estado inicial es

$\mathbf{x}(0) = \begin{bmatrix} S(0) \\ I(0) \\ R(0) \end{bmatrix} = \begin{bmatrix} 0.78 \\ 0.22 \\ 0 \end{bmatrix}$​​

La matriz de transición es

$A = \begin{bmatrix} 1-\beta I(0) & 0 & 0 \\ \beta I(0) & 1-\gamma & 0 \\ 0 & \gamma & 1 \end{bmatrix}$

Sustituimos los valores: $\beta = 0.03,\quad I(0) = 0.22,\quad \gamma = 0.1$

$\Rightarrow A = \begin{bmatrix} 1-0.03(0.22) & 0 & 0 \\ 0.03(0.22) & 1-0.1 & 0 \\ 0 & 0.1 & 1 \end{bmatrix} = \begin{bmatrix} 0.9934 & 0 & 0 \\ 0.0066 & 0.9 & 0 \\ 0 & 0.1 & 1 \end{bmatrix}$

Calculamos el estado al siguiente momento

$\mathbf{x}(1) = A \cdot \mathbf{x}(0) = \begin{bmatrix} 0.9934 & 0 & 0 \\ 0.0066 & 0.9 & 0 \\ 0 & 0.1 & 1 \end{bmatrix} \cdot \begin{bmatrix} 0.78 \\ 0.22 \\ 0 \end{bmatrix} = \begin{bmatrix} 0.77766 \\ 0.20034 \\ 0.022 \end{bmatrix}$​​

Luego $\mathbf{x}(1) = \begin{bmatrix} 0.774 \\ 0.204 \\ 0.022 \end{bmatrix}$

Entonces, después de un día, aproximadamente: 6 personas dejaron de ser susceptibles, hay 16 infectados menos que al inicio y 22 personas se recuperaron.

Ejercicio
Supongamos que en una comunidad de 500 personas, 495 son susceptibles, 5 están infectadas y 0 están recuperadas. Y se tienen las tasas: $\beta = 0.001$ y $\gamma = 0.2$.
a. Escribe el vector de estado inicial
b. Escribe la matriz de transición
c. Calcula cómo estará distribuida la población al día siguiente.

Respuesta esperada
a.

$\mathbf{x}(0) = \begin{bmatrix} S(0) \\ I(0) \\ R(0) \end{bmatrix} = \begin{bmatrix} \frac{495}{500} \\ \frac{5}{500} \\ 0 \end{bmatrix} = \begin{bmatrix} 0.99 \\ 0.01 \\ 0 \end{bmatrix}$

b. Tenemos

$A = \begin{bmatrix} 1-\beta I(0) & 0 & 0 \\ \beta I(0) & 1-\gamma & 0 \\ 0 & \gamma & 1 \end{bmatrix}$​​

Sustituimos los valores: $\beta = 0.001,\quad I(0) = 0.01,\quad \gamma = 0.2$

$\Rightarrow A = \begin{bmatrix} 1-0.001 \cdot 0.01 & 0 & 0 \\ 0.001 \cdot 0.01 & 0.8 & 0 \\ 0 & 0.2 & 1 \end{bmatrix} = \begin{bmatrix} 0.99999 & 0 & 0 \\ 0.00001 & 0.8 & 0 \\ 0 & 0.2 & 1 \end{bmatrix}$​​

c.

$\mathbf{x}(1) = \begin{bmatrix} 0.99999 & 0 & 0 \\ 0.00001 & 0.8 & 0 \\ 0 & 0.2 & 1 \end{bmatrix} \cdot \begin{bmatrix} 0.99 \\ 0.01 \\ 0 \end{bmatrix} = \begin{bmatrix} 0.9809901 \\ 0.0080099 \\ 0.002 \end{bmatrix}$

Si multiplicamos por 500 para obtener los valores absolutos, tendemos que al día siguiente hay aproximadamente 491 individuos susceptibles, 5 individuos infectados y 1 recuperado.

Diagrama cinemático en conducta animal

En etología (el estudio científico del comportamiento animal), es común modelar el comportamiento de un organismo como una secuencia de estados discretos: por ejemplo, buscar alimento, alimentarse, descansar, explorar, etcétera.
Un diagrama cinemático es una representación de estas transiciones de un estado a otro, usando una matriz de transición que permita cuantificar y predecir cómo un animal cambia de comportamiento con el tiempo.
Este enfoque es análogo a un sistema de Markov en tiempo discreto, donde cada estado es una clase o comportamiento, así, cada comportamiento observado en un instante depende sólo del estado anterior y las probabilidades o tasas de transición se representan mediante una matriz cuadrada. (Metz, Dienske, de Jonge, 1983)

Representación matricial

El modelo se escribe como $\mathbf{x}(t+1) = A \cdot \mathbf{x}(t)$ donde
• $\mathbf{x}(t)$ es el vector que representa la proporción (o número absoluto) de individuos en cada estado conductual en el instante $t$,
• $A$ es la matriz de transición donde cada entrada $a_{ij}$​ representa la probabilidad de que un individuo en el estado $j$ en $t$ pase al estado $i$ en $t+1$.
En ese caso, $A$ es una matriz estocástica por columnas.

Ejemplo
Supongamos que un ave muestra tres comportamientos observables que categorizamos en estados: estado 1, buscar alimento; estado 2, comer; estado 3, descansar.
Supongamos que se realiza un registro conductual durante cada hora y se estima la siguiente matriz de transición

$A = \begin{bmatrix} 0.1 & 0.6 & 0.3 \\ 0.6 & 0.2 & 0.2 \\ 0.3 & 0.2 & 0.5 \end{bmatrix}$

Es decir, se observó que

• Desde el estado 2 (comer), el 60 % de las veces el ave pasa a buscar alimento (estado 1), el 20 % se mantiene comiendo, y el 20 % pasa a descansar.
• Desde el estado 3 (descansar), el 50 % de las veces continúa descansando, un 30 % pasa a buscar alimento, y un 20 % a comer.

Supongamos que al tiempo $t = 0$, la distribución comportamental es

$\mathbf{x}(0) = \begin{bmatrix} 0.2 \\ 0.5 \\ 0.3 \end{bmatrix}$

Es decir, el 20 % está buscando alimento, el 50 % está comiendo, y el 30 % está descansando.
Si queremos calcular la distribución en el siguiente instante:

$\mathbf{x}(1) = A \cdot \mathbf{x}(0) = \begin{bmatrix} 0.1 & 0.6 & 0.3 \\ 0.6 & 0.2 & 0.2 \\ 0.3 & 0.2 & 0.5 \end{bmatrix} \cdot \begin{bmatrix} 0.2 \\ 0.5 \\ 0.3 \end{bmatrix}$

$\begin{aligned} x_1(1) &= 0.1(0.2) + 0.6(0.5) + 0.3(0.3) = 0.02 + 0.30 + 0.09 = 0.41 \\ x_2(1) &= 0.6(0.2) + 0.2(0.5) + 0.2(0.3) = 0.12 + 0.10 + 0.06 = 0.28 \\ x_3(1) &= 0.3(0.2) + 0.2(0.5) + 0.5(0.3) = 0.06 + 0.10 + 0.15 = 0.31 \end{aligned}$

$\Rightarrow \mathbf{x}(1) = \begin{bmatrix} 0.41 \\ 0.28 \\ 0.31 \end{bmatrix}$​​

Podemos decir que después de una unidad de tiempo, el comportamiento dominante se ha desplazado hacia Buscar alimento.

Comportamiento a largo plazo

En el estudio del comportamiento animal, además de conocer cómo cambia la conducta momento a momento, también podemos entender cómo se estabiliza un patrón de comportamiento a largo plazo. Por ejemplo, podemos preguntarnos ¿cuánto tiempo pasa un animal, en promedio, comiendo o descansando si lo observamos durante muchas horas o muchos días?
Para responder esto, debemos estudiar el comportamiento asintótico del sistema, si el modelo de transición de comportamientos se considera como una cadena de Markov en tiempo discreto. Es decir, si suponemos que el comportamiento de un animal se modela por una matriz de transición $A$ que satisface

$\mathbf{x}(t+1) = A \cdot \mathbf{x}(t)$

entonces, bajo ciertas condiciones, existe un vector estacionario $\mathbf{v}$ tal que

$$A \cdot \mathbf{v} = \mathbf{v}, \quad \text{con} \quad \sum_{i} v_i = 1$$

Este vector $\mathbf{v}$ representa una distribución invariante, o sea que si el comportamiento del animal en el tiempo $t$ está dado por $\mathbf{x}(t) = \mathbf{v}$, entonces en todos los tiempos futuros se mantendrá igual: $\mathbf{x}(t+1) = \mathbf{v}, \mathbf{x}(t+2) = \mathbf{v}, \ldots$ (Schinazi, 1999).
Entonces, si lo vemos desde el punto de vista etológico, el vector estacionario representará la proporción de tiempo que un animal pasará en promedio en cada estado conductual si se lo observa por un periodo suficientemente largo. Esto no implica que el animal esté congelado en esos estados, sino que, a lo largo del tiempo su comportamiento oscilará entre ellos con una proporción promedio estable.
Ahora, como se mencionó anteriormente, se requieren ciertas condiciones para que exista y se alcance esta distribución estable. No todas las matrices de transición garantizan que exista un comportamiento estacionario alcanzable desde cualquier estado inicial. Para que sí exista y se cumpla

$$\lim_{t \to \infty} \mathbf{x}(t) = \mathbf{v}$$

es necesario que la matriz $A$ sea regular, lo cual en términos prácticos significa que alguna potencia de $A$ tiene todas sus entradas estrictamente positivas. Esto implica que es posible ir de cualquier estado a cualquier otro, y que no hay estados absorbentes, o sea de los que ya no se puede salir.

Para encontrar el vector estacionario $\mathbf{v}$, se resuelve el sistema

$$A \cdot \mathbf{v} = \mathbf{v}, \quad \sum_{i} v_i = 1$$

Que es lo mismo que resolver

$$(A-I)\mathbf{v} = 0, \quad \text{con} \quad \sum_{i} v_i = 1$$

Este sistema suele resolverse algebraicamente o numéricamente. En la práctica, también puede aproximarse aplicando repetidamente la matriz a un estado inicial arbitrario (iteraciones sucesivas de x(t+1)=A⋅x(t)\mathbf{x}(t+1) = A \cdot \mathbf{x}(t)x(t+1)=A⋅x(t)) hasta que se estabilicen los valores.

Ejercicio
Una tortuga exhibe tres estados de comportamiento: explorar (1), comer (2) y dormir (3). Supongamos que con observaciones se obtiene la matriz de transición

$A = \begin{bmatrix} 0.3 & 0.1 & 0.2 \\ 0.4 & 0.6 & 0.3 \\ 0.3 & 0.3 & 0.5 \end{bmatrix}$​​

a. Verifica si $A$ es una matriz estocástica por columnas.
b. Si la distribución inicial es $\mathbf{x}(0) = \begin{bmatrix} 0.3 \\ 0.5 \\ 0.2 \end{bmatrix}$​​, encuentra $\mathbf{x}(1)$.
c. Calcula la distribución estacionaria $\mathbf{v}$.

Respuesta esperada
a. Sabemos que una matriz es estocástica por columnas si cada columna suma 1.
Columna 1: $0.3 + 0.4 + 0.3 = 1$
Columna 2: $0.1 + 0.6 + 0.3 = 1$
Columna 3: $0.2 + 0.3 + 0.5 = 1$
Entonces sí, $A$ es estocástica por columnas.

b. 

$\mathbf{x}(1) = A \cdot \mathbf{x}(0) = \begin{bmatrix} 0.3 & 0.1 & 0.2 \\ 0.4 & 0.6 & 0.3 \\ 0.3 & 0.3 & 0.5 \\ \end{bmatrix} \cdot \begin{bmatrix} 0.3 \\ 0.5 \\ 0.2 \end{bmatrix}$​​

$\mathbf{x_1}(1) = 0.3(0.3) + 0.1(0.5) + 0.2(0.2) = 0.09 + 0.05 + 0.04 = 0.18$
$\mathbf{x_2}(1) = 0.4(0.3) + 0.6(0.5) + 0.3(0.2) = 0.12 + 0.30 + 0.06 = 0.48$
$\mathbf{x_3}(1) = 0.3(0.3) + 0.3(0.5) + 0.5(0.2) = 0.09 + 0.15 + 0.10 = 0.34$
$\Rightarrow \mathbf{x}(1) = \begin{bmatrix} 0.18 \\ 0.48 \\ 0.34 \end{bmatrix}$

Esto quiere decir que, después de un intervalo de tiempo, la mayoría de las tortugas están comiendo (48 %), seguidas de dormir (34 %) y explorar (18 %).

c. Comenzamos calculando $A-I$

$A = \begin{bmatrix} 0.3 & 0.1 & 0.2 \\ 0.4 & 0.6 & 0.3 \\ 0.3 & 0.3 & 0.5 \end{bmatrix}, \quad I = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}$

$A-I = \begin{bmatrix} -0.7 & 0.1 & 0.2 \\ 0.4 & -0.4 & 0.3 \\ 0.3 & 0.3 & -0.5 \end{bmatrix}$

Entonces buscamos $\mathbf{v}$ tal que

$(A-I)\mathbf{v} = 0, \quad \text{con } v_1 + v_2 + v_3 = 1$

Escribimos el sistema como ecuaciones para resolverlo

$\begin{cases} -0.7v_1 + 0.1v_2 + 0.2v_3 = 0 \quad \text{(ec1)} \\ 0.4v_1-0.4v_2 + 0.3v_3 = 0 \quad \text{(ec2)} \\ 0.3v_1 + 0.3v_2-0.5v_3 = 0 \quad \text{(ec3)} \\ v_1 + v_2 + v_3 = 1 \quad \text{(ec4)} \end{cases}$

Usamos ec1 y ec2 para resolver por eliminación:
multiplicamos ec1 por 4 y ec2 por 7 para igualar los coeficientes de $v_1$​, obtenemos
ec1: $-2.8v_1 + 0.4v_2 + 0.8v_3 = 0$
ec2: $2.8v_1-2.8v_2 + 2.1v_3 = 0$

Sumamos ambas ecuaciones
$(-2.8 + 2.8)v_1 + (0.4-2.8)v_2 + (0.8 + 2.1)v_3 = 0$
$\Rightarrow -2.4v_2 + 2.9v_3 = 0$

entonces

$$2.9v_3 = 2.4v_2 \Rightarrow v_3 = \frac{2.4}{2.9}v_2 \approx 0.8276v_2$$

Sustituimos $v_3$​ en términos de $v_2$ en ec4 para obtener todos los valores, si tenemos inicialmente ec4: $v_1 + v_2 + v_3 = 1$, entonces
$v_1 + v_2 + 0.8276v_2 = 1$
$v_1 + 1.8276v_2 = 1$
$\Rightarrow v_1 = 1-1.8276v_2$
Este sistema tiene infinitas soluciones, por lo que elegimos a $v_2$ como variable libre y la igualamos a $t$, de modo que

$v_2 = t \Rightarrow v_3 = 0.8276t \Rightarrow v_1 = 1-t-0.8276t = 1-1.8276t$

luego, la familia de soluciones es

$\mathbf{v}(t) = \begin{bmatrix} 1-1.8276t \\ t \\ 0.8276t \end{bmatrix}$​​

Sabemos que para que $\mathbf{v}$ sea una distribución de probabilidad válida, se deben cumplir las condiciones:
• Los valores deben sumar 1 (se cumple por construcción).
• Todos los valores deben ser mayores o iguales que cero.

Observemos que $v_1 = 1-1.8276t$ podría volverse negativa si $t$ es muy grande, entonces tenemos la condición

$$1-1.8276t \geq 0 \Rightarrow t \leq \frac{1}{1.8276} \approx 0.547$$

Entonces, cualquier valor de $t$ en el intervalo $[0, 0.547]$ generará una distribución válida. Dentro del intervalo válido, tomamos arbitrariamente $t=0.4$, de modo que

$t = 0.4 \Rightarrow v_2 = 0.4, \quad v_3 = 0.8276 \cdot 0.4 \approx 0.331, \quad v_1 = 1-0.4-0.331 = 0.269$

Obtenemos el vector

$\mathbf{v} \approx \begin{bmatrix} 0.269 \\ 0.4 \\ 0.331 \end{bmatrix}$​​

Este vector ya suma 1 (aproximadamente) y todos los valores son positivos. Por tanto, es una distribución estacionaria válida.
Esto quiere decir que, a largo plazo, la tortuga pasará aproximadamente 26.9 % del tiempo explorando, 40.0 % del tiempo comiendo, y 33.1 % del tiempo durmiendo.

Ejercicio
Supón que un insecto muestra cuatro estados de comportamientos: buscar alimento (1), comer (2), escapar (3), y reposar (4). Y que la matriz de transición es

$A = \begin{bmatrix} 0.1 & 0.2 & 0.4 & 0.1 \\ 0.7 & 0.3 & 0.1 & 0.2 \\ 0.1 & 0.2 & 0.4 & 0.2 \\ 0.1 & 0.3 & 0.1 & 0.5 \\ \end{bmatrix}$

a. Responde: ¿cuál es la interpretación de $a_{23} = 0.1$?
b. Comprueba que $A$ es estocástica por columnas.
c. Si $\mathbf{x}(0) = \begin{bmatrix} 0.25 \\ 0.25 \\ 0.25 \\ 0.25 \end{bmatrix}$​​, encuentra $\mathbf{x}(1)$.
d. Responde: ¿cuál es la interpretación biológica de una distribución estacionaria en este contexto?

Respuesta esperada
a. $a_{23} = 0.1$ indica que hay una probabilidad del 10 % de que un insecto que está en el estado 3, escapar, pase al estado 2, comer, en el siguiente intervalo de tiempo.
b. 
Columna 1: $0.1 + 0.7 + 0.1 + 0.1 = 1$
Columna 2: $0.2 + 0.3 + 0.2 + 0.3 = 1$
Columna 3: $0.4 + 0.1 + 0.4 + 0.1 = 1$
Columna 4: $0.1 + 0.2 + 0.2 + 0.5 = 1$
Luego, $A$ es estocástica por columnas.
c. 

$\mathbf{x}(1) = A \cdot \mathbf{x}(0) = \begin{bmatrix} 0.1 & 0.2 & 0.4 & 0.1 \\ 0.7 & 0.3 & 0.1 & 0.2 \\ 0.1 & 0.2 & 0.4 & 0.2 \\ 0.1 & 0.3 & 0.1 & 0.5 \end{bmatrix} \cdot \begin{bmatrix} 0.25 \\ 0.25 \\ 0.25 \\ 0.25 \end{bmatrix}$

$\mathbf{x_1}(1) = 0.1(0.25) + 0.2(0.25) + 0.4(0.25) + 0.1(0.25) = 0.025 + 0.05 + 0.10 + 0.025 = 0.20$
$\mathbf{x_2}(1) = 0.7(0.25) + 0.3(0.25) + 0.1(0.25) + 0.2(0.25) = 0.175 + 0.075 + 0.025 + 0.05 = 0.325$
$\mathbf{x_3}(1) = 0.1(0.25) + 0.2(0.25) + 0.4(0.25) + 0.2(0.25) = 0.025 + 0.05 + 0.10 + 0.05 = 0.225$
$\mathbf{x_4}(1) = 0.1(0.25) + 0.3(0.25) + 0.1(0.25) + 0.5(0.25) = 0.025 + 0.075 + 0.025 + 0.125 = 0.25$

$\Rightarrow \mathbf{x}(1) = \begin{bmatrix} 0.20 \\ 0.325 \\ 0.225 \\ 0.25 \end{bmatrix}$​​

Esto quiere decir que en este intervalo, el comportamiento más frecuente será comer (32.5 %), seguido de reposar (25 %), escapar (22.5 %) y buscar alimento (20 %).

d. Sabemos que una distribución estacionaria representa la proporción estable de tiempo que el insecto pasa en cada estado de comportamiento a largo plazo, independientemente del estado inicial. Es decir que se trata del comportamiento promedio que se espera del insecto si se observa durante un periodo largo, donde el patrón de cambio entre estados ya no varía tanto.

[Faltan las referencias]