En la entrada pasada vimos el último tipo importante de v.a. que veremos, por ahora: las v.a.’s mixtas. En particular, vimos una manera de construir v.a.’s mixtas siguiendo un método muy sencillo: evaluando el y el en alguna v.a. continua. Esto puede pensarse como «transformar» la v.a. continua dada mediante las funciones y . No sólamente la transformación fue posible, sino que además la función resultante es una v.a., y obtuvimos su función de distribución. Este proceso puede generalizarse para obtener la distribución de muchas más funciones de v.a.’s continuas.
Composición de funciones y variables aleatorias
Una de las cosas que hicimos en la entrada pasada fue ver que, dada una v.a. continua , podíamos obtener v.a.’s mixtas a partir de . Vamos a refinar un poco lo que hicimos en la entrada pasada. Sea , y sea la función dada por
De este modo, definimos una v.a. nueva como . Sin embargo, ¿qué es exactamente «»? Sabemos que es una «variable aleatoria», lo que significa que es como «evaluar» una función en una variable aleatoria. No obstante, esto no es otra cosa que… ¡una composición de funciones! Como recordatorio de Álgebra Superior I, dadas funciones , , la composición , llamada seguida de , se define como
Recordando la definición de variable aleatoria, cuando tenemos un espacio de probabilidad sabemos que una función es una variable aleatoria si satisface una condición de «medibilidad», que dimos hace unas entradas. De momento, lo que más nos importa es que una v.a. es una función. En consecuencia, la v.a. que definimos no es otra cosa que , dada por
que es justamente como la definimos en la entrada anterior a esta. Ahora bien, dadas una v.a. y una función , hay que tener cuidado con para que sea una v.a., pues puede pasar que la función resultante no es una variable aleatoria, de acuerdo con la definición. Nosotros nos abstendremos de presentar casos degenerados de ese estilo, pero expondremos las condiciones que se necesitan para que una transformación de una v.a. sea nuevamente una v.a.
¿Cuáles funciones sí dan como resultado variables aleatorias?
Comenzaremos con una definición general del tipo de funciones que nos serán útiles.
Definición. Si es una función, diremos que es una función Borel-medible si para cada se cumple que .
Es decir, es una función Borel-medible si la imagen inversa de cualquier elemento del σ-álgebra de Borel es también un elemento del σ-álgebra de Borel.
Si recuerdas la definición de variable aleatoria, podrás observar que… ¡Es casi la misma! En realidad, ambas son el mismo concepto en la teoría más general: son funciones medibles. En particular, las funciones Borel-medibles reciben su nombre por el σ-álgebra que preservan: el σ-álgebra de Borel. De hecho, observa que las funciones Borel-medibles son un caso particular de nuestra definición de variable aleatoria, usando como espacio de probabilidad. Por ello, todos los resultamos que hemos visto hasta ahora para v.a.’s aplican para funciones Borel-medibles.
Resulta que esta clase de funciones son aquellas que, al componer con una v.a., nos devuelven otra variable aleatoria.
Proposición. Sean un espacio de probabilidad, una v.a. y una función Borel-medible. Entonces es una variable aleatoria.
Demostración. Queremos demostrar que es una variable aleatoria. Es decir, que para cada se cumple que . Ahora, , por propiedades de la imagen inversa. En consecuencia, hay que ver que para cada se cumple que .
Sea . Como es una función Borel-medible, esto implica que . Ahora, como es una variable aleatoria, implica , que es justamente lo que queríamos demostrar.
Así, si es una función Borel-medible y es una variable aleatoria, entonces es también una variable aleatoria.
Pero entonces, ¿qué funciones podemos usar?
A pesar de que lo anterior nos da muchas funciones con las cuales transformar v.a.’s, de momento quizás no conozcas ninguna función Borel-medible. No temas, el siguiente teorema nos da una gran cantidad de funciones que son Borel-medibles, y con las cuales seguramente te has encontrado antes.
Proposición. Si es una función continua, entonces es Borel-medible.
Demostración. Sea una función continua. Queremos demostrar que es Borel-medible. Es decir, que para cada , .
Sea . Como es un intervalo abierto, es un subconjunto abierto (en la topología usual) de . En consecuencia, como es continua, también es un subconjunto abierto de .
Ahora, como es un abierto, esto implica que existe una familia numerable de intervalos abiertos tales que
Nota que como es un intervalo abierto, para cada , entonces . Por lo tanto, , que implica , que es justamente lo que queríamos demostrar.
Es muy probable que estés cursando Cálculo Diferencial e Integral III al mismo tiempo que esta materia, por lo que quizás no hayas visto algunos detalles de la topología usual de que utilizamos en la demostración anterior. Puedes consultar nuestras notas de Cálculo Diferencial e Integral III sobre el tema si lo consideras necesario.
Con esta última proposición hemos encontrado una gran cantidad de funciones válidas para transformar v.a.’s. Seguramente conoces muchísimas funciones continuas: los polinomios, funciones lineales, algunas funciones trigonométricas (como y ), etcétera.
Un primer método para obtener la distribución de una transformación
Una vez que conocemos muchas funciones con las cuales podemos transformar v.a.’s, nuestro objetivo es encontrar la distribución de tales transformaciones. Si es una función Borel-medible y es una v.a. (cuya función de distribución es conocida), queremos encontrar la distribución de . Para hacerlo, basta con encontrar la probabilidad de los eventos de la forma
Es común encontrar la notación , y de este modo, se usa para referirse a los eventos .
Sin embargo, el caso de las v.a.’s discretas puede ser más sencillo, ya que la función de masa de probabilidad caracteriza el comportamiento de ese tipo de v’a’s. Veamos cómo hacerlo mediante el siguiente ejemplo.
Ejemplo. Sea una v.a. con función de masa de probabilidad dada por
Figura. Gráfica de la función de masa de probabilidad de .
Ahora, sea la función dada por
Defínase , es decir, . Primero, el conjunto de posibles valores que puede tomar es
Observa que puede tomar valores distintos, mientras que puede tomar . Ya desde este momento se nota que las probabilidades de los eventos que involucran a van a ser distintas a los de .
Sea . Para obtener la función de masa de probabilidad de tenemos que obtener la probabilidad de los eventos de la forma . Este evento es
Es decir, . Usando la definición de , se tiene que
esto es, es un elemento de si y sólamente si o . Esto es equivalente a que , por lo que podemos concluir que
En consecuencia, , y así:
Para , observa que
pues toma valores en los reales, no en los complejos. Del mismo modo, cuando , ; y así,
Por otro lado, para , sólamente hay valores que importan: , y , como acordamos previamente. Para el caso de , observa que , pues
Por lo tanto, se tiene que
Para y sí podemos aplicar la fórmula que obtuvimos:
En conclusión, la función de masa de probabilidad de es la función dada por
Figura. Función de masa de probabilidad de .
El ejemplo anterior ilustra lo que se debe de hacer para obtener las probabilidades de la transformación de una v.a. discreta. Sea una v.a. y sea una función Borel-medible. Para cada , sabemos que el evento no es otra cosa que . Definimos la v.a. como . Ahora, sabemos que para cada se cumple que
por la definición de imagen inversa. En consecuencia, para tenemos que
Por lo que . Por ello, . Esto tiene sentido: como , entonces la probabilidad de que tome algún valor en es la misma que la probabilidad de que tome algún valor en , pues todos los elementos de son mandados a cuando se les aplica .
Finalmente, utilizando que es una v.a. discreta, tendremos que
En el caso particular en el que existe tal que , tendremos que
justamente como hicimos en el ejemplo anterior. A continuación presentamos otro ejemplo siguiendo la misma metodología.
Ejemplo. Sea una v.a. con función de masa de probabilidad dada por
Figura. Gráfica de la función de masa de probabilidad de .
Nuevamente, considera la transformación dada por para cada . De este modo, defínase la v.a. como . Antes que nada, el conjunto de valores que puede tomar es el resultado de transformar el conjunto de los valores que puede tomar . Si es el conjunto de valores que puede tomar , entonces el conjunto de valores que puede tomar es
Como es la misma transformación que en el ejemplo anterior, hay algunas cosas que ya sabemos. Primero,
mientras que para , se tiene que . Para , vimos previamente que . Así, tendremos que
En particular, la v.a. sólamente toma probabilidades mayores a en , por lo que para , y en otro caso. Así, tenemos que
Alternativamente, podemos obtener una fórmula cerrada para cada , que queda así:
Y así obtenemos una expresión para la función de masa de probabilidad de :
Figura. Gráfica de la función de masa de probabilidad de .
Tarea moral
Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu dominio de los conceptos abordados en esta entrada.
Verifica que la función de masa de probabilidad de la v.a. del primer ejemplo satisface las propiedades de una función de masa de probabilidad.
Haz lo mismo para la función de masa de probabilidad de la v.a. del segundo ejemplo.
Retomando los dos ejemplos vistos en esta entrada y las v.a.’s y de cada ejemplo, y tomando la transformación dada por :
Encuentra la función de masa de probabilidad de .
Encuentra la función de masa de probabilidad de .
Más adelante…
El método expuesto en esta entrada funciona para cualquier variable aleatoria discreta. No hay fórmulas «cerradas» para la f.m.p. (función de masa de probabilidad) de la transformación de una v.a. discreta. Sin embargo, las fórmulas y son suficientes para encontrar las probabilidades de eventos que involucran a la transformación de la v.a. discreta conocida. No obstante, estas fórmulas sólamente funcionan para v.a.’s discretas. Por ello, en la siguiente entrada centraremos nuestra atención en el caso de las v.a.’s continuas.