En las entradas pasadas introdujimos los conceptos de variable aleatoria y función de distribución. Además, al final de la entrada pasada comentamos que las variables aleatorias pueden clasificarse como discretas o continuas, dependiendo de la cardinalidad del conjunto de valores que pueden tomar.
En esta entrada trataremos el caso de las variables aleatorias discretas. En el contexto de las matemáticas se usa el término «discreta» para hacer referencia a conjuntos finitos o infinitos numerables. Por ello, a grandes rasgos, las variables aleatorias discretas son aquellas cuyo conjunto de valores que pueden tomar es a lo más infinito numerable.
¡IMPORTANTE! Algunas convenciones que usaremos
De ahora en adelante, escribiremos «variable aleatoria» simplemente como v.a. De este modo, por ejemplo, cuando digamos «sea una v.a.», deberás de leerlo como «sea una variable aleatoria».
Por otro lado, usaremos los límites laterales (por la derecha y por la izquierda) de la función de distribución, por lo que introduciremos la siguiente notación: si es una función, entonces
En otras palabras,
es el límite de cuando tiende a por la derecha.
es el límite de cuando tiende a por la izquierda.
Esta convención facilita la escritura de las fórmulas que involucran a estos límites.
Definición de variable aleatoria discreta
Como su nombre lo indica, una v.a. discreta es aquella v.a. cuyo conjunto de valores que puede tomar es un conjunto de cardinalidad a lo más numerable. Es decir, que la cantidad de valores distintos que puede tomar la v.a. es finito, o infinito numerable.
Definición. Sea una v.a. sobre . Diremos que es una variable aleatoria discreta si el conjunto de valores que puede tomar es finito o infinito numerable.
De manera más formal, un conjunto es llamado un soporte de la v.a. si . Así, es una v.a. discreta si tiene un soporte finito o infinito numerable.
Cuando es una v.a. discreta, y el conjunto de valores que toma es de tal manera que para cada , la función de distribución de , , es una función escalonada con una discontinuidad de magnitud en cada . Además, es constante entre los , y toma el valor mayor en cada discontinuidad. Esto es algo que puedes observar en el ejemplo 4 de la entrada anterior.
Además, si es una variable aleatoria cualquiera, se cumple que
En particular, cuando es una variable aleatoria discreta, cuando es alguno de los valores que puede tomar ; y es en cualquier otro caso. La demostración de que te la dejamos como parte de la tarea moral.
Más aún, como vimos que la función de distribución de una v.a. contiene toda la información sobre una v.a. , entonces si es una v.a. discreta, los valores para cada capturan toda la información sobre el comportamiento probabilístico de . ¡Cuidado! Esto sólamente pasa con las v.a.’s discretas, veremos que con las continuas no es así.
Función de masa de probabilidad de una v.a. discreta
A la función que manda a cada al valor se le conoce como la función de masa de probabilidad (en inglés, probability mass function), que definimos a continuación.
Definición. Sea una v.a. discreta que toma los valores . Se define la función de masa de probabilidad (f.m.p.) de , denotada por , como sigue.
Esta función también es conocida simplemente como función de probabilidad.
Observa que cuando es alguno de los valores en ; y en cualquier otro caso. De acuerdo con lo anterior, para cualquier se tendrá que
La suma anterior es discreta, pues es mayor a en a lo más en una cantidad numerable de valores.
Ejemplo 1. Sea una v.a. con distribución dada por
Es decir, la función de distribución de es . Gráficamente, la función se ve como sigue:
Figura. Gráfica de la función .
Los puntos en los que presenta una discontinuidad son los valores que toma la variable aleatoria , y la magnitud de los saltos es la probabilidad de que tome cada respectivo valor. La magnitud del salto corresponde precisamente a
pues en aquellos valores de en los que hay una discontinuidad, y son valores distintos. Además, observa que para cada , es la probabilidad acumulada por todos los valores menores o iguales a . Por ejemplo, , que significa que no ha acumulado probabilidad hasta el valor . Es decir, todos los números reales menores o iguales a acumulan de probabilidad. Por otro lado, , por lo que la probabilidad acumulada hasta es de . Esto es, los números reales que son menores o iguales a acumulan de la probabilidad.
A partir de la distribución podemos obtener la función de masa de probabilidad de . Para ello, tenemos que usar la fórmula
Esta expresión es distinta de en todos los valores de en los que presenta una discontinuidad, y es en otro caso. En los puntos de discontinuidad se tiene que:
De este modo, la función de masa de probabilidad de es la función dada por
Esto significa que la variable aleatoria toma valores en el conjunto , que son precisamente los puntos en los que tiene una discontinuidad.
Conexión entre la función de masa de probabilidad y la función de distribución
En el ejemplo anterior puede observarse que la función de masa de probabilidad de contiene toda la información sobre el comportamiento probabilístico de , pues gracias a ella podemos saber:
El conjunto de valores que puede tomar , que son aquellos cuya probabilidad es mayor a .
La probabilidad de que tome cada uno de estos valores.
Además, es posible recuperar la función de distribución de en cada sumando los valores que toma hasta .
La suma anterior tendrá a lo más una cantidad numerable de términos, pues en a lo más una cantidad numerable de valores. Además, como la función de masa de probabilidad permite recuperar una función de distribución, es suficiente con tener la f.m.p. para conocer el comportamiento probabilístico de una v.a. discreta. Por ello, usualmente en los ejercicios se te dará la función de masa de probabilidad.
Ejemplo 2. Una variable aleatoria que toma una cantidad infinita numerable de valores también es discreta. Por ejemplo, sea una v.a. con función de masa de probabilidad dada por
De este modo, tenemos que
etcétera. Sin embargo, observa que ahora te estamos dando una función de masa de probabilidad, y no te damos una función de distribución. ¿Cómo podemos estar seguros de que la función que nos están dando representa el comportamiento probabilístico de manera correcta? Hay dos cosas de tenemos que revisar:
Para cada , se debe de cumplir que . Recuerda, es una probabilidad, así que debe de ser mayor o igual a .
Que la suma de todos los valores que toma es . Esto debe de pasar porque la probabilidad de que tome alguno de los valores que puede tomar debe de ser .
La primera propiedad se cumple, pues es o una potencia de . La segunda propiedad hay que verificarla. Para ello, hay que obtener
Podemos hacer uso de la fórmula para una serie geométrica, modificando un poco la expresión anterior. Así,
Así, nos queda una serie geométrica de la forma , con , por lo que resulta
Esto garantiza que es una función que describe el comportamiento probabilístico de una v.a.
Podemos hacer el cálculo de probabilidades de . Por ejemplo, ¿cuál es la probabilidad de que sea o sea ? Para verlo, tenemos que obtener la probabilidad de . Estos dos conjuntos son ajenos, pues
así que . Así, tenemos que
así que la probabilidad de que tome el valor o tome el valor es de aproximadamente , o . Por otro lado, ¿cuál será la probabilidad de que ? Esta es la probabilidad de que tome alguno de los valores , , , o . En consecuencia, tenemos que
así que la probabilidad de que sea menor o igual a es de , o . Otra pregunta interesante es, ¿cuál es la probabilidad de que sea un número par? Es decir, si es el conjunto de números naturales pares,
¿cuál es el valor de ? Para verlo, observa que como en las probabilidades anteriores, la probabilidad que queremos calcular puede verse como la suma de las probabilidades de todos los valores en . De este modo, se tiene que
así que la probabilidad de que tome como valor un número par es de , o .
Finalmente, observa que y son soportes de , pues , y como , se tiene que , que implica . Esto exhibe que cuando es un soporte de una v.a. discreta, está asegurado que contiene a todos los valores que puede tomar la v.a., pero no significa que todos los elementos de tienen probabilidad positiva. Por ejemplo, en este caso tenemos que y .
Propiedades de una función de masa de probabilidad
Como vimos en el ejemplo anterior (y en la discusión que le precede), la función de masa de probabilidad es suficiente para conocer el comportamiento probabilístico de una v.a. discreta. Por ello, es necesario saber qué propiedades necesita una función cualquiera para ser la función de masa de probabilidad de alguna v.a. discreta .
Sea una función y sea un conjunto a lo más numerable de números reales y sea una colección de números reales tales que
Para cada se cumple que .
Se cumple que
si definimos como
entonces existe una v.a. discreta tal que es la función de masa de probabilidad de . En efecto, al tomar dada por
se tiene que es una función de distribución, así que la existencia de está garantizada por lo que vimos en la entrada de Funciones de Distribución.
En conclusión, si tu cuentas con una colección a lo más numerable de números reales, y son números reales que se pueden usar como la probabilidad de los elementos de (de tal manera que es la probabilidad de ), estos valores definen las probabilidades de que alguna v.a. discreta tome los valores en .
Esto es, existe una v.a. discreta tal que
Fórmula para la función de distribución a partir de la función de masa de probabilidad
Más adelante veremos algunas v.a.’s que tienen a como un soporte. Esto es, la probabilidad de que esas v.a.’s caigan en es . Por ello, el conjunto de valores que puede tomar una v.a. de ese tipo es el conjunto de los números naturales, o algún subconjunto de este, como o , para algún . Por ejemplo, ya vimos que es un soporte de la v.a. del último ejemplo; aún cuando el conjunto de valores que puede tomar es .
En tales casos, la función de distribución de una v.a. discreta puede escribirse a partir de la función de masa de probabilidad de manera ordenada como sigue. Si es una v.a. discreta tal que su función de masa de probabilidad es dada por
donde son números reales tales que para cada y . Entonces la función de distribución de puede escribirse como
donde es el mayor entero que es menor o igual a . Por ejemplo, y .
Tarea moral
Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu dominio de los conceptos abordados en esta entrada.
Demuestra que si es una v.a., entonces se para cada se cumple queSugerencia: Aplica el teorema de continuidad de la probabilidad a la sucesión de conjuntos , donde para cada definimos .
Retomando el Ejemplo 1, encuentra la probabilidad de que « tome el valor o el valor ».
Encuentra la función de distribución de la variable aleatoria del Ejemplo 2. Sugerencia: Nosotros obtuvimos , ¿qué pasa si en vez de hacerlo para , lo haces para cualquier ?
Más adelante…
Más adelante veremos muchas v.a.’s discretas para las cuales es un soporte. Como comentamos en la última sección de esta entrada, esto significará que el conjunto de valores que pueden tomar esas v.a.’s es o algún subconjunto de . Por ello, la función de distribución de esas v.a.’s podrá escribirse utilizando la fórmula que obtuvimos en esa sección.
En la siguiente entrada abordaremos las v.a.’s continuas. Así como las v.a.’s discretas, las v.a.’s continuas tienen ciertas peculiaridades importantes que tenemos que analizar.
En la pregunta «¿cuál será la probabilidad de que Y>=5?», ¿no debería ser Y<=5?
Hola Roma. Sí, de acuerdo. Ya hicimos la corrección. Gracias por la atenta lectura. Si encuentras otros errores, con gusto los revisamos.