Una vez que hemos introducido el concepto de variable aleatoria, nos toca ver qué nuevas definiciones surgen a partir de este. Un primer concepto que surge es la función de distribución. A grandes rasgos, dado un espacio de probabilidad , en la entrada anterior vimos que una función debe de satisfacer que para cualquier , es un evento de . Básicamente, esta condición era suficiente para concluir que para cada se cumple que . En otras palabras, la imagen inversa de cualquier evento de es un evento de .
De manera similar, lo que haremos será definir la probabilidad de los eventos de la forma , con . No lo veremos aquí (porque no tenemos las herramientas suficientes para hacerlo), pero resulta que asignarle probabilidad a esos eventos captura toda la información relevante sobre una variable aleatoria. Esto nos permitirá prescindir por completo de muchos detalles de la variable aleatoria, y centrar nuestra atención en el conjunto de valores que puede tomar.
Funciones de distribución de probabilidad
De manera general, existe un tipo de función que nos va a interesar a partir de ahora, que corresponde a las funciones de distribución de probabilidad. Estas se definen como sigue.
Definición. Sea una función. Diremos que es una función de distribución de probabilidad si:
es no-decreciente. Esto es, para cada , si entonces .
es continua por la derecha. Es decir, para cada se cumple que
Se cumple que
Una función no requiere de ningún contexto adicional para considerarse una función de distribución de probabilidad. Es decir, para que una función sea considerada una función de distribución de probabilidad, simplemente debe de ser no-decreciente, continua por la derecha y sus límites a y deben de ser y , respectivamente.
Ejemplo 1. Sean tales que . La función dada por
es no-decreciente, continua por la derecha y sus límites a y son y , así que es una función de distribución de probabilidad. Gráficamente, se ve como sigue.
Figura. Gráfica de la función de distribución de probabilidad expuesta en este ejemplo.
Ejemplo 2. Sea tal que . La función dada por
es una función de distribución de probabilidad. Gráficamente:
Figura. Gráfica de la función de distribución de probabilidad de este ejemplo.
Función de distribución de una variable aleatoria
Dada cualquier variable aleatoria sobre un espacio de probabilidad , hay una función muy importante asociada a : su función de distribución, definida como sigue.
Definición. Sea un espacio de probabilidad y sea una variable aleatoria. La función de distribución de es la función dada por
también es llamada la función de distribución acumulada de , que en inglés se abrevia como CDF (cumulative distribution function).
Es decir, dada una variable aleatoria , su función de distribución devuelve la probabilidad de que sea menor o igual a , para cada . Como seguramente ya sospechas por el nombre de , resulta que es una función de distribución de probabilidad. Este hecho es demostrado en el siguiente teorema.
Teorema. Sea un espacio de probabilidad y sea una variable aleatoria. Entonces es una función de distribución de probabilidad.
Demostración. De acuerdo con la definición, para demostrar que es una función de distribución de probabilidad, tenemos que demostrar 3 cosas:
es no-decreciente: para cada , si entonces .
es continua por la derecha: que para cada se cumple que
Se cumple que
Veamos que se cumple 1. Sean tales que . Ahora, observa que , por lo que
Como , se cumple que , por lo que
así que . En consecuencia, tenemos que
Recuerda que es una medida de probabilidad, por lo que ; que implica , o equivalentemente, que . En conclusión, para cualesquiera tales que , se cumple que , que es justamente lo que queríamos demostrar. Por lo tanto, es una función no-decreciente.
Para demostrar 2, sea una sucesión monótona decreciente de números reales tal que su límite es . Es decir, y
Ahora, sea . Definimos la sucesión de eventos tal que para cada , . De este modo, se tiene que
pues la sucesión converge a . Ahora, por el teorema de continuidad de la probabilidad, tenemos que
es decir, , para cualquier y cualquier sucesión monótona decreciente . Por ello, se puede concluir que es una función continua por la derecha.
Finalmente, en 3 demostraremos que el límite de cuando es . La demostración del otro límite es muy parecida. Sea una sucesión de números reales tal que y . Para cada definimos
De esta forma, tenemos que es una sucesión creciente de eventos, pues observa que De este modo, como supusimos que es una sucesión que diverge a , se tiene que
Ahora, aplicando el teorema de la continuidad de la probabilidad a y usando que la sucesión es divergente, tenemos que
En conclusión, tenemos que
que es justamente lo que queríamos demostrar. La demostración de que el límite a de es se obtiene de manera casi análoga, pero la familia de eventos que se plantea es decreciente, y se utiliza el teorema de continuidad de la probabilidad para ese caso.
Partiendo de una función de distribución de probabilidad
Por el teorema anterior, vimos que la función de distribución de cualquier variable aleatoria es también una función de distribución de probabilidad. Es decir, que si tienes un espacio de probabilidad y una variable aleatoria , la función de distribución de , , es una función de distribución de probabilidad.
Por otro lado, ahora imagina que te encuentras con una función que es una función de distribución de probabilidad. No obstante, observa que no sabes nada más sobre esta función. Es decir, no hay ninguna variable aleatoria ni un espacio de probabilidad a la vista… ¿Será posible que provenga de alguna variable aleatoria definida sobre un espacio de probabilidad ?
En otras palabras: dada una función de distribución de probabilidad, ¿siempre existen un espacio de probabilidad y una variable aleatoria tal que es la función de distribución de ? ¡La respuesta es que sí! A grandes rasgos, define la probabilidad de los eventos de la forma , para cada . Esto resulta suficiente para definir por completo la medida de probabilidad inducida por una variable aleatoria … pero, ¿cuál variable aleatoria ? De manera canónica, siempre puede utilizarse la variable aleatoria identidad sobre , que es la función tal que para cada , . De este modo, la medida de probabilidad inducida por es la misma que la medida en el dominio de , que en este caso es con como σ-álgebra, y usando la medida determinada por .
¡CUIDADO! Esto NO significa que todas las variables aleatorias son simplemente la función identidad. Lo que significa es que siempre que tengas una función de distribución de probabilidad, está garantizado que existen un espacio de probabilidad y una variable aleatoria de tal forma que es la función de distribución de . La existencia está garantizada porque, al menos, siempre se puede usar la función identidad de en como variable aleatoria, pero puede haber otras distintas cuya función de distribución también es .
Los siguientes ejemplos son largos, pero capturan muchas de las ideas vistas hasta ahora sobre variables aleatorias. Además, en conjunto, estos dos ejemplos exhiben lo que comentamos en el párrafo anterior.
Ejemplo 3. Sea . Es decir, es el conjunto
puede pensarse como el espacio muestral de un experimento aleatorio en el que se hacen ensayos de un experimento aleatorio que tiene dos resultados posibles: éxito o fracaso. Por ejemplo, el lanzamiento de una moneda («águila» o «sol»). Tomaremos como σ-algebra de a , la potencia de .
Sea tal que . Plantearemos una medida de probabilidad tal que los ensayos son independientes. Para ello, para cada planteamos los eventos
: el evento de que el -ésimo ensayo sea un éxito. Es decir, es el evento
: el evento de que el -ésimo ensayo sea un fracaso. Es decir, es el evento
Observa que para cada se cumple que . Por ejemplo, es el evento
Comenzamos a definir la medida de probabilidad como sigue: para cada definimos
y pedimos que sea tal que los eventos , y son independientes. En consecuencia, se cumple lo siguiente
De hecho, observa que estas condiciones son suficientes para definir la probabilidad de cada resultado, y así, la de cada evento . Por ejemplo, nota que
y por lo anterior, . Por lo tanto, se concluye que
Los elementos de pueden verse como las intersecciones de las identidades a , así que la probabilidad de cada uno está determinada por cada una de esas igualdades. Por ejemplo, además de la anterior (), observa que
por lo que . Ahora, presta atención a los exponentes de y de en estas probabilidades, y compáralos con el número de ’s y ’s de las ternas ordenadas. ¿Qué puedes observar? Resulta que el exponente de la es el número de ’s, es decir, el número de éxitos. Por otro lado, el exponente del es el número de ’s, es decir, el número de fracasos.
Ahora, para cada , puede escribirse como , con , , . En consecuencia, el número de éxitos en la terna puede escribirse como
Por el contrario, el número de fracasos en la terna puede escribirse como
De este modo, para cada , se tiene que
Por esta razón, definimos a la medida de probabilidad dada por
Ahora, definimos a la variable aleatoria como sigue. Para cada , se define
por lo que si , se tiene que
Por ejemplo, , y . Es decir, contabiliza el número de éxitos en los ensayos. Observa que el conjunto de valores que puede tomar es . Obtengamos la probabilidad de que tome cada uno de estos valores.
Ahora obtengamos la función de distribución de . Esto es,
Primero, observa que para cada se tiene que , pues la variable aleatoria no toma valores negativos. Después,
Por otro lado, para cada , observa que
porque el único que hace que es , para todos los demás, vale al menos , que es mayor a . Luego, tenemos que
Observa que ahí se acumularon los elementos de que hacen que y , pues son todos los valores que toma la variable aleatoria que son menores o iguales a .
Después, para cada , los que hacen que son los mismos que en el caso anterior, por lo que . Continuando de esta manera, se llega a que
Observa que la expresión para corresponde a , por el teorema del binomio. En consecuencia, . De este modo, obtenemos que la función de distribución de es la función dada por
Nota que a pesar de ser una función con discontinuidades (es una función escalonada), sí es continua por la derecha. Observa que también es no-decreciente, y sus límites a y a son y , respectivamente; algo que ya esperábamos por el teorema demostrado en esta entrada.
Figura. Gráfica de la función . Es una función escalonada, continua por la derecha. Sus discontinuidades las representamos como círculos sin relleno. Para hacer la gráfica, utilizamos el valor .
Ejemplo 4. Ahora sea la siguiente función de distribución de probabilidad:
¡Es la función de distribución de la variable aleatoria del ejemplo pasado! Sin embargo, nota que aquí te la estamos dando sin ninguna información sobre el espacio de probabilidad subyacente, ni sobre la variable aleatoria involucrada. En primer lugar, ya tenemos garantizado que existe el espacio de probabilidad y la variable aleatoria dada por , para cada de tal forma que es la función de distribución de .
No obstante, observa que podemos definir otra variable aleatoria que resulta en la misma función de distribución. Para ello, toma a , donde es la medida de probabilidad definida como sigue: para cada , definimos
Ojo: Esto define la probabilidad de los elementos de (que son eventos) que tienen la forma , para cada . A su vez, esto define la probabilidad de los eventos de la forma , para cada , tales que , que es
que se puede extender de manera única a una medida sobre todo . Esto es algo que puede demostrarse, pero carecemos de las herramientas para hacerlo en este curso. De cualquier modo, la variable aleatoria que utilizamos en este caso es , la función identidad, dada por
De este modo, se tiene que
y por lo tanto, para cada ,
por lo que la función de distribución de es precisamente la función de distribución de probabilidad que escogimos al comenzar este ejemplo. De este modo, es una variable aleatoria que puede tomar los valores , , y … ¡con las mismas probabilidades que la variable aleatoria del ejemplo pasado! Sin embargo, ¡los espacios de probabilidad sobre los que estas están definidas son completamente distintos! Esto exhibe que lo más importante de una variable aleatoria es su función de distribución, pues esta determina los valores que puede tomar, y la probabilidad con la que los toma. Es decir, la función de distribución caracteriza el comportamiento probabilístico de una variable aleatoria.
¡Presta mucha atención a los últimos dos ejemplos! La conclusión es que el espacio de probabilidad que subyace a una variable aleatoria realmente no importa. Por ello, en muchos libros de probabilidad (y en este mismo curso), no le prestan atención a esto. Comúnmente, te dan una función que es una función de distribución de probabilidad, y te dicen «sea una variable aleatoria con distribución ». Con eso es suficiente, pues determina las probabilidades de todos los eventos que involucran a , sin importar quiénes son y el espacio de probabilidad sobre el que ésta se define.
Tarea moral
Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu dominio de los conceptos abordados en esta entrada.
Determina si la función dada pores una función de distribución de probabilidad. Utiliza su gráfica para auxiliarte, en caso de que lo necesites.
Demuestra que el límite a de la función de distribución de una variable aleatoria es Sugerencia: Revisa la demostración de la propiedad 3 que vimos en el teorema de esta entrada.
¿Podrías idear más variables que tengan la misma función de distribución del Ejemplo 3? Por ejemplo, si , decimos que representa éxito; y definimos como la función dada por¿tiene la misma distribución que la del Ejemplo 3?
Más adelante…
Lo siguiente que haremos en el curso es ver los dos tipos de variables aleatorias más importantes que hay, las discretas y las continuas. A grandes rasgos, las discretas son aquellas que pueden tomar una cantidad a lo más numerable de valores distintos, mientras que las continuas son aquellas que pueden tomar una cantidad no-numerable de valores. Es decir, pueden tomar valores en un conjunto cuya cardinalidad es igual a la de . En la siguiente entrada abordaremos las particularidades de las variables aleatorias discretas.
excelente informacion