Archivo de la etiqueta: teorema de bayes

Probabilidad I: Teorema de Bayes

Por Octavio Daniel Ríos García

Introducción

En la última entrada vimos un resultado muy importante para el cálculo de probabilidades: el teorema de probabilidad total. En particular, vimos cómo aplicarlo en algunos ejemplos prácticos. Además, puede que sea necesario para demostrar algunos resultados teóricos más adelante.

Por otro lado, en uno de los ejemplos calculamos una probabilidad que no parecía tan evidente calcular. No obstante, usando las propiedades vistas hasta el momento, obtuvimos esa probabilidad. Por ello, en esta entrada vamos a presentar el resultado que captura ese comportamiento.

El teorema de Bayes

El resultado que presentamos a continuación es conocido como el teorema de Bayes. En español, este nombre comúnmente se pronunciado como se lee, «bayes». No obstante, recibe su nombre en honor a Thomas Bayes, un notable ministro y matemático inglés.


Teorema. Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad. Entonces para cualesquiera $A$, $B$ eventos tales que $\Prob{A}$, $\Prob{B} > 0$ se cumple que

\[ \Prob{A \mid B} = \frac{\Prob{A} \Prob{B \mid A}}{\Prob{B}}. \]


Demostración. Sean $A$, $B$ eventos tales que $\Prob{A}$, $\Prob{B} > 0$. Por la definición de la probabilidad condicional de $A$ dado $B$, sabemos que

\begin{equation} \label{eq:cond} \Prob{A \mid B} = \frac{\Prob{A \cap B}}{\Prob{B}}. \end{equation}

Por otro lado, gracias a la regla multiplicativa y como $\Prob{A} > 0$, sabemos que se cumple que $\Prob{A \cap B} = \Prob{A} \Prob {B \mid A}$. En consecuencia, sustituyendo esta expresión en \eqref{eq:cond}, se tiene que

\[ \Prob{A \mid B} = \frac{\Prob{A \cap B}}{\Prob{B}} = \frac{\Prob{A} \Prob{B \mid A}}{\Prob{B}}, \]

que es justamente lo que queríamos demostrar.

$\square$

El resultado anterior es el teorema de Bayes en su forma más sencilla. Esencialmente, el teorema relaciona la probabilidad condicional de $A$ dado $B$ con la de $B$ dado $A$. Es decir, otorga una manera de voltear los conjuntos dentro de la probabilidad condicional. Sin embargo, para que sea efectivo, las probabilidades de $A$ y de $B$ deben de ser conocidas, o al menos, calculables.

Extensión del teorema de Bayes

Es posible extender el teorema de Bayes usando el teorema de probabilidad total. El resultado queda como sigue.


Corolario (Teorema de Bayes extendido). Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad y sea $n \in \mathbb{N}^{+}$.

  1. Sea $\{A_{1}, \ldots, A_{n} \} \subseteq \mathscr{F}$ una partición finita de $\Omega$ tal que para cada $i \in \{1, \ldots, n\}$ se cumple que $\Prob{A_{i}} > 0$ y sea $B$ un evento tal que $\Prob{B} > 0$. Entonces para cada $k \in \{1,\ldots, n\}$ se cumple que \[ \Prob{A_{k} \mid B} = \frac{\Prob{B \mid A_{k}} \Prob{A_{k}}}{\sum_{i = 1}^{n} \Prob{B \mid A_{i}} \Prob{A_{i}} }. \]
  2. Sea $\{ A_{i} \}_{i \in \mathbb{N}^{+}} \subseteq \mathscr{F}$ una partición numerable de $\Omega$ tal que para cada $i \in \mathbb{N}^{+}$ se cumple que $\Prob{A_{i}} > 0$, y sea $B$ un evento tal que $\Prob{B} > 0$. Entonces para cada $k \in \mathbb{N}^{+}$ se cumple que \[ \Prob{A_{k} \mid B} = \frac{\Prob{B \mid A_{k}} \Prob{A_{k}}}{\sum_{i = 1}^{\infty} \Prob{B \mid A_{i}} \Prob{A_{i}} }. \]

Demostración. La demostración de este resultado no es complicada, y te la dejamos como tarea moral.

$\square$

Con este último corolario es posible atacar a aquellos problemas en los que $\Prob{B}$ no es conocida directamente, pero puede calcularse usando el teorema de probabilidad total.

En particular, dado un evento $A \in \mathscr{F}$ tal que $\Prob{A}$, $\Prob{A^{\mathsf{c}}} > 0$, resulta que $A$ y $A^{\mathsf{c}}$ forman una partición de $\Omega$. En tal caso, para cualquier evento $B \in \mathscr{F}$ que satisface $\Prob{B} > 0$ se cumple que

\[ \Prob{A \mid B} = \frac{\Prob{B \mid A} \Prob{A} }{ \Prob{B \mid A} \Prob{A} + \Prob{B \mid A^{\mathsf{c}} } \Prob{A^{\mathsf{c}} } }. \]

Ejemplos

Así como el teorema de probabilidad total, el teorema de Bayes puede aplicarse para dar solución a diversos ejercicios y problemas. A continuación, presentamos algunos ejemplos de su uso.

Ejemplos. En una compañía manufacturera de componentes electrónicos, los componentes fabricados reciben una calificación de acuerdo a su calidad: $\mathrm{A}$ para la mejor calidad, $\mathrm{B}$ para calidad media y $\mathrm{C}$ para calidad baja. De acuerdo con el registro de esta compañía, se encontró que $70\%$ de los componentes recibieron una calificación de $\mathrm{A}$, $18\%$ una calificación de $\mathrm{B}$, y $12\%$ una calificación de $\mathrm{C}$. Además, se encontró que un $2\%$ de los calificados con $\mathrm{A}$, $10\%$ de los calificados con $\mathrm{B}$ y $18\%$ de los calificados con $\mathrm{C}$ salieron defectuosos. Ahora, si un componente falla, ¿cuál es la probabilidad de que haya recibido una calificación de $\mathrm{B}$?

Primero, hay que organizar la información disponible. Sea $\Omega$ el espacio muestral de este experimento. $\Omega$ sería el conjunto de todos los componentes fabricados. Definamos los siguientes $4$ eventos:

  • $A$: el evento de escoger un componente con calificación $\mathrm{A}$.
  • $B$: el evento de escoger un componente con calificación $\mathrm{B}$.
  • $C$: el evento de escoger un componente con calificación $\mathrm{C}$.
  • $D$: el evento de escoger un componente defectuoso.

De acuerdo con la información dada, y asumiendo equiprobabilidad, se tiene que

\begin{align*}&\Prob{A} = 0.7 \\ &\Prob{D \mid A} = 0.02\end{align*}

\begin{align*}&\Prob{B} = 0.18 \\ &\Prob{D \mid B} = 0.1\end{align*}

\begin{align*}&\Prob{C} = 0.12 \\ &\Prob{D \mid C} = 0.18,\end{align*}

Lo que se nos pide es la probabilidad de que un componente haya recibido una calificación de $\mathrm{B}$ dado que salió defectuoso. Es decir, queremos obtener $\Prob{B \mid D}$. Observa que los eventos $A$, $B$ y $C$ constituyen una partición de $\Omega$. Por lo tanto, usando el teorema de Bayes tenemos que

\begin{align*} \Prob{B \mid D} = \frac{\Prob{D \mid B} \Prob{B}}{\Prob{D}} &= \frac{\Prob{D \mid B} \Prob{B}}{\Prob{D \mid A}\Prob{A} + \Prob{D \mid B}\Prob{B} + \Prob{D \mid C}\Prob{C}} \\ &= \frac{(0.1)(0.18)}{(0.02)(0.7) + (0.1)(0.18) + (0.18)(0.12)} \\ &\approx 0.3358 \end{align*}

por lo que si un componente falla, la probabilidad de que haya recibido una calificación de $\mathrm{B}$ es aproximadamente $0.3358 = 33.58\%$.


Ejemplo. Un paciente acude a una cita con su médico. El médico le realiza una prueba que tiene un $99\%$ de fiabilidad. Es decir, un $99\%$ de las personas que están enfermas salen positivas, y un $99\%$ de las personas sanas salen negativas. El doctor sabe que sólamente el $1\%$ de la gente en su país tienen esa enfermedad. Si el paciente sale positivo, ¿cuál es la probabilidad de que esté enfermo?

Antes de exponer la solución, de acuerdo con la información que tenemos, aparentemente la prueba es muy buena, ya que la fiabilidad parece ser suficientemente buena como para determinar con certeza si el paciente está enfermo o no.

Como es costumbre, desglosemos la información que nos están dando. Primero, definimos los siguientes eventos:

  • $E$: el evento de que el paciente esté enfermo.
  • $P$: el evento de que la prueba salga positiva.

Considerando la información dada, sabemos que

  • La probabilidad de que la prueba salga positiva dado que el paciente está enfermo es de $0.99$. Es decir, $\Prob{P \mid E} = 0.99$.
  • De igual forma, la probabilidad de que la prueba salga negativa dado que el paciente está sano es de $0.99$. Por ello, $\Prob{P^{\mathsf{c}} \mid E^{\mathsf{c}}} = 0.99$. Además, $\Prob{P \mid E^{\mathsf{c}} } = 1 − \Prob{P^{\mathsf{c}} \mid E^{\mathsf{c}}}$, por lo que $\Prob{P \mid E^{\mathsf{c}} } = 0.01$.
  • Sólamente el $1\%$ de la población tiene esa enfermedad, por lo que $\Prob{E} = 0.01$. En consecuencia, $\Prob{E^{\mathsf{c}}} = 1 − \Prob{E} = 0.99$.

Nos interesa calcular la probabilidad de que el paciente esté enfermo dado que la prueba salió positiva. Por ello, queremos $\Prob{E \mid P}$. Observa que los conjuntos $E$ y $E^{\mathsf{c}}$ forman una partición del espacio muestral. Aplicando el teorema de Bayes tenemos que

\begin{align*} \Prob{E \mid P} = \frac{\Prob{P \mid E} \Prob{E}}{\Prob{P}} &= \frac{\Prob{P \mid E} \Prob{E}}{\Prob{P \mid E} \Prob{E} + \Prob{P \mid E^{\mathsf{c}} } \Prob{E^{\mathsf{c}}} } \\ &= \frac{(0.99)(0.01)}{(0.99)(0.01) + (0.01)(0.99)} \\ &= 0.5 \end{align*}

En conclusión, la probabilidad de que el paciente esté enfermo dado que la prueba salió positiva es de $0.5 = 50\%$. Como dirían por ahí, ¡resulta que es un volado! Contrario a lo que indica la información sobre la fiabilidad de la prueba, este valor es para nada satisfactorio.


Tarea moral

Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu dominio de los conceptos abordados en esta entrada.

  1. Demuestra el teorema de Bayes extendido. Para ello, utiliza el teorema de Bayes en conjunto con el teorema de probabilidad total.
  2. En el ejemplo de los componentes electrónicos calculamos $\Prob{B \mid D}$. Retoma este ejemplo y haz lo siguiente:
    1. Calcula $\Prob{A \mid D}$ y $\Prob{C \mid D}$, e interprétalas.
    2. Calcula la suma de las tres probabilidades. ¿Cuánto te da? ¿Por qué?
  3. Retoma el ejemplo de las pruebas para enfermedad.
    1. Calcula $\Prob{E \mid P^{\mathsf{c}} }$. Esta es la probabilidad condicional de $E$ dado $P^{\mathsf{c}}$, ¿esto qué significa?
    2. Supón que el médico viaja a otro país en el que sólamente el $0.5\%$ de la población padece la enfermedad. Es decir, $\Prob{E} = 0.005$. Calcula $\Prob{E \mid P}$ bajo este nuevo supuesto. ¿Cómo cambia con respecto al valor obtenido en el ejemplo?

Más adelante…

Así como el teorema de probabilidad total, el teorema de Bayes es una herramienta muy útil en el cálculo de probabilidades. También hay situaciones teóricas en las que puede resultar de utilidad. Además, si decides cursar la materia de Estadística Bayesiana, el teorema de Bayes es uno de sus fundamentos. En esta materia se le da una interpretación especial a lo que estipula este teorema, y permite el desarrollo de un enfoque estadístico distinto del frecuentista.

En la siguiente entrada veremos un resultado teórico conocido como el teorema de continuidad de la probabilidad. Es mucho más teórico, pero exhibe una propiedad importante que tienen todas las medidas de probabilidad.

Entradas relacionadas