Introducción
Las pruebas binomiales se caracterizan porque la distribución de la estadística de prueba tiene una distribución binomial, de la cual solo se conoce el tener “éxito” o “fracaso” en cada observación.
En esta unidad veremos distintos tipos de pruebas binomiales, así como sus aplicaciones con diferentes ejercicios. Comenzaremos en esta entrada hablando de pruebas para proporciones.
1.1 Pruebas para proporciones
Usaremos la prueba de proporciones cuando, dada una población, nos interese conocer la proporción de elementos de la población que posee cierta característica, o bien, evaluar las afirmaciones con respecto a una proporción de la población.
Partimos de una muestra aleatoria la cual clasificaremos en dos categorías, y . La observación podría estar en o en .
El número de observaciones en es denotado como , mientras que para es .
La hipótesis nula siempre será:
(En donde, de población es igual a alguna proporción de población )
La hipótesis alternativa toma alguna de las siguientes formas dependiendo del problema en cuestión:
A. (Prueba de dos colas)
B. (Prueba de cola inferior o derecha)
C. (Prueba de cola superior o izquierda)
De acuerdo a la metodología usada en (Conover, 1999), para el caso A, la región de rechazo es de tamaño y corresponde a la suma de las dos colas de la distribución nula del estadístico ; (cola inferior) y (cola superior).
El estadístico de prueba será la proporción de la población que se estará evaluando, en donde, su distribución nula es la distribución binomial con parámetros la probabilidad especificada en la hipótesis nula y el tamaño de la muestra.
Número de observaciones en
- Cuando utilizamos el estadístico:
donde se obtiene de la Tabla de Distribución Binomial (A1).
- Cuando utilizamos la aproximación normal y en este caso se utilizan los cuantiles aproximados para obtener el estadístico .
donde se obtiene de la Tabla de Distribución Normal (A2).
Buscamos los cuantiles y como:
ó
ó
según sea el caso.
Si , aproximamos:
- , el cuantil
- , el cuantil
Rechazamos sí:
o
Al tener un valor de mayor o menor que estos cuantiles, los valores se encuentran alejados por la derecha e izquierda de la media, y por lo tanto están dentro de la región de rechazo. Por este motivo no aceptaríamos la hipótesis nula.
Para calcular el usamos la siguiente fórmula:
,
- Si buscamos en la tabla A1
- En otro caso, el puede obtenerse como:
y
donde se encuentra en la tabla A2, siendo el valor observado de .
En ambos casos, si el , rechazamos la hipótesis nula con un nivel de significancia .
Para el caso de la cola inferior y superior, se utiliza el mismo procedimiento correspondientemente.
Ejemplos
Veamos algunos ejemplos de cómo se utiliza la prueba anterior.
Problema 1. De acuerdo a la base de datos del Sector Salud, se cree que 30% de pacientes adultos mayores ya tienen aplicada la 4ta dosis de vacunación contra COVID. El mismo Sector Salud decide investigar a sus pacientes y preguntar sobre la aplicación de la vacuna. Se seleccionan aleatoriamente a 1400 pacientes adultos mayores, de los cuales 360 confirmaron haberse aplicado la dosis. Prueba usando
Solución.
PRUEBA DE DOS COLAS
HIPÓTESIS:
%
v.s.
%
ESTADÍSTICO DE PRUEBA:
Corresponde a las 360 personas que confirmaron haberse aplicado la dosis.
como el tamaño de muestra
CUANTILES:
Buscamos y tal que:
con buscamos y en T2
Sustituyendo en para cada cuantil tenemos :
y
REGIÓN DE RECHAZO:
Rechazamos sí ó
ó
como se cumple la primera condición, entonces Rechazamos .
P-VALUE:
Rechazamos sí
Este cálculo lo realizaremos con ayuda del software de R:
Ejemplo del cálculo en código de R
#1. Dos colas
T = 360; #Estadistico de prueba
alpha = 0.05;
n = 1400 #Tamanio muestra
p = 0.3; #probabilidad
# cuantil t = qbinom(alpha,n,p*);
t = qbinom(alpha,n,p);
# p_value = 2*min(c(pbinom(T,n,p*), pbinom(T,n,p*,lower.tail = F)));
p_value = 2*min(c(pbinom(T,n,p), pbinom(T,n,p,lower.tail = F)));
#p_value = 2*pbinom(t,n,p);
# Rechazo H0 si p_value < alpha
if (p_value <= alpha){print("rechazo H0")
}else{print("No rechazo H0")}
El resultado de esto es:
» Rechazo «.
Nota. Otra forma de validar en R, es con la función de proporciones que tiene R:
# Prueba de Proporciones en R
prop.test(T, n, p, alternative = c("two.sided"), conf.level = 1-alpha)
Esto da como resultado la siguiente información:
1-sample proportions test with
continuity correction
data: T out of n, null probability p
X-squared = 12.042, df = 1,
p-value = 0.0005202
alternative hypothesis: true p is not equal to 0.3
95 percent confidence interval:
0.2345892 0.2810463
sample estimates:
p
0.2571429
donde tenemos que el , y con el cual podemos seguir Rechazando
CONCLUSIÓN:
Como se rechazó , podemos decir que hay información suficiente para afirmar que el 30% de los pacientes adultos mayores no tienen aplicada la 4ta dosis de vacunación contra COVID.
Problema 2. Un docente del CONAMAT, afirma que solo el 5% de sus alumnos de un grupo de 18, no pasan la prueba COMIPEMS. La dirección solicita el resultado de los 18 alumnos y solamente 3 de ellos no logran pasar el examen. Si el docente cree que la proporción de alumnos que no pasaron es mayor al número de alumnos que ya confirmaron no pasar, ¿Se puede rechazar con = 0.05?
Solución.
PRUEBA DE COLA SUPERIOR
HIPÓTESIS:
v.s.
ESTADÍSTICO DE PRUEBA:
Corresponde a los 3 alumnos que no lograron pasar el examen.
como el tamaño de muestra
CUANTILES:
Buscamos en T1 con:
y
obtenemos
REGIÓN DE RECHAZO:
Rechazamos sí
como sí se cumple la condición entonces Rechazamos .
P-VALUE:
Rechazamos sí
Cálculo en código R
#2. Cola superior
T = 3; #Estadistico de prueba
alpha = 0.05;
n = 18 #Tamanio muestra
p = 0.05; #probabilidad
# cuantil t = qbinom(1-alpha,n,p*);
alpha_2 =1-alpha;
t = qbinom(alpha_2,n,p);
# p_value = 1- pbinom(T,n,p*);
p_value = 1-pbinom(T,n,p);
# Rechazo H0 si p_value < alpha
if (p_value <= alpha){print("rechazo H0")
}else{print("No rechazo H0")}
El resultado de esto es:
» Rechazo «
CONCLUSIÓN:
Como rechazamos , existe evidencia suficiente para afirmar lo que señala el docente.
Problema 3. La cafetería «Fast-Coffee» asegura que el 95% de sus clientes son despachados en menos de 10 minutos una vez comandada su orden. Al finalizar el día, durante el corte, se toman aleatoriamente 9 comandas de las cuáles 8 órdenes fueron entregadas en menos de 10 min. ¿Puede concluirse = 5% que menos del 95% de los clientes se les entregó su orden dentro del lapso señalado?
Solución.
PRUEBA DE COLA INFERIOR
HIPÓTESIS:
%
v.s.
%
ESTADÍSTICO DE PRUEBA:
Corresponde a las 8 órdenes entregadas en menos de 10 min.
como el tamaño de muestra
CUANTILES:
Buscamos en T1 con:
y
obtenemos
REGIÓN DE RECHAZO:
Rechazamos sí
como no se cumple la condición entonces No Rechazamos .
P-VALUE:
Rechazamos sí
Cálculo en código R
#3. Cola inferior
T = 8; #Estadistico de prueba
alpha = 0.05;
n = 9 #Tamanio muestra
p = 0.95; #probabilidad
# cuantil t = qbinom(alpha,n,p*);
t = qbinom(alpha,n,p);
# p_value = pbinom(T,n,p*);
p_value = pbinom(T,n,p);
# Rechazo H0 si p_value < alpha
if (p_value <= alpha){print("rechazo H0")
}else{print("No rechazo H0")}
El resultado de esto es:
«No rechazo «
CONCLUSIÓN:
No existe evidencia suficiente para asegurar que el 95% de los clientes son despachados en menos de 10 minutos una vez comandada su orden.
Más adelante…
En la siguiente entrada veremos otro tipo de prueba binomial: la prueba de cuantiles. Esta prueba se utilizará cuando nos interese hacer inferencia sobre un cuantil específico de alguna distribución.
Ejercicios
- En un rancho donde se crían vacas para producir leche, se utilizó un nuevo alimento para ver si mejora la cantidad de leche producida. Se quiere verificar si la cantidad producida de leche es mayor al 15% contra la producción del mes anterior. Se toma una muestra de 200 vacas, donde solo 35 vacas fallan con la producción esperada. ¿Es posible comprobar la hipótesis con =0.01 ?
- Una empresa de salto en paracaídas asegura que el 90% de los grupos de salida a la avioneta para realizar el salto es en menos de 10 min entre cada grupo. De 25 grupos, 12 de estos salieron dentro del lapso de tiempo estimado anteriormente. ¿Se puede concluir con = 0.05, que menos del 90% de las salidas entre cada grupo se hacen en 10 minutos?
- Una farmacéutica desarrolló una vacuna contra la Leucemia y quiere saber si tiene una efectividad mayor al 85% contra dicha enfermedad. Se toma una muestra de 100 personas a las que se les aplica dicha vacuna, de las cuales 65 personas mostraron resultados positivos contra la enfermedad. ¿Se puede concluir que la vacuna tiene una efectividad mayor al 85%? Prueba usando = 0.10
Enlaces relacionados
- A1: Tabla de distribución Binomial
- A2: Tabla de distribución Normal
- Conover, W. J. (1999). Practical Nonparametric statistics (3ª ed.). Second Edition. USA. Wiley & Sons
Entradas relacionadas
- Ir a: Estadística no paramétrica
- Entrada anterior del curso:
- Siguiente entrada del curso: Estadística No Paramétrica: Pruebas para cuantiles