Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Estadística No Paramétrica: Pruebas para proporciones

Por Alondra Sierra

Introducción

Las pruebas binomiales se caracterizan porque la distribución de la estadística de prueba tiene una distribución binomial, de la cual solo se conoce el tener “éxito” o “fracaso” en cada observación.

En esta unidad veremos distintos tipos de pruebas binomiales, así como sus aplicaciones con diferentes ejercicios. Comenzaremos en esta entrada hablando de pruebas para proporciones.

1.1 Pruebas para proporciones

Usaremos la prueba de proporciones cuando, dada una población, nos interese conocer la proporción de elementos de la población que posee cierta característica, o bien, evaluar las afirmaciones con respecto a una proporción de la población.

Partimos de una muestra aleatoria $X_1,X_2, …, X_n$ la cual clasificaremos en dos categorías, $C_1$ y $C_2$. La observación $X_i$ podría estar en $C_1$ o en $C_2$.

El número de observaciones en $C_1$ es denotado como $O_1$, mientras que para $C_2$ es $n-O_1$.

La hipótesis nula siempre será:

$H_0: p=p^*$

(En donde, $p^*$ de población es igual a alguna proporción de población $p^*$)

La hipótesis alternativa toma alguna de las siguientes formas dependiendo del problema en cuestión:

A. $H_1: p≠p^* $ (Prueba de dos colas)

B. $H_1: p < p^*$ (Prueba de cola inferior o derecha)

C. $H_1: p > p^*$ (Prueba de cola superior o izquierda)

De acuerdo a la metodología usada en (Conover, 1999), para el caso A, la región de rechazo es de tamaño $\alpha$ y corresponde a la suma de las dos colas de la distribución nula del estadístico $T$; $\alpha_1$ (cola inferior) y $\alpha_2$ (cola superior).

El estadístico de prueba $T$ será la proporción de la población que se estará evaluando, en donde, su distribución nula es la distribución binomial con parámetros $p = p^*$ la probabilidad especificada en la hipótesis nula y $n$ el tamaño de la muestra.

$T =$ Número de observaciones en $C_1$

  • Cuando $n \leq 20$ utilizamos el estadístico:

 $T \sim Bin(n,p^*)$

donde $T$ se obtiene de la Tabla de Distribución Binomial (A1).

  • Cuando $n > 20$ utilizamos la aproximación normal y en este caso se utilizan los cuantiles aproximados $X_q$ para obtener el estadístico $T$. 

$X_q = np + Z_q \sqrt{np(1 – p)}$

donde $Z_q$ se obtiene de la Tabla de Distribución Normal (A2).

Buscamos los cuantiles $t_1$ y $t_2$ como:

$P[Y \leq t_1] = \alpha_1$ 

$P[Y \leq t_2] = 1 – \alpha_2$  ó  $P[Y> t_2] = \alpha_2$

$Y \sim Bin(n, p^*)$ ó $ Y \sim X_q $

según sea el caso.

Si $T \sim X_q $, aproximamos:

  • $t_1$, el cuantil $q_1 = \frac{⍺}{2}$
  • $t_2$, el cuantil $ q_2 = 1- \frac{⍺}{2}$

Rechazamos $H_0$ sí:

$T \leq t_1$ o $T> t_2$

Al tener un valor de $T$ mayor o menor que estos cuantiles, los valores se encuentran alejados por la derecha e izquierda de la media, y por lo tanto están dentro de la región de rechazo. Por este motivo no aceptaríamos la hipótesis nula.

Para calcular el $p-value$ usamos la siguiente fórmula:

$p-value = 2 * min\{ P [ Y \leq T ], P [Y \geq T] \}$,

  • Si $n\leq20$ buscamos $T$ en la tabla A1
  • En otro caso, el $p-value$ puede obtenerse como:

$P[Y\leq t] \cong P(Z \leq \frac{t -np^* + 0.5}{\sqrt{np^*(1-p^*)}})$

y $P[Y\geq t]\cong 1-P(Z \leq\frac{t -np^* – 0.5}{\sqrt{np^*(1-p^*)}})$

donde $t$ se encuentra en la tabla A2, siendo $t$ el valor observado de $T$.

En ambos casos, si el $p-value \leq \alpha$, rechazamos la hipótesis nula con un nivel de significancia $\alpha$.

Para el caso de la cola inferior y superior, se utiliza el mismo procedimiento correspondientemente.

Ejemplos

Veamos algunos ejemplos de cómo se utiliza la prueba anterior.

Problema 1. De acuerdo a la base de datos del Sector Salud, se cree que 30% de pacientes adultos mayores ya tienen aplicada la 4ta dosis de vacunación contra COVID. El mismo Sector Salud decide investigar a sus pacientes y preguntar sobre la aplicación de la vacuna. Se seleccionan aleatoriamente a 1400 pacientes adultos mayores, de los cuales 360 confirmaron haberse aplicado la dosis. Prueba usando $\alpha = 0.05$

Solución.

PRUEBA DE DOS COLAS

HIPÓTESIS:

$H_0: p = 30$%

v.s.

$H_1:p \neq 30$%

ESTADÍSTICO DE PRUEBA:

Corresponde a las 360 personas que confirmaron haberse aplicado la dosis.

$T = 360$

como el tamaño de muestra $n > 20 $

$T \sim X_q $

CUANTILES:

Buscamos $t_1$ y $t_2$ tal que:

$P[Y \leq t_1] = P[Y \leq t_\alpha] = \alpha_1$

$P[Y \geq t_2] = P[Y \geq t_1-\frac{\alpha}{2}] = \alpha_2$

con $\alpha = 0.05$ buscamos $\frac{\alpha}{2}$ y $1-\frac{\alpha}{2}$ en T2

$\frac{\alpha}{2} = \frac{0.05}{2} = 0.025 \Rightarrow z =-1.96$

$1-\frac{\alpha}{2} = 1 – \frac{0.05}{2} = 0.975 \Rightarrow z =1.96$

Sustituyendo en $X_q$ para cada cuantil tenemos :

$t_1 = (1400)(0.3) -1.96 \sqrt{(1400)(0.3)(1 – 0.3)} = 386.39$

$t_2 = (1400)(0.3) +1.96 \sqrt{(1400)(0.3)(1 – 0.3)} = 453.60$

$\therefore t_1 = 386$ y $t_2 = 453$

REGIÓN DE RECHAZO:

Rechazamos $H_0$ sí $T\leq t_1$ ó $T > t_2$

$T =360 \leq t_1 =386$ ó $T =360 \ngtr t_2= 454$

como se cumple la primera condición, $T\leq t_1$ entonces Rechazamos $H_0$.

P-VALUE:

Rechazamos $H_0$ sí $p-value \leq \alpha$

$p-value = 2 * min\{ P [ Y \leq T ], P [Y \geq T] \}$

Este cálculo lo realizaremos con ayuda del software de R:

Ejemplo del cálculo en código de R

#1. Dos colas
T = 360; #Estadistico de prueba
alpha = 0.05; 
n = 1400 #Tamanio muestra
p = 0.3; #probabilidad

# cuantil t = qbinom(alpha,n,p*);
t = qbinom(alpha,n,p);

# p_value = 2*min(c(pbinom(T,n,p*), pbinom(T,n,p*,lower.tail = F)));
p_value = 2*min(c(pbinom(T,n,p), pbinom(T,n,p,lower.tail = F)));
#p_value = 2*pbinom(t,n,p);

# Rechazo H0 si p_value < alpha
if (p_value <= alpha){print("rechazo H0")
}else{print("No rechazo H0")}

El resultado de esto es:

» Rechazo $H_0$ «.

$\triangle$

Nota. Otra forma de validar en R, es con la función de proporciones que tiene R:

# Prueba de Proporciones en R
prop.test(T, n, p, alternative = c("two.sided"), conf.level = 1-alpha)

Esto da como resultado la siguiente información:

	1-sample proportions test with
	continuity correction

data:  T out of n, null probability p
X-squared = 12.042, df = 1,
p-value = 0.0005202
alternative hypothesis: true p is not equal to 0.3
95 percent confidence interval:
 0.2345892 0.2810463
sample estimates:
        p 
0.2571429 

donde tenemos que el $p-value = 0.0005202$, y con el cual podemos seguir Rechazando $H_0$

CONCLUSIÓN:

Como se rechazó $H_0$, podemos decir que hay información suficiente para afirmar que el 30% de los pacientes adultos mayores no tienen aplicada la 4ta dosis de vacunación contra COVID.

Problema 2. Un docente del CONAMAT, afirma que solo el 5% de sus alumnos de un grupo de 18, no pasan la prueba COMIPEMS. La dirección solicita el resultado de los 18 alumnos y solamente 3 de ellos no logran pasar el examen. Si el docente cree que la proporción de alumnos que no pasaron es mayor al número de alumnos que ya confirmaron no pasar, ¿Se puede rechazar $H_0:p=0.05$ con $alpha$ = 0.05?

Solución.

PRUEBA DE COLA SUPERIOR

HIPÓTESIS:

$H_0: p \leq 0.05$

v.s.

$H_1: p > 0.05$

ESTADÍSTICO DE PRUEBA:

Corresponde a los 3 alumnos que no lograron pasar el examen.

$T = 3$

como el tamaño de muestra $n \leq 20 $

$T \sim bin(18,0.05) $

CUANTILES:

Buscamos $t_2$ en T1 con:

$n = 18 , T=Y =3$ y $p = 0.05$

obtenemos $t_2 = 0.9891$

REGIÓN DE RECHAZO:

Rechazamos $H_0$ sí $T > t_2$

$T = 3 > t_2= 0.9891$

como sí se cumple la condición entonces Rechazamos $H_0$.

P-VALUE:

Rechazamos $H_0$ sí $p-value \leq \alpha$

Cálculo en código R

#2. Cola superior
T = 3; #Estadistico de prueba
alpha = 0.05; 
n = 18 #Tamanio muestra
p = 0.05; #probabilidad

# cuantil t = qbinom(1-alpha,n,p*);
alpha_2 =1-alpha;
t = qbinom(alpha_2,n,p);

# p_value = 1- pbinom(T,n,p*);
p_value = 1-pbinom(T,n,p);

# Rechazo H0 si p_value < alpha
if (p_value <= alpha){print("rechazo H0")
}else{print("No rechazo H0")}

El resultado de esto es:

» Rechazo $H_0$ «

CONCLUSIÓN:

Como rechazamos $H_0$, existe evidencia suficiente para afirmar lo que señala el docente.

Problema 3. La cafetería «Fast-Coffee» asegura que el 95% de sus clientes son despachados en menos de 10 minutos una vez comandada su orden. Al finalizar el día, durante el corte, se toman aleatoriamente 9 comandas de las cuáles 8 órdenes fueron entregadas en menos de 10 min. ¿Puede concluirse $\alpha$= 5% que menos del 95% de los clientes se les entregó su orden dentro del lapso señalado?

Solución.

PRUEBA DE COLA INFERIOR

HIPÓTESIS:

$H_0: p \geq 95$%

v.s.

$H_1: p < 95$%

ESTADÍSTICO DE PRUEBA:

Corresponde a las 8 órdenes entregadas en menos de 10 min.

$T = 8$

como el tamaño de muestra $n \leq 20 $

$T \sim bin(9,0.95) $

CUANTILES:

Buscamos $t_1$ en T1 con:

$n = 9 , T=Y =8$ y $p = 0.95$

obtenemos $t = 0.3698$

REGIÓN DE RECHAZO:

Rechazamos $H_0$ sí $T \leq t_1$

$T = 8 \nless t_1= 0.3698$

como no se cumple la condición entonces No Rechazamos $H_0$.

P-VALUE:

Rechazamos $H_0$ sí $p-value \leq \alpha = 0.05$

Cálculo en código R

#3. Cola inferior
T = 8; #Estadistico de prueba
alpha = 0.05; 
n = 9 #Tamanio muestra
p = 0.95; #probabilidad

# cuantil t = qbinom(alpha,n,p*);
t = qbinom(alpha,n,p);

# p_value = pbinom(T,n,p*);
p_value = pbinom(T,n,p);

# Rechazo H0 si p_value < alpha
if (p_value <= alpha){print("rechazo H0")
}else{print("No rechazo H0")}

El resultado de esto es:

«No rechazo $H_0$ «

CONCLUSIÓN:

No existe evidencia suficiente para asegurar que el 95% de los clientes son despachados en menos de 10 minutos una vez comandada su orden.

Más adelante…

En la siguiente entrada veremos otro tipo de prueba binomial: la prueba de cuantiles. Esta prueba se utilizará cuando nos interese hacer inferencia sobre un cuantil específico de alguna distribución.

Ejercicios

  1. En un rancho donde se crían vacas para producir leche, se utilizó un nuevo alimento para ver si mejora la cantidad de leche producida. Se quiere verificar si la cantidad producida de leche es mayor al 15% contra la producción del mes anterior. Se toma una muestra de 200 vacas, donde solo 35 vacas fallan con la producción esperada. ¿Es posible comprobar la hipótesis con $\alpha$=0.01 ?
  2. Una empresa de salto en paracaídas asegura que el 90% de los grupos de salida a la avioneta para realizar el salto es en menos de 10 min entre cada grupo. De 25 grupos, 12 de estos salieron dentro del lapso de tiempo estimado anteriormente. ¿Se puede concluir con $\alpha$ = 0.05, que menos del 90% de las salidas entre cada grupo se hacen en 10 minutos?
  3. Una farmacéutica desarrolló una vacuna contra la Leucemia y quiere saber si tiene una efectividad mayor al 85% contra dicha enfermedad. Se toma una muestra de 100 personas a las que se les aplica dicha vacuna, de las cuales 65 personas mostraron resultados positivos contra la enfermedad. ¿Se puede concluir que la vacuna tiene una efectividad mayor al 85%? Prueba usando $\alpha$ = 0.10

Enlaces relacionados

  • A1: Tabla de distribución Binomial
  • A2: Tabla de distribución Normal
  • Conover, W. J. (1999). Practical Nonparametric statistics (3ª ed.). Second Edition. USA. Wiley & Sons

Entradas relacionadas

Álgebra Moderna I: Clase de Conjugación, Centro de $G$, Ecuación de Clase y $p$-Grupo

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Esta entrada es una caja de herramientas. Continuamos sobre la línea de estudiar las propiedades de una órbita y de su orden. Primero, nos vamos a enfocar en grupos actuando sobre sí mismos, a partir de esto definiremos un nuevo conjunto al que llamamos el centro de $G$ y daremos algunas observaciones al respecto.

El segundo bloque importante de la entrada es probar la llamada ecuación de clase, una ecuación que nos permite calcular el orden de un $G$-conjunto usando otros conjuntos relacionados. Uno de estos conjuntos lo definiremos como $X_G$, el conjunto de todos los elementos de $X$ que quedan fijos sin importar el elemento de $G$ que actúa sobre ellos. Volveremos a encontrar a la órbita de los elementos en la demostración de esta ecuación.

Por último, comenzaremos a trabajar con $p$-grupos, es decir grupos de orden una potencia de un número primo y usaremos la ecuación de clase para demostrar una propiedad de los $p$-grupos.

Decimos que esta entrada es una caja de herramientas, porque no estamos introduciendo temas que vayamos a estudiar a profundidad, más bien son conceptos que nos ayudarán a llegar al tema principal de esta unidad: los Teoremas de Sylow.

Clases de conjugación, centralizadores y centro de $G$

La acción de un grupo actuando en sí mismo por conjugación es muy importante y debido a ello daremos nombres y notaciones específicas para las órbitas y estabilizadores correspondientes (que fueron estudiados de manera general en la entrada Órbita de $x$ y tipos de acciones).

Definición. Sea $G$ es un grupo actuando en sí mismo por conjugación, es decir $g\cdot x = g x g^{-1}$ para todos $g,x\in G$. Dado $x\in G$ la órbita del elemento $x$ bajo esta acción se llama la clase de conjugación de $x$ y se denota por $x^G$, esto es:
\begin{align*}
x^G=\mathcal{O}(x) &= \{g\cdot x | g\in G \} = \{gxg^{-1} | g\in G\}.
\end{align*}

Por otro lado el estabilizador de $x$ se llama el centralizador de $x$ en $G$ y se denota por $C_G(x)$, es decir:

\begin{align*}
C_G(x)=G_x &= \{g\in G|g\cdot x = x\} = \{g\in G | gxg^{-1} = x\}\\
&= \{g\in G | gx = xg\} ,
\end{align*}

siendo entonces el conjunto de todos los elementos del grupo que conmutan con $x$.

Otra colección que resultará clave en el material que desarrollaremos más adelante es el llamado centro de un grupo:

Definición. Sea $G$ un grupo, el centro de $G$, denotado por $Z(G)$, es
\begin{align*}
Z(G) = \{x\in G | xg = gx \quad \forall g\in G\}.
\end{align*}

Es decir, el centro es la colección de todos los elementos de $G$ que conmutan con todos los demás.

Observación 1. $Z(G)$ es subgrupo normal de $G$.

Demostración.
Primero, tomemos el neutro $e\in G$ y veamos que está en $Z(G)$. Como estamos hablando del neutro, se cumple que $eg = g = ge$ para toda $g\in G$, entonces $e\in Z(G)$.

Ahora, tomamos $x\in Z(G)$ entonces $xg = gx$ para toda $g\in G$. Así $g=x^{-1}gx$ para toda $g\in G$, lo que implica que $gx^{-1} = x^{-1}g$ para toda $g\in G$ por lo que $x^{-1} \in Z(G)$.

Luego, si tomamos $x,y\in Z(G)$, se tienen las siguientes igualdades por la definición del centro $(xy)g = x(yg) = x(gy) = (xg)y = (gx)y = g(xy)$ para todo $g\in G$. Así, $xy \in Z(G)$.

Concluimos que el centro es un subgrupo.

Por último, probemos que es un subgrupo normal. Sean $x\in Z(G)$, $g\in G$, al conjugar $x$ con $g$ podemos usar la asociatividad y la definición de centro para concluir que $$gxg^{-1} = (gx)g^{-1} = (xg)g^{-1} = x(gg^{-1}) = xe = x \in Z(G).$$

Por lo tanto $Z(G)\unlhd G$.

$\blacksquare$

Observación 2. Sean $G$ un grupo y $x\in G$. Entonces $x\in Z(G)$ si y sólo si $x^G = \{x\}$.

Demostración. Sean $G$ un grupo y $x\in G$. Tenemos que
\begin{align*}
x^G = \{x\} &\Leftrightarrow gxg^{-1} = x \quad \forall g\in G &\\
&\Leftrightarrow gx = xg &\text{Multiplicamos por $g$ a la derecha}\\
&\Leftrightarrow x\in Z(G).
\end{align*}

$\blacksquare$

La observación anterior nos dice entonces que los elementos del centro son precisamente aquellos cuya clase de conjugación es trivial.

Ecuación de Clase

Para poder enunciar la ecuación de clase, que describe la carnalidad de un $G$-conjunto $X$ en términos de los índices de ciertos estabilizadores, definamos primero un cierto subconjunto de $X$:

Definición. Sea $G$ un grupo, $X$ un $G$-conjunto finito,
\begin{align*}
X_G = \{x\in X | g\cdot x = x \; \forall g\in G\}.
\end{align*}

Es decir, $X_G$ es el conjunto de elementos de $X$ que quedan fijos sin importar qué elemento de $G$ actúe sobre ellos.

Notemos que dado $x\in X$ se tiene que $x\in X_G$ si y sólo si $g\cdot x = x$ para toda $g\in G$ y esto sucede si y sólo si $\mathcal{O}(x) = \{x\}.$ Entonces se cumple lo siguiente:

Observación 3. $x\in X_G$ si y sólo si $\mathcal{O}(x) = \{x\}.$

Así, el conjunto $X_G$ consiste de los elementos cuya órbita es trivial.

Proposición. (Ecuación de Clase)
Sea $G$ un grupo, $X$ un $G$-conjunto finito. Tenemos que
\begin{align*}
\#X = \#X_G + \sum_{j=1}^k [ G : G_{x_j}]
\end{align*}
con $x_1, \cdots x_k$ representantes de las distintas órbitas con más de un elemento.

En particular, si $G$ es finito y actúa en $G$ por conjugación
\begin{align*}
|G| = |Z(G)| + \sum_{j= i}^{k} [ G: C_G(x_j) ]
\end{align*}
con $x_1,\cdots x_k$ representantes de las distintas clases de conjugación con más de un elemento.

Demostración.
Sea $G$ un grupo, $X$ un $G$-conjunto finito.

Sabemos que las órbitas son una partición de $X$. Sean $x_1,\cdots,x_k, x_{k+1},\cdots, x_t$ representantes de las distintas órbitas, donde $\#\mathcal(x_j) > 1$ si $j\in \{1,\cdots, k \}$ y $\#\mathcal{O}(x_j) = 1$ si $j\in \{k+1,\cdots , t\}.$ Entonces por un lado tenemos a las órbitas que tienen un sólo elemento y, por otro lado, las demás.

Por la observación 3, $X_G = \{x\in X| \# \mathcal{O}(x) = 1\} = \{x_{k+1},\cdots, x_t\}$.

Así,
\begin{align*}
\# X &= \sum_{j=1}^t \#\mathcal{O}(x_j) \\
&= \sum_{j= 1}^k \#\mathcal{O}(x_j) + \sum_{j= k+1}^t \#\mathcal{O}(x_j) &\text{Separamos la suma}\\
&= \sum_{j= 1}^k \#\mathcal{O}(x_j) + \sum_{j = k+1}^t 1 & \#\mathcal{O}(x_j) = 1 \text{ para } j \geq k+1\\
&= \sum_{j= 1}^k [ G : G_{x_j} ] + \# X_G & \text{Por la observación 3.}
\end{align*}

Si $G$ es finito y actúa en $G$ por conjugación, $X_G = Z(G)$, $\mathcal{O}(x_j) = x_j^G$ son las clases de conjugación y $G_{x_j} = C_G(x_j)$. Así
\begin{align*}
|G| = \sum_{j= 1}^k \lceil G: C_G(x_j) \rceil + |Z(G)|.
\end{align*}

$\blacksquare$

$p$-grupo

Hemos tratado con grupos finitos de orden primo, de ellos sabemos propiedades importantes como el hecho de que son cíclicos. El siguiente paso en nuestro estudio, es enfocarnos en los grupos cuyo orden es una potencia de algún primo. No todos los grupos finitos cumplen esta característica, pero los que sí, nos permiten entender a los demás.

Definición. Sea $G$ un grupo, $p\in\z^+$ un primo. Decimos que $G$ es un $p$-grupo si $|G| = p^t$ para alguna $t\in \n$.

Teorema. Sean $p\in \z^+$ un primo, $G$ un $p$-grupo, $X$ un $G$-conjunto finito. Entonces $$\#X \equiv \# X_G ( \text{mód } p).$$

Demostración.
Sean $p\in \z^+$ un primo, $G$ un $p$-grupo, $X$ un $G$-conjunto finito. Por la ecuación de clase,
\begin{align*}
\#X = \#X_G + \sum_{j=1}^k [G: G_{x_j} ]
\end{align*}
con $x_1,\cdots, x_k$ representantes de las distintas órbitas con más de un elemento. Como $G$ es un $p$-grupo, $|G| = p^t$ con $t\in \n$. Dado que el orden de los estabilizadores divide al orden de $G$ tenemos que $|G_{x_j}| \mid p^t$ y por lo tanto $|G_{x_j}| = p^{m_j}$ con $m_j\in \n, m_j \leq t.$

Entonces

\begin{align*}
1< \# \mathcal{O}(x_j) &= [G: G_{x_j} ] & \text{Por lo visto anteriormente}\\
&= \frac{|G|}{|G_{x_j}|} & \text{Propiedad del índice}\\
&= \frac{p^t}{p^{m_j}} & \text{Consecuencia de la hipótesis}\\
&= p^{t-m_j}.
\end{align*}

Así, $p$ divide a $[G: G_{x_j}]$ para toda $j\in \{1,\cdots, k\}.$ Por lo que

\begin{align*}
p \text{ divide a } \sum_{j=1}^k [G:G_{x_j}].
\end{align*}

Pero por la ecuación de clase $ \displaystyle \sum_{j=1}^k [G:G_{x_j}]= \# X – \# X_G.$

Entonces
\begin{align*}
p \text{ divide a } \# X – \# X_G.
\end{align*}

En consecuencia $\# X \equiv \#X_G( \text{mód } p).$

$\blacksquare$

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Considera el grupo $S_4$ actuando sobre sí mismo por conjugación.
    • Determina las clases de conjugación de $S_4$.
    • Escribe la ecuación de clase de $S_4$.
    • Deduce el orden de cada uno de los estabilizadores $G_x$, donde $x\in S_4$.
  2. Encuentra todos los $p$-subgrupos de $S_4$.
  3. Sean $X = \{H \,|\, H \leq D_{2(4)}\}$, $G = \left< a \right>$ con $a$ la rotación de $\displaystyle \frac{\pi}{2}$. Considera la acción de $G$ en $X$ dada por $g \cdot H = gHg^{-1}$ para todo $g\in G$, $H \in X$. Encuentra $X_G$ y verifica que $\#X \equiv \# X_G (\text{mód }2)$.

Más adelante…

Ahora nuestro interés está puesto en los números primos o más bien, en la relación de los números primos con el orden de los grupos. Esta entrada te da lo que tienes que saber de $p$-grupos y más adelante veremos cómo mediante ellos se pueden estudiar otros grupos. Además, eventualmente veremos un caso especial de los $p$-grupos, llamados $p$-subgrupos de Sylow, que nos llevará (para sorpresa de nadie) a los Teoremas de Sylow.

Entradas relacionadas

Álgebra Moderna I: Tamaño de una órbita y de un estabilizador

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

En esta entrada repasaremos lo que vimos en la entrada anterior. Primero, veremos unos ejemplos que ilustran las definiciones de órbita y estabilizadores. A partir de estos ejemplos podremos observar ciertos patrones que se repiten y los analizaremos formalmente en una proposición. Por último, daremos un último ejemplo para ilustrar dicha proposición.

Ejemplos de Acciones

Repasemos lo que hemos visto con los siguientes ejemplos. En cada ejemplo describimos el grupo $G$, la órbita y los estabilizadores de los elementos.

Ejemplo 1. Consideremos la permutación $\alpha = (1\,2\,3\,4) \in S_6$. Sean $G = \left<\alpha\right>$ y $X = \{1,2,3,4,5,6\}$ con la acción dada por $\alpha^k \cdot i = \alpha^k(i)$ para toda $k\in \z, i\in X.$

Este diagrama nos ayuda a entender cómo funciona $\alpha$ y qué sucede cuando aplicamos $\alpha^2$, $\alpha^3$, $\dots$. Los elementos del círculo van cambiando en el orden indicado por las flechas.
Además, $\alpha$ deja fijos al 5 y al 6.

Comencemos describiendo a las órbitas de los elementos:
\begin{align*}
\mathcal{O}(1) &= \{1,2,3,4\}\\
&= \mathcal{O}(2) = \mathcal{O}(3) = \mathcal{O}(4)\\
\mathcal{O}(5) &= \{5\}\\
\mathcal{O}(6) &= \{6\}.
\end{align*}

Observemos que las órbitas de $1, 2, 3$ y $4$ son iguales porque $\alpha$ es una permutación cíclica que mueve esos elementos, pero como $\alpha$ deja fijos a $5$ y a $6,$ sus órbitas son distintas y consisten solamente de sí mismos.

Ahora, podemos describir mejor a $G = \left< \alpha \right>$. Como $\alpha$ tiene orden 4, $G$ quedaría:

$$G = \{(1), \alpha, \alpha^2,\alpha^3\}.$$

Por último, describamos los estabilizadores. De acuerdo a la definición de la entrada previa el estabilizador de un objeto son los elementos del grupo que fijan al objeto, en este caso las potencias de $\alpha$ que dejan fijo al objeto. En el caso del $1$ la única potencia de $\alpha$ que lo fija es la identidad y análogamente para $2,3$ y $4$. Por otro lado en el caso de $5$ y $6$, como $\alpha$ no los mueve en absoluto, cualquier potencia de $\alpha$ forma parte de sus respectivos estabilizadores. Esto quedaría escrito de la siguiente manera:
\begin{align*}
G_1 &= \{\alpha^k \in G | \alpha^k \cdot 1 = 1\} = \{(1)\}\\
&= G_2 = G_3 = G_4. \\\\
G_5 &= \{\alpha^k \in G | \alpha^k \cdot 5 = 5\} = G = \{(1), \alpha, \alpha^2,\alpha^3\} \\&= \{\alpha^k \in G | \alpha^k \cdot 6 = 6\}= G_6.
\end{align*}

Ejemplo 2. Consideremos ahora la permutación $\beta = (1\,2\,3)(4\,5)\in S_5$. Sean $G = \left< \beta \right>$ y $X= \{1,2,3,4,5\}$ con la acción dada por $\beta^k \cdot i = \beta^k(i)$ para todas $k\in\z$ y $i\in X.$

Este diagrama ilustra el efecto de $\beta$ en los elementos de $X$. Podemos ver como $1, 2$ y $3$ forman un ciclo y, $4$ y $5$ forman otro.

Primero, describamos las órbitas de los elementos:

\begin{align*}
\mathcal{O}(1) &= \{1,2,3\} = \mathcal{O}(2) = \mathcal{O}(3).\\
\mathcal{O}(4) &= \{4,5\} = \mathcal{O}(5).
\end{align*}

Ahora, describamos mejor a $G$. Observemos que $\beta$ está compuesta por dos ciclos disjuntos: $(1\, 2\, 3)$ con orden $3$ y $(4\,5)$ con orden $2$, es decir es el producto de dos ciclos que conmutan y que tienen órdenes primos relativos entre sí. Por el último teorema de la entrada Palabras, el orden de $\beta$ es entonces $6$. Así, $G$ quedaría descrito como:
$$G = \{(1), \beta, \beta^2, \beta^3, \beta^4,\beta^5\}.$$

Por último, describamos los estabilizadores de cada elemento.

\begin{align*}
G_1 &= \{\beta^k \in G | \beta^k(1) = 1\} = \{(1),\beta^3\}\\
&= G_2 = G_3. \\\\
G_4 &= \{\beta^k\in G | \beta^k(4) = 4\} = \{(1), \beta^2, \beta^4\}\\
&= \{\beta^k\in G | \beta^k(5) = 5\} = G_5.
\end{align*}

Antes de avanzar a la siguiente sección, considera los ejemplos estudiados e intenta determinar si existe alguna relación entre $\#\mathcal{O}(x)$, $|G_x|$ y $|G|$.

¿Qué relación existe entre el tamaño de la órbita y el tamaño del estabilizador de un elemento?

Los ejemplos que trabajamos al inicio de esta entrada nos pueden dar la idea de que existe algún tipo de relación entre los tamaños de la órbita y del estabilizador para cada elemento.

Proposición. Sea $G$ un grupo, $X$ un $G$-conjunto, $x\in X$.
\begin{align*}
\#\mathcal{O}(x) = [ G:G_x].
\end{align*}

Demostración.

Sea $G$ un grupo, $X$ un $G$-conjunto, $x\in X$. Dado que $[ G:G_x]=\# \{gG_x| g\in G\}$ bastaría con encontrar una biyección entre $\mathcal{O}(x)$ y $\{gG_x| g\in G\}.$
Proponemos $\varphi : \mathcal{O}(x) \to \{gG_x| g\in G\}$ tal que $g\cdot x \mapsto gG_x$ para todo $g\in G.$

Debemos probar que $\varphi$ es una biyección.

Primero, veamos que está bien definida. Tomemos $g,h\in G$, y supongamos que $g\cdot x = h\cdot x$.

Entonces

Esto implica,
\begin{align}\label{ec1}
h^{-1}\cdot (g\cdot x) &= h^{-1}\cdot (h\cdot x)
\end{align}

Por las propiedades de acción, al desarrollar la parte derecha de la igualdad \ref{ec1} obtenemos
\begin{align*}
h^{-1}\cdot (h\cdot x) &= (h^{-1}h)\cdot x\\
&= e\cdot x = x.
\end{align*}

Por otro lado al desarrollar la parte izquierda de la igualdad \ref{ec1} obtenemos que,
\begin{align*}
h^{-1}\cdot(g\cdot x) = (h^{-1}g)\cdot x,
\end{align*}

así, $ (h^{-1}g)\cdot x=x$ y esto por definición quiere decir que $h^{-1}g\in G_x$.
Por lo que estudiamos en clases laterales, esto implica que $gG_x = hG_x$, es decir que $\varphi(g\cdot x)=\varphi(h\cdot x)$.
Así, concluimos que $\varphi$ está bien definida.

Ahora, probaremos que $\varphi$ es unyectiva.
Sean $g, h \in G$, tales que $\varphi(g\cdot x) = \varphi(h\cdot x)$, es decir tales que $g G_x = hG_x.$ Pero
\begin{align*}
g G_x &= hG_x\\
\Rightarrow &h^{-1} g\in G_x &\text{Por lo que sabemos de clases laterales}\\
\Rightarrow &(h^{-1}g)\cdot x = x & \text{Por estar en el estabilizador}\\
\Rightarrow &h\cdot ((h^{-1}g)\cdot x) = h\cdot x. &\text{Haciendo actuar $h$}\\ \Rightarrow &g\cdot x=((hh^{-1})g)\cdot x =(h(h^{-1}g))\cdot x =h\cdot ((h^{-1}g)\cdot x) = h\cdot x. &\text{Por las propiedades de acción.}\\
\end{align*}

Así $\varphi$ es inyectiva.

Por construcción podemos observar que $\varphi$ es suprayectiva.

Por lo tanto $\#\mathcal{O} = [ G:G_x]$.

$\blacksquare$

Como consecuencia de lo anterior obtenemos el siguiente corolario.

Corolario. Sea $G$ un grupo finito, $X$ un $G$-conjunto, $x\in X.$ Entonces, $\# \mathcal{O}(x)$ divide a $|G|.$

Ejemplo del Dodecaedro

Veamos un ejemplo en el que apliquemos lo que acabamos de ver.

Consideremos el dodecaedro $D$.

Si pensamos en todas las simetrías en $\r^3$ que mandan el dodecaedro en sí mismo, podemos tomar las rotaciones y así definir $G = \{\varphi \text{ rotación en }\r^3 | \varphi[D]= D\}$.

¿Cuál es el orden de $G$?

Sea $X$ el conjunto de caras de $D$, $G$ actúa en $X$ ya que manda caras de $D$ en caras de $D$. La acción es transitiva ya que cada cara se puede llevar a cualquier cara contigua mediante una rotación de $\displaystyle\frac{2\pi}{3}.$

Si el eje de rotación va del origen a un vértice, las caras rotarán tomando el lugar de otras caras. En cambio, si el eje de rotación cruza del origen al centro de una cara, esa cara rotará sobre sí misma y cada que rote $\displaystyle r = \frac{2\pi}{5}$ seguirá en su lugar.

Rotación de $\frac{2\pi}{5}$ del dodecaedro cuando el eje pasa por el centro de una cara. Las caras superiores e inferiores rotan sobre sí mismo.
Rotación de $\frac{2\pi}{3}$ del dodecaedro cuando el eje pasa por un vértice.

Así, dado $x\in X$, habrá exactamente cinco rotaciones que mandan la cara $x$ en sí misma (aquellas rotaciones de ángulo $ \frac{2\pi}{5}$ cuyo eje de rotación cruza del origen al centro de una cara), por lo cual $|G_x| = 5$. Además, como la acción es transitiva $\# X = \#\mathcal{O}(x)$. Luego, $\#X = 12$ y $\#\mathcal{O}(x) = [G:G_x ]$. Pero $\displaystyle [G:G_x ] = \frac{|G|}{5}$. Si juntamos todo eso, obtenemos:
$$12 = \# X = \#\mathcal{O}(x) = [G:G_x ]= \frac{|G|}{5}.$$

Despejando, $|G| = 12\cdot 5 = 60.$ Es decir, tenemos 60 rotaciones en $\r^3$ que son simetrías del dodecaedro.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Sea $G$ un grupo finito actuando sobre sí mismo:
    • Determina si el hecho de que exista $x\in G$ y tal que $G_x =\{e\}$ implica que la acción es transitiva.
    • Determina si el hecho de que la acción sea transitiva implica que exista $x\in G$ tal que $G_x =\{e\}$.
  2. Encuentra el orden del grupo de simetrías de cada sólido platónico (recuerda que hay algunos que son duales y por lo tanto tienen el mismo grupo de simetrías).

Más adelante…

Ya casi acabamos de estudiar la órbita, todavía nos queda analizar con ás detalle el caso cuando $X=G$, es decir cuando $G$ actúa sobre sí mismo. También podemos preguntarnos qué sucede con el conjunto de elementos de $X$ que se quedan fijos ante cualquier elemento de $G$ que actúe sobre ellos. Esto nos servirá para llegar a una importante ecuación llamada la ecuación de clase.

Además, en la siguiente entrada definiremos un nuevo tipo de grupo conocido como $p$-grupo y esto nos perfilará para llegar a los Teoremas de Sylow.

Entradas relacionadas

Álgebra Moderna I: Órbita de $x$ y tipos de acciones

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Tomemos un grupo $G$ y $X$ un $G$-conjunto. A lo largo de esta entrada consideraremos la relación de equivalencia en $X$ inducida por esta acción y que fue definida en la entrada anterior de la siguiente manera:

$x\sim y$ si y sólo si $g\cdot x = y$ para algún $g\in G$.

Continuemos entonces con esta idea, comenzando por definir las clases de equivalencia inducidas por esa relación.

Después, definiremos nuevos tipos de acciones, por ejemplo, ¿qué pasa si la relación sólo induce una clase de equivalencia? o ¿qué sucede con el conjunto de objetos que dejan fijo a los elementos de $G$?

Órbita de un elemento de $X$

Dada la importancia de esta manera de relacionar a los elementos de un grupo de acuerdo a una acción, daremos un nombre a sus clases de equivalencia.

Definición. Sean $G$ un grupo, $X$ un $G$-conjunto. Para cada $x\in X$, la órbita de $x$ es
\begin{align*}
\mathcal{O}(x) = \{g\cdot x | g \in G\},
\end{align*}

es decir, todos los objetos que podemos obtener haciendo actuar a $G$ sobre $x$.

Observación. Sean $G$ un grupo, $X$ un $G$-conjunto. Tenemos que $\mathcal{O}(x)$ es la clase de equivalencia de $x$ con respecto a la relación inducida por la acción de $G$ en $X$.

Demostración.

Sea $x\in G$. Sabemos que la clase de equivalencia de $x$, denotada por $[x]$, se define como:
\begin{align*}
[ x ] &= \{y\in X |x\sim y\} &\text{Definición de clase de equivalencia} \\
&= \{y\in X|\exists g\in G \text{ con }g\cdot x = y\} &\text{Definición de la relación }\sim\\
&= \{g\cdot x| g\in G\} = \mathcal{O}(x) &\text{Definición de órbita.}
\end{align*}

$\blacksquare$

De cursos anteriores sabemos que la colección de clases de equivalencia inducidas por una relación es una partición del conjunto. El siguiente teorema se da como consecuencia de las propiedades de una partición.

Teorema. Sean $G$ un grupo, $X$ un $G$-conjunto. Entonces

  1. $\mathcal{O}(x) \neq \emptyset $ para toda $x\in X$.
  2. Sean $x,y\in X$. Si $\mathcal{O}(x)\cap \mathcal{O}(y)\neq \emptyset$, entonces $\mathcal{O}(x) = \mathcal{O}(y)$.
  3. $\displaystyle X = \bigcup_{x\in X}\mathcal{O}(x)$.

Este teorema sólo enlista las propiedades de una partición en el caso particular en el que estamos trabajando, por lo que no hay nada nuevo que demostrar.

Una acción transitiva

Las órbitas están determinadas por varios factores: el conjunto $X$, el grupo $G$ y la acción de $G$ en $X$. En algunos casos existe una única órbita.

Definición. Sean $G$ un grupo, $X$ un $G$-conjunto. Si $\mathcal{O}(x) = X$ para alguna $x\in X$, decimos que la acción es transitiva.

Esta definición nos dice que podemos obtener cualesquier elemento de $X$ haciendo actuar algún elemento del grupo en el objeto $x$.

Ejemplos de acciones transitivas

Ejemplo 1. Dado $G$ un grupo, $X=G$ definimos la acción de $G$ en sí mismo mediante la operación de $G$, es decir $a\cdot x = a x$ para todas $a\in G$, $x\in X.$

Consideremos cualquier $x\in X$. Sea $y\in X$. Siempre tenemos una manera de obtener $y$ a través de $x$:
\begin{align*}
y = y(x^{-1}x) = (yx^{-1})x = (yx^{-1})\cdot &x \in \mathcal{O}(x). \\
\text{Entonces } &y \in \mathcal{O}(x).
\end{align*}

Por lo tanto $\mathcal{O}(x) = X$ y así la acción es transitiva.

Ejemplo 2. Sean $G$ un grupo, $H\leq G$, $X = \{gH | g\in G\}$. Definimos $a\cdot (gH) = agH$ para todas $a,g\in G.$

Consideremos cualquier $gH \in X.$ Sea $tH \in X$ con $t\in G.$ Podemos reescribir al representante como:
\begin{align*}
t H &= t(g^{-1}g) H = (tg^{-1})gH \\
&= (tg^{-1})\cdot gH \in \mathcal{O}(gH).
\end{align*}

Por lo tanto $\mathcal{O}(gH) = X$. Así, la acción es transitiva.

Ejemplo 3. Sea $G = D_{2(n)}$ el grupo diédrico, $X = \{1,2,\cdots, n\}$ los distintos vértices del polígono regular de $n$ lados.

La acción que ya habíamos trabajado: dados $g\in G$, $i\in X$ definimos $g\cdot i = g(i)$.

Dada $a\in G$ la rotación $\displaystyle\frac{2\pi}{n}$ y $1\in X$, tenemos que
\begin{align*}
\text{id}\cdot 1 &= 1, \\
a\cdot 1 = a(1) &= 2,\\
a^2 \cdot 1 = a^2(1) &= 3, \\
&\vdots \\
a^{n-1} \cdot 1 = a^{n-1} (1) &= n.
\end{align*}

Entonces $X = \{1,2,\cdots,n\}\subseteq \mathcal{O}(1) \subseteq X$. Así, $\mathcal{O}(1) = X$. Por lo tanto la acción es transitiva.

Ejemplo 4. Ahora veamos un ejemplo nuevo.

Sea $G$ un grupo, $X= G$. Dados $a\in G$, $x\in X$ definimos
\begin{align*}
a\cdot x &= a x a^{-1}.
\end{align*}

Demostremos que es una acción:
\begin{align*}
e\cdot x &= exe^{-1} = x &\forall x\in X.\\
a\cdot(b\cdot x) &= a(b\cdot x)a^{-1} = a(bxb^{-1})a^{-1} = (ab)x(ab)^{-1}& \text{Asociando diferente}\\
&= (ab)\cdot x &\forall a,b\in G, \forall x\in X.
\end{align*}

Así, $G$ actúa en sí mismo por conjugación.

Dado $x\in X$,
\begin{align*}
\mathcal{O}(x) = \{g\cdot x | g\in G\} = \{gxg^{-1}| g\in G\}
\end{align*}
que son todos los conjugados de $x$.

En este caso, la acción no siempre es transitiva: Si $ G\neq \{e\}$ consideremos $x\in G\setminus\{e\}.$ Si $e\in \mathcal{O}(x)$ entonces $e = g\cdot x = gxg^{-1}$ para algún $g\in G$ y entonces $e = x$, esto es una contradicción porque $x\in G\setminus\{e\}$. Así, $\mathcal{O}(x)\neq X$ y la acción no es transitiva.

Más definiciones de acciones

En toda acción el neutro del grupo actúa de forma trivial en todos los elementos del conjunto pero puede ser que existan otros elementos del grupo con esa propiedad. Si no es el caso decimos que la acción es fiel:

Definición. Sea $G$ un grupo, $X$ un $G$-conjunto. Decimos que la acción es fiel si $g\cdot x = x$, con $g\in G$, para todo $x\in X$, implica que $g=e.$

Consideremos ahora los elementos del grupo que fijan a algún elemento específico del conjunto:

Definición. Sea $G$ un grupo, $X$ un $G$-conjunto, $x\in X$. El estabilizador de $x$ es
\begin{align*}
G_x = \{g\in G | g\cdot x = x\}.
\end{align*}

Es decir, la colección de todos los elementos de $G$ que dejan fijo a $x$.

Ejemplos de acción fiel y estabilizador

Ejemplo 1. Sea $G$ un grupo, $X = G$ y $g\cdot x = gx$ para todo $g,x \in G.$

Si $g\in G$ es tal que $g\cdot x = x$ para toda $x\in X$, entonces $gx = x$ para toda $x\in X$, en particular $g = ge = e.$

Así $g=e$ y la acción es fiel.

Dado $x\in X$,
\begin{align*}
G_x = \{g\in G | g\cdot x = x\} = \{g\in X| gx = x\}.
\end{align*}

Pero si $gx = x$,por cancelación $g=e$. Así $G_x = \{e\}$ para toda $x\in X,$ de modo que los estabilizadores son triviales.

Ejemplo 2. Sean $G$ grupo, $H$ subgrupo de $G$, $X = \{xH | x\in G\}$ con $g\cdot(xH) = gx H$ para toda $g,x\in G.$

Si $g\in G$ es tal que $g\cdot (xH) = xH$ para toda $x\in G$, entonces
\begin{align*}
gxH &= xH &\forall x\in G\\
\Rightarrow \, x^{-1} g x &\in H & \forall x\in G\\
\Rightarrow \, g&\in xHx^{-1} & \forall x\in G.
\end{align*}

Si $H\unlhd G$ esto se cumple para toda $g\in H$. Por lo tanto la acción no necesariamente es fiel.

Ahora, dada una clase lateral $xH \in X$.
\begin{align*}
G_{xH} &= \{g\in G | g\cdot (xH) = xH\}\\
&= \{g\in G| gxH = xH\}\\
&= \{g\in G | x^{-1}gx\in H\} \\
&= \{g\in G | g\in xHx^{-1}\}\\
&= xHx^{-1}.
\end{align*}

Así $G_{xH} = xHx^{-1}$ para toda $x\in G.$

Ejemplo 3. Sean $G = D_{2(n)}$ el grupo diédrico, $X = \{1,2,\cdots, n\}$ los distintos vértices del polígono regular de $n$ lados.

Dados $g\in G, i \in X$ definimos $g\cdot i = g(i)$.

Si $g\in G$ es tal que $g\cdot i = i$ para toda $i \in X$, entonces $g(i) = i$ para toda $i\in X$. Así, $g$ sería una transformación lineal en el plano, que fija a los vértices $1$ y $2,$ los cuales forman una base del plano. Por lo tanto $g = \text{id}$ y la acción es fiel.

Dado $i\in X$,
\begin{align*}
G_i &= \{g \in G | g\cdot i = i\}\\
&= \{g\in G | g(i) = i\}\\
&= \{\text{id},r_i\}
\end{align*}
con $r_i$ la reflexión con respecto a la recta que pasa por $(0,0)$ y $i.$

Por último, veremos una observación.

Ilustración de lo que sucede con $r_i$ de $D_{2(n)}.$ Usamos $D_{2(4)}$ representado con un cuadrado y $D_{2(8)}$ representado con un octágono. En el dibujo, $r_1$ mantiene fijo a 1 y 3, y $r_3$ mantiene fijo a 3 y 7.

Observación. Sea $G$ un grupo, $X$ un $G$-conjunto, $x\in X$. $G_x$ es un subgrupo de $G$.

Demostración.
Sean $G$ grupo, $X$ un $G$-conjunto, $x\in X.$

El neutro de $G$ siempre está en el estabilizador porque:
\begin{align*}
e\cdot x = x \quad \forall x\in X,
\end{align*}

entonces $e\in G_x.$

Si $a,b\in G_x$, entonces $(ab)\cdot x = a\cdot (b\cdot x) = a\cdot x = x = x$. Así, $ab\in G_x$. Es decir, el estabilizador es cerrado bajo producto.

Finalmente si $a\in G_x$, $a\cdot x = x$, entonces $a^{-1}\cdot x = a^{-1}\cdot (a\cdot x) = (a^{-1}a)\cdot x = e\cdot x = x$, así $a^{-1} \in G_x$.

Por lo tanto $G_x \leq G$.

$\blacksquare$

Tarea moral

  1. En cada uno de los incisos del ejercicio 1 de la entrada de acciones, en donde haya una acción, describe cómo son las órbitas y determina si se trata de una acción transitiva.
  2. Considera el conjunto $X = \{1,2,3,4,5,6,7,8\}$ y el grupo $G = \left< a \right>$ con $a\in S_8$. Define $a^{i}\cdot j = a^{i}(j)$ para cada $a^{i} \in G$ y cada $j\in X$.
    • Verifica que es una acción de $G$ en $X$.
    • Si $a = (2 \; 4 \; 1 \; 7 \; 8)$ describe las órbitas y determina si se trata de una acción transitiva.
    • Si $a = (6 \; 1 \; 5 \; 8)(3 \; 4)$ describe órbitas y determina si se trata de una acción transitiva.
  3. Sea $G$ un grupo y $X$ un $G$-conjunto. Si la acción de transitiva prueba o da un contraejemplo para las siguientes afirmaciones:
    • $\mathcal{O}(x) = X$ para todo $x\in X$.
    • Para cada $x,y \in X$ existe $g\in G$ tal que $g\cdot x = y$.
  4. Considera el grupo diédrico $D_{2(n)}$ actuando sobre sí mismo con conjugación.
    • Determina si la acción es fiel.
    • Encuentra el estabilizador de $a$, con $a$ la rotación de $\displaystyle\frac{2\pi}{n}$, y el de $b$ con $b$ la reflexión con respecto al eje $x$.
  5. Sea $G$ un grupo y $X$ un $G$-conjunto.
    • Determina si el hecho de que exista $x\in G$ tal que $G_x = \{e\}$ implica que la acción es fiel.
    • Determina si el hecho de que la acción sea fiel implica que exista $x\in G$ tal que $G_x=\{e\}$.

Más adelante…

Continuaremos estudiando las propiedades de las órbitas, en particular, el orden de las órbitas, ¿cómo se relaciona éste con el orden del grupo $G$? Daremos respuesta a ello en la siguiente entrada.

Entradas relacionadas

Compacidad en espacios métricos

Por Lizbeth Fernández Villegas

Introducción

En esta sección mostraremos los fundamentos de uno de los términos más importantes de las matemáticas. Una descripción histórica la presenta Yanina del Carmen Rodríguez Reyes, en la tesis «Desarrollo histórico-pedagógico del concepto de compacidad» en la Universidad de Panamá, República de Panamá 2018.

«La compacidad surgió de uno de los periodos más productivos de la actividad matemática. En la segunda mitad del siglo XIX en Europa las matemáticas avanzadas comenzaron a tomar la forma que conocemos actualmente. Muchos matemáticos, incluyendo Weierstrass, Hausdorff y Dedekind estaban preocupados por los fundamentos de las matemáticas y comenzaron a hacer muchas rigurosidades de las ideas que durante siglos habían sido dadas por sentado. Mientras que algunos de los trabajos del siglo XIX se pueden remontar a las preocupaciones matemáticas de los antiguos griegos, el nivel de rigor y la abstracción refleja una revolución en el pensamiento matemático. Fréchet fue influenciado por muchos contemporáneos y predecesores pero parece que merece el crédito como el padre de la compacidad. Fue Fréchet quien dio el nombre al concepto en un documento que conduce a su tesis doctoral de 1906. Fréchet también define por primera vez espacios métricos aunque no usando ese término y de hecho incursiona en el análisis funcional proporcionando así un contexto para el cual la importancia de la compacidad se hizo indiscutible”. (Rodríguez, 2018).

Conjuntos compactos

Sea $(X,d)$ un espacio métrico y $A \subset X$. Podemos pensar en «cubrir» este subconjunto a través de otros a modo de la siguiente imagen, es decir, conjuntos cuya unión logre contener a $A.$

$A$ cubierto por conjuntos

La cantidad de subconjuntos que forman parte de la cubierta elegida puede ser finita, numerable o no numerable, entonces, para ser formales, cada subconjunto se puede indexar con los elementos de algún conjunto $\mathcal{I}$. Así tenemos la siguiente:

Definición. Cubierta de un conjunto: Sea $A \subset X$. Decimos que una familia de subconjuntos $\mathcal{C} = \{A_{i} \subset X : i \in \mathcal{I} \}$ es una cubierta de $A$ en $X$ si
$$A \subset \underset{i \in \mathcal{I}}{\cup} \, A_{i} \,$$

Cubierta de $A$

Definición. Cubierta abierta: Si para toda $i \in \mathcal{I}$ se cumple que el conjunto $A_i$ es abierto, diremos que $\mathcal{C}$ es una cubierta abierta de $A$ en $X$.

Cubierta abierta de $A$

Definición. Subcubierta: Si tomamos conjuntos de una cubierta $\mathcal{C}$, digamos, una familia $\mathcal{C’} \subset \mathcal{C} \, $ y $\, \mathcal{C’}$ es también una cubierta de $A$ diremos que $\mathcal{C’}$ es una subcubierta de $\mathcal{C}$.

Los conjuntos en rosa son una subcubierta de $\mathcal{C}$

Definición. Conjunto compacto: Sea $A$ un conjunto de un espacio métrico $(X,d)$. Decimos que $A$ es un conjunto compacto si dada cualquier cubierta abierta $\mathcal{C}$ de $A$, existe una subcubierta finita de $\mathcal{C}.$

El concepto de compacidad suele tomar mayor relevancia cuando en un espacio topológico se considera el subespacio generado por el conjunto compacto. En estos casos se le denomina espacio topológico compacto.

Subcubierta abierta finita

Según la definición, para demostrar que un conjunto $A$ no es compacto, bastará con identificar una cubierta de la cual no sea posible extraer una subcubierta finita (conjuntos cuya unión logre contener el conjunto $A$).

Ejemplos

El conjunto $\mathbb{R}$ con la métrica euclidiana no es compacto.

Demostración:
El conjunto de intervalos abiertos con centro en $0$ y radio $n, \, n \in \mathbb{N}$ es decir, $\mathcal{C}=\{(-n,n):n \in \mathbb{N}\}$ es una cubierta abierta de $\mathbb{R}.$ Pero si consideramos un subconjunto finito $\mathcal{C’} \subset \mathcal{C}$ entonces $\mathcal{C’} = \{(-k_1,k_1),(-k_2,k_2),…,(-k_m,k_m)\}$ con $k_1,k_2,…,k_m \in \mathbb{N}.$ Sea $k=máx\{k_1,k_2,…,k_m\}$ podemos ver que la unión de los elementos en $\mathcal{C’}$ es el intervalo $(-k,k)$ que claramente, no contiene a $\mathbb{R}$, por lo tanto $\mathbb{R}$ no es compacto.

Representación de intervalos de la subcubierta finita

Un espacio discreto es compacto si y solo si es finito

Considera un conjunto $X$ con la métrica discreta. Entonces, para cada $x \in X$ el conjunto $\{ x \}$ es abierto, así $\mathcal{C}=\{\{x\}:x \in X\}$ es una cubierta abierta de $X.$ Un subconjunto finito de esta cubierta estaría dada por $\mathcal{C’}=\{\{x_1\},\{x_2\},…,\{x_k\}\}, \, k \in \mathbb{N}$ cuya unión de conjuntos contiene $k$ elementos. Por lo tanto, si $X$ es infinito no es compacto con la métrica discreta. La prueba de que si $X$ es finito entonces es compacto se deja como ejercicio al final de esta sección.

Si $(X,d_{disc})$ es infinito no hay subcubierta finita

Proposición. Si $A$ es un conjunto compacto en $(X,d)$, entonces toda sucesión en $A$ tiene una subsucesión que converge en $A$.

Demostración:
Sea $A \subset X$ compacto y $(x_n)_{n \in \mathbb{N}} \,$ una sucesión en $A$. Demostraremos primero que existe un punto $x \in A$ tal que toda bola abierta con centro en $x$ tiene una subsucesión de $(x_n)$. Supón por el contrario que no es así, es decir, para todo punto $x \in A$ existe $\varepsilon_x >0$ y existe $k_x \in \mathbb{N}$ tal que para toda $k \geq k_x, \, x_k \, \notin \, B(x,\varepsilon_x).$

No hay subsucesión dentro de la bola abierta pues todos los últimos términos de la sucesión están fuera de ella.


El conjunto de todas estas bolas abiertas, $\{B(x, \varepsilon_x): x \in A\}$ es una cubierta abierta del conjunto $A$. Como $A$ es compacto, existe $\{B(x_1, \varepsilon_{x_1}),B(x_2, \varepsilon_{x_2}),…,B(x_m, \varepsilon_{x_m})\}$ subcubierta finita. Sea $l =: máx \{k_{x_1},k_{x_2},…,k_{x_3}$ entonces para toda $k \geq l,$ el término $x_k \notin \underset{1\leq i \leq m}{\cup} \, B(x_i, \varepsilon_{x_i}) \supset A,$ en consecuencia $x _k \notin A$ lo cual es una contradicción, pues todos los términos de la sucesión están en $A$, por lo tanto existe un punto $x \in A$ tal que toda bola abierta con centro en $x$ tiene una subsucesión de $(x_n)$.

Cubierta finita

Sea $x \in A$ dicho punto. Por la propiedad mencionada es posible seleccionar un punto $x_{k_j}$ de la sucesión que esté en cada bola $B(x,\frac{1}{j}), \, j \in \mathbb{N}$ tal que no se repita con los anteriores y conserven el orden de la sucesión original. Por lo tanto $(x_{k_j})$ es subsucesión de $(x_n)$ y $x_{k_{j}} \to x$.
Así probamos que toda sucesión de un conjunto compacto tiene una subsucesión que converge en él.


Proposición: Si $A \subset X$ es compacto entonces es cerrado y acotado.

Demostración:
Recordemos que un conjunto es cerrado si y solo si es igual a su cerradura. Como $A \subset \overline{A}$ basta demostrar que $\overline{A} \subset A$. Sea $x \in \overline{A}$ entonces existe una sucesión $(x_n)_{n \in \mathbb{N}}$ en $A$ que converge en $x$ (Visto en Convergencia). Pero por la proposición que acabamos de ver, $(x_n)$ tiene una subsucesión que converge en $A$. Por la unicidad del límite, ese punto de convergencia es $x$, por lo tanto $x \in A$.

La subsucesión converge en $x$. Por lo tanto $x \in A$

Para probar que $A$ es acotado notemos lo siguiente. Si fijamos un punto $x_0 \in X$, podemos poner cada $x \in A$ en una bola abierta con centro en $x_0$ y radio mayor a la distancia $d(x,x_0).$ Elegimos el radio como un número natural $k \,$ suficientemente grande, tal que $d(x,x_0)<k.$ Entonces $x \in B(x_0,k).$

Cada punto de $A$ está en una bola abierta de $x_0$

En consecuencia el conjunto de bolas abiertas $\{B(x_0,n):n \in \mathbb{N}\}$ es una cubierta abierta del conjunto $A$ que, como es compacto, tiene una subcubierta finita $\{B(x_0,n_1), B(x_0,n_2),…,B(x_0,n_m)\}$. Sea $M =: máx \{n_1,n_2,…,n_m\}$ entonces $A \subset B(x_0,M)$ por lo tanto $A$ es acotado.

$A \subset B(x_0,M)$

Ejemplos

A continuación recordamos un resultado conocido de los cursos de cálculo:

Teorema de Heine Borel: Considera $\mathbb{R}^n$ con la métrica euclidiana y $A \subset \mathbb{R}^n.$ Entonces $A$ es un conjunto compacto si y solo si es cerrado y acotado.

Conjuntos compactos en $\mathbb{R}^3$

No obstante, hay espacios métricos en los que no es suficiente que un conjunto sea cerrado y acotado para que sea compacto:

Ejercicio: Considera el conjunto $\mathbb{R}$ y $d$ definida como $d(x,y)=min\{1, |x-y|\}, \, x,y \in \mathbb{R}$ entonces tenemos lo siguiente:

  1. $d$ es una métrica en $\mathbb{R}.$
  2. $d$ induce en $\mathbb{R}$ los mismos conjuntos abiertos que la métrica usual. Entonces un conjunto es compacto en $(\mathbb{R},d)$ si y solo si lo es en $(\mathbb{R},d_2).$
  3. El conjunto $[0,\infty)$ es cerrado y acotado en $(\mathbb{R},d),$ pero no es compacto, pues no lo es en $(\mathbb{R},d_2).$

Veamos una propiedad que hereda la compacidad a un subconjunto de un conjunto compacto:

Proposición: Un subconjunto cerrado $B$ de un conjunto compacto $A$ también es compacto.

Demostración:

Sea $B \subset A$ con $B$ cerrado y $A$ compacto. Considera $\mathcal{C} = \{B_{i} \subset X : i \in \mathcal{I} \}$ una cubierta abierta de $B$.

Representación de una cubierta abierta de $B$

Como $B$ es cerrado, entonces el conjunto $X \setminus B$ es abierto.

$X \setminus B$ es abierto

Dado que $B \subset A,$ si agregamos $X \setminus B$ a la cubierta de $B$ tenemos que $\mathcal{C} \cup \{X \setminus B\}$ es una cubierta abierta de $A.$

$\mathcal{C} \cup \{X \setminus B\}$ es una cubierta abierta de $A$


Al ser el conjunto $A$ compacto, se sigue que esta cubierta tiene una subcubierta finita que satisface:
$$B \subset A \subset B_{i_1} \cup…\cup B_{i_n} \cup (X \setminus A).$$ con $n \in \mathbb{N}.$

Por lo tanto $\mathcal{C’}=B_{i_1},…,B_{i_n}$ es una subcubierta finita de $\mathcal{C}$ lo cual concluye que $B$ es compacto.

La cubierta abierta de $B$ tiene una subcubierta finita

Finalizamos esta sección con los siguientes resultados para así cumplir con una deuda pendiente.

Teorema: Considera $ \{ A_{\alpha} : \alpha \in \mathcal{A} \}$ una colección de subconjuntos compactos de un espacio métrico $(X,d).$ Si ocurre que cualquier intersección finita de elementos de $\{A_{\alpha}\}$ es no vacía, entonces la intersección de todos los elementos también es no vacía. Es decir:
$$\underset{\alpha \in \mathcal{A}}{\bigcap} \, A_{\alpha} \, \neq \emptyset$$

Demostración:
Supón por el contrario que la intersección es vacía. Sea $A_1 \in \{A_{\alpha}\}$ entonces no existe punto de $A_1$ que pertenezca al mismo tiempo, a todos los elementos de $\{A_{\alpha}\}$
Sea $C_{\alpha} := X \setminus A_{\alpha}.$ Entonces $ \{ C_{\alpha} : \alpha \in \mathcal{A} \}$ es una cubierta abierta de $A_1$ que, por ser compacto, tiene una subcubierta finita, así:
$A_1 \subset (C_{\alpha_1} \cup … \cup C_{\alpha_n})$ p.a. ${\alpha_1},…{\alpha_n}, \in \mathcal{A}$
En consecuencia $A_{\alpha_1} \cap … \cap A_{\alpha_n} = \emptyset$ lo cual no es cierto, por lo tanto
$$\underset{\alpha \in \mathcal{A}}{\bigcap} \, A_{\alpha} \, \neq \emptyset$$

Corolario: Si $ \{ A_{n} : n \in \mathbb{N} \}$ es una colección de subconjuntos compactos no vacíos de un espacio métrico $(X,d)$ tales que para cada $n \in \mathbb{N} , \, A_n \supset A_{n+1}$ se cumple que $\underset{n \in \mathbb{N}}{\bigcap} \, A_n \neq \emptyset .$

En la entrada Convergencia uniforme y continuidad se enunció el siguiente resultado. Vamos a retomarla ahora con demostración.

Proposición: Sea $A$ un espacio métrico compacto, $(f_n)_{n \in \mathbb{N}}$ una sucesión de funciones continuas con $f_n:A \to \mathbb{R}, n \in \mathbb{N}$ tal que $(f_n)$ converge puntualmente a una función continua $f$. Si para cada $x \in A$ y $n \in \mathbb{N} \, f_n(x) \geq f_{n+1}(x),$ entonces $(f_n)$ converge a $f$ uniformemente en $A.$

Demostración:
Para cada $n \in \mathbb{N}$ definimos $g_n := f_n – f.$ Entonces $(g_n)_{n \in \mathbb{N}} \,$ es una sucesión de funciones continuas en $A.$ Es sencillo probar que $(g_n)_{n \in \mathbb{N}} \,$ converge puntualmente a $0.$

Sea $\varepsilon >0.$ Ahora, para cada $n \in \mathbb{N}$ definimos un conjunto con los puntos de $A$ que bajo la función $g_n \,$ quedan fuera de la bola de radio $\varepsilon$ con centro en $0.$ Formalmente:

$A_n:= \{a \in A: g_n(a) \notin \, B(0,\varepsilon)\}$

Nota que este conjunto es complemento de la imagen inversa de la función continua $g_n \,$ en la bola abierta $B(0,\varepsilon).$ Por lo tanto $A_n$ es cerrado en $A.$ Esa propiedad se vio en Funciones continuas en espacios métricos. Arriba vimos que cada conjunto cerrado de un compacto hereda la compacidad, en consecuencia cada $A_n$ es compacto.

Nota además que para cada $n \in \mathbb{N}, \, A_{n+1} \subset A_n.$ La intersección de todos estos conjuntos es vacía, pues si existe $x_0 \in \underset{\n \in \mathbb{N}}{\cap} \, A_n$ entonces para toda $n \in \mathbb{N}, \, g_n(a) \notin \, B(0,\varepsilon)$ lo cual no puede ser, pues $g_n(x_0) \to 0.$ A partir del corolario visto un par de lineas arriba se sigue que existe $N \in \mathbb{N}$ tal que $A_N$ es vacío. Entonces, para todo $k \geq N, \, A_k = \emptyset.$ Así para cada $a \in A$ se cumple que $0 \leq g_n(a) < \varepsilon.$ Por lo tanto $(f_n)$ converge a $f$ uniformemente en $A.$

Más adelante…

Conoceremos los efectos que producen algunas funciones al ser aplicadas en conjuntos compactos. ¿Será posible conservar la compacidad al enviar conjuntos de un espacio métrico a otro? ¿Qué propiedades tendrá la imagen de una función continua?

Tarea moral

  1. Resuelve el ejercicio planteado arriba.
  2. Prueba que un espacio discreto finito es compacto. ¿Es necesario que tenga asociada la métrica discreta?
  3. Demuestra que cada subconjunto infinito de un conjunto compacto posee un punto de acumulación en el conjunto compacto.
  4. Da un ejemplo de un conjunto $A$ que sea cerrado pero no acotado y una cubierta abierta y numerable de $A$ que no tenga una subcubierta finita.
  5. Prueba que si $A$ es cerrado y $B$ es compacto, entonces $A \cap B$ es compacto.
  6. Prueba que la intersección arbitraria de conjuntos compactos es compacta.
  7. Demuestra que una sucesión de Cauchy en un conjunto compacto es convergente.
  8. Sea $(X,d)$ un espacio métrico y $A \subset X$ un conjunto compacto. Demuestra que el subespacio $(A,d)$ es completo.

Enlaces