Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Cálculo Diferencial e Integral II: Funciones integrables con finitas discontinuidades

Por Moisés Morales Déciga

Introducción

Hasta ahora, hemos hablado de funciones integrables en un intervalo cerrado, en términos de ciertas sumas superiores e inferiores. Vimos en la entrada de Propiedades de la integral que si una función es monótona o continua, entonces su integral siempre está definida. Ahora veremos qué sucede con las funciones que tienen discontinuidades. En esta entrada trataremos a las funciones que finitas discontinuidades. En la siguiente hablaremos de funciones con una infinidad de discontinuidades.

Breve repaso de integrabilidad

Recordemos que para determinar si una función acotada f:RR es integrable en cierto intervalo [a,b], debemos calcular ciertas sumas superiores e inferiores con respecto a una partición. Esto es tomar algunos puntos x0<<xn en [a,b], con x0=a y xn=b. Escribimos P={x0,x1,,xn},

y decimos que P genera los siguientes intervalos a los que llamamos celdas

[x0,x1],[x1,x2],,[xn1,xn].

A [xk1,xk] le llamamos la k-ésima celda de P, cuya longitud es Δxk=xkxk1. Si mk es el ínfimo de los valores de f en la k-ésima celda y Mk es su supremo, entonces podemos definir respectivamente la suma inferior y superior como S(f,P)=k=1nmkΔxkyS(f,P)=k=1nMkΔxk.

La función f es integrable cuando el ínfimo de las sumas superiores (tomado sobre todas las particiones) coindice con el supremos de las sumas inferiores. Vimos que esto es equivalente a pedir que para todo ϵ haya una partición en la que la suma superior y la inferior difieran menos que ϵ (a lo que llamamos el criterio de Riemann). Probamos varias otras propiedades de esta definición, pero una que será muy importante para esta entrada es la siguiente.

Proposición. Sea f:RR una función acotada. Sea c cualquier valor entre [a,b]. Si la integral

abf(x) dx

existe, entonces las dos integrales

acf(x) dx,cbf(x) dx

también existen. Y viceversa, si estas dos integrales existen, entonces la primera también.

Cuando las tres integrales existen, se cumple además la siguiente igualdad:

abf(x) dx=acf(x) dx +cbf(x) dx.

Usaremos esta proposición en las siguientes secciones, pero necesitamos una versión un poco más versátil.

Proposición. Sea f:RR una función acotada y n un entero positivo. Sea P={x0,,xn} una partición de [a,b]. Si la integral abf(x) dx existe, entonces todas las integrales xk1xkf(x)dx para k=1,,n existen. Y viceversa, si estas n integrales existen, entonces la primera también. Cuando todas estas integrales existen, entonces abf(x) dx=k=1nxk1xkf(x)dx.

La demostración de esta proposición no es difícil, pues se sigue de la proposición anterior y de una prueba inductiva. Por ello, la encontrarás como parte de los ejercicios.

Funciones escalonadas

Hablaremos de la integrabilidad de funciones escalonadas, para lo cual necesitaremos la siguiente definición.

Definición. Una función f:RR es escalonada en el intervalo [a,b], si existe una partición P={x0,x1,,xn} del intervalo [a,b], tal que f es constante en cada subintervalo abierto de P. Es decir, para cada k=1,2,,n existe un número real sk tal que:

f(x)=sk,sixk1<x<xk.

A las funciones escalonadas también se les conoce como funciones constantes a trozos.

Ejemplo. En algunos sistemas postales se deben poner estampillas en una carta para poderse enviar. La cantidad de estampillas que hay que poner está determinada por el peso de la carta. Supongamos que una estampilla cuesta 5 pesos y que hay que poner una estampilla por cada 20g (o fracción) que pese la carta, hasta un máximo de 100g.

Si el peso de la carta en gramos está en el intervalo [0,20], entonces tienes que pagar 5 pesos. Si está en el intervalo (20,40], pagarás 10 pesos y así sucesivamente hasta que llegue a 100 gramos. Gráficamente, el costo de envío tendría el siguiente comportamiento (puedes dar clic en la imagen para verla a mayor escala).

Observa que en efecto parece ser que hay «escalones». Esta función es escalonada pues al dar la partición P={0,20,40,60,80,100}, tenemos que la función es constante en cada intervalo abierto definido por la partición.

Si quisiéramos calcular la integral de esta función, ¿qué podríamos hacer? Podemos utilizar la proposición de separar la integral en intervalos que enunciamos arriba, usando la misma partición P. Como la función es constante en cada intervalo dado, entonces su integral existe. Así, la integral en todo el intervalo [0,100] existirá y será la suma de las integrales en cada intervalo. Tendrás que encontrar el valor exacto como uno de los ejercicios.

Integral para funciones escalonadas

Las funciones escalonadas en un cierto intervalo siempre son integrables, como lo afirma el siguiente resultado.

Teorema. Sea f:RR una función. Si f es escalonada en un intervalo [a,b], entonces es integrable en [a,b]. Además, si la partición que muestra que es escalonada es P={x0,,xn}, y para x en el intervalo [xk1,xk] (para k=1,,n) se cumple que f(x)=sk, entonces se tiene que abf(x)dx=k=1nsk(xkxk1).

El teorema nos dice entonces que el valor de la integral es la suma de los productos del valor sk (constante), por la longitud del k-ésimo intervalo. Esto tiene mucho sentido geométrico: cada uno de estos productos es el área de un rectángulo correspondiente a un «escalón». El teorema nos dice que el área buscada es la suma de las áreas de estos escalones.

Demostración. La demostración es consecuencia de la proposición para partir integrales en intervalos. Notemos que como f es constante en cada intervalo [xk1,xk] (para k=1,,n), entonces es integrable en dicho intervalo. En efecto, fijemos una k{1,,n} y tomemos Q={y0,,ym} una partición de [xk1,xk]. En en este intervalo cualquier suma superior (o inferior) se hace tomando como supremo (o ínfimo) al valor constante sk, de modo que:

S(f,Q)=i=1mMiΔyi=i=1mskΔyi=ski=1mΔyi=sk(xkxk1),S(f,Q)=i=1mmiΔyi=i=1mskΔyi=ski=1mΔyi=sk(xkxk1).

Así, el ínfimo de las particiones superiores y el supremo de las inferiores es ck(xkxk1), por lo que la integral existe en cada intervalo [xk1,xk] y es igual a ck(xkxk1). Usando la proposición que enunciamos en la sección de recordatorio sobre partir la integral por intervalos, obtenemos

abf(x)dx=k=1nxk1xkf(x)dx=k=1nsk(xkxk1),

como queríamos.

◻

Funciones continuas a trozos

Las funciones escalonadas son muy sencillas, pero las ideas que hemos discutido respaldan una cierta intuición de que para la integrabilidad «si la función se comporta bien en cada uno de una cantidad finita de intervalos, entonces se comporta bien en todo el intervalo». Esa idea se repite a continuación.

Definición. Sea f:RR. Diremos que f es continua a trozos en el intervalo [a,b] si existe una partición P={x0,,xn} de [a,b] tal que f es continua en cada intervalo (xk1,xk) para k=1,,n.

Pareciera que estamos pidiendo continuidad en todo el intervalo [a,b]. Sin embargo, hay algunas excepciones. Por la manera en la que está escrita la definición, la función f no necesariamente es continua en los puntos x1,x2,,xn1.

Proposición. Sea f:RR una función acotada. Si f es continua a trozos en el intervalo [a,b], entonces f es integrable en [a,b].

Demostración. Nos gustaría usar la proposición de separación de la integral por intervalos. Para ello, tomemos la partición P={x0,,xn} de [a,b] tal que f es continua en cada intervalo (xk1,xk) para k=1,,n. Si f fuera continua en cada intervalo cerrado [xk1,xk], podríamos usar un resultado anterior para ver que es integrable en cada uno de estos intervalos, pero aquí tenemos una hipótesis un poco más débil, pues la continuidad es sólo en el abierto.

De cualquier manera, se puede ver que f es integrable en cada intervalo cerrado [xk1,xk]. Para ello, fijemos k y tomemos ϵ>0. Como f es acotada, tiene supremo M e ínfimo m en [a,b]. Si M=m, entonces f es constante y no hay nada que hacer. Así, supongamos Mm y tomemos una δ>0 tal que 2δ(Mm)<ϵ2, y tal que δ<xkxk12. La segunda condición nos dice que [xk1+δ,xkδ] es no vacío. Como f es continua en este intervalo cerrado, es integrable ahí. Por el criterio de Riemann, hay una partición Q={y1,,yl1} de dicho intervalo tal que S(f,Q)S(f,Q)<ϵ2.

Si a esta partición agregamos los puntos y0=xk1 y yl=xk, entonces obtenemos una partición Q={y0,,yl} la cual su primera y última celda tienen longitud δ y cumple

S(f,Q)S(f,Q)=(S(f,Q)S(f,Q))+(M1m1)Δy1+(Mlml)Δyl<ϵ2+(Mm)δ+(Mm)δ=ϵ2+2(Mm)δ<ϵ2+ϵ2=ϵ.

Así, hemos encontrado una partición Q de [xk1,xk] donde las sumas superior e inferior difieren en menos de ϵ. Por el criterio de Riemann, f es integrable en ese intervalo, para cada k=1,,n. Concluimos la demostración usando nuevamente la proposición de separación de la integral en intervalos.

◻

Ejemplo. La siguiente función f(x)={x2si0x2xsi2<x<3x336+3si3x4.5

es integrable en el intervalo [0,4.5]. Tendrás que calcular su integral en los ejercicios.

Funciones monótonas a trozos

Para esta discusión de funciones monótonas, vale la pena que tengas presente las definiciones de funciones crecientes y decrecientes, que puedes consultar en la entrada correspondiente del curso de Cálculo Diferencial e Integral I.

Definición. Una función f:RR es monótona a trozos en el intervalo [a,b] si existe una partición P={x0,,xn} de [a,b] tal que f es monótona en cada intervalo (xk1,xk) para k=1,,n.

Podemos pensar cómo sería la gráfica de una función así. Tendría que estar formada por un número finito de trozos monótonos. Un ejemplo de ello son las funciones escalonadas (son por ejemplo, no crecientes a trozos). Un ejemplo un poco más interesante sería el de la siguiente figura.

Monótona por trozos

Como te imaginarás, las funciones monótonas a trozos también son integrables.

Proposición. Sea f:RR una función acotada. Si f es monótona a trozos en el intervalo [a,b], entonces f es integrable en [a,b].

Una vez más, la demostración usa la proposición de separación de la integral por intervalos. Pero nuevamente nos enfrentamos con una dificultad. Lo que hemos demostrado anteriormente es que si una función es monónona en un intervalo [xk1,xk], entonces es integrable en dicho intervalo. ¿Pero si sólo tenemos monotonía en (xk1,xk)? Para atender esta dificultad, se tiene que hacer una adaptación similar a lo que hicimos en la demostración para funciones continuas a trozos. Los detalles quedan como parte de la tarea moral.

Más adelante…

En esta entrada analizamos funciones con una cantidad finita de discontinuidades. También hablamos de las funciones monótonas a trozos, que podrían tener una infinidad de discontinuidades, pero también ser integrables. En la siguiente entrada veremos qué hacer con la integrabilidad cuando tenemos una cantidad infinita de discontinuidades.

Tarea moral

  1. Calcula el valor de la integral de la función escalonada del servicio postal, con la partición dada.
  2. Integra la siguiente función: f(x)={x2si0x2xsi2<x<3x336+3si3x4.5
  1. Integra la siguiente función. Puedes usar fórmulas de integración que conozcas de cursos preuniversitarios, sin embargo, toma en cuenta que tu respuesta será un poco informal hasta que mostremos de dónde salen dichas fórmulas. f(x)={xsi0x2ln(x)si2<x<3x216x+5si3x4
  1. Demuestra por inducción la proposición de separación de la integral en intervalos que quedó pendiente en la sección de «Breve repaso de integrabilidad». Asegúrate de demostrar la ida y la vuelta.
  2. Sean f:RR y g:RR funciones acotadas.
    • Muestra que si f y g son funciones escalonadas en un intervalo [a,b], entonces f+g y fg también son funciones escalonadas en [a,b]. Sugerencia. Usa como partición un refinamiento común a las particiones P y Q que muestran que f y g son escalonadas, respectivamente.
    • Muestra que si f y g son funciones continuas por trozos en un intervalo [a,b], entonces f+g y fg también son funciones continuas por trozos en [a,b].
    • Si f y g son funciones monótonas por trozos en un intervalo [a,b], ¿será que f+g y fg también lo son? ¿Bajo qué condiciones de la monotonía sí sucede esto?
  3. Da un ejemplo de una función que sea monótona por trozos, pero que no sea continua por trozos.
  4. Demuestra la proposición de que las funciones monónotas a trozos son integrables.

Entradas relacionadas

Álgebra Superior I: El espacio vectorial Rn

Por Eduardo García Caballero

Introducción

En la entrada anterior introdujimos conceptos relacionados a los espacios vectoriales R2 y R3. Hablamos de vectores, combinaciones lineales, espacio generado, independencia lineal y bases. Ahora haremos lo análogo en dimensiones más altas, para lo cual hablaremos de Rn.

La idea es sencilla, queremos extender lo que ya hicimos para vectores con 5 o 100 entradas. Sin embargo, visualizar estos espacios y entender su geometría ya no será tan sencillo. Es por esta razón que principalmente nos enfocaremos a generalizar las propiedades algebraicas que hemos discutido. Esta resultará una manera muy poderosa de estudiar los espacios vectoriales, pues nos permitirá generalizar sin mucha dificultad los conceptos aprendidos en la entrada anterior al espacio Rn para cualquier número natural n.

Definición del espacio vectorial Rn

En la entrada anterior vimos cuáles son propiedades que debe cumplir una colección de objetos, en conjunto con una operación de suma y otra de producto escalar, para poder considerarse un espacio vectorial. Como ya vimos, tanto R2 y R3 son espacios vectoriales. Podemos definir a Rn y a sus operaciones como sigue.

Definición. El conjunto Rn consiste de todas las n-adas ordenadas u=(u1,u2,,un) en donde cada ui es un número real, para i=1,,n. A ui le llamamos la i-ésima entrada de u. Para dos elementos de Rn, digamos

u=(u1,u2,,un)v=(v1,v2,,vn),

definimos la suma u+v como la n-áda cuya i-ésima entrada es ui+vi (decimos que sumamos entrada a entrada). En símbolos, u+v=(u1+v1,u2+v2,,un+vn).

Además, si tomamos un real r, definimos el producto escalar de r con u como la n-ada cuya i-ésima entrada es rui, es decir, ru=(ru1,ru2,,run).

El conjunto Rn con esta suma y producto escalar cumple ser un espacio vectorial. A continuación probaremos sólo algunas de las propiedades, ¿puedes completar el resto?

1. La suma es asociativa:
(u+v)+w=((u1,u2,,un)+(v1,v2,,vn))+(w1,w2,,wn)=(u1+v1,u2+v2,,un+vn)+(w1,w2,,wn)=((u1+v1)+w1,(u2+v2)+w2,,(un+vn)+wn)=(u1+(v1+w1),u2+(v2+w2),,un+(vn+wn))=(u1,u2,,un)+(v1+w1,v2+w2,,vn+wn)=(u1,u2,,un)+((v1,v2,,vn)+(w1,w2,,wn))=u+(v+w).

La cuarta igualdad usa el paso clave de que en R sí sabemos que la suma es asociativa.

2. La suma es conmutativa:
u+v=v+w.

¡Intenta demostrarlo!

3. Existe un elemento neutro para la suma, que es el elemento de Rn en donde todas las entradas son iguales al neutro aditivo 0 de R:
u+0=(u1,u2,,un)+(0,0,,0)=(u1+0,u2+0,,un+0)=(u1,u2,,un)=u.

Para demostrar esta propiedad, necesitaras usar que en R cada ui tiene inverso aditivo.

4. Para cada n-tupla existe un elemento inverso:
u+(u)=0.

5. La suma escalar se distribuye bajo el producto escalar:
(r+s)u=(r+s)(u1,u2,,un)=((r+s)u1,(r+s)u2,,(r+s)un)=(ru1+su1,ru2+su2,,rn+sun)=(ru1,ru2,,run)+(su1,su2,,sun)=r(u1,u2,,un)+s(u1,u2,,un)=ru+su.

Una vez más, se está usando una propiedad de R para concluir una propiedad análoga en Rn. En este caso, se está usando fuertemente que hay una propiedad de distributividad en R.

6. La suma de n-tuplas de distribuye bajo el producto de escalares:
r(u+v)=ru+rv.

7. El producto escalar es compatible con el producto de R:
(rs)u=(rs)(u1,u2,,un)=((rs)u1,(rs)u2,,(rs)un)=(r(su1),r(su2),,r(sun))=r(su1,su2,,sun)=r(s(u1,u2,,un))=r(su).

8. El neutro multiplicativo 1 de R funciona como neutro para el producto escalar:
1u=u.

De este modo, podemos trabajar con el espacio vectorial Rn para explorar sus propiedades. La gran ventaja es que lo que demostremos para Rn en general lo podremos usar para cualquier valor particular de n. y poder emplearlas cuando trabajemos con algún número n en particular.

Combinaciones lineales y espacio generado

Al igual que hicimos con R2 y R3 podemos definir los conceptos de combinación lineal y espacio generado para el espacio vectorial Rn.

Definición. En Rn, diremos que un vector u es combinación lineal de los vectores v1,,vk si y sólo si existen números reales r1,,rn en R tales que
u=r1v1+r2v2++rkvk.

Ejemplo. En R5, el vector (3,4,2,5,5) es combinación lineal de los vectores (2,1,2,0,3), (0,1,1,3,0) y (1,1,5,2,1), pues
(3,4,2,5,5)=2(2,1,2,0,3)+1(0,1,1,3,0)+1(1,1,5,2,1).

La noción de combinación lineal nos permite hablar de todas las posibles combinaciones lineales, así como en R2 y R3.

Definición. Dado un conjunto de vectores v1,,vn en Rn, podemos definir el espacio generado por estos vectores como el conjunto de todas las posibles combinaciones lineales de v1,,vn en Rn.

Es este caso, ya no podremos visualizar geométricamente el espacio generado (aunque con un poco de imaginación, quizás puedas generalizar lo que ya hicimos en dimensiones anteriores: ¿cómo se vería un plano en R4?, ¿cómo se vería un sub-R3 de R4?). De cualquier manera, sí podemos seguir respondiendo preguntas del espacio generado a través de sistemas de ecuaciones.

Ejemplo. ¿El espacio generado por los vectores (1,1,1,0), (0,3,1,2), (2,3,1,0) y (1,0,2,1) es R4?

Para ver si R4 es el espacio generado por los vectores propuestos, debemos asegurarnos de que cada vector en R4 se pueda expresar como combinación lineal de estos. Entonces, seleccionamos un vector (a,b,c,d) arbitrario en R4, y debemos ver si existen escalares q, r, s y t tales que
q(1,1,1,0)+r(0,3,1,2)+s(2,3,1,0)+t(1,0,2,1)=(a,b,c,d);
esto es,
(q,q,q,0)+(0,3r,r,2r)+(2s,3s,s,0)+(t,0,2t,t)=(a,b,c,d),
que equivale a
(q+2s+t,q+3r+3s,q+r+s+2t,2r+t)=(a,b,c,d),
lo cual a su vez equivale al sistema de ecuaciones
{q++2s+t=aq+3r+3s=bq+r+s+2t=c2r+t=d,
el cual podemos representar como
(1021133011120201)(qrst)=(abcd).
Además, podemos observar que la matriz en el lado izquierdo tiene determinante distinto de 0 (para verificar esto, tendrás que calcularlo), lo que nos indica que es invertible, y la igualdad anterior equivale a
(qrst)=(1021133011120201)1(abcd),
o bien,
(qrst)=(31331/21/41/403/21/45/4111/21/21)(abcd),
de donde tenemos la solución para q,r,s,t siguiente:
{q=3a+b+3c3dr=12a+14b+14cs=32a14b54c+dt=a12b12c+d.
Este sistema nos da una fórmula para los escalares q, r, s y t en función del valor de las entradas del vector (a,b,c,d), y estos escalares satisfacen
q(1,1,1,0)+r(0,3,1,2)+s(2,3,1,0)+t(1,0,2,1)=(a,b,c,d).
Como esto se cumple para un vector arbitrario (a,b,c,d) en R4, entonces se cumple para todos los vectores de R4; es decir, ¡R4 es el espacio generado por los vectores (1,1,1,0), (0,3,1,2), (2,3,1,0), (1,0,2,1)!

Nuestra técnica de resolver sistemas de ecuaciones mediante la inversa de la matriz asociada ha resultado muy útil. Hemos tenido un poco de suerte en que la matriz sea invertible. Si no lo fuera, no podríamos haber hecho el procedimiento descrito en el ejemplo. ¿Será que si la matriz no es invertible, entonces el sistema no se podrá resolver? La respuesta es compleja: a veces sí, a veces no. En ese caso hay que entender el sistema de ecuaciones con otro método, como reducción gaussiana.

Independencia lineal

Cuando exploramos las propiedades de R2 y R3, observamos que hay ocasiones en las que el espacio generado por un conjunto de vectores es «más chico» de lo que se esperaría de la cantidad de vectores: por ejemplo, dos vectores en R2 generan una línea (y no todo R2) cuando estos dos se encuentran alineados con el origen. Cuando tres vectores en R3 no están alineados, pero se encuentran sobre el mismo plano por el origen, su espacio generado es dicho plano (y no todo R3).

Aunque el el espacio vectorial Rn no podamos visualizarlo de manera inmediata, podemos mantener la intuición de que un conjunto de vectores «genera todo lo que puede generar» o «genera algo más chico». Para identificar en qué situación nos encontramos, recurrimos a la siguiente definición.

Definición. Dado un conjunto de k vectores v1,v2,,vk en Rn distintos de 0, diremos son linealmente independientes si la única forma de escribir al vector 0 como combinación lineal de ellos es cuando todos los coeficientes de la combinación lineal son igual al escalar 0; es decir, si tenemos que
r1v1+r2v2++rkvk=0,
entonces forzosamente r1=r2==rn=0.

Teniendo esta definición en consideración, se puede mostrar que si un conjunto de vectores es linealmente independiente, entonces ninguno de los vectores se puede escribir como combinación lineal de los otros. De hecho, es únicamente en este caso cuando cuando el espacio generado por los vectores es «todo lo que se puede generar».

La justificación de por qué sucede esto es similar a la que vimos en la entrada anterior: como el primer vector es no genera una línea. Como el segundo vector no se puede escribir como combinación lineal del primero, entonces queda fuera de esta línea y ambos generan un plano. Como el tercer vector no se puede escribir como combinación lineal de los primeros dos, entonces queda fuera del plano, y entre los tres generan un espacio «más grande» («de dimensión 3»). A partir de este punto, quizá no podamos visualizar inmediatamente la forma geométrica del espacio generado, pero como sabemos que los vectores son linealmente independientes, entonces el cuarto vector no se puede escribir como combinación lineal de los primeros tres. Por ello, queda fuera del espacio generado por los primeros tres, y el espacio generado por los cuatro es aún «más grande» («de dimensión 4»); y así sucesivamente, para tantos vectores linealmente independientes como tengamos.

Una herramienta que podemos emplear para determinar cuándo un conjunto de vectores es linealmente independiente son nuevamente los sistemas de ecuaciones. Para esto veamos el siguiente ejemplo.

Ejemplo. ¿Son los vectores (1,5,1,2), (3,3,0,1), (2,0,4,1) y (0,1,1,0) linealmente independientes en R4?

Supongamos que para ciertos escalares a, b, c y d, se cumple que
a(1,5,1,2)+b(3,3,0,1)+c(2,0,4,1)+d(0,1,1,0)=(0,0,0,0).
Esto es equivalente a decir que
(a,5a,a,2a)+(3b,3b,0,b)+(2c,0,4c,c)+(0,d,d,0)=(0,0,0,0)
que equivale a
(a+3b2c,5a3b+d,a+4cd,2ab+c)=(0,0,0,0),
y a su vez equivale al sistema de ecuaciones
{a+3b2c=05a3b+d=0a+4cd=02ab+c=0
el cual podemos representar de la forma
(1320530110412110)(abcd)=(0000),
y, como notamos que la matriz del lado izquierdo de la ecuación tiene determinante distinto de 0 (¿puedes verificarlo?), entonces es invertible, de modo que
(abcd)=(1320530110412110)1(0000)=(0000),
es decir,
a=b=c=d=0,
lo que nos indica, basándonos en la definición, que los vectores anteriores son linealmente independientes.

El ejemplo anterior nos da una idea de lo que debe cumplir un conjunto linealmente independiente de n vectores en Rn. En general, podemos mostrar que un conjunto de n vectores v1=(v11,v12,,v1n), v2=(v21,v22,,v2n), , vn=(vn1,vn2,,vnn) es linealmente independiente si y sólo si la matriz
(v11v21vn1v12v22vn2v1nv2nvnn),
formada por los vectores escritos como columna, es invertible. Esto ya platicamos que está relacionado con que su determinante sea distinto de 0. Pero no en todas las situaciones tendremos tantos vectores como entradas y entonces tendremos que estudiar el sistema de ecuaciones lineales con otras técnicas, como reducción gaussiana.

Ejemplo. ¿Serán los vectores (1,2,3,4,5), (6,7,8,9,10) y (11,12,13,14,15) de R5 linealmente independientes? Tal y como lo hemos hecho arriba, podemos preguntarnos si hay reales a,b,c tales que a(1,2,3,4,5)+b(6,7,8,9,10)+c(11,12,13,14,15)=(0,0,0,0,0), y que no sean todos ellos cero. Tras plantear el sistema como sistema de ecuaciones y luego en forma matricial, lo que se busca es ver si el sistema (161127123813491451015)(abc)=(00000) tiene alguna solución no trivial. Esto puede entenderse aplicando reducción gaussiana a A, que muestra que toda solución al sistema anterior es solución al sistema (101012000000000)(abc)=(00000), lo cual nos lleva a que el sistema original es equivalente al sistema {ac=0b+2c=0.

De aquí, podemos tomar a c como cualquier valor, digamos 1, de donde a=1 y b=2 es solución. En resumen, hemos detectado que (1,2,3,4,5)2(6,7,8,9,10)+(11,12,13,14,15)=(0,0,0,0,0), que es una combinación lineal de los vectores donde no todos los coeficientes son cero. Por ello, no son linealmente intependientes.

Puedes intentar «imaginar» esto como que son vectores en R5 (un espacio de «dimensión 5»), pero no generan dentro de él algo de dimensión 3, sino algo de dimensión menor. Como (1,2,3,4,5) y (6,7,8,9,10) sí son linealmente independientes (¡demuéstralo!), entonces los tres vectores en realidad generan sólo un plano mediante sus combinaciones lineales.

◻

Bases

De manera similar a lo que observamos en la entrada anterior, hay ocasiones en las que un conjunto de vectores no tiene como espacio generado a todo Rn. Por otra parte, hay ocasiones en las que el conjunto de vectores sí genera a todo Rn, pero lo hace de manera «redundante», en el sentido de que, aunque su espacio generado sí es todo Rn, podríamos quitar a algún vector del conjunto y el espacio generado sería el mismo. La siguiente definición se enfoca en los conjuntos en los que no pasa mal ninguna de estas cosas. Es decir, los vectores generan exactamente al espacio: cada vector se genera por una y sólo una combinación lineal de ellos.

Definición. Diremos que un conjunto de vectores v1,v2,,vk es base del esapacio vectorial Rn si el conjunto de vectores es linealmente independiente y el espacio generado por estos es exactamente Rn.

Ejemplo. Al igual que en R2 y R3, la «base canónica» es el primer ejemplo que seguramente se nos viene a la mente. La base canónica en Rn consiste en los n vectores e1=(1,0,0,,0), e2=(0,1,0,,0), e3=(0,0,1,,0), , en=(0,0,0,,1). Es claro que cualquier vector u=(u1,u2,,un) es combinación lineal de e1,,en pues podemos expresarlo como
u=(u1,u2,,un)=(u1,0,,0)+(0,u2,,0)+(0,0,,un)=u1(1,0,,0)+u2(0,1,,0)++un(0,0,,1)=u1e1+u2e2++unen.
Además, los vectores e1,,en son linealmente independientes (¿puedes ver por qué?). De este modo, verificamos que la «base canónica» es, en efecto, una base.

Ejemplo. Más arriba verificamos que los vectores (1,5,1,2), (3,3,0,1), (2,0,4,1) y (0,1,1,0) son linealmente independientes. Además, vimos que la matriz formada por estos es invertible. De este modo, verificamos que estos vectores forman una base para R4.

Más adelante…

A lo largo de esta unidad nos hemos enfocado en estudiar a vectores, matrices, ecuaciones lineales y espacios vectroriales. En las últimas entradas, vimos que hay ocho condiciones que se deben cumplir para que un conjunto de objetos matemáticos (junto con una operación de suma y una de producto escalar) sean considerados espacio vectorial. Todos los ejemplos de espacio vectorial que vimos son de la forma Rn, sin embargo, puede surgir la pregunta, ¿existen espacios vectoriales que no sean de esta forma?

De hecho, si has estado prestando atención en la formalidad de los resultados, hay muchos resultados que han quedado pendientes:

  • ¿Por qué el determinante no depende de la fila o columna en la que se expanda?
  • Si tenemos matrices de n×n, ¿por qué son invertibles si y sólo si el determinate es cero?
  • En matrices de n×n, ¿por qué el determinante es multiplicativo?
  • ¿Cómo se formaliza el proceso de reducción gaussiana y para qué más sirve?
  • ¿Será que podemos tener muchos vectores linealmente independientes en Rn? ¿Será posible tener un conjunto generador de menos de n vectores para Rn? ¿Por qué?

Estas dudas no se resuelven en el curso de Álgebra Superior 2, que sigue a este. Sin embargo, en el curso de Álgebra Lineal I sí se resuelven varias de estas dudas.

Además, podrás ver que hay otros tipos de objetos matemáticos distintos a las listas ordenadas y que también forman un espacio vectorial; algunos con los cuales ya hemos trabajado, como lo son las matrices, y otros que se comportan de manera muy poco usual, como son los espacios con dimensión infinita. Asimismo, con las herramientas que hemos desarrollado hasta ahora, podremos aprender nuevos conceptos como transformaciones lineales, eigenvectores y eigenvalores; estos nos permitirán comprender de manera más íntima los espacios vectoriales, y podremos relacionarlos unos con otros.

Tarea moral

  1. Verifica lo siguiente:
    • (1,1,1,1), (2,2,2,2), (1,1,2,2), (2,2,1,1) no es un conjunto linealmente independiente de R4.
    • (1,2,3,4), (2,3,4,1), (3,4,1,2), (4,1,2,3) es un conjunto generador de R4.
    • (1,1,1,1,1),(1,1,1,1,0),(1,1,1,0,0),(1,1,0,0,0),(1,0,0,0,0) es una base de R5.
  2. Demuestra las siguientes dos cosas:
    • Sea S un conjunto generador de Rn y TS. Entonces T es conjunto generador de Rn.
    • Sea T un conjunto linealmente independiente de Rn y ST. Entonces S es un conjunto linealmente independiente de Rn.
  3. Sean v1,v2,v3,,vk vectores linealmente independientes de Rn. Demuestra que v1,v1+v2,v1+v2+v3,,v1+v2+v3++vk son también vectores linealmente independientes de Rn. ¿Es esto un si y sólo si?
  4. En vista de lo que hemos platicado para matrices de 2×2, 3×3, R2 y R3, ¿cómo definirías el producto matriz-vector AX donde A es una matriz de m×n y X un vector en Rn?
  5. Demuestra que la definición de base tal y como está en la entrada en efecto permite no sólo escribir a cada vector v del espacio como combinación lineal de los elementos de una base v1,,vn, sino que también implica que dicha expresión será única.

Entradas relacionadas

Álgebra Moderna I: Producto directo externo

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Esta entrada es el inicio de la última unidad del curso de Álgebra Moderna I, uno de los temas centrales que estudiaremos en esta unidad es el Teorema Fundamental de los Grupos Abelianos Finitos. Como es costumbre, para poder sumergirnos en el teorema, primero tenemos que construir algunos cimientos.

Seguramente a lo largo de tu estudio de las matemáticas te has encontrado con la notación R2=R×R y otras similares. R2 se usa para denotar al plano cartesiano y rápidamente entendemos que sus elementos tienen la forma de pares ordenados (x,y) donde x,yR. Esto mismo sucede con potencias mayores, como por ejemplo (x,y,z)R3=R×R×R y (x1,,xn)Rn=R××R (n veces).

De la misma manera, podríamos hacer Z×R y obtener objetos de la forma (z,r) donde z es un entero y r un real. Es decir, podemos usar a la operación × entre dos grupos completamente distintos. Pero más allá de poder, ¿esto es algo que podamos estudiar? En pocas palabras, sí, resulta que la operación × es una manera práctica de construir grupos más grandes a partir de otros grupos.

En esta entrada y la próxima seguiremos el desarrollo de la sección 4.3 del libro de Grupos I de Avella, Mendoza, Sáenz y Souto que se encuentra en la bibliografía del curso.

Hablemos del producto de grupos

Comencemos definiendo formalmente al producto de grupos.

Definición. Sean (G1,1),,(Gn,n) grupos. El producto directo externo de G1,,Gn es
G1××Gn={(g1,,gn)|giGi{1,,n}}
con la operación
(g1,,gn)(h1,,hn)=(g11h1,,gnnhn).

Observación. G1××Gn es un grupo con neutro (eG1,,eGn) y (g11,,gn1) es el inverso de cada (g1,,gn)G1××Gn.

Ejemplo 1. Consideremos G=S3×Z2×D2(4).
Un elemento es ((123),1¯,a2b).
Dados (α,a¯,f),(β,b¯,g)G se tiene que
(α,a¯,f)(β,b¯,g)=(αβ,a¯+b¯,fg).

Ejemplo 2. Tomemos el producto Z2×Z2={(0¯,0¯),(0¯,1¯),(1¯,0¯),(1¯,1¯)}.
Observemos que o(0¯,0¯)=1, o(0¯,1¯)=o(1¯,0¯)=o(1¯,1¯)=2.
La suma de dos elementos en {(0¯,1¯),(1¯,0¯),(1¯,1¯)} nos da el tercero. Entonces, Z2×Z2 es isomorfo al grupo de Klein.

Ejemplo 3. Por último, tomemos Z2×Z3={(0¯,0¯),(0¯,1¯),(0¯,2¯),(1¯,0¯),(1¯,1¯),(1¯,2¯)}.
Observemos que o(1¯,1¯)=6.
Tenemos que Z2×Z3=(1¯,1¯) y así Z2×Z3Z6.

Dos funciones naturales

Definición. Sean G1,,Gn grupos, G=G1××Gn. Para cada i{1,,n} definimos la inclusión natural
inci:GiG como inci(gi)=(eG1,,gi,,eGn),
donde gi está en la i-ésima posición.

Definición. Sean G1,,Gn grupos, G=G1××Gn. Para cada i{1,,n} definimos la proyección natural
πi:GGi con πi(g1,,gn)=gi.

Observación 1 . inci es un monomorfismo.

Observación 2 . πi es un epimorfismo.

Notación. Gi=inciGi={eG1}××Gi×{eGn}.

Observación 3. Para G=G1××Gn, los siguientes incisos son ciertos:

  1. GiGi,
  2. GiG y
  3. G/GiG1××Gi1×Gi+1×Gn.

Demostración.
inci es un monomorfismo y si restringimos a su imagen Gi obtenemos un epimorfismo, dando un isomorfismo de Gi a Gi.

Ahora φ:GG1××Gi1×Gi+1××Gn con φ(g1,,gn)=(g1,,gi1,gi+1,,gn) es un epimorfismo y Núc φ=Gi, probando con ello que GiG. Además, por el 1er teorema de isomorfía
G/GiG1××Gi1×Gi+1×Gn.

◼

Observación 4. Sean ij, xGi, yGj. Entonces xny=ynx.

¿Y si ahora recuperamos G a partir de los Gi?

En la entrada Producto de subgrupos y clases laterales, definimos el producto de dos subgrupos. Generalicemos esta idea para una cantidad finita de subgrupos:

Definición. Sea G un grupo. Dados H1,,Hn subgrupos de G, el producto de H1,,Hn es
i=inHi=H1Hn={h1h2hn|hiHi;i{1,,n}}.

Observemos que para realizar el producto de h1h2hn sólo usamos la operación del grupo G porque todas las Hi son subgrupos de G. Sin embargo, como estudiamos en la entrada Producto de subgrupos y clases laterales, el conjunto H1Hn no necesariamente es un subgrupo ya que la operación no siempre es cerrada. En la siguiente entrada agregaremos condiciones a los subgrupos Hi para que H1Hn sí sea un subgrupo de G.

Relacionemos ahora el producto directo externo con el producto de los subgrupos Gi antes definidos:

Proposición. Sean G1,,Gn grupos, G=G1××Gn.

  1. GiGi{1,,n}.
  2. Gi(jiGj)={eG} para toda i{1,,n}.
  3. G=i=1nGi.

Demostración.
Sean G1,,Gn grupos, G=G1××Gn.

  1. Por la observación 3: GiG, para toda i{1,,n}.
  2. La contención {eG}Gi(jiGj), donde eG=(eG1,,eGn), es clara. Así que probaremos la otra.
    Sea g=(g1,,gn)Gi(jiGj).
    Como gGi={eG1}××Gi××{eGn}, entonces la j-ésima entrada de g es gj=eGj para toda ji.
    Como gjiGj, g=h1hi1hi+1hn con hjGj para toda ji.
    Dado que cada hjGj y ji, la entrada i de cada hj es eGi, por lo tanto la entrada i de g es eGi.
    Por lo tanto g=(eG1,,eGn)=eG.
  3. Como GiG para toda i{1,,n}, entonces i=1nGiG.
    Ahora, si gG,
    g=(g1,,gn)=(g1,eG2,,eGn)(eG1,g2,eG3,,eGn)(eG1,,eGn1,gn).
    Entonces gi=1nGi.
    Por lo tanto G=i=1nGi.

◼

Lo anterior muestra que un producto directo externo es un producto de subgrupos normales que cumple el inciso 2 de la proposición.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra las observaciones 1, 2 y 4:
    • inci es un monomorfismo.
    • πi es un epimorfismo.
    • Sean ij, xGi, yGj. Entonces xny=ynx.
  2. Sean G1,,Gn grupos finitos, demuestra que el orden de su producto directo externo es |G1||G2||Gn|.
  3. Prueba que el centro de un producto externo es el producto externo de los centros, esto es: Z(G1×G2××Gn)=Z(G1)×Z(G2)××Z(Gn). Deduce que el producto directo externo de grupos abelianos es abeliano.
  4. Sea G=A1×A2×An y para cada i{1,,n} sea BiAi. Prueba que B1×B2××BnG y que (A1×A2×An)/(B1×B2××Bn)(A1/B1)×(A2/B2)××(An/Bn).
  5. Sean A y B dos grupos finitos y sea p un primo.
    • Prueba que cualquier p-subgrupo de Sylow de A×B es de la forma P×Q, donde P es un p-subgrupo de Sylow de A y Q es un p-subgrupo de Sylow de B.
    • Prueba que además, la cantidad de p-subgrupos de Sylow de A×B es igual a la cantidad de p-subgrupos de Sylow de A por la cantidad de p-subgrupos de Sylow de B, es decir: rp(A×B)=rp(A)rp(B).
    • Generaliza este resultado para el producto directo externo de una cantidad finita de grupos, es decir, para A1×A2××An determina que sus p-subgrupos de Sylow son el producto directo externo de p-subgrupos de Sylow de sus factores.

Más adelante…

La última proposición es prácticamente la conclusión de esta entrada, porque iniciamos definiendo a G como el producto de grupos externos a él y terminamos describiendo a G como producto de subgrupos específicos de él mismo. ¿Habrá alguna manera de generalizar esto, es decir, cuándo un grupo G se podrá expresar como un producto de subgrupos específicos de él mismo? Esta pregunta nos lleva a la definición del producto directo interno que se dará en la siguiente entrada.

Entradas relacionadas

Álgebra Moderna I: Ejemplo de Sylow

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Siendo la última entrada de la Unidad 4, está dedicada a un ejemplo que se justifica usando el Tercer Teorema de Sylow que vimos en la entrada anterior. Por lo mismo, es mucho más corta de lo que estamos acostumbrados, pero es importante para reforzar el conocimiento antes aprendido.

Ilustrando el TTS

Veamos un ejemplo del Tercer Teorema de Sylow.

Ejemplo.

Tomemos G=S4 y veamos la factorización en primos del orden de G, |G|=24=233.

Primero, consideremos al 3. Notamos que (123) es un 3-subgrupo de Sylow ya que tiene 3 elementos y no podemos encontrar subgrupos de Sylow de 9,27 u otra potencia de 3, porque esta no dividiría al orden de G.

Ahora nos preguntamos ¿cuál es la cantidad de 3-subgrupos de Sylow, denotada por r3? Bueno, por el Tercer Teorema de Sylow sabemos que se cumple:

r3|233 y r31(mód 3).

Como 30(mód 3), entonces r3 no es un múltiplo de 3, así que r3 tiene que ser un divisor de 23=8 congruente con uno módulo 3, por lo que r3{1,4}.

Pero podemos encontrar (234), otro 3-subgrupo de Sylow diferente al anterior, así que r3=4. Los otros 3-subgrupos de Sylow son (134) y (124).

Ahora nos fijamos en el primo 2. Por el TTS, la cantidad de 2-subgrupos de Sylow (r2) tiene que cumplir,
r2|233 y r21(mód 2).

La condición del módulo nos indica que r2 es impar, por lo que tiene que ser divisor de 3 para además se cumpla la primera condición, esto nos deja con r2{1,3}.

Busquemos estos 2-subgrupos de Sylow. Sabemos que cada 2-subgrupo de Sylow tiene orden igual a la máxima potencia de 2 que divide a |G|, esto es 8. Sabemos que si tenemos un cuadrado y numeramos los vértices, podemos codificar cada simetría del cuadrado con una permutación de S4. Recordemos que no toda permutación de S4 es una simetría, pero sí al revés.

Las simetrías de un cuadrado son 8 en total y estas simetrías pueden ser generadas por la combinación de una rotación y la reflexión con respecto al eje x. Como hay 8 simetrías del cuadrado y éstas pueden ser codificadas en permutaciones de S4, tendremos un subgrupo de S4 de orden 8, es decir, un 2-subgrupo de Sylow.

Supongamos que numeramos los vértices de un cuadrado 1,2,3,4 como en la imagen, entonces la rotación estará dada por (1234) y la reflexión con respecto al eje x sería (24). Así, el 2-subgrupo de Sylow que obtenemos es (1234),(24).

Simetrías del cuadrado 1,2,3,4 usando (1234),(24).

Estamos buscando todos los 2-subgrupos de Sylow posibles, como r2{1,3} bien podíamos pensar que (1234),(24) es el único. Pero podemos nombrar los vértices del cuadrado de manera distinta para que las simetrías de S4 que le correspondan cambien y encontremos otro 2-subgrupo de Sylow.

Numerando los vértices del cuadrado 2,1,3,4 como en la imagen, encontramos que la simetrías están generadas por la rotación (2134) y la reflexión (14). Así (2134),(14) es otro 2-subgrupo de Sylow.

Si nos damos cuenta, lo único que hicimos en este cuadrado fue intercambiar los vértices 1 y 2 del cuadrado. Esto nos da un subgrupo diferente al anterior porque ese cambio no es una simetría del cuadrado.

Simetrías del cuadrado 2,1,3,4 usando (2134),(14).

Pero r2=1 o r2=3, así que no puede haber sólo dos 2-subgrupos de Sylow, deben ser 3. Nos queda entonces otro 2-subgrupo de Sylow por encontrar. Análogamente, tomamos el cuadrado numerando los vértices 1,3,2,4, donde sólo intercambiamos los vértices 3 y 4 del cuadrado original. En este caso nos encontramos que sus simetrías son generadas por (1324),(34) y este es el último 2-subgrupo de Sylow que nos faltaba.

Simetrías del cuadrado 1,3,2,4 usando (1324),(34).

Así, encontramos todos los subgrupos de Sylow de S4.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Considera el grupo de los cuaternios Q8, ¿cuántos y cuáles son sus 2-subgrupos de Sylow?
  2. Busca los 2 y 3-subgrupos de Sylow de Z6.
  3. Sean a,bG:=S3×Z4, donde a=((123),[2]) y b=((13),[1]). Considere el subgrupo T:=a,bG. Prueba que T=a,b:a6=1G,b2=a3=(ab)2 y que T es un grupo no abeliano con 12 elementos.
    La notación anterior se lee como T es el generado por los elementos a y b tales que a6=1G,b2=a3=(ab)2.

Más adelante…

Con esta entrada no sólo concluimos en tema de los Teoremas de Sylow, si no también la unidad 4 del curso. ¡Felicidades! Sigue avanzando, ya casi acabamos.

En la siguiente unidad planeamos estudiar el Teorema Fundamental de los Grupos abelianos finitos. Pero para ello comenzaremos viendo una forma sencilla de construir nuevos grupos a partir de una cantidad finita de grupos previos.

Entradas relacionadas

Álgebra Moderna I: Teoremas de Sylow

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

En la entrada anterior definimos a los p-subgrupos de Sylow de un grupo G como un p-subgrupo de G tal que no estuviera contenido en otro p-subgrupo de G. En esta entrada estudiaremos los Teoremas de Sylow que hablan, como su nombre nos indica, de los p-subgrupos de Sylow que definimos antes.

El primero trata sobre del orden de los p-subgrupos de Sylow, que es la máxima potencia de p que divide al orden del grupo G. El segundo habla de la relación entre los p-subgrupos de Sylow y establece que todo par de p-subgrupos son conjugados. El tercero describe de modo aproximado la cantidad de p-subgrupos de Sylow que hay en un grupo G. No nos da un número exacto, pero nos da alguna información al respecto.

Ahora, prepárate para leer el nombre de Sylow aún más veces.

Primer Teorema de Sylow

Teorema (1er Teorema de Sylow). Sea pZ+ un primo, G un grupo finito con |G|=ptm, tN+,mN+,p|m. Entonces

  1. para cada i{1,,t}, G contiene un subgrupo de orden pi.
  2. Todo subgrupo de G de orden pi con i{1,,t1} es un subgrupo normal de algún subgrupo de G de orden pi+1.

Demostración.
Sea pZ+ un primo, G un grupo finito con |G|=ptm, t,mN+, p|m.

P.D. Para toda i{1,,t} existe PiG con |Pi|=pi y de forma que PiPi+1 para toda i{1,,t1}.
De hecho, con esto quedarían probados los dos incisos del PTS (Primer Teorema de Syow).

Primero necesitamos un subgrupo de orden p. Éste se tiene gracias al Teorema de Cauchy. Así, podemos afirmar que G tiene un subgrupo de orden p.
Ahora, si i{1,,t1} y H es un subgrupo de orden pi veamos que podemos construir un subgrupo de G de orden pi+1 tal que H sea normal a él:

Sabemos que p divide a [G:H] y como [G:H][NG(H):H](mód p) entonces
p divide a [NG(H):H]=|NG(H)/H|.

Entonces por Cauchy, el grupo cociente NG(H)/H tiene un subgrupo de orden p, y por el teorema de la correspondencia es de la forma H~/H con HH~NG(H). Así,

p=|H~/H|=|H~||H|=H~pi|H~|pi=p|H~|=pi+1
pero HNG(H) por construcción del normalizador y H~NG(H), entonces HH~.

Ilustración de por qué HH~.

De esta manera, dado un subgrupo de orden pi podemos encontrar un subgrupo de orden pi+1 tal que el primero sea normal en el segundo. Entonces, considerando P1 un subgrupo de G de orden p, existe P2 un subgrupo de G de orden p2 tal que P1P2 y a partir de P2 podemos hallar P3 un subgrupo de G de orden p3 tal que P2P3 y así sucesivamente.

Concluimos entonces que existen P1,,Pt subgrupos de G con |Pi|=pi para toda i{1,,t} tales que P1P2Pt.

◼

En consecuencia, el PTS nos dice qué tamaño tienen los p-subgrupos de Sylow, una incógnita que no habíamos resuelto. Esto se ilustra en el siguiente corolario.

Corolario. Sea pZ+ un primo, G un grupo finito con |G|=ptm, t,m,N+ y p|m. Los p-subgrupos de Sylow de G tienen orden pt.

Segundo Teorema de Sylow

Antes de enunciar y probar el STS (Segundo Teorema de Sylow) vamos a dar una observación.

Observación. Los conjugados de un p-subgrupo de Sylow son también p-subgrupos de Sylow.

Demostración.
Sea pZ+ un primo, G un grupo finito, |G|=ptm con t,mN+, p|m.

Al tomar P un p-subgrupo de Sylow de G, por el corolario del PTS sabemos que |P|=pt.

Ahora, al conjugarlo mediante gG se tiene que gPg1G con |gPg1|=|P|=pt. Así, gPg1 es un p-grupo y debido a que su orden es la máxima potencia de p que divide a |G| se tiene que es un p-subgrupo de Sylow.

◼

Esta observación nos dice que todos los conjugados de un p-subgrupo de Sylow son igual un p-subgrupo de Sylow, pero el STS va más allá y nos dice que conjugando p-subgrupos de Sylow podemos encontrar todos los p-subgrupos de Sylow de un grupo G.

Teorema (2do Teorema de Sylow). Sean pZ+ un primo, G un grupo finito. Todos los p-subgrupos de Sylow de G son conjugados en G.

Demostración.

Sea pZ+ un primo, G un grupo finito, P y Qp-subgrupos de Sylow de G.

Sea X={gP|gG}. Para comenzar definimos q(gP)=qgP para todas qQ,gG. Ésta es una acción de Q en X. Como Q es un p-grupo, por el último teorema de la entrada Clase de Conjugación, Centro de G, Ecuación de Clase y  p-Grupo sabemos que
#X#XQ(mód p).

Como p no divide a [G:P] y [G:P]=#X, entonces p tampoco divide a #XQ. En particular #XQ0 y así XQ.

Pero
XQ={gP|q(gP)=gPqQ}={gP|qgP=gPqQ}={gP|g1qgPqQ}={gP|g1QgP}porque es para toda qQ={gP|g1Qg=P}.

donde la última igualdad se da porque g1Qg y P son p-subgrupos de Sylow y entonces tienen el mismo orden, la máxima potencia de p que divide al orden de G.

Así, {gP|g1Qg=P} y en consecuencia existe gG tal que g1Qg=P.

Por lo tanto P y Q son conjugados en G.

◼

Tercer Teorema de Sylow

Teorema (3er Teorema de Sylow). Sea pZ+ un primo, G un grupo finito y rp el número de p-subgrupos de Sylow de G. Entonces

  1. rp1(mód p).
  2. rp divide a |G|.

Demostración.
Sea pZ+ un primo, G un grupo finito y rp el número de p-subgrupos de Sylow de G.

  1. Sea X={P1,,Prp} la colección de todos los p-subgrupos de Sylow de G. Definimos gPi=gPig1 para todas gP1 e i{1,,rp}, que es una acción de P1 en X ya que gPig1 es nuevamente un p-subgrupo de Sylow por la observación previa. Como P1 es un p-grupo, por el último teorema de la entrada Clase de Conjugación, Centro de G, Ecuación de Clase y  p-Grupo sabemos que
    #X#XP1(mód p).
    Pero por la construcción de X, tenemos que rp=#X#XP1(mód p).
    Ahora, veamos que #XP1=1 y para ello analicemos quién es XP1
    XP1={PiX|gPi=PigP1}={PiX|gPig1=PigP1}.
    Así, para toda PiXP1 se tiene que P1NG(Pi) y también PiNG(Pi).
    Entonces P1 y Pi son p-subgrupos de Sylow de NG(Pi).
    Por el 2do Teorema de Sylow, P1 y Pi son conjugados en NG(Pi), es decir existe gNG(Pi) tal que
    P1=gPig1=Pipues gNG(Pi).
    Concluimos entonces que P1 es el único elemento en XP1 y así #XP1=1. Por lo tanto rp1(mód p).
  2. Sea X={P1,,Prp} la colección de todos los p-subgrupos de Sylow de G.
    Definimos gPi=gPig1 para todas gG e i{1,,rp}, que es una acción de G en X.
    Por el segundo teorema de Sylow sabemos que P1,,Prp son conjugados de P1, entonces O(P1)={gP1|gg}={gP1g1|gg}={P1,,Prp}=X es decir, la acción es transitiva.
    Entonces obtenemos que rp=#O(P1). Pero, sabemos que #O(P1)=[G:GPi]=|G||GPi|
    que es un divisor de |G|. Por lo tanto rp es un divisor de |G|.

◼

Tarea moral

  1. Demuestra el corolario del PTS: Sea pZ+ un primo, G un grupo finito con |G|=ptm con t,m,N+ y p|m. Los p-subgrupos de Sylow de G tienen orden pt.
  2. Sean pZ+ un número primo, G un grupo y P un p-subgrupo de Sylow de G. Demuestra que P es el único p-subgrupo de Sylow de G si y sólo si PG.
  3. Sea pZ+ un número primo. Da un ejemplo de un grupo finito G que tenga tres p-subgrupos de Sylow P, Q y R tales que PQ={1} y PR{1}.
    (Sugerencia: Considera S3×S3.)
  4. Sean pZ+ un número primo y G un grupo finito. Considera Q un p-subgrupo de G tal que QG. Prueba que QP para cada p-sugrupo de Sylow P de G.
    (Sugerencia: Usa el hecho de que cualquier otro p-subgrupo de Sylow de G es conjugado de P.)
  5. Sean pZ+ un número primo y G un grupo finito. Para cada primo p divisor del orden de un grupo finito G, escoge un p-subgrupo de Sylow Qp. Prueba que G=pQp.(Sugerencia: Usa el orden de los subgrupos generados por los subgrupos de Sylow.)

Más adelante…

En esta entrada abarcamos los tres Teoremas de Sylow, se colocaron los tres en esta entrada para que fuera más fácil consultarlos. Sin embargo, esto hace a la entrada un poco larga, así que la siguiente estará dedicada a algunos ejemplos de la aplicación de estos teoremas.

Entradas relacionadas