Archivo de la etiqueta: dominios enteros

Álgebra Superior II: Divisibilidad en los enteros

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior hablamos del algoritmo de la división. Dados dos números enteros $a$ y $b$, con $b\neq 0$, nos permite poner de manera única a $a$ de la forma $a=qb+r$, en donde $q$ y $r$ son enteros, y además $0\leq r < |b|$. En otras palabras, nos permite poner a un número como «copias de otro», más un residuo «chiquito». En esta entrada hablaremos de la divisibilidad en los enteros.

La divisibilidad se da cuando pasa una situación especial en el algoritmo de la división: cuando el residuo obtenido es igual a cero. Es decir, cuando podemos escribir $a=qb$. Cuando esto sucede, diremos que $b$ divide a $a$, o bien que $a$ es múltiplo de $b$. En esta entrada daremos una definición formal que contemple este caso y estudiaremos varias de sus propiedades.

Definición de divisibilidad

La noción fundamental que estudiaremos en esta entrada es la de divisibilidad. La definición crucial es la siguiente.

Definición. Sean $m$ y $n$ enteros. Diremos que $m$ divide a $n$ si existe un entero $k$ tal que $n=km$. En notación, escribiremos $m|n$. También diremos que $n$ es un múltiplo de $m$, o bien que $n$ es divisible entre $m$.

Ejemplo. El número $35$ es divisible entre $5$ pues podemos encontrar un entero $k$ tal que $35=k\cdot 5$. Concretamente, podemos escribir $35=7\cdot 5$. Así mismo, este número también es divisible entre $-7$ pues podemos encontrar un entero $k$ tal que $35=k\cdot (-7)$, en concreto, podemos escribir $35=(-5)(-7)$.

Por otro lado, el $35$ no es múltiplo de $8$. ¿Cómo sabemos esto? Al hacer el algoritmo de la división obtenemos que $35=4\cdot 8 + 3$. Como esta es la única forma de escribir a $35$ como un múltiplo de $8$ más un residuo entre $0$ y $7$, entonces es imposible escribirlo como un múltiplo de $8$ más residuo $0$. En otras palabras, no es múltiplo de $8$.

$\square$

Propiedades básicas de divisibilidad

La siguiente proposición habla de algunas de las propiedades básicas de la divisibilidad. Las enunciaremos y daremos sus demostraciones para poner en práctica nuestra definición de divisibilidad.

Proposición. La noción de divisibilidad cumple las siguientes propiedades.

  • Los enteros $1$ y $-1$ dividen a cualquier otro entero.
  • El entero $0$ es divisible por cualquier entero.
  • Es reflexiva, es decir para cualquier entero $n$ se tiene que $n|n$.
  • Es transitiva, es decir si $l,m,n$ son enteros tales que $l|m$ y $m|n$, entonces $l|n$.

Demostración. A continuación demostramos la demostración, inciso por inciso.

  • Recordemos que si $n$ es un entero, entonces $n=n\cdot 1$. Esto nos dice que $1$ divide a $n$. Además, por las propiedades de las operaciones en los números enteros tenemos lo siguiente:
    \begin{align*}
    n&=n\cdot 1\\
    &=n\cdot ((-1)\cdot (-1))\\
    &=(n\cdot (-1))\cdot (-1)\\
    &=(-n)\cdot (-1).
    \end{align*}
    Aquí estamos usando que $(-1)(-1)=1$, la asociatividad del producto en los números enteros y que $(-1)n=-n$. En resumen, obtenemos que $n=(-n)(-1)$, lo cual nos dice que $-1|n$.
  • Aquí notamos que para cualquier entero $n$ tenemos que $0=0\cdot n$. Así, $n|0$.
  • Anteriormente usamos que $n=n\cdot 1$ para concluir $1|n$. Así mismo, al usar $n=1\cdot n$ obtenemos que $n|n$.
  • Veamos la transitividad. Supongamos que $l,m,n$ son enteros tales que $l|m$ y $m|n$. Por definición de divisibilidad podemos encontrar enteros $q$ y $r$ tales que $m=ql$ y $n=rm$. Substituyendo el valor de $m$ de la primera igualdad en la segunda y usando asociatividad obtenemos que: $$n=rm=r(ql)=(rq)l.$$ Esto precisamente nos dice que $l|n$.

$\square$

Divisibilidad y operaciones en los enteros

La divisibilidad se comporta bien con las operaciones en los números enteros. En la siguiente proposición encontramos algunas de las propiedades que vuelven esto un poco más preciso.

Proposición. La noción de divisibilidad cumple las siguientes propiedades.

  • Para enteros $l,m,n$, si $l|m$ y $l|n$, entonces $l|m+n$.
  • Para enteros $l,m,n$, si $l|m$, entonces $l|mn$.
  • Para enteros $l$, $a$, $b$, $c$, $d$ se cumple que si $l|m$ y $l|n$, entonces $l|am+bn$.

Demostración. Daremos la demostración inciso por inciso:

  • Como $l|m$ y $l|n$, por definición existen enteros $r$ y $s$ tales que $m=rl$ y $n=sl$. Al hacer la suma y usar la distributividad del producto sobre la suma obtenemos que $$m+n=rl+sl=(r+s)l.$$ Esto por definición está diciendo que $l$ divide a $m+n$.
  • Aquí podemos utilizar una propiedad anterior. Tenemos que $mn=nm$, por lo cual $mn$ es divisible entre $m$. Es decir, tenemos $l|m$ y $m|mn$. Así, por la transitividad de la divisibilidad, que ya probamos anteriormente, tenemos que $l|mn$.
  • Este inciso es consecuencia de los dos anteriores y, de hecho, ya no tenemos que usar la definición. Por el segundo inciso, como $l|m$, entonces $l|am$. Así mismo, como $l|n$, entonces $l|bn$. Finalmente, por el primer inciso, como $l|am$ y $l|bn$, entonces $l|am+bn$.

$\square$

Observa que si ponemos $a=1$ y $b=-1$ en la última propiedad obtenemos el siguiente corolario: si $l|m$ y $l|n$, entonces $l|m-n$.

Divisibilidad y orden en los enteros

Hay una tercera clase de propiedades que cumple la noción de divisibilidad: aquellas relacionadas con el orden en los enteros. Veamos esto.

Proposición. La noción de divisibilidad cumple las siguientes propiedades.

  • Si $m$ y $n$ son enteros distintos de cero tales que $m|n$, entonces $|m|\leq |n|$.
  • Si $m$ y $n$ son enteros positivos tales que $m|n$, entonces $m\leq n$.
  • Si $m$ y $n$ son enteros tales que $m|n$ y $n|m$, entonces $|m|=|n|$.

Demostración. Demostraremos la primera afirmación a detalle, pues a partir de ella salen las otras dos de manera prácticamente inmediata.

Tomemos dos enteros $m$ y $n$ tales que $m|n$. Por definición de divisibilidad, tenemos que existe un entero $k$ tal que $n=km$. Al tomar valor absoluto de esta expresión, obtenemos que $|n|=|km|$. Por propiedades del valor absoluto, tenemos que $|km|=|k||m|$. Como $n$ es distinto de cero, entonces $k$ también es distinto de cero, así que $|k|\geq 1$. De esta manera, tenemos la siguiente cadena de igualdades y desigualdades: $$|n|=|km|=|k||m|\geq 1\cdot |m| = |m|.$$

Esto es lo que queríamos demostrar.

Para el segundo inciso, como $m$ y $n$ son positivos, entonces entran en el caso del primer inciso. Además, por ser positivos tenemos $|m|=m$ y $|n|=n$. De este modo, por el primer inciso tenemos $m\leq n$.

En el tercer inciso primero tenemos que descartar algunos casos. Si $m=0$, entonces la divisibilidad $0|n$ nos dice que $n=k\cdot 0$ para alguna $k$ entera, pero entonces $n=0$ también, y entonces se cumple $|m|=0=|n|$. El caso $n=0$ es análogo. Ya descartados estos casos, podemos suponer que $m$ y $n$ son distintos de cero. Por el primer inciso tendríamos entonces $|m|\leq |n|$ y $|m|\geq |n|$. Así, $|m|=|n|$, como queríamos.

$\square$

Un ejemplo que usa varias propiedades de divisibilidad

¿Por qué es bueno recordar y saber cuándo usar propiedades de la divisibilidad? Porque nos permite simplificar ciertos problemas y resolverlos más fácilmente. Veamos un ejemplo.

Problema. Encuentra todos los divisores del número $12$.

Solución. Supongamos que $d$ es un divisor de $12$. Tenemos entonces que $|d|\leq |12|=12$, así, $d$ es un número entre $-12$ y $12$. Fuera de este rango no pueden existir divisores de $12$.

Por reflexividad tenemos que $12|12$. Por la propiedad de $1$ y $-1$ tenemos que $1|12$ y $-1|12$. Es fácil ver $12=2\cdot 6$ y $12=3\cdot 4$, así que $2$, $3$, $4$ y $6$ son todos ellos divisores de $12$. Los negativos de estos números también serán divisores entonces pues, por ejemplo, como $12=3\cdot 4$, también tenemos $12=(-3)(-4)$.

De este modo, hasta ahora hemos visto que $-12,-6,-4,-3,-2,-1,1,2,3,4,6,12$ son todos ellos divisores de $12$.

El $5$ claramente no es, pues al hacer el algoritmo de la división obtenemos $12=2\cdot 5 +2$, con residuo $2$. Entonces el $-5$ tampoco puede ser divisor.

Podríamos hacer lo mismo con $7,8,9,10,11$. Pero una forma fácil de ver que ninguno de ellos va a funcionar es que si intentáramos escribir $12=7k$, por ejemplo, se tiene que $k$ no puede ser $1$ (pues $12\neq 7$) y si ponemos $k\geq 2$ entonces el producto es al menos $14$, que ya se pasa de $12$. Así, ni estos números, ni $-7,-8,-9,-10,-11$ son divisores de $12$.

$\square$

Más adelante…

La noción de divisibilidad da pie a varios otros conceptos en la teoría de números enteros. Dentro de algunas entradas hablaremos de dos conceptos importantes: el de máximo común divisor y mínimo común múltiplo en los enteros. Sin embargo, antes de hacer esto tomaremos una pequeña desviación para hablar de un concepto un poco abstracto pero bastante útil: los ideales.

Tarea moral

  1. Encuentra todos los divisores del número $24$ (tanto los positivos, como los negativos) y verifica que en efecto cumplen con la definición dada en esta entrada.
  2. Encuentra contraejemplos para las siguientes afirmaciones:
    1. Si $l$, $m$ y $n$ son enteros tales que $l|m$ y $n|m$, entonces $l+n|m$.
    2. Si $l,m,n$ son enteros tales que $l|mn$, entonces o bien $l|m$ o bien $l|n$.
  3. Demuestra las siguientes dos propiedades de la noción de divisibilidad:
    1. Si $m$ y $n$ son enteros positivos tales que $m|n$ y $n|m$, entonces $m=n$.
    2. Si $m$ es divisor de $n$ con $n=km$, entonces $k$ también es divisor de $n$.
  4. Sean $m$ y $n$ enteros. Demuestra que $m$ divide a $n$ si y sólo si $m^2$ divide a $n^2$.
  5. Sea $n$ un entero positivo, $m$ un entero, $a_1,\ldots,a_n$ enteros y $b_1,\ldots,b_n$ enteros. Demuestra que si $m|b_i$ para todo $i=1,\ldots,n$, entonces $m| \sum_{i=1}^n a_ib_i$.

Entradas relacionadas

Álgebra Superior II: Máximo común divisor de polinomios y algoritmo de Euclides

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada continuamos estudiando propiedades aritméticas del anillo de polinomios con coeficientes reales. En la entrada anterior introdujimos el algoritmo de la división, la noción de divisibilidad y los polinomios irreducibles. Además, mostramos el teorema del factor y el teorema del residuo. Lo que haremos ahora es hablar del máximo común divisor de polinomios.

Mucha de la teoría que desarrollamos en los enteros también se vale para $\mathbb{R}[x]$. Como en $\mathbb{Z}$, lo más conveniente para desarrollar esta teoría es comenzar hablando de ideales. Con estos buenos cimientos, veremos que el máximo común divisor de dos polinomios se puede escribir como «combinación lineal de ellos». Para encontrar la combinación lineal de manera práctica, usaremos de nuevo el algoritmo de Euclides.

Antes de comenzar, haremos una aclaración. Hasta ahora hemos usado la notación $f(x), g(x),h(x)$, etc. para referirnos a polinomios. En esta entrada frecuentemente usaremos nada más $f,g,h$, etc. Por un lado, esto simplificará los enunciados y demostraciones de algunos resultados. Por otro lado, no corremos el riesgo de confusión pues no evaluaremos a los polinomios en ningún real.

Ideales de $\mathbb{R}[x]$

Comenzamos con la siguiente definición clave, que nos ayuda a hacer las demostraciones de máximo común divisor de polinomios de manera más sencilla.

Definición. Un subconjunto $I$ de $\mathbb{R}[x]$ es un ideal si pasa lo siguiente:

  1. El polinomio cero de $\mathbb{R}[x]$ está en $I$.
  2. Si $f$ y $g$ son elementos de $\mathbb{R}[x]$ en $I$, entonces $f+g$ está en $I$.
  3. Si $f$ y $g$ son elementos de $\mathbb{R}[x]$, y $f$ está en $I$, entonces $fg$ está en $I$.

Ejemplo. El conjunto $I_0=\{f\in \mathbb{R}[x]\mid f(0)=0 \}$.

Evidentemente el polinomio constante $0$, está en $I_0$, ya que evaluado en cualquier número es cero (en particular al evaluarlo en 0).

Si $f,g\in I_0$, entonces $(f+g)(0)=f(0)+g(0)=0+0=0$, por lo que $f+g\in I_0$.

Finalmente, si $g\in I_0$ y $f$ es cualquier polinomio, tenemos que $(fg)(0)=f(0)g(0)=f(0)\cdot 0=0$, por lo que $fg\in I_0$. Con esto concluimos que $I_0$ es un ideal.

$\square$

Al igual que en los enteros, los únicos ideales consisten de múltiplos de algún polinomio. El siguiente resultado formaliza esto.

Teorema (caracterización de ideales en $\mathbb{R}[x]$). Un subconjunto $I$ es un ideal de $\mathbb{R}[x]$ si y sólo si existe un polinomio $f$ tal que $$I=f\mathbb{R}[x]:=\{fg: g \in \mathbb{R}[x]\}.$$

Demostración de «la ida». Primero mostraremos que cualquier conjunto de múltiplos de un polinomio dado $f$ es un ideal. Tomemos $f$ en $\mathbb{R}[x]$ y $$I=f\mathbb{R}[x]=\{fg: g \in \mathbb{R}[x]\}.$$

La propiedad (1) de la definición de ideal se cumple pues tomando $g=0$ tenemos que $f\cdot 0 = 0$ está en $I$.

Para la propiedad (2), tomamos $fg_1$ en $I$ y $fg_2$ en $I$, es decir, con $g_1$ y $g_2$ en $\mathbb{R}[x]$. Su suma es, por la ley de distribución, el polinomio $f\cdot (g_1+g_2)$, que claramente está en $I$ pues es un múltiplo de $f$.

Para la propiedad (3), tomamos $fg$ en $I$ y $h$ en $\mathbb{R}[x]$. El producto $(fg)\cdot h$ es, por asociatividad, igual al producto $f\cdot(gh)$, que claramente está en $I$. De esta forma, $I$ cumple (1), (2) y (3) y por lo tanto es un ideal.

$\square$

Demostración de «la vuelta». Mostraremos ahora que cualquier ideal $I$ es el conjunto de múltiplos de un polinomio. Si $I=\{0\}$, que sólo tiene al polinomio cero, entonces $I$ es el conjunto de múltiplos del polinomio $0$. Así, podemos suponer que $I$ tiene algún elemento que no sea el polinomio $0$.

Consideremos el conjunto $A$ de naturales que son grado de algún polinomio en $I$. Como $I$ tiene un elemento no cero, $A$ es no vacío. Por el principio del buen orden, $A$ tiene un mínimo, digamos $n$. Tomemos en $I$ un polinomio $f$ de grado $n$. Afirmamos que $I$ es el conjunto de múltiplos de $f$, es decir, $$I=f\mathbb{R}[x].$$

Por un lado, como $f$ está en $I$ e $I$ es un ideal, por la propiedad (3) de la definición de ideal se tiene que $fg$ está en $I$ para todo $g$ en $\mathbb{R}[x]$. Esto muestra la contención $f\mathbb{R}[x]\subseteq I$.

Por otro lado, supongamos que hay un elemento $h$ que está en $I$, pero no es múltiplo de $f$. Por el algoritmo de la división, podemos encontrar polinomios $q$ y $r$ tales que $h-qf=r$ y $r$ es el polinomio cero o de grado menor a $f$. No es posible que $r$ sea el polinomio cero pues dijimos que $h$ no es múltiplo de $f$. Así, $r$ no es el polinomio cero y su grado es menor al de $f$.

Notemos que $-qf$ está en $I$ por ser un múltiplo de $f$ y que $h$ está en $I$ por cómo lo elegimos. Por la propiedad (2) de la definición de ideal se tiene entonces que $r=h+(-qf)$ también está en $I$. Esto es una contradicción, pues habíamos dicho que $f$ era un polinomio de grado mínimo en $I$, pero ahora $r$ tiene grado menor y también está en $I$. Por lo tanto, es imposible que exista un $h$ en $I$ que no sea múltiplo de $f$. Esto muestra la contención $I\subseteq f\mathbb{R}[x]$.

$\square$

Ejemplo. En el ejemplo anterior, $I_0$ denotaba el conjunto de polinomios que se anulan en $0$, podemos demostrar que $I_0=x\mathbb{R}[x]$, ya que si $f\in I_0$, por el teorema del factor, el polinomio $x-0$ divide a $f$, es decir que $f(x)=xg(x)$ para alguan $g\in \mathbb{R}[x]$. Esto prueba que $I_0\subseteq x\mathbb{R}$, dejamos el resto de los detalles como un ejercicio moral.

$\square$

El teorema anterior nos dice que cualquier ideal se puede escribir como los múltiplos de un polinomio $f$. ¿Es cierto que este polinomio $f$ es único? Para responder esto, pensemos qué sucede si se tiene $$f\mathbb{R}[x]=g\mathbb{R}[x],$$ o, dicho de otra forma, pensemos qué sucede si $f$ divide a $g$ y $g$ divide a $f$.

Si alguno de $f$ ó $g$ es igual a $0$, entonces el otro también debe de serlo. Así, podemos suponer que ninguno de ellos es igual a $0$. Como $g$ divide a $f$, podemos escribir a $f$ como $hg$ para $h$ un polinomio no cero. De manera similar, podemos escribir a $g$ como un polinomio $kf$ para $k$ un polinomio no cero. Pero entonces $$f=hg=hkf.$$

El grado del lado izquierdo es $\deg(f)$ y el del derecho es $\deg(h)+\deg(k)+\deg(f)$, de donde obtenemos que $\deg(h)=\deg(k)=0$. En otras palabras, concluimos que $h$ y $k$ son polinomios constantes y distintos de cero. Resumimos esta discusión a continuación.

Proposición. Tomemos $f(x)$ y $g(x)$ polinomios en $\mathbb{R}[x]$ distintos del polinomio $0$. Si $f(x)$ divide a $g(x)$ y $g(x)$ divide a $f(x)$, entonces $f(x)=hg(x)$ para un real $h\neq 0$. Del mismo modo, si $f(x)=hg(x)$ con $h$ un real, entonces $f(x)$ divide a $g(x)$ y $g(x)$ divide a $f(x)$.

Cuando sucede cualquiera de las cosas de la proposición anterior, decimos que $f(x)$ y $g(x)$ son asociados.

Ya que no hay un único polinomio que genere a un ideal, nos conviene elegir a uno de ellos que cumpla una condición especial. El coeficiente principal de un polinomio es el que acompaña al término de mayor grado. En otras palabras, si $p(x)$ es un polinomio de grado $n$ dado por $$p(x)=a_0+\ldots+a_nx^n,$$ con $a_n\neq 0$, entonces $a_n$ es coeficiente principal.

Definición. Un polinomio es mónico si su coeficiente principal es $1$.

Por la proposición anterior, existe un único polinomio mónico asociado a $p(x)$, y es $\frac{1}{a_n}p(x)$. Podemos resumir las ideas de esta sección mediante el siguiente teorema.

Teorema. Para todo ideal $I$ de $\mathbb{R}[x]$ distinto del ideal $\{0\}$, existe un único polinomio mónico $f$ tal que $I$ es el conjunto de múltiplos de $f$, en símbolos, $$I=f\mathbb{R}[x].$$

Máximo común divisor de polinomios

Tomemos $f$ y $g$ polinomios en $\mathbb{R}[x]$. Es sencillo ver, y queda como tarea moral, que el conjunto $$f\mathbb{R}[x]+g\mathbb{R}[x]=\{rf+sg: r,s \in \mathbb{R}[x]\}$$ satisface las propiedades (1), (2) y (3) de la definición de ideal. Por el teorema de caracterización de ideales, la siguiente definición tiene sentido.

Definición. El máximo común divisor de $f$ y $g$ es el único polinomio mónico $d$ en $\mathbb{R}[x]$ tal que $$f\mathbb{R}[x]+g\mathbb{R}[x] = d\mathbb{R}[x].$$ A este polinomio lo denotamos por $\MCD{f,g}$.

De manera inmediata, de la definición de $\MCD{f,g}$, obtenemos que es un elemento de $f\mathbb{R}[x]+g\mathbb{R}[x]$, o sea, una combinación lineal polinomial de $f$ y $g$. Este es un resultado fundamental, que enunciamos como teorema.

Teorema (identidad de Bézout). Para $f$ y $g$ en $\mathbb{R}[x]$ existen polinomios $r$ y $s$ en $\mathbb{R}[x]$ tales que $$\MCD{f,g}=rf+sg.$$

El nombre que le dimos a $\MCD{f,g}$ tiene sentido, en vista del siguiente resultado.

Teorema. Para $f$ y $g$ en $\mathbb{R}[x]$ distintos del polinomio cero se tiene que:

  • $\MCD{f,g}$ divide a $f$ y a $g$.
  • Si $h$ es otro polinomio que divide a $f$ y a $g$, entonces $h$ divide a $\MCD{f,g}$.

Demostración. Por definición, $$f\mathbb{R}[x]+g\mathbb{R}[x] = \MCD{f,g}\mathbb{R}[x].$$ El polinomio $f$ pertenece al conjunto del lado izquierdo, pues lo podemos escribir como $$1\cdot f + 0 \cdot g,$$ así que también está en el lado derecho. Por ello, $f$ es un múltiplo de $\MCD{f,g}$. De manera similar se prueba que $g$ es un múltiplo de $\MCD{f,g}$.

Para la segunda parte, escribimos a $\MCD{f,g}$ como combinación lineal polinomial de $f$ y $g$, $$\MCD{f,g}=rf+sg.$$ De aquí es claro que si $h$ divide a $f$ y a $g$, entonces $h$ divide a $\MCD{f,g}$.

$\square$

Todo esto va muy bien. El máximo común divisor de dos polinomios en efecto es un divisor, y es «el mayor», en un sentido de divisibilidad. Además, como en el caso de $\mathbb{Z}$, lo podemos expresar como una combinación lineal de sus polinomios. En la tarea moral puedes ver algunos ejemplos que hablan del concepto dual: el mínimo común múltiplo.

El algoritmo de Euclides

Al igual que como sucede en los enteros, podemos usar el algoritmo de la división iteradamente para encontrar el máximo común divisor de polinomios, y luego revertir los pasos para encontrar de manera explícita al máximo común divisor como una combinación lineal polinomial de ellos. Es un buen ejercicio enunciar y demostrar que esto es cierto. No lo haremos aquí, pero veremos un ejemplo de cómo aplicar el algoritmo.

Problema: Encuentra el máximo común divisor de los polinomios
\begin{align*}
a(x)&=x^7+x^6+x^5+x^4+x^3+x^2+x+1\\
b(x)&=x^4+x^3+x^2+x+1,
\end{align*} y exprésalo como combinación lineal de $a(x)$ y $b(x)$.

Solución. Aplicando el algoritmo de la división repetidamente, tenemos lo siguiente:

\begin{align*}
a(x)&=x^3b(x)+(x^2+x+1)\\
b(x)&=x^2(x^2+x+1)+(x+1)\\
x^2+x+1&=x(x+1)+1.
\end{align*}

Esto muestra que $a(x)$ y $b(x)$ tienen como máximo común divisor al polinomio $1$. Por lo que discutimos antes, debe haber una combinación lineal polinomial de $a(x)$ y $b(x)$ igual a $1$ Para encontrarla de manera explícita, invertimos los pasos:

\begin{equation*}
\begin{split}
1 & =(x^2+x+1)-x(x+1)\\
& =(x^2+x+1)-x(b(x)-x^2(x^2+x+1))\\
& =(x^2+x+1)(x^3+1)-xb(x)\\
& =(x^3+1)(a(x)-x^3(b(x))-xb(x)\\
& =(x^3+1)a(x)-x^3(x^3+1)b(x)-xb(x)\\
& =(x^3+1)a(x)+(-x^6-x^3-x)b(x)
\end{split}
\end{equation*}

Así, concluimos que una combinación lineal que sirve es: $$(x^3+1)a(x)+(-x^6-x^3-x)b(x) = 1.$$

$\square$

Tarea moral

Los siguientes ejercicios te ayudarán a repasar los conceptos vistos en esta entrada.

  • Verifica que el conjunto $$f\mathbb{R}[x]+g\mathbb{R}[x]=\{rf+sg: r,s \in \mathbb{R}[x]\}$$ satisface las propiedades (1), (2) y (3) de la definición de ideal.
  • Encuentra el máximo común divisor de los polinomios $x^8-1$ y $x^6-1$. Exprésalo como combinación lineal de ellos.
  • Muestra que la intersección de dos ideales de $\mathbb{R}[x]$ es un ideal de $\mathbb{R}[x]$.
  • Al único polinomio mónico $m$ tal que $$f\mathbb{R}[x]\cap g\mathbb{R}[x]=m\mathbb{R}[x]$$ le llamamos el mínimo común múltiplo de $f$ y $g$, y lo denotamos $\mcm{f,g}$. Muestra que es un múltiplo de $f$ y de $g$ y que es «mínimo» en el sentido de divisibilidad.
  • Muestra que si $f$ y $g$ son polinomios mónicos en $\mathbb{R}[x]$ distintos del polinomio cero, entonces $fg = \MCD{f,g} \mcm{f,g}$. ¿Es necesaria la hipótesis de que sean mónicos? ¿La puedes cambiar por una hipótesis más débil?

Más adelante

Como mencionamos, los conceptos que desarrollamos en esta sección son muy similares a los que desarrollamos para $\mathbb{Z}$, sin embargo, para que puedas acostumbrarte a la notación, en la siguiente entrada practicaremos como calcular el Máximo Común Divisor para dos polinomios.

Después de eso, el siguiente paso será extrapolar el concepto de elementos primos en el conjunto de los polinomios y con esa nueva herramienta ver la posibilidad de poder dar un resultado análogo al teorema fundamental de la aritmética que dimos en $\mathbb{Z}$.

Entradas Relacionadas

Seminario de Resolución de Problemas: Grupos, anillos y campos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En estas entradas hemos visto cómo distintas herramientas de álgebra nos pueden ayudar en la resolución de problemas. En las primeras dos entradas, hablamos de identidades algebraicas básicas y un par de avanzadas. Luego, hablamos de factorización en polinomios y del teorema de la identidad. Ahora platicaremos de cómo estructuras un poco más abstractas nos pueden ayudar. De manera particular, nos enfocaremos en aplicaciones de teoría de grupos a la resolución de problemas. Sin embargo, hacia el final de la entrada también hablaremos un poco acerca de anillos, dominios enteros y campos.

Teoría de grupos básica

Una de las nociones de álgebra abstracta más básicas, y a la vez más flexibles, es la de grupo. La teoría de grupos es muy rica y se estudia a profundidad en un curso de álgebra abstracta o álgebra moderna. Aquí veremos únicamente un poco de esta teoría y algunas aplicaciones a resolución de problemas. Comenzamos con la definición.

Definición. Un grupo es un conjunto no vacío $G$ con una operación binaria $\cdot$ que cumple lo siguiente:

  • Asociatividad: Para cualesquiera elementos $x,y,z$ en $G$ tenemos que $x\cdot (y\cdot z) = (x\cdot y) \cdot z$.
  • Neutro: Existe un elemento $e$ en $G$ tal que $x\cdot e = x = e\cdot x$ para todo elemento x.
  • Inversos: Para cada elemento $x$ en $G$, existe un elemento $y$ en $G$ tal que $x\cdot y = e = y\cdot x$.

Usualmente se simplifica la notación de la siguiente manera. Por un lado, en vez de poner el símbolo de producto, simplemente se ponen elementos consecutivos, por ejemplo $a\cdot b = ab$. Además, por la asociatividad, muchas veces no se ponen los paréntesis, de modo que expresiones como $(a\cdot b)\cdot c$ se escriben simplemente como $abc$, a menos que los paréntesis ayuden a entender un argumento.

Hay que tener cuidado con invertir el orden de factores. En grupos, no necesariamente sucede que la operación es conmutativa, es decir, que $ab=ba$ para todo par de elementos $a$ y $b$. Si $ab=ba$ decimos que $a$ y $b$ conmutan y si todo par de elementos de $G$ conmutan, decimos que $G$ es conmutativo. Un elemento siempre conmuta consigo mismo. Para $n$ un entero positivo definimos $a^n$ como el producto formado por $n$ veces el elemento $a$.

A partir de la definición se puede ver que el neutro es único, pues si hubiera dos neutros $e$ y $e’$ tendríamos $e=e\cdot e’=e’$, en donde primero usamos que $e’$ es neutro y después que $e$ lo es. Para $a$ en $G$, definimos $a^0$ como $e$.

En grupos se vale «cancelar». Por ejemplo, si $ab=ac$, entonces podemos multiplicar esta igualdad a la izquierda por un inverso $d$ de $a$ y obtendríamos $$b=eb=dab=dac=ec=c.$$ Del mismo modo, la igualdad $ba=ca$ implica $b=c$.

En particular, si $d$ y $d’$ son inversos de $a$, tenemos $da=e=d’a$, de donde $d=d’$. Esto muestra que los inversos también son únicos, así que al inverso de $a$ le llamamos $a^{-1}$. Observa que $e^{-1}=e$. Nota que si $a$ y $b$ son elementos de $G$, entonces $$ab(b^{-1}a^{-1})=aea^{-1}=aa^{-1}=e,$$ de modo que el inverso de un producto $ab$ es el producto $b^{-1}a^{-1}$. Para $n$ un entero positivo, definimos $a^{-n}$ como el inverso de $a^n$, que por lo anterior, es precisamente $(a^{-1})^n$. De hecho, ya definido $a^n$ para todo entero, se puede verificar que se satisfacen las leyes usuales de los exponentes.

Problema. Sean $a$ y $b$ dos elementos en un grupo $G$ con neutro $e$ tales que $aba=ba^2b$, $a^3=e$ y $b^{2021}=e$. Muestra que $b=e$.

Sugerencia pre-solución. Observa que si $a$ y $b$ conmutaran, entonces el resultado se deduce fácilmente de la primer igualdad. Así, intenta modificar el problema a demostrar que $a$ y $b$ conmutan. Para ello tienes que hacer un paso intermedio que necesita inducción.

Solución. Lo primero que veremos es que $a$ y $b^2$ conmutan. Poniendo una identidad entre ambas $b$ en el producto $ab^2$, tenemos que $$ab^2=abaa^{-1}b=ba^2ba^{-1}b.$$ De $a^3=e$, tenemos $a^{-1}=a^2$, así que siguiendo con la cadena de igualdades, \begin{align*}
ba^2ba^{-1}b&=ba^2ba^2b\\
&=ba^2aba\\
&=bba=b^2a.
\end{align*} Así, $ab^2=b^2a$.

Ahora veremos que $a$ y $b$ conmutan. Para ello, como $a$ y $b^2$ conmutan, tenemos que $a$ y $b^{2k}$ conmutan para cualquier entero $k$. Esto se puede probar por inducción. El caso $k=1$ es lo que ya probamos. Si es válido para cierta $k$, se sigue que $$ab^{2k+2}=b^{2k}ab^2=b^{2k+2}a.$$ Por hipótesis, $b^{2020}=b$, así que el resultado anterior nos dice que $a$ y $b$ conmutan.

Por esta razón, la primer hipótesis $aba=ba^2b$ se puede reescribir como $a^2b=a^2b^2$, que por cancelación izquierda da $e=b$, como queríamos mostrar.

$\square$

Subgrupos y órdenes

Dentro de un grupo pueden vivir grupos más pequeños.

Definición. Un subgrupo de un grupo $G$ es un subconjunto $H$ de $G$ que es un grupo con las operaciones de $G$ restringidas a $H$.

Para que $H$ sea subgrupo, basta con que no sea vacío y que sea cerrado bajo la operación de grupos y la operación «sacar inverso».

Por ejemplo, se puede ver que $\mathbb{Z}_{12}$, los enteros módulo $12$ con la suma, forman un grupo. De aquí, $H_1=\{0,3,6,9\}$ es un subgrupo y $H_2=\{0,4,8\}$ es otro.

Proposición. Si $a$ es un elemento de un grupo $G$, entonces o bien $$1,a, a^2, a^3,\ldots$$ son todos elementos distintos de $G$, o bien existe un entero positivo $n$ tal que $a^n=1$ y $1,a,\ldots,a^{n-1}$ son todos distintos. En este segundo caso, $\{1,a,\ldots,a^{n-1}\}$ es un subgrupo de $G$.

Sugerencia pre-demostración. Divide en casos. Luego, usa el principio de cancelación o las leyes de exponentes para grupos.

Demostración. Si todos los elementos son distintos, entonces no hay nada que hacer. De otra forma, existen $i<j$ tales que $a^j=a^i$, de donde por la ley de cancelación tenemos que $a^{j-i}=e$ y $j-i\geq 1$. Así, el conjunto de enteros positivos $m$ tales que $a^m=e$ es no vacío, de modo que por el principio de buen orden tiene un mínimo, digamos $n$.

Afirmamos que $$1,a,a^2,\ldots,a^{n-1}$$ son todos distintos. En efecto, de no ser así, como en el argumento de arriba existirían $0\leq i < j \leq {n-1}$ tales que $a^{j-i}=e$, pero $j-i\leq n-1$ sería una contradicción a la elección de $n$ como elemento mínimo.

Probemos ahora que $A=\{1,a,\ldots,a^{n-1}\}$ es subgrupo de $G$. Si tenemos $a^k$ y $a^l$ en $A$, su producto es $a^{k+l}$. Por el algoritmo de la división, $k+l=qn+r$, con $r\in \{0,\ldots,n-1\}$, de modo que $$a^ka^l=a^{qn+r}=(a^n)^qa^r=e^qa^r=a^r,$$ así que $A$ es cerrado bajo productos. Además, si $1\leq k\leq n-1$, entonces $1\leq n-k \leq n-1$ y $a^ka^{n-k}=a^n=e$. Así, $A$ es cerrado bajo inversos. Esto muestra que $A$ es subgrupo de $G$.

$\square$

En teoría de grupos, la palabra «orden» se usa de dos maneras. Por un lado si $G$ es un grupo, su orden $\text{ord}(G)$ es la cantidad de elementos que tiene. Por otro, dado un elemento $a$, el orden $\text{ord}(a)$ de $a$ es el menor entero positivo $n$ tal que $a^n=e$, si es que existe.

Definimos al subgrupo generado por $a$ como $$\langle a\rangle:=\{a^n:n\in \mathbb{Z}\}.$$ La proposición anterior dice que si $\langle a \rangle$ es finito, entonces es un subgrupo de $G$ de orden $\text{ord}(\langle a \rangle) = \text{ord}(a).$ A los grupos de la forma $\langle a \rangle$ se les llama cíclicos.

Teorema de Lagrange

Cuando estamos trabajando con grupos finitos, el orden de un subgrupo debe cumplir una condición de divisibilidad.

Teorema (de Lagrange). Sea $G$ un grupo finito y $H$ un subgrupo de $G$. Entonces $\text{ord}(H)$ divide a $\text{ord}(G)$.

No daremos la demostración de este teorema, pero veremos algunos corolarios que sirven en la resolución de problemas.

Proposición. Sea $G$ un grupo finito.

  • Si $\text{ord}(G)$ es un primo $p$, entonces $G$ es cíclico.
  • El orden de cualquier elemento $a$ de $G$ divide al orden de $G$, y por lo tanto $a^{\text{ord}(G)}=1$.
  • Si $a$ es un elemento de $G$ de orden $n$ y $a^m=e$, entonces $n$ divide a $m$.

Demostración. Para la primer parte, si tomamos un elemento $a$ de $G$ que no sea $e$, ya vimos que $\langle a \rangle$ es un subgrupo cíclico de $G$. Por el teorema de Lagrange, su orden debe dividir al primo $p$. Pero el orden de $\langle a \rangle$ es al menos $2$, así que el orden de $\langle a \rangle$ debe ser $p$ y por lo tanto $\langle a \rangle=G$.

Como vimos arriba, el orden de $a$ es el orden de $\langle a \rangle$, que divide a $G$. Así,
\begin{align*}
a^{\text{ord}(G)}&=(a^{\text{ord}{a}})^{\text{ord}(G)/ \text{ord}(a)}\\
&=e^{\text{ord}(G)/ \text{ord}(a)}\\
&=e.
\end{align*} Con esto queda probado el segundo punto.

Para el último punto, usamos el algoritmo de la división para escribir $m=qn+r,$ con $r$ entre $0$ y $n-1$. Tenemos que $$e=a^m=a^{qn+r}=a^r.$$ Por lo visto en la sección anterior, necesariamente $r=0$, así que $n$ divide a $m$.

$\square$

Veamos cómo se pueden aplicar algunas de las ideas anteriores a un problema de teoría de grupos concreto.

Problema. En un grupo $G$, tenemos elementos $a$ y $b$ tales que $a^7=1$ y $aba^{-1}=b^2$. Determina qué posibles valores puede tener el orden de $b$.

Sugerencia pre-solución. Conjetura una fórmula para $b^{2n}$ buscando un patrón. Establécela por inducción.

Solución. El orden de $a$ debe dividir a $7$, así que es o $1$ o $7$. Si es $1$, entonces $a=e$, por lo que por la hipótesis tenemos $b=b^2$. De aquí $b=e$, así que el orden de $b$ es $1$. La otra opción es que el orden de $a$ sea $7$.

Afirmamos que para todo entero $n$ se tiene que $a^nba^{-n}=b^{2^n}$. Esto se prueba inductivamente. Es cierto para $n=1$ por hipótesis. Si se cumple para cierta $n$ y elevamos la igualdad al cuadrado, tenemos que
\begin{align*}
b^{2^{n+1}}&=(b^{2n})^2\\
&=a^nba^{-n}a^nba^{-n}\\
&=a^nb^2a^{-n}\\
&=a^{n+1}ba^{-(n+1)},
\end{align*}

lo cual termina la inducción.

En particular, para $n=7$ tenemos que $a^7=a^{-7}=e$, por lo que $b=b^{2^7}$, y por lo tanto $b^{127}=e$. Como $127$ es primo, el orden de $b$ puede ser $1$ ó $127$.

$\square$

En realidad, en el problema anterior falta mostrar que en efecto existe un grupo que satisfaga las hipótesis, y para el cual el orden de $b$ sea exactamente $127$. Esto no lo verificaremos aquí.

Teoría de grupos en teoría de números

Lo que hemos platicado de teoría de grupos se vale para grupos en general. Cuando aplicamos estos resultados a grupos particulares, tenemos nuevas técnicas para resolver problemas. Uno de los casos que aparecen más frecuentemente es aplicar teoría de grupos en problemas de teoría de números.

Si tomamos un entero $n$, los enteros entre $1$ y $n-1$ que son primos relativos con $n$ forman un grupo con la operación de producto módulo $n$. Si llamamos $\varphi(n)$ a la cantidad de primos relativos con $n$ entre $1$ y $n-1$, el teorema de Lagrange da el siguiente corolario.

Teorema (de Euler). Para todo entero positivo $n$ y $a$ un entero primo relativo con $n$, se tiene que $$a^\varphi(n)\equiv 1\pmod n.$$

Como corolario al teorema de Euler, tenemos el pequeño teorema de Fermat, que hemos discutido previamente aquí en el blog.

Teorema (pequeño teorema de Fermat). Para $p$ un primo y $a$ un entero que no sea múltiplo de $p$, se tiene que $$a^{p-1}\equiv 1 \pmod p.$$

Así, cuando $p$ es primo y $a$ no es múltiplo de $p$, se tiene que el orden de $a$ divide a $p-1$. Veamos un ejemplo en donde esta idea forma parte fundamental de la solución.

Problema. Muestra que para ningún entero $n>1$ se tiene que $n$ divide a $2^n-1$.

Sugerencia pre-solución. Procede por contradicción, suponiendo que sí existe. Considera un primo $p$ que divida a $n$ y que además sea extremo en algún sentido. Trabaja módulo $p$.

Solución. Supongamos que existe un entero $n>1$ tal que $n$ divide a $2^n-1$. Sea $p$ el primo más pequeño que divide a $n$. Tomemos $a$ el orden de $2$ en el grupo multiplicativo $\mathbb{Z}_p$.

Por un lado, como $p$ divide a $n$ y $n$ divide a $2^n-1$, se tiene que $p$ divide a $2^n-1$ y por lo tanto $$2^n\equiv 1 \pmod p.$$ De esta forma, $a$ divide a $n$.

Por otro lado, por el pequeño teorema de Fermat, tenemos que $$2^{p-1}\equiv 1 \pmod p,$$ así que $a$ divide a $p-1$ y por lo tanto $a\leq p-1$.

Si $a\neq 1$, entonces $a$ tiene un divisor primo que divide a $n$ y es menor que $a\leq p-1$, lo cual es imposible pues elegimos a $p$ como el menor divisor primo de $n$. De esta forma, $a=1$. Pero esto da la contradicción $2\equiv 1 \pmod p$.

$\square$

Anillos, dominios enteros y campos

Cuando se están resolviendo problemas, es importante tener en mente que existen otras estructuras algebraicas. Definiremos sólo las más comunes y veremos un problema ejemplo.

Definición. Un anillo es un conjunto $R$ con dos operaciones binarias suma y producto tales que:

  • $R$ con la suma es un grupo conmutativo.
  • El producto en $R$ es asociativo, es decir $(ab)c=a(bc)$ para $a,b,c$ en $R$.
  • Se cumple la ley distributiva, es decir $a(b+c)=ab+ac$ y $(b+c)a=ba+ca$ para $a,b,c$ en $R$.

El producto en $R$ no tiene por qué ser un grupo. De hecho, ni siquiera tiene que tener neutro.

Definición. Si un anillo $R$ tiene neutro, decimos que $R$ es un anillo con $1$. Si la multiplicación de $R$ es conmutativa, decimos que $R$ es conmutativo.

Definición. Un dominio entero es un anillo conmutativo con uno en donde además se vale cancelar, es decir, $ab=ac$ implica $b=c$ y $ba=ca$ implica $b=c$.

Definición. Un campo es un anillo conmutativo con uno en donde cada elemento distinto de la identidad aditiva tiene inverso multiplicativo. En otras palabras, es un anillo en donde la suma y el producto son grupos.

Problema. Muestra que todo dominio entero finito es un campo.

Sugerencia pre-solución. Usa el principio de las casillas.

Solución. Supongamos que $R=\{a_1,\ldots,a_n\}$ es un dominio entero con una cantidad finita de elementos. Lo único que falta para que sea campo es que los elementos tengan inversos multiplicativos.

Sea $a$ un elemento de $R$ y supongamos que $a$ no tiene inverso multiplicativo. Entonces, los números $$a_1a, a_2a,\ldots,a_n a$$ sólo pueden tomar a lo más $n-1$ valores diferentes, de modo que por principio de las casillas existen dos de ellos que son iguales, digamos $a_ia=a_ja$ para $i\neq j$.

Como $R$ es dominio entero, se vale cancelar, lo cual muestra $a_i=a_j$. Esto es una contradicción, pues $a_i$ y $a_j$ eran elementos distintos de $R$. Así, todo elemento tiene inverso multiplicativo.

$\square$

En cursos de matemáticas a nivel superior se ven muchos ejemplos de estas estructuras algebraicas. En cursos de Álgebra Superior se construye el dominio entero de enteros $\mathbb{Z}$. Se construyen los campos $\mathbb{R}$, $\mathbb{Q}$ y $\mathbb{C}$. También, se construyen los anillos de polinomios $\mathbb{F}[x]$. La noción de campo es fundamental cuando se construye la teoría de Álgebra Lineal. Como se puede ver, la teoría de álgebra es muy amplia, así que esta entrada sólo queda como invitación al tema.

Más problemas

Puedes encontrar más problemas de estructuras algebraicas en la Sección 4.4 del libro Problem Solving through Problems de Loren Larson.