Archivo de la etiqueta: heurísticas

Seminario de Resolución de Problemas: Polinomios asociados a matrices y el teorema de Cayley-Hamilton

Por Leonardo Ignacio Martínez Sandoval

Introducción

Para terminar esta serie de entradas de álgebra lineal, y con ello el curso de resolución de problemas, hablaremos de polinomios especiales asociados a una matriz: el polinomio mínimo y el polinomio característico. Después, hablaremos del teorema de Cayley-Hamilton, que a grandes rasgos dice que una matriz se anula en su polinomio característico.

Estos resultados forman parte fundamental de la teoría que se aprende en un curso de álgebra lineal. En resolución de problemas, ayudan mucho para entender a los eigenvalores de una matriz, y expresiones polinomiales de matrices.

Polinomio mínimo de una matriz

Podemos evaluar un polinomio en una matriz cuadrada de acuerdo a la siguiente definición.

Definición. Si A es una matriz de n×n con entradas reales y p(x) es un polinomio en R[x] de la forma p(x)=a0+a1x+a2x2++anxn, definimos a la matriz p(A) como la matriz a0In+a1A+a2A2++anAn.

De manera análoga se puede dar una definición cuando las entradas de la matriz, o los coeficientes del polinomio, son números complejos.

Cuando una matriz está diagonalizada, digamos A=P1DP con P invertible y D diagonal, entonces evaluar polinomios en A es sencillo. Se tiene que p(A)=P1p(D)P, y si las entradas en la diagonal principal de D son d1,,dn, entonces p(D) es diagonal con entradas en la diagonal principal iguales a p(d1),,p(dn).

Dada una matriz A, habrá algunos polinomios p(x) en R[x] para los cuales p(A)=0. Si p(x) es uno de estos, entonces cualquier eigenvalor de A debe ser raíz de p(x). Veamos un problema de la International Mathematics Competition de 2011 que usa esto. Es el Problema 2 del día 1.

Problema. Determina si existe una matriz A de 3×3 con entradas reales tal que su traza es cero y A2+tA=I3.

Sugerencia pre-solución. Busca un polinomio p(x) tal que p(A)=0.

Solución. La respuesta es que no existe dicha matriz. Procedamos por contradicción. Si existiera, podríamos transponer la identidad dada para obtener que
A=I3t(A2)=I3(tA)2=I3(I3A2)2=2A2A4.

De aquí, tendríamos que A42A2+A=0, de modo que cualquier eigenvalor de A debe ser una raíz del polinomio p(x)=x42x2+x=x(x1)(x2+x1),

es decir, debe ser alguno de los números 0,1,1+52,152.

Los eigenvalores de A2 son los cuadrados de los eigenvalores de A, así que son algunos de los números 0,1,3+52,352.

Como la traza de A es 0, la suma de sus tres eigenvalores (con multiplicidades), debe ser 0. Como la traza de A2 es la de I3tA, que es 3, entonces la suma de los eigenvalores de A al cuadrado (con multiplicidades), debe ser 0. Un sencillo análisis de casos muestra que esto no es posible.

◻

De entre los polinomios que se anulan en A, hay uno especial. El polinomio mínimo de una matriz A con entradas reales es el polinomio mónico μA(x) de menor grado tal que μA(A)=On, donde On es la matriz de n×n con puros ceros. Este polinomio siempre es de grado menor o igual a n.

Una propiedad fundamental del polinomio mínimo de una matriz es que es mínimo no sólo en un sentido de grado, sino también de divisibilidad.

Teorema. Sea A una matriz de n×n con entradas reales. Entonces para cualquier polinomio p(x) en R[x] tal que p(A)=On, se tiene que μA(x) divide a p(x) en R[x].

Veamos cómo se puede usar este resultado.

Problema. La matriz A de 2×2 con entradas reales cumple que A3A2+A=O2. Determina los posibles valores que puede tener A2A.

Sugerencia pre-solución. Encuentra las posibles opciones que puede tener el polinomio mínimo de A y haz un análisis de casos con respecto a esto.

Solución. La matriz A se anula en el polinomio p(x)=x3x2+x=x(x2x+1), en donde x2x+1 tiene discriminante negativo y por lo tanto es irreducible.

El polinomio mínimo μA(x) debe ser un divisor de p(x). Además, es de grado a lo más 2. Esto nos deja con las siguientes opciones:

  • μA(x)=x, de donde A=O2, y por lo tanto A2=O2. De aquí, A2A=O2.
  • μA(x)=x2x+1. En este caso, tenemos que A2A+I2=0. Así, A2A=I2.

Para mostrar que ambas opciones son posibles, en el primer caso usamos A=O2 y en el segundo caso usamos A=(0111).

◻

Polinomio característico de una matriz

El polinomio característico de una matriz A de n×n se define como χA(x)=det(xInA).

Teorema. El polinomio característico de una matriz A cumple que:

  • Es un polinomio mónico en x de grado n.
  • El coeficiente del término de grado n1 es la traza de A.
  • El coeficiente libre es χA(0)=(1)ndet(A).
  • Es igual al polinomio característico de cualquier matriz similar a A.

Para ver ejemplos de cómo obtener el polinomio característico y cómo usar sus propiedades, hacemos referencia a la siguiente entrada:

Propiedades del polinomio característico

En particular, para fines de este curso, es importante leer los ejemplos y problemas resueltos de esa entrada.

El teorema de Cayley-Hamilton y una demostración con densidad

Finalmente, hablaremos de uno de los resultados fundamentales en álgebra lineal.

Teorema (Cayley-Hamilton). Si A es una matriz de n×n con entradas en C y χA(x) es su polinomio característico, entonces χA(A)=On.

En realidad el teorema de Cayley-Hamilton es válido para matrices más generales. Daremos un esbozo de demostración sólo para matrices con entradas complejas pues eso nos permite introducir una técnica de perturbaciones.

Esbozo de demostración. Vamos a hacer la técnica de la bola de nieve, construyendo familias poco a poco más grandes de matrices que satisfacen el teorema.

Si A es una matriz diagonal, las entradas en su diagonal son sus eigenvalores λ1,,λn. Por la discusión al inicio de esta entrada, χA(A) es diagonal con entradas χA(λ1),,χA(λn), y como los eigenvalores son raíces del polinomio característico, entonces todos estos valores son 0, y por lo tanto χA(A)=0.

Si A es diagonalizable, digamos, de la forma A=P1DP, entonces A y D tienen el mismo polinomio característico. Por la discusión al inicio de la entrada, y por el caso anterior:
χA(A)=χD(A)=χD(P1DP)=P1χD(D)P=P1OnP=On.

Si A tiene todos sus eigenvalores distintos, se puede mostrar que A es diagonalizable. Ahora viene la idea clave del argumento de continuidad.

Pensemos al espacio métrico de matrices de n×n. Afirmamos que las matrices con eigenvalores todos distintos son densas en este espacio métrico. Para ello, tomemos una matriz A. En efecto, como estamos trabajando en C, existe una matriz invertible P tal que P1AP es triangular. Como P es invertible, define una transformación continua. Los eigenvalores de P1AP son sus entradas en la diagonal, y podemos perturbarlos tan poquito como queramos para hacer que todos sean distintos.

De esta forma, existe una sucesión de matrices Ak, todas ellas diagonalizables, tales que AkA conforme k. El resultado se sigue entonces de las siguientes observaciones:

  • Los coeficientes del polinomio característico de una matriz dependen continuamente de sus entradas.
  • Las entradas de potencias de una matriz dependen continuamente de sus entradas.
  • Así, la función χM(M) es continua en la matriz variable M.

Concluimos como sigue χAk(Ak)=0, por ser cada una de las matrices Ak diagonalizables. Por la continuidad de χM(M), tenemos que
χA(A)=limkχAk(Ak)=limkOn=On.

◻

Terminamos esta entrada con un problema que usa el teorema de Cayley-Hamilton.

Problema. Muestra que para cualesquiera matrices X,Y,Z de 2×2 con entradas reales se cumple que
ZXYXY+ZYXYX+XYYXZ+YXXYZ=XYXYZ+YXYXZ+ZXYYX+ZYXXY.

Sugerencia pre-solución. Muestra que las matrices reales de 2×2 de traza cero conmutan con cualquier matriz de 2×2.

Solución. Si A es una matriz de 2×2 de traza cero, su polinomio característico es
χA(x)=x2tr(A)x+det(A)=x2+det(A).

Por el teorema de Cayley-Hamilton, se satisface entonces que A2=det(A)I2, así que A2 es un múltiplo de la identidad, y por lo tanto conmuta con cualquier matriz de 2×2.

La identidad que queremos mostrar se puede reescribir como Z(XYYX)2=(XYYX)2Z.

La traza de XY es igual a la traza de YX, y como la traza es una transformación lineal, tenemos que tr(XYYX)=tr(XY)tr(YX)=0. El problema se termina aplicando la discusión de arriba a la matriz A=XYYX.

◻

Más problemas

Puedes encontrar más problemas relacionados con el polinomio mínimo, el polinomio característico y el teorema de Cayley-Hamilton en la Sección 8.2, 8.4 y 8.5 del libro Essential Linear Algebra de Titu Andreescu. También hay más problemas relacionados con el teorema de Cayley-Hamilton en el Capítulo 4 del libro Mathematical Bridges de Andreescu, Mortici y Tetiva.

Seminario de Resolución de Problemas: Cálculo de determinantes

Por Leonardo Ignacio Martínez Sandoval

Introducción

Una de las habilidades fundamentales que hay que desarrollar para resolver problemas de álgebra lineal es el cálculo de determinantes. Como vimos en la entrada anterior, conocer el determinante de una matriz nos permite saber si es invertible. Así mismo, los determinantes permiten encontrar soluciones a sistemas de ecuaciones lineales, y más adelante veremos que están relacionados con el rango. Además, los determinantes juegan un papel muy importante en otras áreas de las matemáticas, como cálculo y teoría de gráficas.

Todo parte de la siguiente definición:

Definición. Para una matriz A de n×n con entradas reales A=[aij], el determinante de A es detA=σSnsign(σ)a1σ(1)anσ(n), donde la suma se hace sobre todas las permutaciones (funciones biyectivas) σ de {1,,n} a sí mismo y sign(σ) es el signo de la permutación.

A detA también lo escribimos a veces en notación de «matriz con barras verticales» como sigue:

detA=|a11a12a1na21a22a2nan1an2ann.|.

La definición permite mostrar de maneras muy elegantes las propiedades que cumplen los determinantes, pero no es nada práctica para cuando se quieren hacer las cuentas. Como la suma se hace sobre todas las permutaciones σ de un conjunto de n elementos, si quisiéramos calcular determinantes por definición se tendrían que hacer n! productos, y luego sumar todos estos resultados.

Por esta razón, es muy importante encontrar otras formas de evaluar determinantes. Para empezar, esta entrada hará referencia a dos enlaces del blog en los que se discuten las propiedades básicas de determinantes. Luego, se hablará de dos tipos especiales de determinantes: los de Vandermonde y los de matrices circulantes.

Técnicas básicas de cálculo de determinantes

Lo primero y más importante es que conozcas las teoría básica para cálculo de determinantes. Aquí en el blog hay una entrada que sirve justo para conocer las propiedades y técnicas principales para encontrar determinantes.

Técnicas básicas de cálculo de determinantes

Además, es también muy importante que sepas calcular determinantes usando la expansión de Laplace. En la siguiente entrada puedes ver el enunciado de la técnica, y cómo se usa en varios ejemplos:

Problemas de cálculo de determinantes

Para fines de este curso, es importante que revises esas entradas. Puedes saltarte las demostraciones de los resultados principales, pero presta atención a cómo se usan en cada uno de los problemas.

Las siguientes secciones presentan técnicas avanzadas que a veces resultan útiles. Sin embargo, tómalas como temas optativos, dando prioridad a primero dominar los básicos.

Determinantes de Vandermonde

Teorema (determinante de Vandermonde). Sean a1,,an números reales. El determinante de la matriz de Vandermonde (1a1a12a1n11a2a22a2n11a3a32a3n11anan2ann1) es igual a 1i<jn(ajai).

Ejemplo. La matriz (1aa21bb21cc2) es una matriz de Vandermonde, así que su determinante es (ba)(ca)(cb).

◻

Veamos un problema en el que aparece una matriz de Vandermonde.

Problema. Sean a, b y c reales distintos de 0. Muestra que el determinante de |a2b2c2c2a2b2caabbc| es (a2bc)(b2ca)(c2ab).

Sugerencia pre-solución. Formula un problema equivalente usando propiedades de determinantes para que quede un determinante del tipo de Vandermonde. Aprovecha la simetría para ahorrar algunas cuentas.

Solución. Como el determinante es homogéneo en cada columna, podemos factorizar a2 de la primera, b2 de la segunda y c2 de la tercera para obtener que
|a2b2c2c2a2b2caabbc|=(abc)2|111c2a2a2b2b2c2caabbc|=(abc)2|111caabbcc2a2a2b2b2c2|.

Aquí también usamos que al intercambiar dos filas (o columnas), el determinante de una matriz cambia de signo.

Una matriz tiene el mismo determinante que su transpuesta, y la transpuesta de esta última matriz es de Vandermonde, de modo que (abc)2|111caabbcc2a2a2b2b2c2|=(abc)2(abca)(bcca)(bcab).

Vamos a partir esta última expresión en factores simétricos. Tenemos que ab(abca)=a2bc. De manera similar, tenemos también ca(bcca)=c2ab y bc(bcab)=b2ac.

Así, concluimos que |a2b2c2c2a2b2caabbc|=(a2bc)(b2ca)(c2ab).

◻

Determinantes de matrices circulantes

Teorema (determinantes circulantes) Sean a1,,an números reales. El determinante de la matriz circulante
(a1anan1a2a2a1ana3a3a2a1a4anan1an2a1.)

es j=0n1(a1+anωj+an1ωj2++a2ωjn1), en donde ωj es la n-ésima raíz de la unidad dada por ωj:=ej2πin.

Ejemplo. La matriz (abccabbca) es una matriz circulante, así que su determinante es (a+b+c)(a+ωb+ω2c)(a+ω2b+ωc), donde ω es la raíz cúbica de la unidad de argumento positivo mínimo.

◻

El siguiente problema apareció en la tercera edición de la Olimpiada Iberoamericana de Matemática Universitaria. El enunciado en esa ocasión fue un poco distinto, pero lo adaptamos a la notación de esta entrada.

Problema. Sea n3 un entero Muestra que el determinante de la matriz circulante en donde a1=an=an1=1 y a2==an1=0 es 3 si n no es un múltiplo de 3 y es 0 si n es un múltiplo de 3.

Sugerencia pre-solución. Para empezar, aplica el teorema de determinantes de matrices circulantes. Luego, necesitarás además un argumento de polinomios y de números complejos.

Solución. Para empezar, llamemos An a la matriz del problema. Como An es una matriz circulante, su determinante es det(An)=j=0n1(1+ωj+ωj2).

El polinomio 1+x+x2 se factoriza como (ηx)(η2x), donde η es la raíz cúbica de la unidad de argumento positivo mínimo. De esta forma, podemos reescribir al determinante de An como det(An)=j=0n1(ηωj)(η2ωj).

El polinomio h(x)=xn1 se factoriza como h(x)=(xω0)(xω1)(xωn1), así que det(An) es precisamente el producto de h(η) con h(η2). En otras palabras,
det(An)=(ηn1)(η2n1)=η3n+1(ηn+η2n)=2(ηn+η2n)

Finalmente, hacemos un análisis de casos:

  • Si n es múltiplo de 3, entonces ηn=η2n=1 y entonces det(An)=0.
  • Si n no es múltiplo de 3, entonces n y 2n no son congruentes módulo 3, y entonces ηn y η2n son η y η2 en algún orden. Así, (ηn+η2n)=η+η2=1, y por lo tanto det(An)=3.

◻

Más problemas

Puedes encontrar más problemas de cálculo de determinantes en la Sección 7.4 y la Sección 7.5 del libro Essential Linear Algebra de Titu Andreescu.

Seminario de Resolución de Problemas: Geometría discreta

Por Leonardo Ignacio Martínez Sandoval

Introducción

Como última entradaen esta parte de geometría, hablaremos de algunos temas de geometría discreta. Esta área de las matemáticas se dedica a estudiar propiedades combinatorias de familias de objetos geométricos. Estos objetos pueden ser puntos, rectas, rectángulos, convexos, politopos, etc. Las relaciones que nos interesan son que formen un tipo de acomodo especial, que se intersecten, que podamos contar ciertas configuraciones, etc.

Sólo hablaremos superficialmente de un área que es profunda y bastante interesante. Un libro genial que cubre varios temas de geometría discreta de manera sistemática es Lectures on Discrete Geometry de Jiří Matoušek.

Convexos y el teorema de Helly

Un convexo de Rd es un conjunto tal que cualquier segmento recto definido por dos de sus puntos queda totalmente contenido en el conjunto. Por ejemplo, los convexos de R son los intervalos, mientras que en el plano hay muchos más ejemplos, como lo muestra la figura.

Ejemplos de conjuntos convexos y no convexos
Ejemplos de conjuntos convexos y no convexos

Si tenemos un conjunto X de Rd, su envolvente convexa es el conjunto convexo más pequeño (por contención), que contiene a X. Cuando X es un conjunto de puntos, tenemos algo como lo de la figura. Si todos los puntos de X están sobre la frontera de su envolvente convexa, y no hay tres alineados, decimos que X son puntos en posición convexa.

Envolvente convexa de un conjunto de puntos
Envolvente convexa de un conjunto de puntos. El conjunto X no está en posición convexa.

Los conjuntos convexos son especiales en muchos sentidos. Uno de ellos es que la intersección de una familia de convexos se puede detectar «localmente».

Problema. A una plática de matemáticas de una hora asistieron una cantidad finita de matemáticos. La plática estaba tan aburrida, que cada matemático se durmió en cierto intervalo de tiempo de esa hora, pero sólo una vez. A la hora del café, los matemáticos platicaron entre sí, y si se dieron cuenta de que para cualesquiera dos de ellos, I y J, hubo un momento en el que I y J estuvieron dormidos simultáneamente. Muestra que hubo un momento de la plática en la que todos los matemáticos estuvieron dormidos.

Sugerencia pre-solución. Hay muchas soluciones. Una es mediante un argumento de maximalidad.

Solución. En términos matemáticos, queremos ver que si tenemos una cantidad finita de intervalos acotados y cerrados en la recta real que se intersectan de dos en dos, entonces todos ellos se intersectan.

Tomemos el intervalo I cuyo extremo derecho sea mínimo. Llamemos x a este extremo derecho. Afirmamos que cualquier otro intervalo tiene a x. Sea J cualquiera de estos intervalos, con extremo izquierdo y y extremo derecho z.

Imagen auxiliar para intersección de intervalos
Imaten auxiliar para intersección de intervalos

Por la minimalidad de x, tenemos que xz. Si y>x, entonces J no intersecta a I y se contradice la hipótesis. Entonces, para que J pueda intersectar a I, necesitamos que yx. Pero entonces x queda entre los extremos del intervalo J y por lo tanto x está en J. Esto termina la prueba.

◻

En dimensiones más altas, tenemos el siguiente resultado.

Teorema (Helly). Sea F una familia finita de al menos d+1 conjuntos convexos compactos en Rd. Si cada subfamilia de F de d+1 convexos tiene intersección no vacía, entonces F tiene intersección no vacía.

El teorema de Helly es una de las piedras angulares de la geometría discreta. Una cantidad de enorme de investigación ha resultado de considerar variantes del teorema con hipótesis más débiles o más fuertes.

Politopos y la fórmula de Euler

Otra área muy rica de la geometría discreta es la teoría de politopos. Un politopo es la generalización a altas dimensiones de un polígono, o de un poliedro. Hay dos formas de definir politopos. Una es tomar puntos en Rd y considerar su envolvente convexa. Esto es un V-politopo. Para la otra necesitamos algunas definiciones adicionales.

Un subespacio afín de Rd es la traslación de un subespacio lineal, y su dimensión es la dimensión del subespacio lineal trasladado. Por ejemplo, cualquier punto de Rd es un subespacio afín de dimensión 0 pues es la traslación del subespacio trivial {0}. Las rectas en Rd, incluso aquellas que no pasan por el 0, son subespacios afines de dimensión 0. A los subespacios afines de dimensión n1 les llamamos hiperplanos. Así, las líneas son los hiperplanos de R2, los planos los hiperplanos de R3, etc.

Si P es un hiperplano de Rd, un semiespacio definido por P es todo lo que queda en uno de los lados de P. Si es abierto, no incluye a P, y si es cerrado, sí incluye a P. Un hiperplano siempre define dos semiespacios abiertos, y dos cerrados.

Hay otra forma de pensar a los politopos: tomamos una cantidad finita de semiespacios cerrados y los intersectamos. Si esa intersección está acotada, entonces a lo que obtenemos le llamamos un H-politopo. Piensa, por ejemplo, en los hiperplanos que determinan las caras de un cubo, y en los semiespacios «hacia adentro».

Un resultado clásico es que todo H-politopo es un V-politopo, así que podemos usar la descripción que nos convenga de acuerdo al problema que estemos resolviendo.

Un hiperplano H es hiperplano soporte de un politopo P si el politopo se queda totalmente contenido en alguno de los semiespacios definidos por H. Una cara de P es la intersección de P con alguno de sus hiperplanos soporte. Resulta que las caras de politopos son politopos. Para que todo funcione bien, debemos considerar al vacío como un politopo.

La dimensión de un politopo es la menor dimensión de un subespacio afín que lo contiene. Por definición, la dimensión del vacío es 1. Si una cara de un politopo es k, entonces la llamamos una k-cara. Los valores de k sólo pueden ir de 0 a d. A las 0-caras les llamamos los vértices de P. A las 1-caras les llamamos las aristas.

Para cada k de 0 a n, usamos fk para denotar la cantidad de k caras del politopo, y a (f0,f1,f2,,fd) le llamamos el f-vector del politopo. Estamos listos para enunciar un resultado crucial en la teoría de politopos.

Teorema (fórmula de Euler). Sea P un politopo de dimensión d en Rd. Entonces

f0f1+f2+(1)dfd=1.

Observa que fd siempre es 1 pues la única d cara de un politopo P de dimensión d es P mismo.

En R2 esta fórmula no es tan útil, pues simplemente nos dice que si un polígono tiene V vértices y A aristas, entonces VA=0, es decir, que tiene la misma cantidad de vértices y aristas, lo cual es inmediato.

En R3 la fórmula nos dice que si un poliedros tiene V vértices, A aristas y F caras, entonces VA+F=2. Este fórmula se puede usar en varios problemas matemáticos de poliedros.

Problema. Muestra que el tetraedro, el cubo, el octaedro, el dodecaedro y el icosaedro son los únicos poliedros en R3 tales que a cada vértice una misma cantidad a de caras, y cada cara consiste de la misma cantidad b de vértices.

Sugerencia pre-solución. Usa notación adecuada, poniendo la cantidad de vértices, aristas y caras en términos de a y b. Usa la fórmula de Euler. Luego, da un argumento de desigualdades.

Solución. A cada vértice llegan por lo menos 3 caras, y cada cara tiene por lo menos 3 vértices. Así, a3 y b3.

Si hay A aristas, entonces tanto 2A como bF cuentan la cantidad de parejas (e,c) donde e es una arista y c una cara que lo tiene. Esto se debe a que cada arista está exactamente en dos caras, y a que como cada cara tiene b vértices, entonces tiene b aristas. Por lo tanto, 2A=bF, de donde A=bF2.

De manera similar, si hay V vértices y F caras, entonces tanto aV como bF cuentan la cantidad de parejas (v,c), donde v es un vértice y c es una cara que lo tiene. De esta forma, aV=bF, de lo cual V=bFa.

Por la fórmula de Euler, tenemos entonces que bFabF2+F=2. Esta igualdad implica, en particular, que al determinar los valores de a y b, se determinan F y entonces V y A.

Si multiplicamos por 2bF de ambos lados, y sumamos 1 de ambos lados, tenemos que (1)2a+2b=4bF+1>1.

Como a3, entonces 2a23. De este modo,
2b>12a123=13.

Esto muestra que b<6, de modo que b5. Por simetría, a5. Podemos entonces simplemente estudiar los casos a=2,3,4 y b=2,3,4.

Si a=5, entonces la desigualdad (1) se cumple sólo si b=3. Si a=4, la desigualdad (1) se cumple sólo si b=3. Finalmente, si a=3, la desigualdad se cumple para b=3,4,5. De este modo, las únicas parejas de (a,b) que sirven son:

  • (3,3), que nos da el tetraedro.
  • (3,4), que nos da el cubo.
  • (4,3), que nos da el octaedro.
  • (3,5), que nos da el dodecaedro.
  • (5,3), que nos da el icosaedro.

◻

La fórmula de Euler es sólo una de las relaciones lineales que satisfacen las entradas del f-vector de un politopo. Otros dos resultados interesantes del área son:

  • Las relaciones de Dehn-Sommerville, que dan otras relaciones lineales que satisfacen las entradas del f-vector.
  • El teorema de la cota superior que para d, n y k fijas acota el número de k-caras que puede tener un politopo de dimensión d con n-vértices.

Un libro canónico para aprender de politopos de manera sistemática es el Lectures on Polytopes de Günter M. Ziegler.

Conjuntos de puntos y teoremas extremales

La última área de la que hablaremos serán los problemas extremales en geometría discreta. Nos enfocaremos únicamente en problemas sobre conjuntos de puntos, pero se podrían hacer preguntas análogas para otras familias de objetos geométricos. De manera informal, pero intuitiva, un problema extremal de geometría consiste en mostrar que si un número es suficientemente grande, entonces empiezan a pasar cosas interesantes con ciertos objetos geométricos.

Uno de los resultados clásicos es el teorema de Erdős-Szekeres. A grandes rasgos, lo que dice es que si tenemos muchos puntos en posición general en el plano (no hay tres colineales), entonces siempre es posible encontrar un subconjunto grande de ellos que está en posición convexa.

Teorema (Erdős-Szekeres). Sea n un entero positivo. Entonces, existe un entero f(n) tal que si se tiene un conjunto S con f(n) o más puntos en el plano en posición general, entonces hay un subconjunto de tamaño n de S que consiste de puntos en posición convexa.

Típicamente, es bastante difícil encontrar los valores exactos de las funciones involucradas en problemas extremales de geometría discreta. El tipo de resultados de interés para la investigación matemática es encontrar las mejores «cotas asintóticas», que digan, más o menos, cómo se comporta la función que se está estudiando. En el caso del teorema de Erdős-Szekeres, las mejores cotas se enuncian así:

1+2n2f(n)2n+o(n).

La notación h(n)=o(g(n)) quiere decir que h(n)g(n)0 cuando n.

Aunque sea difícil determinar los valores exactos de f(n) para toda n, hay algunos valores pequeños que sí se pueden determinar.

Problema. Demuestra que f(4)=5, es decir:

  • Que hay conjuntos de 4 puntos en posición general en el plano que no tienen subconjuntos de tamaño 4 en posición convexa.
  • Que cualquier subconjunto de 5 puntos en posición general en el plano tiene un subconjunto de 4 puntos en posición convexa.

Sugerencia pre-solución. Encontrar el ejemplo para el primer punto es fácil, simplemente explora el problema haciendo varias figuras. Divide el problema en casos de acuerdo a la cantidad de puntos que forman la envolvente convexa. Para uno de los casos, usa el principio de las casillas.

Solución. El siguiente ejemplo son 4 puntos que no están en posición convexa, y que por lo tanto no tienen subconjuntos de tamaño 4 en posición convexa.

Cuatro puntos que no están en posición convexa
Cuatro puntos que no están en posición convexa

Mostraremos ahora que 5 puntos en posición general en el plano siempre tienen un subconjunto de tamaño 4 en posición convexa. Procedemos por casos de acuerdo a la cantidad de puntos que están en la frontera de la envolvente convexa. Si son 4 ó 5, entonces inmediatamente entre ellos hay 4 en posición convexa.

Si son 3, entonces llamemos A, B, C a esos puntos y D y E a los otros dos, que quedan dentro de ABC. La recta DE divide al plano en dos semiplanos. Por principio de las casillas, hay dos puntos de entre A, B y C que yacen en el mismo semiplano, digamos A y B.

Caso con tres puntos en la envolvente convexa
Caso con tres puntos en la envolvente convexa

Como la recta DE no corta al segmento AB (por estar D y E en el mismo semiplano), y la recta AB no corta al segmento DE (por ser AB un lado de la envolvente convexa), entonces los puntos A, B, D, E están en posición convexa.

◻

Finalmente, presentamos un par de resultados más. También son problemas extremales, pero en vez de hablar de envolventes convexas, hablan acerca de distancias.

Si lo piensas un poco, es imposible colocar 4 puntos distintos en el plano de modo que todas las parejas estén a distancia uno. Si tienes n puntos en el plano, entonces ellos definen (n2)=n(n1)2n22 parejas de puntos. ¿Cuántos de ellos pueden estar a distancia 1? Estudiar esta cantidad es un problema que fue propuesto por Paul Erdős. Si u(n) denota este máximo, las mejores cotas que hay para el problema son n1+d/loglognf(n)O(n4/3).

Aquí d es una constante que sirve para toda n. La notación h(n)O(g(n)) se refiere a que existe una constante c tal que h(n)cg(n) para n suficientemente grande.

Por supuesto, la distancia 1 no tiene nada de especial. En realidad, ninguna distancia puede repetirse demasiado. Ya que ninguna distancia aparece muchas veces, la intuición (por principio de las casillas), nos debe decir que entonces para un conjunto de puntos, sus parejas deben definir muchas distancias diferentes. Llamemos d(n) a la cantidad de distancias diferentes que define un conjunto de n puntos en el plano. Erdős también preguntó, ¿cómo se comporta este número?. Las mejores cotas son Ω(nlog)d(n)O(nlogn).

La notación h(n)Ω(g(n)) se refiere a que existe una constante c tal que h(n)cg(n) para n suficientemente grande.

El problema de las distancias unitarias y el problema de las distancias diferentes han estimulado mucha de la investigación en geometría discreta. Las demostraciones de sus cotas, han introducido al área varias técnicas de teoría de números, del método probabilista y de geometría algebraica.

Un libro con mucho material de problemas extremales y otros temas es Combinatorial Geometry and its Algorithmic Applications de Janos Pach y Micha Sharir.

Más problemas

En resumen, en los siguientes libros hay bastante material para aprender los temas de esta entrada:

Seminario de Resolución de Problemas: Desigualdades básicas

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas correspondientes a esta parte del curso aprenderemos varias técnicas que nos permitirán resolver problemas que involucren desigualdades. El área es enorme y hay libros enteros dedicados a ello. Nosotros sólo veremos algunas técnicas. Comenzaremos con desigualdades básicas y nos enfocaremos en los siguientes temas:

  • Desigualdad x20 y desigualdad del triángulo
  • Desigualdades de medias
  • La desigualdad de Cauchy-Schwarz
  • Técnicas de cálculo en desigualdades

En esta entrada veremos el primer inciso, que consiste de dos ideas muy sencillas:

Desigualdad x20. El cuadrado de cualquier número real es mayor o igual a cero. Es cero si y sólo si el número es cero.

Desigualdad del triángulo. Si V es un espacio vectorial con norma , entonces para cualesquiera vectores u y v se tiene que u+vu+v.

La desigualdad x20 parece muy inocente. Sin embargo, es una herramienta muy versátil cuando se combina con manipulaciones algebraicas creativas. La desigualdad del triángulo la estamos enunciando para espacios vectoriales con norma en general. Dos casos particulares que a lo mejor te son más familiares son los siguientes:

Desigualdad del triángulo para R. Si a y b son números reales, entonces |a|+|b||a+b|.

Desigualdad del triángulo en Rn. Si ABC es un triángulo en el plano (o dimensiones más altas) , de lados de longitudes AB=c, BC=a y CA=b, entonces
a+bcb+cac+ab.

Si una de las igualdades se da, ABC es un triángulo degenerado, es decir, con sus tres vértices alineados. En otro caso, todas las desigualdades son estrictas.

Veamos aplicaciones de estas desigualdades básicas.

La desigualdad a2+b22ab

Comenzaremos probando de dos formas distintas una desigualdad que también resulta útil en otras ocasiones.

Problema. Sean a y b números reales mayores o iguales a cero. Muestra que a+b2ab, y que la igualdad se da si y sólo si a y b son iguales.

A esta desigualdad se le conoce como la desigualdad MA-MG para dos números reales. También forma parte de las desigualdades básicas que te ayudará conocer. Se llama así pues en el lado izquierdo tenemos a la media aritmética de los números a y b, y al lado derecho tenemos la media geométrica de los números a y b. En realidad la desigualdad se vale para más reales no negativos, pero esto lo veremos en otra entrada.

Sugerencia pre-solución. El problema se puede resolver tanto de manera algebraica, (usando x20) como de manera geométrica (usando la desigualdad del triángulo).

Para resolverlo de la primera forma, trabaja hacia atrás. Haz manipulaciones algebraicas para formular problemas equivalentes hasta que llegues a una desigualdad obvia.

Para resolverlo de la segunda forma, haz una figura en la que puedas representar tanto a la media geométrica como a la aritmética. Una forma de hacerlo es comenzar con una semicircunferencia de diámetro a+b.

Para identificar el caso de igualdad, haz un análisis de casos.

Solución algebraica. Queremos mostrar que a+b2ab. Pasando el dos multiplicando, y luego 2ab restando al lado izquierdo, esta desigualdad igualdad ocurre si y sólo si a+b2ab0. En el lado izquierdo identificamos un binomio al cuadrado, que se puede factorizar para dar la desigualdad equivalente (ab)20.

Esta desigualdad es de la forma x20, así que es claramente cierta. La igualdad ocurre si y sólo si ab=0, lo cual sucede si y sólo si a=b. Todos los pasos que hicimos son reversibles. Esto termina la solución.

◻

Solución geométrica. Consideremos la siguiente figura, en donde tenemos una semicircunferencia de diámetro AB=a+b y centro O. Aquí C es un punto en AB tal que AC=a y entonces CB=b. Además, D es un punto sobre la circunferencia tal que DC es perpendicular a AB. Llamemos d=CD.

Prueba visual de la desigualdad entre la media aritmética y media geométrica usando desigualdades básicas
Prueba visual de MA-MG

Como AOD y BOD son isósceles por tener dos lados iguales al radio de la circunferencia, tenemos que ADO=DAO y BDO=DBO. Usando estas igualdades y que la suma de los ángulos internos de ABD es 180, se puede mostrar que el ángulo ADB es de 90.

De este modo, ACD y DCB son semejantes (por ser ambos semejantes a ABD por criterio AA). Por la semejanza, tenemos que ad=db, de donde d=ab.

Para terminar la demostración, tomamos un punto E sobre DO tal que EOC=ECO. Por la desigualdad del triángulo en DEC, tenemos que

ab=DCDE+EC=DE+EO=DO=a+b2.

Con esto demostramos la desigualdad. Para terminar el problema, necesitamos ver cuándo se dan los casos de igualdad. Se tiene la igualdad si y sólo si DEC es un triángulo degenerado, lo cual sucede si y sólo si E está en el segmento DC. Esto sólo es posible cuando DO es perpendicular a AB, lo cual sucede si y sólo si C=O, si y sólo si AC=CB, si y sólo si a=b.

◻

Desigualdades básicas aplicadas a un problema de la Olimpiada Mexicana de Matemáticas

El siguiente problema apareció como parte de los exámenes selectivos que el Comité Nacional de la Olimpiada Mexicana de Matemáticas envía a los estados para seleccionar a sus estudiantes en distintas etapas. Tiene muchas formas de resolverse, pero veamos cómo se puede resolver con desigualdades básicas.

Problema. Sean a,b,c,d reales positivos con a2+b2+c2+d2=4. Muestra que a5+b5+c5+d5a+b+c+d

Sugerencia pre-solución. Modifica el problema a mostrar como desigualdad auxiliar que para un real no negativo x se tiene que x52x2x+20. Esta desigualdad se puede demostrar usando que los cuadrados son no negativos.

Solución. Vamos a probar primero la desigualdad x52x2x+20. Para que sea un poco más fácil, factorizaremos la expresión del lado izquierdo.

Notemos que 1 es una raíz de x52x2x+2, de modo que por el teorema del factor podemos factorizar x1 del polinomio. Obtenemos que x52x2x+2=(x1)(x4+x3+x2x2).

Notemos que, nuevamente, 1 es una raíz de (x4+x3+x2x2). Al factorizar x1 de nuevo, obtenemos que x52x2x+2=(x1)2(x3+2x2+3x+2).

Ya estamos listos para probar la desigualdad que queremos. Notemos que (x1)20 y que x3+2x2+3x+2 es mayor o igual que cero para x0 pues es un polinomio con puros coeficientes positivos. Esto prueba la desigualdad auxiliar. Reescribiéndola, tenemos que x52x2+x2. Aplicándola en esta forma a los cuatro reales positivos a,b,c,d del problema, y usando que la suma de cuadardos es 4, obtenemos que
a5+b5+c5+d52(a2+b2+c2+d2)+a+b+c+d8=24+a+b+c+d8=a+b+c+d.

Esto termina el problema.

◻

El primer paso parece un poco artificial. ¿Por qué queremos probar esa desigualdad auxiliar? En otra entrada de blog escribí cómo se puede llegar a las ideas de esta solución.

Desigualdad del triángulo aplicada a la construcción de tetraedros

Si pegamos cuatro triángulos equiláteros en el espacio se hace un tetraedro regular. De manera similar, si pegamos cuatro triángulos como el siguiente, también se hace un tetraedro en el espacio:

Pegar cuatro triángulos congruentes para hacer un tetraedro

La intuición nos dice que debería poderse con cualquier triángulo. Pero esta intuición está mal.

Problema. Sea ABC un triángulo con un ángulo mayor a 90. Muestra que no existe ningún tetraedro en el espacio tal que sus cuatro caras sean congruentes a ABC.

Sugerencia pre-solución. Procede por contradicción. Por simetría, puedes asumir que el ángulo mayor a 90 es el ángulo en A. Usa como punto auxiliar al punto medio de BC y usa desigualdades.

Solución. Una observación inicial es que si ABC es un triángulo, M es el punto medio de BC y su ángulo interno en A es mayor a 90, entonces 2AM<BC. Esto se muestra trazando una circunferencia de diámetro BC.

Desigualdad para la mediana en términos del ángulo que hace.

De hecho,

  • Un punto X está sobre la circunfencia si y sólo si BXC=90, si y sólo si OX=OA.
  • X está dentro de la circunferencia si y sólo si BXC>90, si y sólo si OX<OA y
  • X está fuera de la circunferencia si y sólo si BXC<90, si y sólo si OX>OA.

Resolvamos el problema. Sin pérdida de generalidad, el ángulo en A es mayor a 90. Entonces AM<BC2, de donde 2AM<BC.

Supongamos que se pudiera hacer en el espacio un tetraedro WXYZ tal que cada una de las caras es congruente al triángulo ABC. Sin pérdida de generalidad, tenemos que
WX=YZ=ABXY=ZW=BCWY=XZ=CA.

Tomemos el punto medio M de XY. En ZMW, tenemos que
ZM=AMWM=AM.

Así, usando la desigualdad del triángulo en ZMW tenemos que 2AM=ZM+WMZW=BC.

Esto es una contradicción con la desigualdad 2AM<BC que ya habíamos mostrado.

◻

Más problemas

Puedes encontrar más problemas de desigualdades básicas en la sección 7.1 del libro Problem Solving through Problems de Loren Larson. También puedes consultar más técnicas y problemas en el libro Desigualdades de la Olimpiada Mexicana de Matemáticas.

Seminario de Resolución de Problemas: Grupos, anillos y campos

Por Leonardo Ignacio Martínez Sandoval

Introducción

En estas entradas hemos visto cómo distintas herramientas de álgebra nos pueden ayudar en la resolución de problemas. En las primeras dos entradas, hablamos de identidades algebraicas básicas y un par de avanzadas. Luego, hablamos de factorización en polinomios y del teorema de la identidad. Ahora platicaremos de cómo estructuras un poco más abstractas nos pueden ayudar. De manera particular, nos enfocaremos en aplicaciones de teoría de grupos a la resolución de problemas. Sin embargo, hacia el final de la entrada también hablaremos un poco acerca de anillos, dominios enteros y campos.

Teoría de grupos básica

Una de las nociones de álgebra abstracta más básicas, y a la vez más flexibles, es la de grupo. La teoría de grupos es muy rica y se estudia a profundidad en un curso de álgebra abstracta o álgebra moderna. Aquí veremos únicamente un poco de esta teoría y algunas aplicaciones a resolución de problemas. Comenzamos con la definición.

Definición. Un grupo es un conjunto no vacío G con una operación binaria que cumple lo siguiente:

  • Asociatividad: Para cualesquiera elementos x,y,z en G tenemos que x(yz)=(xy)z.
  • Neutro: Existe un elemento e en G tal que xe=x=ex para todo elemento x.
  • Inversos: Para cada elemento x en G, existe un elemento y en G tal que xy=e=yx.

Usualmente se simplifica la notación de la siguiente manera. Por un lado, en vez de poner el símbolo de producto, simplemente se ponen elementos consecutivos, por ejemplo ab=ab. Además, por la asociatividad, muchas veces no se ponen los paréntesis, de modo que expresiones como (ab)c se escriben simplemente como abc, a menos que los paréntesis ayuden a entender un argumento.

Hay que tener cuidado con invertir el orden de factores. En grupos, no necesariamente sucede que la operación es conmutativa, es decir, que ab=ba para todo par de elementos a y b. Si ab=ba decimos que a y b conmutan y si todo par de elementos de G conmutan, decimos que G es conmutativo. Un elemento siempre conmuta consigo mismo. Para n un entero positivo definimos an como el producto formado por n veces el elemento a.

A partir de la definición se puede ver que el neutro es único, pues si hubiera dos neutros e y e tendríamos e=ee=e, en donde primero usamos que e es neutro y después que e lo es. Para a en G, definimos a0 como e.

En grupos se vale «cancelar». Por ejemplo, si ab=ac, entonces podemos multiplicar esta igualdad a la izquierda por un inverso d de a y obtendríamos b=eb=dab=dac=ec=c. Del mismo modo, la igualdad ba=ca implica b=c.

En particular, si d y d son inversos de a, tenemos da=e=da, de donde d=d. Esto muestra que los inversos también son únicos, así que al inverso de a le llamamos a1. Observa que e1=e. Nota que si a y b son elementos de G, entonces ab(b1a1)=aea1=aa1=e, de modo que el inverso de un producto ab es el producto b1a1. Para n un entero positivo, definimos an como el inverso de an, que por lo anterior, es precisamente (a1)n. De hecho, ya definido an para todo entero, se puede verificar que se satisfacen las leyes usuales de los exponentes.

Problema. Sean a y b dos elementos en un grupo G con neutro e tales que aba=ba2b, a3=e y b2021=e. Muestra que b=e.

Sugerencia pre-solución. Observa que si a y b conmutaran, entonces el resultado se deduce fácilmente de la primer igualdad. Así, intenta modificar el problema a demostrar que a y b conmutan. Para ello tienes que hacer un paso intermedio que necesita inducción.

Solución. Lo primero que veremos es que a y b2 conmutan. Poniendo una identidad entre ambas b en el producto ab2, tenemos que ab2=abaa1b=ba2ba1b. De a3=e, tenemos a1=a2, así que siguiendo con la cadena de igualdades, ba2ba1b=ba2ba2b=ba2aba=bba=b2a. Así, ab2=b2a.

Ahora veremos que a y b conmutan. Para ello, como a y b2 conmutan, tenemos que a y b2k conmutan para cualquier entero k. Esto se puede probar por inducción. El caso k=1 es lo que ya probamos. Si es válido para cierta k, se sigue que ab2k+2=b2kab2=b2k+2a. Por hipótesis, b2020=b, así que el resultado anterior nos dice que a y b conmutan.

Por esta razón, la primer hipótesis aba=ba2b se puede reescribir como a2b=a2b2, que por cancelación izquierda da e=b, como queríamos mostrar.

◻

Subgrupos y órdenes

Dentro de un grupo pueden vivir grupos más pequeños.

Definición. Un subgrupo de un grupo G es un subconjunto H de G que es un grupo con las operaciones de G restringidas a H.

Para que H sea subgrupo, basta con que no sea vacío y que sea cerrado bajo la operación de grupos y la operación «sacar inverso».

Por ejemplo, se puede ver que Z12, los enteros módulo 12 con la suma, forman un grupo. De aquí, H1={0,3,6,9} es un subgrupo y H2={0,4,8} es otro.

Proposición. Si a es un elemento de un grupo G, entonces o bien 1,a,a2,a3, son todos elementos distintos de G, o bien existe un entero positivo n tal que an=1 y 1,a,,an1 son todos distintos. En este segundo caso, {1,a,,an1} es un subgrupo de G.

Sugerencia pre-demostración. Divide en casos. Luego, usa el principio de cancelación o las leyes de exponentes para grupos.

Demostración. Si todos los elementos son distintos, entonces no hay nada que hacer. De otra forma, existen i<j tales que aj=ai, de donde por la ley de cancelación tenemos que aji=e y ji1. Así, el conjunto de enteros positivos m tales que am=e es no vacío, de modo que por el principio de buen orden tiene un mínimo, digamos n.

Afirmamos que 1,a,a2,,an1 son todos distintos. En efecto, de no ser así, como en el argumento de arriba existirían 0i<jn1 tales que aji=e, pero jin1 sería una contradicción a la elección de n como elemento mínimo.

Probemos ahora que A={1,a,,an1} es subgrupo de G. Si tenemos ak y al en A, su producto es ak+l. Por el algoritmo de la división, k+l=qn+r, con r{0,,n1}, de modo que akal=aqn+r=(an)qar=eqar=ar, así que A es cerrado bajo productos. Además, si 1kn1, entonces 1nkn1 y akank=an=e. Así, A es cerrado bajo inversos. Esto muestra que A es subgrupo de G.

◻

En teoría de grupos, la palabra «orden» se usa de dos maneras. Por un lado si G es un grupo, su orden ord(G) es la cantidad de elementos que tiene. Por otro, dado un elemento a, el orden ord(a) de a es el menor entero positivo n tal que an=e, si es que existe.

Definimos al subgrupo generado por a como a:={an:nZ}. La proposición anterior dice que si a es finito, entonces es un subgrupo de G de orden ord(a)=ord(a). A los grupos de la forma a se les llama cíclicos.

Teorema de Lagrange

Cuando estamos trabajando con grupos finitos, el orden de un subgrupo debe cumplir una condición de divisibilidad.

Teorema (de Lagrange). Sea G un grupo finito y H un subgrupo de G. Entonces ord(H) divide a ord(G).

No daremos la demostración de este teorema, pero veremos algunos corolarios que sirven en la resolución de problemas.

Proposición. Sea G un grupo finito.

  • Si ord(G) es un primo p, entonces G es cíclico.
  • El orden de cualquier elemento a de G divide al orden de G, y por lo tanto aord(G)=1.
  • Si a es un elemento de G de orden n y am=e, entonces n divide a m.

Demostración. Para la primer parte, si tomamos un elemento a de G que no sea e, ya vimos que a es un subgrupo cíclico de G. Por el teorema de Lagrange, su orden debe dividir al primo p. Pero el orden de a es al menos 2, así que el orden de a debe ser p y por lo tanto a=G.

Como vimos arriba, el orden de a es el orden de a, que divide a G. Así,
aord(G)=(aorda)ord(G)/ord(a)=eord(G)/ord(a)=e. Con esto queda probado el segundo punto.

Para el último punto, usamos el algoritmo de la división para escribir m=qn+r, con r entre 0 y n1. Tenemos que e=am=aqn+r=ar. Por lo visto en la sección anterior, necesariamente r=0, así que n divide a m.

◻

Veamos cómo se pueden aplicar algunas de las ideas anteriores a un problema de teoría de grupos concreto.

Problema. En un grupo G, tenemos elementos a y b tales que a7=1 y aba1=b2. Determina qué posibles valores puede tener el orden de b.

Sugerencia pre-solución. Conjetura una fórmula para b2n buscando un patrón. Establécela por inducción.

Solución. El orden de a debe dividir a 7, así que es o 1 o 7. Si es 1, entonces a=e, por lo que por la hipótesis tenemos b=b2. De aquí b=e, así que el orden de b es 1. La otra opción es que el orden de a sea 7.

Afirmamos que para todo entero n se tiene que anban=b2n. Esto se prueba inductivamente. Es cierto para n=1 por hipótesis. Si se cumple para cierta n y elevamos la igualdad al cuadrado, tenemos que
b2n+1=(b2n)2=anbananban=anb2an=an+1ba(n+1),

lo cual termina la inducción.

En particular, para n=7 tenemos que a7=a7=e, por lo que b=b27, y por lo tanto b127=e. Como 127 es primo, el orden de b puede ser 1 ó 127.

◻

En realidad, en el problema anterior falta mostrar que en efecto existe un grupo que satisfaga las hipótesis, y para el cual el orden de b sea exactamente 127. Esto no lo verificaremos aquí.

Teoría de grupos en teoría de números

Lo que hemos platicado de teoría de grupos se vale para grupos en general. Cuando aplicamos estos resultados a grupos particulares, tenemos nuevas técnicas para resolver problemas. Uno de los casos que aparecen más frecuentemente es aplicar teoría de grupos en problemas de teoría de números.

Si tomamos un entero n, los enteros entre 1 y n1 que son primos relativos con n forman un grupo con la operación de producto módulo n. Si llamamos φ(n) a la cantidad de primos relativos con n entre 1 y n1, el teorema de Lagrange da el siguiente corolario.

Teorema (de Euler). Para todo entero positivo n y a un entero primo relativo con n, se tiene que aφ(n)1(modn).

Como corolario al teorema de Euler, tenemos el pequeño teorema de Fermat, que hemos discutido previamente aquí en el blog.

Teorema (pequeño teorema de Fermat). Para p un primo y a un entero que no sea múltiplo de p, se tiene que ap11(modp).

Así, cuando p es primo y a no es múltiplo de p, se tiene que el orden de a divide a p1. Veamos un ejemplo en donde esta idea forma parte fundamental de la solución.

Problema. Muestra que para ningún entero n>1 se tiene que n divide a 2n1.

Sugerencia pre-solución. Procede por contradicción, suponiendo que sí existe. Considera un primo p que divida a n y que además sea extremo en algún sentido. Trabaja módulo p.

Solución. Supongamos que existe un entero n>1 tal que n divide a 2n1. Sea p el primo más pequeño que divide a n. Tomemos a el orden de 2 en el grupo multiplicativo Zp.

Por un lado, como p divide a n y n divide a 2n1, se tiene que p divide a 2n1 y por lo tanto 2n1(modp). De esta forma, a divide a n.

Por otro lado, por el pequeño teorema de Fermat, tenemos que 2p11(modp), así que a divide a p1 y por lo tanto ap1.

Si a1, entonces a tiene un divisor primo que divide a n y es menor que ap1, lo cual es imposible pues elegimos a p como el menor divisor primo de n. De esta forma, a=1. Pero esto da la contradicción 21(modp).

◻

Anillos, dominios enteros y campos

Cuando se están resolviendo problemas, es importante tener en mente que existen otras estructuras algebraicas. Definiremos sólo las más comunes y veremos un problema ejemplo.

Definición. Un anillo es un conjunto R con dos operaciones binarias suma y producto tales que:

  • R con la suma es un grupo conmutativo.
  • El producto en R es asociativo, es decir (ab)c=a(bc) para a,b,c en R.
  • Se cumple la ley distributiva, es decir a(b+c)=ab+ac y (b+c)a=ba+ca para a,b,c en R.

El producto en R no tiene por qué ser un grupo. De hecho, ni siquiera tiene que tener neutro.

Definición. Si un anillo R tiene neutro, decimos que R es un anillo con 1. Si la multiplicación de R es conmutativa, decimos que R es conmutativo.

Definición. Un dominio entero es un anillo conmutativo con uno en donde además se vale cancelar, es decir, ab=ac implica b=c y ba=ca implica b=c.

Definición. Un campo es un anillo conmutativo con uno en donde cada elemento distinto de la identidad aditiva tiene inverso multiplicativo. En otras palabras, es un anillo en donde la suma y el producto son grupos.

Problema. Muestra que todo dominio entero finito es un campo.

Sugerencia pre-solución. Usa el principio de las casillas.

Solución. Supongamos que R={a1,,an} es un dominio entero con una cantidad finita de elementos. Lo único que falta para que sea campo es que los elementos tengan inversos multiplicativos.

Sea a un elemento de R y supongamos que a no tiene inverso multiplicativo. Entonces, los números a1a,a2a,,ana sólo pueden tomar a lo más n1 valores diferentes, de modo que por principio de las casillas existen dos de ellos que son iguales, digamos aia=aja para ij.

Como R es dominio entero, se vale cancelar, lo cual muestra ai=aj. Esto es una contradicción, pues ai y aj eran elementos distintos de R. Así, todo elemento tiene inverso multiplicativo.

◻

En cursos de matemáticas a nivel superior se ven muchos ejemplos de estas estructuras algebraicas. En cursos de Álgebra Superior se construye el dominio entero de enteros Z. Se construyen los campos R, Q y C. También, se construyen los anillos de polinomios F[x]. La noción de campo es fundamental cuando se construye la teoría de Álgebra Lineal. Como se puede ver, la teoría de álgebra es muy amplia, así que esta entrada sólo queda como invitación al tema.

Más problemas

Puedes encontrar más problemas de estructuras algebraicas en la Sección 4.4 del libro Problem Solving through Problems de Loren Larson.