Archivo de la etiqueta: álgebra

Álgebra Lineal II: Introducción a forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta última unidad usaremos las herramientas desarrolladas hasta ahora para enunciar y demostrar uno de los teoremas más hermosos y útiles en álgebra lineal: el teorema de la forma canónica de Jordan. A grandes rasgos, lo que nos dice este teorema es que cualquier matriz prácticamente se puede diagonalizar. En esta primera entrada hablaremos un poco de qué puedes esperar en el transcurso de la unidad, aunque en un orden algo distinto que te ayudará a entender mejor la motivación de presentar la teoría cómo vendrá en las siguientes notas.

Bloques de Jordan

Un bloque de Jordan de tamaño $k$ y eigenvalor $\lambda$ es una matriz en $M_k(F)$ que se obtiene de comenzar con $\lambda I_k$ y agregar encima de la diagonal principal puros unos. Queda algo así:

$$J_{\lambda,k}=\begin{pmatrix} \lambda & 1 & 0 & \ldots & 0 & 0 \\ 0 & \lambda & 1 & \ldots & 0 & 0 \\ 0 & 0 & \lambda & \ldots & 0 & 0 \\ & \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \ldots & \lambda & 1 \\ 0 & 0 & 0 & \ldots & 0 & \lambda \end{pmatrix}.$$

Puedes notar que esto es prácticamente una matriz diagonal, a excepción de la diagonal de unos que queda por encima de la diagonal principal. Esto debería sugerirte que los bloques de Jordan son casi tan amigables como las matrices diagonales. Como veremos en las siguientes entradas, es muy fácil calcularles su traza, determinante, polinomio característico, polinomio mínimo, eigenvalores, eigenvectores, etc.

A partir de los bloques de Jordan podemos formar matrices de bloques de Jordan pegando varios bloques de Jordan en una diagonal para obtener una matriz del siguiente estilo:

\begin{equation}\label{eq:Jordan}\begin{pmatrix} J_{\lambda_1,k_1} & 0 & 0 & \ldots & 0 \\ 0 & J_{\lambda_2,k_2} & 0 & \ldots & 0 \\ 0 & 0 & J_{\lambda_3,k_3} & \ldots & 0 \\ & \vdots & & \ddots & \vdots \\ 0 & 0 & 0 & \ldots & J_{\lambda_d,k_d}\end{pmatrix}.\end{equation}

Aquí pusimos muchos ceros, pero en el fondo cada uno de estos ceros son una matriz de ceros. Por ejemplo, si tenemos los tres bloques de Jordan $J_{3,2}$, $J_{-2,1}$ y $J_{5,3}$ y pegamos estos bloques, obtenemos la siguiente matriz de bloques:

$$\left( \begin{array}{cc|c|ccc} 3 & 1 & 0 & 0 & 0 & 0 \\ 0 & 3 & 0 & 0 & 0 & 0\\ \hline 0 & 0 & -2 & 0 & 0 & 0 \\ \hline 0 & 0 & 0 & 5 & 1 & 0\\ 0 & 0 & 0 & 0 & 5 & 1 \\ 0 & 0 & 0 & 0 & 0 & 5 \end{array}\right).$$

Recuerda que las líneas que dibujamos en una matriz de bloques son simplemente ayuda visual. Estas matrices también son prácticamente diagonales y, como te imaginarás, también es fácil encontrar muchas de sus propiedades.

Teorema de la forma canónica de Jordan

Si recuerdas, una de las motivaciones fuertes para que nos interesara diagonalizar una matriz $A$ es que la matriz diagonal $D$ semejante comparte muchas propiedades con $A$, pero $D$ es mucho más fácil de entender. A veces no podremos encontrar una matriz diagonal semejante a $A$, pero lo que nos dice el teorema de formas canónicas de Jordan es que prácticamente siempre podremos encontrar una matriz de bloques de Jordan semejante a $A$.

Teorema. Sea $A\in M_n(F)$ una matriz tal que su polinomio característico $\chi_A(X)$ se divide sobre $F$. Entonces, $A$ es similar a una matriz de bloques de Jordan, es decir, una matriz como en \refeq{eq:Jordan}.

En realidad, cuando enunciemos el teorema lo haremos de manera más formal, y hasta diremos en qué sentido la forma canónica de Jordan es única.

¿Por qué decimos que entonces prácticamente siempre podemos diagonalizar una matriz? En cursos más avanzados se muestra que sin importar en qué campo $F$ estemos trabajando, siempre podemos extender el campo $F$ lo suficiente como para que cualquier polinomio se divida sobre una extensión $G$ de $F$. En este campo extendido, cualquier matriz en $M_n(F)$ se puede diagonalizar.

Transformaciones y matrices nilpotentes

Para demostrar el teorema de Jordan, primero tendremos que enunciarlo y demostrarlo para una clase muy especial de matrices: las nilpotentes. Ya hemos hablado un poco de estas matrices en ejercicios particulares y algunos problemas de la tarea moral. Pero si se te pasó, una matriz $A$ en $M_n(F)$ es nilpotente cuando se puede encontrar un expontente $m$ tal que $A^m=O_n$. De manera similar, si $T$ es una transformación lineal, diremos que es nilpotente cuando $T^m=Z$ para algún exponente $m$, donde $Z$ es la transformación lineal trivial que manda todo elemento al $0$. Recuerda que aquí el exponente indica cuántas veces se compone $T$ consigo mismo. Como te imaginarás, $T$ será nilpotente si y sólo si alguna de sus formas matriciales lo es.

Las matrices nilpotentes servirán como nuestros cimientos para demostrar el teorema de la forma canónica de Jordán. Es sencillo ver que los bloques de Jordan de la forma $J_{0,k}$ son nilpotentes. También es sencillo ver que cualquier matriz de bloques de Jordan con puros eigenvalores iguales a cero es nilpotente. Nuestra primera versión del teorema de la forma canónica de Jordán nos dará algo así como un «regreso» de esta afirmación. El siguiente teorema es una versión «light» de lo que demostraremos.

Teorema. Sea $A\in M_n(F)$ una matriz nilpotente. Entonces, $A$ es similar a una matriz de bloques de Jordan, todos ellos con eigenvalor $0$.

La demostración será muy bonita, y hará uso de la teoría de dualidad de Álgebra Lineal I. Una vez que demostremos esta versión, la combinaremos con el teorema de Cayley-Hamilton de la Unidad 1 para obtener el teorema general.

Aplicaciones del teorema de Jordan

Si conocemos la forma canónica de Jordan de una matriz, podemos encontrar a partir de ella fácilmente muchas propiedades, como la traza, determinante, etc. Además de estas aplicaciones «de cálculo de propiedades», el teorema de la forma canónica de Jordán nos permitirá decir exactamente cuándo dos matrices son similares. En particular, veremos que cualquier matriz $A$ es similar a su transpuesta.

Tarea moral

En esta ocasión la tarea moral consistirá en un repaso de contenido anterior tanto de Álgebra Lineal I como Álgebra Lineal II, para que cuentes con todas las herramientas necesarias para aprovechar esta última unidad.

  1. Haz un repaso de la teoría de Matrices de bloques, para recordar a qué se refiere esta notación y cómo se pueden hacer operaciones cuando las matrices están escritas por bloques.
  2. Revisa la entrada de Matrices de cambio de base, para recordar por qué dos matrices similares en el fondo representan a la misma transformación lineal, pero en distintas bases.
  3. Repasa la teoría básica de dualidad en espacios vectoriales. Puedes comenzar con la entrada de Introducción a espacio dual. Concretamente, tendrás que recordar por lo menos hasta la teoría de Ortogonalidad y espacio ortogonal.
  4. Recuerda todo lo que podemos decir de las transformaciones triangularizables, revisando la entrada de Triangularizar y descomposición de Schur, y compara los resultados de ahí con lo que esperamos obtener sobre forma canónica de Jordan. ¿Cuál teorema dice algo más fuerte?
  5. Vuelve a leer todo el contenido relacionado con el teorema de Cayley-Hamilton para recordar no sólo qué dice, sino cómo está relacionado con los eigenespacios asociados a una transformación lineal. Puedes empezar con la entrada de Introducción al teorema de Cayley-Hamilton.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior II: Introducción a estructuras algebraicas

Por Leonardo Ignacio Martínez Sandoval

Introducción

Finalmente terminamos de construir a los números naturales, sus operaciones y su orden. El siguiente conjunto que nos interesa construir es $\mathbb{Z}$, el conjunto de los números enteros. Haremos esto en breve. Sin embargo, primero haremos un paréntesis para hablar de estructuras algebraicas.

Quizás hayas escuchado hablar de varias de ellas. En cálculo y geometría analítica se habla de los números reales y se comenta que es muy importante que sea un campo. En geometría moderna se habla de transformaciones geométricas y cómo algunas de ellas forman un grupo. También es común escuchar de los anillos de enteros o de polinomios (que estudiaremos más adelante). Y por supuesto, también están los espacios vectoriales, que están fuertemente conectados con resolver sistemas de ecuaciones lineales y hacer cálculo y geometría en altas dimensiones.

Todos estos conceptos (campos, grupos, anillos, espacios vectoriales, etc.) son ejemplos de estructuras algebraicas. Cada tipo de estructura algebraica es muy especial por sí misma y sus propiedades se estudian por separado en distintas materias, notablemente aquellas relacionadas con el álgebra moderna. La idea de esta entrada es dar una muy breve introducción al tema, para que te vayas acostumbrando al uso del lenguaje. Esto te servirá más adelante en tu formación matemática.

Intuición de estructuras algebraicas

De manera intuitiva, una estructura algebraica consiste de tomar un conjunto, algunas operaciones en ese conjunto, y ciertas propiedades que tienen que cumplir las operaciones. Eso suena mucho a lo que hemos trabajado con $\mathbb{N}$: es un conjunto, con las operaciones de suma y producto. Y ya demostramos que estas operaciones tienen propiedades especiales como la conmutatividad, la distributividad y la existencia de neutros.

En realidad podríamos tomar cualquier conjunto y cualquier operación y eso nos daría una cierta estructura.

Ejemplo. Consideremos el conjunto $\mathbb{N}$ con la operación binaria $\star$ tal que $$a\star b=ab+a+b.$$ Tendríamos entonces que $$3\star 1=3\cdot 1+3+1= 7,$$ y que $$10\star 10=10\cdot 10 + 10 + 10 = 120.$$

Es posible que la operación $\star$ tenga ciertas propiedades especiales, y entonces algunas proposiciones matemáticas interesantes consistirían en enunciar las propiedades de $\star$.

$\triangle$

Aunque tenemos mucha libertad en decidir cuál es el conjunto, cuáles son las operaciones que le ponemos y qué propiedades vamos a pedir, hay algunos ejemplos que se aparecen muy frecuentemente en las matemáticas. Aparecen de manera tan frecuente, que ameritan nombres especiales. Comencemos a formalizar esto.

Operaciones binarias y magmas

Dado un conjunto $S$, una operación binaria toma parejas de elementos de $S$ y los lleva a otro elemento de $S$. En símbolos, es una función $\star: S\times S\to S$. Cuando usamos la notación de función, tendríamos que escribir todo el tiempo $\times(a,b)$ para referirnos a lo que esta operación le hace a cada pareja de elementos $a$ y $b$ en $S$. Sin embargo, esto resulta poco práctico, y es por esta razón que se usa mucho más la notación $a\times b:=\times (a,b)$.

Ejemplo. En $\mathbb{N}$ ya definimos la operación binaria $+$, que toma dos enteros $a$ y $b$ y los manda a $s_a(b)$, donde $s_a:\mathbb{N}\to \mathbb{N}$ es la función que construimos usando el teorema de recursión estableciendo que $s_a(0)=a$ y $s_a(\sigma(n))=\sigma(s_a(n))$.

$\triangle$

Aquí lo único que nos importa es establecer una operación binaria. No nos importa si tiene otras propiedades adicionales.

Definición. Un magma consiste de un conjunto $S$ con una operación binaria $\ast$.

Otros ejemplos de magma son $\mathbb{N}$ con la operación que dimos en la parte de intuición, o bien $\mathbb{N}$ con el producto que ya definimos. También podemos tener magmas en conjuntos que no sea el de los enteros. Por ejemplo, si $P$ es el conjunto de subconjuntos de $\{0,1,2,3,4\}$, y le damos la operación que manda $A$ y $B$ a $A\cup B\cup \{0\}$, entonces también obtenemos un magma.

Conmutatividad

Cuando tenemos un conjunto $S$ y una operación binaria $\star$ en $S$, puede suceder que de lo mismo hacer $a\star b$ que $b\star a$. Esto ya es una propiedad especial que pueden cumplir las operaciones binarias, y tiene un nombre.

Definición. Decimos que una operación binaria $\star$ en un conjunto $S$ es conmutativa si para cualesquiera dos elementos $a$ y $b$ de $S$ se cumple que $a\star b=b\star a$.

Observa que la igualdad debe suceder para cualesquiera dos elementos. Basta con que falle para una pareja para que la operación ya no sea conmutativa.

Ejemplo. Una de las propiedades que demostramos de la operación de suma en $\mathbb{N}$ es que $s_a(b)=s_b(a)$, es decir, que $a+b=b+a$. En otras palabras, la operación binaria $+$ en $\mathbb{N}$ es conmutativa. Así mismo, vimos que el producto era conmutativo, es decir, que $p_a(b)=p_b(a)$, que en términos de la operación binaria $\cdot$ quiere decir que $a\cdot b=b\cdot a$.

$\triangle$

Más adelante veremos que otras funciones de suma y producto también son conmutativas, por ejemplo, las de los enteros, racionales, reales y complejos. Sin embargo, hay algunas operaciones binarias muy importantes en matemáticas que no son conmutativas. Un ejemplo de ello es el producto de matrices. Otro ejemplo es la diferencia de conjuntos.

Ejemplo. Si $P$ es el conjunto de subconjuntos de $\{0,1,2,3,4\}$ y le damos la operación binaria $\setminus$ tal que dados $A$ y $B$ en $P$ los manda a $A\setminus B$, entonces obtenemos un magma. Sin embargo, la operación $\setminus$ no es conmutativa pues, por ejemplo, $$\{1,2,3\}\setminus\{2,3,4\}=\{1\},$$ pero $$\{2,3,4\}\setminus\{1,2,3\}=\{4\}.$$

$\triangle$

En $\mathbb{N}$ no tenemos una operación de resta, como discutiremos en breve. Pero en el conjunto de los enteros sí, y ese sería otro ejemplo de una operación que no es conmutativa.

Asociatividad y semigrupos

Otra de las propiedades importantes que demostramos de la suma y producto de naturales es que son operaciones asociativas. En general, podemos definir la asociatividad para una operación binaria como sigue.

Definición. Sea $\star$ una operación binaria en un conjunto $S$. Decimos que $\star$ es asociativa si $a\star (b\star c)=(a\star b)\star c$ para cualesquiera tres elementos $a,b,c$ de $S$.

Tanto la suma como el producto de naturales dan una operación asociativa pues ya demostramos que si $a,b,c$ son naturales, entonces $a+(b+c)=(a+b)+c$ y $a(bc)=(ab)c$. Esta propiedad también la tendremos para la suma y producto de enteros, racionales, reales, complejos, polinomios, etc.

A partir de la asociatividad podemos definir la primer estructura algebraica que requiere un poco más de propiedades.

Definición. Un semigrupo es un conjunto $S$ con una operación asociativa $\star$.

Si además $\star$ es una operación conmutativa, entonces decimos que es un semigrupo conmutativo. En realidad, en cualquiera de las definiciones que daremos a continuación podemos agregar el adjetivo «conmutativo» y esto querrá decir que además de las propiedades requeridas, también se cumple que la operación es conmutativa.

En los semigrupos (y demás estructuras con asociatividad) tenemos la ventaja de que podemos «olvidarnos de los paréntesis» sin la preocupación de que haya ambigüedad. Por ejemplo, en los naturales la expresión $3+((2+4)+8)$ se puede escribir simplemente como $3+2+4+8$, pues cualquier otra forma de poner paréntesis, como $(3+2)+(4+8)$, debe dar exactamente el mismo resultado por asociatividad.

Ejemplo. Una operación que no es asociativa es la resta en los enteros. Aunque no hemos definido formalmente esta operación, es intuitivamente claro que $3-(2-1)$ no es lo mismo que $(3-2)-1$.

$\triangle$

Unidades y magmas unitales

A veces sucede que algunos elementos de un conjunto «no afectan a nadie» bajo una cierta operación binaria dada. Por ejemplo, en los naturales «sumar cero» no cambia a ningún entero.

Definición. Sea $\star$ una operación binaria en un conjunto $S$. Una unidad o neutro para $\star$ es un elemento $e$ en $S$ para el cual se cumple que para cualquier elemento $a$ de $S$ se tenga $a\star e = a$ y $e\star a = a$.

Observa que es muy importante pedir las dos igualdades de la definición. Si una se cumple, no necesariamente tiene que pasar la otra, pues no necesariamente la operación es conmutativa. Por supuesto, si ya se sabe que la operación es conmutativa, entonces basta con ver una de ellas.

En $\mathbb{Z}$ tenemos las operaciones de suma y producto. Para no confundir a sus neutros, a $0$ le llamamos el neutro aditivo para hacer énfasis que es el neutro de la suma. Y a $1$ le llamamos el neutro multiplicativo para hacer énfasis que es el neutro del producto. Entre las propiedades que probamos, en efecto vimos que $a+0=a=0+a$ y que $a\cdot 1 = a = 1\cdot a$ para cualquier entero $a$.

Definición. Un magma unital es un conjunto $S$ con una operación $\star$ que tiene un neutro.

El conjunto de naturales con la operación $\star$ que dimos en la sección de intuición también es un magma unital. ¿Puedes decir quién es su neutro?

Monoides

Se puede pedir más de una propiedad a una operación binaria y entonces obtenemos estructuras algebraicas más especiales.

Definición. Un monoide es un conjunto $S$ con una operación $\star$ que es asociativa y que tiene un neutro.

En otras palabras, un monoide es un magma unital con operación asociativa. O bien, un semigrupo cuya operación tiene unidad. Por supuesto, si la operación además es conmutativa entonces decimos que es un monoide conmutativo.

Ejemplo. Por todo lo que hemos visto en esta entrada, tenemos que $\mathbb{N}$ con la suma es un monoide conmutativo. Así mismo, $\mathbb{N}$ con el producto es un monoide conmutativo.

$\triangle$

Semianillos

La última idea importante para discutir en esta entrada es que una estructura algebraica puede tener más de una operación binaria, y además de pedir propiedades para cada operación, también se pueden pedir propiedades que satisfagan ambas operaciones en igualdades que las involucran a las dos.

Definición. Un seminanillo es un conjunto $S$ con dos operaciones binarias $\square$ y $\star$ que satisfacen las siguientes propiedades:

  • $\square$ es un monoide conmutativo
  • $\star$ es un monoide
  • Se cumple distributividad, es decir, que para cualesquiera tres elementos $a,b,c$ de $S$ se tiene $a\star(b\square c) = (a\star b)\square(a\star c)$ y $(a\square b)\star c = (a\star c)\square(b\star c)$.
  • El neutro $e$ de $\square$ aniquila a los elementos bajo $\star$, es decir, para cualquier elemento $a$ de $S$ se tiene que $a\star 0=0$ y $0\star a = 0$.

Un semianillo conmutativo es un semianillo en donde la operación $\star$ también es conmutativa. Las propiedades que hemos de los números naturales nos permiten enunciar el siguiente resultado.

Teorema. El conjunto $\mathbb{N}$ con las operaciones binarias de suma y producto es un semianillo conmutativo.

Más adelante…

Este sólo fue un pequeño paréntesis para comenzar a hablar de operaciones binarias y de estructuras algebraicas. Ahora regresaremos a seguir construyendo de manera formal los sistemas numéricos con los que se trabaja usualmente: los enteros, los racionales, los reales y los complejos.

Un poco más adelante haremos otro paréntesis de estructuras algebraicas, en el que hablaremos de otras propiedades más que puede tener una operación binaria. Una muy importante es la existencia de inversos para la operación binaria. Esto llevará a las definiciones de otras estructuras algebraicas como los grupos, los anillos, los semigrupos con inversos, los quasigrupos y los campos.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra el neutro de la operación $\star$ dada en la sección de intuición. Verifica que en efecto es un neutro.
  2. Demuestra que el conjunto de los naturales pares $\{0,2,4,6,\ldots\}$ sí tiene un neutro para la operación de suma, pero no para la operación de producto.
  3. Considera el conjunto $P(S)$ de subconjuntos de un conjunto $S$. Considera las operaciones binarias de unión e intersección de elementos de $P(S)$. Muestra que $P(S)$ con estas operaciones es un semianillo conmutativo.
  4. Da un ejemplo de un magma que no sea un magma unital. Da un ejemplo de un magma unital que no sea un monoide.
  5. Da o busca un ejemplo de un semianillo que no sea un semianillo conmutativo.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: El orden en los enteros

Por Ana Ofelia Negrete Fernández

Introducción

En las entradas anteriores introdujimos al conjunto de los números enteros, así como sus operaciones de suma y producto. Lo que haremos ahora es ver cómo ordenar a los elementos en $\mathbb{Z}$. Lo haremos de una forma similar a la que hicimos lo de las operaciones: usando las nociones que ya teníamos definidas en $\mathbb{N}$.

Como recordatorio, en $\mathbb{N}$ dijimos que $a<b$ cuando $a\in b$. De esta noción de «menor que» dimos la noción de «menor o igual que», diciendo que $a\leq b$ cuando ya sea que $a<b$ o bien $a=b$. Vimos que esta relación $\leq$ define un orden parcial en $\mathbb{N}$ que además es tricotómico. Quizás los resultados más importantes para trabajar con esta noción de desigualdad fue ponerla en términos de suma de elementos en $\mathbb{N}$:

  • En $\mathbb{N}$ se cumple que $a<b$ si y sólo si existe un natural $k>0$ tal que $a+k=b$.
  • En $\mathbb{N}$ se cumple que $a\leq b$ si y sólo si existe un natural $k$ tal que $a+k=b$.

Con esto en mente, veamos ahora cómo construir un orden en $\mathbb{Z}$. Antes de hacer eso, conviene primero pensar en números positivos, negativos y el cero.

Los positivos, los negativos y el cero en $\mathbb{Z}$

Ya sabemos que la identidad aditiva en $\mathbb{Z}$ es la clase $\overline{(0,0)}$, que también se puede pensar como la clase $\overline{(a,a)}$ para cualquier $a$ en $\mathbb{N}$. Si tenemos cualquier otra clase $\overline{(a,b)}$, por tricotomía del orden en $\mathbb{N}$ nos quedan sólo otras dos opciones: o bien $a<b$, o bien $b<a$. Esto nos ayudará a definir la noción de positividad y negatividad.

Definición. Sea $\overline{(a,b)}$ un entero. Diremos que ${(a,b)}$ es:

  • Cero si $a=b$,
  • Positivo si $a>b$ y
  • Negativo si $a<b$.

Una vez más, por la tricotomía del orden en $\mathbb{N}$, siempre sucede exactamente una de las posibilidades anteriores. Es importante ver que esta definición está bien hecha, es decir, que no depende de la clase de equivalencia que se eligió. Por ejemplo, si $\overline{(a,b)}$ es positivo, sucede que $a>b$. Si tomamos $(c,d)$ tal que $(a,b)\sim (c,d)$, nos gustaría ver que también sucede $c>d$. Esto se debe a que $a+d=b+c$. Si tuviéramos $c\leq d$, entonces nos pasaría que $a+d>b+c$ y tendríamos una contradicción. Así, por tricotomía debe pasar $c>d$. El caso de la negatividad se verifica de manera análoga.

Recuerda que el inverso aditivo de un entero $\overline{(a,b)}$ es el entero $-\overline{(a,b)}=\overline{(b,a)}$. Así, si $\overline{(a,b)}$ es positivo, entonces su inverso aditivo es negativo y viceversa.

Definición. Usaremos la letra $P$ para referirnos al conjunto de todos los enteros positivos. Usaremos $-P$ para referirnos al conjunto de todos los enteros negativos.

¿Cómo se comportan estas definiciones con las operaciones que ya tenemos en $\mathbb{Z}$? Ahora tenemos todo lo necesario para poder formalizar oraciones como «negativo por negativo es positivo», o «positivo más positivo es positivo.

Proposición. En $\mathbb{Z}$ se cumple todo lo siguiente:

  • Si $\overline{(a,b)}$ y $\overline{(c,d)}$ están en $P$, entonces su suma está en $P$ y su producto también.
  • Si $\overline{(a,b)}$ y $\overline{(c,d)}$ están en $-P$, entonces su suma está en $-P$ y su producto está en $P$.

Demostración. Todas estas afirmaciones se traducen a proposiciones que debemos demostrar en $\mathbb{N}$. En el caso de la primera, debemos ver que si $a>b$ y $c>d$, entonces $a+c>b+d$ y que $ac+bd>ad+bc$. Lo primero es sencillo, pues sale de la compatibilidad de $>$ con la suma de $\mathbb{N}$. Demostremos entonces que $ac+bd>ad+bc$.

Como $a>b$, existe un natural $k>0$ tal que $a=b+k$. Como $c>d$, existe un natural $l>0$ tal que $c=d+l$. Haciendo estas substituciones de $a$ y $c$ en $ac+bd>ad+bc$, obtenemos la siguiente cadena de desigualdades que son equivalentes a lo que debemos demostrar:

\begin{align*}
ac+bd&>ad+bc\\
(b+k)(d+l)+bd&>(b+k)d+b(d+l)\\
bd+bl+kd+kl+bd&>bd+kd+bd+bl.
\end{align*}

La última de estas desigualdades se cumple pues a la izquierda tenemos todos los sumandos que del lado derecho, y además el sumando $kl$ que como $k>0$ y $l>0$, entonces cumple $kl>0$.

Las demostraciones para cuando los elementos son negativos quedan como tarea moral.

$\square$

Al conjunto de enteros positivos también se le conoce en ocasiones como $\mathbb{Z}^+$, y al de enteros positivos también se le conoce como $\mathbb{Z}^-$.

El orden en $\mathbb{Z}$

Estamos listos para definir el orden en $\mathbb{Z}$. Aprovecharemos que ya podemos restar para poner la definición de orden en términos de esta operación.

Definición. Para $\overline{(a,b)}$ y $\overline{(c,d)}$ elementos en $\mathbb{Z}$ diremos que $\overline{(c,d)}<\overline{(a,b)}$ si $\overline{(a,b)}-\overline{(c,d)}$ es un entero positivo.

En realidad la expresión $\overline{(a,b)}-\overline{(c,d)}$ es simplemente $\overline{(a+c,b+d)}$, así que otra forma de escribir la condición de la definición es simplemente pedir que $a+c>b+d$. Como siempre sucede que o bien $a+c>b+d$, o que $a+c<b+d$, o que $a+c=b+d$ (y sólo una de ellas), entonces de manera inmediata obtenemos la tricotomía en $\mathbb{Z}$.

Proposición. Para $\overline{(a,b)}$ y $\overline{(c,d)}$ elementos en $\mathbb{Z}$ siempre sucede exactamente alguna de las siguientes:

  • $\overline{(a,b)}<\overline{(c,d)}$
  • $\overline{(c,d)}<\overline{(a,b)}$
  • $\overline{(a,b)}=\overline{(c,d)}$

Como en el caso de los naturales, a partir de la definición de «menor estricto» es sencillo obtener la noción de «menor o igual».

Definición. Para $\overline{(a,b)}$ y $\overline{(c,d)}$ elementos en $\mathbb{Z}$ diremos que $\overline{(c,d)}\leq \overline{(a,b)}$ si o bien $\overline{(a,b)}-\overline{(c,d)}$ es un entero positivo, o bien $\overline{(a,b)}=\overline{(c,d)}$.

Lo anterior es equivalente a pedir que $a+c\geq b+d$.

Proposición. La relación $\leq$ es un orden parcial en $\mathbb{Z}$.

Demostración. Es inmediato que esta relación $\leq$ es reflexiva, pues $\overline{(a,b)}\leq \overline{(a,b)}$ se obtiene de manera inmediata de la segunda parte de la definición.

Para ver que es antisimétrica, si tuviéramos $\overline{(c,d)}\leq \overline{(a,b)}$ y $\overline{(a,b)}\leq \overline{(c,d)}$, entonces tendríamos las desigualdades $a+c\geq b+d$ y $b+d\geq a+c$, que por la antisimetría en $\mathbb{N}$ implican que $a+c=b+d$, que justo es $\overline{(a,b)}=\overline{(c,d)}$.

Finalmente, para ver que $\leq$ es una relación transitiva, comenzamos con enteros $\overline{(a,b)}, \overline{(c,d)}, \overline{(e,f)}$ tales que $\overline{(e,f)}\leq \overline{(c,d)}$ y $\overline{(c,d)}\leq \overline{(a,b)}$.

De la primer desigualdad obtenemos $c+f\geq e+d$ y de la segunda obtenemos que $a+d\geq b+c$. Sumando ambas desigualdades, obtenemos que $c+f+a+d\geq b+c+e+d$. De aquí podemos deducir que $a+f\geq b+e$. Esto precisamente nos dice que $\overline{(e,f)}\leq \overline{(a,b)}$, como queríamos.

$\square$

Las dos proposiciones anteriores se pueden resumir en el siguiente enunciado.

Teorema. La relación $\leq$ es un orden total en $\mathbb{Z}$.

Compatibilidad del orden con las operaciones en $\mathbb{Z}$

Lo último que nos queda por mencionar es cómo se comporta la relación $\leq$ en $\mathbb{Z}$ con sus operaciones de suma y producto. A continuación mencionamos algunas de las propiedades que se cumplen, aunque hay varias cosas más que se pueden demostrar.

Proposición. En $\mathbb{Z}$ se cumple lo siguiente:

  • Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}\leq \overline{(g,h)}$, entonces $$\overline{(a,b)}+\overline{(e,f)}\leq \overline{(c,d)}+\overline{(g,h)}.$$
  • Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}$ es positivo, entonces $$\overline{(a,b)}\overline{(e,f)}\leq \overline{(c,d)}\overline{(e,f)}.$$
  • Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}$ es negativo, entonces $$\overline{(c,d)}\overline{(e,f)}\leq \overline{(a,b)}\overline{(e,f)}$$

Demostración.

  • Las hipótesis se pueden escribir como $a+d\leq b+c$ y $e+h\leq f+g$. Sumando ambas y asociando de un modo que nos convenga, obtenemos que $(a+e)+(d+h)\leq (b+f)+(c+g)$. Esto lo que nos dice es que $\overline{(a+e,b+f)}\leq $\overline{(c+g,d+h)}$, que es precisamente lo que queríamos demostrar.
  • Por la hipótesis, tenemos que $\overline{(c,d)}-\overline{(a,b)}$ es positivo y que $\overline{(e,f)}$ también. Por lo que ya vimos antes, el producto de estos dos enteros debe ser entonces positivo. Por distributividad, este producto es $\overline{(c,d)}\overline{(e,f)}-\overline{(a,b)}\overline{(e,f)}$. Así, $\overline{(a,b)}\overline{(e,f)}\leq \overline{(c,d)}\overline{(e,f)},$ como queríamos.
  • Por la hipótesis, tenemos que $\overline{(c,d)}-\overline{(a,b)}$ es positivo y que $\overline{(e,f)}$ es negativo. Entonces $\overline{(f,e)}=-\overline{(e,f)}$ es positivo. Por lo que ya vimos antes, el producto de estos dos enteros debe ser entonces positivo. Por distributividad, este producto es $\overline{(c,d)}\overline{(f,e)}-\overline{(a,b)}\overline{(f,e)}$. Esta expresión se puede escribir de manera alternativa como $\overline{(a,b)}\overline{(e,f)}-\overline{(c,d)}\overline{(e,f)}$. Como es positiva, obtenemos justo lo que queríamos.

$\square$

En los ejercicios de la tarea moral explorarás más propiedades de la relación $\leq$ y cómo interactúa con las operaciones en $\mathbb{Z}$.

Más adelante…

Ya tenemos todo lo que necesitamos en los enteros: su definición, sus operaciones y su noción de orden. Sin embargo, aún tenemos una gran dificultad: es muy difícil escribirlos. Cada que queremos referirnos a un entero, debemos usar la clase de equivalencia de una pareja de naturales. Nos gustaría que los enteros fueran algo mucho más intuitivo: los naturales y sus negativos. Lo que haremos en la siguiente entrada es ver cómo formalizar esta idea para que podamos, finalmente, abandonar la notación de parejas de naturales y relaciones de equivalencia. Esto será bastante útil para después entrar en muchas otras propiedades que nos interesan de los enteros como la noción de divisibilidad y otras propiedades aritméticas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Completa las demostraciones de las nociones de positivo, negativo y orden en $\mathbb{Z}$ están bien definidas.
  2. Demuestra que la suma de dos enteros negativos es un entero negativo y que su producto es un entero positivo. Haz una demostración que funcione en general, pero luego verifícalo «a mano» para los enteros $\overline{(3,7)}$ y $\overline{(9,11)}$.
  3. En la entrada dimos la definición formal de $<$ y de $\leq$ en $\mathbb{Z}$, pero aún no hemos definido ni usado los símbolos $>$ y $\geq$ en $\mathbb{Z}$. Formaliza una definición para ellos. Demuestra que $\geq$ también es un orden total en $\mathbb{Z}$.
  4. Demuestra que en $\mathbb{Z}$, si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}$ es negativo, entonces $$\overline{(a,b)}\overline{(e,f)}\geq \overline{(c,d)}\overline{(e,f)}.$$
  5. Determina si la siguiente propiedad del producto y el orden en $\mathbb{Z}$ siempre es verdadera, o bien si hay ocasiones en las que falla: «Si $\overline{(a,b)}\leq \overline{(c,d)}$ y $\overline{(e,f)}\leq \overline{(g,h)}$, entonces $$\overline{(a,b)}\overline{(e,f)}\leq \overline{(c,d)}\overline{(g,h)}.»

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: Introducción al curso y a los números naturales

Por Roberto Manríquez Castillo

Introducción

El curso de Álgebra Superior I tuvo como principal objetivo darte las herramientas necesarias para poder entender, a grandes rasgos, la teoría que sustenta las primeras asignaturas con las que te encuentras a nivel universitario en tu trayectoria matemática. Por esta razón, en el temario se incluyeron los temas de lógica, demostraciones, teoría de conjuntos, números naturales, inducción matemática, conteo y espacios vectoriales.

Sin embargo, quedaron abiertas algunas preguntas. Por ejemplo: ¿cómo sabemos que los conjuntos con los que trabajamos existen?, ¿qué es en el fondo el conjunto de números reales que usamos en los espacios vectoriales? o ¿por qué funciona el principio de inducción?

En este sentido, el curso de Álgebra Superior II es la continuación de Álgebra Superior I. El objetivo de este curso será responder estas preguntas que en el curso anterior quedaron sin responder. Con esto en mente, usaremos las herramientas de la teoría de conjuntos que desarrollamos con anterioridad para estudiar qué son los números naturales, los enteros y hasta los complejos. Haremos una escala en cada tema para poder entender a profundidad las propiedades con las que hemos estado familiarizados desde educación básicas y para conocer otras propiedades que te servirán a lo largo de tu formación matemática.

En la parte final del curso, introduciremos otra estructura con la que seguramente ya estarás familiarizado gracias al curso de Cálculo Diferencial e Integral I: el anillo de polinomios con coeficientes reales (o complejos). Como en el caso de los temas anteriores, nos detendremos a estudiar las propiedades que caracterizan a este conjunto y las similitudes que podemos encontrar con algunos de los sistemas numéricos, como los números enteros.

La intuición detrás de formalizar a los números naturales

Desde la educación básica se aprende a contar. Con el pasar del tiempo, la idea de los números naturales y las características que se necesitan para contar “de uno en uno” seguramente se han hecho muy familiares en tu mente. A grandes rasgos, cuando contamos tenemos mente a los números $$0,1,2,3,4,5,6,7,\ldots.$$ De hecho, las propiedades de estos números probablemente son tan familiares que ya no reparas en ello a la hora de contar. Al cero le sigue el uno. Al uno le sigue el dos. Y así sucesivamente. Esto resulta práctico a la hora de contar, pero algo impráctico a la hora de establecer los fundamentos matemáticos de los números naturales. Por esta razón, tomémonos un momento para pensar en las propiedades que satisface este sistema numérico.

La primera característica en la que podemos pensar es que los números naturales cuentan con un elemento especial de entre todos los demás números, el primero de todos ellos. Dependiendo del contexto, el $0$ (y no el $1$) es considerado como el primer número natural y coincide con la intuición de que podemos «tener cero cosas», es decir, ninguna. Es importante que sepas que en cierto contextos (por ejemplo, otros cursos o áreas de las matemáticas) podría no serlo. La recomendación es que siempre uses la convención del área o comunidad con la que estés trabajando. En este curso el número $0$ siempre será un número natural.

Otra característica con la que seguramente estamos muy familiarizados es que si bien los números naturales tienen un comienzo (en nuestro caso, el $0$), por otra parte nunca terminan. No importa hasta qué número podamos haber contado, siempre podemos dar un paso más y avanzar al siguiente número. Cuando tenemos un natural, decimos entonces que siempre tiene un sucesor. Sabemos que sólo hay un sucesor para cada número.

Otra característica clave de los números naturales es que, a la hora de contar, nunca regresamos a un número por el cual ya pasamos; es decir, bajo ninguna circunstancia contamos $107, 108, 109, 37, ‘ldots$. Para enunciar esto formalmente, lo diremos en dos partes. Primero, el $0$ no es el sucesor de ningún número y segundo, en ninguna circunstancia, un mismo número es el sucesor de dos números diferentes.

Existe una quinta propiedad, tal vez más sutil que las anteriores, y es que si empezamos a contar desde el cero y vamos contando de uno en uno, entonces podremos alcanzar cualquier número natural, siempre que el tiempo lo permita.

Resulta que estas propiedades intuitivas son suficientes para definir muchas otras operaciones en los números naturales y para obtener una gran cantidad de propiedades. Es por esta razón que conviene incluirlas en nuestra formalización de los naturales, como discutimos a continuación.

Los axiomas de Peano para los números naturales

A finales del siglo XIX, los matemáticos empezaron a notar que a partir de algunas propiedades tan elementales como las que discutimos arriba, se podían probar las leyes de la aritmética que conocemos. En 1889, Giuseppe Peano, basado en las propiedades que acabamos de enunciar, dio un conjunto de axiomas que usó para estudiar sistemáticamente a los números naturales. Estos axiomas son:

  1. $0$ es un número natural.
  2. Si $n$ es un número natural, entonces existe un único natural, denotado $\sigma(n)$ al que llamamos su sucesor.
  3. Para todo número natural, $\sigma(n)\neq0$.
  4. Si $n,m$ son números naturales, tales que $\sigma(n)=\sigma(m)$, entonces $n=m$.
  5. Si $S$ es un subconjunto de números naturales tal que: $0$ está en $S$, y para todo $n$ en $S$, se cumple que $\sigma(n)$ está también en $S$, entonces $S$ es el conjunto de todos los naturales.

Nota que cada una de las cinco propiedades coinciden con una de las propiedades intuitivas que mencionamos antes.

Encontrando los primeros números naturales

El logro de Peano fue muy importante, ya que permitió reducir la teoría de los números naturales a solo cinco axiomas; sin embargo, aún quedan abiertas las preguntas ¿qué son los números naturales? y ¿cómo sabemos que existen? Aunque se hayan mencionado las propiedades de un objeto, no necesariamente tiene que existir tal objeto. Este fue el gran problema al que se enfrentaron los matemáticos cuando intentaron definir a un conjunto al que pertenecen todos los conjuntos.

Es por esta razón que debemos fundamentar la construcción de los números naturales en teoría que ya tengamos desarrollada. Por esta razón, a partir de este punto se aparece la teoría de los conjuntos, la cual nos permitirá definir formalmente lo que significan los símbolos que diariamente ocupamos (como el $0$), para después ver que en efecto estos conjuntos satisfacen los axiomas de Peano.

Definición: Definimos al cero como $0:=\emptyset$.

Cuando ponemos $:=$, quiere decir que estamos definiendo algo, típicamente un símbolo. Cuando veas algo así aparecer, puedes pensar que significa «esta es la primera vez que usamos el símbolo $0$, y lo que querrá decir es el conjunto vacío». Podemos pensar en esta definición como una simple ocurrencia de notación; sin embargo, es curioso notar que, pensando intuitivamente, $\emptyset$ tiene en efecto cero elementos. Más adelante veremos que los demás números naturales también satisfacen esta intuitiva coincidencia.

Definición: Dado un conjunto $A$ arbitrario, definimos el sucesor de $A$ como $\sigma(A):=A\cup\{A\}$.

Notemos que en realidad $\sigma$ no es en el sentido estricto una función ¿por qué? Más bien, lo que estamos haciendo es explicar a qué nos referimos con el símbolo $\sigma(A)$.

Considerando que hemos construido el primer número natural (el $0$) y hemos dado una forma de construir sucesores, parece una buena idea considerar \[\sigma(0)=\sigma(\emptyset)=\emptyset\cup\{\emptyset\}=\{\emptyset\}.\]

Y definir $1:= \{\emptyset\}$. Análogamente podemos pensar que \[2:=\sigma(1)=\sigma(\{\emptyset\})=\{\emptyset\}\cup\{\{\emptyset\}\}=\{\emptyset,\{\emptyset\}\}.\]

Podríamos continuar así sucesivamente. Observa que, efectivamente, los conjuntos $1$ y $2$ coinciden con la intuición de tener respectivamente $1$ y $2$ elementos.

Los «disfraces» de los números naturales

Actualmente usamos el sistema de numeración arábigo y sabemos exactamente qué quieren decir los «dibujos» $1$, $2$, $3$, $4$, etc. Si fueramos romanos, estaríamos usando los «dibujos» $I$, $II$, $III$, $IV$, etc. De manera estricta, los «dibujos» no son lo mismo que «el concepto que representan». Es decir, en el fondo, $2$ y $II$ son «disfraces distintos para el mismo concepto». Pero ninguno de esos «dibujos» es el concepto mismo, ni vive de manera formal en la teoría que estamos construyendo.

Lo que sí vive en la teoría que construimos es el $\{\emptyset,\{\emptyset\}\}$, pues a partir de los axiomas se puede garantizar su existencia. Por supuesto, en el curso usaremos los «disfraces» habituales de estos conceptos, de modo que casi siempre escribiremos $2$, $7$, $51$, etc. Sin embargo, es crucial que en todo momento tengas en cuenta que cuando escribimos esos «dibujos», en el fondo están las construcciones formales que realizaremos.

Más adelante

Hemos empezado a definir a los números naturales a partir del $0$ (el conjunto vacío) y la función sucesor $\sigma$; sin embargo, la realidad es que el proceso que hemos descrito debe ser refinado, ya que si continuamos así, jamás acabaremos de definir la infinidad de números naturales que queremos que existan.

Incluso asumiendo que los podemos definir a todos, un segundo problema que se origina es el intentar unirlos en un solo «conjunto de los números naturales». Uno podría intentar ocupar el principio de inducción para resolver el problema. Sin embargo, recordemos que por el momento sólo contamos con los axiomas de la teoría de conjuntos, y aún no sabemos que el principio de inducción (visto como en el curso de Álgebra Superior I, o a partir de los axiomas de Peano) sea válido. Entonces, necesitaremos pensar cómo resolver el problema desde otra perspectiva.

Además, queda el problema de ver que los números naturales que definamos sí satisfagan los axiomas de Peano. También haremos esto pronto, para que a partir de ello podamos comenzar a introducir otras propiedades aritméticas y de orden.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Prueba a partir de sólo los axiomas de Peano, que $n\neq \sigma (n) $ para todo $n\in\mathbb{N}$.
  2. ¿Qué axiomas de Peano satisface el conjunto $\sigma(\mathbb{N})$, es decir, el conjunto de los números a partir del $1$?
  3. ¿Cómo será un conjunto y una función que satisfagan los axiomas 1), 2), 4) y 5) de Peano, pero que no satisfaga el 3)? ¿Puedes construir formalmente un conjunto y una función así?
  4. A partir de la definición de $\sigma(n)$ que dimos, demuestra que para todo número natural $n$ se satisface que $n\in\sigma(n)$ y que $n\subset\sigma(n)$.
  5. Demuestra que si $A$ es un conjunto, entonces $\sigma(A)$ es un conjunto. Para ello, tendrás que recordar los axiomas de teoría de conjuntos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: Raíces de polinomios de grados 3 y 4

Por Leonardo Ignacio Martínez Sandoval

Introducción

Esta es la entrada final de la unidad de polinomios y del curso. En ella hablaremos acerca de las fórmulas para encontrar las raíces de polinomios de grado $3$ y $4$. Además, en la parte final, hablaremos de polinomios de grados más altos y cómo ellos te pueden llevar a cursos muy interesantes que puedes tomar para continuar tu formación matemática.

Existen métodos generales para encontrar las raíces de polinomios de grado $3$ y $4$, ya sea en $\mathbb{R}[x]$ o en $\mathbb{C}[x]$. Para los polinomios de grado $3$, se usa el método de Cardano. Para los polinomios de grado $4$ se usa el método de Ferrari. Encontrar estas fórmulas tomó mucho tiempo. Ambas requieren de manipulaciones algebraicas muy creativas.

Raíces de polinomios de grado 3 y el método de Cardano

Tomemos un polinomio $f(x)$ en $\mathbb{R}[x]$ de grado $3$. Si $f(x)$ no es mónico, podemos multiplicarlo por el inverso de su coeficiente principal para obtener un polinomio con las mismas raíces. De esta forma, podemos suponer sin pérdida de generalidad que $f(x)$ es de la forma $$f(x)=x^3+ax^2+bx+c.$$

Consideremos al polinomio $$g(x)=f\left(x-\frac{a}{3}\right).$$ Observa que $r$ es una raíz de $g(x)$ si y sólo si $g(r)=0$, si y sólo si $f\left(r-\frac{a}{3}\right)=0$, si y sólo si $r-\frac{a}{3}$ es una raíz de $f$. De esta forma, si conocemos las raíces de $g(x)$, podemos encontrar las de $f(x)$, y viceversa.

Al hacer las cuentas (que quedan como tarea moral), se tiene que $g(x)$ se simplifica a
\begin{align*}
g(x)&=f\left(x-\frac{a}{3}\right)\\
&=x^3+\left(b-\frac{a^2}{3}\right)x+\left(-\frac{ba}{3}+c+\frac{2a^3}{27}\right),
\end{align*}

que tiene la ventaja de ya no tener término cuadrático. En otras palabras, para encontrar las raíces de polinomio cúbico, basta con poder encontrar las de los polinomios de la forma $$g(x)=x^3+px+q.$$

Tomando $x=u+v$ y haciendo las operaciones, se tiene que $$g(u+v)=u^3+v^3+(3uv+p)(u+v)+q.$$

Observa que si logramos encontrar $u$ y $v$ que satisfagan el sistema de ecuaciones
\begin{align*}
u^3+v^3&=-q\\
uv&=-\frac{p}{3},
\end{align*}

entonces tendríamos una raíz $x=u+v$.

La segunda ecuación implica $u^3v^3=-\frac{p^3}{27}$. Pero entonces conocemos la suma y el producto de las variables $u^3$ y $v^3$, con lo cual obtenemos que son las raíces del siguiente polinomio de grado $2$ en la variable $t$:
\begin{align*}
(t-u^3)(t-v^3)&=t^2-(u^3+v^3)t+u^3v^3\\
&=t^2+qt-\frac{p^3}{27}.
\end{align*}

El discriminante de esta ecuación cuadrática es $$\Delta = q^2 + \frac{4p^3}{27}.$$

Si $\Delta >0$, esta ecuación cuadrática tiene las siguientes soluciones reales:
\begin{align*}
\sqrt[3]{-\frac q2 + \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}}\\
\sqrt[3]{-\frac q2 – \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}}.
\end{align*}

Sin pérdida de generalidad, $u$ es la primera y $v$ la segunda. De esta forma, una raíz real para $g(x)$ es $$x= \sqrt[3]{-\frac q2 + \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}} + \sqrt[3]{-\frac q2 – \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}}.$$

Hasta aquí hay algunas cosas por notar:

  • Supusimos que el discriminante $\Delta$ es positivo.
  • Sólo hemos encontrado una de las $3$ raíces de $p(x)$ que garantiza el teorema fundamental del álgebra.

Cuando el discriminante es positivo, las otras dos soluciones son $\omega x$ y $\omega^2 x$, en donde $\omega$ es una raíz cúbica primitiva de la unidad.

Cuando la cuadrática tiene discriminante $\Delta<0$, tenemos que $u$ y $v$ son complejos, y entonces al sacar raíz cúbica podemos tener tres opciones para cada uno, algo que parecería dar un total de $9$ soluciones. Sin embargo, recordando que $uv=-\frac{p}{3}$, tenemos que $u$ queda totalmente determinado por $v$, así que de ahí se obtienen las tres soluciones.

Raíces de polinomios de grado 4 y el método de Ferrari

El método de Ferrari está explicado a detalle en el libro de Álgebra de Bravo, Rincón y Rincón. Ahí están las ideas principales para encontrar una fórmula general para encontrar las raíces de un polinomio de grado $4$, es decir, de la forma $$p(x)=ax^4+bx^3+cx^2+dx+e.$$ Recuerda que el libro está disponible para descarga gratuita.

Al igual que en el caso del método de Ferrari, los primeros pasos consisten en hacer simplificaciones algebraicas. Así como el método de Cardano usa la fórmula cuadrática, del mismo modo el método de Ferrari reduce el problema a encontrar soluciones a un polinomio de grado 3. Uno podría creer que este patrón se repite, y que se pueden encontrar métodos para polinomios de grado arbitrario. Esto no es así, y lo platicaremos en la siguiente sección.

Para otra derivación de la fórmula de Ferrari, compartimos el artículo «Identidades para la resolución de ecuaciones cúbicas y cuárticas» de José Leonardo Sáenz Cetina, que apareció en el número 24 de la revista Miscelánea Matemática de la Sociedad Matemática Mexicana:

Este documento también tiene otras dos formas de resolver ecuaciones cúbicas, así que es una lectura recomendada.

Finalmente, se recomienda también echarle un ojo a la página de Wikipedia acerca de la ecuación cuártica. La entrada en inglés es mucho mejor. Sobre todo la sección referente al método de Ferrari.

Raíces de polinomios de grado 5 y más

De acuerdo al teorema fundamental del álgebra, todo polinomio sobre los complejos tiene al menos una raíz. De hecho, se puede mostrar que si es de grado $n$, entonces tiene exactamente $n$ raíces, contando multiplicidades.

Cuando tenemos polinomios de grados $2$, $3$ y $4$ podemos usar la fórmula cuadrática, el método de Cardano y el método de Ferrari para encontrar una fórmula para las soluciones. ¿Hay algún método que tenga fórmulas similares para polinomios de grado más grande?

La respuesta es que no. Aunque el teorema fundamental del álgebra garantice la existencia de las raíces, hay un teorema de Abel y Ruffini que muestra que no es posible encontrar una fórmula general. Al menos no una que ayude a poner las raíces de cualquier polinomio de grado cinco (o más) usando únicamente sumas, restas, multiplicaciones, divisiones y raíces. Esto formalmente se enuncia como que hay ecuaciones de grado 5 y más que no son solubles por radicales.

Enunciar y demostrar este teorema formalmente requiere de herramientas que quedan fuera del alcance de este curso, sin embargo, se puede estudiar en un curso avanzado de álgebra, en donde se hable de extensiones de campo y teoría de Galois.

Por otro lado, podemos dejar de lado la exactitud y preguntarnos si, dado un polinomio, podemos acercarnos a sus raíces tanto como queramos. Hoy en día eso se hace mediante métodos computacionales. Aunque la computadora sea muy buena haciendo cuentas, hay que ser particularmente cuidadoso con los errores que comete al hacer aproximaciones.

Eso es otra de las cosas que quedan fuera del alcance de este curso, y que puedes estudiar en un buen curso de métodos numéricos. Si lo que buscas es saber cómo pedirle a la computados que haga los cálculos, eso lo puedes aprender en un buen curso de programación, en donde te enseñen a usar ambientes de computación científica.

Más adelante…

Antes de concluir el curso, en la siguiente entrada, repasamos lo aprendido en esta entrada y vemos como se puede realizar una ecuación de grado $3$ y de grado $4$ usando los métodos de Cardano y de Ferrari, sin embargo, es importante no olvidar que antes de estos métodos, tenemos otros teoremas importantes que en principio podrían ser más simples para obtener las soluciones a una cúbica o cualquier ecuación.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Completa las cuentas faltantes en la discusión del método de Cardano.
  2. Muestra que un polinomio de grado $3$ y coeficientes reales tiene exactamente cero o dos raíces complejas distintas.
  3. ¿Cuántas raíces complejas distintas puede tener un polinomio de grado $4$ con coeficientes reales? Encuentra un ejemplo para cada una de las respuestas.
  4. Encuentra las raíces del polinomio cuártico $$p(x)=x^4+2x^3-12x^2-10x+4.$$ Después, compara tu respuesta con el Ejemplo 216 del libro de Álgebra de Bravo, Rincón, Rincón.
  5. Lee las entradas en Wikipedia acerca de ecuaciones cúbicas y ecuaciones cuárticas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»