Archivo de la etiqueta: polinomios

Seminario de Resolución de Problemas: Polinomios asociados a matrices y el teorema de Cayley-Hamilton

Introducción

Para terminar esta serie de entradas de álgebra lineal, y con ello el curso de resolución de problemas, hablaremos de polinomios especiales asociados a una matriz: el polinomio mínimo y el polinomio característico. Después, hablaremos del teorema de Cayley-Hamilton, que a grandes rasgos dice que una matriz se anula en su polinomio característico.

Estos resultados forman parte fundamental de la teoría que se aprende en un curso de álgebra lineal. En resolución de problemas, ayudan mucho para entender a los eigenvalores de una matriz, y expresiones polinomiales de matrices.

Polinomio mínimo de una matriz

Podemos evaluar un polinomio en una matriz cuadrada de acuerdo a la siguiente definición.

Definición. Si A es una matriz de n\times n con entradas reales y p(x) es un polinomio en \mathbb{R}[x] de la forma

    \[p(x)=a_0+a_1x+a_2x^2+\ldots+a_nx^n,\]

definimos a la matriz p(A) como la matriz

    \[a_0I_n+a_1A+a_2A^2+\ldots+a_nA^n.\]

De manera análoga se puede dar una definición cuando las entradas de la matriz, o los coeficientes del polinomio, son números complejos.

Cuando una matriz está diagonalizada, digamos A=P^{-1}DP con P invertible y D diagonal, entonces evaluar polinomios en A es sencillo. Se tiene que p(A)=P^{-1} p(D) P, y si las entradas en la diagonal principal de D son d_1,\ldots,d_n, entonces p(D) es diagonal con entradas en la diagonal principal iguales a p(d_1),\ldots,p(d_n).

Dada una matriz A, habrá algunos polinomios p(x) en \mathbb{R}[x] para los cuales p(A)=0. Si p(x) es uno de estos, entonces cualquier eigenvalor de A debe ser raíz de p(x). Veamos un problema de la International Mathematics Competition de 2011 que usa esto. Es el Problema 2 del día 1.

Problema. Determina si existe una matriz A de 3\times 3 con entradas reales tal que su traza es cero y A^2+ {^tA} = I_3.

Sugerencia pre-solución. Busca un polinomio p(x) tal que p(A)=0.

Solución. La respuesta es que no existe dicha matriz. Procedamos por contradicción. Si existiera, podríamos transponer la identidad dada para obtener que

    \begin{align*}A&=I _3- {^t(A^2)}\\&=I_3-({^tA})^2\\&=I_3-(I_3 - A^2)^2\\&=2A^2 - A^4.\end{align*}

De aquí, tendríamos que A^4-2A^2+A = 0, de modo que cualquier eigenvalor de A debe ser una raíz del polinomio

    \[p(x)=x^4-2x^2+x=x(x-1)(x^2+x-1),\]

es decir, debe ser alguno de los números

    \[0,1,\frac{-1+\sqrt{5}}{2}, \frac{-1-\sqrt{5}}{2}.\]

Los eigenvalores de A^2 son los cuadrados de los eigenvalores de A, así que son algunos de los números

    \[0,1,\frac{3+\sqrt{5}}{2}, \frac{3-\sqrt{5}}{2}.\]

Como la traza de A es 0, la suma de sus tres eigenvalores (con multiplicidades), debe ser 0. Como la traza de A^2 es la de I_3-{ ^tA}, que es 3, entonces la suma de los eigenvalores de A al cuadrado (con multiplicidades), debe ser 0. Un sencillo análisis de casos muestra que esto no es posible.

\square

De entre los polinomios que se anulan en A, hay uno especial. El polinomio mínimo de una matriz A con entradas reales es el polinomio mónico \mu_A(x) de menor grado tal que \mu_A(A)=O_n, donde O_n es la matriz de n\times n con puros ceros. Este polinomio siempre es de grado menor o igual a n.

Una propiedad fundamental del polinomio mínimo de una matriz es que es mínimo no sólo en un sentido de grado, sino también de divisibilidad.

Teorema. Sea A una matriz de n\times n con entradas reales. Entonces para cualquier polinomio p(x) en \mathbb{R}[x] tal que p(A)=O_n, se tiene que \mu_A(x) divide a p(x) en \mathbb{R}[x].

Veamos cómo se puede usar este resultado.

Problema. La matriz A de 2\times 2 con entradas reales cumple que

    \[A^3-A^2+A=O_2.\]

Determina los posibles valores que puede tener A^2-A.

Sugerencia pre-solución. Encuentra las posibles opciones que puede tener el polinomio mínimo de A y haz un análisis de casos con respecto a esto.

Solución. La matriz A se anula en el polinomio

    \[p(x)=x^3-x^2+x=x(x^2-x+1),\]

en donde x^2-x+1 tiene discriminante negativo y por lo tanto es irreducible.

El polinomio mínimo \mu_A(x) debe ser un divisor de p(x). Además, es de grado a lo más 2. Esto nos deja con las siguientes opciones:

  • \mu_A(x)=x, de donde A=O_2, y por lo tanto A^2=O_2. De aquí, A^2-A=O_2.
  • \mu_A(x)=x^2-x+1. En este caso, tenemos que A^2-A+I_2=0. Así, A^2-A=-I_2.

Para mostrar que ambas opciones son posibles, en el primer caso usamos A=O_2 y en el segundo caso usamos

    \[A=\begin{pmatrix} 0 & -1 \\ 1 & 1 \end{pmatrix}.\]

\square

Polinomio característico de una matriz

El polinomio característico de una matriz A de n\times n se define como

    \[\chi_A(x)=\det(xI_n - A).\]

Teorema. El polinomio característico de una matriz A cumple que:

  • Es un polinomio mónico en x de grado n.
  • El coeficiente del término de grado n-1 es la traza de A.
  • El coeficiente libre es \chi_A(0)=(-1)^n\det(A).
  • Es igual al polinomio característico de cualquier matriz similar a A.

Para ver ejemplos de cómo obtener el polinomio característico y cómo usar sus propiedades, hacemos referencia a la siguiente entrada:

Propiedades del polinomio característico

En particular, para fines de este curso, es importante leer los ejemplos y problemas resueltos de esa entrada.

El teorema de Cayley-Hamilton y una demostración con densidad

Finalmente, hablaremos de uno de los resultados fundamentales en álgebra lineal.

Teorema (Cayley-Hamilton). Si A es una matriz de n\times n con entradas en \mathbb{C} y \chi_A(x) es su polinomio característico, entonces

    \[\chi_A(A)=O_n.\]

En realidad el teorema de Cayley-Hamilton es válido para matrices más generales. Daremos un esbozo de demostración sólo para matrices con entradas complejas pues eso nos permite introducir una técnica de perturbaciones.

Esbozo de demostración. Vamos a hacer la técnica de la bola de nieve, construyendo familias poco a poco más grandes de matrices que satisfacen el teorema.

Si A es una matriz diagonal, las entradas en su diagonal son sus eigenvalores \lambda_1,\ldots, \lambda_n. Por la discusión al inicio de esta entrada, \chi_A(A) es diagonal con entradas \chi_A(\lambda_1),\ldots,\chi_A(\lambda_n), y como los eigenvalores son raíces del polinomio característico, entonces todos estos valores son 0, y por lo tanto \chi_A(A)=0.

Si A es diagonalizable, digamos, de la forma A=P^{-1} D P, entonces A y D tienen el mismo polinomio característico. Por la discusión al inicio de la entrada, y por el caso anterior:

    \begin{align*}\chi_A(A) &= \chi_D(A)\\&= \chi_D(P^{-1} D P)\\&=P^{-1}\chi_D(D) P\\&=P^{-1}O_n P \\&=O_n.\end{align*}

Si A tiene todos sus eigenvalores distintos, se puede mostrar que A es diagonalizable. Ahora viene la idea clave del argumento de continuidad.

Pensemos al espacio métrico de matrices de n\times n. Afirmamos que las matrices con eigenvalores todos distintos son densas en este espacio métrico. Para ello, tomemos una matriz A. En efecto, como estamos trabajando en \mathbb{C}, existe una matriz invertible P tal que P^{-1}A P es triangular. Como P es invertible, define una transformación continua. Los eigenvalores de P^{-1} A P son sus entradas en la diagonal, y podemos perturbarlos tan poquito como queramos para hacer que todos sean distintos.

De esta forma, existe una sucesión de matrices A_k, todas ellas diagonalizables, tales que A_k \to A conforme k\to \infty. El resultado se sigue entonces de las siguientes observaciones:

  • Los coeficientes del polinomio característico de una matriz dependen continuamente de sus entradas.
  • Las entradas de potencias de una matriz dependen continuamente de sus entradas.
  • Así, la función \chi_{M}(M) es continua en la matriz variable M.

Concluimos como sigue \chi_{A_k}(A_k)=0, por ser cada una de las matrices A_k diagonalizables. Por la continuidad de \chi_{M}(M), tenemos que

    \begin{align*}\chi_A(A)&=\lim_{k\to \infty} \chi_{A_k}(A_k)\\&= \lim_{k\to \infty} O_n \\&= O_n.\end{align*}

\square

Terminamos esta entrada con un problema que usa el teorema de Cayley-Hamilton.

Problema. Muestra que para cualesquiera matrices X,Y,Z de 2\times 2 con entradas reales se cumple que

    \begin{align*}   &ZXYXY + ZYXYX + XYYXZ + YXXYZ\\= &XYXYZ + YXYXZ + ZXYYX + ZYXXY.\end{align*}

Sugerencia pre-solución. Muestra que las matrices reales de 2\times 2 de traza cero conmutan con cualquier matriz de 2\times 2.

Solución. Si A es una matriz de 2\times 2 de traza cero, su polinomio característico es

    \begin{align*}\chi_A(x)&=x^2 - \text{tr}(A) x + \det(A)\\&=x^2 + \det(A).\end{align*}

Por el teorema de Cayley-Hamilton, se satisface entonces que A^2=-\det(A) I_2, así que A^2 es un múltiplo de la identidad, y por lo tanto conmuta con cualquier matriz de 2\times 2.

La identidad que queremos mostrar se puede reescribir como

    \[Z(XY-YX)^2 = (XY-YX)^2Z.\]

La traza de XY es igual a la traza de YX, y como la traza es una transformación lineal, tenemos que

    \[\text{tr}(XY-YX)= \text{tr}(XY)-\text{tr}(YX)=0.\]

El problema se termina aplicando la discusión de arriba a la matriz

    \[A=XY-YX.\]

\square

Más problemas

Puedes encontrar más problemas relacionados con el polinomio mínimo, el polinomio característico y el teorema de Cayley-Hamilton en la Sección 8.2, 8.4 y 8.5 del libro Essential Linear Algebra de Titu Andreescu. También hay más problemas relacionados con el teorema de Cayley-Hamilton en el Capítulo 4 del libro Mathematical Bridges de Andreescu, Mortici y Tetiva.

Álgebra Superior II: Raíces de polinomios de grados 3 y 4

Introducción

Esta es la entrada final de la unidad de polinomios y del curso. En ella hablaremos acerca de las fórmulas para encontrar las raíces de polinomios de grado 3 y 4. Además, en la parte final, hablaremos de polinomios de grados más altos y cómo ellos te pueden llevar a cursos muy interesantes que puedes tomar para continuar tu formación matemática.

Existen métodos generales para encontrar las raíces de polinomios de grado 3 y 4, ya sea en \mathbb{R}[x] o en \mathbb{C}[x]. Para los polinomios de grado 3, se usa el método de Cardano. Para los polinomios de grado 4 se usa el método de Ferrari. Encontrar estas fórmulas tomó mucho tiempo. Ambas requieren de manipulaciones algebraicas muy creativas.

Raíces de polinomios de grado 3 y el método de Cardano

Tomemos un polinomio f(x) en \mathbb{R}[x] de grado 3. Si f(x) no es mónico, podemos multiplicarlo por el inverso de su coeficiente principal para obtener un polinomio con las mismas raíces. De esta forma, podemos suponer sin pérdida de generalidad que f(x) es de la forma

    \[f(x)=x^3+ax^2+bx+c.\]

Consideremos al polinomio

    \[g(x)=f\left(x-\frac{a}{3}\right).\]

Observa que r es una raíz de g(x) si y sólo si g(r)=0, si y sólo si f\left(r-\frac{a}{3}\right)=0, si y sólo si r-\frac{a}{3} es una raíz de f. De esta forma, si conocemos las raíces de g(x), podemos encontrar las de f(x), y viceversa.

Al hacer las cuentas (que quedan como tarea moral), se tiene que g(x) se simplifica a

    \begin{align*}g(x)&=f\left(x-\frac{a}{3}\right)\\&=x^3+\left(b-\frac{a^2}{3}\right)x+\left(-\frac{ba}{3}+c+\frac{2a^3}{27}\right),\end{align*}

que tiene la ventaja de ya no tener término cuadrático. En otras palabras, para encontrar las raíces de polinomio cúbico, basta con poder encontrar las de los polinomios de la forma

    \[g(x)=x^3+px+q.\]

Tomando x=u+v y haciendo las operaciones, se tiene que

    \[g(u+v)=u^3+v^3+(3uv+p)(u+v)+q.\]

Observa que si logramos encontrar u y v que satisfagan el sistema de ecuaciones

    \begin{align*}u^3+v^3&=-q\\uv&=-\frac{p}{3},\end{align*}

entonces tendríamos una raíz x=u+v.

La segunda ecuación implica u^3v^3=-\frac{p^3}{27}. Pero entonces conocemos la suma y el producto de las variables u^3 y v^3, con lo cual obtenemos que son las raíces del siguiente polinomio de grado 2 en la variable t:

    \begin{align*}(t-u^3)(t-v^3)&=t^2-(u^3+v^3)t+u^3v^3\\&=t^2+qt-\frac{p^3}{27}.\end{align*}

El discriminante de esta ecuación cuadrática es

    \[\Delta = q^2 + \frac{4p^3}{27}.\]

Si \Delta >0, esta ecuación cuadrática tiene las siguientes soluciones reales:

    \begin{align*}\sqrt[3]{-\frac q2 + \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}}\\\sqrt[3]{-\frac q2 - \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}}.\end{align*}

Sin pérdida de generalidad, u es la primera y v la segunda. De esta forma, una raíz real para g(x) es

    \[x= \sqrt[3]{-\frac q2 + \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}} + \sqrt[3]{-\frac q2 - \sqrt {\frac {q^2}{4} +\frac {p^3}{27}}}.\]

Hasta aquí hay algunas cosas por notar:

  • Supusimos que el discriminante \Delta es positivo.
  • Sólo hemos encontrado una de las 3 raíces de p(x) que garantiza el teorema fundamental del álgebra.

Cuando el discriminante es positivo, las otras dos soluciones son \omega x y \omega^2 x, en donde \omega es una raíz cúbica primitiva de la unidad.

Cuando la cuadrática tiene discriminante \Delta<0, tenemos que u y v son complejos, y entonces al sacar raíz cúbica podemos tener tres opciones para cada uno, algo que parecería dar un total de 9 soluciones. Sin embargo, recordando que uv=-\frac{p}{3}, tenemos que u queda totalmente determinado por v, así que de ahí se obtienen las tres soluciones.

Raíces de polinomios de grado 4 y el método de Ferrari

El método de Ferrari está explicado a detalle en el libro de Álgebra de Bravo, Rincón y Rincón. Ahí están las ideas principales para encontrar una fórmula general para encontrar las raíces de un polinomio de grado 4, es decir, de la forma

    \[p(x)=ax^4+bx^3+cx^2+dx+e.\]

Recuerda que el libro está disponible para descarga gratuita.

Al igual que en el caso del método de Ferrari, los primeros pasos consisten en hacer simplificaciones algebraicas. Así como el método de Cardano usa la fórmula cuadrática, del mismo modo el método de Ferrari reduce el problema a encontrar soluciones a un polinomio de grado 3. Uno podría creer que este patrón se repite, y que se pueden encontrar métodos para polinomios de grado arbitrario. Esto no es así, y lo platicaremos en la siguiente sección.

Para otra derivación de la fórmula de Ferrari, compartimos el artículo «Identidades para la resolución de ecuaciones cúbicas y cuárticas» de José Leonardo Sáenz Cetina, que apareció en el número 24 de la revista Miscelánea Matemática de la Sociedad Matemática Mexicana:

Este documento también tiene otras dos formas de resolver ecuaciones cúbicas, así que es una lectura recomendada.

Finalmente, se recomienda también echarle un ojo a la página de Wikipedia acerca de la ecuación cuártica. La entrada en inglés es mucho mejor. Sobre todo la sección referente al método de Ferrari.

Raíces de polinomios de grado 5 y más

De acuerdo al teorema fundamental del álgebra, todo polinomio sobre los complejos tiene al menos una raíz. De hecho, se puede mostrar que si es de grado n, entonces tiene exactamente n raíces, contando multiplicidades.

Cuando tenemos polinomios de grados 2, 3 y 4 podemos usar la fórmula cuadrática, el método de Cardano y el método de Ferrari para encontrar una fórmula para las soluciones. ¿Hay algún método que tenga fórmulas similares para polinomios de grado más grande?

La respuesta es que no. Aunque el teorema fundamental del álgebra garantice la existencia de las raíces, hay un teorema de Abel y Ruffini que muestra que no es posible encontrar una fórmula general. Al menos no una que ayude a poner las raíces de cualquier polinomio de grado cinco (o más) usando únicamente sumas, restas, multiplicaciones, divisiones y raíces. Esto formalmente se enuncia como que hay ecuaciones de grado 5 y más que no son solubles por radicales.

Enunciar y demostrar este teorema formalmente requiere de herramientas que quedan fuera del alcance de este curso, sin embargo, se puede estudiar en un curso avanzado de álgebra, en donde se hable de extensiones de campo y teoría de Galois.

Por otro lado, podemos dejar de lado la exactitud y preguntarnos si, dado un polinomio, podemos acercarnos a sus raíces tanto como queramos. Hoy en día eso se hace mediante métodos computacionales. Aunque la computadora sea muy buena haciendo cuentas, hay que ser particularmente cuidadoso con los errores que comete al hacer aproximaciones.

Eso es otra de las cosas que quedan fuera del alcance de este curso, y que puedes estudiar en un buen curso de métodos numéricos. Si lo que buscar es saber cómo pedirle a la computados que haga los cálculos, eso lo puedes aprender en un buen curso de programación, en donde te enseñen a usar ambientes de computación científica.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Completa las cuentas faltantes en la discusión del método de Cardano.
  • Muestra que un polinomio de grado 3 y coeficientes reales tiene exactamente cero o dos raíces complejas distintas.
  • ¿Cuántas raíces complejas distintas puede tener un polinomio de grado 4 con coeficientes reales? Encuentra un ejemplo para cada una de las respuestas.
  • Encuentra las raíces del polinomio cuártico

        \[p(x)=x^4+2x^3-12x^2-10x+4.\]

    Después, compara tu respuesta con el Ejemplo 216 del libro de Álgebra de Bravo, Rincón, Rincón.
  • Lee las entradas en Wikipedia acerca de ecuaciones cúbicas y ecuaciones cuárticas.

Álgebra Superior II: El criterio de la raíz racional para polinomios de coeficientes enteros

Introducción

En esta entrada veremos el criterio de la raíz racional. Este es un método que nos permite determinar las únicas raíces racionales que puede tener un polinomio con coeficientes enteros. Es una más de las herramientas que podemos usar cuando estamos estudiando polinomios en \mathbb{R}[x].

Si encontramos una raíz con este método, luego podemos encontrar su multiplicidad mediante el teorema de derivadas y multiplicidad. Esto puede ayudarnos a factorizar el polinomio. Otras herramientas que hemos visto que nos pueden ayudar son el algoritmo de Euclides, la fórmula cuadrática, el teorema del factor y propiedades de continuidad y diferenciabilidad de polinomios.

El criterio de la raíz racional

Si un polinomio p(x) en \mathbb{R}[x] cumple que todos sus coeficientes son números enteros, entonces decimos que es un polinomio sobre los enteros. Al conjunto de polinomios sobre los enteros se le denota \mathbb{Z}[x].

Teorema (criterio de la raíz racional). Tomemos un polinomio p(x) en \mathbb{Z}[x] de la forma

    \[p(x)=a_0+a_1x+\ldots+a_nx^n.\]

Supongamos que el número \frac{p}{q} es número racional simplificado, es decir con p y q\neq 0 enteros primos relativos. Si \frac{p}{q} es raíz de p(x), entonces p divide a a_0, y q divide a a_n.

Demostración. Por definición, si \frac{p}{q} es una raíz, tenemos que

    \[0=a_0+a_1\cdot \frac{p}{q} + \ldots + a_n \cdot \frac{p^n}{q^n}.\]

Multiplicando ambos lados de esta igualdad por q^n, tenemos que

    \[0=a_0q^n+a_1pq^{n-1}+\ldots+a_{n-1}p^{n-1}q+a_np^n.\]

Despejando a_0q^n, tenemos que

    \begin{align*}a_0q^n&=-(a_1pq^{n-1}+\ldots+a_{n-1}p^{n-1}q+a_np^n)\\&=-p(a_1q^{n-1}+\ldots+a_{n-1}p^{n-2}q+a_np^{n-1})\end{align*}

Esto muestra que a_0q^n es múltiplo de p. Pero como \MCD{p,q}=1, tenemos que p debe dividir a a_0.

De manera similar, tenemos que

    \begin{align*}a_np^n&=-(a_0q^n+a_1pq^{n-1}+\ldots+a_{n-1}p^{n-1}q)\\&=-q(a_0q^{n-1}+a_1pq^{n-2}+\ldots+a_{n-1}p^{n-1}).\end{align*}

De aquí, q divide a a_np^n, y como \MCD{p,q}=1, entonces q divide a a_n.

\square

Como cualquier natural tiene una cantidad finita de divisores, el criterio de la raíz racional nos permite restringir la cantidad posible de raíces de un polinomio con coeficientes enteros a una cantidad finita de candidatos. Veamos un par de ejemplos.

Aplicación directa del criterio de la raíz racional

Ejercicio. Usa el criterio de la raíz racional para enlistar a todos los posibles números racionales que son candidatos a ser raíces del polinomio

    \[h(x)=2x^3-x^2+12x-6.\]

Después, encuentra las raíces racionales de p(x).

Solución. El polinomio h(x) tiene coeficientes enteros, así que podemos usar el criterio de la raíz racional. Las raíces racionales son de la forma \frac{p}{q} con p divisor de -6, con q divisor de 2 y además \MCD{p,q}=1. Los divisores enteros de -6 son

    \[-6,-3,-2,-1,1,2,3,6.\]

Los divisores enteros de 2 son

    \[-2,-1,1,2.\]

Pareciera que hay muchas posibilidades por considerar. Sin embargo, nota que basta ponerle el signo menos a uno de p o q para considerar todos los casos. Así, sin pérdida de generalidad, q>0. Si q=1, obtenemos a los candidatos

    \[-6,-3,-2,-1,1,2,3,6.\]

Si q=2, por la condición de primos relativos basta usar los valores -3,-1,1,3 para p. De aquí, obtenemos al resto de los candidatos

    \[-\frac{3}{2},-\frac{1}{2},\frac{1}{2},\frac{3}{2}.\]

En el peor de los casos, ya solo bastaría evaluar el polinomio en estos 12 candidatos para determinar si son o no son raíz. Sin embargo, a veces podemos hacer algunos trucos para disminuir todavía más la lista.

Observa que si evaluamos

    \[h(x)=2x^3-x^2+12x-6\]

en un número negativo, entonces la expresión quedará estrictamente negativa, así que ninguno de los candidatos negativos puede ser raíz. De este modo, sólo nos quedan los candidatos

    \[1,2,3,6,\frac{1}{2},\frac{3}{2}.\]

Si evaluamos en x=2 o x=6, entonces la parte de la expresión 2x^3-x^2+12x es múltiplo de 4, pero -6 no. De esta forma, h(x) no sería un múltiplo de 4, y por lo tanto no puede ser 0. Si evaluamos en x=1 o x=3, tendríamos que la parte de la expresión 2x^3+12x-6 sería par, pero -x^2 sería impar, de modo que h(x) sería impar, y no podría ser cero. Así, ya sólo nos quedan los candidatos

    \[\frac{1}{2},\frac{3}{2}.\]

Para ellos ya no hagamos trucos, y evaluemos directamente. Tenemos que

    \begin{align*}h\left(\frac{1}{2}\right) &= 2\cdot \frac{1}{8} - \frac{1}{4} + 12 \cdot \frac{1}{2}-6\\&=\frac{1}{4}-\frac{1}{4}+6-6\\&=0.\end{align*}

y que

    \begin{align*}h\left(\frac{3}{2}\right) &= 2\cdot \frac{27}{8} - \frac{9}{4} + 12 \cdot \frac{3}{2}-6\\&=\frac{27}{4}-\frac{9}{4}+18-6\\&=\frac{9}{2}+12\\&=\frac{33}{2}.\end{align*}

Habiendo considerado todos los casos, llegamos a que la única raíz racional de h(x) es \frac{1}{2}.

\square

Aplicación indirecta del criterio de la raíz racional

El criterio de la raíz racional lo podemos usar en algunos problemas, aunque en ellos no esté escrito un polinomio de manera explícita.

Problema. Muestra que \sqrt[7]{13} no es un número racional.

Solución. Por definición, el número \sqrt[7]{13} es el único real positivo r que cumple que r^7=13. Se puede mostrar su existencia usando que la función f:\mathbb{R}\to\mathbb{R} dada por f(x)=x^7 es continua, que f(0)=0, que f(2)=128, y aplicando el teorema del valor intermedio. Se puede mostrar su unicidad mostrando que la función f es estrictamente creciente en los reales positivos. Lo que tenemos que mostrar es que este número real no es racional.

Si consideramos el polinomio p(x)=x^7-13, tenemos que p(r)=r^7-13=0, de modo que r es raíz de p(x). Así, para terminar el problema, basta mostrar que p(x) no tiene raíces racionales.

El polinomio p(x) tiene coeficientes enteros, así que podemos aplicarle el criterio de la raíz racional. Una raíz racional tiene que ser de la forma \frac{p}{q} con p divisor de -13 y q divisor de 1.

Sin perder generalidad, q>0, así que q=1. De esta forma, los únicos candidatos a ser raíces racionales de p(x) son -13,-1,1,13. Sin embargo, una verificación de cada una de estas posibilidades muestra que ninguna de ellas es raíz de p(x). Por lo tanto, p(x) no tiene raíces racionales, lo cual termina la solución del problema.

\square

Aplicación en polinomio con coeficientes racionales

A veces un polinomio tiene coeficientes racionales, por ejemplo,

    \[r(x)=\frac{x^3}{2}+\frac{x^2}{3}-4x-1.\]

A un polinomio con todos sus coeficientes en \mathbb{Q} se les conoce como polinomio sobre los racionales y al conjunto de todos ellos se le denota \mathbb{Q}[x]. Para fines de encontrar raíces racionales, los polinomios en \mathbb{Q}[x] y los polinomios en \mathbb{Z}[x] son muy parecidos.

Si tenemos un polinomio q(x) en \mathbb{Q}[x], basta con multiplicar por el mínimo común múltiplo de los denominadores de los coeficientes para obtener un polinomio p(x) con coeficientes enteros. Como q(x) y p(x) varían sólo por un factor no cero, entonces tienen las mismas raíces. Por ejemplo, el polinomio r(x) de arriba tiene las mismas raíces que el polinomio

    \[s(x)=6r(x)=3x^3+2x^2-24x-6.\]

A este nuevo polinomio se le puede aplicar el criterio de la raíz racional para encontrar todas sus raíces racionales.

Ejemplo. Consideremos el polinomio

    \[q(x)=x^3+\frac{x^2}{3}+5x+\frac{5}{3}.\]

Vamos a encontrar todos los candidatos a raíces racionales. Para ello, notamos que q(x) y p(x):=3q(x) varían sólo por un factor multiplicativo no nulo y por lo tanto tienen las mismas raíces. El polinomio

    \[p(x)=3x^3+x^2+15x+5\]

tiene coeficientes enteros, así que los candidatos a raíces racionales son de la forma \frac{a}{b} con a y b primos relativos, a\mid 5 y b\mid 3. Sin pérdida de generalidad b>0.

Los divisores de 5 son -5,-1,1,5. Los divisores positivos de 3 son 1 y 3. De esta forma, los candidatos a raíces racionales son

    \[-5,-1,1,5,-\frac{5}{3},-\frac{1}{3},\frac{1}{3},\frac{5}{3}.\]

Si ponemos un número positivo en p(x), como sus coeficientes son todos positivos, tenemos que la evaluación sería positiva, así que podemos descartar estos casos. Sólo nos quedan los candidatos

    \[-5,-1,-\frac{5}{3},-\frac{1}{3}.\]

La evaluación en -5 da

    \begin{align*}-3\cdot 125 + 25 - 15\cdot 5 +5&=-375+25-75+5\\&=-295,\end{align*}

así que -5 no es raíz.

La evaluación en -1 da

    \begin{align*}-3+1-15+5=-12,\end{align*}

así que -1 tampoco es raíz.

Como tarea moral, queda verificar que -\frac{5}{3} tampoco es raíz, pero que -\frac{1}{3} sí lo es.

\square

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Realiza las evaluaciones que faltan en el último ejemplo.
  • Determina las raíces racionales del polinomio

        \[x^7-6x^4+3x^3+18x-1.\]

  • Muestra que \sqrt[3]{12} no es un número racional.
  • Encuentra todos los candidatos a ser raíces racionales de

        \[x^3+\frac{2x^2}{3}-7x-\frac{14}{3}.\]

    Determina cuáles sí son raíces.
  • Puede que un polinomio en \mathbb{Z}[x] no tenga raíces racionales, pero que sí se pueda factorizar en \mathbb{Z}[x]. Investiga acerca del criterio de irreducibilidad de Eisenstein.

Álgebra Superior II: El teorema de derivadas y multiplicidad

Introducción

En entradas anteriores definimos qué quiere decir que un real sea una raíz de un polinomio. Luego, vimos que mediante el teorema del factor se puede definir una relación entre las raíces de un polinomio y los polinomios lineales que lo dividen. Sin embargo, es posible que un real sea una raíz de un polinomio «más de una vez», que fue un concepto que formalizamos en la entrada de desigualdades de polinomios. En esta entrada veremos que a través de las derivadas de polinomios, podemos determinar la multiplicidad de sus raíces.

Como recordatorio, la multiplicidad de una raíz r de un polinomio p(x) en \mathbb{R}[x] es el mayor entero m tal que (x-r)^m divide a p(x) en \mathbb{R}[x]. También, en esta entrada haremos uso de la regla del producto para derivadas.

El teorema de derivadas y multiplicidad

El siguiente resultado es fundamental para la detección de raíces múltiples. Su demostración es sencilla pues usamos varios de los resultados que hemos obtenido anteriormente.

Teorema (derivadas y multiplicidad). Sea r una raíz del polinomio p(x) en \mathbb{R}[x] de multiplicidad m. Si m>1, entonces r es una raíz de la derivada p'(x), y es de multiplicidad m-1. Si m=1, entonces r no es raíz de p'(x).

Demostración. Como r es una raíz de p(x) de multiplicidad m, entonces se puede escribir p(x)=(x-r)^m q(x), en donde q(x) es un polinomio que ya no es divisible entre x-r. Derivando, por regla del producto tenemos que

    \begin{align*}p'(x)&=m(x-r)^{m-1}q(x) + (x-r)^m q'(x)\\&=(x-r)^{m-1}(mq(x)+(x-r)q'(x)).\end{align*}

Afirmamos que x-r no divide a mq(x)+(x-r)q'(x). Si lo dividiera, como divide a (x-r)q'(x) entonces también tendría que dividir a mq(x) y por lo tanto a q(x). Pero esto sería una contradicción con la elección de q(x).

De esta forma, si m=1 entonces x-r no divide a p'(x) y por el teorema del factor entonces r no es raíz de p'(x). Y si m>1, entonces (x-r)^{m-1} divide a p'(x) por la expresión que encontramos de la derivada, pero (x-r)^m no pues x-r no divide al segundo factor. Esto termina la prueba.

\square

Ejemplo. Consideremos al polinomio p(x)=(x-3)^3(x+1). Tanto 3 como -1 son raíces de p(x). La multiplicidad de la raíz 3 es tres y la multiplicidad de la raíz -1 es uno. Si derivamos a p(x) usando la regla del producto, tenemos que

    \begin{align*}p'(x)&=3(x-3)^2(x+1)+(x-3)^3\\&=3(x-3)^2(x+1+x-3)\\&=3(x-3)^2(2x-2)\\&=6(x-3)^2(x-1)\end{align*}

Observa que p'(x) en efecto tiene a 3 como raíz de multiplicidad dos y ya no tiene a 1 como raíz.

\square

Es muy importante respetar la hipótesis de que r sea raíz de p(x). Por ejemplo, en el ejemplo anterior 1 es raíz de p'(x) de multiplicidad 1, pero 1 no es raíz de p(x) (y mucho menos de multiplicidad 2).

El teorema de derivadas y multiplicidad es interesante, pero todavía no es útil en aplicaciones prácticas. Sin embargo, tiene dos consecuencias que sí se pueden usar para estudiar polinomios concretos.

Encontrar la multiplicidad de una raíz

El teorema de derivadas y multiplicidad nos dice que la multiplicidad de una raíz «baja en uno» al pasar de un polinomio a su derivada, pero aún no nos dice cuál es esa multiplicidad. Sin embargo, lo podemos aplicar repetidamente para obtener esta información. Recuerda que para k un entero no negativo y p(x) en \mathbb{R}[x], usamos p^{(k)}(x) para denotar k-ésima derivada de un polinomio. Aquí p^{(0)}(x) es simplemente p(x).

Proposición. Sea r una raíz del polinomio p(x) en \mathbb{R}[x] de multiplicidad m. Si k el mayor entero positivo tal que r es raíz de

    \[p^{(0)}(x), p^{(1)}(x),\ldots,p^{(k)}(x),\]

entonces m=k+1.

Demostración. Usando el teorema anterior de manera inductiva, tenemos que para cada entero 0\leq \ell<m, se tiene que r es raíz de multiplicidad m-\ell de p^{(\ell)}(x) En particular, es raíz de todas estas derivadas. Además, por el mismo teorema, se tiene que r ya no es raíz de p^{(m)}(x). De esta forma, tenemos que k=m-1, de donde se obtiene el resultado deseado.

\square

La proposición anterior ahora sí nos da una manera de encontrar la multiplicidad de una raíz de un polinomio.

Ejemplo. Sabiendo que 3 es una raíz del polinomio

    \[p(x)=x^5-9x^4+28x^3-36x^2+27x-27,\]

vamos a encontrar su multiplicidad.

Para esto, vamos a calcular sus derivadas:

    \begin{align*}p'(x)&=5x^4-36x^3+84x^2-72x+27\\p''(x)&=20x^3-108x^2+168x-72\\p^{(3)}(x)&=60x^2-216x+168\\p^{(4)}(x)&=120x-216\\p^{(5)}(x)&=120\\p^{(6)}(x)&=0\end{align*}

Tenemos que

    \begin{align*}p'(3)&=5\cdot 81 - 36 \cdot 27 +84 \cdot 9 -72\cdot 3 + 27\\&=405-972+756-216+27\\&=0.\end{align*}

Hasta aquí, sabemos que 3 es raíz de multiplicidad al menos dos. Tenemos también que

    \begin{align*}p''(3)(3)&=20\cdot 27-108\cdot 9 +168 \cdot 3 - 72\\&=540-972+504-72\\&=0.\end{align*}

Hasta aquí, sabemos que 3 es raíz de multiplicidad al menos tres. Siguiendo,

    \begin{align*}p^{(3)}&=60\cdot 9-216\cdot 3 +168\\&=720-648+168\\&=240.\end{align*}

Como la tercera derivada ya no se anuló en 3, la multiplicidad de 3 como raíz es exactamente tres.

\square

Es importante que revisemos todas las derivadas, y que sea una por una. En el ejemplo anterior, p^{(6)}(3)=0, pero eso no quiere decir que 3 sea raíz de multiplicidad 7, pues la evaluación falla desde la tercera derivada.

Simplificar un polinomio para encontrarle sus raíces

Hay otra consecuencia práctica del teorema de multiplicidades y derivadas, que puede ser de utilidad en algunos problemas. Recuerda que para polinomios p(x) y q(x) en \mathbb{R}[x] usamos \MCD{p(x),q(x)} para denotar al máximo común divisor de dos polinomios. En particular, divide a p(x) en \mathbb{R}[x], de modo que

    \[\frac{p(x)}{\MCD{p(x),q(x)}}\]

es un polinomio en \mathbb{R}[x].

Proposición. Sea p(x) un polinomio en \mathbb{R}[x] y p'(x) su derivada. El polinomio

    \[q(x):=\frac{p(x)}{\MCD{p(x),p'(x)}}\]

es un polinomio en \mathbb{R}[x], con las mismas raíces reales que p(x), pero todas ellas tienen multiplicidad 1.

Demostración. Factoricemos a todas las raíces reales de p(x) con sus multiplicidades correspondientes para escribir

    \[p(x)=(x-r_1)^{m_1}\cdot \ldots \cdot (x-r_n)^{m_n} r(x),\]

en donde r(x) ya no tiene raíces reales. De acuerdo al teorema de derivadas y multiplicidad, podemos escribir

    \[p'(x)=(x-r_1)^{m_1-1}\cdot \ldots \cdot (x-r_n)^{m_n-1} s(x),\]

en donde ningún x-r_i divide a s(x). Es sencillo entonces mostrar, y queda como tarea moral, que \MCD{p(x),p'(x)} es

    \[(x-r_1)^{m_1-1}\cdot \ldots \cdot (x-r_n) \cdot \MCD{r(x),s(x)}.\]

A partir de esto, concluimos que

    \begin{align*}q(x)&=\frac{p(x)}{\MCD{p(x),p'(x)}}\\&= (x-r_1)\cdot \ldots \cdot (x-r_n) \cdot \frac{r(x)}{\MCD{r(x),s(x)}}.\end{align*}

De aquí se ve que r_1,\ldots,r_n son raíces de multiplicidad 1 de q(x). No hay más raíces reales en \frac{r(x)}{\MCD{r(x),s(x)}}, pues si hubiera una raíz \alpha, entonces por el teorema del factor x-\alpha dividiría a este polinomio, y por lo tanto a r(x), de donde \alpha sería raíz de r(x), una contradicción.

\square

La proposición anterior se puede usar de manera práctica como sigue:

  • Para empezar, tomamos un polinomio arbitrario p(x).
  • Luego, lo derivamos para obtener p'(x).
  • Después, usando el algoritmo de Euclides, encontramos al polinomio \MCD{p(x),q(x)}.
  • Ya con el máximo común divisor, hacemos división polinomial para encontrar q(x)=\frac{p(x)}{\MCD{p(x),q(x)}}.
  • Si p(x) tenía raíces repetidas, entonces ahora q(x) será de grado menor, y quizás más fácil de estudiar. Encontramos las raíces de q(x). Estas son las raíces de f(x).
  • Finalmente, usamos el teorema de la sección anterior para encontrar la multiplicidad de cada raíz.

Veamos un problema interesante en el que se conjuntan varias ideas de esta entrada.

Problema. Factoriza en \mathbb{R}[x] al polinomio

    \[-x^5+5x^4+5x^3-45x^2+108.\]

Solución. Este es un polinomio de grado cinco, para el cual hasta antes de ahora no teníamos muchas herramientas para estudiarlo. Vamos a aplicar el método explicado arriba. Lo primero que haremos es factorizar un -1 para volver este polinomio mónico. Recordaremos poner este signo al final. Tomemos entonces

    \[p(x)=x^5-5x^4-5x^3+45x^2-108.\]

Su derivada es

    \[p'(x)=5x^4-20x^3+15x^2+90x,\]

Se puede verificar, y queda como tarea moral, que el máximo común divisor de p(x) y p'(x) es el polinomio

    \[M(x)=x^3-4x^2-3x+18.\]

Haciendo la división polinomial, tenemos que

    \[\frac{p(x)}{M(x)}=x^2-x-6=(x+2)(x-3).\]

Como este polinomio tiene las mismas raíces que p(x), concluimos que -2 y 3 son las raíces de p(x).

Usando la proposición para multiplicidades de raíces (que también queda como tarea moral), se puede verificar que -2 es raíz de multiplicidad dos y que 3 es raíz de multiplicidad 3. Como p(x) es un polinomio de grado 5 y es mónico, entonces se debe de dar la igualdad

    \[p(x)=(x+2)^2(x-3)^3.\]

Al regresar al polinomio original, debemos agregar un signo menos. Concluimos que la factorización del polinomio del problema es

    \[-(x+2)^2(x-3)^3.\]

\square

Esta proposición nos da una manera de encontrar raíces. En las siguientes dos entradas veremos otras dos formas de encontrarlas. Para cuando los polinomios son de grado 3 y 4, podemos encontrar las raíces de manera explícita. Para cuando los polinomios tienen coeficientes enteros, podemos encontrar una cantidad finita de candidatos a ser raíces racionales.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Verifica que 1 es raíz del polinomio

        \[x^8-x^7-9x^6+19x^5+5x^4-51x^3+61x^2-31x+6\]

    y encuentra su multiplicidad.
  • En la demostración de la última proposición, muestra la igualdad

        \[\MCD{p(x),p'(x)}=(x-r_1)^{m_1-1}\cdot \ldots \cdot (x-r_n) \MCD{r(x),s(x)}.\]

  • En el último ejemplo, aplica el algoritmo de Euclides a p(x) y p'(x) para mostrar que el máximo común divisor es el que se afirma.
  • Aplica la proposición de multiplicidad de raíces en el último ejemplo para verificar que en efecto las multiplicidades de 2 y 3 son las que se afirman.
  • Aplica el mismo método que en la última sección para factorizar el polinomio

        \[x^6+8x^5+18x^4-4x^3-47x^2-12x+36.\]

Álgebra Lineal I: Propiedades del polinomio característico

Introducción

En esta entrada continuamos con el estudio de eigenvalores y eigenvectores de matrices y trasformaciones lineales. Para ello, estudiaremos más a profundidad el polinomio característico.

Como recordatorio, en una entrada pasada demostramos que si A es una matriz en M_n(F), entonces la expresión \det (\lambda I_n - A) es un polinomio en \lambda de grado n con coeficientes en F. A partir de ello, definimos el polinomio característico de A como

    \[\chi_A(\lambda)=\det(\lambda I_n - A).\]

En esta entrada probaremos algunas propiedades importantes del polinomio característico de matrices. Además, hablaremos de la multiplicidad algebraica de los eigenvalores. Finalmente enunciaremos sin demostración dos teoremas fundamentales en álgebra lineal: el teorema de caracterización de matrices diagonalizables y el teorema de Cayley-Hamilton.

Las raíces del polinomio característico son los eigenvalores

Ya vimos que las raíces del polinomio característico son los eigenvalores. Pero hay que tener cuidado. Deben ser las raíces que estén en el campo en el cual la matriz esté definida. Veamos un ejemplo más.

Problema. Encuentra el polinomio característico y los eigenvalores de la matriz

    \begin{align*}\begin{pmatrix}0&1&0&0\\2&0&-1&0\\0& 7 & 0 & 6\\0 & 0 & 3 & 0\end{pmatrix}.\end{align*}

Solución. Debemos encontrar las raíces del polinomio dado por el siguiente determinante:

    \begin{align*}\begin{vmatrix}\lambda&-1&0&0\\-2&\lambda&1&0\\0& -7 & \lambda & -6\\0 & 0 & -3 & \lambda\end{vmatrix}.\end{align*}

Haciendo expansión de Laplace en la primer columna, tenemos que este determinante es igual a

    \begin{align*}\lambda\begin{vmatrix}\lambda&1&0\\ -7 & \lambda & -6\\ 0 & -3 & \lambda\end{vmatrix}+2\begin{vmatrix}-1&0&0\\-7 & \lambda & -6\\0 & -3 & \lambda\end{vmatrix}.\end{align*}

Para calcular los determinantes de cada una de las matrices de 3\times 3 podemos aplicar la fórmula por diagonales para obtener:

    \begin{align*}\lambda\begin{vmatrix}\lambda&1&0\\-7 & \lambda & -6\\0 & -3 & \lambda\end{vmatrix}&=\lambda(\lambda^3-18\lambda+7\lambda)\\&=\lambda(\lambda^3-11\lambda)\\&=\lambda^4-11\lambda^2\end{align*}

y

    \begin{align*}2\begin{vmatrix}-1&0&0\\-7 & \lambda & -6\\0 & -3 & \lambda\end{vmatrix}&=2(-\lambda^2+18)\\&=-2\lambda^2+36.\end{align*}

Concluimos que el polinomio característico es

    \begin{align*}\lambda^4-13\lambda^2+36&=(\lambda^2-4)(\lambda^2-9)\\&=(\lambda+2)(\lambda-2)(\lambda+3)(\lambda-3).\end{align*}

De esta factorización, las raíces del polinomio (y por lo tanto los eigenvalores que buscamos) son -2,2,-3,3.

Si quisiéramos encontrar un eigenvector para, por ejemplo, el eigenvalor -2, tenemos que encontrar una solución no trivial al sistema lineal de ecuaciones homogéneo

    \[(-2I_n-A)X=0.\]

\square

Propiedades del polinomio característico

Veamos ahora algunas propiedades importantes del polinomio característico. El primer resultado habla del polinomio característico de matrices triangulares superiores. Un resultado análogo se cumple para matrices inferiores, y su enunciado y demostración quedan como tarea moral.

Proposición. Si A=[a_{ij}] es una matriz triangular superior en M_n(F), entonces su polinomio característico es

    \[\chi_A(\lambda)=\prod_{i=1}^n (\lambda-a_{ii}).\]

Demostración. Como A es triangular superior, entonces \lambda I_n -A también, y sus entradas diagonales son precisamente \lambda-a_{ii} para i=1,\ldots,n. Como el determinante de una matriz diagonal es el producto de sus entradas en la diagonal, tenemos que

    \[\chi_A(\lambda)=\prod_{i=1}^n (\lambda-a_{ii}).\]

\square

Como el polinomio característico es un determinante, podemos aprovechar otras propiedades de determinantes para obtener otros resultados.

Proposición. Una matriz y su transpuesta tienen el mismo polinomio característico.

Demostración. Sea A una matriz en M_n(F). Una matriz y su transpuesta tienen el mismo determinante. Además, transponer es una transformación lineal. De este modo:

    \begin{align*}\chi_A(\lambda)&=\det(\lambda I_n - A)\\&=\det({^t(\lambda I_n-A)})\\&=\det(\lambda({^tI_n})-{^tA})\\&=\det(\lambda I_n - {^tA})\\&=\chi_{^tA}(\lambda).\end{align*}

\square

Ya antes habíamos mostrado que matrices similares tienen los mismos eigenvalores, pero que dos polinomios tengan las mismas raíces no necesariamente implica que sean iguales. Por ejemplo, los polinomios

    \[(x-1)^2(x+1) \quad \text{y} \quad (x+1)^2(x-1)\]

tienen las mismas raíces, pero no son iguales.

De esta forma, el siguiente resultado es más fuerte de lo que ya habíamos demostrado antes.

Proposición. Sean A y P matrices en M_n(F) con P invertible. Entonces A y P^{-1}AP tienen el mismo polinomio característico.

Demostración. El resultado se sigue de la siguiente cadena de igualdades, en donde usamos que \det(P)\det(P^{-1})=1 y que el determinante es multiplicativo:

    \begin{align*}\chi_{P^{-1}AP}(\lambda) &= \det(P) \chi_{P^{-1}AP}(\lambda) \det(P)^{-1}\\&=\det(P) \det(\lambda I_n - P^{-1}AP) \det(P^{-1})\\&=\det(P(\lambda I_n - P^{-1}AP)P^{-1})\\&=\det(\lambda PP^{-1}-PP^{-1}APP^{-1})\\&=\det(\lambda I_n - A)\\&=\chi_{A}(\lambda)\end{align*}

\square

Ten cuidado. El determinante es multiplicativo, pero el polinomio característico no es multiplicativo. Esto es evidente por el siguiente argumento. Si A y B son matrices en M_n(F), entonces \chi_A(\lambda) y \chi_B(\lambda) son cada uno polinomios de grado n, así que su producto es un polinomio de grado 2n, que por lo tanto no puede ser igual al polinomio característico \chi_{AB}(\lambda) pues este es de grado n. Así mismo, \chi_{A^2}(\lambda) no es \chi_{A}(\lambda)^2.

Una última propiedad que nos interesa es mostrar que el determinante de una matriz y su traza aparecen en los coeficientes del polinomio característico.

Teorema. Sea A una matriz en M_n(F) y \chi_A(\lambda) su polinomio característico. Entonces \chi_{A}(\lambda) es de la forma

    \[\lambda^n-(\text{tr} A) \lambda^{n-1}+\ldots+(-1)^n \det A.\]

Demostración. Tenemos que mostrar tres cosas:

  • El polinomio \chi_{A} es mónico, es decir, tiene coeficiente principal 1,
  • que el coeficiente del término de grado n-1 es \text{tr} A y
  • el coeficiente libre es (-1)^n \det A.

El coeficiente libre de un polinomio es su evaluación en cero. Usando la homogeneidad del determinante, dicho coeficiente es:

    \begin{align*}\chi_A(0)&=\det(0\cdot I_n-A)\\&=\det(-A)\\&=(-1)^n\det(A).\end{align*}

Esto muestra el tercer punto.

Para el coeficiente del término de grado n-1 y el coeficiente principal analicemos con más detalle la fórmula del determinante

    \begin{align*}\begin{vmatrix}\lambda - a_{11} & -a_{12} & \ldots & -a_{1n}\\-a_{21} & \lambda - a_{22} & \ldots & -a_{1n}\\\vdots & & \ddots & \\-a_{n1} & -a_{n2} & \ldots & \lambda - a_{nn}\end{vmatrix}\end{align*}


en términos de permutaciones.

Como discutimos anteriormente, la única forma de obtener un término de grado n es cuando elegimos a la permutación identidad. Pero esto también es cierto para términos de grado n-1, pues si no elegimos a la identidad, entonces la permutación elige por lo menos dos entradas fuera de la diagonal, y entonces el grado del producto de entradas correspondiente es a lo más n-2.

De este modo, los únicos términos de grado n y n-1 vienen del producto

    \[(\lambda-a_{11})\cdot\ldots\cdot(\lambda-a_{nn}).\]

El único término de grado n viene de elegir \lambda en todos los factores, y se obtiene el sumando \lambda^n, lo cual muestra que el polinomio es mónico.

Los únicos términos de grado n-1 se obtienen de elegir \lambda en n-1 factores y un término del estilo -a_{ii}. Al considerar todas las opciones, el término de grado n-1 es

    \[-(a_{11}+a_{22}+\ldots+a_{nn})\lambda^{n-1}=-(\text{tr} A) \lambda^{n-1},\]

que era lo último que debíamos mostrar.

\square

Ejemplo. El teorema anterior muestra que si A es una matriz en M_2(F), es decir, de 2\times 2, entonces

    \[\chi_A(\lambda)=\lambda^2 - (\text{tr}A) \lambda +\det A.\]

De manera explícita en términos de las entradas tendríamos entonces que si A=\begin{pmatrix} a & b \\ c & d \end{pmatrix}, entonces su polinomio característico es

    \[\lambda^2-(a+d)\lambda+(ad-bc).\]

Como ejemplo, si A=\begin{pmatrix} 5 & 2 \\ -8 & -3 \end{pmatrix}, entonces su polinomio característico es

    \[\lambda^2 -2\lambda +1=(\lambda-1)^2.\]

Su único eigenvalor sería entonces 1.

\square

Suma y producto de eigenvalores de matrices complejas

A veces queremos referirnos al conjunto de todos los eigenvalores de una matriz.

Definición. Para A una matriz en M_n(F), el espectro de A es el conjunto de eigenvalores de A. Lo denotamos por \text{spec} (A)

Tenemos una definición análoga para el espectro de una transformación lineal. Esa definición da un poco de intuición de por qué los teoremas de diagonalización de matrices se llaman teoremas espectrales. La siguiente definición habla de un sentido en el cual un eigenvalor «se repite».

Definición. Sea A una matriz en M_n(F) y \lambda un eigenvalor de A. La multiplicidad algebraica de \lambda es el mayor entero m_{\lambda} tal que (x-\lambda)^{m_\lambda} divide a \chi_A(x).

Cuando estamos en \mathbb{C}, por el teorema fundamental del álgebra todo polinomio de grado n se puede factorizar en exactamente n términos lineales. Además, los polinomios característicos son mónicos. De este modo, si tenemos una matriz A en M_n(\mathbb{C}), su polinomio característico se puede factorizar como sigue:

    \[\chi_A(\lambda) = \prod_{j=1}^n (\lambda-\lambda_j),\]

en donde \lambda_1,\ldots,\lambda_n son eigenvalores de A, no necesariamente distintos, pero en donde cada eigenvalor aparece en tantos términos como su multiplicidad algebraica.

Desarrollando parcialmente el producto del lado derecho, tenemos que el coeficiente de \lambda^{n-1} es

    \[-(\lambda_1+\ldots+\lambda_n)\]

y que el coeficiente libre es

    \[(-1)^n\lambda_1\cdot\ldots\cdot\lambda_n.\]

Combinando este resultado con el de la sección anterior y agrupando eigenvalores por multiplicidad, se demuestra el siguiente resultado importante. Los detalles de la demostración quedan como tarea moral.

Teorema. Sea A una matriz en M_n(\mathbb{C})

  • La traza A es igual a la suma de los eigenvalores, contando multiplicidades algebraicas, es decir:

        \[\text{tr} A = \sum_{\lambda \in \text{spec}(A)} m_{\lambda} \lambda.\]

  • El determinante de A es igual al producto de los eigenvalores, contando multiplicidades algebraicas, es decir:

        \[\det A = \prod_{\lambda \in \text{spec} (A)} \lambda^{m_{\lambda}}.\]

Veamos un problema en donde se usa este teorema.

Problema. Sea A una matriz en M_n(\mathbb{C}) tal que A^2-4A+3I_n=0. Muestra que el determinante de A es una potencia de 3.

Solución. Sea \lambda un eigenvalor de A y v un eigenvector para \lambda. Tenemos que

    \[A^2v=A(\lambda v) = \lambda(Av)=\lambda^2 v.\]

De esta forma, tendríamos que

    \begin{align*}0&=(A^2-4A+3I_n)v\\&=(\lambda^2 v - 4\lambda v + 3 v)\\&=(\lambda^2-4\lambda+3) v.\end{align*}

Como v no es el vector 0, debe suceder que \lambda^2-4\lambda+3=0. Como \lambda^2-4\lambda+3 = (\lambda-3)(\lambda-1), entonces \lambda=1 ó \lambda=3. Con esto concluimos que los únicos posibles eigenvectores de A son 1 y 3.

Como A es una matriz en \mathbb{C}, tenemos entonces que su polinomio característico es de la forma (x-1)^a(x-3)^b con a y b enteros no negativos tales que a+b=n. Pero entonces por el teorema de producto de eigenvalores, tenemos que el determinante es 1^a\cdot 3^b=3^b, con lo que queda demostrado que es una potencia de 3.

\square

Dos teoremas fundamentales de álgebra lineal (opcional)

Tenemos todo lo necesario para enunciar dos resultados de álgebra lineal. Sin embargo, las demostraciones de estos resultados requieren de más teoría, y se ven en un siguiente curso. No los demostraremos ni los usaremos en el resto de este curso, pero te pueden servir para anticipar el tipo de resultados que verás al continuar tu formación en álgebra lineal.

El primer resultado fundamental es una caracterización de las matrices que pueden diagonalizarse. Para ello necesitamos una definición adicional. Hay otro sentido en el cual un eigenvalor \lambda de una matriz A puede repetirse.

Definición. Sea A una matriz en M_n(F) y \lambda un eigenvalor de A. La multiplicidad geométrica de \lambda es la dimensión del kernel de la matriz \lambda I_n -A pensada como transformación lineal.

En estos términos, el primer teorema al que nos referimos queda enunciado como sigue.

Teorema. Una matriz A en M_n(F) es diagonalizable si y sólo si su polinomio característico \chi_A(\lambda) se puede factorizar en términos lineales en F[\lambda] y además, para cada eigenvalor, su multiplicidad algebraica es igual a su multiplicidad geométrica.

Ejemplo. La matriz

    \[A=\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\]

tiene como polinomio característico a \chi_A(\lambda)=\lambda^2+1. Este polinomio no se puede factorizar en \mathbb{R}[x], así que A no es diagonalizable con matrices de entradas reales.

Sin embargo, en \mathbb{C} tenemos la factorización en términos lineales \lambda^2+1=(\lambda+i)(\lambda-i), que dice que i y -i son eigenvalores de multiplicidad algebraica 1. Se puede mostrar que la multiplicidad geométrica también es 1. Así, A sí es diagonalizable con matrices de entradas complejas.

\square

El segundo resultado fundamental dice que «cualquier matriz se anula en su polinomio característico». Para definir correctamente esto, tenemos que decir qué quiere decir evaluar un polinomio en una matriz. La definición es más o menos natural.

Definición. Si A es una matriz en M_n(F) y p es un polinomio en F[\lambda] de la forma

    \[p(\lambda)=a_0+a_1\lambda+a_2\lambda^2+\ldots+a_n\lambda^n,\]

definimos a la matriz p(A) como la matriz

    \[a_0I_n+a_1A+a_2A^2+\ldots+a_nA^n.\]

En estos términos, el resultado queda enunciado como sigue.

Teorema (Cayley-Hamilton). Si A es una matriz en M_n(F) y \chi_A(x) es su polinomio característico, entonces

    \[\chi_A(A)=O_n.\]

Ejemplo. Tomemos de nuevo a la matriz

    \[A=\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\]

del ejemplo anterior. Su polinomio característico es x^2+1. En efecto, verificamos que se cumple el teorema de Cayley-Hamilton pues:

    \begin{align*}A^2+I_2 &= \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} + \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\\&=\begin{pmatrix} -1 & 0 \\ 0 & -1 \end{pmatrix}+\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\\&=\begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}.\end{align*}

\square

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Enuncia y demuestra cómo es el polinomio característico de una matriz triangular inferior.
  • Completa los detalles de la demostración del teorema de suma y producto de eigenvalores. Úsalo para encontrar la suma y producto (con multiplicidades) de los eigenvalores de la matriz

        \[\begin{pmatrix}5 & 0 & -1 & 2 \\ 3 & -2 & 1 & -2 \\ 0 & 0 & 0 & 5\\ 0 & 2 & 4 & 0 \end{pmatrix}.\]

  • Sea A una matriz en M_n(F). ¿Cómo es el polinomio característico de -A en términos del polinomio característico de A?
  • Tomemos A una matriz en M_n(F) y k un entero positivo. Muestra que si \lambda es un eigenvalor de la matriz A, entonces \lambda^k es un eigenvalor de la matriz A^k.

De la sección opcional:

  • Demuestra, haciendo todas las cuentas, el caso particular del teorema de Cayley-Hamilton para matrices de 2\times 2.
  • Ya sabemos calcular el polinomio característico de matrices diagonales. Muestra el teorema de Cayley-Hamilton en este caso particular.
  • Las matrices diagonales trivialmente son diagonalizables. Muestra que la multiplicidad algebraica de sus eigenvalores en efecto coincide con la multiplicidad geométrica.