Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Sucesiones de Cauchy

Por Lizbeth Fernández Villegas

 MATERIAL EN REVISIÓN

Introducción

En otros cursos, donde el conjunto de los números reales es el protagonista, se suele hablar de una propiedad: El conjunto R es completo. Esto puede concluirse a partir de 3 situaciones que son válidas en R:

  1. El axioma del supremo o de completitud.
  2. La intersección de intervalos cerrados encajados cuya longitud tiende a cero es no vacía.
  3. Las sucesiones de Cauchy son convergentes en R.

En las siguientes entradas veremos cómo las propiedades 2 y 3 son generalizadas a los espacios métricos. La primera no es posible, por ejemplo, en conjuntos métricos que no están ordenados. Pero tampoco basta que un conjunto tenga un orden en sus elementos para que todos sus subconjuntos acotados tengan un supremo en el conjunto. Este es el caso de algunos conjuntos acotados en el subespacio Q que tendrán supremo en R pero no en Q. ¿Puedes dar un ejemplo?

Recordemos que en la entrada de Convergencia vista anteriormente, hablamos de sucesiones (xn)nN que se aproximan a un punto x en un espacio métrico (X,d). Según la definición, xnx significa que dado ε>0 existe NN que cumple para cada nN,d(xn,x)<ε. Esta definición compara la distancia entre cada punto de la sucesión con un punto fijo x. Sin embargo, ¿qué podemos decir de la distancia entre cualesquiera dos puntos de la sucesión?

Sea ε>0. En una sucesión convergente (xn)nN ocurrirá que para algún NN si nN entonces d(xn,x)<ε2.

Sucesión convergente

Podemos ver que mientras más se aproximan los puntos de la sucesión al punto de convergencia x, los puntos de la sucesión se acercan cada vez más entre ellos también.

Los puntos de la bola abierta son más cercanos

Más aún, la desigualdad del triángulo garantiza que si n,mN entonces:
d(xn,xm)d(xn,x)+d(x,xm)<ε2+ε2<ε. como lo expresa la siguiente imagen:

Hay puntos con distancias arbitrariamente pequeñas

Esto indica que es posible identificar un término de la sucesión, a partir del cual las distancias entre cualesquiera dos de ellos será arbitrariamente pequeña. Aunque ya vimos que esto pasa en sucesiones convergentes también puede ocurrir en algunas que no lo son. Cuando las sucesiones tienen esta característica son denominadas como sigue:

Definición sucesión de Cauchy: Sea (xn)nN una sucesión de un espacio métrico (X,d). Decimos que es una sucesión de Cauchy si satisface la condición de Cauchy que es que:
ε>0, existe NN tal que n,mN ocurre que d(xn,xm)<ε.

Proposición: Si una sucesión es de Cauchy entonces es acotada.

Demostración:
Sea (xn)nN una sucesión de Cauchy. Entonces para ε=1 existe NN tal que n,m>N se cumple que d(xn,xm)<1 Entonces, mN,d(xN,xm)<1. Si definimos las distancias faltantes en los términos de la sucesión, es decir, las distancias di=d(xN,xi) con i=1,,N1 y hacemos M=máx{di,1},i=1,,N1 se concluye que existe una bola abierta que contiene todos los términos de la sucesión, la bola B(xN,M).

Una sucesión de Cauchy es acotada

A pesar de que una sucesión convergente es de Cauchy, no toda sucesión de Cauchy es convergente.

Ejemplo: La sucesión (1n)nN en el subespacio euclideano (0,1] es de Cauchy, pero no es convergente en (0,1]. La demostración se deja como ejercicio.

No obstante tenemos el siguiente resultado:

Proposición: Sea (xn)nN una sucesión de Cauchy en el espacio euclidiano Rn, entonces la sucesión también es convergente.

Demostración:
Si el conjunto de términos de la sucesión dado por {xn}:={xn:nN} es finito entonces es convergente. (Ejercicio de la tarea moral de la entrada de Convergencia). Pero si es infinito entonces, al ser también acotado (por la proposición anterior) se sigue que el conjunto de los términos de la sucesión tiene un punto de acumulación xRn. Esto es resultado del teorema de Bolzano-Weierstrass, que se ve en los cursos de cálculo y dice que todo conjunto infinito acotado en Rn tiene un punto de acumulación. (La demostración puede consultarse en el libro «Análisis Matemático, Introducción Moderna al Cálculo Superior» de Tom. M. Apóstol).

Sea ε>0. Como (xn) es de Cauchy entonces existe NN tal que n,mN ocurre que d(xn,xm)<ε2.

Como x es punto de acumulación del conjunto {xn} podemos garantizar que existe un término de la sucesión xkB(x,ε2) con kN. (Se te pedirá argumentar esto al final de esta sección).

Existe xkB(x,ε2)

Entonces, nN
d(xn,x)d(xn,xk)+d(xk,x)ε2+ε2=ε
Por lo tanto xnx.

xnx

Finalizamos esta sección con la siguiente:

Proposición: Sea (X,d) un espacio métrico y (xn)nN una sucesión de Cauchy en X. Entonces (xn) es convergente si y solo si tiene una subsucesión convergente.

Demostración: Queda como ejercicio.

Más adelante…

Ya que conocemos el concepto de las sucesiones de Cauchy procederemos a explorar espacios donde este tipo de sucesiones sí es convergente. Esto motiva la definición de espacio métrico completo que conoceremos en la siguiente entrada.

Tarea moral

  1. Demuestra que la sucesión (1n)nN en el subespacio euclideano (0,1] es de Cauchy, pero no es convergente en (0,1].
  2. En la demostración de la proposición anterior, prueba que que existe un término de la sucesión (xn) de Rn, digamos xk tal que xkB(x,ε2) con kN.
  3. Demuestra que si (xn)nN es una sucesión de Cauchy en un espacio X, entonces (xn) es convergente si y solo si tiene una subsucesión convergente.
  4. Sea X=[1,) y sea d(x,y)=|1x1y|. Demuestra que d es una métrica en X.
  5. Para cada nN definimos xn=n+1. Prueba que la sucesión (xn) es de Cauchy en el espacio métrico del ejercicio anterior.

Enlaces

Geometría Moderna II: Principio de dualidad y Triángulo autopolar

Por Armando Arzola Pérez

Introducción

Gracias a la relación de polos y polares con respecto a una circunferencia, se tenían correspondencias entre todos los puntos y todas las rectas del plano. Por lo cual nace el Principio de dualidad. Así mismo analizaremos el Triángulo Autopolar junto con algunas propiedades.

Principio de Dualidad

El principio de Dualidad, donde la propiedad que nos dé como resultado de intercambiar las palabras de recta y punto resulta verdadera, además de que guarda sus propiedades.

Por ejemplo, se tiene la siguiente dualidad del teorema con respecto a su corolario.

Teorema. Dada una circunferencia, la polar de P pasa por Q, entonces la polar de Q pasa por P.

Corolario. Dada una circunferencia, sean p y q rectas tales que, el polo de p está en q, entonces el polo de q está en p.

Se puede ver que ambos son duales, se puede dar un ejemplo más sencillo.

Ejemplo. La unión de dos puntos es una recta, entonces la intersección de dos rectas es un punto.

Triángulo Autopolar

Definición. Se define como triángulo autopolar a aquel que, con respecto a una circunferencia, se tiene que cada vértice es el polo del lado opuesto, de tal modo que cada lado es polar del vértice opuesto.

Construcción. Se tiene una circunferencia C(O,r), tomemos un punto A dentro de la circunferencia y tracemos su inverso A y a su polar. Ahora tomemos un punto B en a tal que AB y trazamos b su polar, y por el Teorema Fundamental de Polos y Polares se tiene que b pasa por A. Además, a la intersección de a y b la llamaremos C, y su polar de c pasa por A y B puntos.

De esta forma tenemos el ABC es autopolar con respecto a C(O,r).

Triángulo Autopolar

◻

Propiedades

Se tienen varias propiedades del triángulo autopolar.

1.- El ortocentro del triángulo autopolar es el centro de la circunferencia.

Demostración. De la figura anterior se tiene que:

La polar de A es a que es el lado BC del ABC y BCOA por A inverso de A.

La polar de B es b que es el lado CA del ABC y CAOB por B inverso de B.

La polar de C es c que es el lado AB del ABC y ABOC por C inverso de C.

Por lo cual AA, CC y BB son las alturas del ABC y estas se intersecan en O.

Por lo tanto, O es el ortocentro del ABC.

◻

2.- Uno de sus vértices está dentro de la circunferencia y los otros dos fuera de esta.

3.- El ángulo del triángulo cuyo vértice está en la circunferencia es obtuso.

Más adelante…

Se abordará el tema de circunferencia Polar, en el cual veremos su relación con polos y polares.

Entradas relacionadas

Álgebra Lineal II: Aplicaciones de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que cualquier matriz (o transformación lineal) tiene una y sólo una forma canónica de Jordan. Además, explicamos cómo se puede obtener siguiendo un procedimiento específico. Para terminar nuestro curso, platicaremos de algunas de las consecuencias del teorema de Jordan.

Clasificación de matrices por similaridad

Una pregunta que aún no hemos podido responder es la siguiente: si nos dan dos matrices A y B en Mn(F), ¿son similares? Con la maquinaria desarrollada hasta ahora podemos dar una muy buena respuesta.

Proposición. Sean A y B matrices en Mn(F) tales que el polinomio característico de A se divide en F. Entonces, A y B son similares si y sólo si se cumplen las siguientes dos cosas:

  • El polinomio característico de B también se divide en Mn(F) y
  • A y B tienen la misma forma canónica de Jordan.

Demostración. Sea J la forma canónica de Jordan de A.

Si A y B son similares, como A es similar a J, se tiene que B es similar a J. Entonces, B tiene el mismo polinomio característico que A y por lo tanto se divide en F. Además, como J es similar a B, entonces por la unicidad de la forma canónica de Jordan, precisamente J es la forma canónica de Jordan de B. Esto es un lado de nuestra proposición.

Supongamos ahora que el polinomio característico de B también se divide en Mn(F) y que la forma canónica de Jordan de B también es J. Por transitividad de similaridad, A es similar a B.

◻

Veamos un ejemplo de cómo usar esto en un problema específico.

Problema. Encuentra dos matrices en M2(R) que tengan como polinomio característico a x23x+2, pero que no sean similares.

Solución. Las matrices A=(1002) y B=(1102) ya están en forma canónica de Jordan y son distintas, así que por la proposición anterior no pueden ser similares. Además, por ser triangulares superiores, en ambos casos el polinomio característico es (X1)(X2)=X23X+2.

El problema anterior fue sumamente sencillo. Piensa en lo difícil que sería argumentar con cuentas de producto de matrices que no hay ninguna matriz PM2(R) tal que A=P1BP.

Forma canónica de Jordan «para cualquier matriz»

Como en C[X] todos los polinomios se dividen, entonces tenemos el siguiente corolario del teorema de Jordan.

Corolario. Toda matriz en Mn(C) tiene una única forma canónica de Jordan.

Aquí C es muy especial pues es un campo completo, es decir, en el cual cualquier polinomio no constante tiene por lo menos una raíz. En general esto no es cierto, y es muy fácil dar ejemplos: x22 no tiene raíces en Q y x2+1 no tiene raíces en R.

Sin embargo, existe toda un área del álgebra llamada teoría de campos en donde se puede hablar de extensiones de campos. Un ejemplo de extensión de campo es que C es una extensión de R pues podemos encontrar «una copia de» R dentro de C (fijando la parte imaginaria igual a cero).

Un resultado importante de teoría de campos es el siguiente:

Teorema. Sea F un campo y P(X) un polinomio en F[X]. Existe una extensión de campo G de F tal que P(X) se divide en G.

¿Puedes notar la consecuencia que esto trae para nuestra teoría de álgebra lineal? Para cualquier matriz en Mn(F), podemos considerar a su polinomio característico y encontrar campo G que extiende a F en donde el polinomio se divide. Por el teorema de Jordan, tendríamos entonces lo siguiente.

Corolario. Sea A una matriz en Mn(F). Entonces, A tiene una forma canónica de Jordan en un campo G que extiende a F.

Por supuesto, la matriz P invertible que lleva A a su forma canónica quizás sea una matriz en Mn(G).

Toda matriz compleja es similar a su transpuesta

Ya demostramos que para cualquier matriz A en Mn(F) se cumple que χA(X)=χ(AT)(X). Esto implica que A y su transpuesta AT tienen los mismos eigenvalores, traza y determinante. También vimos que μA(X)=μAT(X). Las matrices A y AT comparten muchas propiedades. ¿Será que siempre son similares? A continuación desarrollamos un poco de teoría para resolver esto en el caso de los complejos.

Proposición. Sea Jλ,n un bloque de Jordan en Mn(F). Entonces, Jλ,n y Jλ,nT son similares.

Demostración. Para bloques de Jordan, podemos dar explícitamente la matriz de similitud. Es la siguiente matriz, con unos en la diagonal no principal:

P=(0001001001001000).

Esta matriz es invertible, su inversa es ella misma y cumple lo siguiente (ver ejercicios). Si A es una matriz en Mn(F), entonces:

  • Si A tiene columnas C1,,Cn, entonces AP tiene columnas Cn,,C1.
  • Si A tiene filas R1,,Rn, entonces PA tiene filas Rn,,R1.

Para los bloques de Jordan, si revertimos el orden de las filas y luego el de las columnas, llegamos a la transpuesta. Así, Jλ,nT=PJλ,nP es la similitud entre las matrices dadas.

◻

La prueba anterior no funciona en general pues para matrices arbitrarias no pasa que AT=PAP (hay un contraejemplo en los ejercicios). Para probar lo que buscamos, hay que usar la forma canónica de Jordan.

Teorema. En Mn(C), toda matriz es similar a su transpuesta.

Demostración. Sea A una matriz en Mn(C). Como en C todo polinomio se divide, tanto A como AT tienen forma canónica de Jordan. Digamos que la forma canónica de Jordan es

(1)J=(Jλ1,k10000Jλ2,k20000Jλ3,k30000Jλd,kd).

Si P es la matriz de similitud, tenemos que A=P1JP y al transponer obtenemos que:

AT=PT(Jλ1,k1T0000Jλ2,k2T0000Jλ3,k3T0000Jλd,kdT)(PT)1.

Como por la proposición anterior cada bloque de Jordan es similar a su transpuesta, existen matrices invertibles Q1,,Qd tales Jλi,kiT=Qi1Jλi,kiQi para todo i{1,,d}. Pero entonces al definir Q como la matriz de bloques

Q=(Q1000Q20000Qd),

obtenemos la similaridad

AT=PTQ1(Jλ1,k10000Jλ2,k20000Jλ3,k30000Jλd,kd)Q(PT)1.

Así, A y AT tienen la misma forma canónica de Jordan y por lo tanto son matrices similares.

◻

Más adelante…

¡Hemos terminado el curso de Álgebra Lineal II! Por supuesto, hay muchos temas de Álgebra Lineal adicionales que uno podría estudiar.

Un tema conectado con lo que hemos platicado es qué hacer con las matrices cuyo polinomio característico no se divide en el campo con el que estamos trabajando. Por ejemplo si tenemos una matriz A en Mn(R) cuyo polinomio característico no se divide, una opción es pensarla como matriz en Mn(C) y ahí encontrar su forma canónica de Jordan. ¿Pero si queremos quedarnos en R? Sí hay resultados que llevan una matriz a algo así como una «forma canónica» en R muy cercana a la forma canónica de Jordan.

Otro posible camino es profundizar en la pregunta de cuándo dos matrices en Mn(F) son similares. Si tienen forma canónica de Jordan, ya dimos una buena caracterización en esta entrada. En los ejercicios encontrarás otra. Pero, ¿y si no tienen forma canónica de Jordan? Podríamos extender el campo a otro campo G y comprar las formas canónicas ahí, pero en caso de existir la similaridad, sólo la tendremos en Mn(G). Existe otra manera de expresar a una matriz en forma canónica, que se llama la forma canónica de Frobenius y precisamente está pensada para determinar si dos matrices son similares sin que sea necesario encontrar las raíces del polinomio característico, ni extender el campo.

Estos son sólo dos ejemplos de que la teoría de álgebra lineal es muy extensa. En caso de que estés interesado, hay mucho más por aprender.

Tarea moral

  1. Sea A una matriz en Mn(F) y tomemos P en Mn(F) la matriz
    P=(0001001001001000).
    • Demuestra que si A tiene columnas C1,,Cn, entonces AP tiene columnas Cn,,C1.
    • Demuestra que si A tiene filas R1,,R1, entonces PA tiene filas Rn,,Rn.
    • Concluye con cualquiera de los incisos anteriores que P es invertible y su inversa es ella misma.
    • Tomemos explicitamente n=2 y A=(1234). Encuentra explícitamente PAP. ¿Es AT?
  2. ¿Cuál es la máxima cantidad de matrices que se pueden dar en M5(C) de manera que cada una de ellas tenga polinomio característico x2(x2+1)(x+3) y tales que no haya dos de ellas que sean similares entre sí.
  3. Sea A una matriz en Mn(R) tal que su polinomio característico se divide en R, con forma canónica de Jordan J. Sea P(X) un polinomio en R[X].
    • Demuestra que el polinomio característico de P(A) se divide en R.
    • La forma canónica de Jordan de P(A) no necesariamente será P(J) pues puede que el polinomio altere el orden de los eigenvalores pero, ¿cómo se obtiene la forma canónica de P(A) a partir de J?
  4. Sean A y B matrices en Mn(F) cuyo polinomio característico se divide en F. Muestra que A y B son similares si y sólo si para cualquier polinomio P(X) en F[X] se tiene que rango(P(A))=rango(P(B)).
  5. Investiga sobre la forma canónica de Frobenius y sobre la variante a la forma canónica de Jordan restringida a R.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Unicidad de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior enunciamos el teorema de la forma canónica de Jordan y demostramos la existencia de dicha forma bajo ciertas hipótesis. Como corolario, quedó pensar cuál es la versión para matrices. En esta entrada enunciamos la versión para matrices (totalmente equivalente a la de transformaciones lineales) y nos enfocamos en mostrar la unicidad de la forma canónica de Jordan.

Unicidad de la forma canónica de Jordan

El siguiente teorema es totalmente análogo al enunciado en la entrada anterior. Recuerda que es un orden total fijo de F (en R, es el orden usual).

Teorema. Sea A una matriz Mn(F) cuyo polinomio característico χA(X) se divide en F. Entonces, existen únicos valores λ1λn en F y únicos enteros k1,,kd tales que k1+k2++kd=n,k1k2kd, para los cuales A es similar a la siguiente matriz de bloques de Jordan:

(Jλ1,k1000Jλ2,k2000Jλd,kd).

Usaremos esta versión para demostrar la unicidad, lo cual también implicará la unicidad para la versión de transformaciones lineales.

Mediante la demostración de existencia de la entrada anterior, llegamos a que si el polinomio característico de A es

χA(X)=(Xλ1)m1(Xλ2)m2(Xλr)mr,

entonces A es similar a una matriz conformada por matrices de bloques de Jordan J1,J2,,Jr, en donde cada Ji es de tamaño mi y de bloques de Jordan de eigenvalor λi.

Si A fuera similar a otra matriz K de bloques de Jordan, podríamos agrupar por eigenvalores de los bloques κ1<<κs en matrices de bloques de Jordan tamaños o1,,os, digamos K1,,Ks. El polinomio característico de K sería entonces

χK(X)=(Xκ1)o1(Xκ2)o2(Xκs)os.

Pero K es similar a A, y entonces deben tener el mismo polinomio característico, así que conciden en raíces y multiplicidad. Esto demuestra que r=s y como los λi y los κi están ordenados, también demuestra las igualdades λi=κi y mi=oi para todo i{1,,r}.

Sólo nos queda argumentar la igualdad entre cada Ji y Ki para i{1,,r}. Pero ambas una forma canónica de Jordan para la transformación nilpotente que se obtiene de restringir TAλiI a ker(TAλiImi). Por la unicidad que demostramos para la forma canónica de Jordan para transformaciones nilpotentes, concluimos que Ji=Ki. Esto termina la demostración de la unicidad de la forma canónica de Jordan.

◻

Una receta para encontrar la forma canónica de Jordan

Ya con el teorema demostrado, ¿cómo juntamos todas las ideas para encontrar la forma canónica de Jordan de una matriz A en Mn(F) cuyo polinomio característico se divida en F? Podemos proceder como sigue.

  1. Encontramos el polinomio característico χA(X) y su factorización, digamos χA(X)=(Xλ1)m1(Xλ2)m2(Xλr)mr.
  2. Nos enfocamos en encontrar las matrices de bloque de Jordan Ji para cada eigenvalor λi. Sabemos que la matriz Ji será de tamaño mi.
  3. Para saber exactamente cuál matriz de bloques de Jordan es Ji, pensaremos en que tiene b1,b2,,bmi bloques de Jordan de eigenvalor λi de tamaños 1,2,,mi. Consideramos la matriz Ai=AλiI. Los b1,,bmi son la solución al siguiente sistema de ecuaciones en las variables x1,,xmi.
    mi=1x1+2x2+3x3++mixmimin+rango(AiλiI)=0x1+1x2+2x3++(mi1)xmimin+rango(AiλiI2)=0x1+0x2+1x3++(mi2)xmimin+rango(AiλiI3)=0x1+0x2+0x3++(mi3)xmimin+rango(AiλiImi1)=0x1+0x2+0x3++1xmi.
  4. Juntamos todos los Ji en una misma matriz y los ordenamos apropiadamente.

El paso número 3 está motivado por lo que sabemos de las matrices nilpotentes, y es bueno que pienses por qué se estudia específicamente ese sistema de ecuaciones para cada eigenvalor λi y multiplicidad mi.

Ejemplo de obtener la forma canónica de Jordan

Veamos un ejemplo del procedimiento descrito en la sección anterior.

Ejemplo. Encontraremos la forma canónica de Jordan de la siguiente matriz: A=(2261024639246234232364623619820192411959310122101223853039374396).

Con herramientas computacionales, podemos darnos cuenta de que el polinomio característico de esta matriz es χA(X)=X511X4+46X390X2+81X27.

Este polinomio se puede factorizar como (X1)2(X3)3. Así, la submatriz de bloques de Jordan J1 de eigenvalor 1 tendrá tamaño 2 y la J3 de eigenvalor 3 tendrá tamaño 3. Pero, ¿de qué tamaño son cada uno de los bloques de Jordan en cada una de estas matrices?

Para respondernos esto para J1, notamos que sus bloques son de tamaño 1 y 2 solamente. Si hay b1 bloques de tamaño 1 y b2 bloques de tamaño 2, por la teoría desarrollada arriba tendremos:

b1+2b2=2b2=25+rango(AI)=25+4=1.

El rango de AI lo obtuvimos computacionalmente, pero recuerda que también puede ser obtenido con reducción gaussiana. Resolviendo el sistema, b2=1 y entonces b1=0. Concluimos que en J1 hay un bloque de Jordan de tamaño 2.

Para J3, reciclemos las variables bi (para no introducir nuevas). Los bloques pueden ser de tamaño 1,2,3. Supongamos que de estos tamaños respectivamente hay b1,b2,b3 bloques. Los bi cumplen:

b1+2b2+3b3=3b2+2b3=35+rango(A3I)=35+3=1b3=35+rango((A3I)2)=35+2=0.

Así, b3=0, y en consecuencia b2=1 y entonces b1=1. Concluimos que J3 tiene un bloque de tamaño 1 y uno de tamaño 3. Por lo tanto, la forma canónica de Jordan de A es:

(J100J3)=(J1,2000J3,1000J3,2)=(1100001000003000003100003)

Otro problema sobre forma canónica de Jordan

La receta anterior funciona en general y da la forma canónica de Jordan. Esto es algo que probablemente en la práctica en aplicaciones no tendrás que hacer manualmente nunca, pues hay herramientas computacionales que te pueden ayudar. Sin embargo, es importante entender con profundidad el teorema y la receta de manera teórica, pues hay problemas conceptuales en los que no podrás usar herramientas computacionales. A continuación veremos un ejemplo.

Problema. Sea A una matriz en M6(R) con polinomio característico χA(X)=X62X4+X2.

  • ¿Cuántas posibilidades hay para la forma canónica de Jordan de A?
  • Demuestra que si el rango de A es 5, entonces A no es diagonalizable.

Solución. Podemos factorizar el polinomio característico de A como sigue:

χA(X)=X2(X+1)2(X1)2.

Así, la forma canónica de Jordan está conformada por una matriz de bloques de Jordan J0 de eigenvalor 0 y tamaño 2; una J1 de eigenvalor 1 y tamaño 2; y una J1 de eigenvalor 1 y tamaño 2.

Cada Ji tiene dos chances: o es un bloque de Jordan de tamaño 2, o son dos bloques de Jordan de tamaño 1. Así, en total tenemos 222=8 posibilidades.

Si A es de rango 5, entonces tendríamos en las cuentas de cantidad de bloques b1 y b2 para eigenvalor 0 que

b1+2b2=2b2=26+rango(A)=26+5=1,

de donde en J0 tendría 1 bloque de tamaño 2 y ninguno de tamaño 1. Si A fuera diagonalizable, su diagonalización sería una forma canónica de Jordan donde para eigenvalor 0 se tendrían 2 bloques de tamaño 1 y ninguno de tamaño 2. Así, A tendría dos formas canónicas de Jordan distintas, lo cual es imposible.

◻

Más adelante…

Con esta entrada terminamos de demostrar el teorema de la forma canónica de Jordan, uno de los teoremas más bonitos de álgebra lineal. ¿Te das cuenta de todo lo que utilizamos en su demostración? Forma matricial de transformaciones lineales, el teorema de Cayley-Hamilton, polinomio característico, subespacios estables, teoría de dualidad, sistemas de ecuaciones lineales, resultados auxiliares de polinomios, etc. Es un resultado verdaderamente integrador.

En la siguiente entrada, la última del curso, hablaremos de algunas de las consecuencias del teorema de la forma canónica de Jordan. Discutiremos cómo lo podemos utilizar para clasificar a las matrices por similaridad. Veremos una aplicación con respecto a una matriz y su transpuesta. También, esbozaremos un poco de por qué en cierto sentido el resultado no sólo vale para las matrices cuyo polinomio se divide sobre el campo, sino que para cualquier matriz. Con ello terminaremos el curso.

Tarea moral

  1. Calcula la forma canónica de Jordan J de la matriz A=(103116125). Además de encontrar J, encuentra de manera explícita una matriz invertible P tal que A=P1JP.
  2. Calcula la forma canónica de Jordan de la matriz (1100012000100002)
  3. Explica y demuestra cómo obtener lo siguiente para una matriz de bloques de Jordan:
    • Su polinomio característico.
    • Su polinomio mínimo.
    • Su determinante.
    • Su traza.
    • Sus eigenespacios.
  4. Justifica con más detalle por qué la receta que se propone para calcular la forma canónica de Jordan en efecto funciona. Necesitarás varios de los argumentos que dimos en la entrada anterior.
  5. Demuestra que una matriz AMn(F) para la cual su polinomio característico se divide en F es diagonalizable si y sólo si cada bloque de cada matriz de bloques de la forma canónica de Jordan tiene tamaño 1.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Existencia de la forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores demostramos que para cualquier matriz nilpotente existe (y es única) una matriz similar muy sencilla, hecha por lo que llamamos bloques de Jordan de eigenvalor cero. Lo que haremos ahora es mostrar una versión análoga de este resultado para una familia mucho más grande de matrices. De hecho, en cierto sentido tendremos un resultado análogo para todas las matrices.

Pensando en ello, lo que haremos en esta entrada es lo siguiente. Primero, generalizaremos nuestra noción de bloques de Jordan para contemplar cualquier eigenvalor. Estudiaremos un poco de los bloques de Jordan. Luego, enunciaremos el teorema que esperamos probar. Finalmente, daremos el primer paso hacia su demostración. En la siguiente entrada terminaremos la demostración y hablaremos de aspectos prácticos para encontrar formas canónicas de Jordan.

Enunciado del teorema de la forma canónica de Jordan

A continuación definimos a los bloques de Jordan para cualquier eigenvalor y tamaño.

Definición. Sea F un campo. El bloque de Jordan de eigenvalor λ y tamaño k es la matriz Jλ,k en Mk(F) cuyas entradas son todas λ, a excepción de las que están inmediatamente arriba de la diagonal superior, las cuales son unos. En símbolos, Jλ,k=[aij] con aij={1si j=i+1λsi i=j0en otro caso.

También podemos expresarlo de la siguiente manera:

Jλ,k=(λ10000λ10000λ00000λ10000λ), en donde estamos pensando que la matriz es de k×k.

Una última manera en la que nos convendrá pensar a Jλ,k es en términos de los bloques de Jordan de eigenvalor cero: Jλ,k=λIk+J0,k.

Definición. Una matriz de bloques de Jordan en Mn(F) es una matriz diagonal por bloques en la que cada bloque en la diagonal es un bloque de Jordan.

Lo que nos gustaría demostrar es el siguiente resultado. En él, piensa en como algún orden total fijo de F (para R es el orden usual, pero otros campos no necesariamente tienen un orden natural asociado).

Teorema. Sea V un espacio vectorial de dimensión finita n sobre el campo F y T:VV una transformación lineal tal que χT(X) se divide sobre F. Entonces, existen únicos valores λ1λn en F y únicos enteros k1,,kd tales que k1+k2++kd=n,k1k2kd, para los cuales existe una base de V en la cual T tiene como forma matricial a la siguiente matriz de bloques de Jordan:

(Jλ1,k1000Jλ2,k2000Jλd,kd).

Por supuesto, este teorema también tiene una versión matricial, la cuál tendrás que pensar cómo escribir.

Un teorema de descomposición de kernels

Ya tenemos uno de los ingredientes que necesitamos para dar la demostración de la existencia de la forma canónica de Jordan: su existencia para las transformaciones nilpotentes. Otro de los ingredientes que usaremos es el teorema de Cayley-Hamilton. El tercer ingrediente es un resultado de descoposición de kernels de transformaciones evaluadas en polinomios.

Proposición. Sea V un espacio vectorial sobre F. Sea T:VV una transformación lineal. Y sean P1(X),,Pr(X) polinomios en F[x] cuyo máximo común divisor de cualesquiera dos de ellos es el polinomio 1. Entonces, ker((P1P2Pr)(T))=i=1rker(Pi(T)).

Demostración. Para cada i{1,2,,r} consideraremos a Qi(X) como el polinomio que se obtiene de multiplicar a todos los polinomios dados, excepto Pi(X). Y por comodidad, escribiremos P(X)=(P1Pr)(X). Notemos que entonces P(X)=(QiPi)(X) para cualquier i{1,2,,r}.

Primero probaremos un resultado polinomial auxiliar. Veremos que Q1(X),,Qr(X) tienen como máximo común divisor al polinomio 1. En caso de no ser así, un polinomio D(X) no constante dividiría a todos ellos. Sin pérdida de generalidad, D es irreducible (tomando, por ejemplo D(X) de grado mínimo con esta propiedad). Como D(X) es irreducible y divide a Qr(X), entonces debe dividir a alguno de los factores de Qr(X), que sin pérdida de generalidad (por ejemplo, reetiquetando), es P1(X). Pero D(X) también divide a Q1(X), así que debe dividir a alguno de sus factores P2(X),,Pr(X), sin pérdida de generalidad a P2(X). Pero entonces D(X) divide a P1(X) y P2(X), lo cual contradice las hipótesis. Así, Q1(X),,Qr(X) tienen como máximo común divisor al polinomio 1. Por el lema de Bézout para polinomios (ver tarea moral), existen entonces polinomios R1(X),,Rr(X) tales que

(2)(R1Q1+R2Q2++RrQr)(X)=1.

Estamos listos para pasar a los argumentos de álgebra lineal. Veamos primero que cualquier elemento en la suma de la derecha está en el kernel de P(T). Tomemos v=v1++vr con viker(Pi(T)). Al aplicar P obtenemos

P(v)=P(v1)++P(vr)=Q1(P1(v1))++Qr(Pr(vr))=0++0=0.

Esto muestra que vker(P(T)), de donde se obtiene la primera contención que nos interesa.

Veamos ahora la segunda contención, que ker(P(T))=i=1rker(Pi(T)). Tomemos vker(P(T)). Al aplicar (2) en T y evaluar en v obtenemos que

v=Id(v)=(1)(T)(v)=(R1Q1+R2Q2++RrQr)(T)(v)=(R1Q1)(T)(v)++(RrQr)(T)(v).

Pero esto justo expresa a v como elemento de ker(Pi(T)) pues para cada i tenemos

Pi(T)((RiQi)(T)(v))=(PiRiQi)(T)(v)=(RiQiPi)(T)(v)=Ri(T)P(T)(v)=Ri(0)=0,

de modo que expresamos a v como suma de vectores en ker(P1(T)),,ker(Pr(T)).

Ya demostramos la igualdad de conjuntos, pero recordemos que en la igualdad de suma directa hay otra cosa que hay que probar: que el cero tiene una forma única de expresarse como suma de elementos de cada subespacio (aquella en donde cada elemento es cero). Supongamos entonces que 0=v1++vr con viker(Pi(T)) para cada i. Si aplicamos Qi en esta igualdad, como tiene todos los factores Pj con ji obtenemos 0=Qi(0)=Qi(vi).

Por otro lado, al aplicar nuevamente (2) en T y evaluar en vi

vi=Id(vi)=(1)(T)(vi)=(R1Q1+R2Q2++RrQr)(T)(vi)=(R1Q1)(T)(v1)++(RrQr)(T)(vi)=(RiQi)(T)(vi)=0.

De esta forma, en efecto tenemos que los espacios están en posición de suma directa, que era lo último que nos faltaba verificar.

◻

Existencia de la forma canónica de Jordan

Estamos listos para demostrar la existencia de la forma canónica de Jordan. Supongamos que V es un espacio vectorial de dimensión finita n sobre F y que T:VV es una transformación lineal cuyo polinomio característico se divide en F[x]. Sabemos entonces que es de la siguiente forma:

χT(X)=(Xλ1)m1(Xλ2)m2(Xλr)mr,

donde λ1,,λr son eigenvalores distintos de T y m1,,mr son las multiplicidades algebraicas respectivas de estos eigenvalores como raíces de χT(X).

Por el teorema de Cayley-Hamilton, sabemos que χT(T)=0, de modo que ker(χT(T))=V. Por la proposición de descomposición de la sección anterior aplicada a los polinomios Pi(X)=(Xλi)mi (verifica que son primos relativos dos a dos) para i{1,,r} tenemos entonces que V=i=1rker((Tλiid)mi).

Pero, ¿cómo es la transformación Tλiid restringida a cada ker((Tλiid)mi)? ¡Es nilpotente! Precisamente por construcción, (Tλiid)mi se anula totalmente en este kernel. Así, por la existencia de la forma canónica de Jordan para matrices nilpotentes, hay una base βi para cada ker((Tλiid)mi) tal que Tλiid restringida a ese kernel tiene como forma matricial una matriz Ji de bloques de Jordan de eigenvalor cero. Pero entonces T (restringida a dicho kernel) tiene como forma matricial a Ji+λiImi, que es una matriz de bloques de Jordan de eigenvalor λ.

Con esto terminamos: como V es la suma directa de todos esos kernel, la unión de bases β1,,βr es una base para la cual T tiene como forma matricial a una matriz de bloques de Jordan.

◻

Más adelante…

Hemos demostrado la existencia de la forma canónica de Jordan, pero aún nos falta demostrar su unicidad. Además de esto, también necesitaremos un mejor procedimiento para encontrarla. Haremos eso en la siguiente entrada.

Tarea moral

  1. Enuncia el teorema de la forma canónica de Jordan versión matrices.
  2. Investiga más sobre el lema de Bézout para polinomios y cómo se demuestra. Después de esto, expresa al polinomio 1 como combinación lineal de los polinomios x21,x3+1,x2+5x+4.
  3. Verifica que los polinomios Pi(X)=(Xλi)ki de la demostración de la existencia de la forma canónica de Jordan cumplen las hipótesis de la proposición de descomposición de kernels.
  4. Sea F un campo y r,s elementos en F. Sea n un entero. Demuestra que los bloques de Jordan Jr,n y Js,n en Mn(F) conmutan.
  5. Siguiendo las ideas de la demostración de existencia, encuentra la forma canónica de Jordan de la matriz (1111011100220002).

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»