Archivo de la etiqueta: lineal

Álgebra Lineal I: Teorema espectral para matrices simétricas reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada demostramos el teorema espectral para matrices simétricas reales en sus dos formas. Como recordatorio, lo que probaremos es lo siguiente.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Teorema. Sea A una matriz simétrica en Rn. Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Rn, tales que A=P1DP.

Para ello, usaremos los tres resultados auxiliares que demostramos en la entrada de eigenvalores de matrices simétricas reales. Los enunciados precisos están en ese enlace. Los resumimos aquí de manera un poco informal.

  • Los eigenvalores complejos de matrices simétricas reales son números reales.
  • Si una transformación T es simétrica y W es un subespacio estable bajo T, entonces W también lo es. Además, T restringida a W o a W también es simétrica.
  • Es lo mismo que una matriz sea diagonalizable, a que exista una base formada eigenvectores de la matriz.

Además de demostrar el teorema espectral, al final de la entrada probaremos una de sus consecuencias más importantes. Veremos una clasificación de las matrices que inducen formas bilineales positivas.

Demostración de la primera versión del teorema espectral

Comenzamos mostrando la siguiente versión del teorema espectral.

Teorema. Sea V un espacio euclideano y T:VV una transformación simétrica. Entonces, existe una base ortonormal de V que consiste de eigenvectores de T.

Demostración. Como V es espacio Euclideano, entonces tiene cierta dimensión finita n. Haremos inducción fuerte sobre n. Si n=1, el polinomio característico de T es de grado 1 y con coeficientes reales, así que tiene una raíz λ real. Si v es un eigenvector de T para λ, entonces vv también es eigenvector de T y conforma una base ortonormal para V.

Supongamos que el resultado es cierto para todo espacio Euclideano de dimensión menor a n y tomemos V espacio Euclideano de dimensión n. Por el teorema fundamental del álgebra, el polinomio característico de T tiene por lo menos una raíz λ en C. Como T es simétrica, cualquier matriz A que represente a T también, y λ sería una raíz del polinomio característico de A. Por el resultado que vimos en la entrada anterior, λ es real.

Consideremos el kernel W de la transformación λidT. Si W es de dimensión n, entonces W=V, y por lo tanto T(v)=λv para todo vector v en V, es decir, todo vector no cero de V es eigenvector de T. De esta forma, cualquier base ortonormal de V satisface la conclusión. De esta forma, podemos suponer que WV y que por lo tanto 1dimWn1, y como V=WW, se obtiene que 1dimWn1. Sea B una base ortonormal de W, que por lo tanto está formada por eigenvectores de T con eigenvalor λ.

Como la restricción T1 de T a W es una transformación simétrica, podemos aplicar la hipótesis inductiva y encontrar una base ortonormal B de eigenvectores de T1 (y por lo tanto de T) para W.

Usando de nuevo que V=WW, tenemos que BB es una base de V formada por eigenvectores de T.

El producto interior de dos elementos distintos de B, o de dos elementos distintos de B es cero, pues individualmente son bases ortonormales. El producto de un elemento de B y uno de B es cero pues un elemento está en W y el otro en W. Además, todos los elementos de BB tiene norma 1, pues vienen de bases ortogonales. Esto muestra que BB es una base ortonormal de V que consiste de eigenvectores de T.

◻

Demostración de la segunda versión del teorema espectral

Veamos ahora la demostración del teorema espectral en su enunciado con matrices.

Teorema. Sea A una matriz simétrica en Mn(R). Entonces, existe una matriz ortogonal P y una matriz diagonal D, ambas en Mn(R), tales que A=P1DP.

Demostración. Como A es una matriz simétrica, la transformación T:FnFn dada por T(X)=AX es simétrica. Aplicando la primer versión del teorema espectral, existe una base ortonormal de Fn que consiste de eigenvectores de T. Digamos que estos eigenvectores son C1,,Cn. Por definición de T, estos eigenvectores de T son exactamente eigenvectores de A.

Anteriormente demostramos que si construimos a una matriz B usando a C1,,Cn como columnas y tomamos la matriz diagonal D cuyas entradas son los eigenvalores correspondientes λ1,,λn, entonces A=BDB1.

Afirmamos que la matriz B es ortogonal. En efecto, la fila j de la matriz tB es precisamente Cj. De esta forma, la entrada (i,j) del producto tBB es precisamente el producto punto de Ci con Cj. Como la familia C1,,Cn es ortonormal, tenemos que dicho producto punto es uno si i=j y cero en otro caso. De aquí, se concluye que tBB=In.

Si una matriz es ortogonal, entonces su inversa también. Esto es sencillo de demostrar y queda como tarea moral. Así, definiendo P=B1, tenemos la igualdad A=P1DP, con D diagonal y P ortogonal, justo como lo afirma el teorema.

◻

Matrices positivas y positivas definidas

Una matriz A simétrica en Mn(R) induce una forma bilineal simétrica en Rn mediante la asignación (x,y)txAy, con forma cuadrática correspondiente xtxAx.

Definición. Una matriz A en Mn(R) es positiva o positiva definida si su forma bilineal asociada es positiva o positiva definida respectivamente.

Una de las aplicaciones del teorema espectral es que nos permite dar una clasificación de las matrices simétricas positivas.

Teorema. Sea A una matriz simétrica. Entonces todas las siguientes afirmaciones son equivalentes:

  1. A es positiva.
  2. Todos los eigenvalores de A son no negativos.
  3. A=B2 para alguna matriz simétrica B en Mn(R).
  4. A=tCC para alguna matriz C en Mn(R).

Demostración. (1) implica (2). Supongamos que A es positiva y tomemos λ un eigenvalor de A. Tomemos v un eigenvector de eigenvalor λ. Tenemos que:
λv2=λtvv=tv(λv)=tvAv0.

Como v20, debemos tener λ0.

(2) implica (3). Como A es matriz simétrica, por el teorema espectral tiene una diagonalización A=P1DP con P una matriz invertible y D una matriz diagonal cuyas entradas son los eigenvalores λ1,,λn de A. Como los eigenvalores son no negativos, podemos considerar la matriz diagonal E cuyas entradas son los reales λ1,,λn. Notemos que E2=D, así que si definimos a la matriz B=P1EP, tenemos que B2=P1E2P=P1DP=A.

Además, B es simétrica pues como E es diagonal y P es ortogonal, tenemos que
tB=tPtEt(P1)=P1EP=B.

(3) implica (4). Es inmediato, tomando C=B y usando que B es simétrica.

(4) implica (1). Si A=tCC y tomamos un vector v en Rn, tenemos que

tvAv=tvtCCv=t(Cv)(Cv)=Cv20,

lo cual muestra que A es positiva.

◻

También hay una versión de este teorema para matrices simétricas positivas definidas. Enunciarlo y demostrarlo queda como tarea moral.

En una entrada final, se verá otra consecuencia linda del teorema espectral: el teorema de descomposición polar. Dice que cualquier matriz con entradas reales se puede escribir como el producto de una matriz ortogonal y una matriz simétrica positiva.

Más allá del teorema espectral

Durante el curso introdujimos varias de las nociones fundamentales de álgebra lineal. Con ellas logramos llegar a uno de los teoremas más bellos: el teorema espectral. Sin embargo, la teoría de álgebra lineal no termina aquí. Si en tu formación matemática profundizas en el área, verás otros temas y resultados fundamentales como los siguientes:

  • El teorema de Cayley-Hamiltón: toda matriz se anula en su polinomio característico.
  • La clasificación de matrices diagonalizables: una matriz es diagonalizable si y sólo si su polinomio característico se factoriza en el campo de la matriz, y la multiplicidad algebraica de sus eigenvalores corresponde con la multiplicidad geométrica.
  • El teorema de la forma canónica de Jordan: aunque una matriz no se pueda diagonalizar, siempre puede ser llevada a una forma estándar «bonita».
  • Productos interiores con imágenes en C, a los que también se les conoce como formas hermitianas.
  • Los polinomios mínimos de matrices y transformaciones, que comparten varias propiedades con el polinomio característico, pero dan información un poco más detallada.

Más adelante…

En esta entrada discutimos dos demostraciones del teorema espectral. Sólo nos falta discutir cómo podemos aplicarlo. En la siguiente entrada trabajaremos con algunos problemas, por ejemplo, ver cómo se usa para demostrar que una matriz simétrica no es diagonalizable.

Finalmente, discutiremos cómo podemos pensar en las nociones de continuidad y acotamiento en el álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Muestra que la inversa de una matriz ortogonal es ortogonal.
  • Encuentra una base ortonormal de R3 conformada por eigenvectores de la matriz (10070307010).
  • Determina si la matriz anterior es positiva y/o positiva definida.
  • Enuncia y demuestra un teorema de clasificación de matrices simétricas positivas definidas.
  • Muestra que la matriz (51711077718) es positiva.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Problemas de determinantes y ecuaciones lineales

Por Blanca Radillo

Introducción

En esta entrada, realizaremos problemas que nos ayudarán a repasar el tema visto el pasado lunes, sobre soluciones de sistemas lineales, Teorema de Rouché-Capelli y la regla de Cramer.

Problemas de ecuaciones lineales

Una de las maneras más usuales para demostrar que un conjunto de vectores es linealmente independientes es probar que tomamos una combinación lineal de éstos tal que es igual a 0, sólo es posible si todos los coeficientes son igual a cero. Pero como ya lo hemos visto anteriormente en diversos problemas, algunas veces ésto nos genera un sistema de ecuaciones que puede ser difícil y/o tardado resolver.

Por ello, otra manera de demostrar independencia lineal es ilustrada con el siguiente problema.

Problema 1. Considera los vectores

v1=(1,x,0,1),v2=(0,1,2,1),v3=(1,1,1,1)

en R4. Prueba que para cualquier elección de xR, los vectores v1,v2,v3 son linealmente independientes.

Solución. Sea A la matriz cuyas columnas son v1,v2,v3, es decir,

A=(101x11021111).

Sabemos que v1,v2,v3 son linealmente independiente si y sólo si dim(span(v1,v2,v3))=3, ya que rank(A)=3, y eso es equivalente (por la clase del lunes) a demostrar que A tiene una submatriz de 3×3 invertible.

Notemos que si borramos el segundo renglón, obtenemos la submatriz cuyo determinante es

|101021111|=1,

lo que implica que es invertible, y por lo tanto v1,v2,v3 son vectores linealmente independientes.

◻

En este curso, los ejemplos usualmente utilizan espacios vectoriales sobre R o sobre C. Como RC, es natural preguntarnos si los resultados obtenidos en los problemas trabajados en R se cumplen en C. En este caso particular, si las soluciones de una matriz en Mm,n(R) son soluciones de la misma matriz pero vista como elemento en Mm,n(C). El siguiente teorema nos da el resultado a esta pregunta.

Teorema. Sea AMm,n(F) y sea F1 un campo contenido en F. Consideremos el sistema lineal AX=0. Si el sistema tiene una solución no trivial en F1n, entonces tiene una solución no trivial en Fn.

Demostración. Dado que el sistema tiene una solución no trivial en F1n, r:=rank(A)<n vista como elemento en Mm,n(F1). Por el primer teorema visto en la clase del lunes, el rango es el tamaño de la submatriz cuadrada más grande que sea invertible, y eso es independiente si se ve a A como elemento de Mm,n(F1) o de Mm,n(F). Y por el teorema de Rouché-Capelli, el conjunto de soluciones al sistema es un subespacio de Fn de dimensión nr>0. Por lo tanto, el sistema AX=0 tiene una solución no trivial en Fn.

◻

A continuación, se mostrarán dos ejemplos de la búsqueda de soluciones a sistemas lineales donde usaremos todas las técnicas aprendidas a lo largo de esta semana.

Problema. 2 Sea Sa el siguiente sistema lineal:

x2y+z=13x+2y2z=22xy+az=3.

Encuentra los valores de a para los cuales el sistema no tiene solución, tiene exactamente una solución y tiene un número infinito de soluciones.

Solución. El sistema lo podemos escribir como AX=b donde

A=(12132221a)yb=(123).

Notemos que

|12132221a|=8a1,

entonces si a1/8, A es invertible, y por lo tanto rank(A)=3, mientras que si a=1/8, A no es invertible y rank(A)=2 ya que la submatriz es invertible

|1232|=8.

Además, si la matriz (A,b) es igual a

(1211322221a3),

quitando la tercera columna, obtenemos una submatriz invertible (ejercicio). Por lo tanto, rank(A,b)=3.

Aplicando el Teorema de Rouché-Capelli, para a=1/8, el sistema AX=b no tiene soluciones. También podemos concluir que como rank(A)=3 para todo a1/8, el sistema tiene exactamente una solución. (Y AX=b nunca tiene infinitas soluciones).

Problema 3. Sean a,b,c números reales dados. Resuelve el sistema lineal

(b+c)x+by+cz=1ax+(a+c)y+cz=1ax+by+(a+b)z=1.

Solución. La matriz del sistema es

A=(b+cbcaa+ccaba+b).

No es difícil ver que det(A)=4abc. Si abc0, usando la regla de Cramer, la única solución al sistema está dada por

x=|1bc1a+cc1ba+b|4abc,y=|b+c1ca1ca1a+b|4abc

y=|b+cb1aa+c1ab1|4abc,

resolviendo los determinantes obtenemos que

x=a2(bc)24abc,y=b2(ac)24abc,z=c2(ab)24abc.

Ahora, si abc=0, entonces A no es invertible (rank(A)<3). El sistema es consistente si y sólo si rank(A)=rank(A,b).

Sin pérdida de generalidad, decimos que a=0 (pues abc=0). Esto reduce el sistema a

(b+c)x+by+cz=1c(y+z)=1b(y+z)=1.

El sistema es consistente si b=c y distintos de cero. En este caso, tenemos que b(2x+y+z)=1 y b(y+z)=1, implicando x=0, y+z=1/b. De manera similar, obtenemos las posibles soluciones si b=0 o si c=0.

Resumiendo:

  • Si abc0, el sistema tiene una solución única dada por la regla de Cramer.
  • Si tenemos alguno de los siguientes tres casos: caso 1) a=0 y b=c0; caso 2) b=0 y a=c0; caso 3) c=0 y a=b0, tenemos infinitas soluciones descritas como, para todo wR: caso 1) (0,w,1/bw); caso 2) (w,0,1/aw); caso 3) (w,1/aw,0).
  • Si no se cumplen ninguno de las cuatro condiciones anteriores para a,b,c, el sistema no es consistente.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Propiedades de determinantes

Por Ayax Calderón

Introducción

Para esta entrada enunciaremos y demostraremos algunas de las propiedades más importantes de los determinantes tanto para transformaciones lineales como para matrices. Estas propiedades de determinantes y en general el concepto de determinante tiene numerosas aplicaciones en otras áreas de las matemáticas como el cálculo de volúmenes ndimensionales o el wronskiano en ecuaciones diferenciales, sólo por mencionar algunos, por eso es importante analizar a detalle el determinante de los distintos tipos de matrices y transformaciones lineales que conocemos.

Como recordatorio, veamos qué hemos hecho antes de esta entrada. Primero, transformaciones multilineales. De ellas, nos enfocamos en las que son alternantes y antisimétricas. Definimos el determinante para un conjunto de vectores con respecto a una base, y vimos que, en cierto sentido, son las únicas formas n-lineal alternantes en un espacio vectorial de dimensión n. Gracias a esto, pudimos mostrar que los determinantes para transformaciones lineales están bien definidos, y con ellos motivar la definición de determinante para matrices.

El determinante es homogéneo

La primera de las propiedades de determinantes que enunciaremos tiene que ver con «sacar escalares» del determinante.

Teorema. Sea A una matriz en Mn(F).

  1. Si multiplicamos un renglón o una columna de A por un escalar λ, entonces su determinante se multiplica por λ.
  2. Se tiene que det(λA)=λnA.

Demostración. 1. Sea Aj la matriz obtenida me multiplicar el j-ésimo renglón por λ. Siguiendo la definición de determinante vista en la entrada de ayer (determinantes de matrices) vemos que
detAj=σSnsign(σ)a1σ(1)λajσ(j)anσ(n)=σSnsign(σ)λa1σ(1)anσ(n)=λdetA.

La demostración para la j-ésima columna queda como tarea moral.

2. Sea \lamdaA=[λaij], entonces por definición tenemos

det(λA)=σSnsign(σ)(λa1σ(1))(λanσ(n))=σSnsign(σ)λna1σ(1)anσ(n)=λndetA

De manera alternativa, podemos aplicar el primer inciso n veces, una por cada renglón.

◻

Aquí arriba hicimos la prueba explícita a partir de la definición. Una forma alternativa de proceder es notar que el determinante de una matriz es precisamente el determinante det (de vectores) con respecto a la base canónica de Fn evaluada en los renglones de A. Al multiplicar uno de los renglones por λ, el vector entrada de det se multiplica por λ. El resultado se sigue inmediatamente de que det es una forma n-lineal.

El determinante es multiplicativo

Quizás de entre las propiedades de determinantes, la más importante es que es multiplicativo. Mostraremos esto a continuación.

Teorema. Sea V un espacio vectorial de dimensión finita y transformaciones lineales T1:VV, T2:VV. Se tiene que det(T1T2)=detT1detT2.

Demostración. Sea (v1,,vn) una base cualquiera de V. Del resultado visto en la entrada anterior y la definición de determinante, se sigue que
det(T1T2)=det(v1,,vn)(T1(T2(v1)),,T1(T2(vn)))=detT1det(v1,,vn)(T2(v1),,T2(vn))=detT1detT2.

◻

Observa cómo la demostración es prácticamente inmediata, y no tenemos que hacer ningún cálculo explícito en términos de coordenadas. La demostración de que el determinante es multiplicativo para las matrices también es muy limpia.

Teorema. Sean A y B matrices en Mn(F). Se tiene que det(AB)=detAdetB.

Demostración. Sean V=Fn, T1:VV la transformación lineal definida por xAx y similarmente T2:VV la transformación lineal definida por xBx. Sabemos que A,B,AB son las matrices asociadas a T1,T2,T1T2 con respecto a la base canónica, respectivamente.

Recordemos que para una transformación lineal T en V, detT=detAT, para una matriz que la represente en cualquier base. Entonces

det(AB)=detAT1T2=detT1T2=detT1detT2=detAT1detAT2=detAdetB.

◻

Nota que hubiera sido muy complicado demostrar que el determinante es multiplicativo a partir de su definición en términos de permutaciones.

El determinante detecta matrices invertibles

Otra de las propiedades fundamentales del determinante es que nos ayuda a detectar cuándo una matriz es invertible. Esto nos permite agregar una equivalencia más a la lista de equivalencias de matrices invertibles que ya teníamos.

Teorema. Una matriz A en Mn(F) es invertible si y sólo si detA0.

Demostración. Supongamos que A es invertible, entonces existe BMn(F) tal que AB=In=BA.
Así,

1=detIn=det(AB)=detAdetB.

Como el lado izquierdo es 1, ambos factores del lado derecho son distintos de 0. Por lo tanto detA0. Nota que además esta parte de la prueba nos dice que detA1=(detA)1.

Ahora supongamos que detA0. Sea (e1,,en) la base canónica de Fn y C1,,Cn las columnas de A. Como det(e1,,en) es una forma lineal alternante, sabemos que si C1,,Cn fueran linealmente dependientes, la evaluación daría cero. Ya que la columna Ci es la imagen bajo A de ei, entonces

detA=det(e1,,en)(C1,,Cn)0.

Por lo tanto los vectores C1,,Cn son linealmente independientes y así rank(A)=n. Se sigue que A es una matriz invertible.

◻

Determinante de transformación y matriz transpuesta

Una cosa que no es totalmente evidente a partir de la definición de determinante para matrices es que el determinante no cambia si transponemos una matriz o una transformación lineal. Esta es la última de las propiedades de determinantes que probaremos ahora.

Teorema. Sea A una matriz en Mn(F). Se tiene que det(tA)=detA.

Demostración. Por definición

det(tA)=σSnsign(σ1)aσ1(1)1aσ1(n)n.

Luego, para cualquier permutación σ se tiene

aσ(1)1aσ(n)n=a1σ1(1)anσ1(n)

pues aiσ1(i)=aσ(j)j, donde j=σ1(i).
También vale la pena notar que sign(σ1)=sign(σ)1=sign(σ).

De lo anterior se sigue que

det(tA)=σSnsign(σ1)a1σ1(1)anσ1(n)=σSnsign(σ)a1σ(1)anσ(n)=detA.

◻

Teorema. Sea V un espacio vectorial de dimensión finita T:VV una transformación lineal. Se tiene que det(tT)=detT.

Demostración. Sea A la matriz asociada a T, entonces tA es la matriz asociada a tT. Luego det(tT)=det(tA)=detA=detT.

◻

Veamos un ejemplo de un problema en el que podemos aplicar algunas de las propiedades anteriores.

Problema. Sea AMn(F) una matriz antisimétrica para algún n impar. Demuestra que det(A)=0.

Demostración. Como A=At, entonces detA=det(tA), pero detA=det(tA).
Se sigue que
det(tA)=det(tA)=(1)ndet(tA)=det(tA).

Concluimos det(tA)=0

◻

Más adelante…

En esta entrada enunciamos y demostramos varias propiedades de los determinantes. Ahora, vamos a ponerlas en práctica resolviendo algunos problemas.

En las siguientes entradas, que constituyen la parte final del curso, vamos a hablar de diferentes técnicas para calcular el determinante de una matriz y obtendremos sus eigenvalores y eigenvectores. Vamos a ver cómo esto nos conduce a uno de los teoremas más importantes del curso de Álgebra Lineal I: el teorema espectral.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Muestra que al multiplicar una columna de una matriz por λ, entonces su determinante se multiplica por λ.
  • Demuestra que si una matriz tiene dos columnas iguales, entonces su determinante es igual a cero.
  • Analiza cómo es el determinante de una matriz antisimétrica AMn(F) con n par.
  • Formaliza la frase «el determinante detecta transformaciones invertibles» en un enunciado matemático. Demuéstralo.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Determinantes de vectores e independencia lineal

Por Leonardo Ignacio Martínez Sandoval

Introducción

En este cuarto y último bloque del curso comenzamos hablando de transformaciones multilineales y de permutaciones. Luego, nos enfocamos en las transformaciones multilineales antisimétricas y alternantes. Con la teoría que hemos desarrollado hasta ahora, estamos listos para definir determinantes de vectores, de transformaciones lineales y de matrices.

En esta entrada comenzaremos con la definición de determinantes de vectores. En la siguiente entrada hablaremos acerca de determinantes de matrices y de transformaciones lineales. Después de definir determinantes, probaremos varias de las propiedades que satisfacen. Posteriormente, hablaremos de varias técnicas que nos permitirán calcular una amplia variedad de determinantes para tipos especiales de matrices.

Determinantes de vectores

Para empezar, definiremos qué es el determinante de un conjunto de vectores en un espacio de dimensión finita con respecto a una base.

Definición. Sea B=(b1,,bn) una base de un espacio vectorial V de dimensión finita n y x1,,xn vectores de V. Cada uno de los xi se puede escribir como xi=j=1najibj.

El determinante de x1,,xn con respecto a (b1,,bn) es σSnsign(σ)a1σ(1)anσ(n), y lo denotamos por det(b1,,bn)(x1,,xn).

Observa que estamos sumando tantos términos como elementos en Sn. Como existen n! permutaciones de un conjunto de n elementos, entonces la suma de la derecha tiene n! sumandos.

Ejemplo. Consideremos la base b1=1, b2=1+x y b3=1+x+x2 del espacio vectorial R2[x] de polinomios con coeficientes reales y grado a lo más 2. Tomemos los polinomios v1=1, v2=2x y v3=3x2. Vamos a calcular el determinante de v1,v2,v3 con respecto a la base (b1,b2,b3).

Para hacer eso, lo primero que tenemos que hacer es expresar a v1,v2,v3 en términos de la base. Hacemos esto a continuación:
v1=1b1+0b2+0b3v2=2b1+2b2+0b3v3=0b13b2+3b3.

De aquí, obtenemos
a11=1,a21=0,a31=0,a12=2,a22=2,a32=0,a13=0,a23=3,a33=3.

Si queremos calcular el determinante, tenemos que considerar las 3!=321=6 permutaciones en S3. Estas permutaciones son

σ1=(123123)σ2=(123132)σ3=(123213)σ4=(123231)σ5=(123321)σ6=(123312).

Los signos de σ1,,σ6 son, como puedes verificar, 1, 1, 1, 1, 1 y 1, respectivamente.

El sumando correspondiente a σ1 es
(1)sign(σ1)a1σ1(1)a2σ1(2)a3σ1(3)(2)=1a11a22a33(3)=1123=6.

El sumando correspondiente a σ2 es
(4)sign(σ2)a1σ2(1)a2σ2(2)a3σ2(3)(5)=(1)a11a23a32(6)=(1)1(3)0=0.

Continuando de esta manera, se puede ver que los sumandos correspondientes a σ1,,σ6 son +6,0,0,+0,0,+0, respectivamente de modo que el determinante es 6.

La expresión de determinante puede parecer algo complicada, pero a través de ella podemos demostrar fácilmente algunos resultados. Consideremos como ejemplo el siguiente resultado.

Proposición. Sea B=(b1,,bn) una base de un espacio vectorial V de dimensión finita n. El determinante de B con respecto a sí mismo es 1.

Demostración. Cuando escribimos a bi en términos de la base b, tenemos que bi=j=1najibj. Como la expresión en una base es única, debemos tener aii=1 y aji=0 si ji. Ahora, veamos qué le sucede al determinante σSnsign(σ)a1σ(1)anσ(n).

Si σ es una permutación tal que σ(i)i para alguna i, entonces en el producto del sumando correspondiente a σ aparece aiσ(i)=0, de modo que ese sumando es cero. En otras palabras, el único sumando no cero es cuando σ es la permutación identidad.

Como el signo de la identidad es 1 y cada aii es 1, tenemos que el determinante es
σSnsign(σ)a1σ(1)anσ(n)=a11ann=11=1.

◻

El determinante es una forma n-lineal alternante

La razón por la cual hablamos de transformaciones n-lineales antisimétricas y alternantes antes de hablar de determinantes es que, en cierto sentido, los determinantes de vectores son las únicas transformaciones de este tipo. Los siguientes resultados formalizan esta intuición.

Teorema. Sea B=(b1,,bn) una base de un espacio vectorial V sobre F. Entonces la transformación det(b1,,bn):VnF es una forma n-lineal y alternante.

Demostración. La observación clave para demostrar este resultado es que det(b1,,bn) se puede reescribir en términos de la base dual b1,,bn. En efecto, recuerda que bi es la forma lineal que «lee» la coordenada de un vector v escrito en la base B. De esta forma,

det(b1,,bn)(v1,,vn)=σSn(sign(σ)j=1nbj(vσ(j)))

Para cada permutación σ, el sumando correspondiente es una forma n-lineal, pues es producto de n formas lineales evaluadas en los distintos vectores. Así que det(b1,,bn) es suma de formas n-lineales y por lo tanto es forma n-lineal.

Para mostrar que el determinante es alternante, tenemos que mostrar que es igual a 0 cuando algún par de sus entradas son iguales. Supongamos que ij y que vi=vj. Tomemos τ a la transposición que intercambia a i y a j. Cuando se compone una permutación con una transposición, su signo cambia. Así, para cualquier permutación σ, tenemos que στ tiene signo diferente.

Además, para cualquier σ tenemos que a1σ(1)anσ(n) y a1στ(1)anστ(n) son iguales, pues vi=vj. Combinando ambas ideas, podemos emparejar a cada sumando del determinante con otro con el cual sume cero. Esto muestra que el determinante es 0.

◻

Usando la teoría que desarrollamos en la entrada anterior, tenemos el siguiente corolario.

Corolario. La forma n-lineal det(b1,,bn) es antisimétrica.

Los determinantes de vectores son las «únicas» formas n-lineales alternantes

Ya vimos que el determinante es una forma n-lineal alternante. Veamos ahora por qué decimos que es «la única». El siguiente resultado dice que cualquier otra forma n-lineal alternante varía de det(b1,,bn) únicamente por un factor multiplicativo.

Teorema. Sea B=(b1,,bn) una base de un espacio vectorial V. Si f:VnF es cualquier forma n-lineal y alternante, entonces f=f(b1,,bn)det(b1,,bn).

Demostración. Para mostrar la igualdad del teorema, que es una igualdad de transformaciones, tenemos que ver que es cierta al evaluar en cualesquiera vectores x1,,xn. Escribamos a cada xi en términos de la base B: xi=j=1naijbj.

Usando la n-linealidad de f en cada una de las entradas, tenemos que
f(x1,,xn)=i=1na1if(bi,x2,,xn)=i,j=1na1ia2if(bi,bj,x3,,xn)==i1,,in=1na1i1aninf(bi1,,bin).

Aquí hay muchos términos, pero la mayoría de ellos son 0. En efecto, si bik=bil, como f es alternante tendríamos que ese sumando es 0. Así, los únicos sumandos que pueden ser no cero son cuando la elección de subíndices es una permutación, es decir cuando existe σ en Sn tal que para ik=σ(k).

Por lo tanto, podemos simplificar la expresión anterior a
f(x1,,xn)=σSna1σ(1)anσ(n)f(bσ(1),,bσ(n)).

Como f es alternante, entonces es antisimétrica. De este modo, podemos continuar la igualdad anterior como
=σSnsign(σ)a1σ(1)anσ(n)f(b1,,bn)=f(b1,,bn)det(b1,,bn)(x1,,xn).

Esto es justo lo que queríamos probar.

◻

Los determinantes de vectores caracterizan bases

Como consecuencia del último teorema de la sección anterior, los determinantes de vectores caracterizan totalmente a los conjuntos de vectores que son bases. A continuación enunciamos esto formalmente.

Corolario. En un espacio vectorial V de dimensión n son equivalentes las siguientes tres afirmaciones para vectores x1,,xn de V:

  1. El determinante de x1,,xn con respecto a toda base es distinto de 0.
  2. El determinante de x1,,xn con respecto a alguna base es distinto de 0.
  3. x1,,xn es una base de V.

Demostración. La afirmación (1) es más fuerte que la (2) y por lo tanto la implica.

Ahora, probemos que la afirmación (2) implica la afirmación (3). Como x1,,xn son n vectores y n es la dimensión de V, para mostrar que forman una base basta mostrar que son linealmente independientes. Anteriormente, vimos que cualquier forma alternante manda vectores linealmente dependientes a 0. Como la hipótesis de (2) es que existe alguna forma alternante que no se anula en x1,,xn, entonces deben ser linealmente independientes y por lo tanto formar una base.

Finalmente, probemos que (3) implica (1). Tomemos B=(b1,,bn) otra base de V. Como det(x1,,xn) es una forma n-lineal, podemos aplicar el teorema anterior y evaluar en x1,,xn para concluir que
det(x1,,xn)(x1,,xn)=det(x1,,xn)(b1,,bn)det(b1,,bn)(x1,,xn).

El término de la izquierda es igual a 1, de modo que ambos factores a la derecha deben ser distintos de 0.

◻

Ejemplo. En el ejemplo que dimos de polinomios vimos que el determinante de 1, 2x y 3x2 con respecto a la base 1, 1+x y 1+x+x2 es igual a 6. De acuerdo al teorema anterior, esto implica que 1, 2x y 3x2 es un conjunto linealmente independiente de polinomios, y de hecho una base.

Además, el teorema anterior también implica que sin importar que otra base B de R2[x] tomemos, el determinante de 1, 2x y 3x2 con respecto a B también será distinto de 0.

Más adelante…

A lo largo de esta entrada estudiamos la definición de determinantes para un conjunto de vectores y enunciamos sus principales propiedades. En las siguientes entradas vamos a hablar cómo se define el determinante para matrices y para transformaciones lineales. Después de las definiciones, pasaremos a estudiar cómo se calculan los determinantes y veremos cómo se aplican a diferentes problemas de álgebra lineal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • ¿Cuántos sumandos tendrá el determinante de 5 vectores en un espacio vectorial de dimensión 5 con respecto a cualquier base? Da el número de manera explícita.
  • Verifica que en el primer ejemplo de determinantes de esta entrada, en efecto los sumandos correspondientes a σ1,,σ6 son los que se enuncian.
  • Encuentra el determinante de los vectores (3,1) y (2,4) con respecto a la base ((5,1),(2,3)) de R2.
  • Muestra que los vectores (1,4,5,2), (0,3,2,1), (0,0,1,4) y (0,0,0,1) son linealmente independientes calculando por definición su determinante con respecto a la base canónica de R4.
  • Usa un argumento de determinantes para mostrar que los vectores (1,4,3), (2,2,9), (7,8,27) de R3 no son linealmente independientes. Sugerencia. Calcula su determinante con respecto a la base canónica.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Transformaciones multilineales antisimétricas y alternantes

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior hablamos de la importancia que tiene poder diagonalizar una matriz: nos ayuda a elevarla a potencias y a encontrar varias de sus propiedades fácilmente. En esa entrada discutimos a grandes rasgos el caso de matrices en M2(R). Dijimos que para dimensiones más altas, lo primero que tenemos que hacer es generalizar la noción de determinante de una manera que nos permita probar varias de sus propiedades fácilmente. Es por eso que introdujimos a las funciones multilineales y dimos una introducción a permutaciones. Tras definir las clases de transformaciones multilineales alternantes y antisimétricas, podremos finalmente hablar de determinantes.

Antes de entrar con el tema, haremos un pequeño recordatorio. Para d un entero positivo y V, W espacios vectoriales sobre un mismo campo, una transformación d-lineal es una transformación multilineal de Vd a W, es decir, una tal que al fijar cualesquiera d1 coordenadas, la función que queda en la entrada restante es lineal.

Con [n] nos referimos al conjunto {1,2,,n}. Una permutación en Sn es una función biyectiva σ:[n][n]. Una permutación invierte a la pareja i<j si σ(i)>σ(j). Si una permutación σ invierte una cantidad impar de parejas, decimos que es impar y que tiene signo sign(σ)=1. Si invierte a una cantidad par de parejas (tal vez cero), entonces es par y tiene signo sign(σ)=1.

Transformaciones n-lineales antisimétricas y alternantes

Tomemos d un entero positivo, V, W espacios vectoriales sobre el mismo campo y σ una permutación en Sd. Si T:VdW es una transformación d-lineal, entonces la función (σT):VdW dada por (σT)(v1,,vd)=T(vσ(1),vσ(2),,vσ(d)) también lo es. Esto es ya que sólo se cambia el lugar al que se lleva cada vector. Como T es lineal en cualquier entrada (al fijar las demás), entonces σT también.

Definición. Decimos que T es antisimétrica si σT=sign(σ)T para cualquier permutación σ en Sd. En otras palabras, T es antisimétrica si σT=T para las permutaciones pares y σT=T para las permutaciones impares.

Definición. Decimos que T es alternante si T(v1,,vd)=0 cuando hay dos vi que sean iguales.

Ejemplo. Consideremos la función T:(R2)2R dada por T((a,b),(c,d))=adbc. Afirmamos que ésta es una transformación 2-lineal alternante y antisimétrica. La parte de mostrar que es 2-lineal es sencilla y se queda como tarea moral.

Veamos primero que es una función alternante. Tenemos que mostrar que si (a,b)=(c,d), entonces T((a,b),(c,d))=0. Para ello, basta usar la definición: T((a,b),(a,b))=abab=0.

Ahora veamos que es una función antisimétrica. Afortunadamente, sólo hay dos permutaciones en S2, la identidad id y la permutación σ que intercambia a 1 y 2. La primera tiene signo 1 y la segunda signo 1.

Para la identidad, tenemos (idT)((a,b),(c,d))=σ((a,b),(c,d)), así que (idT)=T=sign(id)T, como queremos.

Para σ, tenemos que σT es aplicar T pero «con las entradas intercambiadas». De este modo:
(σT)((a,b),(c,d))=T((c,d),(a,b))=cbda=(adbc)=T((a,b),(c,d)).

Esto muestra que (σT)=T=sign(σ)T.

◻

Equivalencia entre alternancia y antisimetría

Resulta que ambas definiciones son prácticamente la misma. Las transformaciones alternantes siempre son antisimétricas. Lo único que necesitamos para que las transformaciones antisimétricas sean alternantes es que en el campo F en el que estamos trabajando la ecuación 2x=0 sólo tenga la solución x=0. Esto no pasa, por ejemplo, en Z2. Pero sí pasa en Q, R y C.

Proposición. Sean V y W espacios vectoriales sobre un campo donde 2x=0 sólo tiene la solución x=0. Sea d un entero positivo. Una transformación d-lineal T:VdW es antisimétrica si y sólo si es alternante.

Demostración. Supongamos primero que T es antisimétrica. Mostremos que es alternante. Para ello, supongamos que para ij tenemos que xi=xj.

Tomemos la permutación σ:[d][d] tal que σ(i)=j, σ(j)=i y σ(k)=k para todo k distinto de i y j. A esta permutación se le llama la transposición (i,j). Es fácil mostrar (y queda como tarea moral), que cualquier transposición tiene signo 1.

Usando la hipótesis de que T es antisimétrica con la transposición (i,j), tenemos que
T(x1,,xi,,xj,,xn)=T(x1,,xj,,xi,,xn)=T(x1,,xi,,xj,,xn),

en donde en la segunda igualdad estamos usando que xi=xj. De este modo, 2T(x1,,xi,,xj,,xn)=0, y por la hipótesis sobre el campo, tenemos que T(x1,,xi,,xj,,xn)=0. Así, cuando dos entradas son iguales, la imagen es 0, de modo que la transformación es alternante.

Hagamos el otro lado de la demostración. Observa que este otro lado no usará la hipótesis del campo. Supongamos que T es alternante.

Como toda permutación es producto de transposiciones y el signo de un producto de permutaciones es el producto de los signos de los factores, basta con mostrar la afirmación para transposiciones. Tomemos entonces σ la transposición (i,j). Tenemos que mostrar que σT=sign(σ)T=T.

Usemos que T es alternante. Pondremos en las entradas i y j a la suma de vectores xi+xj, de modo que T(x1,,xi+xj,,xi+xj,,xn)=0. Usando la n-linealidad de T en las entradas i y j para abrir el término a la izquierda, tenemos que
0=T(x1,,xi,,xi,,xn)+T(x1,,xi,,xj,,xn)+T(x1,,xj,,xi,,xn)+T(x1,,xj,,xj,,xn).

Usando de nuevo que T es alternante, el primero y último sumando son cero. Así, T(x1,,xi,,xj,,xn)=T(x1,,xj,,xi,,xn).

En otras palabras, al intercambiar las entradas i y j se cambia el signo de T, que precisamente quiere decir que (σT)=sign(σ)T.

◻

Las transformaciones alternantes se anulan en linealmente dependientes

Una propiedad bastante importante de las transformaciones alternantes es que ayudan a detectar a conjuntos de vectores linealmente dependientes.

Teorema. Sea T:VdW una transformación d-lineal y alternante. Supongamos que v1,,vd son linealmente dependientes. Entonces T(v1,v2,,vd)=0.

Demostración. Como los vectores son linealmente dependientes, hay uno que está generado por los demás. Sin perder generalidad, podemos suponer que es vd y que tenemos vd=α1v1++αd1vd1 para ciertos escalares α1,,αd1.

Usando la d-linealidad de T, tenemos que
T(v1,v2,,vd1,vd)=T(v1,,vd1,i=1d1αivi)=i=1d1αiT(v1,,vd1,vi).

Usando que T es alternante, cada uno de los sumandos del lado derecho es 0, pues en el i-ésimo sumando tenemos que aparece dos veces el vector vi entre las entradas de T. Esto muestra que T(v1,,vd)=0, como queríamos mostrar.

◻

Introducción a definiciones de determinantes

En la siguiente entrada daremos tres definiciones de determinante. Una es para un conjunto de vectores. Otra es para transformaciones lineales. La última es para matrices. Todas ellas se motivan entre sí, y las propiedades de una nos ayudan a probar propiedades de otras. En esa entrada daremos las definiciones formales. Por ahora sólo hablaremos de ellas de manera intuitiva.

Para definir el determinante para un conjunto de vectores, empezamos con un espacio vectorial V de dimensión n y tomamos una base B=(b1,,bn). Definiremos el determinante con respecto a B de un conjunto de vectores (v1,v2,,vn) , al cual denotaremos por det(b1,,bn)(v1,,vn)de V de la manera siguiente.

A cada vector vi lo ponemos como combinación lineal de elementos de la base: vi=j=1najibj. El determinante det(b1,,bn)(v1,,vn) es σS(n)sign(σ)a1σ(1)a2σ(1)anσ(n).

Observa que esta suma tiene tantos sumandos como elementos en Sn, es decir, como permutaciones de [n]. Hay n! permutaciones, así que esta suma tiene muchos términos incluso si n no es tan grande.

Veremos que para cualquier base B, el determinante con respecto a B es una forma d-lineal alternante, y que de hecho las únicas formas d-lineales alternantes en V «son determinantes», salvo una constante multiplicativa.

Luego, para una transformación T:VV definiremos al determinante de T como el determinante det(b1,,bn)(T(b1),,T(bn)), y veremos que esta definición no depende de la elección de base.

Finalmente, para una matriz A en Mn(F), definiremos su determinante como el determinante de la transformación TA:FnFn tal que TA(X)=AX. Veremos que se recupera una fórmula parecida a la de determinante para un conjunto de vectores.

Los teoremas que veremos en la siguiente entrada nos ayudarán a mostrar más adelante de manera muy sencilla que el determinante para funciones o para matrices es multiplicativo, es decir, que para T:VV, S:VV y para matrices A,B en Mn(F) se tiene que

det(TS)=det(T)det(S)det(AB)=det(A)det(B).

También mostraremos que los determinantes nos ayudan a caracterizar conjuntos linealmente independientes, matrices invertibles y transformaciones biyectivas.

Más Adelante…

En esta entrada hemos definido las clases de transformaciones lineales alternantes y antisimétricas; esto con la finalidad de introducir el concepto de determinantes. Además hemos dado una definición intuitiva del concepto de determinante.

En las siguientes entrada estudiaremos diferentes definiciones de determinante: para un conjunto de vectores, para una transformación lineal y finalmente para una matriz. Veremos cómo el uso de determinantes nos ayuda a determinar si un conjunto es linealmente independiente, si una matriz es invertible o si una transformación es biyectiva; además de otras aplicaciones.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Prueba que la función T:(R2)2R dada por T((a,b),(c,d))=adbc es 2-lineal. Para esto, tienes que fijar (a,b) y ver que es lineal en la segunda entrada, y luego fijar (c,d) y ver que es lineal en la primera.
  • Muestra que las transposiciones tienen signo 1. Ojo: sólo se intercambia el par (i,j), pero puede ser que eso haga que otros pares se inviertan.
  • Muestra que cualquier permutación se puede expresar como producto de transposiciones.
  • Muestra que la suma de dos transformaciones n-lineales es una transformación n-lineal. Muestra que al multiplicar por un escalar una transformación n-lineal, también se obtiene una transformación n-lineal.
  • ¿Es cierto que la suma de transformaciones n-lineales alternantes es alternante?

Al final del libro Essential Linear Algebra with Applications de Titu Andreescu hay un apéndice en el que se habla de permutaciones. Ahí puedes aprender o repasar este tema.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»