Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Variable Compleja I: Series de potencias. Introducción y criterios de convergencia

Por Pedro Rivera Herrera

Introducción

En esta entrada abordaremos el concepto de serie de potencias, la cual es un tipo particular de serie de números complejos y/o serie de funciones de números complejos, por lo que los resultados de las dos entradas anteriores nos serán de gran utilidad para caracterizar a dichas series.

En general, las series de potencias resultan de gran interés puesto que nos permiten aproximar y definir funciones, en particular a las funciones complejas elementales como lo haremos en las siguientes entradas. Nuestro objetivo en esta entrada es establecer algunos resultados elementales para determinar cuándo y en qué conjuntos estas series convergen.

Definición 29.1. (Serie de Potencias.)
Sean z0C y {cn}n0C una sucesión de números complejos. Una serie de la forma: (29.1)n=0cn(zz0)n, para cada zC, es llamada serie de potencias centrada en z0 y los números cnC son llamados los coeficientes de la serie.

Observación 29.1.
Recordemos que hemos hecho antes la convención (zz0)0=1 para todo zz0C.

Considerando lo anterior, podemos pensar a una serie de potencias como una serie de números complejos o como una serie de funciones, por lo que, en cualquiera de los dos casos podemos hablar de los conceptos de convergencia, convergencia absoluta, convergencia puntual y convergencia uniforme establecidos en las entradas anteriores.

Si consideramos a una serie de potencias, dada en (29.1), como una serie de funciones, entonces dicha serie está definida por la sucesión de funciones:
f0(z)=c0,fn(z)=cn(zz0)n,n1.

Bajo esta idea, es claro que cada serie de potencias define a una función compleja, de variable z, cuyo dominio natural consistirá de todos los zC para los cuales la serie de funciones (29.1) converge. Por tanto, en caso de ser necesario podemos elegir distintos dominios para dicha función, correspondientes con subconjuntos del dominio natural dado por la convergencia de la serie.

Observación 29.2.
Notemos que la serie dada por (29.1) siempre converge en el centro, es decir, si z=z0 entonces para n1 todos los términos de la serie se anulan, mientras que para n=0 se obtiene la constante c0C, por lo que la serie de potencias converge.

Por otra parte, para zz0 la serie de potencias puede converger o diverger, como veremos más adelante.

Si planteamos el cambio de variable:
(29.2)ζ=zz0, es claro que ζ=0 si y solo si z=z0 y ζ0 si y solo si zz0, entonces la serie de potencias dada en (29.1) toma la forma:
(29.3)n=0cnζn,ζC, de donde (29.3) converge si ζ=0, mientras que para ζ0 la serie puede converger o diverger.

El cambio de variable dado en (29.2) puede simplificar un poco las cuentas, por lo que trabajaremos indistintamente con una serie de potencias de la forma (29.1) ó (29.3), simplemente considerando z=ζ y a la serie centrada en el origen, es decir, z0=0. Para recuperar el caso general bastará con realizar el cambio de variable (29.2).

Ejemplo 29.1.
Veamos que para una serie de potencias, de la forma (29.1) ó (29.3), se cumple alguna de las siguientes condiciones.

  1. La serie converge para todo zC ó ζC.
  2. La serie converge solo para z=z0 ó ζ=0.
  3. La serie converge solo para los z ó ζ en alguna región del plano complejo C.

Solución. Por ahora, para verificar la afirmación basta con dar un ejemplo para cada caso. Más adelante, corolario 29.1, probaremos esta afirmación.

Veamos que cada condición se cumple sin importar si la serie de potencias es de la forma (29.1) ó (29.3).

  1. Consideremos a las series de potencias: n=0(z1+i)n(n!)2yn=0ζnn!. Para la primera serie tenemos que z0=1i. Es claro que para z=z0 la serie de potencias converge. Supongamos que zz0, entonces: λ=limn|(z1+i)n+1[(n+1)!]2||(z1+i)n(n!)2|=limn|(z1+i)n+1(n!)2(z1+i)n[(n+1)!]2|=limn|z1+i|(n!)2(n+1)2(n!)2=limn|z1+i|(n+1)2=0. Entonces, por el criterio del cociente de D’Alembert, proposición 27.5, para todo zz0 la serie converge absolutamente. Por lo tanto, para todo zC la primera serie de potencias converge.

    Por otra parte, para la segunda serie de potencias, por el ejemplo 27.8, sabemos que la serie es absolutamente convergente para todo ζC, por lo que la segunda serie de potencias también converge para todo ζC.
  2. Consideremos a las series de potencias: n=1nn(zi)nnyn=0n!ζn. Para la primera serie tenemos que z0=i, c0=0 y cn=nnn para n1. Es claro que para z=z0 la serie de potencias converge. Supongamos que zz0, entonces: λ=limn|nn(zi)nn|1/n=limnn|zi|n1/n=, ya que limnn= y limnn1/n=1.

    Entonces, por el criterio de la raíz, proposición 27.6, tenemos que la serie diverge para toda zz0. Por lo tanto, la primera serie de potencias converge solo para z=z0.

    Por otra parte, para la segunda serie de potencias es claro que la serie converge si ζ=0. Mientras que para ζ0 tenemos que: limnn!ζn=, desde que limnn!= y |ζn|r>0 para toda nN, es decir, la sucesión {ζn}n0, con ζ0, está separada de cero, proposición 8.2(5).

    Por lo tanto, la segunda serie solo converge para ζ=0.
  3. Consideremos a las series de potencias: n=0(2)n(z+2)nn+1yn=0ζn.Para la primera serie tenemos que z0=2. Es claro que para z=z0 la serie de potencias converge. Si zz0, tenemos: λ=limn|(2)n+1(z+2)n+1n+2||(2)n(z+2)nn+1|=limn|2||(n+1)(z+2)n+1(n+2)(z+2)n|=limn(2)|z+2|n+1n+2=2|z+2|.Entonces, por el criterio del cociente de D’Alembert, proposición 27.5, tenemos que la serie converge si λ=2|z+2|<1, es decir, para todo zC tal que |z+2|<1/2, mientras que la serie diverge si |z+2|>1/2.

    Por último, para la segunda serie de potencias, por el ejemplo 27.3 sabemos que la serie geométrica es convergente para todo ζC tal que |ζ|<1 y divergente si |ζ|1.

Observación 29.3.
Al trabajar con una serie de potencias, ya sea de la forma (29.1) ó (29.3), debemos ser cuidadosos al identificar los coeficientes de la serie, puesto que no siempre están dados de forma explícita y esto puede llegar a causar errores al manipular a las series de potencias y/o al deducir algo relacionado con su convergencia.

Una vez que estemos seguros de que los coeficientes de la serie corresponden con la regla explícita dada en la serie, podemos trabajar con dicha regla para obtener los coeficientes.

Ejemplo 29.2.
Identifiquemos los coeficientes de las siguientes series de potencias.
a) n=0(1)n2nz2n.
b) n=1znn.
c) n=1(1)nzn1n(n+1).

Solución. Es claro que las tres series están centradas en z0=0. Procedemos a escribir a las series de potencias de acuerdo con la definición 29.1.

a) Tenemos que:
n=0(1)n2nz2n=k=0ckzk, de donde:
ck={(1)n2n,si existenNtal quek=2n,0,en otro caso.

Por lo que:
c0=1,c1=0,c2=12,c3=0,,c2n=(1)n2n,c2n+1=0,

es decir:
ck={(1)n2n,sik=2n,0,sik=2n+1,connN.

b) Tenemos que:
n=1znn=k=0ckzk, de donde:
ck={1n,si existenNtal quek=n,0,en otro caso.

Por lo que:
c0=0,c1=1,c2=12,c3=13,,cn=1n,es decir:
ck={1k,sik1,0,sik=0.

c) Tenemos que:
n=1(1)nzn1n(n+1)=k=0ckzk,de donde:
ck={(1)nn(n+1),si existenNtal quek=n1,0,en otro caso.

Por lo que:
c0=(1)11(1+1)=12,c1=(1)22(2+1)=16,c2=(1)33(3+1)=112,, es decir:
ck=(1)k+1(k+1)(k+2),kN.

Nuestra primera tarea es determinar bajo qué condiciones una serie de potencias converge, pues como vimos en el ejemplo 29.1, existen series de potencias que convergen en todo C, en un sólo punto o en alguna región del plano complejo. Es claro que un ejemplo no es una prueba de este hecho, por lo que procedemos a verificarlo de manera formal.

Proposición 29.1. (Lema de Abel.)
Si la serie de potencias n=0cnzn converge para algún z=z00, entonces la serie converge absolutamente para todo zC tal que |z|<|z0|.

Más aún, si la serie diverge para algún z=z10, entonces la serie diverge para todo zC tal que |z1|<|z|.

Demostración. Dadas las hipótesis, procedemos a verificar la primera parte de la proposición.

Si la serie n=0cnz0n converge, con z00, entonces, por el corolario 27.1, se cumple que:
limncnz0n=0,

es decir, la sucesión {cnz0n}n0 converge a 0, por lo que, proposición 8.1, es una sucesión acotada. Entonces, existe M>0 tal que:
|cn||z0|n=|cnz0n|M,nN.

Como z00, tenemos que:
|cn|M|z0|n,nN,

de donde:
|cnzn|M|zz0|n,nN.

Si |z|<|z0|, entonces la serie geométrica n=0M|zz0|n es convergente, por lo que, se sigue del criterio de comparación, proposición 27.4, que la serie n=0cnzn es absolutamente convergente.

Por último, para la segunda parte procedemos por reducción al absurdo. Supongamos que n=0cnz1n diverge. Si |z1|<|z| y la serie n=0cnzn converge, entonces de la primera parte se sigue que n=0cnz1n converge, lo cual claramente es una contradicción. Por lo tanto n=0cnzn diverge si |z|>|z1|.

◼

El lema de Abel es de suma importancia para poder establecer el siguiente resultado, el cual será un parteaguas para los resultados de esta entrada.

Proposición 29.2. (Radio de convergencia.)
Sea n=0cn(zz0)n una serie de potencias, entonces existe un número R[0,] tal que:

  1. la serie es absolutamente convergente si |zz0|<R;
  2. la serie converge absoluta y uniformemente en todo disco cerrado B(z0,r), con r fijo tal que r<R;
  3. si |zz0|>R la serie diverge.

Demostración. Sea n=0cn(zz0)n una serie de potencias, definimos:
S:={ρ[0,):n=0cnρnconverge}.

Notemos que S desde que 0S.

Afirmamos que el número R que cumple lo anterior está dado por R:=supS.

  1. De acuerdo con el enunciado de la proposición, debe ser claro que podemos tener dos casos extremos: si R=0 ó si R=, los cuales están dados por la definición de R como sigue.

    Si S no es acotado superiormente, adoptamos la convención R=. Veamos que en tal caso, la serie n=0cn(zz0)n converge absoluta y uniformemente en B(z0,r), para cualquier r0.

    Si elegimos a ρS tal que |zz0|r<ρ, entonces la serie n=0cnρn es convergente y de la proposición 27.4(1) tenemos que la serie n=0cnrn es absolutamente convergente. Dado que: |cn(zz0)n||cnrn|=|cn|rn,nN, entonces del criterio M de Weierstrass, proposición 28.3, se sigue que la serie n=0cn(zz0)n converge absoluta y uniformemente en B(z0,r). Como r es arbitario, entonces tenemos el caso R=.

    Supongamos que S es acotado superiormente. Si R=0, entonces la serie solo converge si z=z0, por lo que, lema de Abel, la serie converge absolutamente solo en el centro.

    Si R>0 y |zz0|<R, entonces, por la definición de R, existe rS tal que: |zz0|<rR.Dado que rS, entones la serie n=0cnrn es convergente. Notemos que la serie n=0cn(zz0)n converge para z=r+z0, por lo que, lema de Abel, la serie converge absolutamente para |zz0|<rR, lo cual completa el caso |zz0|<R.
  2. Sea zB(z0,r), con r fijo tal que r<R, entonces, por la definición de R, podemos elegir ρS tal que r<ρR. Como la serie n=0cnρn converge, entonces, proposición 27.4(1), la serie n=0|cn|rn converge, por lo que, criterio M de Weierstrass, la serie n=0cn(zz0)n es absoluta y uniformemente convergente en B(z0,r).
  3. Supongamos que |zz0|>R, entonces, por la definición de R, existe rS tal que: Rr<|zz0|. Como la serie n=0cnrn diverge, entonces la serie n=0cn(zz0)n diverge para z=z0+r, por lo que, por lema de Abel, la serie diverge para todo zC tal que Rr<|zz0|.

◼

Definición 29.2. (Radio de convergencia.)
Se llama radio de convergencia de la serie de potencias n=0cn(zz0)n al número R dado en la proposición 29.2.

Al conjunto B(z0,R)={zC:|zz0|<R} se le llama su disco de convergencia asociado, figura 108. En algunos textos suele hablarse del círculo de convergencia de la serie, el cual se asocia al conjunto B(z0,R)={zC:|zz0|R}, ya que geométricamente corresponde con el interior y la frontera de una circunferencia de radio R centrada en z0.

Observación 29.4.
Notemos que la proposición no nos dice nada sobre la convergencia o divergencia de la serie para el caso en que R=|zz0|. Como veremos en la proposición 29.3, no podemos afirmar nada sobre tal caso.

La proposición 29.2 nos da la prueba de la afirmación hecha en el ejemplo 29.1.

Corolario 29.1.
Sea n=0cn(zz0)n una serie de potencias y sea R su radio de convergencia. Entonces:

  1. Si R=, la serie converge absolutamente para todo zC.
  2. Si R=0, la serie converge solo para z=z0.
  3. Si 0<R<, la serie converge solo para los zC tales que |zz0|<R y diverge para |zz0|>R.

Demostración. Es inmediato de la proposición 29.2.

Ejemplo 29.3.
Analicemos la siguiente serie y determinemos su radio de convergencia.
n=0(1)n2nz2n=1z22+z422z623+.

Solución. Por el ejemplo 29.2 sabemos que se trata de una serie de potencias con centro en z0=0 y coeficientes:
ck={(1)n2n,sik=2n,0,sik=2n+1,connN.

Notemos que si hacemos w=z22 entonces:
n=0(1)n2nz2n=n=0(z22)n=n=0wn.

Entonces, tenemos una serie geométrica convergente si |w|<1, es decir, si |z2|<2. En tal caso la serie converge a:
11w=22z2.

Para esta serie es claro que su radio de convergencia es R=2.

En general, obtener el radio de convergencia de una serie de potencias no es una tarea fácil, el ejemplo anterior resultó sencillo pues conocemos bien a la serie geométrica, pero en general las series de potencias pueden resultar más complejas. Por ello, procedemos a establecer una serie de resultados que nos permitan determinar el radio de convergencia de una serie de potencias a través de la sucesión de números complejos {cn}n0, correspondiente con los coeficientes de la serie.

Primeramente, recordemos los siguientes conceptos y resultados estudiados y probados en nuestros cursos de Cálculo y/o Análisis.

Definición 29.3.
Sea {an}n0R una sucesión de números reales acotada. Se define:
l0=sup{an:n0}=sup{a0,a1,,an,},l1=sup{an:n1}=sup{a1,a2,,an,},l2=sup{an:n2}=sup{a2,a3,,an,},lk=sup{an:nk}=sup{ak,ak+1,,an,}.

Es claro que:
{an:nk+1}{an:nk},kN,

por lo que:
lk+1=sup{an:nk+1}lk=sup{an:nk},

es decir, la sucesión {lk}k0 es decreciente.

Dado que {an}n0 es acotada, entonces existe M>0 tal que |an|M para todo nN, es decir:
ManM,nN,

de donde:
MlkM,kN, es decir, la sucesión {lk}k0 también es acotada.

Por lo tanto, se sigue del teorema de la convergencia monótona para sucesiones, teorema 27.1, que la sucesión {lk}k0 converge.

Si la sucesión {an}n0 no es acotada superiormente, tenemos que lk= para todo kN, en tal caso se define:
(29.4)limklk=.

Análogamente, se define a la sucesión:
mk=inf{an:nk},kN.

Claramente mkmk+1 para todo kN y {mk}k0 es acotada, entonces, teorema 27.1, la sucesión {mk}k0 converge.

Si la sucesión {an}n0 no es acotada inferiormente, tenemos que mk= para todo kN, en tal caso se define:
(29.5)limkmk=.

Definición 29.4. (Límite superior e inferior de una sucesión.)
Sea {an}n0R una sucesión de números reales arbitraria. Considerando a las sucesiones {lk}k0 y {mk}k0, dadas como en la definición 29.3, se define el límite inferior y superior de {an}n0, respectivamente, como:
limkmk=limkinf{an:nk},limklk=limksup{an:nk},

a los cuales se denota, respectivamente, como:
lim infnan=limkmk,lim supnan=limklk.

Observación 29.5.
Dado que una sucesión monótona (acotada) siempre tiene límite, entonces si permitimos que se cumplan (29.4) y (29.5), es claro que limkmk y limklk siempre existen y por tanto los límites inferior y superior de una sucesión arbitraria de números reales {an}n0 siempre existen.

Más aún, de acuerdo con las definiciones 29.3 y 29.4 es claro que se cumple:
m0m1mk,lkl1l0, y milj, por lo que:
lim infnanlim supnan.

Observación 29.6.
Dada una sucesión arbitraria de números reales {an}n0, de acuerdo con la definición 7.7 de la entrada 7, tenemos que lim infnan y lim supnan corresponden, respectivamente, con el menor y mayor punto de acumulación del conjunto {an:nN}.

Es importante notar que lim infnan y lim supnan no son necesariamente, el valor más pequeño o más grande, respectivamente, del conjunto {an:nN}.

Ejemplo 29.4.
a) Para la sucesión {(1)n}n0={1,1,1,1,} tenemos que:
sup{(1)n:nk}=1einf{(1)n:nk}=1kN,

por lo que:
lim infn(1)n=1ylim supn(1)n=1.

b) Para la sucesión {(1)nn}n0={0,1,2,3,} tenemos que:
sup{(1)nn:nk}=einf{(1)nn:nk}=kN,

por lo que:
lim infn(1)nn=ylim supn(1)nn=.

c) Para la sucesión {1n}n1={1,12,13,} tenemos que:
sup{1n:nk}=1keinf{1n:nk}=0,kN,por lo que:lim infn1n=0=lim supn1n,

aún cuando cada término de la sucesión es más mayor que 0.

Teorema 29.1.
Una sucesión de números reales {an}n0R converge si y solo si lim infnan y lim supnan, existen, son finitos y son iguales. En tal caso:
lim infnan=lim supnan=limnan.

Teorema 29.2.
Una sucesión {an}n0R converge a LR si y solo si toda subsucesión de {an}n0 converge a L.

Lema 29.1.
Una sucesión {an}n0R converge a LR si y solo si las subsucesiones {a2n}n0 y {a2n+1}n0 convergen ambas a L.

Demostración. Dadas las hipótesis.

) Si limnan=L, entonces, por el teorema 29.2, ambas subsucesiones {a2n}n0 y {a2n+1}n0 convergen a L.

( Supongamos que ambas subsucesiones {a2n}n0 y {a2n+1}n0 convergen a L. Sea ε>0, entonces existen N1,N2N tales que:
|a2nL|<ε,para todonN1,|a2n+1L|<ε,para todonN2.

Sea N=max{2N1,2N2+1}. Para nN, tenemos que n2N1 y n2N2+1.

Si n=2k, para algún kN, y nN, entonces kN1, por lo que:
|anL|=|a2kL|<ε.

Análogamente, si n=2k+1, para algún kN, y nN, entonces kN2, por lo que:
|anL|=|a2k+1L|<ε.

De ambos casos concluimos que, dado ε>0 existe NN, tal que si nN, entonces |anL|<ε.

◼

Ejemplo 29.5.
a) Para la sucesión {an}n1, con an=(1)n+nn, tenemos que:
a2n=(1)2n+2n2n=1+12nlimna2n=1,

a2n+1=(1)2n+1+(2n+1)2n+1=112n+1limna2n+1=1,

por lo que, del lema 29.1 y el teorema 29.1 se sigue que:
limnan=1=lim supnan=lim infnan.

Figura 106: Gráfica de puntos de la sucesión {an}n1.

Consideremos a la sucesión {bn}n1 dada por:
bn={nn+1sin=2k,1n+1sin=2k+1,kN+.

Tenemos que:
{bn}n1={12,23,14,45,16,}.

Notemos que para dicha sucesión, los puntos 1 y 0 son de acumulación del conjunto {bn:nN+}, proposición 8.6, ya que existen las subsucesiones {b2k}k1 y {b2k+1}k1 de la sucesión original tales que 1b2k y 0b2k+1 para todo kN+ y se cumple que:
b2k=2k2k+1limkb2k=1,
b2k+1=12k+1limkb2k+1=0.

Más aún, es claro que la sucesión está acotada superiormente e inferiormente por 1 y 0, respectivamente, por lo que:
lim supnbn=1ylim infnbn=0.

De acuerdo con el teorema 29.1, tenemos que la sucesión no converge ya que estos límites son distintos.

Figura 107: Gráfica de puntos de la sucesión {bn}n1.

Teorema 29.3.
Sea {an}n1R una sucesión de números reales positivos, entonces:
(29.6)lim infnan+1anlim infnan1/nlim supnan1/nlim supnan+1an.

Corolario 29.2.
Si {an}n1R es una sucesión de números reales positivos tales que limnan+1an existe, entonces las cuatro cantidades dadas en (29.6) son iguales, por lo que:
limnan+1an=limnan1/n.

Observación 29.7.
Puede suceder que la sucesión {ann}n1 sea convergente, pero que la sucesión {an+1an}n1 sea divergente.

Ejemplo 29.6.
Sea {an}n1 dada por:
a2n=a2n1=12n,nN+,

es decir:
{an}n1={12,12,14,14,18,18,,12n,12n,}.

Tenemos que:
a2n2n=(12n)1/2n=12limna2n2n=12,
a2n12n1=(12n)12n1=12n2n1limna2n12n1=12.

Entonces, por el lema 29.1, tenemos que:
limnan=12, es decir, la sucesión {ann}n1 converge.

Por otra parte, notemos que:
a2na2n1=12n12n=1limna2na2n1=1,
a2n+1a2n=12n+112n=12limna2n+1a2n=12, por lo tanto, del lema 29.1 se sigue que {an+1an}n1 no converge.

Puede consultarse la prueba de estos resultados en alguno de los siguientes textos:

  • Elementary Analysis: The Theory of Calculus de Kenneth A. Ross.
  • An Introduction to Analysis de William R. Wade.

Una vez recordados estos resultados, procedemos a establecer el resultado esperado para poder determinar el radio de convergencia a través de la sucesión de números complejos dada por los coeficientes de una serie de potencias.

Proposición 29.3. (Fórmula de Cauchy-Hadamard para el radio de convergencia.)
Sea n=0cn(zz0)n una serie de potencias y sea λ=lim supn|cn|n. Definimos a R[0,] como el radio de convergencia de la serie dado por R=1/λ, con la definición de R=0 si λ= y R= si λ=0. Entonces:

  1. Si R=, la serie converge absolutamente para todo zC.
  2. Si R=0, la serie solo converge para z=z0.
  3. Si 0<r<R< entonces la serie es absolutamente convergente para |zz0|<R y uniformemente convergente en B(z0,r). La serie diverge si |zz0|>R y no podemos afirmar nada para |zz0|=R.

Demostración. Dadas las hipótesis.

  1. Si R=, entonces tenemos que λ=lim supn|cn|n=0. Notemos que para todo zC se cumple: lim supn|cn(zz0)n|n=|zz0|lim supn|cn|n=|zz0|λ=0. Dado que la sucesión {|cn(zz0)n|n}n1 es una sucesión de números reales no negativos, entonces: 0lim infn|cn(zz0)n|nlim supn|cn(zz0)n|n=0, es decir: lim infn|cn(zz0)n|n=lim supn|cn(zz0)n|n=0. Considerando lo anterior, por el teorema teorema 29.1, tenemos que: limn|cn(zz0)n|n=0<1, por lo que, se sigue del criterio de la raíz, proposición 27.6, que la serie n=0cn(zz0)n es absolutamente convergente para todo zC.
  2. Si R=0, entonces tenemos que λ=lim supn|cn|n=. Es claro que para z=z0 la serie converge: n=0cn(zz0)n=n=0cn(z0z0)n=c0. Veamos que la serie no puede converger en ningún otro punto. Procedamos por contradicción, supongamos que la serie converge para z=az0, entonces, corolario 27.1, se cumple que: limncn(az0)n=0, lo cual es equivalente, considerando el ejercicio 6 de la entrada 8, a que: limn|cn|n|az0|=0, es decir, para todo ε>0 existe NN tal que si nN, entonces: |cn|n|az0|=||cn|n|az0||<ε, por lo que: |cn|n<ε|az0|,nN, de donde, teorema 29.1:limn|cn|n=lim supn|cn|n=λ<, lo cual contradice nuestro supuesto de que λ=. Por lo que, la serie solo converge para z=z0.
  3. Supongamos que |zz0|<R. De acuerdo con la definición 29.3: λ=lim supn|cn|n=limksup{|cn|n:nk}, por lo que, de la definición del límite tenemos que para todo ε>0 existe NN tal que si kN, entonces:|sup{|cn|n:nk}λ|<εε+λ<sup{|cn|n:nk}<ε+λ, de donde: ε+λ<|cn|n<ε+λ,nN. Sea ρ=|zz0|+R2>0, entonces |zz0|<ρ<R. Tenemos que: 0<ρ<R=1λλ<1ρ, por lo que, para ε=1ρλ>0 existe NN tal que:
    |cn|n<1ρλ+λ,nN, es decir: |cn|<1ρn,nN. De lo anterior se sigue que: |cn(zz0)n|=|cn||zz0|n<(|zz0|ρ)n,nN. Dado que |zz0|<ρ, entonces la serie geométrica: n=0(|zz0|ρ)n, es convergente. Por tanto, del criterio de comparación, proposición 27.4, se sigue que la serie: n=0cn(zz0)n, es absolutamente convergente para todo zC tal que |zz0|<R.

    Supongamos que 0<r<R. Sea ρ=r+R2>0, entonces r<ρ<R=1λ, por lo que λ<1ρ. Entonces, para ε=1ρλ>0 existe NN tal que:|cn|<1ρn,nN. Como r<ρ, tenemos que la serie geométrica es convergente:n=0(rρ)n. Si |zz0|r, de lo anterior se sigue que:|cn(zz0)n|=|cn||zz0|n(rρ)n,nN, por lo que, se sigue del criterio M de Weierstrass, proposición 28.3, que la serie: n=0cn(zz0)n, es absoluta y uniformemente convergente en B(z0,r), para 0<r<R.

    Supongamos ahora que |zz0|>R. Sea r=|zz0|+R2>0 tal que R<r<|zz0|, de donde 1r<1R=λ. Entonces, para ε=λ1r>0 existe NN tal que:1r=ε+λ<|cn|n,nN, de donde: (|zz0|r)n<|cn||zz0|n=|cn(zz0)n|,nN. Como 0<r<|zz0|, entonces la serie geométrica:n=0(|zz0|r)n, es divergente. Por el criterio de comparación, proposición 27.4, concluimos que la serie de potencias diverge.

    Por último, consideremos a la serie de potencias: n=1znn. Es claro que dicha serie está centrada en z0=0 y del ejemplo 29.2(b) tenemos que:cn={1n,sin1,0,sin=0. Dado que: sup{|cn|n:nk}=(1k)1/k,k1, entonces:λ=lim supn|cn|n=limk(1k)1/k=1. Notemos que, para z=1 tenemos que |zz0|=1=R=1λ y en ese caso tenemos a la serie armónica: n=11n, la cual diverge.

    Mientras que, para z=1 tenemos que |zz0|=1=R=1λ y la serie es convergente:n=1(1)nn. Por lo tanto, no podemos afirmar nada para el caso |zz0|=R.

◼

Considernado lo anterior, podemos dar de manera equivalente la siguiente:

Definición 29.5. (Radio de convergencia.)
Sea n=0cn(zz0)n una serie de potencias y sea λ=lim supn|cn|n. Entonces definimos a R[0,] como el radio de convergencia de la serie de potencias, dado por:

  1. R= si λ=0.
  2. R=0 si λ=.
  3. R=1/λ si 0<λ<.
Figura 108: Disco de convergencia B(z0,R), de una serie de potencias n=0cn(zz0)n.

Definición 29.6. (Dominio de convergencia.)
Sea n=0cn(zz0)n una serie de potencias. El conjunto de valores de zC para los cuales la serie de potencias converge es llamado su dominio de convergencia.

Ejemplo 29.7.
Determinemos el radio de convergencia de las siguientes series de potencias y veamos dónde la convergencia es uniforme.
a) n=0cnzn=1+4z+52z2+43z3+54z4+45z5+.
b) n=0(z1+i)n(2i)n.
c) n=1zn2.

Solución.
a) Tenemos que:
c0=1,cn={5n,sin=2k,4n,sin=2k+1,conkN+,

por lo que:
sup{|cn|1/n:nk}=5,k1.

Entonces:
λ=lim supn|cn|1/n=limksup{|cn|1/n:nk}=5,R=1λ=15.

De la proposición 29.3 se sigue que la serie converge uniformemente en todo disco cerrado B(0,r), con r<R.

b) Tenemos que:
z0=1i,c0=1ycn=1(2i)n,nN+,

por lo que:
sup{|cn|1/n:nk}=(1|2i|k)1/k=1|2i|=15,k1.

Entonces:
λ=lim supn|cn|1/n=limksup{|cn|1/n:nk}=15,R=1λ=5.

De la proposición 29.3 se sigue que la serie converge uniformemente en todo disco cerrado B(1i,r), con r<5.

c) Tenemos que:
n=0zn2=k=0ckzk,

de donde:
ck={1,si existenNtal quek=n2,0,en otro caso,

es decir:
c0=1,c1=1,c2=0,c3=0,c4=1,.

Considerando lo anterior es claro que la serie tiene un número infinitos de coeficientes que son 0. Sin embargo, notemos que:
sup{|cn|1/n:nk}=|1|1/k=1,k1.

Entonces:
λ=lim supn|cn|1/n=limksup{|cn|1/n:nk}=1,R=1λ=1.

De la proposición 29.3 se sigue que la serie converge uniformemente en todo disco cerrado B(0,r), con r<1.

Corolario 29.3. (Determinación del radio de convergencia de una serie de potencias.)
El radio de convergencia R[0,], de una serie de potencias n=0cn(zz0)n puede determinarse por alguno de los siguientes métodos.

  1. Criterio de D’Alembert del radio de convergencia. Si λ=limn|cn+1||cn| existe o es infinito, entonces:R=1λ.
  2. Criterio de la raiz de Cauchy. Si λ=limn|cn|1/n existe o es infinito, entonces:R=1λ.

En ambos casos consideramos la definición natural de R=0 si λ= y R= si λ=0.

Demostración. Los dos casos son una consecuencia de la proposición 29.3, de los teoremas 29.1 y 29.3 y del corolario 29.1, por lo que los detalles se dejan como ejercicio al lector.

◼

Observación 29.8.
Es posible dar una formulación de los criterios de convergencia de D’Alembert y de la raíz, proposiciones 27.5 y 27.6 respectivamente, en términos del límite superior, es decir, considerando:
λ=lim supn|zn+1||zn|,λ=lim supn|zn|n, respectivamente, en cada caso. Esta formulación de dichos criterios es de gran utilidad cuando los límites limn|zn+1||zn|, limn|zn|n no existen.

Ejemplo 29.8.
Veamos que la serie:
n=1zn,conzn=12n[1+(1)n]+13n[1(1)n], converge.

Solución. Tenemos que:
z2n=222nyz2n+1=232n+1.

Entonces, el límite limn|zn+1||zn|=limnzn+1zn no existe, lema 29.1, ya que las subsucesiones:
z2n+2z2n=z2n+2z2n+1z2n+1z2nyz2n+3z2n+1=z2n+3z2n+2z2n+2z2n+1,

tienen diferentes límites:
limnz2n+2z2n=limn2(22(n+1))2(22n)=14,limnz2n+3z2n+1=limn2(3(2n+3))2(3(2n+1))=19.

Sin embargo, notemos que:
lim supn|zn+1||zn|=lim supnzn+1zn=14<1,

por lo que, de acuerdo con el criterio de D’Alembert, la serie converge.

Ejemplo 29.9.
Determinemos el radio de convergencia de las siguientes series de potencias.

a) n=1(1+1n)n2zn.
b) n=1(n+1)zn(n+2)(n+3).
c) n=1(a+ib)nzn, con a,bR no ambos cero.
d) n=1(n+23n+1)n(z4)n.

Solución. Para las cuatro series utilizaremos el corolario 29.3.
a) Tenemos que:
n=1(1+1n)n2zn=k=0ckzk,

de donde:
ck={(1+1n)n2,si existenNtal quek=n,0,en otro caso,

es decir:
c0=0ycn=(1+1n)n2,n1.

Entonces:
λ=limn|cn|1/n=limn(1+1n)n=e,R=1λ=1e.

b) Tenemos que:
cn=n+1(n+2)(n+3),nN,

por lo que:
cn+1=n+2(n+3)(n+4).

Entonces:
λ=limn|cn+1||cn|=limn(n+2)2(n+3)(n+1)(n+3)(n+4)=limnn2+4n+4n2+5n+4=1, de donde R=1/λ=1.

c) Tenemos que:
cn=(a+ib)nnN, con a,bR no ambos cero, por lo que:
cn+1=(a+ib)n+1.

Entonces:
λ=limn|cn+1||cn|=limn|(a+ib)n+1(a+ib)n|=limn|a+ib|=a2+b2, de donde R=1/λ.

d) Tenemos que:
z0=4,c0=1ycn=(n+23n+1)nnN+.

Entonces:
λ=limn|cn|n=limn(|n+23n+1|n)1/n=limnn+23n+1=13, de donde R=1/λ=3.

Ejemplo 29.10.
Determinemos el dominio de convergencia de la siguiente serie de potencias e identifiquemos gráficamente a dicho conjunto en el plano complejo.
n=1135(2n1)n!(1zz)n.

Solución. Sea w=1zz, entonces:
n=1135(2n1)n!wn=k=0ckwk,

de donde:
ck={135(2n1)n!,si existenNtal quek=n,0,en otro caso,

es decir:
c0=0ycn=135(2n1)n!n1.

Tenemos que:
cn+1=135(2n1)(2n+1)(n+1)!,

por lo que:
λ=limn|cn+1||cn|=limn|135(2n1)(2n+1)(n+1)!135(2n1)n!|=limn|(2n+1)n!(n+1)!|=limn2n+1n+1=2, de donde R=1/λ=1/2.

Entonces, el dominio de convergencia de la serie está dado por la condición |w|<1/2, es decir:
|1zz|<122|1z|<|z|,4|1z|2<|z|2,4(1z)(1z)<zz,44z4z+3zz<0,(29.7)zz43z43z+43<0.

De acuerdo con los resultados de la entrada 6, sabemos que la ecuación general de una circunfernecia en el plano complejo C es:
zz+az+az+b=0, cuyo centro es el punto a y r=|a|2b su radio.

De (29.7) tenemos:
zz+(43)z+(43)z+43=0,

de donde:
a=43,b=43yr=|a|2b=49=23.

Por lo que, la expresión en (29.7) corresponde con el interior de la circunferencia C(43,23), es decir, el disco abierto B(43,23) es el dominio de convergencia de la serie de potencias, figura 109.

Figura 109: Dominio de convergencia de la serie de potencias del ejemplo 29.10.

Tarea moral

  1. Muestra que el radio de convergencia de la serie de potencias: n=0(1)nnzn(n+1), es 1 y analiza la convergencia para z=1, z=1 y z=i.

    Hint: Observa que el (n+1)-ésimo coeficiente de la serie no es (1)nn. Procede como en el ejemplo 29.1.
  2. Determina el dominio de convergencia de las siguientes series de potencias y gráficalo.
    a) n=0[(iz1)3+4i]n.
    b) n=0(z+2)n1(n+1)34n.
  3. Muestra que el radio de convergencia de las siguientes series de potencias es infinito.
    a) n=0znn!.
    b) n=0(1)nz2n(2n)!.
    c) n=0(1)nz2n+1(2n+1)!.
  4. Considera las tres series del ejemplo 29.2 y obtén su radio de convergencia, ¿en qué conjuntos la convergencia es uniforme?
  5. Prueba el corolario 29.3.
  6. Sean n=0cn(zz0)n y n=0dn(zz0)n dos series de potencias con radio de convergencia R1 y R2, respectivamente.
    a) ¿Cuál es el radio de convergencia de la serie n=0(cn+dn)(zz0)n?
    b) ¿Cuál es el radio de convergencia de la serie n=0(cndn)(zz0)n?
  7. Obtén el radio de convergencia de las siguientes series de potencias:
    a) n=1znn.
    b) n=0z4n4n+1.
    c) n=0n2(z2+11+i)n.
    d) n=0(2ix+i+1)n.
    e) 12z+1325z2+135258z3+
    f) n=1(ln(n))nzn.
  8. Si n=0cnzn tiene radio de convergencia R, determina el radio de convergencia de las siguientes series de potencias:
    a) n=0cnz2n.
    b) n=0cn2zn.
    c) n=0ndcnzn, para cualquier dN+.
    d) n=0(1)ncnzn.

Más adelante…

En esta entrada definimos de manera formal el concepto de serie de potencias y establecimos una serie de resultados relacionados con su convergencia. En particular, vimos que a través del concepto del radio de convergencia de una serie de potencias es posible establecer su dominio de convergencia, que geométricamente corresponde con discos abiertos, a los cuales comúnmente se les llama círculos de convergencia.

En la siguiente entrada estudiaremos algunas propiedades importantes de las series de potencias como la continuidad y analicidad de las mismas, propiedades que nos serán de utilidad en el estudio de las funciones complejas, pues como veremos, toda función compleja que es analítica en un dominio DC puede tener un desarrollo en series de potencias en todo disco abierto completamente contenido en D.

Entradas relacionadas

Cálculo Diferencial e Integral III: Formas lineales y formas bilineales

Por Alejandro Antonio Estrada Franco

Introducción

Hasta ahora hemos cubierto a modo de repaso varios temas de álgebra lineal relacionados con sistemas de ecuaciones lineales, transformaciones lineales, sus matrices asociadas y más. En esta y las entradas que siguen recordaremos más herramientas de álgebra lineal que serán de utilidad para nuestro contenido de diferenciabilidad. Hablaremos de las formas lineales de Rn, de sus formas bilineales y de sus formas cuadráticas.

Como es usual, este contenido cubre sólo por encima lo que se vería en un curso completo de álgebra lineal, en donde se ahonda en varias demostraciones, se dan más ejemplos y se tratan espacios vectoriales más generales. Para estos temas en específico, las siguientes entradas pueden ser un buen punto de partida:

Formas lineales

Las formas lineales son transformaciones lineales, pero son unas muy específicas: las que caen en R.

Definición. Una transformación lineal ϕ¯:RnR se le llama forma lineal o funcional lineal.

Definición. Llamaremos al espacio vectorial L(Rn,R) el espacio dual de Rn y lo denotamos por Rn.

Hay una relación directa entre las bases de Rn y las de Rn. Como los elementos de Rn son transformaciones lineales, basta decir qué les hacen a los elementos de una base. De aquí se motiva la siguiente definición.

Definición. Tomemos una base β={e¯1,,e¯n} para Rn. Sean ϕ¯1,,ϕ¯nRn definidas como sigue: ϕ¯i(e¯j)={1sii=j0siij.

A ϕ¯1,,ϕ¯n le llamamos la base dual a β y la denotamos por β.

El nombre queda justificado por el siguiente resultado.

Teorema. Se tiene que β={ϕ¯1,,ϕ¯n} es una base para Rn.

Demostración. Debemos mostrar que β es generador e independiente. Veremos que es generador, y la independencia lineal quedará de tarea moral. Tomemos α¯Rn. Supongamos que para cada j se tiene α¯(e¯j)=rj. Afirmamos que α¯=r1ϕ¯1++rnϕ¯n.

Para mostrar la igualdad anterior, que es una igualdad de formas lineales, veremos la igualdad vector a vector. Sea v¯Rn. Calcularemos α¯(v¯). Para ello, expresamos a v¯ como combinación de elementos de β: v¯=i=1nxie¯i.

Al aplicar α obtenemos:

α¯(v¯)=α¯(i=1nxie¯i)=i=1nxiα¯(e¯i)=i=1nxiri=i=1nxiriϕ¯i(e¯i)=i=1nriϕ¯i(xie¯i)=i=1nriϕ¯i(k=1nxke¯k)(agregando varios 0)=(r1ϕ¯1++rnϕ¯n)(k=1nxke¯k)=(r1ϕ¯1++rnϕ¯n)(v¯)

Así se da la igualdad α¯=r1ϕ¯1++rnϕ¯n, por lo tanto β es un conjunto generador Rn

◻

De la demostración podemos obtener algo más. Supongamos que tomamos v¯Rn y una base β={e¯1,,e¯n}. Supongamos que v¯=i=1nxie¯i. A partir de aquí, podemos construir una forma lineal ψ(v¯) que cumple ψ(v¯)=i=1nxiϕ¯i. Se puede verificar que la asignación ψ:RnRn es un isomorfismo. De aquí, obtenemos que RnRn.

Hasta ahora, de cualquier base de Rn se puede obtener una base dual, que es base de Rn. ¿Podemos hacer lo inverso? El siguiente resultado dice que sí, si tenemos una base para Rn, podemos construir una para Rn muy conveniente.

Teorema. Dada β={ϕ¯1,,ϕ¯n} base para Rn, existe β={w¯1,,w¯n} base para Rn; tal que ϕ¯i(w¯j)=δij donde: δij={1sii=j0siij,

es decir, tal que β es justo la base dual de β.

Demostración. Para construir la base deseada, hacemos los siguientes pasos. Cada paso está esbozado. Los detalles quedan como tarea moral.

  1. Primero notemos que para cada i=1,,n se tiene, por el teorema de la dimensión, que:
    n=dimRn=dim(ker(ϕ¯i))+dim(Im(ϕ¯i))=dim(ker(ϕ¯i))+1,
    en donde usamos que ϕ¯i es forma lineal no cero (por estar en una base), de donde su imagen tiene dimensión 1. De aquí dim(ker(ϕ¯i))=n1. Si tomamos una base de ker(ϕ¯i), tiene n1 elementos y por lo tanto podemos completarla a una base de Rn agregando un cierto vector v¯i.
  2. Afirmamos que v¯1,v¯2,,v¯n elegidos de la manera anterior son un conjunto linealmente independiente. En efecto, al tener una combinación lineal α1v¯1++αnv¯n=0¯, podemos para cada i=1,,n aplicar ϕ¯i a ambos lados. Del lado izquierdo se eliminarán todos términos excepto αiϕ¯i(v¯i). Como ϕ¯i(v¯i)0, entonces αi=0 para todo i=1,,n. Como v¯1,,v¯n son linealmente independientes, y son n, entonces son una base de Rn.
  3. Ahora, pensemos que ϕ¯i(v¯i)=ri0. Podemos dividir entre ri para obtener ϕ¯i(v¯iri)=1.
  4. De todo lo anterior, {v¯1/r1,,v¯n/rn} es la base buscada.

◻

A la base conformada por los vectores w¯1,,w¯n le llamamos la base primal de β.

En estos dos teoremas hemos desarrollado técnicas para construir bases para un espacio y su dual que se coordinan haciendo simples las evaluaciones de las funciones de la base dual sobre las de la base del espacio original. Entre estas dos bases para el espacio y su dual tenemos un par de ecuaciones que las correlacionan muy convenientemente.

Teorema. Sean {v¯1,v¯n} una base de Rn y {ϕ¯1,ϕ¯n} la base dual de Rn. Para todo u¯Rn tenemos u¯=i=1nϕ¯i(u¯)v¯i, y para todo ΦRn tenemos Φ=i=1nΦ(v¯i)ϕ¯i.

Demostración. Sea u¯Rn, supongamos u¯=ixiv¯i. Para cada j entre 1 y n, tenemos
ϕ¯j(u¯)=i=1nxiϕ¯j(v¯i)=xjϕ¯j(v¯j)=xj.

De esta manera xj=ϕ¯j(u¯), por tanto obtenemos u¯=i=1nϕ¯i(u¯)v¯i.

De manera similar, sea ΦRn, supongamos Φ=iyiϕ¯i. Para cada j entre 1 y n, tenemos
Φ(v¯j)=i=1nyiϕ¯i(v¯j)=yjϕ¯j(v¯j)=yj.

Así hemos obtenido Φ(v¯j)=yj, con lo que concluimos Φ=i=1nΦ(v¯i)ϕ¯i.

◻

Formas bilineales

Este desarrollo teórico nos permite abordar las formas bilineales tal y como las usaremos mas adelante.

Definición. Sea Rn un espacio vectorial sobre R. Una forma bilineal es una función b:Rn×RnR que satisface:

  1. b(ru¯1+u¯2,v¯)=rb(u¯1,v¯)+b(u¯2,v¯) para todo real r y vectores u¯1,u¯2,v¯ en Rn, a lo que llamamos linealidad en la primera entrada.
  2. b(u¯,rv¯1+v¯2)=rb(u¯,v¯1)+b(u¯,v¯2) para todo real r y vectores v¯1,v¯2,u¯ en Rn a lo que llamamos linealidad en la segunda entrada.

Ejemplo. Sea AMn(R). A partir de la matriz A puede construirse una forma bilineal bA sobre Rn. Para los vectores x¯=(x1,,xn) y y¯=(y1,,yn), queda definida como sigue

bA(x¯,y¯)=x¯TAy¯.

Realizando las cuentas matriciales, tenemos:

bA(x¯,y¯)=(x1xn)(a11a1nan1ann)(y1yn)=i,j=1nxiaijyj.

Queda como tarea moral verificar que fA en efecto es bilineal, lo que se recomienda verificar en la expresión x¯TAy¯.

Un ejemplo todavía más concreto sería tomar la matriz A=(2534). Al realizar las cuentas matriciales obtenemos:

(x1x2)(2534)(y1y2)=2x1y1+5x1y23x2y1+4x2y2.

El espacio de formas bilineales

Denotaremos por B(Rn) al conjunto de las formas bilineales en Rn. Le damos a B(Rn) estructura de espacio vectorial con las operaciones siguientes: (b1+b2)(u¯,v¯)=b1(u¯,v¯)+b2(u¯,v¯), y (rb)(u¯,v¯)=rb(u¯,v¯), para todos los b1,b2,bB(Rn) y rR.

Con la teoría que tenemos hasta ahora, podemos construir fácilmente una base para el espacio B(Rn).

Teorema. Sea {ϕ¯1,,ϕ¯n} una base del espacio dual Rn. Entonces B={bij|i,j=1,,n} es una base para B(Rn), donde bij(u¯,v¯)=ϕ¯i(u¯)ϕ¯j(v¯). De este modo dimB(Rn)=n2.

Demostración. Para {ϕ¯1,,ϕ¯n} podemos construir su base primal {v¯1,,v¯n},es decir, base de Rn tal que ϕ¯i(v¯j)=δij, para todo i,j.

Veamos que las formas bilineales propuestas en efecto son un conjunto generador. Sea bB(Rn). Para u¯,v¯ arbitrarios en Rn, calculemos b(u¯,v¯). Para ello recordemos que u¯=i=1nϕ¯i(u¯)v¯i y v¯=j=1nϕ¯j(v¯)vij. Usando esto:

b(u¯,v¯)=b(i=1nϕi(u¯)v¯i,j=1nϕ¯j(v¯)v¯j)=i=1nϕ¯i(u¯)b(v¯i,j=1nϕ¯j(v¯)v¯j)=i=1nϕ¯i(u¯)j=1nϕ¯j(v¯)b(v¯i,v¯j)=i=1nj=1nϕ¯i(u¯)ϕ¯j(v¯)b(v¯i,v¯j)=i=1nj=1nbij(u¯,v¯)b(v¯i,u¯j).

Así vemos que b es combinación lineal del conjunto B. Concluimos que B es un conjunto generador de B(Rn). Para calcular la dimensión de B(Rn), falta todavía ver que B es linealmente independiente, lo cual queda como tarea moral (en la lista de ejercicios hay una sugerencia). Tras probar que B es linealmente independiente, se tiene que dimB(Rn)=n2.

◻

Forma matricial de formas bilineales

En el ejemplo anterior vimos cómo a partir de una matriz A podemos construir una forma bilineal (x¯,y¯)x¯TAy¯ de Rn. En realidad así se pueden obtener todas las formas bilineales.

Definición. Consideremos una forma bilineal b:Rn×RnR. Tomemos una base β={u¯1,,u¯n}. Tomemos la matriz Matβ(b) en Mn(R) cuya entrada (i,j) es f(u¯i,v¯j). Llamaremos a esta matriz la representación matricial de f relativa a la base β.

La matriz A:=Matβ(b) representa a f en el siguiente sentido. Se tiene que, para cualesquiera u¯,v¯ en Rn se cumple que si los vectores de coordenadas de u¯ y v¯ en la base β son X=(x1,,xn) y Y=(y1,,yn), entonces:

b(u¯,v¯)=i=1nj=1nxiyjb(u¯i,u¯j)=(x1xn)A(y1yn)=XTAY.

Ejemplo. Tomemos la forma bilineal b de R2 dada por b((x1,x2),(y1,y2))=5x1y2+3x2y1 (verifica que es forma bilineal). Tomemos la base (1,1) y (1,1) de R2. Para encontrar la representación matricial de b en esta base, debemos hacer los siguientes cálculos:

b((1,1),(1,1))=8b((1,1),(1,1))=2b((1,1),(1,1))=2b((1,1)(1,1))=8

De esta manera, la representación matricial es (8228).

Matrices congruentes y rango

Recordemos dos definiciones más.

Definición. El rango de una matriz es el número máximo de columnas (tratadas como vectores columna) linealmente independientes. La notación para una matriz A será rank(A).

Definición. Sean A y B matrices en Mn(R). Se dice que B es congruente a A si existe una matriz invertible P tal que B=PtAP.

Es sencillo mostrar que esta relación «es congruente a» es una relación de equivalencia, lo cual queda como tarea moral revisar.

Por resultados de rango de matrices, se cumple que el rango de una matriz no cambia si la multiplicamos por una matriz invertible. Si A y B son congruentes mediante la matriz P, tenemos que B=PtAP. Como P es invertible, Pt también. Así, B tiene el mismo rango que A.

Al igual que con las transformaciones lineales, la representación matricial de las formas bilineales depende de la base del espacio dominio que se considere. Pero tenemos una relación importante entre distintas representaciones matriciales de formas bilineales.

Teorema. Cualesquiera dos representaciones matriciales de una misma forma bilineal son congruentes.

Demostración. Consideremos b:Rn×RnR una forma bilineal. Tomemos β={v¯1,,v¯n} y β={u¯1,,u¯n} dos bases para Rn. Supongamos que para cada i tenemos v¯i=k=1nciku¯k.

Así:
b(v¯i,v¯j)=b(k=1nciku¯k,t=1ncjtu¯t)=k=1nt=1ncikcjtb(u¯k,u¯t).

Definamos akt=b(u¯k,u¯t), y tomemos A como la matriz en Mn(R) cuya entrada (k,t) es akt. Tenemos entonces:

b(v¯i,v¯j)=(ci1cin)A(cj1cjn).

Definamos a la matriz C en Mn(R) a aquella con entradas (k,t) iguales a ckt. Al variar sobre los posibles valores de (i,j), la igualdad anterior nos dice que la entrada (i,j) de la forma matricial A de b en la base β es igual a la entrada (i,j) de la matriz CtAC, en donde notamos que A es la forma matricial de b en la base β. Esto nos dice que A=CtAC. Así A y A son congruentes.

◻

Con esto, podemos establecer la siguiente definición sin ambigüedades.

Definición. El rango de una forma bilineal b en Rn, escrito rank(b) se define como el rango de cualquiera de sus representaciones matriciales. Además decimos que b es degenerada o no degenerada según sea rank(b)<dimRn o rank(b)=dimRn, respectivamente.

Más adelante…

Esta entrada repasa los conceptos de formas lineales y bilineales. La siguiente entrada será nuestra última entrada de repaso de álgebra lineal. Lo que haremos es recordar cómo a partir de las formas bilineales podemos definir a las formas cuadráticas. Las formas cuadráticas también nos ayudarán a establecer ciertas propiedades de funciones al combinarlas con la noción de diferenciabilidad.

En esta entrada hablamos del rango de una matriz. Más adelante retomaremos este concepto, y lo usaremos cuando enunciemos el teorema del rango, un resultado crucial en diferenciabilidad.

Tarea moral

  1. Realiza los siguientes dos problemas:
    • Encuentra la base dual de la base {(1,2,3),(3,2,1),(1,1,0)} de R3 explícitamente.
    • Encuentra una base de R3 cuya base dual sean las formas lineales l1(x,y,z)=x, l2(x,y,z)=3x2, l3(x,y,z)=x+yz.
  2. Completa los detalles en cada paso del teorema que nos dice cómo obtener una base primar para una base dual.
  3. En el teorema de bases para el espacio de formas bilineales, verifica que el conjunto de formas lineales propuestas es linealmente independiente. Sugerencia. Toma una combinación lineal igual a cero; luego evalúa en los vectores de la base {v¯1,,v¯n}. Recuerda la definición de bij y el efecto de evaluar ϕ¯j en v¯i.
  4. Revisa este enlace correspondiente al curso de Álgebra Lineal I de este blog para profundizar en el tema del rango de una transformación lineal y cómo se relaciona con el rango de una matriz.
  5. Demuestra que la relación «es congruente a» es una relación de equivalencia en Mn(R).

Entradas relacionadas

Álgebra Moderna I: Primer Teorema de Isomorfía y Diagrama de Retícula

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

La estrella de esta entrada es el primero de los cuatro Teoremas de Isomorfía que veremos. Como el nombre indica, estos teoremas relacionan dos conjuntos a través de una isomorfía, pero no sólo eso, además en los conjuntos que se relacionan aparece un cociente de grupos. El primer teorema de isomorfía nos permite entender cómo están relacionados el dominio, el núcleo y la imagen de un homomorfismo de grupos, de forma similar al teorema de la dimensión en Álgebra lineal, que establece la relación entre el dominio, el núcleo y la imagen de una transformación lineal.

El Primer Teorema de Isomorfía se usa en la prueba del resto de los teoremas de isomorfía, así que al final de esta unidad te quedará muy claro cómo se usa y para qué sirve. Normalmente se usa definiendo un homomorfismo clave para que al aplicarlo en el grupo obtengamos los cocientes necesarios.

Si quieres reforzar algunos temas que usaremos mucho a lo largo de estas entradas, puedes revisar los conceptos de Subgrupo Normal, Cociente de grupos, Isomorfísmos y Núcleo e Imagen de un Homomorfismo. Será de mucha ayuda que los tengas presentes.

Por último, junto con los Teoremas de Isomorfía usaremos una ayuda visual llamada Diagrama de Retícula, es importante para describir las relaciones entre los distintos grupos, subgrupos y subgrupos normales que estaremos manejando.

El Teorema que vamos a tratar

Teorema. (Primer Teorema de Isomorfía)
Sean G,G¯ grupos, φ:GG¯ un homomorfismo. Entonces
G/Núc φIm φ.

Demostración.
Sea G,G¯ grupos, φ:GG¯ un homomorfismo, N=Núc φ.

En la entrada anterior probamos que NG, de modo que G/Núc φ tiene estructura de grupo.

Para probar que G/Núc φ y Im φ son isomorfos, tenemos que dar un isomorfismo entre ellos. Primero construiremos una función que vaya de G/N a Im φ. Sea
ψ:G/NIm φaNφ(a)aG.

Definiremos nuestra función ψ como aquella que manda una clase aN de G/N a φ(a), pero no queda claro si al tomar otro representante de la clase, digamos b, sucederá que φ(a)=φ(b). Esto tenemos que probarlo.

Tomemos a,bG tales que aN=bN. Entonces,

aN=bNa1bNφ(a1b)=eG¯φ(a1)φ(b)=eG¯(φ(a))1φ(b)=eG¯Propiedades de homomorfismosφ(b)=φ(a).
En realidad todas las equivalencias anteriores son producto de las propuedades de homomorfismos que ya vimos. Las implicaciones de ida () nos dicen que ψ está bien definida, como queríamos probar. Pero las implicaciones de regreso () nos dicen algo más: nuestra ψ es inyectiva.

Por lo tanto ψ está bien definida y es inyectiva.

Ahora nos falta ver que en efecto ψ es un homomorfismo y es suprayectiva.

Para ver que es un homomorfismo consideremos a,bG, entonces:
ψ(aNbN)=ψ(abN)=φ(ab)=φ(a)φ(b)=ψ(aN)ψ(bN).
Lo anterior sale de la definición de ψ y de que φ es un homomorfismo. Así, ψ es un homomorfismo.

Finalmente, si cIm φ, c=φ(a) con aG. Entonces, por definición:
c=φ(a)=ψ(aN)Im ψ.

Así, ψ es suprayectiva.

Por lo tanto tenemos que ψ es un homomorfismo inyectivo y suprayectivo, es decir, ψ es un isomorfismo. En consecuencia, G/NIm φ.

◼

Diagrama de retícula

A partir de las siguientes entradas comenzaremos a usar algo llamado diagrama de retícula. Este diagrama es una manera de representar la relación de ser subgrupo. Se escriben todos o algunos subgrupos de un grupo G, y se unen dos subgrupos H y K con una arista si H es subgrupo de K, de modo que H quede más abajo que K. De esta manera, si se consideran todos los sugrupos de G el grupo G aparece hasta arriba y el subrgupo {e} hasta abajo del diagrama.

Veamos un ejemplo: Sea G un grupo y H,K subgrupos de G. Si consideramos HK, sabemos que es subgrupo de G, pero además, sabemos que HHK y KHK. Por último, consideremos HK, que es a su vez un subgrupo de H y K.

Todo esto se puede resumir en el siguiente diagrama de retícula:

Diagrama de Retícula.

¿Por qué no unimos H con G? Pues porque este diagrama es transitivo, es decir como HHKG, está implícito que HG. Tampoco unimos un grupo consigo mismo.

Además, si un subgrupo es un subgrupo normal, anotaremos el símbolo .

Observemos que si HG, entonces todo elemento en H, al ser conjugado con elementos de G, sigue siendo un elemento de H. En particular, si conjugamos a un elemento de H con un elemento de HK seguimos obteniendo un elemento de H. Esto nos dice que H también es normal en HK. En el diagrama, la propiedad de ser normal se escribe de la siguiente manera:

Diagrama de Retícula donde se muestra una relación de Subgrupo Normal.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Sea G un grupo cíclico con G=a. Considera el homomorfosmo φ:ZG dado por φ(m)=am para toda mZ.
    • Si a es de orden finito con o(a)=n ¿qué concluyes al aplicar el 1er Teorema de Isomorfía? ¿Qué relación existe entre dos grupos cíclicos finitos de orden n?
    • Si a es de orden infinito ¿qué concluyes al aplicar en 1er Teorema de Isomorfía? ¿Qué relación existe entre dos grupos cíclicos infinitos?
  2. Puedes revisar los siguientes videos que hablan de homomorfismos:

Más adelante…

Uno de los principales usos del Primer Teorema de Isomorfía es definiendo una φ ideal para que el núcleo y la imágen de φ sean justo lo que queremos probar. Esto lo veremos en la siguiente entrada, donde lo usamos para probar el Segundo Teorema de Isomorfía.

El diagrama de retícula se volverá fundamental sobretodo cuando veamos el Cuarto Teorema de Isomorfía, porque veremos cómo relacionar muchos subgrupos con grupos cocientes correspondientes.

Entradas relacionadas

Investigación de Operaciones: Forma canónica y forma estándar de un problema lineal (9)

Por Aldo Romero

Introducción

En las entradas anteriores hemos dado ejemplos de varios problemas de aplicación que pueden ser planteados mediante un problema de programación lineal. Una vez que llegamos a un modelo, se pueden tener restricciones de los tipos , = y . Además, puede haber restricciones de signo sobre las variables. Puede que se les pida ser no positivas, no negativas o irrestrictas (no restringidas) en signo. Lo que haremos ahora es ver cómo podemos llegar a un cierto formato (forma estándar o forma canónica).

Forma canónica de un problema lineal

A continuación introducimos el primer formato que nos facilitará el trabajo.

Definición. Se dice que un problema de programación lineal está en forma canónica si cumple simultáneamente las siguientes tres propiedades:

  1. El problema es de maximización.
  2. Las restricciones del problema son todas del tipo (menor o igual).
  3. Las variables de decisión son no negativas.

Así, tenemos entonces que un problema en forma canónica se ve como sigue:

Maxz=c1x1++cnxns.a.a11x1+a12x2++a1nxnb1a21x1+a22x2++a2nxnb2am1x1+am2x2++amnxnbnx10,x20,,xn0.

En términos matriciales, esto podemos reescribirlo de manera mucho más compacta como sigue:

Maxz=cxs.a.Axbx0,

en donde:

  • c=(c1,,cn)Rn es el vector de costos (vector renglón)
  • x=(x1,,xn)Rn es el vector de variables de decisión (vector columna),
  • A=[aij] es la matriz de restricciones, que es una matriz de m×n y
  • b=(b1,,bm)Rm es el vector de constantes que acotan las combinaciones lineales de variables.
  • Entendemos 0 como el vector en Rn que consiste de puras entradas iguales a cero.

Todo problema de programación lineal puede ser expresado en forma canónica; es decir, puede definirse un problema en forma canónica equivalente a él, en el sentido de que la solución de uno nos permite encontrar la solución del otro de manera sencilla. En efecto:

  • Si el problema es de minimización, puede considerarse en vez de z la función z=z y en el problema equivalente se busca maximizar z.
  • Si una restricción es del tipo puede ser mutiplicada por -1 para obtener una del tipo .
  • Una ecuación puede ser substituida por una desigualdad del tipo y otra del tipo . Luego, la del tipo puede ser substituida por una del tipo como en el punto anterior.
  • Para una variable xi0 puede definirse xi=xi, resultando xi0. Claramente hay una biyección entre elegir el valor de xi y xi.
  • Para una xi no restringida pueden ser definidas dos variables no negativas xi y xi tales que xixi=xi. Para cualquier xi dado podemos construir dichas variables, y viceversa, para xi y xi se puede construir xi.

Ejemplo de pasar un problema a forma canónica

Transformaremos el siguiente problema a su forma canónica.
Minz=x13x2+7x3s.a.3x1+x2+3x340x1+9x27x3505x1+3x2=205x2+8x380x1,x20,x3libre.

Primeramente se definen las variables no negativas x3 y x3, tales que x3x3=x3, con objeto de satisfacer el punto (3) de la definición. Para satisfacer el punto (1) se considera la función:
z=z=x1+3x27x3=x1+3x27x3+7x3

y se busca maximiza ésta (equivalente a minimizar z). Finalmente se realizan cambios en las restricciones para satisfacer el punto (2). La primera y cuarta desigualdad cumplen con la definición por lo que no se modifican (más allá de la sustitución de x3 por x3x3); la segunda desigualdad se multiplica por 1 para obtener una del tipo : x1+9x27x350x19x2+7x350.

Substituyendo las nuevas variables se obtiene: x19x2+7x37x350.

Para la tercera desigualdad se tiene lo siguiente:

5x1+3x2=205x1+3x220y5x1+3x2205x1+3x220y5x13x220.

Finalmente el problema queda expresado en forma canónica como:

Maxz=x1+3x27x3+7x3s.a.3x1+x2+3x33x340x19x2+7x37x3505x1+3x2205x13x2205x2+8x38x380x1,x2,x3,x30.

Forma estándar de un problema lineal

Definición. Se dice que un problema de programación lineal está en forma estándar si

  1. Todas las restricciones son ecuaciones.
  2. Todas las variables son no negativas.
  3. La función objetivo puede pedirse que se optimice maximizándola, o minimizándola.

De esta manera, un problema en forma estándar se ve como sigue:

Max(Min)z=c1x1++cnxns.a.a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bnx10,x20,,xn0.

En notación matricial, el problema en forma canónica queda expresado de la siguiente manera:

Max(Min)z=cxs.a.Ax=bx0

en donde c,x,A y b0 son como se mencionó antes.

Así como cualquier problema de programación lineal puede ser expresado en forma canónica, también cualquier problema de programación lineal puede expresarse en forma estándar. Una restricción del tipo () puede ser transformada en una ecuación sumando (o restando) una variable no negativa que recibe el nombre de variable de holgura (o variable de sobra).

Ejemplo de pasar un problema a forma estándar

Retomemos el problema ejemplo anterior, antes de expresarlo en forma canónica.

Minz=x13x2+7x3s.a.3x1+x2+3x340x1+9x27x3505x1+3x2=205x2+8x380x1,x20,x3libre.

Vamos a expresarlo ahora en forma estándar. Como lo hicimos anteriormente, hacemos la sustitución x=x3x3 para que la variable libre se convierta en dos con restricciones de ser no negativas.

Para satisfacer (1) se introducen las variables de holgura, x4, x5 y x6 que pediremos que sean no negativas. A la primera desigualdad le sumamos x4. A la quinta le sumamos x6. Y finalmente, a la segunda le restamos x5. Esto transforma las desigualdades en igualdades. De esta manera, el problema queda expresado de la siguiente manera:

Minz=x13x2+7x37x3s.a.3x1+x2+3x33x3+x4=40x1+9x27x3+7x3x5=505x1+3x2=205x2+8x38x3+x6=80x1,x2,x3,x3,x4,x5,x60.

Más adelante…

Las formas que estudiamos en esta entrada nos ayudarán posteriormente para plantear soluciones para problemas de programación lineal.

Mientras tanto, en la siguiente entrada hablaremos de algunos otros conceptos relativos a la teoría de problemas lineales y posibles propiedades que puede tener una asignación de variables. Diremos qué es una solución básica, una solución factible y un punto extremo para un problema lineal.

Tarea moral

  1. ¿Cuál sería la forma estándar del problema de maximizar x+y sujeto a xy8 y y0? ¿Y su forma canónica?
  2. Transforma el siguiente problema de programación lineal a su forma canónica y a su forma estándar:
    Maxz=2x1+3x22x3s.a.4x1x25x3=102x1+3x2+2x312x10,x2,x3irrestrictas.
  3. Revisa nuevamente las entradas anteriores y encuentra las formas canónicas y formas estándar de los problemas que hemos planteado hasta ahora.
  4. La forma estándar (o bien la forma canónica) de un programa lineal «es equivalente» al problema original. Justifica esta afirmación formalmente. Es decir, explica por qué una solución x1,,xn que optimiza el problema original está asociada a una solución de su forma estándar (o canónica) y viceversa.
  5. Imagina que tenemos un sistema de ecuaciones de la forma Ax=B con A matriz en Mm,n(R) y b vector en Rm. Queremos encontrar de todas las posibles soluciones al sistema aquella que minimiza la suma de las entradas de x. Plantea esto como un problema lineal y transfórmalo a su forma canónica y a su forma estándar.

Entradas relacionadas

Cálculo Diferencial e Integral III: Polinomio característico

Por Alejandro Antonio Estrada Franco

Introducción

En la entrada anterior estudiamos las representaciones matriciales de una transformación lineal. Vimos cómo dadas ciertas bases del espacio dominio y codominio, existe un isomorfismo entre matrices y transformaciones lineales. Así mismo, planteamos la pregunta de cómo encontrar bases para que dicha forma matricial sea sencilla. Vimos que unos conceptos cruciales para entender esta pregunta son los de eigenvalor, eigenvector y eigenespacio. Lo que haremos ahora es introducir una nueva herramienta que nos permitirá encontrar los eigenvalores de una transformación: el polinomio característico.

A partir del polinomio característico daremos un método para encontrar también a los eigenvectores y, en algunos casos especiales, encontrar una representación de una transformación lineal como matriz diagonal. Todo lo que hacemos es una versión resumida de lo que se puede encontrar en un curso más completo de álgebra lineal. Dentro del blog, te recomendamos consultar las siguientes entradas:

Polinomio característico

Pensemos en el problema de hallar los eigenvalores de una transformación lineal T:RnRn. Si λR es uno de estos eigenvalores, queremos poder encontrar vectores v¯0¯ tales que T(v¯)=λv¯. Esto sucede si y sólo si λv¯T(v¯)=0¯, lo cual sucede si y sólo si (λIdT)(v¯)=0¯, en donde Id:RnRn es la transformación identidad de Rn en Rn. Tenemos de esta manera que v¯ es un eigenvector si y sólo si v¯ker(λIdT).

Si existe v¯0¯ tal que v¯ker(λIdT); entonces ker(λIdT){0¯} por lo cual la transformación λIdT no es invertible, pues no es inyectiva. Así, en ninguna base Matβ(λIdT) es invertible, y por tanto su determinante es 0. Estos pasos son reversibles. Concluimos entonces que λR es un eigenvalor de T si y sólo si en alguna base β se cumple que det(Matβ(λIdT))=0. Esto motiva la siguiente definición.

Definición. Sea T:RnRn una transformación lineal. Llamamos a det(Matβ(λIdT)) al polinomio característico de T en la base β.

Por la discusión anterior, los escalares que cumplen det(Matβ(λIdT))=0 son los eigenvalores T. Para obtener los correspondientes eigenvectores, basta con resolver Matβ(T)X=λX, lo cual es un sistema de ecuaciones en el vector de variables X. Las soluciones X nos darán las representaciones matriciales de vectores propios v¯Rn en la base β.

Por el momento parece ser que tenemos mucha notación, pues debemos considerar la base en la que estamos trabajando. Un poco más adelante veremos que en realidad la base no importa mucho para determinar el polinomio característico. Pero por ahora, veamos un ejemplo concreto de las ideas platicadas hasta ahora.

Ejemplo: Consideremos T:R3R3 dada por T(x,y,z)=(2x+z,y+x,z). Calculemos su representación matricial con respecto a la base canónica β. Para ello, realizamos las siguientes evaluaciones:
T(1,0,0)=(2,1,0)T(0,1,0)=(0,1,0)T(0,0,1)=(1,0,1),

de donde: Matβ=(201110001).

Calculando el polinomio característico obtenemos: det(λ2011λ1000λ+1)=(λ2)(λ1)(λ+1).

Las raíces de (λ2)(λ1)(λ+1) son λ1=2, λ2=1 y λ3=1. Pensemos ahora en quiénes son los eigenvectores asociados a cada eigenvalor. Tomemos como ejemplo el eigenvalor λ=2. Para que (x,y,z) represente a un eigenvector en la base canónica, debe pasar que:

(201110001)(xyz)=2(xyz),

lo cual sucede si y sólo si:

(201110001)(xyz)2(xyz)=(000);

[(201110001)2(100010001)](xyz)=(000);

(001110003)(xyz)=(000).

De aquí, podemos llegar a la siguiente forma escalonada reducida del sistema de ecuaciones:

(110001000)(xyz)=(000).

En esta forma es sencillo leer las soluciones. Tenemos que z es variable pivote con z=0, que y es variable libre, y que x es variable pivote dada por x=y. Concluimos entonces que todos los posibles eigenvectores para el eigenvalor 2 son de la forma (y,y,0), es decir E2={(y,y,0):yR}.

Queda como tarea moral que encuentres los eigenvectores correspondientes a los eigenvalores 1 y 1.

Matrices similares

En la sección anterior definimos el polinomio de una transformación lineal en términos de la base que elegimos para representarla. En realidad, la base elegida no es muy importante. Demostraremos un poco más abajo que dos representaciones matriciales cualesquiera de una misma transformación lineal tienen el mismo polinomio característico. Para ello, comencemos con la siguiente discusión.

Sea T:RnRn una transformación lineal y sean β1={e¯1,,e¯n}, β2={u¯1,,u¯n} dos bases (ordenadas) de Rn. Supongamos que:

A=Matβ1(T)=[aij]B=Matβ2(T)=[bij].

Por cómo se construyen las matrices A y B, tenemos que:

T(e¯j)=i=1naije¯ipara j=1,,nT(u¯k)=j=1nbjku¯jpara k=1,,n.

Como β1 es base, podemos poner a cada un de los u¯k de β2 en términos de la base β1 mediante combinaciones lineales, digamos:

(1)u¯k=j=1ncjke¯j

en donde los cjk son escalares para j=1,,n y k=1,,n. La matriz C de n×n, con entradas cjk representa a una transformación lineal invertible, ya que es una transformación que lleva uno a uno los vectores de una base a otra. Afirmamos que CB=AC. Para ello, tomaremos una k en [n] y expresaremos T(u¯k) de dos formas distintas.

Por un lado, usando (1) y por como es cada T(e¯k) en la base β1 tenemos que:

T(u¯k)=j=1ncjkT(e¯j)=j=1ncjki=1naije¯i=j=1ni=1n(cjkaije¯i)=i=1nj=1n(cjkaije¯i)=i=1n(j=1naijcjk)e¯i.

Por otro lado, usando (1) y por como es cada T(u¯k) en la base β2:

T(u¯k)=j=1nbjku¯j=j=1nbjki=1ncjie¯j=j=1ni=1n(bjkcije¯i)=i=1nj=1n(bjkcije¯i)=i=1n(j=1ncijbjk)e¯i.

Comparemos ambas expresiones para T(u¯k). La primera es una combinación lineal de los e¯i y la segunda también. Como T(u¯k) tiene una única expresión como combinación lineal de los e¯i, entonces los coeficientes de la combinación lineal deben coincidir. Concluimos que para cada i se cumple:

j=1naijcjk=j=1ncijbjk.

Pero esto precisamente nos dice que la entrada (i,k) de la matriz AC es igual a la entrada (i,k) de la matriz CB. Con esto concluimos que AC=CB, como queríamos.

En resumen, obtuvimos que para dos matrices A y B que representan a la misma transformación lineal, existe una matriz invertible C tal que: B=C1AC. Además C es la matriz con entradas dadas por (1).

Introduciremos una definición que nos permitirá condensar en un enunciado corto el resultado que hemos obtenido.

Definición. Dos matrices A y B se llamarán similares (o semejantes), cuando existe otra matriz C invertible tal que B=C1AC.

Sintetizamos nuestro resultado de la siguiente manera.

Proposición. Si dos matrices representan a la misma transformación lineal, entonces estas matrices son similares.

El recíproco de la proposición también se cumple, tal y como lo afirma el siguiente resultado.

Proposición. Sean A y B matrices similares. Entonces A y B representan a una misma transformación lineal T, quizás bajo distintas bases.

Demostración: Supongamos que las matrices A y B son similares con B=C1AC, donde las matrices A, B, C están dadas por entradas A=[aij] B=[bij], C=[cjk]. Tomemos una base ordenada β={e¯1,,e¯n} de Rn. Consideremos la transformación lineal TL(Rn,Rn) dada por T(e¯j)=i=1naije¯i.

De esta manera T tiene forma matricial A en la base β.

Construyamos ahora una nueva base ordenada de Rn dada por vectores u¯k para k=1,,n construidos como sigue:

u¯k=j=1ncjke¯j.

Como C es invertible, en efecto tenemos que β:={u¯1,,u¯n} también es base de Rn. Además, de acuerdo con las cuentas que hicimos anteriormente, tenemos que precisamente la forma matricial de T en la base β será B.

Así, hemos exhibido una transformación T que en una base tiene representación A y en otra tiene representación B.

◻

Juntando ambos resultados en uno solo, llegamos a lo siguiente.

Teorema. Dos matrices A y B en Mn(R) son similares si y sólo si representan a una misma transformación lineal T:RnRn, quizás bajo distintas bases.

El polinomio característico no depende de la base

Si dos matrices son similares, entonces comparten varias propiedades relevantes para el álgebra lineal. Veamos un ejemplo de esto.

Teorema. Sea T:RnRn una transformación lineal en un espacio sobre R de dimensión finita. Sean β y β bases de Rn. Entonces se obtiene lo mismo calculando el polinomio característico de T en la base β, que en la base β.

Demostración. Tomemos A=Matβ(T) y B=Matβ(T). Como A y B representan a la misma transformación lineal T, entonces son similares y por lo tanto existe C invertible con B=C1AC.

Para encontrar el polinomio característico de T en la base β, necesitamos Matβ(λIdT), que justo es λIA. Así mismo, en la base β tenemos λIB. Debemos mostrar que el determinante de estas dos matrices es el mismo. Para ello, procedemos como sigue:

det(λIB)=det(λC1CC1AC)=det(C1(λIA)C)=det(C1)det(λIA)det(C)=det(C1)det(C)det(λIA)=det(I)det(λIA)=det(λIA).

Aquí estamos usando que el determinante es multiplicativo. Cuando reordenamos expresiones con det, lo hicimos pues los determinantes son reales, cuyo producto es conmutativo.

◻

Este teorema nos permite hablar del polinomio característico de una transformación lineal.

Concluimos esta entrada con un resultado que relaciona al polinomio característico de una transformación lineal, con la posibilidad de que exista una base cuya representación matricial sea diagonal.

Teorema. Sea T:RnRn una transformación lineal. Supongamos que el polinomio característico de T tiene raíces distintas λ1,,λn. Entonces se cumple lo siguiente:

  1. Si tomamos un eigenvector u¯i para cada eigenvalor λi, entonces u¯1,,u¯n forman una base β para Rn.
  2. Con dicha base β, se cumple que Matβ(T) es una matriz diagonal con entradas λ1,,λn en su diagonal.
  3. Si β es otra base de Rn y A=Matβ(T), entonces Matβ(T)=C1AC para una matriz invertible C con entradas dadas por (1).

La demostración de este resultado queda como tarea moral.

Más adelante…

En la entrada planteamos entonces un método para encontrar los eigenvectores de una transformación T: 1) la transformamos en una matriz A, 2) encontramos el polinomio característico mediante det(λIA), 3) encontramos las raíces de este polinomio, 4) cada raíz es un eigenvalor y las soluciones al sistema lineal de ecuaciones (λIA)X=0 dan los vectores coordenada de los eigenvectores.

Como platicamos en la entrada, una condición suficiente para que una transformación de Rn a sí mismo sea diagonalizable es que tenga n eigenvalores distintos. Otro resultado muy bonito de álgebra lineal es que si la transformación tiene alguna forma matricial simétrica, entonces también es diagonalizable. A esto se le conoce como el teorema espectral para matrices simétricas reales. En otros cursos de álgebra lineal se estudia la diagonalizabilidad con mucho detalle. Aquí en el blog puedes consultar el curso de Álgebra Lineal II.

Otra herramienta de álgebra lineal que usaremos en el estudio de la diferenciabilidad y continuidad de las funciones de Rn a Rm son las formas bilineales y las formas cuadráticas. En la siguiente entrada comenzaremos con estos temas.

Tarea moral

  1. Encuentra los eigenvectores faltantes del ejemplo de la sección de polinomio característico.
  2. Considera la transformación lineal T(x,y,z)=(2x+z,y+x,z) de R3 en R3. Nota que es la misma que la del ejemplo de la entrada. Encuentra su representación matricial con respecto a la base {(1,1,1),(1,2,3),(0,1,1)} de R3. Verifica explícitamente que, en efecto, al calcular el polinomio característico con esta base se obtiene lo mismo que con la dada en el ejemplo.
  3. Demuestra que si A y B son dos representaciones matriciales de una misma transformación lineal T, entonces det(A)=det(B).
  4. Sea T:R3R3 dada por T(x,y,z)=(x+y+z,x,y). Encuentra los eigenvalores correspondientes a la transformación, y responde si es posible representarla con una matriz diagonal. En caso de que sí, encuentra explícitamente la base β en la cual Matβ(T) es diagonal.
  5. Demuestra el último teorema de la entrada. Necesitarás usar resultados de la entrada anterior.

Entradas relacionadas