Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Álgebra Superior I: Reducción de Gauss-Jordan

Por Eduardo García Caballero

Introducción

En la entrada anterior vimos que los sistemas de ecuaciones se encuentran íntimamente relacionados con los vectores y las matrices. Teniendo esto en cuenta, en esta entrada abordaremos una estrategia que nos permitirá encontrar soluciones de los sistemas de ecuaciones lineales.

Operaciones elementales por filas

Antes de pasar a describir el algoritmo con el cual podremos resolver un sistema de ecuaciones lineales, deberemos definir algunas operaciones y conceptos que nos ayudaran a efectuarlo. Empecemos con una lista de operaciones que se pueden aplicar a las matrices, las cuales son con conocidas como operaciones elementales por filas.

Para esto, consideremos una matriz
A=(5π32121/340932/3),
y veamos cómo la afecta cada una de estas operaciones.

La primera de estas operaciones es el reescalamiento. Esta operación consiste en seleccionar una fila de una matriz, y multiplicar cada una de las entradas de esta fila por un mismo número real distinto de cero. Por ejemplo, si reescalamos la tercera fila de A por el número 3, obtendremos la matriz
(5π3212(3)(1/3)(3)(4)(3)(0)932/3)=(5π32121120932/3).

Otra operación que podemos aplicar a las matrices es la trasposición, la cual consiste en intercambiar el contenido de dos filas distintas. Por ejemplo, si transponemos las filas 2 y 4 de A, el resultado será la matriz
(5π3932/31/340212).

La última de las operaciones que nos interesa es la transvección. Esta consiste en sumar el múltiplo de una fila (el resultado de multiplicar cada entrada de una fila por un mismo escalar) a otra fila (la suma se realiza entrada por entrada). Por ejemplo, si en A realizamos la transvección que corresponde a “sumar 3/2 de la cuarta fila a la primera fila”, obtendremos la matriz
(5+(3/2)(9)π+(3/2)(3)3+(3/2)(2/3)2121/340932/3)=(37/29/2+π42121/340932/3).

Si recuerdas, todos los sistemas de ecuaciones se pueden escribir como Ax=b. Las operaciones elementales son muy importantes por las siguientes dos razones:

  • Si aplicamos la misma operación elemental a A y b para obtener la matriz A y el vector b, entonces Ax=b y Ax=b tienen exactamente el mismo conjunto solución. Decimos que «las operaciones elementales no cambian las soluciones del sistema».
  • Usando operaciones elementales se puede llevar el sistema Ax=b a un sistema mucho más sencillo Aredx=bred (que discutiremos más abajo). Entonces «las operaciones ayudan a simplificar un sistema de ecuaciones».

Juntando ambas observaciones, con operaciones elementales podemos llevar cualquier sistema de ecuaciones a uno mucho más sencillo y con el mismo conjunto solución.

Puedes intentar convencerte de la primera afirmación pensando en lo siguiente. En un reescalamiento de filas corresponde a multiplicar por una constante no nula ambos lados de una ecuación; la transposición corresponde a cambiar el orden en el que aparecen dos ecuaciones diferentes; mientras que la transvección corresponde a sumar un múltiplo de una ecuación a otra ecuación, y el sistema tiene las mismas soluciones pues, si un conjunto de valores es solución para dos ecuaciones, entonces es solución para cualquier combinación lineal de estas. En un curso de Álgebra Lineal I puedes encontrar las justificaciones con mucho más detalle.

En las siguientes secciones hablamos un poco más de la segunda afirmación.

Forma escalonada y escalonada reducida para una matriz

Además de las operaciones elementales por filas, es importante definir algunos conceptos.

Comencemos con el concepto de pivote: diremos que una entrada de una matriz es un pivote si es el primer elemento distinto de cero en una fila.

Diremos que una matriz se encuentra en forma escalonada si se cumple: 1. Todas las filas nulas se encuentran hasta abajo; 2. Todos los pivotes de filas no-nulas tienen valor 1; 3. El pivote de cada fila se encuentra la derecha del pivote de una fila superior. Es fácil identificar las matrices en forma escalonada porque parecen “estar en escalerita”. Por ejemplo, la matriz
(191101230011)
se encuentra en forma escalonada, mientras que las matrices
(102400920300)y(068500000092)
no lo están. ¿Puedes justificar por qué?

Por su parte, diremos que una matriz se encuentra en forma escalonada reducida si está en forma escalonada y, además, si hay un pivote en alguna fila, todas las entradas que no sean pivote en la misma columna del pivote son iguales a 0 (Ojo. Siempre hablamos de pivotes de renglones).

Por ejemplo, la matriz
(101001300001)
está en forma escalonada reducida.

Como recordarás de la entrada anterior, un sistema de ecuaciones lineales
{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm
se puede codificar como
(a11a12a1na21a22a2nam1am2amn)(x1x2xn)=(b1b2bm).

Como podemos cambiar el nombre de las variables, pero el vector de soluciones sigue siendo el mismo, es común codificar el sistema como una única matriz aumentada
(a11a12a1na21a22a2nam1am2amn | b1b2bm).

Aquí pusimos una línea vertical, pero sólo es por ayuda visual. Esa matriz la puedes tratar como cualquier matriz que hemos platicado.

Teniendo esto en cuenta, las matrices en forma escalonada reducida nos son de gran utilidad al resolver sistemas de ecuaciones lineales. Por ejemplo, consideremos el sistema
{x+3y+2w=8z+w=9,
el cual tiene como matriz aumentada a
(13020011 | 89),
la cual se encuentra en forma escalonada.

Gracias a que la matriz está en forma escalonada, podemos elegir en orden inverso w, z, y, x a las variables libres y pivote como en la entrada anterior. En este caso, podemos elegir como queramos el valor de w (w es variable libre). Usando la segunda ecuación, podemos despejar z en términos de w (z es variable pivote). Estos dos valores los sustituimos en la primera ecuación y notamos que y puede ser lo que queramos (y es variable libre). Finalmente, x queda totalmente determinado por las demás variables (x es pivote). Las variables pivote justo corresponden a columnas de la matriz que tengan pivote de alguna fila.

La ventaja de la forma escalonada es que podremos ir obteniendo fácilmente el valor de cada variable “de abajo hacia arriba”. En el caso de un sistema cuya matriz se encuentre en forma escalonada reducida, será aún más sencillo pues ya no tendremos que sustituir valores y obtenemos el despeje directamente.

Teorema de reducción de Gauss-Jordan

El siguiente teorema relaciona las operaciones elementales por filas con la forma escalonada reducida de una matriz.

Teorema (de reducción de Gauss-Jordan o reducción gaussiana). Cualquier matriz con entradas reales se puede a una forma escalonada reducida aplicando una cantidad finita de pasos.

A continuación presentamos un algoritmo con el cual podemos pasar de una matriz arbitraria a una matriz en su forma escalonada reducida. Para hacer más sencilla su aplicación, nos enfocaremos en comprender la estrategia que sigue el algoritmo. La descripción formal del algoritmo y demostración de que en efecto funciona como esperamos es un tema que abordarás en el curso de Álgebra Lineal I (puedes echarle un ojo a esta entrada).

Primeramente, describiremos los pasos del algoritmo, al que se le conoce como reducción de Gauss-Jordan o reducción gaussiana.

Estrategia: Iremos arreglando la matriz de izquierda a derecha. Para ello, haremos los siguientes pasos repetidamente.

  1. Buscamos la primera columna de la matriz (de izquierda a derecha) que no tenga puros ceros.
  2. Una vez encontrada dicha columna, buscamos la primera entrada (de arriba hacia abajo) que no sea cero.
  3. Pasamos la fila que contiene a dicha entrada hasta arriba mediante la operación de transposición.
  4. Multiplicamos cada entrada de la fila que acabamos de mover hasta arriba por el inverso multiplicativo de su primera entrada (aquí usamos la operación de reescalamiento). La primera entrada de esta fila ahora será 1.
  5. Mediante la operación de transvección, sustraemos múltiplos de la primera fila al resto de renglones de la matriz, de modo que el resto de los valores en la columna correspondiente a la primera entrada de la fila en la que estamos trabajando pasen a ser 0 (como puedes observar, la entrada primera entrada no-nula de la fila en la que estamos trabajando ahora será un pivote).
  6. Ignorando la primera fila, buscamos la primera columna (de izquierda a derecha) que no tenga puros ceros.
  7. Repetimos los pasos anteriores (2 a 6), pero ahora, en vez de mover la fila con la que estamos trabajando “hasta arriba”, la moveremos inmediatamente después de la última fila con la que trabajamos.
  8. Hacemos esto hasta haber arreglado todas las columnas.

Ejemplo de reducción de Gauss-Jordan

Ahora, como ejemplo, veamos cómo podemos implementar este algoritmo en la matriz
(01234101233110201111),
la cual, si la consideramos como la matriz aumentada
(0123101231100111 | 4321),
corresponde al sistema de ecuaciones
{y+2z+3w=4x+z+2w=23x+yz=0y+z+w=1.

Buscamos la primera la primera columna no nula, la cual resulta ser la primera columna de la matriz. En esta columna, vemos que la segunda entrada es la primera entrada distinta de cero. Entonces, mediante trasposicón, intercambiamos las filas 1 y 2 (“movemos la segunda columna hasta arriba”):
(10123012343110201111).

Ahora, nos fijamos en la primera entrada no nula de la primera fila, que es 1, y reescalamos la fila por su inverso multiplicativo, que es 1:
((1)(1)(1)(0)(1)(1)(1)(2)(1)(3)012343110201111)=(10123012343110201111).

Ahora, observamos el valor de la primera entrada de la tercera fila, el cual es 3. Entonces, mediante transvección, sumamos 3 veces la fila 1 a la fila 3:
(10123012343+(3)(1)1+(3)(0)1+(3)(1)0+(3)(2)2+(3)(3)01111)=(101230123401261101111),
y realizamos lo mismo, pero ahora considerando la fila 4.
(10123012340126110+(0)(1)1+(0)(0)1+(0)(1)1+(0)(2)1+(0)(3))=(101230123401261101111)
Como puedes observar, ninguna de las transvecciones influye en la otra, de manera que las podemos enlistar en un único paso. Además, al hacer una transvección con escalar 0 no cambia nada de la fila, así que estas no se necesita hacerlas.

Ahora, ignorando la última fila con la que trabajamos (que es la primera), buscamos la primera columna no-nula, que en este caso será la segunda, posteriormente buscamos el primer elemento no nulo de la columna, el cual se encuentra en la segunda fila, y la “movemos enseguida de la última fila con la que trabajamos” (en este caso no tendríamos que realizar ninguna transposición, o bien, la transposición sería la de la segunda fila consigo misma, ya que ya se encuentra en seguida de la última fila con la que trabajamos). Después, reescalamos por el inverso multiplicativo del primer elemento no nulo de la fila, que es 1:
(10123(1)(0)(1)(1)(1)(2)(1)(3)(1)(4)01261101111)=(101230123401261101111)
(observa que reescalar por 1 deja todas las entradas iguales) y posteriormente realizamos las transvecciones necesarias para que el resto de entradas de la segunda columna sean cero.
(10+(0)(1)1+(0)(2)2+(0)(3)3+(0)(4)0123401+(1)(1)2+(1)(2)6+(1)(3)11+(1)(4)01+(1)(1)1+(1)(2)1+(1)(3)1+(1)(4))=(10123012340003700123)

De manera similar, ignorando ahora las primeras dos filas, buscamos la primera columna no-nula, la cual corresponde ahora a la tercera, y buscamos el primer elemento no-nulo de esta columna, el cual se encuentra en la cuarta fila. Entonces, transponemos las filas 3 y 4 para que el primer elemento no-nulo quede inmediatamente después de la última fila con la que trabajamos:
(10123012340012300037).

Seguidamente, reescalamos la tercera fila,
(1012301234(1)(0)(1)(0)(1)(1)(1)(2)(1)(3)00037)=(10123012340012300037)
y relizamos las transvecciones necesarias:
(1+(1)(0)0+(1)(0)1+(1)(1)2+(1)(2)3+(1)(3)0+(2)(0)1+(2)(0)2+(2)(1)3+(2)(2)4+(2)(3)0012300037)=(10000010120012300037).

Finalmente, como nuestra última columna no cero es la cuarta y la primera fila no cero (ignorando las filas que ya tienen pivote) tiene un 3, reescalamos de la siguiente manera:
(100000101200123(1/3)(0)(1/3)(0)(1/3)(0)(1/3)(3)(1/3)(7))=(10000010120012300017/3),

Y hacemos las transvecciones necesarias:
(100000+(1)(0)1+(1)(0)0+(1)(0)1+(1)(1)2+(1)(7/3)0+(2)(0)0+(2)(0)1+(2)(0)2+(2)(1)3+(2)(7/3)00017/3)=(1000001001/300105/300017/3).

Notemos que si consideramos esta matriz como la matriz aumentada
(1000010000100001 | 01/35/37/3),
este corresponde al sistema
{x=0y=1/3z=5/3w=7/3,
del cual sabemos inmediatamente su solución. Como mencionamos anteriormente, los sistemas de ecuaciones asociados a la matriz original y la matriz escalonada reducida resultante de aplicar operaciones elementales por filas, consideradas como matrices aumentadas, tienen las mismas soluciones. Entonces, ¡este último sistema es la solución para nuestro sistema de ecuaciones original!

Como podemos ver, los sistemas de ecuaciones asociados a una matriz en su forma escalonada reducida son fáciles de resolver por que vamos escogiendo valores arbitrarios para las variables en posición que no es pivote, mientras que podemos obtener el valor de las variables que son pivote mediante despejes sencillos.

Recuerda que este algoritmo funciona para cualquier matriz con entradas reales. ¿Podrías proponer otro sistema de ecuaciones e implementar la misma estrategia para resolverlo?

Más adelante…

Ahora vimos una estrategia para resolver sistemas de ecuaciones lineales de distintos tamaños. En las siguientes entradas conoceremos más propiedades sobre las matrices. Estas nuevas propiedades también juegan un rol fundamental en poder determinar de manera más rápida cuándo un sistema de ecuaciones lineales tiene solución, y tener otras alternativas para resolverlo bajo ciertas condiciones.

Tarea moral

  1. Aplica reducción gaussiana a las siguientes matrices:
    (52135),(110101011).
  2. Resuelve el siguiente sistema de ecuaciones llevándolo a forma escalonada reducida, y luego aplicando a técnica de variables libres y pivote:
    {a+b+c+d+e=52a+2b3c3d+e=5ab+cd+e=0.
  3. Sea I la matriz identidad de n×n y A otra matriz de n×n. Sea E la matriz obtenida de aplicar una transvección a I. Sea B la matriz de aplicar esa misma transvección a A. Demuestra que EA=B.
  4. Demuestra que una matriz A de 2×2 es invertible si y sólo si al aplicar reducción de Gauss-Jordan al final se obtiene la matriz identidad I. ¿Puedes hacerlo para matrices de 3×3? ¿De n×n?
  5. Sea A una matriz de 2×2 invertible. A A le «pegamos» una identidad del mismo tamaño a la derecha para llegar a (A|I), por ejemplo (abcd) se convertiría en (ab10cd01). Muestra que si aplicamos reducción de Gauss-Jordan a (A|I), se llega a (I|A1). Intenta extender tu demostración a matrices de 3×3 ó n×n.

Entradas relacionadas

Geometría Moderna II: Los Diez Problemas de Apolonio

Por Armando Arzola Pérez

Introducción

Un problema clásico de la geometría es el Problema de Apolonio el cual enuncia:

Encontrar una circunferencia dado tres condiciones, las cuales pueden surgir de lo siguiente:

  1. La circunferencia pasa por uno o más puntos «P»
  2. La circunferencia es tangente a una o más líneas «L»
  3. La circunferencia debe de ser tangente a uno o más círculos «C»

De lo anterior nacen los 10 Problemas de Apolonio (Las soluciones se darán a partir de construcciones).

Los Diez Problemas de Apolonio

Problema 1. Construir una circunferencia que pase por tres puntos dados (PPP).

Construcción. Dados tres puntos A, B y C, de los cuales podemos formar un triángulo ABC. Trazando las mediatrices de cada lado encontraremos el circuncentro «O», que resulta ser el centro de la circunferencia circunscrita al triángulo ABC. De esta forma podemos dibujar la circunferencia C(O,r).

◻

Problema 2. Construir una circunferencia que pase por dos puntos dados y tangente a una recta dada (PPL).

Construcción. Sean A y B dos puntos dados y r una recta tangente a la circunferencia buscada.

El centro de la circunferencia buscada C debe estar ubicada en la mediatriz del segmento AB, por ello dibujemos la mediatriz a través del arco de dos circunferencias con centro A y centro B las cuales se intersecan y se puede trazar la mediatriz.

Ahora tomamos un punto «D» de la mediatriz, del cual lo tomamos como centro de una circunferencia C1 que pase por A y B. También trazamos el segmento AB que corte r en C.

Debemos de encontrar una recta tangente a C1 y que pase por el punto C. Por ello unimos DC y sacamos la mediatriz con centro E, trazamos la circunferencia C2 que interseca a C1 en dos puntos del cual solo nos interesa uno que es F y al unirlo con C este forma una recta tangente a C1.
Por ahora tenemos por potencia CACB=CF2.

Ahora trazamos el arco de circunferencia con centro C y radio CF que corta a la recta r en dos puntos T1 y T2 cumplen CACB=CF2=CT12=CT22 perpendiculares por T1 y otra por T2, y cortan a la mediatriz AB.
Y en esas intersecciones van a estar los centros de las circunferencias que pasan por A, B y tangentes a r.

◻

Problema 3. Construir una circunferencia tangente a dos líneas dadas y que pasa por un punto (PLL).

Construcción. Sean l1 y l2 dos rectas dadas y P un punto dado, notemos que el centro de la circunferencia buscada es un punto de la bisectriz; Por otro lado, la circunferencia buscada debe contener a P y P punto simétrico respecto a la bisectriz.
Si observamos tenemos el caso del problema 2 PPL, ya que tenemos dos puntos P y P por los cuales pasara la circunferencia buscada, además de que es tangente a una recta l1. Por tal motivo se puede seguir la misma construcción anterior para llegar a la solución.

◻

Problema 4. Construir un círculo tangente a tres líneas dadas (LLL).

Construcción. Sean tres rectas dadas l1, l2 y l3, las cuales forman un triángulo ABC. Trazando las bisectrices de los ángulos internos del triángulo ABC se intersecan en un único punto O.
El punto O es el centro de la circunferencia inscrita del triángulo ABC , ahora trazamos las perpendiculares por O a cada lado y encontraremos el radio OS el cual nos da la circunferencia tangente a l1, l2 y l3.

◻

Problema 5. Construye una circunferencia pasando por dos puntos dados y tangente a un círculo dado (PPC).

Construcción. Existen varios casos para este problema, en este caso tomaremos a los puntos A y B fuera de la circunferencia dada C(O,r).
Trazamos la mediatriz de A y B, después tomamos un punto cuál sea x en la mediatriz y generamos una circunferencia con centro en x y radio A o B y que corta a la circunferencia C(O,r). Los dos puntos de intersección los llamaremos D y E los uniremos y prolongaremos hasta que corte a la recta AB, el punto de intersección será F.

Unimos F con O y sacamos su mediatriz, denotamos a G al punto de intersección de FO con la mediatriz. Ahora trazamos la circunferencia con centro G y radio O la cual corta a C(O,r) en H y I.

Si unimos I con O corta a la mediatriz AB en O1, el cual será el centro de la circunferencia buscada con radio O1I y por lo cual pasa por A, B y tangente C(O,r). Ocurre lo mismo si unimos H con O, corta a la mediatriz de AB en O2, este sería el centro O2 y radio O2A, el cual genera la otra circunferencia tangente a C(O,r) y pasa por A y B.

◻

Problema 6. Construir una circunferencia que pase por un punto dado, tangente a una recta dada y tangente a un círculo dado (PLC).

Construcción. Para este problema 6 podemos encontrar cuatro soluciones, pero por ahora solo se dará una parte de la construcción, ya que lo demás ya se ha venido trabajando en las construcciones anteriores.
Tenemos la circunferencia C, el punto P y la recta r. Trazamos una perpendicular a r que pase por C, ahora sea O el punto de corte que será el centro de inversión que convierte la circunferencia C en la recta r, entonces los puntos x y x son inversos.
Ahora debemos encontrar el punto inverso de P, por ello trazamos la mediatriz de xx y trazamos la mediatriz de xP, estas dos rectas cortan en Y el cual es el centro de circunferencia que corto a x, x y P, y el punto de intersección de esta circunferencia con la recta OP tendremos P.

Nos daremos cuenta de que tenemos el mismo problema 2 PPL, por lo cual solo se debe seguir la misma construcción para hallar las circunferencias buscadas.

De aquí en adelante se enunciarán únicamente los problemas faltantes.

Problema 7. Construir una circunferencia que pase por un punto P dado y dos círculos tangentes a esta circunferencia buscada (PCC) (4 soluciones).

Problema 8. Construir una circunferencia tangente a dos rectas dadas y a un círculo dado (LLC) (8 soluciones).

Problema 9. Construir una circunferencia tangente a una línea dada y a dos círculos dados (LCC) (8 soluciones).

Problema 10. (Problema de Apollonius) Construir una circunferencia tangente a tres círculos dados (CCC).

Más adelante…

Una vez visto el tema de Polos y Polares, es hora de realizar unos ejercicios que se dejaran, todo con el objetivo de fortalecer los temas vistos.

Entradas relacionadas

Geometría Moderna II: Circunferencia Polar

Por Armando Arzola Pérez

Introducción

Como ya se vio en la entrada anterior de Triángulo Autopolar, se puede tener un triángulo autopolar dada una circunferencia y no solo eso, sino que además se puede tener un número infinito de triángulos autopolares dada una circunferencia, pero solamente existe una circunferencia (Circunferencia Polar) de la cual un triángulo dado sea autopolar.

Circunferencia Polar

Como mencione, solo existe una circunferencia de la cual un triángulo dado sea autopolar, donde el triángulo debe de ser obtuso. Por lo cual si se cumple lo anterior se tiene una circunferencia que se denomina Circunferencia Polar del triángulo.

Construcción. Dado A un punto dado y BC una recta dada. Supongamos O el centro de la circunferencia, dado que la polar de B pasa por A y perpendicular a BO, y la polar de C pasa por A y perpendicular a CO, entonces O es el ortocentro del triángulo ABC.

Ahora como el polo A es el vértice, y el pie de la altura D el cual pertenece a la polar de A son puntos inversos, entonces r=AO×DO, de esta forma encontramos la circunferencia polar del triángulo ABC la cual es única.

Construcción Circunferencia Polar

El triángulo ABC es autopolar.

◻

Propiedad. Cualquier circunferencia la cual tiene una cuerda como altura del triángulo es ortogonal a la circunferencia polar del triángulo.

De la construcción anterior se tiene:

Propiedad. Si un triángulo es autopolar con respecto a una circunferencia, entonces el triángulo es obtusángulo.

Demostración. Se sabe que el ABC es autopolar con respecto a la circunferencia C(O,r) y se tiene que O es el ortocentro. Además, OA×OA=OC×OC=OB×OB=r2.

Ahora supongamos O interno al triángulo ABC, entonces los puntos inversos de cada par estarían en lados contrarios de sus respectivas líneas respecto a O centro de inversión, entonces OA×OA=OC×OC=OB×OB=r2. Por lo cual O debe de ser un punto externo al triángulo ABC.

Entonces BAC es un angulo externo a BBA, entonces BAC=BBA+ABB=π/2+ABB, se tiene que BAC>π/2. Por lo tanto, el ABC es obtusangulo.

◻

Teorema. El circuncirculo de un triángulo autopolar y su circunferencia de los nueve puntos son mutuamente inversas con respecto a la circunferencia polar.

Propiedad. Tres de los cuatro triángulos de un grupo ortocentrico son obtusos.

Circunferencia Polar triángulos Obtusos

Los triángulos DAB, DBC y DCA son obtusos en D, se tienen rC, rA y rB los radios de las circunferencias polares C, A y B de estos triángulos respectivamente.

Entonces se tiene rB2=BA×BC y rC2=AC×BC, de lo anterior se obtiene rB2+rC2=(BA×AC)BC=BC2.

De esta forma las circunferencias B y C son ortogonales, como A y C son puntos inversos con respecto a la circunferencia B, AA es la polar de C respecto a la circunferencia B y pasa por los puntos de intersección de las circunferencias B y C, por lo cual se tiene el siguiente teorema.

Teorema. Dados los tres triángulos obtusos de un grupo ortocentrico sus circunferencias polares son ortogonales en pares, y sus puntos de intersección están en los tres lados de un cuadrángulo que pasa por el vértice común de los ángulos obtusos.

Más adelante…

Se abordarán los 10 problemas de Apolonio.

Entradas relacionadas

Conjuntos anidados

Por Lizbeth Fernández Villegas

 MATERIAL EN REVISIÓN

Introducción:

En esta ocasión nos vamos a fijar en colecciones de conjuntos que están contenidos unos en otros. Vamos a suponer que es una cantidad numerable de conjuntos. El primer conjunto contiene al segundo, que a su vez contiene a un tercero y así, sucesivamente.

Ahora pensemos en la intersección de todos esos conjuntos. Intuitivamente podemos visualizar que se tratará de un conjunto muy pequeño, que estará contenido en todos los demás.

Aquí tenemos un ejemplo de una sucesión de conjuntos donde los últimos términos corresponden al mismo conjunto. La intersección de todos los conjuntos es, evidentemente, ese último conjunto

Observemos la sucesión de intervalos [1n,1n]nN.

Nota que todos tienen como elemento al cero. Además es el único elemento que pertenece a la intersección de todos los intervalos, pues si suponemos que hay otro más, dado que 1n0 es posible encontrar un intervalo suficientemente pequeño, que deje fuera este elemento.

Con un radio menor a la distancia entre 0 y el punto rojo, este último queda fuera.

Ahora consideremos el subespacio Q con la métrica usual. En esta ocasión los intervalos serán (21n,2+1n),nN. Queda como ejercicio al lector demostrar que la intersección de estos conjuntos es vacía en Q.

Entonces, ¿bajo qué condiciones podremos asegurar que la intersección no es vacía pese a que los conjuntos se hagan «cada vez más pequeños» y estén contenidos unos en otros? Veamos la siguiente definición:

Definición bolas encajadas: Sea (X,d) un espacio métrico y (B(xn,εn))nN una sucesión de bolas cerradas en X. Si nN se cumple que B(xn+1,εn+1)B(xn,εn) diremos que la sucesión (B(xn,εn))nN es de bolas encajadas.

Sucesión de bolas cerradas encajadas

Proposición principio de bolas encajadas: (X,d) es un espacio métrico completo si y solo si para cualquier sucesión de bolas cerradas encajadas (B(xn,εn))nN cuyos radios tienden a cero, es decir εn0, se cumple que la intersección de todas las bolas cerradas es no vacía. Además nNB(xn,εn)={x} para algún xX.

Demostración:
Supongamos que (X,d) es completo. Sea (B(xn,εn))nN una sucesión de bolas encajadas. Vamos a probar primero que la sucesión de los centros de las bolas cerradas (xn)nN es de Cauchy. Sea ε>0, como εn0, existe NN tal que nN,εn<ε2. Como la sucesión es de bolas encajadas, tenemos que l,mN,B(xl,εl)B(xN,εN) y B(xm,εm)B(xN,εN) entonces d(xl,xm)d(xl,xN)+d(xN,xm)ε2+ε2=ε. Por lo tanto (xn) es de Cauchy. Como X es completo, se sigue que xnx para algún xX


Vamos a demostrar que xnNB(xn,εn). Sea nN. Como las bolas son encajadas, tenemos que kn,B(xk,εk)B(xn,εn) en consecuencia kn, el término de la sucesión xk es elemento de B(xn,εn), que es un conjunto cerrado. Ya que la subsucesión formada por estos últimos términos converge en x se sigue de lo que vimos en Convergencia que xB(xn,εn). Como esto ocurre nN, concluimos que xnNB(xn,εn).

Además x es el único punto en la intersección, pues si existe otro punto xnNB(xn,εn) existen también bolas cerradas suficientemente pequeñas que no contienen a ambos puntos. La demostración de este hecho se deja como ejercicio.

Para el regreso buscamos demostrar que (X,d) es completo. Sea (xn)nN una sucesión de Cauchy.

Vamos a construir una sucesión de bolas encajadas de la siguiente forma:
Ya que la sucesión (xn) es de Cauchy, podemos afirmar que existe N1N tal que n,mN1,d(xn,xm)12. Entonces nN1,xnB(xN1,12)B(xN1,1).

Nuevamente, como (xn) es de Cauchy, existe N2N tal que n,mN2,d(xn,xm)122. Entonces nN2,xnB(xN2,122)B(xN2,12). Nota que esta bola está contenida en la anterior.

Continuando recursivamente, la bola k de la sucesión en construcción estará dada por el centro xNk donde Nk es tal que n,mNk,d(xn,xm)12k. Entonces nNk,xnB(xNk,12k)B(xNk,12k1).

Así, la sucesión (B(xNn,12n1))nN es de bolas encajadas y sus radios tienden a cero. Por hipótesis sabemos que la intersección de estos conjuntos es {x}, para algún xX. Es sencillo probar que la sucesión de centros (xNn)nN converge en x (se dejará como ejercicio). Entonces tenemos una subsucesión de la sucesión de Cauchy (xn) que es convergente y, como vimos en entrada anterior, esto demuestra que (xn)x por lo que X es completo.

Notemos que para asegurar la contención de un conjunto en otro, necesitamos obtener información acerca de las distancias entre sus elementos. Esto motiva una definición para conjuntos más generales que una bola cerrada:

Definición diámetro de un conjunto: Sea AX. Entonces el diámetro de A se define como:
diam(A)=sup{d(x1,x2):x1,x2A}.

Cuando el conjunto {d(x1,x2):x1,x2A} no es acotado, diremos que el diámetro es .

Proposición: Sea (xn)nN una sucesión en (X,d) y para cada NN,XN={xk:kN} el conjunto de los términos de la sucesión que van a partir de xN. Entonces (xn) es una sucesión de Cauchy si y solo si
limNdiam(XN)=0

Demostración:
Supón que (xn) es una sucesión de Cauchy en X y sea ε>0. Entonces existe KN tal que l,mK,d(xl,xm)<ε. En consecuencia diam(XK)ε. Como para todo LK,(XL)(XK) se sigue que para todo LK,diam(XL)diam(XK)ε. Por lo tanto limNdiam(XN)=0

Ahora supongamos que limNdiam(XN)=0. Buscamos demostrar que (xn) es de Cauchy. Sea ε>0, como los diámetros tienden a cero, existe KN tal que en particular (XK) satisface que diam(XK)<ε. Entonces l,mK,d(xl,xm)<ε lo cual demuestra que (xn) es de Cauchy.

Terminemos con la siguiente:

Proposición: Sean (An)nN una sucesión de subconjuntos cerrados de un espacio métrico completo (X,d) tales que para todo nN,An+1An y además limndiam(An)0. Entonces nNAn={x} para algún xX).

Demostración:
Para cada nN elegimos xnAn. Entonces para cada NN el conjunto XN definido en la proposición anterior está contenido en AN, pues los conjuntos están anidados. En consecuencia, diam(XN)diam(An)0. La proposición anterior nos permite concluir que (xn) es una sucesión de Cauchy. Como X es completo, se sigue que (xn)x para algún xX. Dejamos como ejercicio demostrar que nNAn={x}.

¿Recuerdas la distancia de Hausdorff vista en La métrica de Hausdorff? Nota que si A y B son subconjuntos de X entonces dH(A,B)diam(AB). En esa misma entrada vimos que conjuntos anidados convergen a la intersección de todos ellos, y que este conjunto está formado por los puntos de convergencia de sucesiones que tienen elementos en los conjuntos anidados. En entradas futuras veremos que los espacios compactos son cerrados. ¿Cómo justificarías las proposiciones vistas en esta entrada a partir de los resultados presentados en la métrica de Hausdorff?

Más adelante…

Veremos los conceptos de conjunto denso y conjunto nunca denso. Descubriremos un resultado que ha sido muy importante en el estudio de los espacios métricos completos: El teorema de Baire.

Tarea moral

  1. Sea Q el subespacio de R con la métrica usual. Demuestra que la intersección de los intervalos [21n,2+1n],nN es vacía.
  2. Demuestra que si x está en la intersección de bolas encajadas nNB(xn,εn) entonces es único.
  3. Demuestra que la sucesión de centros (xNn)nN de la proposición converge en x.
  4. Sea AX. Demuestra que diam(A)=diam(A).
  5. Da un ejemplo de un espacio métrico completo y de una sucesión de bolas cerradas en este espacio, encajadas unas en otras que tenga intersección vacía.

Enlaces

Espacios métricos completos

Por Lizbeth Fernández Villegas

 MATERIAL EN REVISIÓN

Introducción

En la entrada anterior vimos que no es suficiente que una sucesión sea de Cauchy para asegurar que sea convergente. Hay espacios donde sí lo es y serán llamados «completos». Contar con este recurso nos permite solo tener que justificar que una sucesión satisface la condición de Cauchy cuando esto resulte ser más sencillo que demostrar su convergencia en un punto. Comencemos con la definición:

Definición espacio métrico completo y espacio de Banach: Sea (X,d) un espacio métrico. Decimos que X es un espacio métrico completo si toda sucesión de Cauchy (xn)nN es convergente en X.
A un espacio normado que es completo con la métrica inducida por su norma le llamaremos espacio de Banach.

Ejemplos:

  1. El espacio métrico euclideano Rn es completo. La demostración la vimos en la sección anterior. (Sucesiones de Cauchy).
  2. Sea X un conjunto no vacío con la métrica discreta. Entonces X es completo. La demostración se propondrá como ejercicio.
  3. Rn con la métrica d(x,y)=máx{|x1y1|,,|xnyn|} donde x=(x1,,xn) y y=(y1,,yn) es completo.

Demostración:
Sea (xn)nN una sucesión de Cauchy en Rn. En la sección anterior vimos que (xn) converge en la métrica euclidiana d2. Sea x el punto de convergencia. En la entrada Más conceptos de continuidad vimos que d y d2 son métricas equivalentes, entonces para todo ε>0 existe NN y c>0 tales que para todo nN:
d(xn,x)cd2(xn,x)cεc=ε
Por lo tanto xnx en (Rn,d), lo cual demuestra que es un espacio métrico completo.

En general, la completitud no es una propiedad invariante bajo homeomorfismos. Esto es, un espacio completo puede ser homeomorfo a otro que no lo sea.

Ejemplo: El espacio euclidiano R es homeomorfo al subespacio (1,1).

En efecto:

ϕ:(1,1)R,ϕ(x)=x1x2

Es un homeomorfismo entre ambos espacios. No obstante la sucesión (11n)nN tiene sus elementos en (1,1) y es de Cauchy pero no converge en el subespacio. Por lo tanto (1,1) no es completo pese a que R sí lo es.

(1,1) es homeomorfo a R

Por otro lado, la completitud sí se conserva bajo equivalencias. (Concepto visto en Más conceptos de continuidad):

Proposición: Sean (X,dX) y (Y,dY) espacios métricos con ϕ:XY una equivalencia entre ellos. Entonces X es completo si y solo si Y lo es.

Demostración:
Supongamos que X es completo. Buscamos demostrar que Y también lo es. Sea (yn)nN una sucesión de Cauchy en Y. Como ϕ es equivalencia entonces ϕ1 es lipschitz continua. Considera la sucesión ϕ1(yn)nN en X. Dadas las hipótesis, para toda ε>0 existe NN y c>0 tales que si n,mN entonces:
dX(ϕ1(yn),ϕ1(ym))cdY(yn,ym)cεc=ε lo cual prueba que la sucesión ϕ1(yn)nN es de Cauchy en X, espacio que es completo, en consecuencia ϕ1(yn)x en X para algún xX.

Finalizamos aplicando ϕ a la última sucesión. En la entrada de Funciones continuas en espacios métricos vimos que podemos concluir que ϕ(ϕ1(yn))ϕ(x) en Y. Por lo tanto (yn) es una sucesión convergente lo cual demuestra que Y es un espacio métrico completo.
El regreso es análogo y se propondrá como ejercicio al final de esta sección.

Proposición: Todo espacio normado de dimensión finita es de Banach.

Demostración:
Sea V un espacio con norma asociada V con dimensión finita n. En la entrada anterior probamos que el espacio euclideano Rn es de Banach. En la entrada Más conceptos de continuidad probamos que la norma 2 es equivalente a 1. De acuerdo a la proposición anterior, bastará con encontrar una equivalencia entre (Rn,1) y (V,V).
Sea {e1,,en} la base canónica de Rn, {v1,,vn}, una base ordenada de V y L:RnV tal que para cada i=1,,n,L(ei)=vi. Es sencillo demostrar que L es una transformación lineal y que es también una función biyectiva. Esta afirmación se propondrá como ejercicio.
Sean a,bRn tales que a=i=1naiei y b=i=1nbiei con ai,biR,1in. Sea c=máx1in{viV}, entonces:

L(i=1naiei)L(i=1nbiei)V=i=1naiL(ei)i=1nbiL(ei)V=i=1naivii=1nbiviV=i=1n(aibi)viVi=1n|aibi|viVmáx1in{viV}i=1n|aibi|=ci=1n|aibi|=cab1

Entonces L es una función Lipschitz continua. La prueba de que la inversa es Lipschitz continua se deja como ejercicio. Esto demostraría que V también es un espacio de Banach.

La completitud no siempre se hereda a los subespacios de un espacio métrico completo. La siguiente proposición nos muestra las condiciones requeridas para que esto ocurra:

Proposición: Sea (X,d) un espacio métrico completo y AX. Entonces el subespacio (A,d) es completo si solo si A es cerrado en X.

Demostración:

Supón que (A,d) es completo. Buscamos demostrar que AA. Sea xA. En la entrada de Convergencia concluimos que existe una sucesión (xn)nN de términos en A tal que xnx. Como converge, se concluye que es de Cauchy. Como todos los términos están en A, que es completo, se concluye que es convergente en A. Como el límite es único, concluimos que el punto de convergencia xA. Por lo tanto AA, probando así que A es cerrado.

Ahora partamos de suponer que AX es cerrado. Sea (xn)nN una sucesión de Cauchy en A. Como X es completo, se sigue que xnx en X para algún xX. Por el mismo resultado de la entrada de Convergencia concluimos que xA. por lo tanto xnx en A lo cual demuestra que A es completo.

Ya que sabemos que un espacio normado de dimensión finita es de Banach, es natural preguntarse qué ocurre con los de dimensión infinita. Como ejemplo tenemos al espacio de los polinomios P[0,1]. Visto como subespacio del espacio de funciones continuas C0[0,1] es de dimensión infinita pero no es cerrado. La proposición anterior nos permite concluir que P[0,1] no es completo. La demostración del ejemplo se puede consultar en las notas de Luis O. Manuel. El documento se encuentra en este link.

Más adelante…

Buscaremos aplicar estos resultados en conjuntos anidados, unos dentro de otros. Partir de una sucesión de Cauchy nos permitirá asegurar la existencia de un punto de convergencia, cuando estemos en un espacio completo. Conoceremos condiciones en las que dicho punto existe y pertenece a la intersección de los conjuntos anidados.

Tarea moral

  1. Demuestra que si X es un conjunto no vacío con la métrica discreta entonces X es completo.
  2. Sean (X,dX) y (Y,dY) espacios métricos con ϕ:XY una equivalencia entre ellos. Prueba que si Y es completo entonces X lo es.
  3. Sea V un espacio con norma asociada V con dimensión finita n y {v1,,vn}, una base ordenada de V. Sea {e1,,en} la base canónica de Rn, y L:RnV tal que para cada i=1,,n,L(ei)=vi. Demuestra que L es una transformación lineal y que es también una función biyectiva.
  4. Prueba que la función inversa de la función del ejercicio anterior es Lipschitz continua.
  5. Sea (xn)nN una sucesión creciente y acotada en R. Concluye que (xn) es convergente en R demostrando que es de Cauchy.

Enlaces