Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Geometría Moderna II: Relaciones Armónicas

Por Armando Arzola Pérez

Introducción

Uno de los aspectos importantes de esta unidad es la teoría de la división armónica, la cual se relaciona con la teoría de los polos y polares, para ello veremos unos teoremas respecto a las relaciones armónicas ejemplificando esto.

Relaciones Armónicas

Teorema. Sean dos puntos conjugados $A$ y $B$ respecto a una circunferencia $C(O,r)$, donde $A$ está dentro y $B$ está fuera, entonces $A$ y $B$ son armónicos respecto a los puntos de intersección en donde la recta que une a $A$ y $B$ se determina con la circunferencia $C$.

Demostración. Dada una circunferencia $C(O,r)$ y dos puntos $A$ dentro de $C$ y $B$ fuera de $C$. La recta $AB$ corta a $C$ en dos puntos $P$ y $Q$, sea $a$ la polar de $A$ y $b$ la polar de $B$, por lo cual $b$ pasa por $A$ y $a$ pasa por $B$.

Ahora se tienen los inversos de $A$ y $B$ que son $A’$ y $B’$ correspondientemente, se tiene que $a$ es perpendicular a $OA’$ por $A’$ y $b$ es perpendicular a $OB’$ por $B’$, de esta forma el cuadrilátero $B’BA’A$ es cíclico y su circunferencia es perpendicular a $C(O,r)$, y se sigue que $AB$ es diámetro de $C(O,r)$. Por lo tanto, $A$ y $B$ son armónicos respecto a $P$ y $Q$.

Relaciones Armónicas Teo1

$\square$

Teorema. Sea $C(O,r)$ una circunferencia dada, dos líneas conjugadas se intersecan fuera de $C$, están separadas armónicamente por las tangentes de sus puntos de intersección.

Demostración. Sean $p$ y $q$ las dos rectas conjugadas, tal que $p$ corta a $C(O,r)$ y $q$ no corta a $C(O,r)$. El punto de intersección de $p$ y $q$ es $S$ fuera de $C(O,r)$.

Sea $P$ el punto de $p$ donde $P$ pertenece a $q$, la polar de $S$ es $s$ que pasa por $C$ donde $C$ es la intersección de $p$ y $s$, entonces la polar de $C$ pasa por $S$. También la polar de $P$ es $p$ que pasa por $C$ entonces la polar de $C$ pasa por $P$, entonces su polar es $q$ y también la polar de $C$ pasa por $D$, por lo cual la polar de $D$ pasa por $C$.

Por lo cual $C$ y $D$ son conjugados respecto a $C(O,r)$, entonces $C$ y $D$ son conjugados respecto a $A$ y $B$. Por lo tanto, $p$ y $q$ son armónicos respecto a $SA$ y $SB$.

Relaciones Armónicas Teo2

$\square$

Teorema. Sea $C(O,r)$ una circunferencia, $p$ una recta y sean $A,B,C,D$ cuatro puntos armónicos sobre la recta, $p$, si $a,b,c,d$ son las polares respecto a $C(O,r)$ de $A,B,C,D$ entonces $a,b,c,d$ son líneas armónicas, entonces el haz $P{a,b,c,d}$ es armónico.

Demostración. Se tienen $A,B,C,D$ puntos armónicos dados, con sus respectivas polares $a,b,c,d$ las cuales pasan por un punto $S$, el cual es el polo de la recta en la cual están los puntos. Ahora cada polar es perpendicular a la recta que une su polo con el centro de la circunferencia $C(O,r)$, y además el ángulo entre dos líneas cualesquiera del haz $O(ABCD)$ es igual al ángulo entre las rectas correspondientes del haz $a,b,c,d$. Por lo cual el haz $P{a,b,c,d}$ es armónico.

Relaciones Armónicas Teo3

$\square$

Más adelante…

Se abordará el tema de dualidad desde un punto de vista teórico, y también se analizará los triángulos autopolares.

Entradas relacionadas

Límite de una función

Por Lizbeth Fernández Villegas

Introducción

Es momento de interactuar entre dos espacios métricos, $(X,d_X)$ y $(Y,d_Y)$, cada uno con su respectivo conjunto de puntos y métrica definida en ellos. Podemos relacionar puntos del espacio métrico $X$ con puntos en el espacio métrico $Y.$ Será natural preguntarse qué ocurre con las distancias en el nuevo espacio métrico, en comparación con el de origen. Considera la siguiente:

Definición. Imagen de un conjunto. Sean $(X,d_X)$ y $(Y,d_Y)$ espacios métricos. Si $A \subset X$ y $f: X \to Y$ es una función, entonces $f \,$ define un conjunto en $Y$ dado por $f(A):=\{f(x)|x\in A\}$, que llamaremos la imagen de $A$ bajo $f \,$ y es la colección de elementos que se le asignan a cada elemento de $A.$

Representación del conjunto $f(A),$ el conjunto al que $A$ es enviado bajo $f.$

Ahora preguntamos: ¿bajo qué circunstancias una función envía puntos de $A \subset X$ a puntos en $Y$ que se aproximan a algún punto $L \in Y$?

Si $x_0$ es un punto de acumulación en $A$, por definición, todas sus bolas abiertas tienen elementos en $A$ distintos de $x_0.$ Podemos así, identificar puntos cercanos a $x_0$, según la distancia $d_X$, que bajo la función $f$ sean enviados a puntos en $Y$ que estén cerca de un punto $L$, según la distancia $d_Y.$
Como los puntos cerca de $L$ en $(Y,d_Y)$ son los que están en la bola de radio $\varepsilon$ con centro en $L,$ se busca conseguir que los puntos cerca de $x_0$ caigan justamente en $B_Y(L,\varepsilon).$ (El subíndice $Y$ en $B_Y$ nos recuerda en qué espacio métrico es considerada la bola abierta. Recuerda que pueden ser diferentes, según la métrica a la que se refiera).

Un elemento de la bola abierta con centro en $x_0$ «cae dentro» de la bola abierta con centro en $L.$

De manera formal tenemos la siguiente:

Definición. Límite de una función. Sea $f: X \to Y$ una función entre espacios métricos y $x_0$ un punto de acumulación de $A.$ Decimos que el límite de $f$, cuando $x$ tiende al punto $x_0$ es $L \in Y$, si ocurre que para todo $\varepsilon >0$ existe $\delta > 0$ tal que para todo $x\neq x_0, \text{ si } d_X(x,x_0)< \delta$ entonces $\, d_Y(f(x),L)<\varepsilon.$ Se denota como:
$$\underset{x \to x_0}{lim} \,f(x) \,:=L$$
Se dice entonces que $f(x) \to L$ cuando $x \to x_0.$

Esta definición se puede expresar en términos de bolas abiertas como sigue: $\, \underset{x \to x_0}{lim} \,f(x) \,=L \,$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que $f(B_X(x_0,\delta) \setminus \{x_0\}) \subset B_Y(L,\varepsilon).$

Veamos un resultado que nos permite concluir límites a partir de sucesiones.

Proposición. Considera $A \subset X$ y $x_0 \in A$ un punto de acumulación en $A.$ Entonces $$\underset{x \to x_0}{lim} \, f(x) \,=L$$ si y solo si para toda sucesión $(x_n)_{n \in \mathbb{N}}$ en $A \setminus \{x_0\}$ tal que $x_n \to x_0$ ocurre que $$\underset{n \to \infty}{lim} \, f(x_n) \,=L.$$
Demostración:
Sea $(x_n)_{n \in \mathbb{N}} \,$ una sucesión en $A \setminus \{x_0\}$ que converge a $x_0 \,$ y sea $\varepsilon >0.$ Como $\underset{x \to x_0}{lim} \, f(x) \,=L$ entonces existe $\delta>0$ tal que para todo $x\neq x_0, \text{ si } d_X(x,x_0)< \delta \,$ entonces $\, d_Y(f(x),L)<\varepsilon.$

Si $(x_n) \to x_0 \,$ en $X \,$ entonces $(f(x_n)) \to L \,$ en $Y.$

Como $(x_n) \to x_0$, entonces existe $N \in \mathbb{N}$ tal que para todo $ \, n\geq N, \, d_X(x_n,x_0)< \delta$, así para todo $ \, n \geq N, \, d_Y(f(x_n),L) < \varepsilon$ por lo tanto $f(x_n) \to L\, $ en $\, Y.$

Ahora supón que el recíproco no es cierto. Entonces existe $\varepsilon_0 >0$ tal que para todo $ \, \delta>0$ existe $x_0 \neq x_0 \,$ con $\, d_X(x_0,x_0)<\delta$ pero $\, d_Y(f(x_0),L)> \varepsilon_0.$

De modo que para cada bola abierta con centro en $x_0$ y radio $\frac{1}{n}$ con $n \in \mathbb{N}$ podemos elegir un punto $x_n \in (B_X(x_0,\frac{1}{n}) \setminus \{x_0\})$ pero $\, d_Y(f(x_n),L)> \varepsilon_0.$

Hay un punto en $B_X(x_0,1)$ que $f$ envía fuera de $B_Y(L,\varepsilon_0).$

La sucesión $x_n \to x_0 \,$ pero la sucesión $(f(x_n))_{n \in \mathbb{N}} \,$ al quedarse siempre fuera de la bola abierta $B_Y(L,\varepsilon_0)$ no converge a $L$, lo cual es una contradicción.

Hay un punto en $B_X(x_0,1/2)$ que $f$ envía fuera de $B_Y(L,\varepsilon_0).$

Por lo tanto $\, \underset{x \to x_0}{lim} \, f(x) \,=L.$

Hay un punto en $B_X(x_0,1/n)$ que $f$ envía fuera de $B_Y(L,\varepsilon_0).$

Las siguientes proposiciones son propiedades de límites de funciones en los espacios métricos mencionados:

Proposición. Sea $z \in \mathbb{C}$ con $z = a+bi$ donde $a,b \in \mathbb{R}.$ La métrica usual en los complejos es la inducida por la norma:
$$\norm{z}:= \sqrt{a^2+b^2}.$$
Sean $f:A \to \mathbb{C}$ y $g:A \to \mathbb{C}.$ Si se definen
Si se definen la suma de funciones como
$$(f+g)(x):=f(x)+g(x)$$
y el producto de funciones como
$$(f g)(x):=f(x)g(x)$$
entonces, si $x_0 \,$ es un punto de acumulación en $A$ y $\underset{x \to x_0}{lim}\, f(x) \,=L_1 \,$ y $\, \underset{x \to x_0}{lim}\, g(x) \,=L_2$, se tiene que:

a) $\underset{x \to x_0}{lim} \, f(x) \pm g(x) \,=L_1 \pm L_2.$
b) $\underset{x \to x_0}{lim} \, f(x)g(x) \,=L_1 L_2.$
c) $\underset{x \to x_0}{lim} \, f(x) / g(x) \,=L_1 / L_2$ cuando $L_2 \neq 0.$

La demostración se deja como ejercicio.

Proposición. Sean $f,g: A \subset X \to \mathbb{R}^n\, $ Si se definen la suma de funciones como
$$(f+g)(x):=f(x)+g(x)$$
y el producto punto (o producto escalar) como
$$(f \cdot g)(x):=f(x) \cdot g(x)$$
entonces, si $x_0 \,$ es un punto de acumulación en $A$ y $\underset{x \to x_0}{lim}\, f(x) \,=L_1 \,$ y $\, \underset{x \to x_0}{lim} \,g(x) \,=L_2$, se tiene que:

a) $\underset{x \to x_0}{lim} \, f(x) \pm g(x) \,=L_1 \pm L_2.$
b) $\underset{x \to x_0}{lim} \, f(x) \cdot g(x) \,=L_1 \cdot L_2.$
c) $\underset{x \to x_0}{lim} \, \lambda f(x) \,= \lambda L_1 \,$con $\,\lambda \in \mathbb{R}.$

La demostración se deja como ejercicio.

Más adelante…

Nota que no hemos evaluado la función en $x_0,$ la definición no necesita siquiera que la función esté definida ahí. La próxima vez veremos el caso en que la función sí está definida en $x_0 \in A \subset X$ y más aún, tiene como límite al punto $f(x_0).$ Hablaremos así de funciones continuas en un punto $x_0$ y observaremos el efecto que estas funciones producen en subconjuntos abiertos y cerrados de un espacio métrico.

Tarea moral

  1. Demuestra las dos proposiciones anteriores.

Bibliografía

  • Apostol, T., Análisis Matemático (2a ed.). México: Editorial Reverté, 1996. Págs: 90-94.
  • Rudin, W., Principles of Mathematical Analysis (3rd ed.). New York: McGraw–Hill, 1953. Págs: 83-85.

Enlaces

La métrica de Hausdorff

Por Lizbeth Fernández Villegas

Introducción

En esta entrada vamos a ver una forma de definir distancias (sí, de nuevo) pero ahora no directamente entre los elementos de un conjunto, sino entre los subconjuntos de un espacio métrico. Entonces, los subconjuntos pasarán a ser vistos como elementos de un nuevo espacio con cierta métrica. Al final haremos sucesiones de conjuntos. Descubriremos bajo qué condiciones estas sucesiones de conjuntos convergen. Será emocionante descubrir que dos conjuntos están cerca uno de otro, cuando son muy parecidos entre sí (en forma y tamaño).

El contenido a exponer se basa predominantemente en el libro «A course in Metric Geometry», escrito por Dmitri Burago, Yuri Burago y Sergei Ivanov (páginas 252 y 253). Omitiremos las demostraciones de las proposiciones, pues no son parte de los objetivos del curso. El lector puede consultarlas en el libro mencionado si así lo desea.

Sea $(X,d)$ un espacio métrico. Visualiza un conjunto $A \subset X$ y un punto arbitrario $x \in A.$

$x$ está en $A.$

Sea $\varepsilon >0.$ Este valor define a $B(x,\varepsilon).$

$x$ está en la bola de radio $\varepsilon.$

Visualiza la unión de todas las bolas de radio $\varepsilon.$ Definimos el conjunto $U_\varepsilon(A) := \underset{x\in A}{\cup}B(x,\varepsilon).$ Nota que este conjunto contiene al conjunto $A.$

Todas las bolas de radio $\varepsilon$ con centro en un punto de $A.$
El conjunto $U_\varepsilon(A)$ es la unión de todas las bolas.

Asímismo, todos los elementos de $U_\varepsilon(A)$ distan en menos que $\varepsilon$ a algún elemento de $A$, pues están en una de las bolas de radio $\varepsilon.$

Un punto $y$ en $U_\varepsilon(A)$ tiene distancia menor que $\varepsilon$ a un punto en $A.$

Pensemos ahora en los conjuntos definidos de esta forma en $A$ pero buscando que también contengan a un conjunto $B \subset X$

Se puede dar el caso en que aunque $U_\varepsilon(A)$ contiene a $A,$ no contiene al conjunto $B.$

$U_\varepsilon(A)$ no cubre a $B$ completamente.

Identificando valores para $\varepsilon >0$ suficientemente grandes, se logra la contención deseada:

$U_{\varepsilon’}(A)$ también contiene a $B.$

Podemos identificar al ínfimo de los $\varepsilon$´s $>0$ y encontrar así un conjunto $U_{\varepsilon´´}(A)$ más ajustado pero que sigue conteniendo a ambos conjuntos.

$U_{\varepsilon´´}(A)$ es el conjunto más pequeño que cubre lo deseado.

Análogamente, vamos a identificar los conjuntos $U_\varepsilon(B)$ que también contienen a $A.$

Se puede dar el caso en que aunque $U_\varepsilon(B)$ contiene a $B,$ no contiene al conjunto $A.$

$U_\varepsilon(B)$ no cubre a $A$ completamente.

Identificando valores para $\varepsilon >0$ suficientemente grandes, se logra la contención deseada:

$U_{\varepsilon’}(B)$ también contiene a $A.$

Podemos identificar al ínfimo de los $\varepsilon$´s $>0$ y encontrar así un conjunto $U_{\varepsilon´´}(B)$ más ajustado pero que sigue conteniendo a ambos conjuntos.

$U_{\varepsilon´´}(B)$ es el conjunto más pequeño que cubre lo deseado.

Si seleccionamos al ínfimo de los $\varepsilon$’s tales que ambos conjuntos quedan contenidos de la forma $A \subset U_\varepsilon(B)$ y $B \subset U_\varepsilon(A).$ Podemos definir la distancia de Hausdorff entre $A$ y $B$ como ese ínfimo. Formalmente:
$$d_H(A,B) := inf \{\varepsilon>0 \, | \, A \subset U_\varepsilon(B) \, \text{ y }\, B \subset U_\varepsilon(A) \}$$

$A \subset U_\varepsilon(B) \,$ y $\, B \subset U_\varepsilon(A).$

Sean $A\subset X, \,$ $B\subset X$ y $\varepsilon >0.$ Si definimos $\text{dist}(a,B) := \underset{b \in B}{inf} \, d(a,b)$ para cada $a \in A$ y análogamente $\text{dist}(b,A) := \underset{a \in A}{inf} \, d(a,b)$ para $b \in B$ entonces las siguientes son propiedades de la distancia de Hausdorff.

a) $d_H(A,B) = max\{\underset{a \in A}{sup} \, \text{dist}(a,B),\underset{b \in B}{sup} \, \text{dist}(b,A)\}.$

$d_H(A,B) = max\{\underset{a \in A}{sup} \, \text{dist}(a,B),\underset{b \in B}{sup} \, \text{dist}(b,A)\}.$

Las líneas señalan las distancias «más grandes» que hay de algún punto de $A$ al conjunto $B$ y de un punto de $B$ al conjunto $A.$ Se garantiza que el máximo define el radio de las bolas que hace que los dos conjuntos $U_{\varepsilon}(A)$ y $U_{\varepsilon}(B)$ contengan tanto a $A$ como a $B.$


b) $d_H(A,B) \leq \varepsilon$ si y solo si para todo $a \in A,$ $\text{dist}(a,B) \leq \varepsilon$ y para todo $b \in B, \, \text{dist}(b,A) \leq \varepsilon.$ Esto puede no ocurrir si cambiamos «$\leq$» por «$<$».

Anteriormente hemos hablado de la definición de una función acotada (Espacios de funciones) y de una sucesión acotada (Convergencia), veamos esta definición de un modo más general:

Definición. Conjunto acotado. Sea $A \subset X$ decimos que $A$ es un conjunto acotado en $X$ si existe un punto $x_0 \in X$ y $M >0$ tal que para toda $x \in A$ se cumple que $d(x,x_0)<M.$ Nota que esto es equivalente a decir que $A \subset B(x_0,M).$

$A$ es acotado si está contenido en $B(x_0,M).$

$A$ es acotado si está contenido en $B(x_0,M).$


Proposición. Si $(X,d)$ es un espacio métrico, entonces $d_H$ define una métrica en el conjunto de conjuntos cerrados y acotados $\mathcal{M}(X):=\{F \subset X: F \text{ es cerrado y acotado}\}.$ (En el libro de Burago la métrica puede tomar el valor infinito, en ese sentido $d_H \,$ también sería una métrica en el conjunto de los subconjuntos cerrados de $X$, incluyendo los no acotados).

Eso significa que $A,B \in \mathcal{M}(X)$ cumplen:

1) $d_H(A,B)=0$ si y solo si los conjuntos son iguales. En este caso tendremos que para todo $\varepsilon>0$ $A \subset U_\varepsilon(B)$ y $B \subset U_\varepsilon(A).$ Además $U_\varepsilon(B)=U_\varepsilon(A).$

$d_H = 0$ entre conjuntos iguales.

2) La propiedad de simetría en espacios métricos dice que $d_H(A,B) = d_H(B,A)$

La distancia $d_H$ es simétrica.

3) Se cumple la desigualdad del triángulo entre conjuntos: $$d_H(A,B) \leq d_H(A,C) + d_H(C,B).$$
Para fines ilustrativos de esta propiedad recordemos que:
$d_H(A,B) = max\{\underset{a \in A}{sup} \, \text{dist}(a,B),\underset{b \in B}{sup} \, \text{dist}(b,A)\}.$
$d_H(A,C) = max\{\underset{a \in A}{sup} \, \text{dist}(a,C),\underset{c \in C}{sup} \, \text{dist}(c,A)\}.$
$d_H(B,C) = max\{\underset{b \in B}{sup} \, \text{dist}(b,C),\underset{c \in C}{sup} \, \text{dist}(c,B)\}.$
La imagen siguiente representa esas distancias.

Desigualdad del triángulo a partir de máximos.

A continuación, visualizaremos ejemplos de sucesiones en el espacio métrico de Hausdorff. Entonces los elementos de las sucesiones serán conjuntos cerrados y acotados.
Si $(A_n)_{n \in \mathbb{N}} \,$ es una sucesión de conjuntos de un espacio métrico y $A_n \to A$ en la métrica de Hausdorff, entonces $d_H(A_n,A) \to 0$ en $\mathbb{R}.$ Eso significa que los conjuntos indicados por la sucesión no solo se van a acercar (en posición, si podemos pensarlo así) al conjunto $A$, sino que se van a ver como éste (pues cuando $d_H =0$ los conjuntos son iguales).

La sucesión presentada muestra estrellas de la misma forma y tamaño pero distinta posición en $\mathbb{R}^2$ cada vez más grandes pero proporcionales entre sí. Para cada $n \in \mathbb{N}$ la estrella $A_n$ tiene su centro en el punto $(\frac{1}{n},0).$ Entonces la sucesión $(A_n)_{n \in \mathbb{N}}\,$ converge a la estrella con centro en $(0,0).$

Representación de sucesión de conjuntos (estrellas) que convergen al conjunto $A.$

La sucesión de huellas de perrito muestra manchas cada vez más pequeñas que convergen a las manchas verdes.

Representación de sucesión de conjuntos (huellas de perrito) que convergen al conjunto $A.$

Tenemos una sucesión de «conos» $(A_n)_{n \in \mathbb{N}}\,$ definida como sigue: para cada $n \in \mathbb{N}$ el cono $A_n$ tiene su centro en $(0,\frac{-3}{n},0)$, altura $\frac{2}{n}$ y radio $1.$ Entonces los conos ven disminuída su altura hasta llegar a $0$ mientras que el centro se desplaza al origen. Finalmente convergen al círculo unitario en el plano horizontal.

Representación de sucesión de conjuntos («conos») que convergen al conjunto $A.$

Formalmente, tenemos los siguientes:

Ejemplos de sucesiones de conjuntos en espacios euclidianos que convergen a un conjunto $A$ en el espacio de Hausdorff.

Para cada $n \in \mathbb{N}$ considera en el espacio euclidiano $\mathbb{R}^2$ el conjunto $A_n := \overline{B}(0,1+\frac{1}{n}).$ Entonces $(A_n)_{n \in \mathbb{N}}\,$ es una sucesión en el espacio de Hausdorff que converge al conjunto $A:=\overline{B}(0,1).$

Representación de sucesión de conjuntos (círculos) que convergen al conjunto $A.$
Representación del término $A_k$ y el límite de la sucesión, $A.$

Basta con demostrar que $d_{H}(A_n,A) = max\{\underset{a \in A_n}{sup} \, \text{dist}(a,A),\underset{b \in A}{sup} \, \text{dist}(b,A_n)\} \to 0$ en $\mathbb{R}.$ Es sencillo probar que para cada $n \in \mathbb{N}, \,d_{H}(A_n,A) = \frac{1}{n} \to 0 \in \mathbb{R}$ por lo tanto $A_n \to A.$

Presentamos una sucesión de prismas ubicadas en el espacio euclidiano $\mathbb{R}^3$ como muestra la imagen.

Los prismas convergen a la cara del fondo.
Prisma $A_k.$
Representación del término $A_k$ y el límite de la sucesión, $A.$

Sea $A$ el triángulo que es una cara del prisma y está en el plano $X_2, X_3.$ Nota que para cada $k \in \mathbb{N}$, $d_{H}(A_k,A) = max\{\underset{a \in A_k}{sup} \, \text{dist}(a,A),\underset{b \in B}{sup} \, \text{dist}(b,A_k)\}= \frac{1}{k}$

Entonces $d_{H}(A_n,A) = \frac{1}{n} \to 0 \in \mathbb{R}$ por lo tanto $A_n \to A.$


La demostración de las siguientes dos sucesiones se dejará como ejercicio.

Tenemos una sucesión de polígonos regulares en $\mathbb{R}^2,$ $(A_n)_{n \in \mathbb{N}}, \,$ donde para cada natural $n$, $ A_n$ es el polígono regular de $\, n \,$ lados con centro en $(0,0)$ y circunscrito en el círculo con centro en $(0,0)$ y radio $1.$ Demuestra que $A_n \to \overline{B}(0,1)$ en el espacio de Hausdorff.

Los polígonos convergen al círculo unitario.
Representación de la sucesión $(A_n)$ y el límite, $A.$

Como sugerencia, puedes demostrar que la medida del apotema vista como $\, cos \alpha \,$ tiende a $1$ en $\mathbb{R}.$

Apotema = $\, cos \alpha.$


La siguiente sucesión muestra cilindros en $\mathbb{R}^3.$

Los cilindros convergen al segmento del centro.
Representación del término $A_k.$

Para cada $n \in \mathbb{N}$ considera $A_n$ como el cilindro que tiene de base al círculo con centro en el origen, radio $\frac{1}{n}$ y altura $2.$ Demuestra que la sucesión $(A_n)_{n \in \mathbb{N}}\,$ converge al segmento $\{(0,0,x_3): x_3 \in [0,2]\}.$

Ahora presentaremos algunas condiciones que garantizan la convergencia en sucesiones de conjuntos. En la última se menciona la noción de compacidad, concepto del que se hablará más adelante, a partir de la entrada Compacidad en espacios métricos. Por el momento podemos imaginar el resultado en espacios euclidianos, donde los compactos son los conjuntos cerrados y acotados.

Proposición. Sea $(A_n)_{n \in \mathbb{N}} \,$ una sucesión en $\mathcal{M}(X)$ tal que $A_n \to A$ en $\mathcal{M}(X).$ Entonces:

a) $A$ es el conjunto de límites de todas las sucesiones convergentes $(x_n)_{n \in \mathbb{N}}$ en $X$ tales que para toda $n \in \mathbb{N}, \, a_n \in A_n.$

Una sucesión convergente $(a_n)$ en $X$ con $a_k \in A_k$ tiene su punto de convergencia en $A.$


b) El conjunto al que converge la sucesión está dado por: $A = \underset{n \in \mathbb{N}}{\cap} (\overline{\underset{m \geq n}{\cup} A_m}).$

Esto significa que en cada iteración, vamos a considerar la cerradura de la unión de todos los conjuntos, exceptuando los de las primeras posiciones (según la iteración en la que vayamos). Esto define nuevos conjuntos, cuya intersección es el conjunto al que la sucesión converge.

Representación de una sucesión en $\mathcal{M}(\mathbb{R}^2).$

La intersección de todos los conjuntos de este estilo es el conjunto al que la sucesión converge:

Proposición. Sea $(X,d)$ un espacio métrico compacto y $(A_n)_{n \in \mathbb{N}} \,$ una sucesión de subespacios compactos en él, entonces:
a) Si $A_{n+1} \subset A_n$, entonces $A_n \to \underset{n \in \mathbb{N}}{\cap}A_n$ en $\mathcal{M}(X).$

Entonces cuando una sucesión es tal que cada término está contenido en el anterior, la sucesión converge a la intersección de todos los conjuntos. Al final de la entrada Compacidad en espacios métricos veremos por qué podemos asegurar que esa intersección no es vacía.

Sucesión de cilindros donde «el siguiente» está contenido en «el anterior».


b) Si para todo $n \in \mathbb{N}, \, A_n \subset A_{n+1}$, entonces $A_n \to \overline{\underset{n \in \mathbb{N}}{\cup}A_n}$ en $\mathcal{M}(X).$

Entonces cuando una sucesión es tal que cada término contiene al anterior, la sucesión converge a la cerradura de la unión de todos los conjuntos.

Sucesión donde cada término está contenido en el siguiente.

En el dibujo la sucesión $(A_n)_n \in \mathbb{N}$ tiene como conjunto $A_n = \overline{B}(0,2-\frac{1}{n})$ para cada $n \in \mathbb{N}.$ Es sencillo demostrar que $A_n \to \overline{B}(0,2)$ en $\mathbb{R}^2.$

El límite contiene todos los términos de la sucesión.

Más adelante…

Ya que hemos estudiado algunas propiedades en un espacio métrico, comenzaremos a relacionar un espacio con otros a través de funciones. Veremos bajo qué circunstancias es posible hablar de “cercanía” en puntos del contradominio cuando se parte de puntos cercanos en el espacio métrico del dominio.

Tarea moral

  1. Describe las características de las sucesión definida como:
    $A_1=[0,1]$
    $A_2=[0,1] \setminus (\frac{1}{3},\frac{2}{3})=[0,\frac{1}{3}] \cup [\frac{2}{3},1],$
    $A_3=[0,\frac{1}{3}] \setminus (\frac{1}{9},\frac{2}{9}) \cup [\frac{2}{3},1]\setminus (\frac{7}{9},\frac{8}{9})=[0,\frac{1}{9}] \cup [\frac{2}{9},\frac{1}{3}] \cup [\frac{2}{3},\frac{7}{9}] \cup[\frac{8}{9},1]$
    Y así, recursivamente, se va quitando la tercera parte central, de cada intervalo que quedaba. La intersección de estos conjuntos es conocido como el conjunto de Cantor. ¿Bajo qué resultados mencionados en esta entrada podemos concluir la convergencia de la sucesión?
  2. El copo de nieve de Koch es la curva a la que converge una sucesión definida como sigue:
    $A_1$ es un triángulo equilátero.
    $A_2$ sustituye la tercera parte central de cada lado por dos aristas de la misma medida.
    $A_3$ Hace lo mismo. Se repite el proceso recursivamente
    ¿Qué puedes decir del área encerrada por las curvas a medida que la sucesión aumenta? ¿Hay condiciones suficientes para concluir la convergencia de estos conjuntos?
  3. Demuestra la convergencia en el espacio de Hausdorff de la sucesión de polígonos circunscritos descrita anteriormente.
  4. Demuestra la convergencia en el espacio de Hausdorff de la sucesión de cilindros expresada anteriormente.

Bibliografía

  • Burago, D., Burago, Y., Ivanov, S., A course in Metric Geometry. Graduate Studies in Mathematics, 33. Providence, Rhode Island: American Mathematical Society, 2001. Págs: 252 y 253.

Enlaces

Convergencia

Por Lizbeth Fernández Villegas

Introducción

Ante el modelado de situaciones, resulta útil identificar qué tan lejos está un objeto de convertirse en otro. Si se identifica una secuencia o patrón entre una situación y la siguiente, posiblemente se pueda comprobar que, tras varios cambios, nos aproximaremos a algún resultado específico. El Análisis Matemático ofrece herramientas que formalizan este estudio. En la sección que a continuación presentamos trabajaremos más con la noción de cercanía a través de distancias que van tendiendo a cero. Esta vez lo haremos con una sucesión que toma elementos del espacio métrico. Se verá bajo qué condiciones estos puntos se acercan cada vez más a cierto punto en el espacio métrico. Comencemos con la siguiente:

Definición. Sucesión. Sea $(X,d)$ un espacio métrico. Decimos que una función $(x_n): \mathbb{N} \to X$ es una sucesión en $X$.

Podemos pensar entonces que una sucesión elige, para cada número natural $n$, un elemento $x_n$ del conjunto $X$ (que es como vamos a denotar el valor de la sucesión en el término $n).$ La sucesión es comúnmente denotada como $(x_n)_{n \in \mathbb{N}} \,$ o simplemente como $(x_n).$

Representación de una sucesión en $(X,d).$

¿Bajo qué condiciones podemos decir que la sucesión se aproxima cada vez más a cierto punto $x$ en $(X,d)$? Para que esto ocurra se espera que, siempre que se fije una distancia $\varepsilon >0$ como referencia, se pueda asegurar que los últimos elementos de la sucesión, tengan una distancia al punto $x$ menor que $\varepsilon$, es decir, que exista un número natural $N \,$ de modo que todos los puntos asignados por la sucesión a partir de la posición $N$, estén “dentro” de la bola de radio $\varepsilon$ con centro en $x$, el punto de convergencia. De manera formal, tenemos la:

Definición. Sucesión convergente. Vamos a decir que una sucesión $(x_n)_{n \in \mathbb{N}} \,$ es convergente en $(X,d)$ si existe $x \in X$ tal que para todo $\varepsilon >0$ existe $N \in \mathbb{N}$ tal que para todo $n \geq N$ ocurre que $d(x_n,x)<\varepsilon$.

Los últimos puntos de la sucesión están dentro de la bola de radio $\varepsilon$ con centro en $x$.

Si es así, diremos que $(x_n)_{n \in \mathbb{N}} \,$ converge a $x$ y se indicará en la notación como:
$$x_n \to x$$
o como:
$$\underset{n \to \infty}{lim} \, x_n =x$$
Nota: $x_n \to x \text{ en } X \iff d(x_n,x) \to 0 \text{ en } \mathbb{R}$.
Si la sucesión no es convergente decimos que es divergente.

Ahora veamos que una sucesión no puede converger a dos puntos diferentes:

Proposición. Si $(x_n)_{n \in \mathbb{N}} \,$ es una sucesión convergente en $X$ entonces el límite $\underset{n \to \infty}{lim} \, x_n \,$ es único.
Demostración:
Supongamos que $x_n \to x_a \,$ y $\, x_n \to x_b \,$ en $X$. Sea $\varepsilon>0$. Siguiendo la definición de convergencia se tiene que para todo $\frac{\varepsilon}{2} >0$ existen números naturales $N_a\, $ y $\, N_b\, $ tales que para todo $n\geq N_a, \, d(x_n,x_a)< \frac{\varepsilon}{2}$ y para todo $n\geq N_b, \, d(x_n,x_b)< \frac{\varepsilon}{2}$. Si elegimos $N = max\{N_a,N_b\}$ las dos condiciones anteriores se satisfacen. Entonces, para toda $n\geq N$,
$0 \leq d(x_a,x_b) \leq d(x_a,x_n)+d(x_n,x_b) < \frac{\varepsilon}{2}+\frac{\varepsilon}{2}= \varepsilon$
Nota entonces que para todo $ \, \varepsilon >0,$ la distancia entre $x_a$ y $x_b$ queda acotada por $0 \leq d(x_a,x_b) < \varepsilon.$
En conclusión, $d(x_a,x_b)=0$, por lo tanto los puntos de convergencia son iguales.

Es importante mencionar que la convergencia de una sucesión depende tanto de la métrica como del conjunto a considerar. Una sucesión puede ser convergente en un espacio métrico pero no serlo en otro. Por ejemplo, la sucesión que a cada natural $n$ le asigna el número $\frac{1}{n}$ cumple que $(\frac{1}{n}) \to 0$ en $\mathbb{R}$ con la métrica euclidiana, pero en el subespacio euclidiano $(0,1]$ no es convergente, pues $0$ no está en el subespacio.

Definición. Subsucesión de $(x_n)_{n \in \mathbb{N}}.$ Una subsucesión $(x_{k(n)})_{n \in \mathbb{N}} \,$ es una composición de la sucesión $(x_n)_{n \in \mathbb{N}}$ con una función estrictamente creciente, $k:\mathbb{N} \to \mathbb{N}$.
Esto significa que una subsucesión tomará elementos en $X$ de la sucesión, en el mismo orden en que aparecen, aunque es posible que vaya descartando algunos.

Los puntos en verde señalan un ejemplo de subsucesión.

Hay una relación entre el límite de una sucesión y los de sus subsucesiones:

Proposición. Una sucesión $(x_n)_{n \in \mathbb{N}}$ converge a $x$ en $X$ si y solo si toda subsucesión $(x_{k(n)})_{n \in \mathbb{N}}$ converge a $x$ en $X$.

Tanto los últimos puntos de la sucesión como los de la subsucesión se aproximan al punto de convergencia.

Demostración:
Sea $(x_{k(n)})_{n \in \mathbb{N}} \,$ una subsucesión de $(x_n)_{n \in \mathbb{N}}$. Como $(x_n)_{n \in \mathbb{N}} \,$ converge entonces existe $N \in \mathbb{N}$ tal que para todo $n \geq N, \, d(x_n,x) < \varepsilon$. Ya que $k: \mathbb{N} \to \mathbb{N}$ es estrictamente creciente, tenemos que para todo $j \geq N, \, k(j) \geq k(N) \geq N$. Así, $d(x_{k(j)},x)< \varepsilon$, lo cual demuestra que $(x_{k(n)}) \to x$. El regreso es trivial, pues es posible definir una subsucesión como la sucesión misma.

Definición. Sucesión acotada. Diremos que una sucesión $(x_n)_{n \in \mathbb{N}} \,$ en $X$ es acotada si existe $M \in \mathbb{R}$ y $x \in X$ tales que para todo $ \, n \in \mathbb{N}$ ocurre que $d(x,x_n) \leq M$.
Esto significa que una sucesión es acotada si todos los puntos $x_n,$ con $n \in \mathbb{N}$ están en una bola abierta con centro en algún punto $x$ del espacio métrico.

Representación de una sucesión acotada.

¿Es posible concluir que una sucesión es convergente si sabemos que se trata de una sucesión acotada? Al final se te propondrá dar un ejemplo de una sucesión acotada que no sea convergente.
En contraparte, tenemos la siguiente:

Proposición. Toda sucesión convergente es acotada.

Demostración:
Sea $(x_n)_{n \in \mathbb{N}} \,$ una sucesión que converge a $x$ en $X$. Buscamos «encerrar» todos los puntos de la sucesión en una bola abierta. Si suponemos $\varepsilon = 1$, existe $N \in \mathbb{N}$ tal que para todo $n \geq N, \, d(x_n,x)<1$. Hasta aquí ya logramos «encerrar» todos los puntos de la sucesión a partir de $x_N$.

A partir de $x_N$, los puntos de la sucesión están en una bola abierta.

Para encerrar los elementos que van antes en la sucesión, considera las distancias entre $x$ y cada uno de esos puntos como $d_i := d(x_i,x), \, i=1,…,N-1$.

Representación de las distancias entre $x$ y los puntos $x_1, x_2,…,x_{N-1}.$

Si hacemos $M = max\{d_1,…,d_{N-1},1\}, \,$ se consigue que para todo $n \in \mathbb{N}, \, d(x_n,x)<M$ con lo cual se demuestra que la sucesión es acotada.

Todos los puntos de la sucesión están en una bola abierta.

Los últimos resultados que expondremos en esta entrada son muy importantes, en el sentido en que suele acudirse a ellos para otras demostraciones. Te sugerimos tenerlos presentes.

Proposición. Si $x_n \to x$ en $X$ entonces $x$ es un punto de contacto del conjunto $\{x_n \,|n \in \mathbb{N}\} \,$ (el conjunto de elementos de la sucesión).
Según la definición, basta con demostrar que toda bola abierta de radio $\varepsilon >0$ con centro en $x$ interseca al conjunto $\{x_n\}$. La demostración se deja como ejercicio.

Toda bola abierta con centro en el punto de convergencia tiene elementos de la sucesión.

Proposición. Sea $A \subset X$ y $x \in X$. Entonces $x \in \overline{A}$ si y solo si existe una sucesión $(x_n)_{n \in \mathbb{N}} \,$ en $A$ tal que $x_n \to x$ en $X$.

Demostración:
El regreso se concluye a partir de la proposición anterior.
Si $x \in \overline{A}$ entonces todas las bolas abiertas con centro en $x$ intersecan al conjunto $A$. Así, para cada $n \in \mathbb{N}$, podemos elegir un punto $x_n \in B(x, \frac{1}{n}) \cap A$. Como $d(x,x_n)< \frac{1}{n} \to 0$ en $\mathbb{R}$, se concluye que $x_n \to x$ en $X$.

Todo punto de contacto de un conjunto tiene una sucesión (de elementos del conjunto) que converge a él.

Más adelante…

Tendremos un acercamiento a un espacio métrico cuyos elementos son los subconjuntos cerrados de otro espacio métrico. Al definir la distancia entre estos subconjuntos cerrados veremos que, si una sucesión de ellos converge, entonces lo hace en un subconjunto cerrado. Ya que eso significa que la distancia tiende a cero, y la distancia entre dos elementos es cero cuando son iguales, podemos esperar que los subconjuntos de la sucesión se parecerán cada vez más, al subconjunto al cual convergen.

Tarea moral

  1. Prueba que si $(x_n) \to x$ en $X$ entonces $x$ es un punto de contacto del conjunto $\{x_n \,|n \in \mathbb{N}\}$.
  2. Demuestra que una sucesión constante converge.
  3. ¿Puede una sucesión ser convergente en el espacio discreto? ¿Bajo qué condiciones?
  4. Da un ejemplo de una sucesión en $\mathbb{Q}$ que converge en $\mathbb{R}$ pero no en $\mathbb{Q}$.
  5. Sea $A \subset X$. Demuestra que $x$ es un punto interior de $A$ si y solo si para toda $(x_n)_{n \in \mathbb{N}}$ que converge a $x$ en $X$, existe $N>0$ tal que para todo $ \, n \geq N, x_n \in A$.
  6. Demuestra que $x \in X$ es un punto frontera de $A \subset X$ si y solo si existen sucesiones $(a_n)_{n \in \mathbb{N}}$ en $A$ y $(b_n)_{n \in \mathbb{N}}$ en $X\setminus A$ que convergen a $x$.
  7. Demuestra que si la imagen de una sucesión es finita entonces la sucesión es convergente.
  8. Da un ejemplo de una sucesión acotada que no sea convergente.

Bibliografía

  • Apostol, T., Análisis Matemático (2a ed.). México: Editorial Reverté, 1996. Págs: 85-88.
  • Clapp, M., Análisis Matemático. Ciudad de México: Editorial Papirhos, IM-UNAM, 2013. Págs: 43-45.
  • Kolmogorov, A.N., Fomin, S.V., Elementos de la Teoría de Funciones y del Análisis Funcional. (2a ed.). Moscú: Editorial MIR, 1975. Págs: 62,63.
  • Rudin, W., Principles of Mathematical Analysis (3rd ed.). New York: McGraw–Hill, 1953. Págs: 47-52.

Enlaces

Álgebra Superior I: Sistemas de ecuaciones lineales

Por Eduardo García Caballero

Introducción

Una de las aplicaciones más importantes de los vectores y matrices tiene que ver con un tema que conociste desde la secundaria y preparatoria: los sistemas de ecuaciones.

Más específicamente, los vectores y matrices nos serán de gran utilidad para resolver sistemas de ecuaciones lineales, determinar cuándo un sistema sí tiene soluciones, y cuáles son todas sus soluciones.

Pero antes, repasemos un poco los conceptos de sistemas de ecuaciones lineales.

Sistemas de ecuaciones lineales

Recordemos que una ecuación es una expresión en la que hay variables o valores que no conocemos. En el caso de una ecuación lineal, se trata de ecuaciones en las que todas sus variables se encuentran elevadas a la primera potencia y acompañadas únicamente por coeficientes constantes. Por ejemplo, podemos ver que las expresiones
\[
2x + 9y – z = 3,
\qquad
4w + 3000a = y + \tfrac{1}{2}x
\]
son ecuaciones lineales, mientras que las expresiones
\[
ax^2 + bx + c = 0,
\qquad
2xz = 9y
\]
no lo son, pues contienen al menos una variable elevada a exponentes distintos de $1$, o bien hay variables multiplicándose entre sí.

De manera más formal, una ecuación de lineal es una ecuación que se puede escribir de la forma
\[
a_1x_2 + a_2x_2 + \cdots + a_nx_n = b,
\]
donde $x_1, \ldots, x_n$ son variables y $a_1, \ldots, a_n, b$ son coeficientes, todos del mismo tipo (en este curso trabajaremos con coeficientes reales, pero en otros cursos podrás encontrar coeficientes de otros tipos, como son números enteros, racionales, y complejos, entre otros).

Por su parte, un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales. Por ejemplo, los siguientes son sistemas de ecuaciones lineales:
\[
\begin{cases}
2x -\tfrac{3}{2}y + 8z = 1 \\
9z + 2w + 5y = 3,
\end{cases}
\qquad
\begin{cases}
2 + 9a = 46b -5c \\
2d + 8x = \sqrt{3} \\
x + y + z = a + b + c \\
x = -y
\end{cases}
\]
Bajo esta definición, una única ecuación se puede considerar un sistema de ecuaciones lineales (con una ecuación).

Notemos que no es necesario que todas las ecuaciones compartan variables, sin embargo, generalmente esto sí sucederá. De hecho, podemos pensar que todas las variables aparecen en todas las ecuaciones. En caso de que esto no suceda, podemos considerar que las variables que no aparecen en una ecuación tienen coeficiente cero. Además, siempre podemos reordenar las variables en las ecuaciones para que en todas ellas aparezcan en el mimo orden. Por ejemplo, a continuación el sistema de ecuaciones a la izquierda lo podemos escribir como el de la derecha, sin alterarlo.

\[
\begin{cases}
2x -\tfrac{3}{2}z + 8y = 11 \\
9z + 2w + 5k = -3,
\end{cases}
\qquad
\begin{cases}
0k+0w+2x + 8y – \tfrac{3}{2}z = 11 \\
5k+2w+0x+0y+9z = -3.
\end{cases}
\]

¿Qué quiere decir resolver un sistema de ecuaciones lineales?

Como recordarás, encontrar una solución de una ecuación corresponde a encontrar valores que, al sustituirlos en las variables, hagan que la expresión sea verdadera. Por ejemplo, si tenemos la ecuación $2x-3y=0$, una solución está dada por $x=3$ y $y=2$, ya que al sustituir en efecto tenemos $(2)(3)-(3)(2)=0$. En ocasiones, una ecuación puede tener más de una solución. Por ejemplo, en este caso otra posible solución es $x=6$ y $y=4$, ya que al sustituir en efecto tenemos $(2)(6)-(3)(4)=0$. Para esta ecuación hemos encontrado entonces dos posibles soluciones. Pero aún no la hemos resuelto. Como veremos un poco más abajo, para resolverla tenemos que alcanzar una meta más grande.

Para el caso de sistemas de ecuaciones lineales, encontrar una solución consiste en dar una asignación de valores a las variables que hagan que todas las ecuaciones sean ciertas simultáneamente. Por ejemplo, podemos verificar que los valores
\[
x = 3 \quad y =5 \quad z = -2
\]
hacen que cada una de las ecuaciones en el sistema
\[
\begin{cases}
x + 2y – z = 15 \\
4x – y + z = 5
\end{cases}
\]
se cumplan simultáneamente. Otra posible solución está dada por la asignación
\[
x = 1 \quad y =15 \quad z = 16.
\]

Cuando hablamos de resolver una ecuación o un sistema de ecuaciones no nos bastará encontrar unas cuantas soluciones que funcionen. Queremos encontrar todas las posibles soluciones.

Como ejemplo más sencillo, tratemos de encontrar todas las soluciones del sigueinte sistema con una única ecuación
\[
\begin{cases}
2x + 3y – z = 5.
\end{cases}
\]

Si despejamos $x$ en la ecuación, obtenemos
\[
x = \frac{-3y+z+5}{2}.
\]
Esto nos indica que podemos escoger valores arbitrarios de $y$ y $z$, y el valor de $x$ quedará determinado por estos valores.

Entonces, la solución de la ecuación son todas las $(x,y,z)$ tales que $x = \frac{-3y+z+5}{2}$; es decir, todas las soluciones del sistema de ecuaciones son de la forma
\[
\left( \frac{-3y+z+5}{2}, y, z \right).
\]

Otra manera de decir esto es que el conjunto de soluciones para el sistema de ecuaciones es el siguiente:

$$S:=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}.$$

Esto ahora sí resuelve el sistema, pues hemos encontrado una descripción para todas las posibles soluciones del sistema. Si tomas los valores que quieras para $y$ y $z$, podrás dar una solución. Por ejemplo, al tomar $y=1,z=2$ obtenemos la solución $(2,1,2)$, la cual puedes verificar que es una solución al sistema de ecuaciones de una ecuación con el que comenzamos. Toda posible solución está en $S$. Como $y$ y $z$ pueden valer lo que sea, las llamamos variables libres. A $x$, que queda totalmente determinada una vez fijas las variables libres, la llamamos variable pivote.

¿Qué sucede si tenemos más ecuaciones? Tratemos de encontrar todas las soluciones para el sistema de ecuaciones siguiente
\[
\begin{cases}
y+z =1 \\
3x+2y+5z&=1.
\end{cases}
\]

Podemos intentar lo mismo que arriba y fijar algún valor e intentar poner al resto en términos de ese. Pero hay que ser cuidadosos. Por ejemplo, al fijar el valor de $x$, no podremos despejar a $y$ (ni a $z$) en términos únicamente de $x$. Sin embargo, fijamos el valor de $z$, sí podemos determinar todo completamente.

Al fijar $z$, entonces $y$ queda determinado como $y = -z + 1$. Sustituyendo este valor de $y$ en la segunda ecuación, obtendremos $3x + 2(-z+1) + 5z = 1$, que equivale a $3x +3z = -1$, de donde tenemos que $x = -z -1/3 $. Entonces, podemos pensar a $z$ como la variable libre y como $y$ y $x$ dependen completamente de $z$, las pensamos como variables pivote. La descripción de las soluciones quedaría entonces como

$$R=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}.$$

Aunque ahora hemos tenido éxito con describir totalmente las soluciones de dos sistemas de ecuaciones y en ambos casos hemos tenido una infinidad de soluciones, lo cierto es que existen sistemas de ecuaciones sin solución. Por ejemplo, consideremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
4x + 3y = 8.
\end{cases}
\]
Podemos ver que cada una de las ecuaciones, de manera individual, tienen soluciones, y hasta podríamos encontrar todas las posibles soluciones (¿puedes dar un par de ejemplos de cada una?). Sin embargo, no existen valores de $x$ y $y$ que resuelvan ambas ecuaciones al mismo tiempo. Esto lo podemos observar porque, si multiplicamos la segunda ecuación por $3$, obtendremos el sistema
\[
\begin{cases}
12x + 9y = 7 \\
12x + 9y = 24.
\end{cases}
\]
Si hubiera alguna solución, podríamos igualar ambas ecuaciones y llegar a que $7=24$, una contradicción.

Interpretación geométrica

El primer conjunto solución que encontramos arriba se puede reescribir en términos de cada variable $y$ y $z$ usando la suma y producto escalar que estudiamos en entradas anteriores de la siguiente manera:

\begin{align*}
S&=\left\{\left( \frac{-3y+z+5}{2}, y, z \right):y,z\in \mathbb{R}\right\}\\
&=\left\{y(-3/2,1,0) + z(1/2,0,1) + (5/2,0,0):y,z\in \mathbb{R}\right\}.
\end{align*}

Posiblemente hayas visto expresiones en algún curso de geometría analítica. Lo anterior es un plano en $\mathbb{R}^3$ que pasa por el punto $(5/2,0,0)$ y generado a partir de ese punto por los vectores $(-3/2,1,0)$ y $(1/2,0,1)$.

Del mismo modo, en el segundo ejemplo que vimos arriba el sistema de ecuaciones puede reescribirse como:

\begin{align*}
R&=\{(-z-1/3,-z+1,z):z\in \mathbb{R}\}\\
&=\{(-1/3,1,0)+z(-1,-1,1):z\in \mathbb{R}\},
\end{align*}

que posiblemente identifiques como la recta en $\mathbb{R}^3$ que parte del punto $(-1/3,1,0)$ y tiene dirección $(-1,-1,1)$.

Forma matricial de un sistema de ecuaciones

Como vimos en una entrada previa, dos vectores del mismo tamaño son iguales si y sólo si sus respectivas entradas son iguales. Una consecuencia de esta definición es que el sistema de ecuaciones
\[
\begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n & = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n & = b_2 \\
& \vdotswithin{\mspace{15mu}} \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m
\end{cases}
\]
se cumple si y sólo si
\[
\begin{pmatrix}
a_{11}x_1 + a_{12}x_2 + \cdots a_{1n}x_n \\
a_{21}x_1 + a_{22}x_2 + \cdots a_{2n}x_n \\
\vdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots a_{mn}x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

Más aún, observemos que el lado izquierdo de esta igualdad lo podemos reescribir como un producto de matriz con vector de la siguiente manera
\[
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\begin{pmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{pmatrix}
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix},
\]
lo cual podemos denotar como
\[
Ax = b.
\]

Entonces, podemos decir que nuestro sistema tiene solución si existe un vector $x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}$ tal que $Ax = b$, donde
\[
A
=
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\quad
\text{y}
\quad
b
=
\begin{pmatrix}
b_1 \\
b_2 \\
\vdots \\
b_m
\end{pmatrix}.
\]

A la expresión $Ax=b$ le llamamos la forma matricial del sistema de ecuaciones.

Ejemplo de la utilidad de la forma matricial

La forma matricial de un sistema de ecuaciones es sumamente útil, como veremos en las siguientes entradas. Pero veamos un pequeño ejemplo de una de sus aplicaciones. Supongamos que sabemos que la matriz $A$ es invertible con inversa $A^{-1}$. Recordemos que entonces se cumple que$A^{-1}A = \mathcal{I}$. Gracias a esto, podemos comenzar con la forma matricial del sistema de ecuaciones y deducir lo siguiente:
\begin{align*}
&Ax = b \\
\Rightarrow & A^{-1}Ax = A^{-1}b \\
\Rightarrow &x = A^{-1}b.
\end{align*}

Es decir, si conocemos la matriz inversa de $A$, ¡podemos obtener de manera única el vector que resuelve el sistema de ecuaciones mediante una multiplicación de matriz por vector!

Aún cuando no hemos visto el método general para saber si una matriz tiene inversa, ya vimos previamente qué sucede con una matriz de $2\times 2$
\[
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\]

Así, verifiquemos mediante un ejemplo que el método que mostramos sirve para encontrar soluciones de sistemas de ecuaciones. Consideremos el sistema de ecuaciones
\[
\begin{cases}
2x + 8y &= 9 \\
-3x + 4y &= 2.
\end{cases}
\]

Este sistema puede ser representado en forma matricial como
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix}.
\]

Como recordarás de entradas pasadas, la matriz inversa de $\begin{pmatrix} 2 & 8 \\ -3 & 4 \end{pmatrix}$ es
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}^{-1}
=
\frac{1}{2\cdot4 – 8\cdot(-3)}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\frac{1}{32}
\begin{pmatrix}
4 & -8 \\
3 & 2
\end{pmatrix}
=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}.
\]

Entonces si multiplicamos esta por matriz por la izquierda a ambos lados de la ecuación
\[
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
=
\begin{pmatrix}
9 \\
2
\end{pmatrix},
\]
obtendremos
\begin{align*}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
2 & 8 \\
-3 & 4
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
1/8 & -1/4 \\
3/32 & 1/16
\end{pmatrix}
\begin{pmatrix}
9 \\
2
\end{pmatrix}
\\[5pt]
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
&=
\begin{pmatrix}
5/8 \\
31/32
\end{pmatrix},
\end{align*}
lo que equivale a $x = 5/8$, $y = 31/32$; la solución del sistema. ¡Verifica que es solución!

Más adelante…

En esta entrada repasamos los conceptos y definiciones sobre sistemas de ecuaciones lineales, y nos adentramos a ver cómo existe una relación directa entre los sistemas de ecuaciones lineales y el producto de una matriz por un vector, así como que las matrices invertibles guardan relación con la solución del sistema.

Que la matriz asociada a un sistema de ecuaciones sea invertible en realidad no pasa tanto, y se tienen que desarrollar métodos más generales para resolver sistemas de ecuaciones. En la siguiente entrada conoceremos un algoritmo que nos permitirá resolver sistemas de ecuaciones con una cantidad arbitraria de variables y ecuaciones, y determinar exactamente cómo se ven todas las soluciones.

Tarea moral

  1. Usa el método de las variables libres y las variables pivote para describir al conjunto solución del siguiente sistema de ecuaciones y descríbelo geométricamente. Tendrás que elegir apropiadamente el orden en el que vas fijando las variables.
    \begin{cases}
    w+2x + 8y + 3z&= 0 \\
    -3x + 4y + z&= -1\\
    x+z&=2.\\
    \end{cases}
  2. Usa el método de la inversa para resolver los siguientes tres sistemas de ecuaciones:
    \[
    \begin{cases}
    2x + 8y &= 4 \\
    -3x + 4y &= 1,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 3 \\
    -3x + 4y &= -2,
    \end{cases} \quad \begin{cases}
    2x + 8y &= 1 \\
    -3x + 4y &= -1.
    \end{cases}
    \]
  3. Intenta usar el método de las variables libres y pivote en el siguiente sistema de ecuaciones y explica qué dificultad tiene intentar usarlo directamente:
    \[
    \begin{cases}
    x + y &= 4 \\
    y+z &= 1\\
    z+x&=2.
    \end{cases}
    \]
    ¿Cómo describirías a un sistema de ecuaciones en el cuál se puede hacer el método de variables libres y pivote cómodamente?
  4. Considera un sistema de ecuaciones en forma matricial $Ax=b$. Demuestra que si $x$ y $x’$ son soluciones a este sistema, entonces $\frac{x+x’}{2}$ también lo es. Explica cómo puedes usar esto para a partir de dos soluciones $x$ y $x’$ distintas conseguir una infinidad de soluciones. Concluye que cualquier sistema de ecuaciones lineales o bien no tiene solución, o bien tiene una única solución, o bien tiene una infinidad de soluciones.
  5. Encuentra una matriz no invertible $A$ y un vector $b$ tales que el sistema de ecuaciones $Ax=b$ sí tenga solución. En ese sistema que diste, ¿la solución es única o puedes encontrar otra?

Entradas relacionadas