Álgebra Moderna I: Producto directo interno

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Continuamos con el estudio del producto de grupos. En la entrada anterior definimos el producto directo externo de grupos, luego vimos unas funciones naturales y definimos los subgrupos $G^*_i$. Demostramos que para un grupo $G = G_1 \times \dots \times G_n$ se cumple que:

  1. $G_i^* \unlhd G \quad \forall i\in\{1,\dots,n\}$.
  2. $\displaystyle G_i^* \cap \left( \prod_{j\neq i} G_j^*\right) = \{e_G\} \text{ para toda }i\in\{1,\dots,n\}$.
  3. $\displaystyle G = \prod_{i = 1}^n G_i^*$.

En resumen, esta proposición nos dice que si $G$ es el producto directo externo de varios grupos, también lo podemos ver como producto de subgrupos normales que cumplen el inciso 2.

En esta entrada queremos generalizar esta idea: ahora $G$ será un grupo cualquiera, tomaremos subgrupos normales $H_i$, con $i\in \{1,\dots,n\}$ de $G$ que cumplan estas propiedades y probaremos que $G$ se puede ver como el producto directo externo de estos subgrupos.

En el producto directo externo, construíamos $G$ a partir de otros grupos que pudieran incluso no estar relacionados entre sí. Ahora intentaremos describir a un grupo $G$ como producto de algunos de sus subgrupos normales, por eso llamaremos a este concepto el producto directo interno.

Producto directo interno de subgrupos

Comencemos definiendo nuestro nuevo producto entre subgrupos normales de $G$.

Definición. Sean $G$ un grupo, $H_1,\dots, H_n$ subgrupos de $G$. Decimos que $G$ es el producto directo interno de $H_1,\dots, H_n$ si

  1. $H_i \unlhd G$ para toda $i\in\{1,\dots, n\}$.
  2. $\displaystyle H_i\cap \left(\prod_{j\neq i} H_j\right) = \{e\}$ para toda $i\in\{1,\dots, n\}$.
  3. $\displaystyle G = \prod_{i=1}^n H_i$.

Observación 5. $G_1\times\cdots\times G_n$ es el producto directo interno de los $G_i^*$.

Observación 6. Si $G$ es el producto directo interno de $H_1,\cdots,H_n$, entonces $xy=yx$ para toda $x\in H_i, y\in H_j$ con $i\neq j$.

Demostración.
Sea $G$ producto directo de $H_1,\dots, H_n$, sean $x\in H_i, y\in H_j$, con $j\neq i$, entonces
\begin{align*}
xyx^{-1}y^{-1} = x(yx^{-1}y^{-1}) \in H_i,
\end{align*}
porque $x \in H_i$ y $yx^{-1}y^{-1}\in H_i$ pues $H_i \unlhd G$.

Por otro lado,
\begin{align*}
xyx^{-1}y^{-1} = (xyx^{-1})y^{-1} \in H_j,
\end{align*}
ya que, análogamente, $xyx^{-1} \in H_j$ debido a que $H_j\unlhd G$ y $y^{-1} \in H_j.$

Así, $\displaystyle xyx^{-1}y^{-1} \in H_i \cap H_j \subseteq H_i\cap \prod_{k\neq i} H_k = \{e\}$. Entonces $xyx^{-1}y^{-1} = e$.

Por lo tanto $xy = yx$.

$\blacksquare$

Ejemplo. Sea $G = \left< a \right>$ con $o(a) = 12$. Busquemos subgrupos $H_1, \dots, H_n$ para alguna $n\in \n$ tales que $G$ sea el producto directo interno de estos subgrupos.

Sean $H_1 = \left< a^3\right>, H_2 = \left< a^4\right>$. Como $G$ es abeliano, $H_1\unlhd G, H_2 \unlhd G$. Además
\begin{align*}
H_1\cap H_2 = \{e,a^3,a^6, a^9\} \cap \{e, a^4, a^8\} = \{e\}.
\end{align*}

Como
\begin{align*}
a = ae = a a^{12} = a^{13} = a^9a^4 \in H_1H_2
\end{align*}
tenemos que $G = \left< a \right> \subseteq H_1H_2$. Por la cerradura del producto en $G$ se tiene además que $H_1H_2 \subseteq G$, entonces $G=H_1H_2$.

Por lo tanto $G$ es el producto directo interno de $H_1$ y $H_2$.

Observación 7. Sean $G$ un grupo, $H_1,\dots, H_n$ subgrupos de $G$. Si $G$ es el producto directo interno de $H_1,\dots, H_n$, entonces
\begin{align*}
\varphi : H_1\times \cdots \times H_n \to G
\end{align*}
con $\varphi(h_1,\dots,h_n) = h_1\cdots h_n$ para toda $(h_1,\dots,h_n) \in H_1\times\cdots\times H_n$ es un isomorfismo.

Es consecuencia, si $G$ es finito tenemos que $|G| = |H_1|\cdots|H_n|$.

Descomposición de $G$ en $p$-subgrupos

Algunos subgrupos importantes que vimos son los $p$-subgrupos de Sylow, para $p$ primo. Ahora los usaremos junto con el producto directo interno para describir a $G$ como el producto de sus $p$-subgrupos de Sylow, esto nos recuerda mucho al Teorema Fundamental de la Aritmética.

Teorema. Sea $G$ un grupo finito con $p_1,\dots, p_t$ los distintos factores primos del orden de $G$ y $P_1, \dots, P_t$ subgrupos de Sylow de $G$ asociados a $p_1,\dots,p_t$ respectivamente. Si $P_i\unlhd G$ para toda $i\in\{1,\dots, t\}$, entonces $G$ es el producto directo interno de $P_1,\dots, P_t$.

Demostración.
Sea $G$ un grupo finito de orden $n$. Sean $p_1,\dots, p_t$ los distintos factores primos de $n$ con $n=p_1^{\alpha_1}p_2^{\alpha_2}\cdots p_t^{\alpha_t}$. Sean $P_1,\dots, P_t$ subgrupos de $G$ con $P_i$ un $p_i$-subgrupo de Sylow de $G$ y $P_i \unlhd G$ para toda $i\in \{1,\dots, t\}$.

Veamos que para todo $S\subseteq \{1,\dots, t\}$, $\displaystyle \prod_{j\in S} P_j$ es un producto directo interno por inducción sobre $\# S$.

Caso Base. Supongamos que $\# S = 1$,
$S = \{i\} \subseteq \{1,\dots, t\}$ y $P_i$ es el producto directo interno de $P_i$.

H.I. Supongamos que si $T\subseteq \{1,\dots, t\}$ con $\# T < \# S$, entonces $\displaystyle \prod_{j\in T} P_j$ es un producto directo interno.

Sea $\displaystyle H = \prod_{j\in S}P_j$. Veamos que $H$ es el producto directo interno de los $P_j$ con $j\in S$.

Por hipótesis se cumplen las condiciones $1$ y $3$ de la definición de producto directo interno. Veamos que se cumple $2$.

Sean $i\in S$, $\displaystyle x\in P_i\cap \prod_{\substack{j\in S\\ j\neq i}} P_j$.

Como $x\in P_i$, entonces $o(x) $ divide a $ |P_i|$.

Como $\displaystyle x\in \prod_{\substack{j\in S\\ j\neq i}} P_j$, entonces el orden de $x$ divide al orden del producto: $\displaystyle o(x) \Big| \left|\prod_{\substack{j\in S\\ j\neq i}} P_j\right| = \prod_{\substack{j\in S\\ j\neq i}} |P_j|$ donde la última igualdad se debe a que $\displaystyle \prod_{\substack{j\in S\\ j\neq i}} P_j$ es un producto directo interno por H.I. y por la observación 7.

Pero $|P_i| = p_i^{\alpha_i}$ y $\displaystyle \prod_{\substack{j\in S\\ j\neq i}} |P_j| = \prod_{\substack{j\in S\\ j\neq i}} p_j^{\alpha_j}$ con $\alpha_j\in \n^+$ para toda $j\in S$, entonces $|P_i|$ y $\displaystyle \prod_{\substack{j\in S\\ j\neq i}} |P_j|$ son primos relativos. Así, $o(x) = 1$. Por lo que $\displaystyle P_i \cap \prod_{\substack{j\in S\\ j\neq i}} P_j = \{e\}$.

Hemos probado entonces que $\displaystyle \prod_{\substack{j\in S}} P_j$ es un producto directo interno para toda $S\subseteq \{1,\dots,t\}$. En particular para $S = \{1,\dots, t\}$ tenemos que $\displaystyle \prod_{j = 1}^t P_j$ es un producto directo interno. Por la observación 7,
\begin{align*}
\left| \prod_{j = 1}^t P_j \right| = \prod_{j=1}^t |P_j| = n = |G|
\end{align*}
ya que $P_1,\dots,P_t$ son subgrupos de Sylow asociados a los distintos factores primos de $G$.

Como $\displaystyle \prod_{j=1}^t P_j$ es un subgrupo de $G$ de orden $|G|$ tenemos que $\displaystyle G = \prod_{j=1}^t P_j$.

Por lo tanto $G$ es el producto directo interno de $P_1,\dots, P_t$.

$\blacksquare$

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra las observaciones 5 y 7.
    • $G_1\times\cdots\times G_n$ es el producto directo interno de los $G_i^*$.
    • Sean $G$ un grupo, $H_1,\dots, H_n$ subgrupos de $G$. Si $G$ es el producto directo interno de $H_1,\dots, H_n$, entonces
      \begin{align*}
      \varphi : H_1\times \cdots \times H_n \to G
      \end{align*}
      con $\varphi(h_1,\dots,h_n) = h_1\cdots h_n$ para toda $(h_1,\dots,h_n) \in H_1\times\cdots\times H_n$ es un isomorfismo.
  2. Regresa a la entrada de Ejemplo de Sylow y considera $S_4$.
    • De existir, busca $H_1, \dots, H_n$ tal que $S_4$ sea producto directo de $H_1,\dots , H_n.$
    • Usando los $p$-subgrupos de Sylow que encontramos, describe a $S_4$ como producto directo interno de ellos. Aplica el último teorema visto.
  3. Aplica el último teorema visto a los grupos $\z_6$ y $T = S_3 \times \z_4$. Para cada uno encuentra los primos $p_1, \dots , p_n$ que conforman al orden del grupo y los $P_1, \dots , P_n$ subgrupos de Sylow que corresponden a estos primos. Al final, representa a cada grupo como producto directo interno de estos $p$-subgrupos de Sylow.

Más adelante…

La descomposición de un grupo en $p$-subgrupos que vimos es una probada de lo que veremos en el Teorema fundamental de grupos abelianos finitos, la relación de los primos que componen al orden del grupo con los $p$-subgrupos del mismo grupo. Pero antes de poder enunciarlo, necesitamos enunciar algunos teoremas que nos ayudarán y que se sirven de los productos directos interno y externo que hemos estado viendo.

Entradas relacionadas

El Teorema de la Función Implícita

Por Angélica Amellali Mercado Aguilar

El Teorema de la función implicita versión para funciones $f:\mathbb{R}\rightarrow\mathbb{R}$

Teorema 1. Considere la función $y=f(x)$. Sea $(x_{0},y_{0}) \in
\mathbb{R}^{2}$ un punto tal que $F(x_{0},y_{0})=0$. Suponga que la función $F$ tiene derivadas parciales continuas en alguna bola con centro $(x_{0},y_{0})$ y que $\displaystyle \frac{\partial F}{\partial y}(x_{0},y_{0})\neq 0$. Entonces $F(x,y)=0$ se puede resolver para $y$ en términos de $x$ y definir así una función $y=f(x)$ con dominio en una vecindad de $(x_{0},y_{0})$, tal que $y_{0}=f(x_{0})$, lo cual tiene derivadas continuas en $\mathcal{V}$ que pueden calcularse como $y’=f'(x)=-\displaystyle
\frac{\displaystyle \frac{\partial F}{\partial x}(x,y)}{\displaystyle \frac{\partial F}{\partial y}(x,y)}$, $x \in \mathcal{V}$.

Demostración. Como $\displaystyle{\frac{\partial
F}{\partial y}(x_{0},y_{0})\neq 0}$ supongamos sin perdida de generalidad que $\displaystyle{\frac{\partial F}{\partial y}(x_{0},y_{0})> 0}$. Por ser $\displaystyle{\frac{\partial F}{\partial y}}$ continua en una vecindad de $(x_{0},y_{0})$ entonces exite un cuadrado S, centrado en $(x_{0},y_{0})$ totalmente contenido en esa vecindad, en donde $\displaystyle{\frac{\partial F}{\partial y}(x,y)> 0}$ $\forall~x,y\in S$.Sea
$$S=\left\{(x,y)\in\mathbb{R}^{2}~|~|x-x_{0}|<h~y~|y-y_{0}|<k \right\}$$

En todo punto $(x,y)$ que pertenece a $S$, $\displaystyle{\frac{\partial F}{\partial y}(x,y)>0}$. Esto quiere decir que en $S$, $F$ es creciente y fijando $x_{0}$ en $[x_{0}-h,x_{0}+h]$ se tiene que $F$ es creciente en $[y_{0}-k,y_{0}+k]$ y se anula en $y_{0}$, por lo que
$$F(x_{0},y_{0}-k)<0~~yF(x_{0},y_{0}+k)>0$$ Consideremos ahora el par de funciones $F(x,y_{0}-k)$ y $F(x,y_{0}+k)$ definidas en el intervalo $(x_{0}-k,x_{0}+k)$. Donde ambas funciones solo tienen x como variable. La primera función cumple $F(x_{0},y_{0}-k)<0$ y por ser continua en $x_{0}$, es negativa en toda una vecindad $(x_{0}-h_{1}x_{0}+h_{1})$ de $x_{0}$. Análogamente, la segunda función cumple $F(x_{0},y_{0}+k)>0$ y por ser continua en $x_{0}$, es positiva en toda una vecindad $(x_{0}-h_{2}x_{0}+h_{2})$ de $x_{0}$. Sea $h=\min{h_{1},h_{2}}$. Entonces para toda $x$ tal que $|x-x_{0}|~y~F(x,y_{0}+k)>0$ Fijemos $x$ en el intervalo $(x_{0}-h,x_{0}+h)$, y consideremos a $F(x,y)$, sólo como función de $y$, sobre $[y_{0}-k,y_{0}+k]$. Esta función cumple que

$$F(x,y_{0}-k)<0~y~F(x,y_{0}+k)>0$$

por lo tanto según el teorema del valor intermedio, existe un único y en $(y_{0}-k,y_{0}+k)$ tal que $F(x,y)=0$. Así queda establecida la existencia y unicidad de la función $y=f(x)$. Donde además, $y_{0}=f(x_{0})$, y para todo $x\in(x_{0}-h,x_{0}+h)$ $$F(x,f(x))=0,y~~\frac{\partial F}{\partial y}(x_{0},y_{0})\neq 0$$

Vamos a comprobar que la función es continua, para ello se tiene
$$x\in[x_{0}-h,x_{0}+h]~\Rightarrow~|x-x_{0}|<h$$
tomando $h<\delta$ se tiene
$$|x-x_{0}|<\delta$$
esto quiere decir que
$$|y-y_{0}|<k$$ es decir$$|f(x)-f(x_{0})|,\frac{\partial F}{\partial y}(x_{0},y_{0})$$
existen y son continuas entonces $F$ es diferenciable por lo que
$$F(x_{0}+h,y_{0}+k)-F(x_{0},y_{0})=\frac{\partial F}{\partial x}(x_{0},y_{0})h+\frac{\partial F}{\partial y}(x_{0},y_{0})k+R(h,k)$$
Tenemos que $F$ es continua por lo que
$$F(x_{0}+h,y_{0}+k)-F(x_{0},y_{0})=0sih,k\rightarrow 0$$
también
$$R(h,k)\rightarrow 0sih,k\rightarrow 0$$
por lo que
$$\frac{\partial F}{\partial x}(x_{0},y_{0})h+\frac{\partial F}{\partial y}(x_{0},y_{0})k=0$$
esto es
$$\frac{k}{h}=-\frac{\frac{\partial F}{\partial x}(x_{0},y_{0})}{\frac{\partial F}{\partial y}(x_{0},y_{0})}$$
y cuando $h,k\rightarrow 0$ se tiene
$$\frac{dy}{dx}=-\frac{\frac{\partial F}{\partial x}(x_{0},y_{0})}{\frac{\partial F}{\partial y}(x_{0},y_{0})}$$

Importante: Este es un resultado que garantiza la
existencia de una función $y=f(x)$ definida implícitamente por
$F(x,y)=0$. Esto es, puede resolverse para $y$ en términos de $x$,
pero no nos dice como hacer el despeje.

Ejemplo. Considere la función $F(x,y)=e^{2y+x}+\sin(x^{2}+y)-1$ en el punto (0,0) tenemos $F(0,0)=0$. Las derivadas parciales de $F$ son
$F_{x}=e^{2y+x}+2x\cos(x^{2}+y)$
$F_{y}=2e^{2y+x}+\cos(x^{2}+y)$

que son siempre continuas. Además, $\displaystyle \frac{\partial F}{\partial y}(0,0)=3\neq0$ de modo que $\textbf{T.F.Im.}$ garantiza una vecindad de $x=0$ en la cual podemos definir una función $y=f(x)$ tal que $F(x,f(x))=0$. Obsérvese que en este caso no podemos hacer explícita la función $y=f(x)$ sin embargo tal función existe y su derivada es

$y’=f'(x)=\displaystyle -\frac{\displaystyle \frac{\partial F}{\partial x}}{\displaystyle \frac{\partial F}{\partial y}}=\displaystyle \frac{e^{2y+x}+2x\cos(x^{2}+y)}{2e^{2y+x}+\cos(x^{2}+y)}$

Ejemplo. Considere $F(x,y)=x^{4}-e^{xy^{3}-1}$ en el punto (1,1) $F(1,1)=1-1=0$, $F_{x}=4x^{3}-y^{3}e^{xy^{3}-1}$ Por lo tanto, $F_{x}|{(1,1)}=3$, $F{y}=-3xye^{xy^{3}-1}$
Y así, $F_{y}|_{(1,1)}=-3$, y $\displaystyle \frac{\partial F}{\partial y}=-3\neq0$.

El $\textbf{T.F.Im.}$ nos garantiza que en los alrededores de (1,1) el nivel cero de $F$ se ve como la gráfica de la función $y=f(x)$ y que su derivada es $y’=\displaystyle
\frac{-4x^{3}-y^{3}e^{xy^{3}-1}}{-3xy^{2}e^{xy^{3}-1}}$.

Observe que en este caso la función $F$ permite hacer el despeje en términos de $x$.

$F(x,y)=x^{4}-e^{xy^{3}-1}=0$
$x^{4}=e^{xy^{3}-1}$
$\ln (x^{4})=xy^{3}-1$
$\left(\displaystyle \frac{\ln (x^{4})+1}{x}\right)^{\frac{1}{3}}=y=f(x)$ que al derivar se debe de llegar al mismo resultado.

Ejemplo. Considere $F(x,y)=x^{2}-y^{3}-1$ en el punto $(x_{0},y_{0})$ con $y_{0}\neq 0$ tal que $F(x_{0},y_{0})=0$, $F_{x}=2x,~~F_{y}=2y$
Por lo tanto, $F_{x}|{(x{0},y_{0})}=2x_{0}$,
Y así, $F_{y}|{(x{0},y_{0})}=2y_{0}$, y $\displaystyle \frac{\partial F}{\partial y}=2y_{0}\neq0$.
El $\textbf{T.F.Im.}$ nos garantiza que en los alrededores de $(x_{0},y_{0})$ el
nivel cero de $F$ se ve como la gráfica de la función $y=f(x)$ y que su derivada es
$$y'(x)=-\frac{\frac{\partial F}{\partial x}(x_{0},y_{0})}{\frac{\partial F}{\partial y}(x_{0},y_{0})}$$
en este caso
$$y'(x)=-\frac{2x_{0}}{2y_{0}}=-\frac{x_{0}}{y_{0}}$$
si $y_{0}>0$ tal función es $f(x)=\sqrt{1-x^{2}}$ por lo que
$$y’=-\frac{x}{\sqrt{1-x^{2}}}=-\frac{x}{y}$$
si $y_{0}<0$ tal función es $f(x)=-\sqrt{1-x^{2}}$ por lo que
$$y’=-\frac{-x}{-\sqrt{1-x^{2}}}=-\frac{x}{y}$$

El Teorema de la función implicita versión para funciones $f:\mathbb{R}^{2}\rightarrow\mathbb{R}$

Considere la función $F(x,y,z)$. Sea $(x_{0},y_{0},z_{0}) \in \mathbb{R}^{3}$ un punto tal que $F(x_{0},y_{0},z_{0})=0$. Suponga que la función $F$ tiene derivadas parciales $\displaystyle{\frac{\partial F}{\partial x},~\frac{\partial F}{\partial y},~\frac{\partial F}{\partial z}}$ continuas en alguna bola con centro $(x_{0},y_{0},z_{0})$ y que $\displaystyle \frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})\neq 0$.
Entonces $F(x,y,z)=0$ se puede resolver para $z$ en términos de $x,y$ y definir así una función $z=f(x,y)$ con dominio en una vecindad de
$(x_{0},y_{0},z_{0})$, tal que $z_{0}=f(x_{0},y_{0})$, lo cual tiene derivadas continuas
en $\mathcal{V}$ que pueden calcularse como $$\frac{d z}{dx}(x,y)=-\displaystyle
\frac{\displaystyle \frac{\partial F}{\partial x}(x,y)}{\displaystyle \frac{\partial F}{\partial z}(x,y)}~~~\frac{d z}{dy}(x,y)=-\displaystyle \frac{\displaystyle \frac{\partial F}{\partial
y}(x,y)}{\displaystyle \frac{\partial F}{\partial z}(x,y)}$$
$\textbf{Importante:}$ Este es un resultado que garantiza la existencia de una función $z=f(x,y)$ definida implícitamente por $F(x,y,z)=0$. Esto es, puede resolverse para $z$ en términos de $x,y$, pero no nos dice como hacer el despeje.

Demostración. Consideremos el par de funciones
$$F(x,y,z_{0}-\ell)yF(x,y,z_{0}+\ell)$$
definidas para $(x,y)\in[x_{0}-h,x_{0}+h]\times [y_{0}-k,y_{0}+k]$\La primera satisface
$$F(x_{0},y_{0},z_{0}-\ell)<0$$ la segunda cumple $$F(x_{0},y_{0},z_{0}+\ell)>0$$
Fijemos $(x,y)$ en $[x_{0}-h,x_{0}+h]\times [y_{0}-k,y_{0}+k]$ y consideramos $F(x,y,z)$ solo como función de z, sobre $[z_{0}-\ell,z_{0}+\ell]$. Esta función cumple
$$F(x,y,z_{0}-\ell)<0~y~F(x,y,z_{0}+\ell)>0$$
por lo que al aplicar el Teorema del valor intermedio, obteniendose un único z en $(z_{0}-\ell,z_{0}+\ell)$ en donde $F(x,y,z)=0$.Queda así establecida la existencia y unicidad de la función $z=f(x,y)$ con dominio $[x_{0}-h,x_{0}+h]\times [y_{0}-k,y_{0}+k]$ y rango $[z_{0}-\ell,z_{0}+\ell]$ Vamos a probar que dicha f es continua, para ello si
$$\left(\begin{matrix}x\in [x_{0}-h,y_{0}+h] , y\in [y_{0}-k,y_{0}+k] \end{matrix}\right)~\Rightarrow~\left(\begin{matrix}|x-x_{0}|<h\|y-y_{0}|<k\end{matrix}\right)$$
por lo que
$$|(x,y)-(x_{0},y_{0})|<|x-x_{0}|+|y-y_{0}|<h+k$$
si $h<k$
$$|(x,y)-(x_{0},y_{0})|<2k=\delta$$
donde
$$|f(x,y)-f(x_{0},y_{0})|=|z-z_{0}|<\ell=\epsilon$$
por lo tanto $f(x,y)$ es continua.Ahora si suponemos que $\displaystyle{\frac{\partial F}{\partial x},~\frac{\partial F}{\partial y}},~\frac{\partial F}{\partial z}$ son continuas en los alrededores de $(x_{0},y_{0},z_{0})$ en tonces F es diferenciable y se tiene
$$F(x_{0}+h,y_{0},z_{0}+\ell)-F(x_{0},y_{0},z_{0})=\frac{\partial F}{\partial x}(x_{0},y_{0},z_{0})h+\frac{\partial F}{\partial y}(x_{0},y_{0},z_{0})0+\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})\ell+R(h,k,\ell)$$

De donde
$$F(x_{0}+h,y_{0},z_{0}+\ell)-F(x_{0},y_{0},z_{0})\rightarrow 0$$
$$R(h,k,\ell)\rightarrow 0$$
por lo que
$$\frac{\partial F}{\partial x}(x_{0},y_{0},z_{0})h+\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})\ell=0$$
$$~\Rightarrow~\frac{h}{\ell}=-\frac{\frac{\partial F}{\partial x}(x_{0},y_{0},z_{0})}{\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})}$$
y cuando $h,\ell\rightarrow 0$ se tiene
$$\frac{dz}{dx}=-\frac{\frac{\partial F}{\partial x}(x_{0},y_{0},z_{0})}{\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})}$$
Análogamente
$$F(x_{0},y_{0}+k,z_{0}+\ell)-F(x_{0},y_{0},z_{0})=\frac{\partial F}{\partial x}(x_{0},y_{0},z_{0})0+\frac{\partial F}{\partial y}(x_{0},y_{0},z_{0})k+\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})\ell+R(h,k,\ell)$$
De donde
$$F(x_{0},y_{0}+k,z_{0}+\ell)-F(x_{0},y_{0},z_{0})\rightarrow 0$$
$$R(h,k,\ell)\rightarrow 0$$
por lo que
$$\frac{\partial F}{\partial y}(x_{0},y_{0},z_{0})k+\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})\ell=0$$
$$~\Rightarrow~\frac{k}{\ell}=-\frac{\frac{\partial F}{\partial y}(x_{0},y_{0},z_{0})}{\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})}$$
y cuando $h,\ell\rightarrow 0$ se tiene
$$\frac{dz}{dy}=-\frac{\frac{\partial F}{\partial y}(x_{0},y_{0},z_{0})}{\frac{\partial F}{\partial z}(x_{0},y_{0},z_{0})}$$ $\square$

Funciones en espacios topológicos compactos

Por Lizbeth Fernández Villegas

Introducción

En esta entrada conoceremos más propiedades de los espacios métricos compactos. Veremos qué ocurre cuando les es aplicada una función continua. Esto nos relacionará dos espacios métricos entre sí a través de los subconjuntos. Podremos concluir información acerca de la imagen de una función cuando ciertas condiciones se cumplen. Comencemos con la siguiente:

Proposición: Sean $(X,d_X)$ y $(Y,d_Y)$ espacios métricos. Si $\phi:X \to Y$ es una función continua y $A \subset X$ es compacto, entonces la imagen de $A$ bajo $\phi$, es decir, $\phi(A),$ es un conjunto compacto en $(Y,d_Y).$

La imagen continua de un compacto es compacta

Demostración:
Sea $\mathcal{C}= \{A_i: i \in \mathcal{I}\}$ una cubierta abierta de $\phi (A)$. Como $\phi$ es continua entonces la imagen inversa de $A_i,$ es decir, el conjunto $\phi ^{-1}(A_i), i \in \mathcal{I}$ es un conjunto abierto en $X$. No es difícil probar que $\{\phi ^{-1}(A_i):i \in \mathcal{I}\}$ es una cubierta abierta de $A.$ (Ejercicio).

La imagen inversa define una cubierta abierta en $X$

Como $A$ es compacto, entonces existe una subcubierta finita $\{\phi ^{-1}(A_{i_1}),\phi ^{-1}(A_{i_2}),…,\phi ^{-1}(A_{i_m}) \}$ con $m \in \mathbb{N}$ tal que $A \subset \underset{1\leq j \leq m}{\bigcup}\phi ^{-1}(A_{i_j}).$ Esto significa que $\{A_{i_1},A_{i_2},…,A_{i_m}\}$ es una subcubierta en $Y$ de $\mathcal{C}$ para $\phi (A)$. (¿Por qué?) Por lo tanto $\phi (A)$ es compacto.

Los conjuntos correspondientes en $X$ definen una cubierta finita en $Y$

Ejemplos

La función valor absoluto en un intervalo cerrado

Considera $\mathbb{R}$ con la métrica euclidiana y la función $f:[-1,1] \to \mathbb{R}$ donde $f(x)= |x|.$ Entonces $f$ es una función continua y $f([-1,1]) = [0,1]$ es compacto en $\mathbb{R}.$

La función $sen(4x)$

Considera $\mathbb{R}$ con la métrica euclidiana y la función $f:[0, \pi ] \to \mathbb{R}$ donde $f(x)= sen(4x).$ Entonces $f$ es una función continua y $f([0, \pi]) = [-1,1]$ es compacto en $\mathbb{R}.$

La función $e^x$

Considera $\mathbb{R}$ con la métrica euclidiana y la función $f:[0, 2 ] \to \mathbb{R}$ donde $f(x)= e^x .$ Entonces $f$ es una función continua y $f([0, 2]) = [1,e^2]$ es compacto en $\mathbb{R}.$

Es resultado conocido que si $\phi: [0,1] \to \mathbb{R}$ es una función continua, entonces $\phi([0,1])= [a,b]$ donde $a = min \{f(x)|0 \leq x \leq 1 \} \, $ y $ \, b = max \{f(x)|0 \leq x \leq 1 \}.$ (Ver Teorema del máximo-mínimo). En efecto $[a,b]$ es un intervalo cerrado en $\mathbb{R}$ y por tanto es compacto.

Bajo la misma idea podemos considerar a la función $\psi: \mathbb{R} \to \mathbb{R}^2$ dada por $\psi(t)=(t,\phi(t))$. Entonces, la curva de esta función es un conjunto compacto en $\mathbb{R}^2$

En la entrada anterior vimos que un conjunto compacto es cerrado y acotado. Podemos concluir el siguiente:

Corolario: Sea $A$ compacto. Entonces una función continua $\phi:A \subset X \to Y$ es acotada, pues la imagen bajo $\phi$ en el compacto es compacta y, por lo tanto, acotada. También podemos concluir que $\phi(A)$ es cerrada.

$\phi$ es acotada

Este resultado nos permite delimitar una función en el espacio euclidiano de $\mathbb{R}$ con dos puntos importantes en el contradominio de la función: el máximo y el mínimo.

Probablemente este resultado te sea familiar de los cursos de cálculo:

Proposición: Sea $f:A\subset \mathbb{R}^n \to \mathbb{R}$ una función continua con $A$ cerrado y acotado (y por tanto compacto en $\mathbb{R}^n$). Entonces $f \,$ alcanza su mínimo y máximo en $A.$

En otros espacios métricos puede generalizarse como sigue:

Proposición: Sea $f:A \to \mathbb{R}$ una función continua con $A$ espacio métrico compacto y $\mathbb{R}$ con la métrica usual. Entonces $f$ alcanza su mínimo y máximo en $A$, es decir, existen puntos $x_1$ y $x_2$ en $A$ tales que para toda $x \in A$ se cumple que:
$$f(x_1) \leq x \leq f(x_2)$$

Demostración:
Si $A$ es compacto, la proposición anterior nos muestra que $f(A)$ es cerrado y acotado. Sea $m_0= inf\{f(x):x \in A\}$. Entonces $m_0 \in \overline{f(A)}$ y como $f(A)$ es cerrado, se concluye que $m_0 \in f(A)$, de modo que existe $x_1 \in A$ tal que $f(x_1)=m_0 \, $ por lo tanto $f$ alcanza su mínimo en $A$.

La demostración de que $f$ alcanza su máximo es análoga y se deja como ejercicio.

Proposición: Sean $(X,d_X)$ y $(Y,d_Y)$ espacios métricos con $X$ compacto y $\phi:X \to Y$ inyectiva y continua. Entonces existe la función inversa $\phi^{-1}$ en $\phi(X)$ y es continua en $\phi(X)$.

Demostración:
Para demostrar que $\phi^{-1}:\phi(X) \to X$ es una función continua, basta probar que la imagen inversa de esta función aplicada en conjuntos cerrados en $X$, es un conjunto cerrado en $Y$. Si $A$ es cerrado en $X$ entonces la imagen inversa respecto a la función $\phi^{-1}$ está dada por $\phi(A)$. Como $A$ es cerrado en un compacto entonces es compacto, de modo que $\phi(A)$ también es compacto y, por lo tanto, es cerrado en $Y$. Esto prueba que $\phi^{-1}$ es continua.

Finalizaremos esta entrada presentando un resultado que se deduce del anterior. La solución se propone como ejercicio al lector:

Proposición: Si $\phi:X \to Y$ es una función biyectiva y continua entre espacios métricos compactos, entonces es un homeomorfismo.

$\phi$ es un homeomorfismo

Más adelante…

Continuaremos visualizando aplicaciones de funciones continuas sobre conjuntos compactos, pero esta vez bajo una nueva definición: la continuidad uniforme.

Tarea moral

  1. Como parte de la prueba de la primera proposición, muestra que en efecto $\{\phi ^{-1}(A_i):i \in \mathcal{I}\}$ es una cubierta abierta de $A$.
  2. Argumenta la parte de la demostración de la primera proposición, en la que se afirma que si $A \subset \underset{1\leq j \leq m}{\bigcup}\phi ^{-1}(A_{i_j}),$ entonces $\{A_{i_1},A_{i_2},…,A_{i_m}\}$ es una subcubierta en $Y$ de $\mathcal{C}$ para $\phi (A)$.
  3. Prueba que si $f:A \to \mathbb{R}$ es una función continua con $A \subset \mathbb{R}^n$ cerrado y acotado, entonces $f$ alcanza su máximo en $A.$
  4. Prueba que si $X$ y $Y$ son homeomorfos, entonces $X$ es compacto si y solo si $Y$ es compacto.
  5. Demuestra que si $\phi:X \to Y$ es una función biyectiva y continua entre espacios métricos compactos, entonces es un homeomorfismo.

Enlaces

El Método de los Mínimos Cuadrados.

Por Angélica Amellali Mercado Aguilar

El método de los mínimos cuadrados

El método de mínimos cuadrados se aplica para ajustar rectas a una serie de datos presentados como punto en el plano.
Suponagamos que se tienen los siguientes datos para las variables $x$,$y$.

Esta situación se puede presentar en estudios experimentales, donde se estudia la variación de cierta magnitud x en función de otra magnitud y. Teóricamente es de esperarse que la relación entre estas variables sea lineal, del tipo
$$y=mx+b$$
El método de mínimos cuadrados nos proporciona un criterio con el cual podremos obtener la mejor recta que representa a los puntos dados. Se desearía tener
$$y_{i}=mx_{i}+b$$
para todos los puntos $(x_{i},y_{i})$ de $i=1,…,n$. Sin embargo, como en general
$$y_{i}\neq mx_{i}+b$$
se pide que la suma de los cuadrados de las diferencias (las desviaciones)
$$y_{i}-(mx_{i}+b)$$
sea la menor posible.

Se requiere
$$S=(y_{1}-(mx_{1}+b))^{2}+(y_{2}-(mx_{2}+b))^{2}+\cdots+(y_{n}-(mx_{n}+b))^{2}$$
$$=\sum_{i=1}^{n}(y_{i}-(mx_{i}+b))^{2}$$
sea lo más pequeña posible. Los valores de m y b que cumplan con esta propiedad, determinan la recta
$$y=mx+b$$
que mejor representa el comportamiento lineal de los puntos $(x_{i},y_{i})$

Consideremos entonces la función f de las variables m y b dada por
$$f(m,b)=\sum_{i=1}^{n}(y_{i}-(mx_{i}+b))^{2}$$
donde los puntos críticos de esta función se obtienen al resolver el sistema
$$\frac{\partial f}{\partial m}=\sum_{i=1}^{n}2(y_{i}-(mx_{i}+b))(-x_{i})=2\sum_{i=1}^{n}x_{i}(y_{i}-(mx_{i}+b))=0$$
$$\frac{\partial f}{\partial b}=\sum_{i=1}^{n}2(y_{i}-(mx_{i}+b))(-1)=-2\sum_{i=1}^{n}(y_{i}-(mx_{i}+b))=0$$
De la segunda ecuación obtenemos
$$\sum_{i=1}^{n}y_{i}-m\sum_{i=1}^{n}x_{i}-\sum_{i=1}^{n}b=0$$
de donde
$$b=\frac{1}{n}\sum_{i=1}^{n}y_{i}-m\left(\frac{1}{n}\sum_{i=1}^{n}x_{i}\right)$$
Llamemos
$$\overline{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}$$
$$\overline{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}$$
que son las medias aritméticas de los valores $x_{i},~y_{i}$ respectivamente. Entonces
$$b=\overline{y}-m\overline{x}$$

sustituyendo en la ecuación
$$\frac{\partial f}{\partial m}=0$$
nos queda
$$\sum_{i=1}^{n}x_{i}(y_{i}-mx_{i}-(\overline{y}-m\overline{x}))=0$$
de donde se obtiene
$$m=\frac{\sum_{i=1}^{n}x_{i}(y_{i}-\overline{y})}{\sum_{i=1}^{n}x_{i}(x_{i}-\overline{x})}$$
En resumen, la función
$$f(m,b)=\sum_{i=1}^{n}(y_{i}-(mx_{i}+b))^{2}$$
tiene un único punto crítico para
$$m=\frac{\sum_{i=1}^{n}x_{i}(y_{i}-\overline{y})}{\sum_{i=1}^{n}x_{i}(x_{i}-\overline{x})},~~~b=\overline{y}-m\overline{x}$$
Ahora vamos a verificar que en dicho punto crítico se alcanza un mínimo local, para lo cual recurrimos a nuestro criterio de la segunda derivada, en este caso
$$\frac{\partial^{2} f}{\partial m^{2}}=-2\sum_{i=1}^{n}-x_{i}^{2}=2\sum_{i=1}^{n}x_{i}^{2}$$
$$\frac{\partial^{2} f}{\partial m \partial b}=-\sum_{i=1}^{n}-x_{i}=2\sum_{i=1}^{n}x_{i}$$
$$\frac{\partial^{2} f}{\partial b^{2}}=-2\sum_{i=1}^{n}(-1)=2n$$

Tenemos que
$$\frac{\partial^{2} f}{\partial m^{2}}>0$$
Por otro lado
$$\left(2\sum_{i=1}^{n}x_{i}\right)^{2}-\left(2\sum_{i=1}^{n}x_{i}^{2}\right)(2n)<0$$
esta desigualdad es equivalente a
$$\left(\sum_{i=1}^{n}x_{i}\right)^{2}<n\sum_{i=1}^{n}x_{i}$$
La cual no es mas que la desigualdad de Cauchy-Schwarz aplicada a los vectores $(1,1,…,1)$ y $(x_{1},x_{2},…,x_{n})$ de $\mathbb{R}^{n}$. Por lo que la función f posee un mínimo local en el punto punto crítico dado.

Ejemplo. Se obtuvieron experimentalmente los siguientes valores de las variables x, y, los cuales se sabe que guardan entre sí una relación lineal

Vamos a encontrar la recta que mejor se ajusta a estos datos, según el método de mínimos cuadrados se tiene
$$\overline{x}=\frac{1+2+3+4}{2}=2.5$$
$$\overline{y}=\frac{1.4+1.1+0.7+0.1}{4}=0.825$$
Aplicando la fórmula obtenida para m y b obtenemos
$$m=\frac{\sum_{i=1}^{n}x_{i}(y_{i}-\overline{y})}{\sum_{i=1}^{n}x_{i}(x_{i}-\overline{x})}=\frac{1(1.4-0.825)+2(1.1-0.825)+3(0.7-0.825)+4(0.1-0.825)}{1(1-2.5)+2(2-2.5)+3(3-2.5)+4(4-2.5)}$$
$$=\frac{-2.15}{5}=-0.43$$
$$b=\overline{y}-m\overline{x}=0.825-(0.43)(2.5)=1.9$$

por lo que la recta que mejor ajusta los datos proporcionados

La suma de las diferencias de la recta y real con la y predicha por la ecuación obtenida es
$$-0.07+0.06+0.09-0.08=0$$
Es decir nuestra recta efectivamente compensa los puntos que quedaron por encima con puntos que quedaron por debajo. Gráficamente esto se ve.

La mejor recta que ajusta los datos del ejemplo.

Geometría Moderna II: Puntos autocorrespondientes y regla geométrica de la falsa posición

Por Armando Arzola Pérez

Introducción

Se seguirá viendo resultados y problemas relacionados con la razón cruzada, en esta entrada se abordará los Puntos autocorrespondientes y la regla geométrica de la falsa posición.

Puntos Autocorrespondientes

Sean $A,B,C$ y $A’,B’,C’$ dos conjuntos de puntos en una misma línea recta, por ende para un punto cualquiera $D$ en la recta le corresponde un punto $D’$ que nos dará como resultado $\{ ABCD \}=\{ A’B’C’D’ \}$.

Problema. El problema cae en la siguiente incógnita ¿Existirá un punto $D$ que se corresponda al mismo?, de tal forma que $\{ ABCD \}=\{ A’B’C’D \}$.

Demostraremos que puede haber uno, dos o ningún punto, a este punto existente se le llamará punto autocorrespondiente con respecto a las dos razones cruzadas.

Solución. Trácese cualquier circunferencia en el plano y tómese un punto $X$ en esta, y únanse los puntos $A,B,C,A’,B’,C’$ a $X$, y las intersecciones con la circunferencia y estas rectas se denotarán como $A_1, B_1, C_1, A_1′, B_1′, C_1’$.

Puntos autocorrespondientes 1

Notese que tenemos un hexagono inscrito con lados $A_1C_1’$, $A_1B_1’$, $C_1A_1’$, $B_1C_1’$, $B_1A_1’$, $B_1’C_1$, y la existencia del punto $D$ depende de que este hexágono cumpla el Teorema de Pascal.
El Teorema de Pascal dice que «Los puntos de intersección de los lados opuestos de un hexágono inscrito en una circunferencia son colineales». Es de esta forma que la intersección de $A_1B_1’$ y $A_1’B_1$ se cortan en $P$, $B_1’C_1$ y $B_1C_1’$ en $Q$, $A_1C_1’$ y $A_1’C_1$ en $R$, de esta forma se tiene la recta $PQ$ la cual corta a la circunferencia en $D_1$ y $E_1$.

Puntos autocorrespondientes 2

Ahora las rectas $XD_1$ y $XE_1$ cortarán la recta de los haces en los puntos $D$ y $E$ correspondientemente, estos son los dos puntos buscados. Sea $S$ la intersección de $PQ$ con $A_1A_1’$.

Puntos autocorrespondientes 3

Entonces se tienen las siguientes igualdades:

$\{ ABCD \}=X\{ A_1B_1C_1D_1\}$

por propiedad 1 de razón cruzada de la circunferencia se tiene:

$X\{ A_1B_1C_1D_1\}=A_1’\{ A_1B_1C_1D_1\}$

Por razón cruzada se tiene:

$A_1’\{ A_1B_1C_1D_1\}=\{SPRD_1\}= A_1\{ A_1’B_1’C_1’D_1 \}$

Por razón cruzada por la circunferencia:

$A_1\{ A_1’B_1’C_1’D_1 \} = X\{ A_1’B_1’C_1’D_1\} = \{ A’B’C’D \}$

Por lo tanto, $\{ ABCD \}=\{ A’B’C’D \}$ y es equivalente para $E$.

$\square$

Ahora, si $PQ$ es tangente a la circunferencia, solo existirá un punto autocorrespondiente, y si la recta $PQ$ no corta a la circunferencia, entonces no existe ningún punto autocorrespondiente.

Regla geométrica de la falsa posición

Esta regla viene del siguiente problema:

Problema. Construir un triángulo el cual sus lados pasan por los vértices de un triángulo dado y cuyos vértices se encuentran en los lados de otro triángulo dado.

Solución. El triángulo a encontrar debe tener sus lados, los cuales deben pasar por los vértices del triángulo $PQR$, y sus vértices en los lados del triángulo $ABC$.

Falsa posición 1

Sea un punto $D$ en $QR$, trácese $DA$ que corte a $PR$ en $E$, $EB$ que corte $PQ$ en $F$, y $FC$ que corte a $QR$ en $D’$, si $D$ y $D’$ son el mismo ya tendríamos el triángulo buscado. Por lo cual se vuelve a hacer lo mismo para $D_1$ obteniendo $D_1’$ y $D_2$ obteniendo $D_2’$, si estos son puntos iguales ya lo tendríamos resuelto, pero no es así, por ende se construirán los puntos autocorrespondientes a partir de $D,D_1,D_2,D’,D_1′,D_2’$.
Si estos puntos $M$ y $N$ existen, y pasamos por uno de ellos, en este caso $M$ para construir el triángulo buscado, nos daríamos cuenta de que regresamos a $M$ y estaría solucionado, pero como menciones estos triángulos existen si existen los puntos autocorrespondientes.

Falsa posición 2

$\square$

Más adelante…

Se verán tres teoremas importantes respecto al tema de Razón Cruzada, los cuales son Teoremas de Pascal, Brianchon y Pappus.

Entradas relacionadas