Álgebra Moderna I: Subgrupos

Por Cecilia del Carmen Villatoro Ramos

(Trabajo de titulación asesorado por la Dra. Diana Avella Alaminos)

Introducción

Ya vimos la definición de un grupo. Es un conjunto con una operación binaria que se comporta «bien», es decir, que es asociativa, tiene un neutro y tal que todo elemento tiene un inverso.

Ahora nos interesa trabajar con una subcolección de $G$, llamémosla $H$. Estudiaremos qué se necesita para que $H$ sea un grupo en sí mismo. La idea es trabajar con la misma operación de $G$, pero ahora usando sólo los elementos de $H$. Para que la operación $*$ siga siendo binaria en $H$, necesitamos que $*$ sea cerrada en $H$. Además, necesitamos que el neutro de $G$, $e_G$, sea elemento de $H$. Porque si $e_G$ deja fijos a todos los elementos de $G$, en particular deja fijos a todos los elementos de $H$. Y la tercera condición es la de los inversos, para todo elemento en $H$, su inverso también debe estar en $H$. La asociatividad, se «hereda» al restringir la operación $*$ a $H$. De esta manera, nos podremos olvidar de $G$ y concentrarnos en $H$.

En esta entrada veremos la definición formal de subgrupos y algunos ejemplos para que quede más clara la definición y la utilidad de definir un grupo dentro de otro.

Definiendo a los subgrupos

Comencemos con la definición formal de subgrupos.

Definición. (Subgrupo)
Sea $G$ un grupo, $H$ subconjunto de $G$. Decimos que $H$ es un subgrupo de $G$ si cumple lo siguiente:

  1. El neutro $e_G$ de $G$ está en $H$, es decir, $e_G \in H$.
  2. $H$ es cerrado con la operación, es decir si $a, b \in H$, entonces, $ab\in H$.
  3. Todo elemento de $H$ tiene su inverso en $H$. Es decir, si $a \in H$, entonces $a^{-1} \in H$.

Notación. $H \leq G$ denotará que $H$ es subgrupo de $G$.

Ejemplos.

  1. Si $G$ es un grupo, $\{e\}$ y $G$ son subgrupos de $G$. Puede haber muchos más, pero al menos esos dos seguro son subgrupos.
  2. Sea $X$ un conjunto, $\cS_X = \{f:X \to X | \; f \text{ es biyectiva en } G\}$ es un grupo con la composición.
    Dado $x_0 \in X$ consideramos todos los elementos de $\cS_X$ que dejan fijo a $x_0$
    $\{f \in \cS_X \;|\; f(x_0) = x_0\}$. Este es un subgrupo de $\cS_X$.
  3. Consideremos $(\z, +)$ y su subconjunto $\{n \in \z \;|\; n \text{ es múltiplo de } 2\} \leq \z$.
    Podemos generalizarlo, dado $m\in\z$ consideremos el conjunto de todos los múltiplos de $m$. Este conjunto se denota como $m\z := \{n \in \z \;|\; n \text{ es múltiplo de } m\} \leq \z$ y se tiene que $m\z \leq \z$.

Caracterizaciones de los subgrupos

Observación 1. Dado $G$ un grupo y $H$ un subconjunto de $G$, $H$ es un subgrupo de $G$ si y sólo si

  1. $H \neq \emptyset$.
  2. Si $a,b\in H$, entonces $ab^{-1}\in H$.

Demostración. La demostración quedará como ejercicio.

Observación 2. Dado $G$ un grupo, $H$ un subconjunto de $G$, $H$ es un subgrupo de $G$ si y sólo si $H$ es un grupo con la operación restringida a $H$.

Demostración.

$|\Rightarrow)$ Supongamos que $H \leq G$.

Por el inciso 2 de la definición de subgrupo, la operación es cerrada en $H$, entonces es una operación binaria en $H$.

Por el inciso 1 de la definición, $e_G \in H$, y sabemos que $e_G * a = a * e_G$ para toda $a \in G$. En particular $e_G * a = a * e_G$ para toda $a \in H$. Así $e_G$ es neutro en $H$.

Sea $a\in H$, por el inciso 3 de la definición de subgrupo, $a^{-1}\in H$, es decir el inverso de $a$ en $G$ está en $H$, entonces existe $a^{-1} \in H$ tal que $aa^{-1} = a^{-1}a = e_G = e_H$, y así $a^{-1}$ es el inverso de $a$ en $H$.

Por lo tanto, $H$ es un grupo con la operación restringida.

$\Leftarrow |)$ Supongamos que $H$ es un grupo con la operación restrigida. Entonces, $H$ tiene un neutro $e_H \in H$.

Aquí hay que hacer una observación. En principio no sabemos que el neutro de $G$ y el neutro de $H$ son el mismo, porque $e_H$ es un neutro restringido a $H$ y puede no serlo fuera del subconjunto. Además, que sean distintos no rompe la unicidad del neutro ya que $e_H$ es el neutro en $H,$ no en $G$ así que no estamos hablando de dos neutros distintos en $G;$ y si $e_G$ es el neutro en $G,$ pero $e_G \not\in H,$ de nuevo no se rompe la unicidad pues sólo hay un neutro en $H$. Así, lo primero que tenemos que demostrar, es que $e_H = e_G$. Las siguientes operaciones las realizaremos en $G$, porque no podemos asegurar que $e_G$ es un elemento de $H$.

$\begin{align*}
e_H e_G &= e_H & e_G \text{ es neutro en } G \\
&= e_H e_H & e_H \text{ es neutro en } H
\end{align*}$

Entonces $e_H e_G = e_H e_H$ y por la cancelación en $G$, $e_G = e_H$. Así $e_G \in H$.

Sean $a,b \in H$. Como $H$ es un grupo con la operación restringida, esta operación es una operación binaria en $H$ y por tanto cerrada. Así $ab\in H$.

Sea $a\in H$, como $H$ es un grupo con la operación restringida, $a$ tiene un inverso en $H$, digamos $\hat{a} \in H$, tal que $a \hat{a} = \hat{a} a = e_H$.

Sea $a^{-1}$ el inverso de $a$ en $G$, entonces $aa^{-1} = a^{-1}a = e_G$. Como $e_H = e_G$

$\begin{align*}
a \hat{a} &= a a^{-1}\\
\hat{a} &= a^{-1} & \text{por la ley de cancelación en } G
\end{align*}$

Así $a^{–1} \in H$.

Por lo tanto $H \leq G$.

$\blacksquare$

Caracterización de subgrupos finitos

Ya teniendo la definición de subgrupo, podemos considerar sólo subconjuntos finitos de un grupo $G$. En este caso basta pedir sólo dos condiciones al subconjunto para que sea un subgrupo: que sea no vacío y que sea cerrado bajo la operación.

Proposición. Sea $G$ un grupo, $H$ un subconjunto finito de $G$, no vacío. $H$ es un subgrupo de $G$ si y sólo si $ab \in H \quad \forall a,b \in H$.

Demostración. Sea $G$ un grupo. Consideremos $H$ un subconjunto finito no vacío de $G$.

$|\Rightarrow)$ Supongamos que $H\leq G$, entonces se cumple la definición de subgrupo. En particular se cumple el inciso 2, es decir, el producto en $H$ es cerrado.

$\Leftarrow|)$ Supongamos que el producto en $H$ es cerrado.
Como $H\neq \emptyset$ consideremos $h \in H$.

Como el producto de $H$ es cerrado, tenemos que $h^n \in H$ para toda $n \in \z^+$. Entonces los elementos de la lista: $h, h^2, h^3, \cdots$ están en $H$, y como $H$ es finito debe haber repeticiones.

Sean $l, m \in \z^+$ con $l < m$ tales que $h^l = h^m$. Como $h^l \in G$ consideremos su inverso $h^{-l} \in G$. Multiplicando por $h^{-l}$ tenemos que

$h^m h^{-l} = h^l h^{-l} = e_G$

Por las leyes de los exponentes

$h^{m-l} = e_G\quad$ con $\; m-l \in \z^+$

Recordemos que $h^n \in H$ para toda $n \in \z^+$, entonces $e_G \in H$.
Además, $h h^{m-l-1} = e_G$. Entonces tenemos dos casos.
Si $m-l-1 = 0$, entonces $h=e_G\in H$ y $h$ es su propio inverso.
Si $m-l-1\in \z^+$, entonces $h^{m-l-1} \in H$, y como $h h^{m-l-1} = e_G$, entonces $h^{m-l-1}$ es el inverso de $H$.

Así $H$ es cerrado bajo inversos y por lo tanto $H$ es un subgrupo de $G$.

Tarea moral

  1. Demuestra que el ejemplo 2 de la definición de subgrupo efectivamente es un subrupo de $\cS_X$.
  2. Para que un subconjunto $H$ de un grupo $G$ sea un subgrupo ¿es necesario pedir que $H$ tenga al neutro o se puede deducir de la condición de cerradura bajo producto y de la cerradura de los inversos?
  3. Demuestra la observación 1.
  4. Prueba o da un contraejemplo: un subconjunto $H$ de un grupo $G$ es un subgrupo si y sólo si $H$ es no vacío y para cualesquiera dos elementos $a,b \in H$ se tiene que $ab \in H$.
  5. De acuerdo las definiciones en los ejemplos importantes de matrices, prueba que
    • $SL(2, \r) \leq GL(2,\r)$
    • $GL(2, \mathbb{Q}) \leq GL(2,\r)$
  6. Investiga lo que es el diagrama reticular o diagrama de Hasse de los subgrupos de un grupo.

Más adelante…

En la siguiente entrada seguiremos profundizando en los subgrupos. Especialmente analizaremos cuántas veces podemos multiplicar un elemento por sí mismo sin que se repita el resultado. En el caso en que se trate de un subgrupo finito el hecho de que existan repeticiones en las potencias de un elemento se puede justificar con los argumentos que se dieron en la prueba de la última proposición que vimos.

Entradas relacionadas

Geometría Analítica I: Aplicaciones a más dimensiones

Por Elsa Fernanda Torres Feria

Introducción

Hasta ahora, describimos la recta de distintas maneras en el espacio $\mathbb{R}^2$. A partir de esto, es posible ampliar esas definiciones de recta al espacio $\mathbb{R}^n$, en especial a $\mathbb{R}^3$. Para este último caso, de manera escrita lo único que tendríamos que hacer sería establecer los puntos que definen a la recta dentro de $\mathbb{R}^3$; en la parte geométrica, estamos agregando una dimensión más al graficar, por lo que tenemos más opciones aún.

En esta entrada ampliaremos esas definiciones de recta al espacio vectorial $\mathbb{R}^3$ y el siguiente paso será definir el plano en este mismo espacio a partir de las definiciones mencionadas al inicio de este párrafo.

Rectas en $\mathbb{R}^3$

Comencemos esta entrada redefiniendo la recta en el espacio $\mathbb{R}^3$ a partir de las dos definiciones que tenemos de este elemento hasta ahora.

Definición. Una recta en forma paramétrica en $\mathbb{R}^3$ consiste de tomar un punto $P \in \mathbb{R}^3$ y otro punto (o vector) dirección $Q \in \mathbb{R}^3$ y considerar el conjunto

$L=\{ P+rQ : r \in \mathbb{R} \}$

Definición. Una recta en forma baricéntrica en $\mathbb{R}^3$ consta de tomar puntos distintos $P$ y $Q$ $\in \mathbb{R}^3$ y considerar al conjunto

$L=\{ rP+sQ : r,s \in \mathbb{R}, r+s=1 \}$

En el siguiente interactivo ponle Play a los delizadores para comprender mejor estas dos definiciones de recta en el espacio. Nota que $C$ es la definición paramétrica de la recta, cuyo parámetro es $a$; mientras que $F$ es la recta en forma baricéntrica que pasa por los puntos $A$ y $E$.

Si bien los deslizadores en este interactivo sólo corren de$-2$ a $2$, recuerda que tanto $a$ como $b$ $\in \mathbb{R}$.

En esta entrada comenzamos generalizando las definiciones de recta al espacio $\mathbb{R}^3. Por lo que (siguiendo esta lógica), el siguiente paso es plantear y trabajar la idea de un plano en el espacio.

Plano en forma paramétrica

Si el considerar un punto en $\mathbb{R}^3$ al cual se le suman múltiplos de un punto director (también en $\mathbb{R}^3$) obtenemos una recta en este espacio, ¿entonces qué necesitamos para describir un plano en el espacio?

Definición. Un plano en forma paramétrica en $\mathbb{R}^3$ consiste de tomar un punto $P \in \mathbb{R}^3$ y dos puntos dirección $Q, R \in \mathbb{R}^3$ y considerar el conjunto

$\Pi = \{ P+rQ+sR : r,s \in\mathbb{R} \}$

Para continuar, analicemos esta definición por partes con ayuda de lo que hemos descrito hasta ahora en esta entrada. Al tomar $r$ fijo en la parte de la definición dada por $rQ+sR$, obtenemos una recta que pasa por $rQ$ con dirección $R$; . De manera análoga, al tomar $s$ fijo, obtenemos una recta que para por $sR$ y tiene dirección $Q$.

Tomando a $Q=(-2,5,1)$ y a $R=(3,4,5)$ como ejemplo, usa los deslizadores en el siguiente interactivo para notar qué pasa cuando fusionas las dos ideas que acabamos de discutir, al establecer un punto $C=rQ+sR$ (con $r$ y $s$ en $\mathbb{R}$).

Ojalá hayas notado que al dejar correr ambos deslizadores, el rastro del punto $C$ describe un plano que claro pasa por $Q$ y $R$, pero pasa por otro punto definido más. Dentro del mismo interactivo, utiliza la herramienta Plano por tres puntos para definir el plano del que hablamos; deja correr los deslizadores y confirma con esto que el rastro de $C$ es este plano.

Para continuar con nuestro análisis, agreguemos la parte faltante al conjunto $\Pi$, el punto $P$. Ojalá recuerdes que en la descripción paramétrica de una recta, el punto que no tiene un parámetro multiplicando es el punto por el que pasa la recta, si ese punto no está, significa que la recta pasa por el origen. Esta idea se repite análogamente en el caso del plano.

En el análisis que acabamos de realizar, el plano descrito por $rQ+sR$, es el plano que tiene como dirección a $Q$ y a $R$ y además pasa por el origen. Al agregar $P$ a la expresión, lo que se obtiene es un plano paralelo al descrito anteriormente, pero esta vez pasa por $P$, es decir, a cada punto del plano $rQ+sR$ se le sumará el punto fijo $P$.

Plano en forma baricéntrica

Continuemos con la lógica que hemos seguido hasta ahora, con lo cual el siguiente paso es definir el plano en forma baricéntrica.

Definición. Un plano en forma baricéntrica en $\mathbb{R}^3$ consta de tomar los puntos $P$, $Q$, y $R$ y considerar el conjunto

$\Pi= \{ pP+qQ+rR : p,q,r \in \mathbb{R}$ y $p+q+r=1 \}$

Al definir el plano de esta manera, lo que debes imaginar es algo distinto a la primera definición que establecimos. Piensa a $\Pi$ como un plano que pasa por los puntos $P$, $Q$ y $R$.

El siguiente interactivo sólo es la ilustración de un plano en su forma baricéntrica.

Ahora que ya definimos de maneras distintas el plano en el espacio, lo más natural sería encontrar la equivalencia entre estas dos definiciones así como lo vimos al hablar de la recta, sólo que en este caso lo formalizaremos con una proposición.

Relación entre las expresiones de un plano

Proposición. Todo plano en forma paramétrica puede expresarse en forma baricéntrica y viceversa.

Lo que nos gustaría hacer para la demostración, sería mostrar que siempre se pueden encontrar $P’$, $Q’$ y $R’$ con los cuales se puede definir un plano en forma baricéntrica de tal manera que ese conjunto sea el mismo que el conjunto que define a un plano en forma paramétrica.

Demostración.

Parte 1: Partamos de un plano en su forma paramétrica al tomar $P,Q,R \in \mathbb{R}^3$ tal que

$\Pi=\{ P+rQ+sR :r,s \in \mathbb{R} \}$

En esta parte de la demostración, nuestro objetivo es encontrar tres puntos en $\Pi$ muy específicos con los cuales podemos describir el mismo plano pero en su forma baricéntrica.

Por lo anterior y yendo directo al grano, busquemos dos puntos en el plano. Si bien podemos escoger cualesquiera valores de $r$ y $s$ para determinar ciertos puntos en el plano, facilitaremos el álgebra al escoger casos particulares de valores para $r$ y $s$ y así obtener tres puntos «prácticos» en el plano que nos servirán para la forma baricéntrica de este. Los valores de los parámetros no serán tomados de manera aleatoria. Por lo que discutimos anteriormente, podemos definir ciertos puntos (en nuestra demostración $P$’, $Q$’ y $R$’) como combinaciones lineales puntuales de $P$, $Q$, $R$.

  1. El caso más sencillo es tomar $r=s=0$ y así obtener el punto $P$’$=P \in \Pi$.
  2. Si ahora $r=0$ y $s=1$, tenemos $R$’$=P+R$.
  3. Y si $r=1$ y $s=0$, obtenemos $Q$’$=P+Q$.

Ya que tenemos estos 3 puntos en $\Pi$, podemos definir el plano en su forma baricéntrica:

$\Pi$’$=\{pP$’$+qQ$’$+rR$’$ : p,q,r \in \mathbb{R}\}$

Para continuar, afirmamos que $\Pi=\Pi$’, y para comprobarlo, tenemos que checar que cada elemento en $\Pi$, está en $\Pi$’. La manera más sencilla de hacerlo, es tomar un elemento genérico de $\Pi$ (i.e. un elemento que «represente» a todos) y mostrar que está en $\Pi$’.

Tomemos un elemento de $\Pi$, es decir un vector de la forma $P+rQ+sR$.

Por Demostrar: Existen $a,b,c \in \mathbb{R}$, tales que $a+b+c=1$ y además

$P+rQ+sR=aP$’$+bQ$’$+cR$’

Encontremos entonces los valores de $a$,$b$, $c$.

Al sustituir los elementos primados, tenemos

\begin{align*}
P+rQ+sR&=aP+b(P+Q)+c(P+R) \\
&=aP+bP+bQ+cP+cR\\
&=(a+b+c)P+bQ+cR
\end{align*}

$\Rightarrow P+rQ+sR= (a+b+c)P+bQ+cR$

La igualdad nos lleva a un sistema de ecuaciones a partir del cual podremos obtener los valores de $a$, $b$, y $c$ para que esta se cumpla

\begin{align*}
a+b+c&=1 \\
b&=r \\
c&=s
\end{align*}

La primera condición ya cumple algo que queríamos y además, podemos despejar a $a=1-b-c$, que gracias a las otras igualdades que tenemos, conocemos su valor en términos de $r$ y $s$

$a=1-r-s$

Por lo que

$P+rQ+sR=(1-r-s)P+r(P+Q)+s(P+R)$

tal que $(1-r-s)+r+s=1$.

Hasta aquí, lo que hemos demostrado es que cualquier elemento en $\Pi$ lo podemos escribir como un elemento en $\Pi$’, esto es que $\Pi \subseteq Pi$’. Lo que sigue es realizar el camino contrario.

Ahora, lo que queremos es demostrar que $\Pi$’$\subseteq Pi$; para lo cual partiremos de un elemento en $\Pi$’ y buscaremos llegar a un elemento en $\Pi$.

Tomemos un elemento en $\Pi’$, esto es que es de la forma

$aP$’$+bQ$’$+cR$’$=aP+b(P+Q)+c(P+R)$

con $a+b+c=1$. Por medio de álgebra, queremos llegar a una expresión que represente un elemento de $\Pi$

\begin{align*}
aP+b(P+Q)+c(P+R) &= \\
&=aP+bP+bQ+cP+Cr \\
&=(a+b+c)P+bQ+cR \\
\end{align*}

Pero por hipótesis, $a+b+c=1$, por lo que

$=P+bQ+cR$

que efectivamente está en $\Pi$, pues es un elemento de la forma $P+rQ+sR$. Por lo que $\Pi$’ $\subseteq \Pi$.

$\therefore$ $\Pi \subseteq \Pi$’ y $\Pi$’ $\subseteq Pi$, entonces $\Pi=\Pi$’. Nota que concluimos esto partiendo de un plano en su forma paramétrica y al hacer el caso de la forma baricéntrica, utilizamos los puntos definidos a partir de la primera forma mencionada.

Parte 2. Para la parte 2, sólo te dare algunos consejos para que completes la demostración, pues es bastante parecida a lo que hicimos en la parte 1. Primero, tienes que partir del plano en su forma baricéntrica, es decir

$\Pi=\{ pP+qQ+rR : p+q+r=1 \text{ con }p,q,r \in \mathbb{R} \}$

Y buscar los puntos $P$’, $Q$’ y $R$’ tales que al tomar $P$’ como punto base y $Q$’ y $R$’ como direcciones, obtengas que $\Pi=\Pi’$.

Si realizas el procedimiento de la manera correcta, llegarás a que los puntos son :

\begin{align*}
P&=P’ \\
Q’&=Q-P \\
R’&=R-P
\end{align*}

Al completar esta segunda parte, entonces la demostración estará completa.

$\square$

Dimensiones mayores a 3

Para cerrar esta entrada, enunciaremos algunas definiciones que nos ayudarán en un futuro a definir cosas más complejas.

Definición. Sean $u_1$, $u_2$, $\dots$, $u_k$ puntos en $\mathbb{R}^n$. Sean $s_1$, $s_2$, $\dots$, $s_k$ números reales. A una expresión de la forma

$s_1u_2+s_2u_2+\dots+s_ku_k$

le llamamos una combinación lineal de $u_1$, $u_2$, $\dots$ $u_k$.

Ejemplo: Sea el espacio $\mathbb{R}^5$, una combinación lineal en este es

$-5(3,1,0,-2,7)+2(-3,6,8,1,9)+(-3)(3,9,0,-1,-2)$

Definición. A una combinación lineal en donde los coeficientes suman $1$, le llamamos una combinación afín. Esto es que

$s_1+s_2+\dots+s_k=1$

Ejemplo: La combinación del ejemplo anterior no es afín, pues

$-5+2+(-3)=-5+2-3=-8+2=-6 \neq 1$

Sin embargo, podemos obtener una combinación afín con los mismos vectores.

$-4(3,1,0,-2,7)+2(-3,6,8,1,9)+3(3,9,0,-1,-2)$

Es una combinación afín, pues

$-4+2+3=-4+5=1$

Definición. Al conjunto de todas las combinaciones lineales de ciertos vectores dados $u_1$, $u_2$, $\dots$ $u_k$ $\in \mathbb{R}^n$ se le conoce como el subespacio generado por $u_1$, $u_2$, $\dots$ $u_k$ y lo denotamos como

$\braket{u_1, u_2, \dots, u_k}$

esto es

$\braket{u_1, u_2, \dots, u_k}=\{ s_1u_2+s_2u_2+\dots+s_ku_k : s_1, \dots, s_k \in \mathbb{R} \}$

Veamos dos ejemplos de esta definición.

Ejemplo 1: Sea $v_1 \in \mathbb{R}^2$, $v_1 \neq 0$, el espacio generado por este vector es

$\braket{v_1}=\{ s_1v_1 : s_1 \in \mathbb{R} \}$

Ejemplo 2: Sea $v_1, v_2 \in \mathbb{R}^2$, $v_1 \neq 0$ y $v_2 \neq 0$, el espacio generado es

$\braket{v_1,v_2} = \{s_1v_1+s_2v_2 : s_1, s_2 \in \mathbb{R}\}$

Cerremos esta entrada con una última definición y su respectivo ejemplo.

Definición. Si $A$ es un subconjunto de $\mathbb{R}^n$y $p$ es un vector en $\mathbb{R}^n$, entonces el traslado de $A$ por el vector $p$ es el conjunto

$A+p=p+A= \{ x+p : x \in A \}$

Esta última definición nos es de utilidad para pasar de una recta o un plano que pasa por el origen a otro que pasa por cualquier punto $p$.

Ejemplo: Sea $\Pi=\{r(5,3,2)+s(-1,7,0): s,r \in mathbb{R}$ el plano que pasa por el origen y que tiene como vectores directores a $(5,3,2$ y $(-1,7,0)$. Entonces el traslado de $\Pi$ por $p=(-2,3,9)$ es el conjunto

\begin{align*}
p+\Pi&=\Pi+p=\Pi+(-2,3,9) \\
&=\{r(5,3,2)+s(-1,7,0)+(-2,3,9): s,r \in \mathbb{R}\}
\end{align*}

Más adelante

Con lo desarrollado en esta entrada seremos capaces de definir ciertos lugares geométricos ya no sólo en el plano, si no también en el espacio. Además, desarrollamos una intuición lógica para continuar construyendo lo que resta del curso.

Tarea moral

  • En el párrafo siguiente a la definición de un plano en el espacio:
    • ¿Cuál es el parámetro de la recta descrita al tomar $r$ fijo?
    • ¿Cuál es el parámetro de la recta descrita al tomar $s$ fijo?
  • Completa el interactivo de la sección Plano en el espacio al dibujar el plano definido por los puntos $Q$ y $R$ del interactivo y $P=(-3,2-6)$. Estarás en lo correcto si el plano que obtienes es paralelo al definido por $Q$, $R$ y el origen.
  • Completa la demostración de la proposición que trata la equivalencia entre las definiciones de plano en el espacio.
  • ¿Qué espacio geométrico define el primer ejemplo de subespacio generado? ¿y el ejemplo 2?
  • Da una expresión paramétrica para el plano que pasa por los puntos $P=(1,2,0)$, $Q=(1,0,1)$ y $R=(-1,0-2)$.

Probabilidad I-Videos: Axiomas de la probabilidad y propiedades

Por Aurora Martínez Rivas

Introducción

Anteriormente vimos que los eventos pueden verse como subconjuntos del espacio muestral , sin embargo, no necesariamente todos los subconjuntos del espacio muestral son eventos. En este video se analizaran varias definiciones que nos permitirán formalizar ideas que hasta el momento son muy vagas, entre estas las condiciones que se deben cumplir para poder hablar de un evento, una medida de probabilidad, un espacio de probabilidad y algunas propiedades elementales.

Axiomas de la probabilidad y propiedades

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE 104721: “Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM”. Sitio web del proyecto: https://www.matematicasadistancia.com.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Si $P(A)$ es la probabilidad de que un evento A ocurra, prueba que para $A_1,A_2,\ldots, A_n$ eventos, se cumple que: $\begin{multline*}P\left(\bigcup_{i=1}^{n}A_i\right)=\sum_{i=1}^{n}P\left(A_i\right)- \sum_{i<j\le n}P\left(A_i\bigcap A_j\right)+\\ \sum_{i<j<k\le n }P\left(A_i\bigcap A_j\bigcap A_k\right)+\ldots+\left(-1\right)^{n+1}P(A_1\bigcap A_2\bigcap\ldots\bigcap A_n)\end{multline*}$.
  • Muestra que $P\left(\bigcup_{i=1}^{n}A_i\right)\le\sum_{i=1}^{n}P\left(A_i\right)$.
  • Sean $A_r,\ \ r\geq1$, eventos tales que $P\left(A_r\right)=1$ para toda $r$. Prueba que $P\left(\bigcap_{r=1}^{\infty}A_r\right)=1$.
  • Prueba que $P\left(\bigcap_{i=1}^{\infty}A_i\right)\geq\ \sum_{i=1}^{n}P\left(A_i\right)-(n-1)$.
  • Prueba que $P\left(A\cap B\right)-P\left(A\right)P\left(B\right)=P\left(\left(A\cup B\right)^c\right)-P\left(A^c\right)P\left(B^c\right)$.

Más adelante…

Cuando nos interesa la probabilidad de un evento asociado a un experimento aleatorio, en ocasiones es necesario encontrar dicha probabilidad, dada la condición suplementaria de que ha ocurrido algún otro evento asociado al experimento aleatorio. Llamaremos a tales probabilidades condicionales, hablaremos más de estas en el siguiente video.

Entradas relacionadas

Probabilidad I: La Probabilidad Geométrica

Por Octavio Daniel Ríos García

Introducción

En la entrada pasada concluimos el estudio de algunas propiedades básicas de una medida de probabilidad. A partir de estas propiedades serás capaz de demostrar muchísimas otras más, que probablemente te encontrarás en tareas, exámenes o en las secciones de ejercicios de tus libros. Por el momento, sigamos con el contenido del curso.

Lo que sigue en el curso es ver tres enfoques de la probabilidad: la probabilidad geométrica, el enfoque frecuentista, y la definición clásica de la probabilidad. Así pues, en esta entrada veremos lo que corresponde a la probabilidad geométrica. Algunos aspectos para tratar con total formalidad este tema son más avanzados. Por ello, veremos este tema «por encima», omitiendo algunas formalidades.

Hay una sección en esta entrada cuyo título lleva un asterisco (*). Cuando las leas, no te preocupes si no entiendes las formalidades, lo importante es que entiendas los resultados.

Motivación de la probabilidad geométrica

Seguramente te ha tocado jugar o espectar algún juego de lanzar cosas. Por ejemplo, el lanzamiento de dardos, o el tiro con arco. La puntuación que obtienes en un juego de este tipo se basa en tu precisión. Es decir, tú arrojas o disparas un objeto hacia una superficie, y obtienes puntos basado en la región de esa superficie a la que le atinaste. Como ejemplo, está la diana de un juego de tiro con arco:

Figura. Diana del juego de tiro con arco. La puntuación que otorga cada región de la diana está indicada por un número dentro de dicha región.

Evidentemente, cuando estás jugando a los dardos o al tiro con arco, usas tu habilidad para intentar juntar la mayor puntuación posible. Sin embargo, podemos volverlo un tema probabilista. ¿Qué pasa si decidimos arrojar un dardo, o disparar una flecha al azar? En otras palabras, que dentro de la superficie dada, escojamos un punto al azar. ¿Cómo determinamos la probabilidad de que el punto elegido caiga dentro de una región dada?

Un primer modelo para acercarnos a este problema es trabajar en $\RR^{2}$, el plano euclidiano. Luego, tomar una región acotada de $\RR^{2}$, digamos, $\Omega$. Además, supondremos que el punto se elige de manera «uniforme» sobre la región $\Omega$. Es decir, que la probabilidad de cualquier subconjunto de $\Omega$ es proporcional a su «área». Por ejemplo, para modelar una diana, podemos tomar a $\Omega$ como un círculo.

Un poco sobre la medida y el σ-álgebra que se utiliza*

Por motivos de tiempo y prerrequisitos, no es posible tratar con mucho detalle la medida ni el σ-álgebra que usaríamos en $\RR^{2}$. Por ello, recomendamos que de esta sección extraigas las ideas y resultados, y que no hagas un esfuerzo excesivo por entender la formalidad. Lo que haremos es partir de los rectángulos en $2$ dimensiones, pues es fácil definir su área.


Definición. Un rectángulo bidimensional cerrado es un subconjunto $R \subseteq \RR^{2}$ de la forma

\[ R = [a_{1}, b_{1}] \times [a_{2}, b_{2}], \]

donde $a_{1}$, $b_{1}$, $a_{2}$ y $b_{2} \in \RR$. En consecuencia, el área de $R$ es

\[ \mu(R) = (b_{1} − a_{1})(b_{2} − a_{2}). \]


Consideraremos a $\emptyset$ como un rectángulo con $\mu(\emptyset) = 0$. Denotaremos al conjunto de todos los rectángulos bidimensionales cerrados por $\mathscr{R}(\RR^{2})$. Veremos muy por encima la manera en que se construye matemáticamente la noción de «área». Lo que haremos será aproximar el área de cualquier subconjunto $E$ de $\RR^{2}$ por afuera, a través del área de familias de rectángulos que contengan a $E$.


Definición. La medida exterior de Lebesgue $\mu^{*}(E)$ de un subconjunto $E \subseteq \RR^{2}$, es

\[ \mu^{*}(E) = \inf{\left\lbrace \sum_{k=1}^{\infty} \mu(R_{k}) \; \middle| \; E \subseteq \bigcup_{k=1}^{\infty}R_{k}, R_{k} \in \mathscr{R}(\RR^{2}) \right\rbrace}, \]

donde el ínfimo se toma sobre las familias numerables de rectángulos cuya unión contiene a $E$. La función $\mu^{*}\colon \mathscr{P}(\RR^{2} \longrightarrow [0, \infty]$ es llamada la medida exterior de Lebesgue.


Varios conceptos en la teoría de la medida reciben su nombre en honor a Henri Lebesgue, un importantísimo matemático francés que desarrolló toda una teoría de integración de funciones.

En la definición anterior, se admite que $\mu^{*}(E)$ valga $\infty$. Esto es algo que no nos preocupará mucho en la probabilidad geométrica, pero es importante tenerlo en cuenta. Así, la función $\mu^{*}$ nos da el área de cualquier región «agradable» de $\RR^{n}$, y la obtiene aproximando por afuera con rectángulos.

Figura. Representación visual de lo que hace $\mu^{*}$. Al ser el ínfimo, nos interesa la aproximación del área de la región más refinada posible a partir de rectángulos. Haz click aquí para ir a la fuente original de esta imagen.

Ahora, lo que nos interesa es conseguir un σ-álgebra sobre la que la medida exterior de Lebesgue sea, efectivamente, una medida. La siguiente es la definición de Carathéodory (pues fue formulada por el matemático griego Constantin Carathéodory) de medibilidad. Esto es, los conjuntos que satisfacen este criterio son a los que se les podrá medir su «área».


Definición. Un subconjunto $A \subseteq \RR^{2}$ es Lebesgue-medible si para cualquier subconjunto $E \subseteq \RR^{2}$ se cumple que

\[ \mu^{*}(E) = \mu^{*}(E \cap A) + \mu^{*}(E \cap A^{\mathsf{c}}). \]


Denotaremos al conjunto de todos los conjuntos Lebesgue-medibles en $\RR^{2}$ por $\mathcal{L}(\RR^{2})$. Esta condición puede interpretarse como que un conjunto es medible si divide a otros conjuntos de «buena» manera. Resulta que $\mathcal{L}(\RR^{2})$ es un σ-álgebra. Además, también se tiene que $\mu^{*}$ restringida a $\mathcal{L}(\RR^{2})$ es una medida (no de probabilidad, simplemente medida. Es lo mismo pero sin pedir que la medida de $\RR^{2}$ sea $1$). Así, se llega a la siguiente definición.


Definición. La función $\lambda\colon \mathcal{L}(\RR^{2}) \longrightarrow [0, \infty]$ definida como

\[ \lambda = \left.\mu^{*}\right|_{\mathcal{L}(\RR^{2})},\]

la restricción de $\mu^{*}$ a $\mathcal{L}(\RR^{2})$, es llamada la medida bidimensional de Lebesgue en $\RR^{2}$.


La medida de Lebesgue asigna a cada región $E \subseteq \mathcal{L}(\RR^{2})$ (las cuales son regiones «bonitas», a las que se les puede asignar un área, en el sentido de la definición de Lebesgue-medible) el valor $\lambda(E)$, que corresponde a su área.

Definición de la probabilidad geométrica

Así, si ahora tomamos alguna región de $\RR^{2}$ para la cual su área está bien definida, podemos construir una medida de probabilidad en la que la probabilidad de cada sub-región es proporcional a su área. Si $\Omega$ es un subconjunto acotado de $\RR^{2}$ que es Lebesgue-medible, entonces su área es finita. Más aún, podemos considerar a

\[ \mathcal{L}(\Omega) = \mathscr{P}(\Omega) \cap \mathcal{L}(\RR^{2}), \]

el conjunto de todos los subconjuntos de $\Omega$ que son Lebesgue-medibles, este es un σ-álgebra sobre $\Omega$. En consecuencia, podemos definir una medida, y dar lugar a un espacio de probabilidad.


Definición. Sea $\Omega \subseteq \RR^{2}$ un conjunto acotado y con área bien definida mayor a $0$. Sea $\mathcal{L}(\Omega)$ el conjunto de todos los subconjuntos de $\Omega$ con área bien definida. Se define la probabilidad geométrica $\mathbb{P}\colon \mathcal{L}(\Omega) \longrightarrow \RR$ como sigue. Para cada $A \in \mathcal{L}(\Omega)$, se define $\Prob{A}$ como

\[ \Prob{A} = \frac{\text{Area}(A)}{\text{Area}(\Omega)}.\]


En la definición anterior, el «área» de $A$, que denotamos por $\text{Area}(A)$, es precisamente $\lambda(A)$, la medida bidimensional de Lebesgue. No centres mucho tu atención en el uso de los conjuntos Lebesgue-medibles ni en la medida de Lebesgue. Nuestra intención es exhibir que la noción de «área» puede ser formalizada matemáticamente, y despertar tu interés por estudiar estos temas con más profundidad. Lo importante con lo que te debes de quedar es que, a cada subconjunto de $\Omega$ con área bien definida, se le asigna una probabilidad que es la proporción entre su área y el área de $\Omega$.

Esta medida de probabilidad asume que se cumple una propiedad llamada equiprobabilidad. Esto es, para cada $A \in \mathcal{L}(\Omega)$, no importa cuáles sean los elementos de $A$, lo único que importa para determinar su probabilidad es su área.

Un primer ejemplo de probabilidad geométrica

Ejemplo. Imagina que vas a tomar un autobús en una parada. Supongamos que tú y el autobús llegarán en tiempos aleatorios a la parada, entre las 12pm y la 1pm. Es decir, los tiempos de llegada tuyo y del autobús son valores $x$, $y \in [0,60]$, pues el tiempo (en minutos) entre las 12pm y la 1pm es de $60$ minutos. Además, supongamos que cuando el autobús llega, permanece en la parada $5$ minutos antes de irse; y cuando tú llegas, esperas $20$ minutos antes de irte si el autobús no llega. ¿Cuál es la probabilidad de que tomes el autobús?

Para resolver este problema, observa que $\Omega$ en este puede considerarse como

\[ \Omega = [0,60] \times [0,60] = \{ (x,y) \in \RR^{2} \mid x \in [0,60] \land y \in [0,60] \}, \]

y que dado un par ordenado $(x,y)$, $x$ es tu tiempo de llegada y $y$ es el tiempo de llegada del autobús. Gráficamente, todos los posibles resultados están dentro de un cuadrado:

Figura. Nuestro espacio muestral $\Omega = [0,60]\times [0,60]$.

Luego, tenemos que encontrar las regiones que corresponden al evento en el que tú y el autobús coinciden. Primero, sabemos que el autobús espera $5$ minutos después de llegar, por lo que tú debes de llegar dentro de esos $5$ minutos que espera. Es decir, $x$, tu tiempo de llegada, debe de ser menor o igual a $y + 5$. Así, $x \leq y + 5$, o equivalentemente, $y \geq x – 5$. Este sería un evento $A$, dado como sigue:

\[ A = \{ (x,y) \in \Omega \mid y \geq x – 5 \}. \]

Figura. El evento $A$ de todos los pares ordenados $(x,y)$ \in \Omega$ tales que $y \geq x – 5$.

Por otro lado, tú esperas el autobús por $20$ minutos, por lo que no puedes llegar más de $20$ minutos antes que el autobús. Es decir, $x$ debe de ser mayor o igual a $y − 20$. Así, $x \geq y − 20$, o equivalentemente, $y \leq x + 20$. Por ello, el evento $B$ que representa a esta situación es

\[ B = \{ (x,y) \in \Omega \mid y \leq x + 20 \}. \]

Figura. El evento $B$ de todos los pares ordenados $(x,y) \in \Omega$ tales que $y \leq x + 20$.

Intersecando ambas regiones obtenemos la región en donde tú y el autobús coinciden.

Figura. En todos los pares $(x,y) \in A \cap B$, el resultado es que tomas el autobús.

Y podemos utilizar la probabilidad geométrica para dar solución a este problema: la probabilidad de que tomes el autobús es el área de esta última región dividida entre el área total. Podemos utilizar la regla de complementación para facilitar el cálculo, pues las regiones en donde no tomas el autobús son triángulos y es más fácil calcular su área.

Figura. El área correspondiente a $(A \cap B)^\mathsf{c}$. Su área es más fácil de calcular que el área de $A \cap B$.

La región de arriba es un triángulo rectángulo cuyos catetos miden $40$, así que su área es $\frac{40^{2}}{2}$. De igual forma, la región de abajo es un triángulo rectángulo cuyos catetos miden $55$, por lo que su área es $\frac{55^{2}}{2}$. Por otro lado, el área de $\Omega$ es $60^2$, pues es un cuadrado cuyos lados miden $60$. Así, tenemos que

\begin{align*} \Prob{(A \cap B)^{\mathsf{c}}} &= \frac{\frac{40^{2}}{2} + \frac{55^{2}}{2}}{60^2} \\ &= \frac{40^{2} + 55^{2}}{(2)(60)^{2}} \\ &= \frac{1600 + 3025}{7200} \\ &= \frac{4625}{7200}. \end{align*}

Y como $\Prob{A \cap B} = 1 − \Prob{(A \cap B)^{\mathsf{c}}}$, tenemos que

\[ \Prob{A \cap B} = 1 − \frac{4625}{7200} = \frac{7200 + 4625}{7200} = \frac{2575}{7200} = \frac{103}{288} \approx 0.35764. \]

En conclusión, la probabilidad de que tomes el autobús es aproximadamente $0.35764$, o alternativamente, es aproximadamente un $35.764\%$.

El problema de la aguja de Buffon

En el siglo XVIII, el naturalista francés Georges-Louis Leclerc formuló un problema con un resultado muy interesante.

Supón que tenemos un piso hecho de bandas de madera, todas con la misma anchura, y dejamos caer una aguja al azar sobre el piso. ¿Cuál es la probabilidad de que la aguja caiga sobre la línea entre dos bandas?

Este problema es conocido como la aguja de Buffon en honor a su creador: Georges-Louis Leclerc, conde de Buffon. Una solución utilizando algunos hechos geométricos fue publicada por Joseph-Émile Barbier en 1860 para el caso en el que la longitud de la aguja es menor a la anchura de las tablas de madera. Para resolver este problema, sea $l$ la longitud de la aguja y sea $D$ el ancho de cada banda de madera. Asumiremos que $0 < l < D$.

Figura. Ilustración de las primeras variables en el problema. $l$ es la longitud de la aguja, y $D$ es la anchura de cada banda de madera. Las bandas se ilustran con colores alternados.

Ahora, sea $\theta$ el ángulo agudo que forma la aguja con el eje horizontal, y sea $x$ la distancia entre el centro de la aguja y la línea entre dos bandas más cercana.

Figura. Visualización de los valores $x$ y $\theta$. $\theta$ se toma siempre como el ángulo agudo que forma la aguja con el eje horizontal. Marcamos con rojo el centro de una aguja que no está sobre la línea entre dos bandas, y con verde el centro de una aguja que sí está sobre una línea.

Observa que la aguja cae sobre la línea entre dos bandas si y sólamente si $x \leq \frac{l \cos{\theta}}{2}$. Esto pasa porque $l \cos{\theta}$ es la distancia horizontal de la aguja, así que $\frac{l \cos{\theta}}{2}$ es la distancia entre el centro de la aguja y la proyección sobre el eje horizontal de sus extremos. Por lo tanto, si la distancia entre el centro de la aguja y la línea entre dos bandas más cercana es menor o igual a $\frac{l \cos{\theta}}{2}$, la aguja atraviesa esta línea.

Figura. Comparación de $x$ con $l \cos{\theta}$. Observa cómo en la aguja de la izquierda, $x > \frac{l \cos{\theta}}{2}$, mientras que en la de la derecha, $x \leq \frac{l \cos{\theta}}{2}$.

Ahora, asumimos que los valores de $x$ y $\theta$ son aleatorios. Además, se debe de cumplir que $0 < x < \frac{D}{2}$, pues $0 < l < D$ (así que la distancia a la línea entre bandas más cercana es menor a $\frac{D}{2}$); y además $0 < \theta < \frac{\pi}{2}$. Por lo tanto, el espacio muestral de este fenómeno puede verse como

\[ \Omega = {\left\lbrace (\theta, x) \in \RR^{2} \; \middle| \; 0 < \theta < \frac{\pi}{2} \land 0 < x < \frac{D}{2} \right\rbrace} = {\left(0, \frac{\pi}{2}\right)} \times {\left(0, \frac{D}{2}\right)} . \]

Y vimos que la aguja cae sobre la línea entre dos bandas si y sólamente si $x \leq \frac{l \cos{\theta}}{2}$, por lo que el evento $A$ que nos interesa es

\[ A = \left\lbrace (\theta,x) \in \Omega \; \middle| \; x \leq \frac{l \cos{\theta}}{2} \right\rbrace. \]

Observa que el área de $A$ se ve como en la siguiente figura:

Figura. Representación gráfica de $\Omega$ y del evento que nos interesa, $A$.

Así, el área de $A$ la podemos calcular integrando la función $\frac{l \cos{\theta}}{2}$ de $0$ a $\frac{\pi}{2}$. Así,

\begin{align*} \text{Area}(A) &= \int_{0}^{\frac{\pi}{2}} \frac{l}{2}\cos{\theta} \, \text{d}\theta \\ &= \frac{l}{2}\left[\sin{\frac{\pi}{2}} − \sin{0}\right] \\ &= \frac{l}{2}. \end{align*}

Por otro lado, el área de todo $\Omega$ es

\[ \text{Area}(\Omega) = \left(\frac{D}{2}\right)\left(\frac{\pi}{2} \right) = \frac{\pi D}{4}. \]

Así, se tiene que la probabilidad geométrica de $A$, $\Prob{A}$, es

\[ \Prob{A} = \frac{\text{Area}(A)}{\text{Area}(\Omega)} = \frac{\frac{l}{2}}{\frac{\pi D}{4}} = \frac{l}{2} \frac{4}{\pi D} = \frac{2l}{\pi D}. \]

Una consecuencia interesante de la solución a este problema es que la probabilidad resultante involucra a $\pi$, una constante matemática muy importante. Mucho más adelante veremos una forma curiosa de aproximar el valor de $\pi$ repitiendo el experimento de la aguja de Buffon muchas veces.

Tarea moral

Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu dominio de los conceptos abordados en esta entrada.

  1. Sea $\Omega \subseteq \RR^{2}$ un conjunto acotado y con área bien definida. Sea $\mathcal{L}(\Omega)$ el conjunto de todos los subconjuntos de $\Omega$ que son Lebesgue-medibles, y sea $\mathbb{P}\colon \mathcal{L}(\Omega) \longrightarrow \RR$ la probabilidad geométrica. Es decir, para cada $A \in \mathcal{L}(\Omega)$, se define $\Prob{A}$ como \[ \Prob{A} = \frac{\text{Area}(A)}{\text{Area}(\Omega)}.\]Explica por qué $(\Omega, \mathcal{L}(\Omega), \mathbb{P})$ es un espacio de probabilidad. En particular, como ya acordamos que $\mathcal{L}(\Omega)$ es un σ-álgebra, basta con que expliques por qué la probabilidad geométrica es una medida de probabilidad.
  2. Vuelve a hacer el ejercicio del autobús pero ahora supón que tú esperas al autobús durante $15$ minutos, y el autobús espera $7$ minutos.
  3. En el problema de la aguja de Buffon, explica por qué si $l < D$ (esto es, la longitud de la aguja es menor que la anchura de las bandas), podemos concluir que $x$ (la distancia entre el centro de la aguja y la línea entre dos bandas más cercana) es menor a $\frac{D}{2}$.
  4. Explica por qué si la longitud de la aguja $l$ es mayor a $D$ no podemos solucionar el problema de la forma en que lo hicimos.

Más adelante…

La probabilidad geométrica presenta una herramienta muy útil para dar solución a problemas con una interpretación espacial directa, como es el caso del problema de la aguja de Buffon. Además, resulta útil como una herramienta auxiliar para resolver ejercicios que no necesariamente tienen una interpretación visual directa, como el ejemplo del autobús. En conclusión, es una herramienta útil, pero que debes de tener cuidado con sus hipótesis: supone equiprobabilidad sobre el espacio muestral $\Omega$.

En la materia de Probabilidad II estudiarás a fondo la aleatoriedad en varias variables. Esto te dará herramientas más poderosas para describir la aleatoriedad sobre $\RR^2$ (y más allá) sin suponer que el espacio muestral es equiprobable.

Por lo pronto, en la siguiente entrada veremos un enfoque distinto de la probabilidad: la probabilidad frecuentista.

Entradas relacionadas

Cálculo Diferencial e Integral I: Límites laterales

Por Juan Manuel Naranjo Jurado

Introducción

En las entradas anteriores hemos trabajado con la definición de límite y revisamos sus propiedades. En esta ocasión, daremos la definición de límite por la derecha y límite por la izquierda, que en conjunto son llamados límites laterales. De igual forma, revisaremos algunos ejemplos y su relación con la definición vista anteriormente.

Límites laterales

Las definiciones que veremos a continuación se basan en restringir la forma en que nos acercamos a $x_0.$ El límite por la derecha se enfoca en acercarnos por la derecha, es decir, pediremos que $x > x_0,$ lo cual se traducirá en que debe cumplirse que $0<x-x_0 < \delta$. Por otro lado, para el límite por la izquierda debe cumplirse que $x < x_0,$ de esta forma se tendrá que $0<x_0-x< \delta.$ Primero daremos la definición de límite por la derecha.

Definición. Sean $A \subset \mathbb{R}$ y $f: A \rightarrow \mathbb{R}.$ Se dice que $L \in \mathbb{R}$ es límite por la derecha de $f$ en $x_0,$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que si $0<x-x_0<\delta$ entonces $|f(x)-L| < \varepsilon.$ Cuando $L$ es el límite de $f$ en el punto $x_0$ por la derecha, lo denotamos $$\lim_{x \to x_0+} f(x) = L.$$

Análogamente, tenemos la definición de límite por la izquierda.

Definición. Sean $A \subset \mathbb{R}$ y $f: A \rightarrow \mathbb{R}.$ Se dice que $L \in \mathbb{R}$ es límite por la izquierda de $f$ en $x_0,$ si para todo $\varepsilon >0$ existe $\delta > 0$ tal que si $0<x_0 – x<\delta$ entonces $|f(x)-L| < \varepsilon.$ Cuando $L$ es el límite de $f$ en el punto $x_0$ por la izquierda, lo denotamos $$\lim_{x \to x_0-} f(x) = L.$$

Propiedades de los límites laterales

De forma similar al teorema que vimos para los límites, existe una relación entre el límite lateral de una función y el límite de una sucesión, basta agregar a los supuestos la condición de que la sucesión sea mayor que $x_0$ para todo $n \in \mathbb{N}$ en el caso de límite por la derecha y que sea menor que $x_0$ para todo $n \in \mathbb{N}$ en el caso de límite por la izquierda.

Teorema. Sea $A \subset \mathbb{R}.$ Definimos la función $f:A \rightarrow \mathbb{R}.$ Entonces, dado un $x_0,$ los siguientes enunciados son equivalentes.

  1. $$\lim_{x \to x_0+} f(x) = L.$$
  2. Para toda sucesión $\{ a_n \}$ en $A$ que converge a $x_0$ y tal que $a_n > x_0$ para todo $n\in \mathbb{N},$ la sucesión $\{f(a_n)\}$ converge a $L.$

El teorema de límite por la izquierda es similar al anterior. Además, la demostración es totalmente análoga a la revisada en una entrada anterior por lo cual quedará como tarea moral. También recordemos que este teorema nos ayuda a determinar las propiedades que tienen los límites laterales debido a la herencia que nos brinda el límite de una sucesión; es gracias a ello que podremos hacer uso de tales propiedades en los siguientes ejemplos.

Ejemplo 1. Sea $f: \mathbb{R} \rightarrow \mathbb{R},$ definida de la siguiente forma

$$f(x) =
\begin{cases}
x^3+1 & \quad \text{si } x<-1 \\
x^2+1& \quad \text{si } x \geq -1. \\
\end{cases}
$$

Determina los límites laterales en $x_0 = -1.$

Primero mostraremos la gráfica de la función:

Calculando el límite por la izquierda, tenemos
$$\lim_{x \to -1^-} f(x) = \lim_{x \to -1^-} x^3+1 = 0.$$

Por otro lado, el límite por la derecha
$$\lim_{x \to -1^+} f(x) = \lim_{x \to -1^+} x^2+1= 2.$$

Por lo tanto
$$\lim_{x \to 0^-} f(x) = 0 \quad \text{ y } \quad \lim_{x \to 0^+} f(x) = 2.$$

Ejemplo 2. Sea $f: \mathbb{R} \setminus \{0 \} \rightarrow \mathbb{R}.$ Calcula los límites laterales en $x_0 = 0$ de

$$f(x) = \frac{|x|}{x}.$$

La gráfica de la función es la siguiente:

Calculando el límite por la izquierda, tenemos
\begin{align*}
\lim_{x \to 0^-} f(x) = & \lim_{x \to 0^-} \frac{|x|}{x} \\
= & \lim_{x \to 0^-} \frac{-x}{x} \text{, pues $x$ < 0} \\
= & \lim_{x \to 0^-} -1 \\
= & -1.
\end{align*}
Por otro lado, el límite por la derecha
\begin{align*}
\lim_{x \to 0^+} f(x) = & \lim_{x \to 0^+} \frac{|x|}{x} \\
= & \lim_{x \to 0^+} \frac{x}{x} \text{, pues $x$ > 0} \\
= & \lim_{x \to 0^+} 1 \\
= & 1.
\end{align*}
Por lo tanto
$$\lim_{x \to 0^-} f(x) = -1 \quad \text{ y } \quad \lim_{x \to 0^+} f(x) = 1.$$

De los ejemplos revisados, el primero tiene la propiedad de que sus límites laterales son iguales mientras que para el segundo y el tercero tales límites son distintos en $x_0.$

Relación entre el límite de una función y sus límites laterales

Parece inmediato inferir que, considerando un punto $x_0$ dado, si los límites por la izquierda y por la derecha existen y son iguales, entonces el límite de la función sí existe en tal punto. De la misma manera, resulta natural que si el límite existe, entonces los límites laterales también existen y son iguales. Probaremos esta equivalencia, pero para hacerlo, primero demostraremos la siguiente proposición.

Proposición. Sean $x,$ $x_0$ en $\mathbb{R}$ y $\delta >0.$ Entonces $0<|x-x_0|< \delta$ si y solo si $0<x-x_0<\delta \quad$ ó $\quad 0<x_0-x<\delta.$

Demostración.
Supongamos que $0<|x-x_0|< \delta$.

Caso 1: $x-x_0 > 0$.
Entonces $|x-x_0| = x-x_0$, así
\begin{gather*}
0<|x-x_0|< \delta \Leftrightarrow 0< x-x_0 < \delta.
\end{gather*}

Caso 2: $x- x_0 < 0$.
Entonces $|x-x_0| = x_0-x$, así
\begin{gather*}
0<|x-x_0| < \delta \Leftrightarrow 0< x_0-x < \delta.
\end{gather*}

$$\therefore 0<|x-x_0|< \delta \Leftrightarrow 0<x-x_0<\delta \quad \text{ ó } \quad 0<x_0-x<\delta.$$

$\square$

Teorema. El límite de una función $f$ en el punto $x_0$ existe y es igual a $L$ si y solo si los límites laterales existen y son iguales a $L$, es decir

$$\lim_{x \to x_0} f(x) = L \quad \Leftrightarrow \quad \lim_{x \to x_0^+} f(x) = L = \lim_{x \to x_0^-} f(x).$$

Demostración.

$\Rightarrow]$ Supongamos que $$\lim_{x \to x_0} f(x) = L.$$
Sea $\varepsilon > 0$. Como $f$ converge a $L$ en $x_0$, existe $\delta > 0$ tal que si $0<|x-x_0|< \delta$ se tiene que $|f(x)-L| < \varepsilon.$

Si $0<x-x_0 < \delta$, entonces $0<|x-x_0|< \delta$ por la proposición anterior. Se sigue que
\begin{gather*}
|f(x)-L| < \varepsilon. \\
\therefore \lim_{x \to x_0^+} f(x) = L.
\end{gather*}

Si $0<x_0-x < \delta$, entonces $0<|x-x_0|< \delta$ por la proposición anterior. Se sigue que
\begin{gather*}
|f(x)-L| < \varepsilon. \\
\therefore \lim_{x \to x_0^-} f(x) = L.
\end{gather*}

$\Leftarrow]$ Supongamos que $$\lim_{x \to x_0^+} f(x) = L = \lim_{x \to x_0^-} f(x)$$
Sea $\varepsilon > 0.$

Como $\lim\limits_{x \to x_0^+} f(x) = L$, existe $\delta_1$ tal que si $0<x-x_0<\delta_1$ entonces $|f(x)-L| < \varepsilon.$

Como $\lim\limits_{x \to x_0^-} f(x) = L$, existe $\delta_2$ tal que si $0<x_0-x<\delta_2$ entonces $|f(x)-L| < \varepsilon.$

Consideremos $\delta = min \{ \delta_1, \delta_2\}.$ Por la proposición, si $0<|x-x_0|< \delta$, entonces $0<x-x_0<\delta$ ó $0<x_0-x<\delta.$

Para el primer caso, tenemos que $0<x-x_0<\delta \leq \delta_1$, entonces $|f(x)-L| < \varepsilon.$
Para el segundo caso, se tiene que $0<x_0-x<\delta \leq \delta_2$, entonces $|f(x)-L| < \varepsilon.$

Por lo tanto $$\lim_{x \to x_0} f(x) = L.$$

$$\therefore \lim_{x \to x_0} f(x) = L \quad \Leftrightarrow \quad \lim_{x \to x_0^+} f(x) = L = \lim_{x \to x_0^-} f(x).$$

$\square$

Observación. Ya que hemos demostrado este teorema, podemos notar que si los límites laterales de una función son distintos en un punto $x_0$, entonces no existe el límite de la función en tal punto.

Finalizaremos esta entrada revisando los siguientes ejemplos.

Ejemplo 3. Determina si existe el límite en $x_0 = 0$ para la siguiente función $$f(x) = x \sqrt{\frac{1}{4x^2}-16}.$$

Veamos primero qué sucede con el límite por la izquierda
\begin{align*}
\lim_{x \to 0^-} f(x) = & \lim_{x \to 0^-} x \sqrt{\frac{1}{4x^2}-16} \\ \\
= & \lim_{x \to 0^-} x \sqrt{\frac{1-64x^2}{4x^2}} \\ \\
= & \lim_{x \to 0^-} \frac{ x \sqrt{1-64x^2} }{ \sqrt{4x^2} } \\ \\
= & \lim_{x \to 0^-} \frac{ x \sqrt{1-64x^2} }{ 2|x|} \\ \\
= & \lim_{x \to 0^-} \frac{ x \sqrt{1-64x^2} }{ -2x} \text{, pues $x$ < 0} \\ \\
= & \lim_{x \to 0^-} – \frac{\sqrt{1-64x^2} }{2} \\ \\
= & – \frac{1}{2}.
\end{align*}

De forma similar, tenemos que
\begin{align*}
\lim_{x \to 0^+} f(x) = & \lim_{x \to 0^+} x \sqrt{\frac{1}{4x^2}-16} \\ \\
= & \lim_{x \to 0^+} x \sqrt{\frac{1-64x^2}{4x^2}} \\ \\
= & \lim_{x \to 0^+} \frac{ x \sqrt{1-64x^2} }{ 2x} \text{, pues $x$ > 0} \\ \\
= & \lim_{x \to 0^+} \frac{\sqrt{1-64x^2} }{2} \\ \\
= & \frac{1}{2}.
\end{align*}
$$\therefore \lim_{x \to 0^-} f(x) = -\frac{1}{2} \quad \text{ y } \quad \lim_{x \to 0^+} f(x) = \frac{1}{2}.$$

Como los límites laterales son distintos, podemos concluir que el límite de la función $f$ no existe en el punto $x_0 = 0.$

Ejemplo 4. Sea $f: \mathbb{R} \rightarrow \mathbb{R}$, definida de la siguiente forma
$$f(x) =
\begin{cases}
x^2 & \quad \text{si } x<5 \\
2x+15 & \quad \text{si } x \geq 5. \\
\end{cases}
$$
Determina si el límite existe en $x_0 = 5.$

Iniciemos calculando el límite por la izquierda.
$$\lim_{x \to 5^-} f(x) = \lim_{x \to 5^-} x^2 = 25.$$

Por otro lado, el límite por la derecha
$$\lim_{x \to 5^+} f(x) = \lim_{x \to 5^+} 2x+15 = 25.$$

Por lo tanto
$$\lim_{x \to 0^-} f(x) = 25 \quad \text{ y } \quad \lim_{x \to 0^+} f(x) = 25.$$

Como los límites laterales existen y son iguales, podemos concluir que
$$\lim_{x \to 0} f(x) = 25.$$

Más adelante…

¿Qué sucede cuando en lugar de acercarnos a un punto en particular $x_0$, hacemos que $x$ crezca indefinidamente? Esto y otras ampliaciones del concepto del límite serán revisadas en la siguiente entrada con lo cual estaremos listos para calcular todo tipo de límites y, con ello, podremos conocer el comportamiento que toman las funciones tanto en un punto específico como «en el infinito».

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Demuestra que
    $i$) $\lim_\limits{x \to 0^+} f(x) = \lim_\limits{x \to 0^-} f(-x).$
    $ii$) $\lim_\limits{x \to 0} f(|x|) = \lim_\limits{x \to 0^+} f(x).$
  • Usando la definición épsilon-delta de límite por la derecha, prueba que $\lim_{x \to 8^+} \sqrt{x-8} = 0.$
  • Calcula el límite en $x_0 = 5$ de la función
    $$f(x) =
    \begin{cases}
    \frac{x^2-12x+35}{x-5} & \quad \text{si } x < 5 \\
    \frac{x-5}{1- \sqrt{x-4} } & \quad \text{si } x \geq 5.
    \end{cases}
    $$
  • Usando límites laterales, determina si existe $$\lim_{x \to 0} \frac{3x + |x|}{7x-5|x|}.$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»