Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Álgebra Lineal II: Teorema de Gauss

Por Diego Ligani Rodríguez Trejo

Introducción

En la entrada anterior vimos un recordatorio de las formas bilineales, cuadráticas y sus polares. En esta entrada continuaremos recordando algunas propiedades vistas previamente enfocándonos en el teorema de Gauss y su demostración. Esto nos dará una pequeña pista de la relación entre las formas cuadráticas y matrices.

Además, con el teorema de Gauss obtendremos un algoritmo para poder escribir cualquier forma cuadrática en una forma estandarizada. Esto nos llevará más adelante a plantear la ley de inercia de Sylvester.

Preparaciones para el teorema de Gauss

Antes de empezar con el teorema, veamos una propiedad de las formas cuadráticas en $\mathbb{R}^n$. Tomemos $e_1,\ldots, e_n$ la base canónica de $\mathbb{R}^n$. Tomemos $q$ una forma cuadrática de $\mathbb{R}^n$ y $b$ su forma polar.

Cualquier vector $x=(x_1,\ldots,x_n)$ de $\mathbb{R}^n$ se escribe como $ (x_1,\ldots,x_n)=\sum_{i=1}^n x_i e_i$. Por lo que hicimos en la entrada anterior tenemos entonces:

$$q(x)=b(x,x)=\sum_{i=1}^n \sum_{j=1}^n x_i x_j b(e_i, e_j).$$

Para simplificar la notación definamos $a_{ij}:=b(e_i,e_j)$. Podemos «ver» todos los sumandos en la siguiente expresión:

\begin{align*} q(x)& =x_1^2a_{11}+ x_1x_2a_{12} + \dots + x_1x_na_{1n} \\
&+x_2x_1a_{21}+ x_2^2a_{22} + \dots +x_2x_na_{2n} \\
&\vdots \qquad \qquad \qquad \qquad \qquad \qquad \\
&+x_nx_1a_{n1} + x_nx_2a_{n2} + \dots + x_n^2 a_{nn} \end{align*}

Aquí hay algunos términos «puros» de la forma $a_{ii}x_i^2$. Se encuentran en la «diagonal». Tenemos también algunos términos «mixtos» de la forma $a_{ij}x_ix_j$ con $i\neq j$. Por la simetría de $b$, en los términos mixtos tenemos $a_{ij}=a_{ji}$. Al separar en términos puros y mixtos obtenemos entonces la siguiente expresión:

\begin{align}q(x)= \sum_{i=1}^na_{ii}x_i^2+ 2\sum_{1 \leq i < j \leq n} a_{ij} x_i x_j .\end{align}

Usaremos esto más abajo.

Teorema de Gauss de formas cuadráticas

Teorema. Sea $q$ una forma cuadrática en $V=\mathbb{R}^n$. Existen reales $\alpha_1, \dots , \alpha_r $ y formas lineales $l_1, \dots l_r$ de $V$ linealmente independientes tales que, para todo $x \in V$ se tiene
$$q(x)= \sum_{i=1}^r \alpha _i (l_i(x))^2.$$

Recordemos que la independencia lineal de las formas $l_1,\ldots,l_r$ sucede en el espacio dual $V^*$.

Demostración. Procedamos por inducción sobre $n$. De la igualdad $(1)$, cuando $n=1$ la forma cuadrática es de la forma $q(x)=a_{11}x_1^2$. Al definir $\alpha_1=a_{11}$ y $l_1(x)=x_1$ obtenemos la forma deseada.

Supongamos que el teorema se cumple para $n-1$. De la igualdad $(1)$ sabemos que $q$ se puede escribir como sigue:

\begin{align*} q(x)= \sum_{i=1}^n a_{ii} x_i^2 + 2\sum_{1 \leq i < j \leq n} a_{ij} x_ix_j. \end{align*}

Tenemos tres posibilidades:

  • Que todos los $a_{ii}$ y todos los $a_{ij}$ sean cero. Este caso es inmediato pues entonces $q$ es la forma cuadrática cero y podemos tomar $l_1(x)=x_1$ y $\alpha_1=0$.
  • Que algún $a_{ii}$ sea distinto de cero.
  • Que todos los $a_{ii}$ sean cero, pero algún $a_{ij}$ sea distinto de cero.

Hagamos cada uno de los últimos dos casos por separado. Comencemos por el caso en el que algún $a_{ii}$ es distinto de cero. Sin pérdida de generalidad (¿por qué?) podemos suponer que es $a_{nn}$.

Apartando los términos que tienen $x_n$ de los que no obtenemos:

\begin{align*} \sum_{i=1}^n a_{ii}x_i^2=a_{nn} x_n^2 + \sum_{i=1}^{n-1} a_{ii} x_i^2. \end{align*}

y

\begin{align*} 2\sum_{1 \leq i < j \leq n} a_{ij}x_ix_j= 2\left(\sum_{i=1}^{n-1} a_{in} x_i\right)x_n + 2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j\end{align*}

Con esto

\begin{align*} q(x)=a_{nn}x_n^2 + 2\left(\sum_{i=1}^{n-1} a_{in} x_i\right)x_n + \sum_{i=1}^{n-1} a_{ii} x_i^2 + 2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j .\end{align*}

Si bien esta expresión se ve complicada, en realidad podemos pensar que en términos de la variable $x_n$ es «simplemente una cuadrática». Basados en los primeros dos términos podemos completar un binomio al cuadrado como sigue:

\begin{align*} q(x)= a_{nn} \left(x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2- a_{nn}\left(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2 + \sum_{i=1}^{n-1} a_{ii}x_i^2+2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j.\end{align*}

Notemos que la expresión

\begin{align*} – a_{nn}\left(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2 + \sum_{i=1}^{n-1} a_{ii}x_i^2+2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j \end{align*}

ya no tiene a la variable $x_n$ y que de hecho es una forma cuadrática en las variables $x_1,\ldots, x_{n-1}$ (¿por qué?). De este modo, podemos aplicarle hipótesis inductiva para obtener que existen escalares $\alpha_1,\ldots, \alpha_r$ y formas lineales $l’_1,\ldots,l’_r$ linalmente independientes de $\mathbb{R}^{n-1}$ tales que

\begin{align*} q'(x_1,\dots , x_{n-1})= \sum_{i=1}^r \alpha_i (l_i'(x))^2.\end{align*}

Si bien estas $l’_i$ son formas lineales de $\mathbb{R}^{n-1}$, también podemos pensarlas como formas lineales de $\mathbb{R}^n$. Formalmente, tomamos $l_i:\mathbb{R}^n\to \mathbb{R}$ dada por $l_i(x_1,\ldots,x_n)=l’_i(x_1,\ldots,x_{n-1})$. Para finalizar, definimos

\begin{align*} l_{r+1}(x_1, \dots , x_n)= x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \text{,} \qquad \alpha_{r+1}=a_{nn}.\end{align*}

De aquí, obtenemos la expresión deseada para $q$:

\begin{align*} q(x)= \sum_{i=1}^{r+1} \alpha_i (l_i(x))^2 \end{align*}

Falta argumentar por qué las $l_i$ son linealmente independientes. Si una combinación lineal de ellas da cero, como $l_{r+1}$ es la única que involucra a $x_n$, entonces su coeficiente debe ser cero. Así, obtendríamos una combinación lineal de $l_1,\ldots,l_r$ igualada a cero. Pero esta es una combinación lineal de $l’_1,\ldots,l’_r$. Por hipótesis inductiva, estas son linealmente independientes así que todos los coeficientes deben ser cero.

Lo anterior termina el caso para cuando hay algún «término puro». Falta el caso en el que todos los «términos puros» tienen coeficiente cero, pero hay por lo menos un «término mixto». Por la igualdad $(1)$ tenemos que la forma cuadrática se ve así:

\begin{align*}q(x)= 2\sum_{1 \leq i < j \leq n} a_{ij} x_i x_j .\end{align*}

Sin pérdida de generalidad podemos suponer que el término mixto que no es cero es el $a_{n-1,n}$ (¿por qué?). La idea es ahora separar a los términos que tienen $x_{n-1}$ ó $x_n$ de los que no, y utilizar la siguientes identidades algebraicas que se valen para cualesquiera $A,B,C, D, E$ (haz las cuentas):

\begin{align} Ax_{n-1}x_n+Bx_{n-1}+Cx_n=A\left(x_{n-1}+\frac{C}{A}\right) \left(x_n+\frac{B}{A}\right)-\frac{BC}{A},\end{align}

\begin{align} DE= \frac{1}{4}(D+E)^2 – \frac{1}{4} (D-E)^2.\end{align}

Al realizar la separación nos queda:

\begin{align*} q(x)= 2a_{n-1,n}x_{n-1}x_n +2\sum_{i=1}^{n-2}a_{in}x_ix_n+ 2\sum_{i=1}^{n-2}a_{i,n-1}x_ix_{n-1} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij}. \end{align*}

Así, podemos usar la identidad $(2)$ con los siguientes valores

\begin{align*}
A &=2a_{n-1.n},\\
B&=2\sum_{i=1}^{n-2}a_{i,n-1}x_i,\\
C&=2\sum_{i=1}^{n-2}a_{i,n}x_i
\end{align*}

para obtener que $q$ es:

\begin{align*} A\left(x_{n-1}+\frac{C}{A}\right) \left(x_n+\frac{B}{A}\right)-\frac{BC}{A} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \end{align*}

Al primer sumando podemos reescribirlo usando la identidad $(3)$ como

\begin{align*}\frac{A}{4}\left(x_{n-1}+x_n+\frac{B+C}{A}\right)^2-\frac{A}{4}\left( x_{n-1}-x_n-\frac{B-C}{A}\right)^2 \end{align*}

A la expresión conformada por los últimos dos sumandos le podemos aplicar hipótesis inductiva (¿por qué?) para escribirla de la forma \begin{align*} q'(x_1, \dots , x_{n-2})= \sum_{i=1}^r \alpha’_i (l’_i(x_1, \dots , x_{n-2}))^2 \end{align*} con $l’_1,\ldots, l’_r$ formas lineales linealmente independientes de $\mathbb{R}^{n-2}$. Como en el caso anterior, podemos «convertir» estas formas lineales a formas lineales $l_1,\ldots,l_r$ en $\mathbb{R}^n$. Al agregar las siguientes dos formas lineales

\begin{align*}
l_{r+1}(x)&= x_{n-1}+x_n+\frac{B+C}{A}\\
l_{r+2}(x)&= x_{n-1}-x_n-\frac{B-C}{A}
\end{align*}

y tomar $\alpha_{r+1}=\frac{A}{4}$, $\alpha_{r+2}=-\frac{A}{4}$, obtenemos la expresión deseada:
\begin{align*} q(x)= \sum_{i=1}^{r+2} \alpha_i (l_i(x))^2. \end{align*}

La demostración de que en efecto $l_1,\ldots,l_{r+2}$ son linealmente independientes queda como ejercicio.

Así por principio de inducción tenemos que el teorema de Gauss se cumple para cualquier forma cuadrática $q$ en $\mathbb{R}^n$ para todo $n\geq 1$ entero.

$\square$

Más adelante…

Debido a la longitud de esta demostración, los ejemplos serán reservados para la siguiente entrada.

Las formas cuadráticas, aunque interesantes, muestran estar limitadas por cómo las definimos, ya que se definen sólo en espacios vectoriales reales. En las siguientes entradas expandiremos un poco esta definición para también abarcar al menos espacios vectoriales complejos y luego nos enfocaremos en un tipo especial de éstas.

Además, al principio de la entrada se dieron pistas a que existe una relación entre formas bilineales y matrices, esto será explorado posteriormente.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea $q$ una forma cuadrática en $\mathbb{R}^n$ y $x=(x_1, \dots, x_n)$. Muestra que \begin{align*} q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \text{ con } a_{ij}=b(e_i,e_j). \end{align*}
  2. Sea $A$ la matriz con entradas $a_{ij}$ dadas en el problema anterior. ¿Qué podrías afirmar acerca de $A$ sin importar la $q$ elegida?
  3. Sea $A=[a_{ij}]$ una matriz simétrica en $M_n(\mathbb{R})$ y definamos
    \begin{align*} q: \mathbb{R}^n \rightarrow \mathbb{R} \text{ dada por } q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \end{align*} ¿Es $q$ así definida una forma cuadrática? ¿Es necesario que $A$ sea simétrica?
  4. Demuestra que las formas lineales definidas en el segundo caso de la demostración del teorema de Gauss en efecto son linealmente independientes.
  5. Sean $\alpha _1, \dots , \alpha_r $ números reales y $l_1 , \dots , l_r$ formas lineales, linealmente independientes en $\mathbb{R}^n$ y $x \in \mathbb{R}^n$. Definamos $q$ como sigue:
    \begin{align*} q(x)=\sum_i^n \alpha_i l_i(x)\end{align*}
    ¿Es $q$ así definida una forma cuadrática en $\mathbb{R}^n$?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Variable Compleja I: El campo de los números complejos $\mathbb{C}$

Por Pedro Rivera Herrera

Introducción

Aunque la teoría de los números complejos ha ido formalizándose a lo largo del tiempo, el término «imaginario» ha trascendido hasta nuestros días. Es claro que dicha expresión está ligada con la concepción con la que surgieron dichos números y que es simplemente una forma para referirse a dichos números. El término «complejo» fue introducido por primera vez por el matemático Carl Friedrich Gauss, mientras que el símbolo $i$, para denotar a $\sqrt{-1}$, fue introducido por primera vez por el matemático Leonhard Euler.

Durante el siglo XVI se encontraron soluciones para las ecuaciones $x^2+2x+2 = 0$ y $x^3=6x+4$, tales como $1+\sqrt{-1}$ y $\sqrt[3]{2+\sqrt{-2}}+\sqrt[3]{2-\sqrt{-2}}$ respectivamente, lo cual generó incertidumbre entre los matemáticos de la época, puesto que expresiones como $\sqrt{-1}$ y $\sqrt{-2}$ no tenían sentido. Conforme se iba desarrollando la teoría de los números complejos, para evitar expresiones como las anteriores, se optó por definir una nueva cantidad, la unidad imaginaria, denotada por el símbolo $i$, la cual es caracterizada por cumplir la propiedad $i^2 = -1$, es decir, es la raíz cuadrada de $-1$. Considerando esta notación las expresiones $\sqrt{-1}$ y $\sqrt{-2}$ ahora pueden reescribirse como $i$, $i\sqrt{2}$, respectivamente.

El campo de los números complejos $\mathbb{C}$

Definición 2.1. (El campo de los números complejos.)
El campo de los números complejos, denotado por $\mathbb{C}$, es el conjunto formado por pares ordenados de números reales $z=(a, b)$, dotado con las operaciones binarias de suma y multiplicación definidas respectivamente como:

\begin{equation*}
(a, b) + (c, d) = (a+c, b+d). \tag{2.1}
\end{equation*}

\begin{equation*}
(a, b) \cdot (c, d) = (ac – bd, ad + bc). \tag{2.2}
\end{equation*}

Considerando a $(0,0)$ y $(1,0)$ como los neutros aditivo y multiplicativo respectivamente, es decir, tales que para todo $z=(a,b)\in\mathbb{C}$:

\begin{equation*}
(0,0) + (a,b) = (a,b).
\end{equation*}

\begin{equation*}
(1,0) \cdot (a,b) = (a,b).
\end{equation*}

Y para $z=(a, b) \in \mathbb{C}$ distinto de cero, su inverso multiplicativo, denotado como $z^{-1}$, dado por:
\begin{equation*}
z^{-1} = \left( \frac{a}{a^2 + b^2}, \frac{-b}{a^2 + b^2} \right),
\end{equation*}

es decir, es tal que:

\begin{equation*}
z \cdot z^{-1} = (1,0).
\end{equation*}

Entonces es fácil verificar, usando las propiedades de los números reales, que $\mathbb{C}$ con la suma y el producto recién definidos satisface las propiedades de campo.

Observación 2.1.
Sean $a, b, c, d$ números reales. Sabemos que las parejas ordenadas $(a, b)$ y $(c, d)$ son iguales, es decir $(a, b) = (c, d)$, si y solo si $a=c$ y $b=d$, por lo que la igualdad entre números complejos está sujeta a dicha condición.
Además, si $a \neq b$, entonces $(a, b) \neq (b, a)$, esto es, como parejas ordenadas $(a, b)$ y $(b, a)$ son diferentes, por lo que como números complejos también lo son.

Procedemos ahora a analizar un subconjunto importante de los números complejos, es decir los números de la forma $z = (a, 0)$, con $a \in \mathbb{R}$. A partir de ahora denotaremos al número real $a$ por el número complejo $(a, 0)$.

Observación 2.2
Sean $a, b \in \mathbb{R}$, entonces:

\begin{equation*}
(a, 0) + (b, 0) = (a+b, 0), \quad \text{es decir} \quad a+b.
\end{equation*}

\begin{equation*}
(a, 0) \cdot (b, 0) = (ab, 0), \quad \text{es decir} \quad ab.
\end{equation*}

Notamos que los números complejos de la forma $(a, 0)$ se comportan con respecto a la suma y la multiplicación definidas en (1) y (2) como los números reales. Lo anterior se debe a que el mapeo $a \mapsto (a,0)$ define un isomorfismo de $\mathbb{R}$ en $\mathbb{C}$, es decir:

Proposición 2.1.
La función $\phi: \mathbb{R} \rightarrow \mathbb{C}$ dada por $\phi(a) = (a,0)$ satisface:

  1. $\phi$ es inyectiva.
  2. $\varphi(a+b) = \varphi(a)+\varphi(b)$ y $\varphi(ab) = \varphi(a)\cdot\varphi(b)$.
  3. $\varphi(0) = (0,0)$ y $\varphi(1) = (1,0)$.
  4. $\varphi(-a) = -\varphi(a)$.
  5. Si $a \in \mathbb{R}$, con $a\neq0$, entonces $\varphi(a^{-1}) = \left(\varphi(a)\right)^{-1}$.

Demostración.

  1. La inyectividad se sigue de la observación 2.1.
  2. Observación 2.2.
  3. Se sigue de la definición.
  4. Se deja como ejercicio al lector.
  5. Supongamos que $a \in \mathbb{R}$, con $a \neq 0$, entonces $\phi(a) = (a, 0) \neq (0,0)$ y :

\begin{equation*}
(1, 0) = \phi(1) = \phi(a a^{-1}) = \phi(a)\cdot\phi\left(a^{-1}\right).
\end{equation*}

Entonces $\phi\left(a^{-1}\right) = \left(\phi(a)\right)^{-1}$.

$\blacksquare$

De acuerdo con este resultado, podemos trabajar de manera indistinta con este conjunto de números complejos y los números reales, como si fuesen el mismo conjunto.

Por otra parte, el conjunto de los números complejos de la forma $(0,b)$, con $b \in \mathbb{R}$, será considerado como el conjunto de los números imaginarios puros.

Si definimos a $i:=(0, 1)$, la unidad imaginaria, entonces notamos que:

\begin{equation*}
i^2 = (0, 1) \cdot (0, 1) = (0 – 1, 0) = (-1, 0), \quad \text{es decir} \quad -1.
\end{equation*}
De esta forma podemos concluir que $i = (0, 1)$ es la raíz cuadrada de $-1$. Además tenemos que:

\begin{equation*}
a + ib = (a, 0) + (0, 1) \cdot (b, 0) = (a, 0) + (0, b) = (a, b).
\end{equation*}

De acuerdo a lo anterior, es posible dar la siguiente:

Definición 2.2. (Número complejo.)
Un número complejo es un número de la forma $z = a+ib$ donde $a$ y $b$ son números reales e $i$ es la unidad imaginaria.
Al número real $a$ se le conoce como la parte real de $z$ y se denota como Re$(z)$, mientras que al número real $b$ se le conoce como la parte imaginaria de $z$ y se le denota como Im$(z)$. Además, si Re$(z) = 0$, entonces se dice que $z$ es un número imaginario puro.

Ejemplo 2.1.

  • a) Si $z = 9 \,-\, 6i$, entonces Re$(z) = 9$, mientras que Im$(z) = -6$.
  • b) Si $z = -8i$, entonces Re$(z) = 0$, mientras que Im$(z) = -8$. En este caso $z$ es un número imaginario puro.

Considerando la definición 2.2 y la proposición 2.1, es posible considerar a $\mathbb{R}$ como un subconjunto de $\mathbb{C}$, de forma que todo número real es un número complejo cuya parte imaginaria es igual a cero.

Definición 2.3. (Conjugado de un número complejo.)
Dado un número complejo $z=a+ib$, se define el conjugado de $z$ como el número complejo:
\begin{equation*}
\overline{z} = a \,-\, ib.
\end{equation*}

Ejemplo 2.2.

  • a) Si $z = 6 + 5i$, entonces $\bar{z} = 6 \,-\, 5i$.
  • b) Si $z = -5 – i$, entonces $\bar{z} = -5 + i$.

Definición 4. (Operaciones Aritméticas).
Sean $z_1 = a_1 + ib_1, z_2 = a_2 + i b_2 \in \mathbb{C}$, entonces se definen las siguientes operaciones:

  1. Suma.
    \begin{equation*}
    z_1 + z_2 = (a_1 + ib_1) + (a_2 + i b_2) = (a_1 + a_2) + i(b_1 + b_2)
    \end{equation*}
  2. Resta.
    \begin{equation*}
    z_1 – z_2 = (a_1 + ib_1) – (a_2 + i b_2) = (a_1 – a_2) + i(b_1 – b_2).
    \end{equation*}
  3. Multiplicación.
    \begin{equation*}
    z_1 \cdot z_2 = (a_1 + ib_1) \cdot (a_2 + i b_2) = (a_1a_2 – b_1b_2) + i (b_1a_2 + a_1b_2).
    \end{equation*}
  4. División. Para $z_2 \neq 0$:
    \begin{equation*}
    \frac{z_1}{z_2} = \frac{a_1 + ib_1}{a_2 + i b_2} \frac{a_2 – ib_2}{a_2 – i b_2} =\left(\frac{a_1 a_2 + b_1 b_2}{a_2^2 + b_2^2}\right) + i\left( \frac{b_1a_2 – a_1 b_2}{a_2^2 + b_2^2}\right).
    \end{equation*}

Observación 2.3.
Notemos que si $z=a+ib \in \mathbb{C}$, entonces:
\begin{equation*}
z \cdot \overline{z} = (a+ib) \cdot (a-ib) = (a^2 – (-b^2)) + i(ab-ab) = a^2 + b^2.
\end{equation*}
\begin{equation*}
z + \overline{z} = (a+ib) + (a-ib) = 2a = 2\,\text{Re}(z), \quad \Longrightarrow \quad \text{Re}(z) = \frac{ z + \overline{z}}{2}.
\end{equation*}
\begin{equation*}
z – \overline{z} = (a+ib) – (a-ib) = 2ib = 2\,i\,\text{Im}(z), \quad \Longrightarrow \quad \text{Im}(z) = \frac{ z – \overline{z}}{2i}.
\end{equation*}

Observación 2.4.
A partir de ahora, si es claro que se está efectuando el producto entre números complejos, entonces se omitirá el símbolo “$\cdot$” para indicarlo.

Ejemplo 2.3.
Sean $z_1 = 2 + 4i$ y $z_2 = -3 + 8i$. Calculemos:

  • a) $ \quad z_1 + z_2$,
  • b) $\quad z_1 z_2$.

Solución.

  • a) $ \quad z_1 + z_2 = (2 + 4i) + (-3 + 8i) = (2-3) + (4+8)i = -1 + 12i$.
  • b) $ \quad z_1 z_2 = (2 + 4i) (-3 + 8i) = \left[2(-3) – 4(8)\right] + \left[4(-3) + 2(8)\right]i = -38 + 4i$.

De acuerdo con las definiciones 2.3 y 2.4 es fácil probar las siguientes propiedades:

Proposición 2.2.
Sean $z, w \in \mathbb{C}$, entonces:

  1. $\overline{z \pm w} = \overline{z} \pm \overline{w}$.
  2. $\overline{z w} = \overline{z} \,\overline{w}$.
  3. Si $w \neq 0$, entonces $\overline{\left(\frac{z}{w}\right)} = \frac{\overline{z}}{\overline{w}}$.
  4. $\overline{\overline{z}} = z$.
  5. $z$ es un número real si y solo si $z = \overline{z}$.

Demostración. Sean $z=a_1 + i b_1$ y $w=a_2 + i b_2$, tenemos que:


  1. \begin{align*}
    \overline{z+w} & = \overline{(a_1 + i b_1) + (a_2 + i b_2)} \\
    & = \overline{(a_1 + a_2) + i (b_1 + b_2)} \\
    & = (a_1 + a_2) – i (b_1 + b_2) \\
    & = (a_1 – ib_2) + (a_2 – i b_2) \\
    & = \overline{a_1 + ib_1} + \overline{a_2 + i b_2}\\
    & = \overline{z} + \overline{w}.
    \end{align*}
  1. Ejercicio.
  2. Si $w \neq 0$, entonces:
    \begin{align*}
    \overline{\left(\frac{z}{w}\right)} & = \overline{\left(\frac{a_1 + i b_1}{a_2 + i b_2}\right)} \\
    & = \overline{\left(\frac{a_1 a_2 + b_1 b_2 }{a_1^2 + a_2^2}\right) + i \left(\frac{b_1 a_2 – a_1 b_2 }{a_1^2 + a_2^2}\right)}\\
    & = \left(\frac{a_1 a_2 + b_1 b_2 }{a_1^2 + a_2^2}\right) – i \left(\frac{b_1 a_2 – a_1 b_2 }{a_1^2 + a_2^2}\right)\\
    & = \frac{\overline{\left(a_1 + i b_1\right)}}{\overline{\left(a_2 + i b_2\right)}}\\
    & = \frac{\overline{z}}{\overline{w}}.
    \end{align*}
  1. Ejercicio.
  1. Ejercicio.

Observación 2.5.
Notemos que las propiedades 1 y 2 de la proposición 2.2 se pueden generalizar mediante inducción matemática para un número finito de números complejos, esto es, para $z_1, z_2, \ldots, z_n \in \mathbb{C}$, $n\geq2$, se cumple que:
\begin{equation*}
\overline{z_1 + z_2 + \cdots + z_n} = \overline{z_1} +\overline{z_2} + \cdots + \overline{z_n}.
\end{equation*}

\begin{equation*}
\overline{z_1 z_2 \cdots z_n} = \overline{z_1} \, \overline{z_2} \,\overline{z_n}. \end{equation*}

Tarea moral

  1. Verifica que el conjunto de los números complejos $\mathbb{C}$ con las operaciones definidas en (2.1) y (2.2) satisface los axiomas de campo, es decir, verificar las propiedades de la definición de campo.
  2. En la proposición 2.1 argumenta porqué se cumple la suprayectividad de la función en el inciso 1 y completa la demostración del inciso 4.
  3. Completa las demostraciones de los incisos (1), (2), (4) y (5) de la proposición 2.2.
  4. Prueba los resultados de la observación 2.5 utilizando inducción matemática. ¿Se puede generalizar la propiedad (3) de la proposición 2.2?
  5. Identifica la parte real y la parte imaginaria de los siguientes números complejos:
  • a) $\dfrac{3+5i}{1 + 7i}$.
  • b) $\left(\dfrac{-1+i\sqrt{3}}{2}\right)^3$.
  • c) $\left(\dfrac{i}{3-i}\right) \left(\dfrac{1}{2+3i}\right)$.

Más adelante…

En esta segunda entrada hemos dado una definición formal de lo que es un número complejo. Realizamos la construcción del campo de los números complejos, analizando la relación que existe entre $\mathbb{R}$ y $\mathbb{C}$ como conjuntos. También definimos las operaciones aritméticas básicas de estos números e introducimos una nueva operación llamada la conjugación compleja.

Es importante notar que la extensión del campo de los números reales al campo de los números complejos nos permite dar solución a ecuaciones como $z^2 + 1 = 0$, la cual en $\mathbb{R}$ no tenía solución, mientras que en $\mathbb{C}$ tenemos que los números $z = \pm i$ satisfacen dicha ecuación. En general, notaremos que el campo de los números complejos $\mathbb{C}$ es algebraicamente cerrado, de hecho es la clausura algebraica de $\mathbb{R}$, por lo que siempre será posible hallar soluciones para polinomios con coeficientes en $\mathbb{C}$ de grado $n\geq1$. Más aún, dichos polinomios tendrán exactamente $n$ raíces, lo cual probaremos más adelante cuando veamos el Teorema Fundamental del Álgebra.

En la siguiente entrada daremos una interpretación geométrica de estos números y sus operaciones, por lo que definiremos una nueva cantidad en $\mathbb{C}$ que nos permitirá realizar una mejor comprensión y caracterización de estos números de acuerdo con su posición en un plano, así como la obtención de nuevos resultados y propiedades que nos permitan diferenciarlos de los números reales.

Entradas relacionadas

Álgebra Superior II: Compatibilidad del orden con las operaciones de los naturales

Por Roberto Manríquez Castillo

Introducción

En las entradas anteriores, nos encargamos de definir con toda formalidad la estructura con la que hemos estado familiarizados desde hace mucho; sin embargo, en principio, la forma en que definimos el orden y las distintas operaciones, no parece ser que.

Para finalizar con el estudio de los números naturales, veremos las importantes relaciones que hay entre el orden que definimos para $\mathbb{N}$ en la entrada anterior, y las operaciones que hemos trabajado a lo largo de este tema. Para esto, nuevamente ocuparemos el Principio de Inducción.

Una equivalencia del orden

Aunque como mencionamos en la introducción, la forma en que definimos el orden, no parece tener mucha relación con las operaciones definidas, usando la definición de la suma, podemos dar una definición equivalente del orden en $\mathbb{N}$, en el siguiente teorema, demostramos que en efecto, ambas caracterizaciones son equivalentes.

Teorema.Si $n,m$ son números naturales, se tiene que $n<m$ si y sólo si existe $k\in\mathbb{N}\setminus\{0\}$ tal que n+k=m.

Demostración. Procedamos por inducción sobre $n$.

Si $n=0$, si $0<m$, entonces $m\in \mathbb{N}\setminus\{0\}$ y $n+m=0+m=m$. Recíprocamente, si existe $k\in\mathbb{N}\setminus\{0\}$ tal que $0+k=m$, tendremos que $k=m$, por lo que $m\neq 0$ y por lo tanto $0<m$. Con esto probamos la base de inducción.

Supongamos que el resultado es válido para alguna $n$ y probemos que el resultado para $\sigma(n)$ es decir, que si $m\in\mathbb{N}$ se tiene que $\sigma(n)<m\Leftrightarrow$ existe $k\in\mathbb{N}\setminus\{0\}$ tal que $\sigma(n)+k=m$.

Verifiquemos la ida de la demostración. Supongamos que $\sigma(n)<m$, entonces $n<m$, por lo que por la hipótesis de inducción concluimos que existe $k\neq 0$ tal que $n+k=m$, como $k\neq0$, existe $k’$ tal que $\sigma(k’)=k$, entonces tenemos que

\begin{align*}
m&=n+k\\
&=n+\sigma(k’)\\
&=\sigma(n)+k’
\end{align*}

Notemos además que $k’\neq 0 $, ya que si $k’=0$, entonces $m=\sigma(n)$ lo cual es un contradicción.

Para el regreso, supongamos que existe $k\neq 0$ tal que $\sigma(n)+k=m$ y demostremos que $\sigma(n)\in m$. Como $\sigma(n)+k=m$, concluimos que $n+ \sigma(k)=m$, por lo que $n<m$ y por lo visto en la entrada de La relación de orden en los naturales, tendremos que $\sigma(n)\leq m$. Si $\sigma(n)=m$, entonces cancelando, obtenemos que $k=0$, lo cual es absurdo, entonces solo queda que $\sigma(n)<m$. Con esto concluimos la inducción y la prueba.

$\square$

El orden y las operaciones

Con el anterior resultado, es más fácil ver las relaciones que tendrán el orden con las operaciones, por ejemplo, la siguiente.

Teorema. Si $n<m$ y $l\in\mathbb{N}$, entonces $n+l<m+l$.

Demostración. Como $n<m$, entonces existe $k\neq 0$ tal que $n+k=m$, de donde $n+l+k=m+l$, pero justo esa es la definición de que $n+l<m+l$.

$\square$

Corolario. Si $a<b$ y $c<d$, entonces $a+c<b+d$.

Demostración. Como $a<b$, entonces $a+c<b+c$, y como $c<d$, tenemos que $b+c<b+d$. Por la transitividad del orden, obtenemos el resultado.

$\square$

Finalizamos la entrada, marcando la relación entre el orden y la multiplicación.

Teorema. Si $n<m$ y $l\in\mathbb{N}\setminus\{0\}$, entonces $n\cdot l<m\cdot l$

Demostración. Como $n<m$ entonces existe $k\neq 0$ tal que $n+k=m$, por lo que $nl+lk=ml$, sin embargo, como $l$ y $k$ son distintos de cero, entonces $lk$ también es distinto de cero, por lo que $nl<ml$ justo como debíamos probar.

$\square$

Más adelante…

Con esta entrada, terminamos el estudio de los números naturales, por lo que en la siguiente entrada empezaremos con el estudio de los números enteros. Sin embargo, toda la teoría que hemos desarrollado hasta el momento será la base para poder dar una definición precisa de qué son los números enteros. También nos ayudará a definir sus operaciones, así que nos encontraremos con más oportunidades para practicar nociones de los números naturales.

Hay que hacer una especial mención a los principios de inducción y de buen orden, ya que jugarán un papel crucial a la hora de estudiar las propiedades de los enteros, que nos servirán para desarrollar lo que conocemos como teoría de números.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $a<b$ y $c<d$, entonces $ac<bd$, no es necesario suponer que los números son distintos de cero.
  2. Si $n<m$ y $l\neq 0$, entonces $n^l<m^l$. Sugerencia, usa inducción sobre $l$.
  3. Si $n<m$ y $l\neq 0$, entonces $l^n<l^m$.
  4. Si $n<m$, entonces $n!<m!$.
  5. Demuestra que si $n,m\in\mathbb{N}\setminus\{0\}$, entonces $(1+m)^n\geq 1+nm$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Probabilidad I: Construcción de σ-álgebras

Por Octavio Daniel Ríos García

Introducción

En la entrada pasada dimos comienzo a la construcción de la teoría matemática de la probabilidad. Introdujimos los conceptos de espacio muestral y σ-álgebra. Estos dos son las piedras angulares de la probabilidad. En consecuencia, en esta sesión estudiaremos algunas propiedades importantes de los σ-álgebras. En particular, será de importancia la capacidad de construir σ-álgebras a partir de familias dadas de conjuntos. Esto es, veremos cómo, dada una colección de conjuntos $\mathscr{C}$, existe un σ-álgebra de tamaño mínimo que tiene como subconjunto a $\mathscr{C}$. Así, construiremos un σ-álgebra muy interesante en el contexto de la probabilidad.

Construir σ-álgebras a partir de familias de conjuntos

Mencionamos en la entrada anterior que un σ-álgebra es una familia de conjuntos a los cuales se les asignará una «calificación», llamada «probabilidad». Es decir, que dado $\Omega$ un espacio muestral y $\mathscr{F} \subset \mathscr{P}(\Omega)$ un σ-álgebra sobre $\Omega$, los elementos de $\mathscr{F}$ con los conjuntos que consideraremos como «calificables».

En consecuencia, resulta interesante plantear la siguiente situación. Supón que tenemos una familia de conjuntos $\mathscr{C} \subseteq \mathscr{P}(\Omega)$. Piensa que esta familia de subconjuntos de $\Omega$ es muy importante. Al ser muy importante, nos gustaría poder «calificar» a todos sus elementos. Sin embargo, no sabemos si $\mathscr{C}$ es un σ-álgebra. ¿Será posible construir un σ-álgebra $\mathscr{L}$ tal que $\mathscr{C} \subseteq \mathscr{L}$? La respuesta es sí, y está dada por el siguiente teorema.


Teorema. Dado $\Omega$ un conjunto y $\mathscr{C}$ una familia de subconjuntos de $\Omega$ ($\mathscr{C} \subseteq \mathscr{P}(\Omega)$), existe un único σ-álgebra sobre $\Omega$ de tamaño mínimo $\mathscr{L}$ tal que $\mathscr{C} \subseteq \mathscr{L}$.

Debido a la unicidad, este σ-álgebra es llamado el σ-álgebra generado por $\mathscr{C}$, y es denotado por $\sigma(\mathscr{C})$.


Demostración. Sea $\Gamma$ la familia de todos los σ-álgebras sobre $\Omega$ que contienen a $\mathscr{C}$. De manera un poco informal, es el siguiente conjunto:

\[ \Gamma = \left\lbrace \mathscr{F} \subseteq \mathscr{P}(\Omega) \mid \text{$\mathscr{F}$ es un $\sigma$-álgebra} \, \land \, \mathscr{C} \subseteq \mathscr{F} \right\rbrace \]

Observa que $\Gamma \neq \emptyset$, pues vimos en la sesión anterior que $\mathscr{P}(\Omega)$ es un σ-álgebra. Por lo tanto, $\mathscr{P}(\Omega) \in \Gamma$. Sea $\mathscr{L}$ la intersección de todos los elementos de $\Gamma$. Es decir,

\[ \mathscr{L} = \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}. \]

Esta intersección está bien definida pues $\Gamma \neq \emptyset$. Por construcción, $\mathscr{C} \subseteq \mathscr{L}$, pues $\mathscr{C}$ es subconjunto de todos los $\mathscr{F} \in \Gamma$, y $\mathscr{L}$ es la intersección de todos esos $\mathscr{F}$. De igual forma, para cualquier $\mathscr{F} \in \Gamma$ se cumple que $\mathscr{L} \subseteq \mathscr{F}$. Veamos que $\mathscr{L}$ es un σ-álgebra.

  1. Primero, veamos que $\Omega \in \mathscr{L}$. Sabemos que todos los elementos de $\Gamma$ son σ-álgebras sobre $\Omega$. En consecuencia, para cualquier $\mathscr{F} \in \Gamma$ se cumple que $\Omega \in \mathscr{F}$. Por lo tanto, $\Omega \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$, que por la definición de $\mathscr{L}$ demuestra que $\Omega \in \mathscr{L}$.
  2. Veamos ahora que para cualquier $E \in \mathscr{L}$ se tiene que $E^{\mathsf{c}} \in \mathscr{L}$. Sea $E \in \mathscr{L}$. Por definición de $\mathscr{L}$, esto implica que $E \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$. Es decir, para todo $\mathscr{F} \in \Gamma$, se cumple que $E \in \mathscr{F}$. Como cada uno de los $\mathscr{F}$ es σ-álgebra, se sigue que para todo $\mathscr{F} \in \Gamma$ se cumple que $E^{\mathsf{c}} \in \mathscr{F}$. Por consiguiente, $E^{\mathsf{c}} \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$. Así, se concluye que $E^{\mathsf{c}} \in \mathscr{L}$.
  3. Finalmente, sea $\{ E_{n} \}_{n=1}^{\infty}$ tal que para todo $n \in \mathbb{N}^{+}$ se cumple que $E_{n} \in \mathscr{L}$. Debemos de demostrar que $\bigcup_{n=1}^{\infty}E_{n} \in \mathscr{L}$. Para ello, observa que si para todo $n \in \mathbb{N}^{+}$ se cumple que $E_{n} \in \mathscr{L}$, entonces también es cierto que para todo $n \in \mathbb{N}^{+}$ se cumple que $E_{n} \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$, por la definición de $\mathscr{L}$. Ahora, esto significa que para cualquier $\mathscr{F} \in \Gamma$, todos los $E_{n}$ cumplen que $E_{n} \in \mathscr{F}$; y como los $\mathscr{F}$ son σ-álgebras, se sigue que $\bigcup_{n=1}^{\infty}E_{n} \in \mathscr{F}$. Por lo tanto, $\bigcup_{n=1}^{\infty}E_{n} \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$, y así, queda demostrado que $\bigcup_{n=1}^{\infty}E_{n} \in \mathscr{L}$.

Estas tres propiedades demuestran que $\mathscr{L}$ es un σ-álgebra que contiene a $\mathscr{C}$. Además, por construcción, $\mathscr{L}$ es minimal en el sentido de que es subconjunto de cualquier otro σ-álgebra que contiene a $\mathscr{C}$.

Nos falta ver que $\mathscr{L}$ es único. Para hacerlo, supón que hay otro σ-álgebra $\mathscr{N}$ que satisface $\mathscr{C} \subseteq \mathscr{N}$ y que para todo σ-álgebra $\mathscr{F}$ tal que $\mathscr{C} \subseteq \mathscr{F}$, se tiene que $\mathscr{N} \subseteq \mathscr{F}$ (es decir, $\mathscr{N}$ es minimal). Como $\mathscr{N}$ es un σ-álgebra tal que $\mathscr{C} \subseteq \mathscr{N}$, se tiene que $\mathscr{N} \in \Gamma$. Más arriba comentamos que para cualquier $\mathscr{F} \in \Gamma$ se cumple que $\mathscr{L} \subseteq \mathscr{F}$. En particular, esto implica que $\mathscr{L} \subseteq \mathscr{N}$.

Por otro lado, supusimos que $\mathscr{N}$ es minimal, es decir, que si $\mathscr{F}$ es un σ-álgebra tal que $\mathscr{C} \subseteq \mathscr{F}$, se tiene que $\mathscr{N} \subseteq \mathscr{F}$. Ya vimos que $\mathscr{L}$ es un σ-álgebra que contiene a $\mathscr{C}$. En consecuencia, $\mathscr{N} \subseteq \mathscr{L}$.

Así, utilizando la igualdad por doble contención, queda demostrado que $\mathscr{N} = \mathscr{L}$. En conclusión, cualquier σ-álgebra que contiene a $\mathscr{C}$ y es minimal en el sentido de que es subconjunto de cualquier otro σ-álgebra que contiene a $\mathscr{C}$ resulta ser igual a $\mathscr{L}$.

$\Box$

¡Bien! Hay dos consecuencias importantes del teorema anterior. En primera, que podemos cronstruir σ-álgebras sobre cualquier conjunto. En segunda, y quizás no tan evidente, que existe una cantidad abundante de σ-álgebras.

Sin embargo, quizás ya notaste que la definición de σ-álgebra generado por una familia de conjuntos $\mathscr{C}$ es un poco intangible. Veamos algunos ejemplos para entender cómo es que funciona esta construcción.

Ejemplos. Sea $\Omega$ el siguiente conjunto:

\[ \Omega = \{ 1, 2, 3, 4, 5, 6 \}. \]

Sea $\mathscr{C} = \{ \{2\}, \{4\} \}$. Veamos qué conjunto es $\sigma(\mathscr{C})$. Primero, sabemos que $\sigma(\mathscr{C})$ debe de ser un σ-álgebra. Por ello, $\sigma(\mathscr{C})$ debe de satisfacer que $\Omega \in \sigma(\mathscr{C})$. Además, por definición de $\sigma(\mathscr{C})$, debe de cumplirse que $\mathscr{C} \subseteq \sigma(\mathscr{C})$. Es decir, se cumplen las siguientes dos pertenencias:

\begin{align}
\{2\} &\in \sigma(\mathscr{C}), \\
\{4\} &\in \sigma(\mathscr{C}).
\end{align}

Bien, entonces en principio $\sigma(\mathscr{C})$ se vería así:

\[ \sigma(\mathscr{C}) = \{ \{2\}, \{4\}, \{ 1, 2, 3, 4, 5, 6 \}, \ldots \}, \]

donde los puntos suspensivos representan los elementos de $\sigma(\mathscr{C})$ que todavía nos faltan. Ahora, sabemos que un σ-álgebra es cerrado bajo complementación. Por lo tanto, los complementos de cada uno de esos conjuntos deben de ser elementos de $\sigma(\mathscr{C})$. Es decir, se cumplen las siguientes pertenencias:

\begin{align}
\{2\}^{\mathsf{c}} = \{1,3,4,5,6 \} &\in \sigma(\mathscr{C}), \\
\{4\}^{\mathsf{c}} = \{1,2,3,5,6 \} &\in \sigma(\mathscr{C}), \\
\{1,2,3,4,5,6\}^{\mathsf{c}} = \emptyset &\in \sigma(\mathscr{C}).
\end{align}

Esto expande la cantidad de elementos en $\sigma(\mathscr{C})$, que va agarrando cada vez más forma:

\[ \sigma(\mathscr{C}) = \{ \emptyset, \{2\}, \{4\}, \{ 1, 3, 4, 5, 6 \}, \{ 1, 2, 3, 5, 6 \}, \{ 1, 2, 3, 4, 5, 6 \}, \ldots \}, \]

Finalmente, un σ-álgebra es cerrado bajo uniones numerables. En este ejemplo, $\Omega$ es finito, así que basta con que acompletemos a $\sigma(\mathscr{C})$ con todas las uniones finitas. Además, $\sigma(\mathscr{C})$ debe de ser cerrado bajo los complementos de las uniones resultantes. Sin embargo, observa que no es necesario meter esos complementos, y que basta con sacar las intersecciones de los conjuntos que ya tenemos. Esto gracias a las leyes de De Morgan: para cualesquiera $A$ y $B$ conjuntos se cumple que $(A \cup B)^{\mathsf{c}} = A^{\mathsf{c}} \cap B^{\mathsf{c}}$. Así, el siguiente paso es tomar todas las uniones e intersecciones posibles de los elementos de $\sigma(\mathscr{C})$ que tenemos.

Sin embargo, observa que algunas de las uniones e intersecciones de conjuntos que ya tenemos dan como resultado otros conjuntos que ya hemos incluido en $\sigma(\mathscr{C})$. Por ello, incluiré las uniones e intersecciones que resultan en conjuntos que todavía no están en $\sigma(\mathscr{C})$. Estas son:

\begin{align*} \{2\} \cup \{4\} = \{2,4\} &\in \sigma(\mathscr{C}), \\ \{1,3,4,5,6\} \cap \{1,2,3,5,6\} = \{1,3,5,6\} &\in \sigma(\mathscr{C}). \end{align*}

Nota que $\{2,4\}^{\mathsf{c}} = \{1,3,5,6\} = \{1,3,4,5,6\} \cap \{1,2,3,5,6\}$, que justo como mencionamos más arriba, cubre la cerradura bajo complementación para $\{2,4\}$. Así, queda completo $\sigma(\mathscr{C})$, que es el siguiente conjunto:

\[ \sigma(\mathscr{C}) = \{ \emptyset, \{2\}, \{4\}, \{2, 4\}, \{1,3,5,6\}, \{ 1, 3, 4, 5, 6 \}, \{ 1, 2, 3, 5, 6 \}, \{ 1, 2, 3, 4, 5, 6 \} \}. \]

Un buen ejercicio sería que verifiques que este conjunto que obtuvimos es, efectivamente, un σ-álgebra. En conclusión, en el caso del σ-álgebra generado por una familia finita de conjuntos, podemos seguir el siguiente método para su construcción.

  1. Dada $\mathscr{C}$ una familia finita de subconjuntos de $\Omega$, el primer paso es incluir a todos los elementos de $\mathscr{C}$ (ya que, por definición, $\mathscr{C} \subseteq \sigma(\mathscr{C})$). Además, por la primera propiedad de un σ-álgebra, también debe de cumplirse que $\Omega \in \sigma(\mathscr{C})$.
  2. Un σ-álgebra debe de ser cerrado bajo complementación. Por ello, el segundo paso es incluir a todos los complementos de los conjuntos incluidos en el paso anterior.
  3. Finalmente, tomar todas las uniones e intersecciones posibles de los conjuntos obtenidos en los dos pasos anteriores.

Un σ-álgebra de gran importancia

El ejemplo anterior exhibe una manera de construir el σ-álgebra generado por una familia finita de conjuntos. SIn embargo, esto se torna más abstracto cuando la familia no es finita. En particular, cuando $\Omega = \mathbb{R}$, sería interesante pensar en el σ-álgebra generado por la familia de intervalos de la siguiente forma:

\[ \mathscr{C}_{1} = \left\lbrace (-\infty, b] \mid b \in \mathbb{R} \right\rbrace. \]

Es decir, $\mathscr{C}_{1}$ es la familia de todos los intervalos no acotados por la izquierda, y cerrados por la derecha. En el contexto de la probabilidad es muy natural que, dado $b \in \mathbb{R}$, planteemos la siguiente situación. Si $x$ es el resultado de algún experimento donde el espacio muestral es $\mathbb{R}$ ¿es cierto que $x \leq b$? O dicho en otras palabras, ¿es cierto que $x \in (-\infty, b]$? Por ejemplo, «¿es cierto que el precio de un activo queda por debajo de algún valor fijo?» Esta es una pregunta que surgiría cuando entras en el contrato de un producto financiero derivado.

Observa que $\mathscr{C}_{1}$ no es un σ-álgebra, así que habría preguntas sobre $x$ que no podríamos contestar dentro de $\mathscr{C}_{1}$. Por ejemplo, $(-\infty, b]^{\mathsf{c}} = (b, \infty)$ no es un elemento de $\mathscr{C}_{1}$, por lo que la pregunta «¿es cierto que $x \in (b, \infty)$?» no tendría respuesta.

¡Ajá! Pero justamente, el teorema que vimos nos permite generar un σ-álgebra a partir de $\mathscr{C}_{1}$. Es decir, $\sigma(\mathscr{C}_{1})$ es el σ-álgebra más pequeño que contiene a todos los intervalos $(-\infty, b]$.

El σ-álgebra generado por esta última familia es muy importante, y es conocido como el σ-álgebra de Borel en $\mathbb{R}$, y es comúnmente denotado por $\mathscr{B}(\mathbb{R})$. Curiosamente, resulta que la manera en que obtuvimos a $\mathscr{B}(\mathbb{R})$ no es la única manera de hacerlo. Por ejemplo, sea $\mathscr{C}_{2}$ la siguiente familia de conjuntos:

\[ \mathscr{C}_{2} = {\left\lbrace (a, b] \mid a, b \in \mathbb{R} \land a < b \right\rbrace}. \]

¿Cuál será el σ-álgebra generado por $\mathscr{C}_{2}$? Veamos primero lo siguiente. Sean $a$, $b \in \mathbb{R}$ tales que $a < b$. Por la definición de $\mathscr{B}(\mathbb{R})$, se cumple que $(-\infty,a]$, $(-\infty,b] \in \mathscr{B}(\mathbb{R})$. Como $\mathscr{B}(\mathbb{R})$ es un σ-álgebra, $(-\infty,a]^{\mathsf{c}} = (a, \infty) \in \mathscr{B}(\mathbb{R})$. Por lo tanto, $(a, \infty) \cap (-\infty,b] = (a,b] \in \mathscr{B}(\mathbb{R})$. Esto es, para cualesquiera $a$, $b \in \mathbb{R}$ tales que $a < b$, se cumple que $(a,b] \in \mathscr{B}(\mathbb{R})$. Por lo tanto, se cumple que $\mathscr{C}_{2} \subseteq \mathscr{B}(\mathbb{R})$, y como $\mathscr{B}(\mathbb{R})$ es un σ-álgebra, se tiene que $\sigma(\mathscr{C}_{2}) \subseteq \mathscr{B}(\mathbb{R})$.

Ahora, sea $b \in \mathbb{R}$. Por la definición de $\sigma(\mathscr{C}_{2})$, para cualquier $n \in \mathbb{N}^{+}$ se cumple que $(b – n, b] \in \sigma(\mathscr{C}_{2})$. Esto pasa porque $b-n$ y $b$ son reales tales que $b – n < b$, por lo que $(b-n, b] \in \mathscr{C}_{2}$. Ahora, debido a que $\sigma(\mathscr{C}_{2})$ es un σ-álgebra, se cumple que

\[ \bigcup_{n=1}^{\infty} (b – n, b] \in \sigma(\mathscr{C}_{2}), \]

pues $\bigcup_{n=1}^{\infty} (b – n, b]$ es una unión numerable de elementos de $\sigma(\mathscr{C}_{2})$. Observa que

\[ \bigcup_{n=1}^{\infty} (b – n, b] = (-\infty, b], \]

ya que si $x$ es un número real tal que $x \in (-\infty,b]$, como consecuencia de la propiedad arquimediana en $\mathbb{R}$, existe $k \in \mathbb{Z}$ tal que $k < x \leq k + 1$. Como $k < x$ y $x \leq b$, se tiene que $k < b$. Luego, $b – (\lceil b \rceil – k) \leq b – (b – k) = k$, pues $b \leq \lceil b \rceil$. Además, como $k < b$ y $b \leq \lceil b \rceil$, se tiene que $\lceil b \rceil – k > 0$, y como $\lceil b \rceil$ y $k$ son enteros, $\lceil b \rceil – k$ también lo es. Esto es, $\lceil b \rceil – k \in \mathbb{N}^{+}$. Sea $n^{*} = \lceil b \rceil – k$. Observa que $b – n^{*} < k$, por lo que $b – n^{*} < x$, y como $x \leq b$, se tiene que

\[ x \in (b – n^{*}, b],\]

y como $\lceil b \rceil – k \in \mathbb{N}^{+}, podemos concluir que

\[ x \in \bigcup_{n=1}^{\infty} (b – n, b], \]

por lo que $(-\infty, b] \subseteq \bigcup_{n=1}^{\infty} (b – n, b]$. La otra contención es más sencilla de demostrar. Si $x$ es un real tal que $x \in \bigcup_{n=1}^{\infty} (b – n, b]$, entonces existe $m \in \mathbb{N}^{+}$ tal que $x \in (b – m, b]$. Esto asegura que $b- n < x \land x \leq b$. En particular, es cierto que $x \leq b$, por lo que $x \in (-\infty, b]$. Por lo tanto, $\bigcup_{n=1}^{\infty} (b – n, b] \subseteq (-\infty, b]$.

Esto demuestra que para cualquier $b \in \mathbb{R}$, el intervalo $(-\infty, b]$ es un elemento de $\sigma(\mathscr{C}_{2})$. Es decir, $\mathscr{C}_{1} \subseteq \sigma(\mathscr{C}_{2})$. Además, recuerda que $\mathscr{B}(\mathbb{R})$ es el σ-álgebra generado por $\mathscr{C}_{1}$, y que $\sigma(\mathscr{C}_{2})$ es un σ-álgebra. Esto implica que $\mathscr{B}(\mathbb{R}) \subseteq \sigma(\mathscr{C}_{2})$.

En conclusión, queda demostrado que $\mathscr{B}(\mathbb{R}) = \sigma(\mathscr{C}_{2})$. esto muestra que el σ-álgebra de Borel en $\mathbb{R}$ puede generarse a partir de $\mathscr{C}_{2}$.

Más aún, $\mathscr{B}(\mathbb{R})$ resulta ser el σ-álgebra generado por otras familias de intervalos muy parecidas. Las siguientes familias son algunas de ellas:

\begin{align*}
\mathscr{C}_{3} &= \left\lbrace [a, b) \mid a, b \in \mathbb{R} \land a < b\right\rbrace, \\
\mathscr{C}_{4} &= \left\lbrace (a, b) \mid a, b \in \mathbb{R} \land a < b \right\rbrace, \\
\mathscr{C}_{5} &= \left\lbrace [a, b] \mid a, b \in \mathbb{R} \land a < b \right\rbrace, \\
\mathscr{C}_{6} &= \left\lbrace (a, \infty) \mid a \in \mathbb{R} \right\rbrace, \\
\mathscr{C}_{7} &= \left\lbrace [a, \infty) \mid a \in \mathbb{R} \right\rbrace, \\
\mathscr{C}_{8} &= \left\lbrace (-\infty, b) \mid b \in \mathbb{R} \right\rbrace.
\end{align*}

Todas las familias anteriores generan el mismo σ-álgebra: $\mathscr{B}(\mathbb{R})$. La justificación de estos hechos es parecida a la que desarrollamos aquí, pero con algunos detalles distintos. Para pasar de un σ-álgebra a otro, se utilizan otras uniones o intersecciones numerables más mañosas. Por ejemplo, si tomas conjuntos en $\mathscr{C}_{4}$, digamos, con $a$, $b \in \mathbb{R}$ tales que $a < b$, y para cada $n \in \mathbb{N}^{+}$ tomas los conjuntos $(a, b + \frac{1}{n})$, al obtener la intersección de esta familia:

\[ \bigcap_{n=1}^{\infty} \left(a, b+\frac{1}{n} \right), \]

el intervalo resultante es el intervalo $(a, b]$. Es decir, haciendo una intersección numerable de elementos de $\mathscr{C}_{4}$, llegas a uno de $\mathscr{C}_{2}$. Algo parecido puede hacerse para pasar de $\mathscr{C}_{2}$ a $\mathscr{C}_{4}$, pero se haría con uniones numerables.

Finalmente, ¿recuerdas el álgebra de la entrada pasada? ¿El de las uniones disjuntas finitas de intervalos? Bueno, resulta que el σ-álgebra generado por ese álgebra es también $\mathscr{B}(\mathbb{R})$.

Tarea moral

Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu manejo de los conceptos abordados en esta entrada.

  • Retomando el ejemplo donde $\Omega = \{ 1, 2, 3, 4, 5, 6 \}$ y $\mathscr{C} = \{ \{2\}, \{4\}\}$, verifica que el conjunto
    \[\sigma(\mathscr{C}) = \{ \emptyset, \{2\}, \{4\}, \{2, 4\}, \{1,3,5,6\}, \{ 1, 3, 4, 5, 6 \}, \{ 1, 2, 3, 5, 6 \}, \{ 1, 2, 3, 4, 5, 6 \} \}\]es un σ-álgebra.
  • Sea $\Omega = \{ 1, 2, 3, 4, 5, 6 \}$.
    • Sea $\mathscr{C}_a = \{ \{1\}, \{3,5\}\}$. Determina $\sigma(\mathscr{C}_a)$.
    • Sea $\mathscr{C}_b = \{ \{1\}, \{2\}, \{3,4\}\}$. Determina $\sigma(\mathscr{C}_b)$.
  • Retomando el σ-álgebra de Borel en $\mathbb{R}$, $\mathscr{B}(\mathbb{R})$, demuestra que
    • El σ-álgebra generado por $\mathscr{C}_{4}$ es $\mathscr{B}(\mathbb{R})$ (puedes demostrar que $\sigma(\mathscr{C}_{4}) = \sigma(\mathscr{C}_{1})$ usando el bosquejo que propusimos).
    • El σ-álgebra generado por $\mathscr{C}_{5}$ es $\mathscr{B}(\mathbb{R})$ (puedes demostrar que $\sigma(\mathscr{C}_{5}) = \sigma(\mathscr{C}_{4})$).

Más adelante…

Esta entrada concluye nuestro estudio enfocado en los σ-álgebras. El σ-álgebra de Borel será necesario mucho más adelante cuando definamos lo que son las variables aleatorias continuas con valores en $\mathbb{R}$. Además, si decides cursar la materia de Teoría de la Medida, te encontrarás con el σ-álgebra de Borel y lo estudiarás con más profundidad. En particular, es de mucha importancia que $\mathscr{B}(\mathbb{R})$ pueda ser generado a partir de un álgebra de conjuntos. Esto pues hay un teorema muy importante (el Teorema de Extensión de Carathéodory) que permite extender la medida sobre el álgebra que asigna a cada intervalo su longitud (donde la longitud de $(a,b]$ es $b – a$) de manera única a $\mathscr{B}(\mathbb{R})$.

En la siguiente entrada abordaremos el concepto de medida de probabilidad, que será nuestra manera de asignar una «calificación» a los elementos de un σ-álgebra dado.

Entradas relacionadas

Probabilidad I: Introducción al Curso, Espacio Muestral y σ-álgebras

Por Octavio Daniel Ríos García

Introducción

Esta es la primera entrada de las notas de curso correspondientes a la materia de Probabilidad I. En esta sesión, platicaremos primero un poco sobre el objeto de estudio de la probabilidad. Después, un poco sobre su filosofía. Es decir, las ideas que sigue. Finalmente, presentaremos algunos de los conceptos matemáticos más fundamentales en esta teoría.

Antes de dar comienzo a nuestro tratamiento de la probabilidad, considero prudente incluir los conocimientos previos recomendables para este curso.

Sobre los prerrequisitos

Primeramente, debes de tener bien claros los contenidos de un curso de Álgebra Superior I. Pon especial atención a los temas de lógica, de teoría de conjuntos, y de funciones.

Por otro lado, te recomiendo que tengas bien claros los temas de un curso de Cálculo Diferencial e Integral II. En este curso es donde se abordan los temas de integración de funciones (de acuerdo con la teoría de integración de Riemann).

Por último, es deseable que tengas una buena noción de los temas de un curso de Cálculo Diferencial e Integral I. En particular, es importante que tengas claros los temas de sucesiones y de diferenciación.

A lo largo de estas notas supondré que manejas bien estos temas. Sin embargo, si necesitas revisarlos, puedes recurrir a nuestras notas de curso para Álgebra Superior I, Cálculo Diferencial e Integral I y Cálculo Diferencial e Integral II.

Fenómenos Aleatorios

En la teoría de la probabilidad nos interesa describir matemáticamente los fenómenos aleatorios. Aquí nos topamos con una primera pregunta: ¿qué es un fenómeno aleatorio? A grandes rasgos, un fenómeno aleatorio es todo aquel fenómeno cuyo resultado se conoce únicamente hasta que este ha concluido.

Por ejemplo, si tomas una moneda y la lanzas al aire, ¿puedes saber con anterioridad cuál de sus caras caerá arriba? A menos que seas clarividente, la respuesta es no. Así, el lanzamiento de una moneda puede pensarse como un fenómeno aleatorio. Conocerás su resultado únicamente hasta que el lanzamiento haya concluido. Otro ejemplo, de naturaleza más trágica, son los terremotos. La fecha exacta del siguiente terremoto se sabrá hasta que este ocurra. En consecuencia, la ocurrencia de un terremoto es un fenómeno aleatorio.

Un Poco de la Filosofía de la Probabilidad

Seguramente conoces ramas de la matemática que se esfuerzan por describir el comportamiento de los fenómenos de la naturaleza de la manera más precisa posible. Sin embargo, tal no es el caso de la probabilidad. En nuestro caso, orientaremos nuestros esfuerzos en describir cómo se acomodan (o se distribuyen) los resultados de un fenómeno aleatorio.

De lo anterior probablemente te surgen dos interrogantes. En primera instancia, ¿A qué te refieres por «cómo se acomodan»? Y en segunda, ¿cómo que la probabilidad no se esfuerza por describir el comportamiento de la naturaleza? Para contestar a la primera pregunta, toma una moneda. Lánzala 10 veces al aire, y registra los resultados. Hice este ejercicio por mi cuenta, y la siguiente tabla ilustra cuáles lanzamientos salieron «águila» (A) y cuáles «sol» (S):

12345678910
ASSSAASSSA

Estos resultados pueden acomodarse también en una gráfica como la siguiente:

Donde la altura de cada barra representa la frecuencia del resultado correspondiente. De mis 10 realizaciones del lanzamiento, 4 salieron «águila» y 6 salieron «sol». Esta gráfica exhibe cómo se distribuyeron los resultados de mis 10 lanzamientos de moneda. Puedes replicar esta gráfica con los resultados de tus 10 lanzamientos. Con ello, te darás una idea de cómo se distribuyen sus resultados.

En el siguiente vídeo se observa otro ejemplo de la distribución que siguen los resultados de un fenómeno aleatorio:

El juguete ilustrado en el vídeo es conocido como Máquina de Galton. En inglés, Galton Board. Se dejan caer muchas pelotitas desde el compartimiento de arriba. Estas rebotan aleatoriamente de izquierda a derecha hasta que caen en alguno de los compartimientos de abajo. Así, las barras resultantes representan cómo se distribuyen los resultados de dejar caer las pelotitas.

Burdamente, la «manera en la que se distribuyen» los resultados de un fenómeno aleatorio se refiere a la frecuencia con la que estos ocurren en varias realizaciones del fenómeno.

Justificando la Filosofía de la Probabilidad

Ahora, vamos a abordar un poco del aspecto filosófico de la probabilidad. Anteriormente, te mencioné que la probabilidad no se enfoca en modelar matemáticamente el funcionamiento de los fenómenos de la naturaleza. Para entender esto, quiero que pienses en lo siguiente:

Si yo te preguntara «¿cómo le hiciste para que tu lanzamiento saliera «águila»? ¿Y para que saliera «sol»?», ¿serías capaz de dar respuesta a alguna de las dos preguntas? Piénsalo bien. Al realizar los lanzamientos, seguramente acomodaste la mano a una cierta altura, y en alguna posición. Después, acomodaste la moneda en tu mano. Acto seguido, la lanzaste (con un cierto ángulo), y finalmente la moneda cayó sobre alguna de sus caras. Toda esta información es relevante para determinar el resultado de un lanzamiento. ¿Serías capaz de decirme la información de los lanzamientos donde salió «águila»? ¿Y de los que salió «sol»? Incluso si tuviéramos el equipo tecnológico para capturar esa información, ¿hace diferencia?

La respuesta es que no. Si ya capturaste estos valores, es porque el experimento ya está ocurriendo. Más aún, quizás ya hasta concluyó. Así, incluso si tuvieras un modelo matemático muy preciso para describir el lanzamiento de una moneda, no resulta útil para predecir su resultado.

Esta discusión puede extenderse a otros fenómenos aleatorios, y justifica el objeto de estudio de la probabilidad: describir matemáticamente el comportamiento de los resultados de un fenómeno aleatorio.

Describiendo Matemáticamente los Fenómenos Aleatorios

Ya quedó clara nuestra intención de centrar nuestra atención en los resultados de un experimento aleatorio. A partir de aquí, empieza la labor matemática. Para comenzar, partiremos de un conjunto cuyos elementos son todos los posibles resultados de un fenómeno aleatorio.


Definición. Dado un fenómeno o experimento aleatorio, el espacio muestral de dicho fenómeno es el conjunto cuyos elementos son todos los posibles resultados del fenómeno, y será denotado por $\Omega$ (Omega).


Ejemplos. El espacio muestral del lanzamiento de una moneda podría ser

$$\Omega = \left\lbrace \text{águila}, \text{sol} \right\rbrace,$$

o alternativamente, podemos hacer uso de números para representar estos resultados

$$\Omega = \left\lbrace 0, 1\right\rbrace,$$

y puedes escoger cuál es cuál (por ejemplo, que $0$ es águila y $1$ es sol).

En el caso del lanzamiento de un dado, podemos considerar el espacio muestral

$$\Omega = \left\lbrace 1, 2, 3, 4, 5, 6 \right\rbrace.$$

Si lanzamos dos dados simultáneamente, podemos considerar que el espacio muestral de ese experimento es

$$\Omega = \left\lbrace 1, 2, 3, 4, 5, 6 \right\rbrace \times \left\lbrace 1, 2, 3, 4, 5, 6 \right\rbrace,$$

pues nos interesan todas las combinaciones de valores que puede tomar cada dado. Por ejemplo, $(1,3)$ representa al resultado en el que el primer dado cae $1$, y el segundo, $2$.


Nuestra intención será cuantificar qué tan probable es que ocurra uno o más de estos resultados. Esto lo haremos asignando una «calificación» entre 0 y 1 a ciertos subconjuntos importantes de $\Omega$. Así, la «calificación» será 0 para lo más improbable, y 1 para lo más probable. Pero, ¿a qué me refiero por subconjuntos importantes? Veámoslo.

Álgebras

Nuestra intención es «calificar» qué tan probable es alguno de los resultados de nuestro fenómeno aleatorio. Es decir, queremos medir la probabilidad de ocurrencia de los resultados. Como queremos realizar una asignación, será necesaria una función, digamos, $\mathbb{P}$. Esta función asignará el número $\mathbb{P}(A)$ a cada conjunto $A$ de una cierta familia de conjuntos. Debido a esto, la familia sobre la que se define a $\mathbb{P}$ debe de tener una cierta estructura. Para motivar el tipo de estructura que impondremos, podemos valernos de ciertas consideraciones de la probabilidad.

Si $\Omega$ es el espacio muestral de un fenómeno aleatorio, dado $A \subseteq \Omega$, y dado $\omega \in \Omega$, es natural preguntar «¿es cierto que $\omega \in A$?» y encontrar si la respuesta es sí o no una vez que $\omega$ ha sido observado. Ahora, si pudimos responder la pregunta anterior, podemos responder si «¿es cierto que $\omega \in A^{\textsf{c}}$?» Más aún, si dado $n \in \mathbb{N}^{+}$ (el conjunto de los números naturales sin el $0$), para cada $i \in \{1, \ldots, n\}$ podemos determinar la veracidad de $\omega \in A_{i}$, deberíamos de poder determinar si $\omega \in \bigcup_{i=1}^{n}A_{i}$ y $\omega \in \bigcap_{i=1}^{n}A_{i}$.

Por lo tanto, un primer requisito estructural para la familia sobre la que definiremos a $\mathbb{P}$ es que sea cerrada bajo complementación, unión finita e intersección finita.

Además, como la respuesta a la pregunta «¿es cierto que $\omega \in \Omega$?» es siempre «sí», el espacio muestral mismo debería de ser un elemento de la familia. Así, esta discusión da lugar a la siguiente definición.


Definición. Sea $\mathscr{F}$ una colección de subconjuntos de un conjunto $\Omega$ (i.e. $\mathscr{F} \subseteq \mathscr{P}(\Omega)$). Diremos que $\mathscr{F}$ es un álgebra sobre $\Omega$ si cumple las siguientes propiedades:

  1. $\Omega \in \mathscr{F}$.
  2. Si $A \in \mathscr{F}$, entonces $A^{\mathsf{c}} \in \mathscr{F}$.
  3. Si $A_{1}, A_{2}, \ldots, A_{n} \in \mathscr{F}$, entonces $\bigcup_{i=1}^{n} A_{i} \in \mathscr{F}$.

$A^{\mathsf{c}}$ es el complemento de $A$ respecto a $\Omega$, pues $A \subseteq \Omega$.


La propiedad 2 es conocida como cerradura bajo complementación, y la propiedad 3 como cerradura bajo uniones finitas. De la definición de álgebra es posible deducir que un álgebra es también cerrado bajo intersecciones finitas (véase la tarea moral al final de esta entrada).

σ-álgebras

Hay una propiedad un poco más exigente que no es tan sencilla de justificar. En la definición de un álgebra, ¿deberíamos de pedir en la propiedad 3 que sea cerrada bajo uniones numerables? El argumento más convincente para hacerlo es que la teoría matemática resultante es más vasta. Así, obtenemos la siguiente definición.


Definición. Sea $\mathscr{F}$ una colección de subconjuntos de un conjunto $\Omega$ (es decir, $\mathscr{F} \subseteq \mathscr{P}(\Omega)$). Diremos que $\mathscr{F}$ es un σálgebra sobre $\Omega$ (se lee «sigma-álgebra sobre omega», su plural es «sigma-álgebras») si cumple las siguientes propiedades:

  1. $\Omega \in \mathscr{F}$.
  2. Si $A \in \mathscr{F}$, entonces $A^{\mathsf{c}} \in \mathscr{F}$.
  3. Si $A_{1}, A_{2}, \ldots \in \mathscr{F}$, entonces $\bigcup_{i=1}^{\infty} A_{i} \in \mathscr{F}$.

$A^{\mathsf{c}}$ es el complemento de $A$ respecto a $\Omega$, pues $A \subseteq \Omega$.

En el contexto de la probabilidad, los elementos de un σ-álgebra son llamados eventos.


La propiedad 3 es conocida como cerradura bajo uniones numerables. Del mismo modo que con un álgebra, es posible deducir que un σ-álgebra es cerrado bajo intersecciones numerables.

Ejemplos. Dado $\Omega$ un conjunto cualquiera, su conjunto potencia $\mathscr{P}(\Omega)$ es un σ-álgebra sobre $\Omega$. Recordemos que

$$\mathscr{P}(\Omega) = \left\lbrace x \mid x \subseteq \Omega \right\rbrace.$$

Así, para ver que $\mathscr{P}(\Omega)$ es un σ-álgebra, debemos de verificar que cumple las tres propiedades de un σ-álgebra.

  1. Sabiendo que $\Omega \subseteq \Omega$, queda demostrado que $\Omega \in \mathscr{P}(\Omega)$.
  2. Sea $A \in \mathscr{P}(\Omega)$. Queremos demostrar que $A^{\mathsf{c}} \in \mathscr{P}(\Omega)$. Debido a que $A \in \mathscr{P}(\Omega)$, se sigue que $A \subseteq \Omega$. Debido a que $A^{\mathsf{c}}$ es el complemento de $A$ respecto a $\Omega$, este complemento está bien definido, y por lo tanto, $A^{\mathsf{c}} = \Omega \smallsetminus A$. Como $\Omega \smallsetminus A \subseteq \Omega$, se sigue que $A^{\mathsf{c}} \subseteq \Omega$. Es decir, $A^{\mathsf{c}} \in \mathscr{P}(\Omega)$.
  3. Sean $A_{1}, A_{2}, \ldots \in \mathscr{P}(\Omega)$. Debemos demostrar que $\bigcup_{i=1}^{\infty} A_{i} \in \mathscr{P}(\Omega)$. Sabiendo que $A_{1}, A_{2}, \ldots \in \mathscr{P}(\Omega)$, podemos ver que

    $$\forall i \in \mathbb{N}^{+}: A_{i} \subseteq \Omega.$$ Sea $a \in \bigcup_{i=1}^{\infty} A_{i}$. Esto implica que existe $n \in \mathbb{N}^{+}$ tal que $a \in A_{n}$. Por lo anterior, sabemos que $A_{n} \subseteq \Omega$, y en consecuencia, $a \in \Omega$. Como la elección de $a$ fue arbitraria, queda demostrado que $\bigcup_{i=1}^{\infty} A_{i} \subseteq \Omega$, y por lo tanto, $\bigcup_{i=1}^{\infty} A_{i} \in \mathscr{P}(\Omega)$.

Considerando nuevamente a $\Omega$ un conjunto cualquiera, el conjunto $\mathscr{F} = \{ \emptyset, \Omega \}$ es un σ-álgebra. La demostración de este hecho es muy sencilla, y se deja como tarea moral.

Para un ejemplo más explícito, considera a $\Omega$ como el siguiente conjunto.

\[ \Omega = \{ 1, 2, 3, 4, 5, 6 \}. \]

Sea $\mathscr{F}$ el siguiente conjunto:

\[ \mathscr{F} = \{ \emptyset, \{1, 3, 5\}, \{2, 4, 6\}, \{ 1, 2, 3, 4, 5, 6 \} \}. \]

Podemos ver que $\mathscr{F}$ es un σ-álgebra. Observa que $\{ 1, 2, 3, 4, 5, 6 \}$ es uno de los elementos de $\mathscr{F}$, así que cumple la primera propiedad. Después, para ver que cumple la segunda propiedad, hay que ver que para cada $A \in \mathscr{F}$ se cumple que $A^{\mathsf{c}} \in \mathscr{F}$. Para verlo, hay que revisar que se cumple para cada elemento de $\mathscr{F}$ satisface esa propiedad.

  1. Para $\emptyset$, $\emptyset^{\mathsf{c}} = \Omega$, el cual ya vimos que es un elemento de $\mathscr{F}$.
  2. Para $\{1, 3, 5\}$, observa que $\{1, 3, 5\}^{\mathsf{c}} = \{2, 4, 6\}$, el cual vemos que es uno de los elementos de $\mathscr{F}$.
  3. Similarmente, también se cumple para $\{2, 4, 6\}$, pues $\{2, 4, 6\}^{\mathsf{c}} = \{1, 3, 5\}$, que efectivamente es uno de los elementos de $\mathscr{F}$.
  4. Finalmente, para $\Omega$, se tiene que $\Omega^{\mathsf{c}} = \emptyset$, que también es uno de los elementos de $\mathscr{F}$.

Así, vemos que $\mathscr{F}$ satisface la segunda propiedad de un σ-álgebra. Finalmente, observa que $\mathscr{F}$ es un conjunto finito. En consecuencia, no podemos escoger una familia infinita numerable de elementos de $\mathscr{F}$. Así, para demostrar la tercera propiedad de un σ-álgebra en una familia finita de conjuntos, basta demostrar que se cumple la cerradura bajo uniones de dos conjuntos.

Esto lo podemos hacer porque si demostramos que es cerrada para uniones de dos conjuntos, digamos, que para cualesquiera $A, B \in \mathscr{F}$ se cumple $A \cup B \in \mathscr{F}$, entonces si $A$, $B$ y $C$ son conjuntos tales que $A \cup B, C \in \mathscr{F}$, entonces $(A \cup B) \cup C \in \mathscr{F}$. Es decir, la cerradura bajo uniones de dos conjuntos implica la cerradura bajo uniones de tres conjuntos. Similarmente, esta última implica la cerradura bajo uniones de cuatro, y esta la cerradura bajo uniones de cinco… Y así sucesivamente.

Bien, entonces veamos que se cumple la cerradura de uniones de cualesquiera dos conjuntos de $\mathscr{F}$.

  • Las uniones de cualquier elemento de $\mathscr{F}$ con $\emptyset$ son nuevamente un elemento de $\mathscr{F}$, pues si $A \in \mathscr{F}$, entonces $A \cup \emptyset = \emptyset \cup A = A \in \mathscr{F}$.
  • Veamos los casos para $\{ 1, 3, 5 \}$:
    • $\{1, 3, 5\} \cup \{ 2, 4, 6 \} = \{1, 2, 3, 4, 5, 6 \} \in \mathscr{F}$, así que se cumple la cerradura.
    • $\{1, 3, 5\} \cup \{ 1, 2, 3, 4, 5, 6 \} = \{1, 2, 3, 4, 5, 6\} \in \mathscr{F}$, también se cumple la cerradura.
  • Ahora, los casos para $\{ 2, 4, 6 \}$:
    • $\{2, 4, 6\} \cup \{1,3,5\} = \{1, 2, 3, 4, 5, 6\} \in \mathscr{F}$, se cumple la cerradura.
    • $\{2, 4, 6\} \cup \{1, 2, 3, 4, 5, 6\} = \{1, 2, 3, 4, 5, 6\} \in \mathscr{F}$, también se cumple.
  • El caso para $\{1, 2, 3, 4, 5, 6 \}$ es parecido al de $\emptyset$, pues para cualquier $A \in \mathscr{F}$ se cumple que $A \cup \{1, 2, 3, 4, 5, 6 \} = \{1, 2, 3, 4, 5, 6\} \cup A = \{1, 2, 3, 4, 5, 6\} \in \mathscr{F}$, ya que todos los elementos de $\mathscr{F}$ son subconjuntos de $\Omega$.

Un último ejemplo más interesante

Sea $\Omega = \mathbb{R}$, el conjunto de los números reales. Considera a los siguientes conjuntos:

\begin{align*}
J_{1} &= \left\lbrace (a,b] \mid a \in \mathbb{R} \land b \in \mathbb{R} \land a < b \right\rbrace, \\
J_{2} &= \left\lbrace (-\infty,a] \mid a \in \mathbb{R} \right\rbrace, \\
J_{3} &= \left\lbrace (a, \infty) \mid a \in \mathbb{R} \right\rbrace.
\end{align*}

Es decir, $J_{1}$ es el conjunto cuyos elementos son todos los intervalos acotados, semi-cerrados por la derecha. Por otro lado, $J_{2}$ es el conjunto de intervalos cerrados por la derecha, y sin cota inferior. Finalmente, $J_{3}$ es el conjunto que tiene por elementos a todos los intervalos abiertos por la izquierda, y sin cota superior.

A partir de $J_{1}$, $J_{2}$ y $J_{3}$, definamos el siguiente conjunto:

\[ J = J_{1} \cup J_{2} \cup J_{3}. \]

El conjunto $J$ simplemente junta a todos los tipos de intervalos descritos más arriba. Después, para cada $n \in \mathbb{N}$, definamos los siguientes conjuntos auxiliares:

\[ B_{n} = \left\lbrace \bigcup_{i=1}^{n} A_{i} \; \middle| \; \forall i,j \in \left\lbrace 1, \ldots, n \right\rbrace : (A_{i} \in J \land (i \neq j \implies A_{i} \cap A_{j} = \emptyset)) \right\rbrace. \]

Esto es, para cada $n \in \mathbb{N}$, $B_{n}$ es el conjunto cuyos elementos son subconjuntos de $\mathbb{R}$ tales que son el resultado de hacer la unión de exactamente $n$ intervalos ajenos de $J$. Por ejemplo, $B_{1}$ son los subconjuntos de $\mathbb{R}$ que resultan de unir exactamente $1$ intervalo de $J$. Es decir, es el mismo $J$. $B_{2}$ son los subconjuntos de $\mathbb{R}$ que resultan al unir exactamente $2$ intervalos ajenos de $J$. Y así, sucesivamente. Como convención, $B_{0} = \{ \emptyset \}$, pues $\emptyset$ es el único subconjunto de $\mathbb{R}$ que resulta de unir $0$ intervalos.

Ahora, considera el siguiente conjunto $\mathscr{F}$:

\[ \mathscr{F} = \bigcup_{n=0}^{\infty} B_{n}. \]

Así, $\mathscr{F}$ es el conjunto cuyos elementos son todas las uniones finitas de intervalos ajenos en $J$. Es posible (e interesante) demostrar que $\mathscr{F}$ es un álgebra de subconjuntos de $\mathbb{R}$. Sin embargo, $\mathscr{F}$ no es un σ-álgebra. Por ejemplo, si para cada $n \in \mathbb{N}^{+}$ tomamos los conjuntos $E_{n} = (0, 1 – (1/n)]$, vemos que en $E_{1}, E_{2}, \ldots \in \mathscr{F}$, pero $\bigcup_{n=1}^{\infty} E_{n} = (0,1) \notin \mathscr{F}$.


Tarea moral

Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu manejo de los conceptos abordados en esta entrada.

  1. Sea $\Omega = \{ 1, 2, 3, 4, 5, 6 \}$. Determina si las siguientes familias de subconjuntos de $\Omega$ son σ-álgebras.
    • $\mathscr{F}_{1} = \{ \emptyset, \{ 1, 2 \}, \{3, 4\}, \{3, 4, 5, 6\}, \{1, 2, 5, 6 \}, \{1, 2, 3, 4, 5, 6 \} \}$.
    • $\mathscr{F}_{2} = \{ \emptyset, \{1\}, \{3\}, \{1,3\}, \{2,3,4,5,6\}, \{1,2,4,5,6\}, \{2,4,5,6\}, \{1,2,3,4,5,6\}\}.$
  2. A partir de la definición de álgebra, demuestra que si $\mathscr{F}$ es un álgebra sobre $\Omega$, entonces también cumple las siguientes propiedades:
    • $\emptyset \in \mathscr{F}$.
    • Si $A_{1}, A_{2}, \ldots A_{n} \in \mathscr{F}$, entonces $\bigcap_{i=1}^{n} A_{i} \in \mathscr{F}$ (sugerencia: aprovecha las propiedades 2 y 3 de un álgebra, y recurre a las leyes de De Morgan).
    • Si $A, B \in \mathscr{F}$, entonces:
      • $B \smallsetminus A \in \mathscr{F}$.
      • $A \triangle B \in \mathscr{F}$.
  3. A partir de la definición σ-álgebra, demuestra que si $\mathscr{F}$ es un σ-álgebra sobre $\Omega$, entonces también cumple las siguientes propiedades:
    • $\mathscr{F}$ es un álgebra.
    • Si $A_{1}, A_{2}, \ldots \in \mathscr{F}$, entonces $\bigcap_{i=1}^{\infty} A_{i} \in \mathscr{F}$ (sugerencia: aprovecha las propiedades 2 y 3 de un σ-álgebra, y recurre a las leyes de De Morgan).
  4. Demuestra que dado $\Omega$ un conjunto cualquiera, el conjunto $\mathscr{F} = \{ \emptyset, \Omega \}$ es un σ-álgebra sobre $\Omega$.
  5. Si $\Omega$ es un conjunto finito, ¿es posible construir un álgebra que no sea σ-álgebra?

Más adelante…

En esta entrada definimos dos de las piedras angulares de la teoría de la probabilidad, el espacio muestral y los σ-álgebras. Por un lado, el espacio muestral deja claro cuáles son los posibles resultados de un experimento aleatorio. Por otra parte, un σ-álgebra del espacio muestral es el que determina los conjuntos que podremos medir. En la siguiente entrada abordaremos la construcción de σ-álgebras a partir de una colección dada de subconjuntos de $\Omega$. Con ello, veremos un σ-álgebra muy importante que puede ser construido de distintas maneras. En particular, puede hacerse utilizando el álgebra de nuestro último ejemplo.

Entradas relacionadas