Álgebra Lineal II: Teorema de Gauss

Por Diego Ligani Rodríguez Trejo

Introducción

En la entrada anterior vimos un recordatorio de las formas bilineales, cuadráticas y sus polares. En esta entrada continuaremos recordando algunas propiedades vistas previamente enfocándonos en el teorema de Gauss y su demostración. Esto nos dará una pequeña pista de la relación entre las formas cuadráticas y matrices.

Además, con el teorema de Gauss obtendremos un algoritmo para poder escribir cualquier forma cuadrática en una forma estandarizada. Esto nos llevará más adelante a plantear la ley de inercia de Sylvester.

Preparaciones para el teorema de Gauss

Antes de empezar con el teorema, veamos una propiedad de las formas cuadráticas en $\mathbb{R}^n$. Tomemos $e_1,\ldots, e_n$ la base canónica de $\mathbb{R}^n$. Tomemos $q$ una forma cuadrática de $\mathbb{R}^n$ y $b$ su forma polar.

Cualquier vector $x=(x_1,\ldots,x_n)$ de $\mathbb{R}^n$ se escribe como $ (x_1,\ldots,x_n)=\sum_{i=1}^n x_i e_i$. Por lo que hicimos en la entrada anterior tenemos entonces:

$$q(x)=b(x,x)=\sum_{i=1}^n \sum_{j=1}^n x_i x_j b(e_i, e_j).$$

Para simplificar la notación definamos $a_{ij}:=b(e_i,e_j)$. Podemos «ver» todos los sumandos en la siguiente expresión:

\begin{align*} q(x)& =x_1^2a_{11}+ x_1x_2a_{12} + \dots + x_1x_na_{1n} \\
&+x_2x_1a_{21}+ x_2^2a_{22} + \dots +x_2x_na_{2n} \\
&\vdots \qquad \qquad \qquad \qquad \qquad \qquad \\
&+x_nx_1a_{n1} + x_nx_2a_{n2} + \dots + x_n^2 a_{nn} \end{align*}

Aquí hay algunos términos «puros» de la forma $a_{ii}x_i^2$. Se encuentran en la «diagonal». Tenemos también algunos términos «mixtos» de la forma $a_{ij}x_ix_j$ con $i\neq j$. Por la simetría de $b$, en los términos mixtos tenemos $a_{ij}=a_{ji}$. Al separar en términos puros y mixtos obtenemos entonces la siguiente expresión:

\begin{align}q(x)= \sum_{i=1}^na_{ii}x_i^2+ 2\sum_{1 \leq i < j \leq n} a_{ij} x_i x_j .\end{align}

Usaremos esto más abajo.

Teorema de Gauss de formas cuadráticas

Teorema. Sea $q$ una forma cuadrática en $V=\mathbb{R}^n$. Existen reales $\alpha_1, \dots , \alpha_r $ y formas lineales $l_1, \dots l_r$ de $V$ linealmente independientes tales que, para todo $x \in V$ se tiene
$$q(x)= \sum_{i=1}^r \alpha _i (l_i(x))^2.$$

Recordemos que la independencia lineal de las formas $l_1,\ldots,l_r$ sucede en el espacio dual $V^*$.

Demostración. Procedamos por inducción sobre $n$. De la igualdad $(1)$, cuando $n=1$ la forma cuadrática es de la forma $q(x)=a_{11}x_1^2$. Al definir $\alpha_1=a_{11}$ y $l_1(x)=x_1$ obtenemos la forma deseada.

Supongamos que el teorema se cumple para $n-1$. De la igualdad $(1)$ sabemos que $q$ se puede escribir como sigue:

\begin{align*} q(x)= \sum_{i=1}^n a_{ii} x_i^2 + 2\sum_{1 \leq i < j \leq n} a_{ij} x_ix_j. \end{align*}

Tenemos tres posibilidades:

  • Que todos los $a_{ii}$ y todos los $a_{ij}$ sean cero. Este caso es inmediato pues entonces $q$ es la forma cuadrática cero y podemos tomar $l_1(x)=x_1$ y $\alpha_1=0$.
  • Que algún $a_{ii}$ sea distinto de cero.
  • Que todos los $a_{ii}$ sean cero, pero algún $a_{ij}$ sea distinto de cero.

Hagamos cada uno de los últimos dos casos por separado. Comencemos por el caso en el que algún $a_{ii}$ es distinto de cero. Sin pérdida de generalidad (¿por qué?) podemos suponer que es $a_{nn}$.

Apartando los términos que tienen $x_n$ de los que no obtenemos:

\begin{align*} \sum_{i=1}^n a_{ii}x_i^2=a_{nn} x_n^2 + \sum_{i=1}^{n-1} a_{ii} x_i^2. \end{align*}

y

\begin{align*} 2\sum_{1 \leq i < j \leq n} a_{ij}x_ix_j= 2\left(\sum_{i=1}^{n-1} a_{in} x_i\right)x_n + 2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j\end{align*}

Con esto

\begin{align*} q(x)=a_{nn}x_n^2 + 2\left(\sum_{i=1}^{n-1} a_{in} x_i\right)x_n + \sum_{i=1}^{n-1} a_{ii} x_i^2 + 2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j .\end{align*}

Si bien esta expresión se ve complicada, en realidad podemos pensar que en términos de la variable $x_n$ es «simplemente una cuadrática». Basados en los primeros dos términos podemos completar un binomio al cuadrado como sigue:

\begin{align*} q(x)= a_{nn} \left(x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2- a_{nn}\left(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2 + \sum_{i=1}^{n-1} a_{ii}x_i^2+2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j.\end{align*}

Notemos que la expresión

\begin{align*} – a_{nn}\left(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2 + \sum_{i=1}^{n-1} a_{ii}x_i^2+2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j \end{align*}

ya no tiene a la variable $x_n$ y que de hecho es una forma cuadrática en las variables $x_1,\ldots, x_{n-1}$ (¿por qué?). De este modo, podemos aplicarle hipótesis inductiva para obtener que existen escalares $\alpha_1,\ldots, \alpha_r$ y formas lineales $l’_1,\ldots,l’_r$ linalmente independientes de $\mathbb{R}^{n-1}$ tales que

\begin{align*} q'(x_1,\dots , x_{n-1})= \sum_{i=1}^r \alpha_i (l_i'(x))^2.\end{align*}

Si bien estas $l’_i$ son formas lineales de $\mathbb{R}^{n-1}$, también podemos pensarlas como formas lineales de $\mathbb{R}^n$. Formalmente, tomamos $l_i:\mathbb{R}^n\to \mathbb{R}$ dada por $l_i(x_1,\ldots,x_n)=l’_i(x_1,\ldots,x_{n-1})$. Para finalizar, definimos

\begin{align*} l_{r+1}(x_1, \dots , x_n)= x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \text{,} \qquad \alpha_{r+1}=a_{nn}.\end{align*}

De aquí, obtenemos la expresión deseada para $q$:

\begin{align*} q(x)= \sum_{i=1}^{r+1} \alpha_i (l_i(x))^2 \end{align*}

Falta argumentar por qué las $l_i$ son linealmente independientes. Si una combinación lineal de ellas da cero, como $l_{r+1}$ es la única que involucra a $x_n$, entonces su coeficiente debe ser cero. Así, obtendríamos una combinación lineal de $l_1,\ldots,l_r$ igualada a cero. Pero esta es una combinación lineal de $l’_1,\ldots,l’_r$. Por hipótesis inductiva, estas son linealmente independientes así que todos los coeficientes deben ser cero.

Lo anterior termina el caso para cuando hay algún «término puro». Falta el caso en el que todos los «términos puros» tienen coeficiente cero, pero hay por lo menos un «término mixto». Por la igualdad $(1)$ tenemos que la forma cuadrática se ve así:

\begin{align*}q(x)= 2\sum_{1 \leq i < j \leq n} a_{ij} x_i x_j .\end{align*}

Sin pérdida de generalidad podemos suponer que el término mixto que no es cero es el $a_{n-1,n}$ (¿por qué?). La idea es ahora separar a los términos que tienen $x_{n-1}$ ó $x_n$ de los que no, y utilizar la siguientes identidades algebraicas que se valen para cualesquiera $A,B,C, D, E$ (haz las cuentas):

\begin{align} Ax_{n-1}x_n+Bx_{n-1}+Cx_n=A\left(x_{n-1}+\frac{C}{A}\right) \left(x_n+\frac{B}{A}\right)-\frac{BC}{A},\end{align}

\begin{align} DE= \frac{1}{4}(D+E)^2 – \frac{1}{4} (D-E)^2.\end{align}

Al realizar la separación nos queda:

\begin{align*} q(x)= 2a_{n-1,n}x_{n-1}x_n +2\sum_{i=1}^{n-2}a_{in}x_ix_n+ 2\sum_{i=1}^{n-2}a_{i,n-1}x_ix_{n-1} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij}. \end{align*}

Así, podemos usar la identidad $(2)$ con los siguientes valores

\begin{align*}
A &=2a_{n-1.n},\\
B&=2\sum_{i=1}^{n-2}a_{i,n-1}x_i,\\
C&=2\sum_{i=1}^{n-2}a_{i,n}x_i
\end{align*}

para obtener que $q$ es:

\begin{align*} A\left(x_{n-1}+\frac{C}{A}\right) \left(x_n+\frac{B}{A}\right)-\frac{BC}{A} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \end{align*}

Al primer sumando podemos reescribirlo usando la identidad $(3)$ como

\begin{align*}\frac{A}{4}\left(x_{n-1}+x_n+\frac{B+C}{A}\right)^2-\frac{A}{4}\left( x_{n-1}-x_n-\frac{B-C}{A}\right)^2 \end{align*}

A la expresión conformada por los últimos dos sumandos le podemos aplicar hipótesis inductiva (¿por qué?) para escribirla de la forma \begin{align*} q'(x_1, \dots , x_{n-2})= \sum_{i=1}^r \alpha’_i (l’_i(x_1, \dots , x_{n-2}))^2 \end{align*} con $l’_1,\ldots, l’_r$ formas lineales linealmente independientes de $\mathbb{R}^{n-2}$. Como en el caso anterior, podemos «convertir» estas formas lineales a formas lineales $l_1,\ldots,l_r$ en $\mathbb{R}^n$. Al agregar las siguientes dos formas lineales

\begin{align*}
l_{r+1}(x)&= x_{n-1}+x_n+\frac{B+C}{A}\\
l_{r+2}(x)&= x_{n-1}-x_n-\frac{B-C}{A}
\end{align*}

y tomar $\alpha_{r+1}=\frac{A}{4}$, $\alpha_{r+2}=-\frac{A}{4}$, obtenemos la expresión deseada:
\begin{align*} q(x)= \sum_{i=1}^{r+2} \alpha_i (l_i(x))^2. \end{align*}

La demostración de que en efecto $l_1,\ldots,l_{r+2}$ son linealmente independientes queda como ejercicio.

Así por principio de inducción tenemos que el teorema de Gauss se cumple para cualquier forma cuadrática $q$ en $\mathbb{R}^n$ para todo $n\geq 1$ entero.

$\square$

Más adelante…

Debido a la longitud de esta demostración, los ejemplos serán reservados para la siguiente entrada.

Las formas cuadráticas, aunque interesantes, muestran estar limitadas por cómo las definimos, ya que se definen sólo en espacios vectoriales reales. En las siguientes entradas expandiremos un poco esta definición para también abarcar al menos espacios vectoriales complejos y luego nos enfocaremos en un tipo especial de éstas.

Además, al principio de la entrada se dieron pistas a que existe una relación entre formas bilineales y matrices, esto será explorado posteriormente.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea $q$ una forma cuadrática en $\mathbb{R}^n$ y $x=(x_1, \dots, x_n)$. Muestra que \begin{align*} q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \text{ con } a_{ij}=b(e_i,e_j). \end{align*}
  2. Sea $A$ la matriz con entradas $a_{ij}$ dadas en el problema anterior. ¿Qué podrías afirmar acerca de $A$ sin importar la $q$ elegida?
  3. Sea $A=[a_{ij}]$ una matriz simétrica en $M_n(\mathbb{R})$ y definamos
    \begin{align*} q: \mathbb{R}^n \rightarrow \mathbb{R} \text{ dada por } q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \end{align*} ¿Es $q$ así definida una forma cuadrática? ¿Es necesario que $A$ sea simétrica?
  4. Demuestra que las formas lineales definidas en el segundo caso de la demostración del teorema de Gauss en efecto son linealmente independientes.
  5. Sean $\alpha _1, \dots , \alpha_r $ números reales y $l_1 , \dots , l_r$ formas lineales, linealmente independientes en $\mathbb{R}^n$ y $x \in \mathbb{R}^n$. Definamos $q$ como sigue:
    \begin{align*} q(x)=\sum_i^n \alpha_i l_i(x)\end{align*}
    ¿Es $q$ así definida una forma cuadrática en $\mathbb{R}^n$?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Probabilidad I-Videos: Probabilidad geométrica

Por Aurora Martínez Rivas

Introducción

La definición “clásica” se usó durante muchos años, pero luego de analizar algunos ejemplos especiales, estos llevaron a cierta modificación de la definición y a la construcción de un concepto de probabilidad para los casos en los que es concebible incluso un conjunto infinito de resultados. Este concepto es el de probabilidad geométrica.

Probabilidad geométrica

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE 104721: “Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM”. Sitio web del proyecto: https://www.matematicasadistancia.com.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

En un plano sea $\Omega$ cierta región y supongamos en ella hay otras dos regiones $A$ y $B$, todas con área finita y bien definida. Prueba que la definición de la probabilidad geométrica usando como medida el área, satisface las siguientes propiedades:

  • $P(\emptyset)=0$ y $P\left(\Omega\right)=1$.
  • $P\left(A\right)\geq0$ para cualquier evento A.
  • $P\left(A^c\right)=1-P(A)$.
  • $P\left(A\bigcup B\right)=P\left(A\right)+P(B)$ cuando A y B son ajenos.
  • $P(A\bigcup\ B)=P\left(A\right)+P\left(B\right)-P(A\bigcap\ B)$. 

Más adelante…

Así como la probabilidad geométrica ayuda a extender la definición de probabilidad clásica para casos con un espacio muestral no finito, en la siguiente entrada de video veremos la interpretación frecuentista de la probabilidad que nos brinda una alternativa para cuando no necesariamente los posibles resultados son equiprobables.

Entradas relacionadas

Variable Compleja I: El campo de los números complejos $\mathbb{C}$

Por Pedro Rivera Herrera

Introducción

Aunque la teoría de los números complejos ha ido formalizándose a lo largo del tiempo, el término «imaginario» ha trascendido hasta nuestros días. Es claro que dicha expresión está ligada con la concepción con la que surgieron dichos números y que es simplemente una forma para referirse a dichos números. El término «complejo» fue introducido por primera vez por el matemático Carl Friedrich Gauss, mientras que el símbolo $i$, para denotar a $\sqrt{-1}$, fue introducido por primera vez por el matemático Leonhard Euler.

Durante el siglo XVI se encontraron soluciones para las ecuaciones $x^2+2x+2 = 0$ y $x^3=6x+4$, tales como $1+\sqrt{-1}$ y $\sqrt[3]{2+\sqrt{-2}}+\sqrt[3]{2-\sqrt{-2}}$ respectivamente, lo cual generó incertidumbre entre los matemáticos de la época, puesto que expresiones como $\sqrt{-1}$ y $\sqrt{-2}$ no tenían sentido. Conforme se iba desarrollando la teoría de los números complejos, para evitar expresiones como las anteriores, se optó por definir una nueva cantidad, la unidad imaginaria, denotada por el símbolo $i$, la cual es caracterizada por cumplir la propiedad $i^2 = -1$, es decir, es la raíz cuadrada de $-1$. Considerando esta notación las expresiones $\sqrt{-1}$ y $\sqrt{-2}$ ahora pueden reescribirse como $i$, $i\sqrt{2}$, respectivamente.

El campo de los números complejos $\mathbb{C}$

Definición 2.1. (El campo de los números complejos.)
El campo de los números complejos, denotado por $\mathbb{C}$, es el conjunto formado por pares ordenados de números reales $z=(a, b)$, dotado con las operaciones binarias de suma y multiplicación definidas respectivamente como:

\begin{equation*}
(a, b) + (c, d) = (a+c, b+d). \tag{2.1}
\end{equation*}

\begin{equation*}
(a, b) \cdot (c, d) = (ac – bd, ad + bc). \tag{2.2}
\end{equation*}

Considerando a $(0,0)$ y $(1,0)$ como los neutros aditivo y multiplicativo respectivamente, es decir, tales que para todo $z=(a,b)\in\mathbb{C}$:

\begin{equation*}
(0,0) + (a,b) = (a,b).
\end{equation*}

\begin{equation*}
(1,0) \cdot (a,b) = (a,b).
\end{equation*}

Y para $z=(a, b) \in \mathbb{C}$ distinto de cero, su inverso multiplicativo, denotado como $z^{-1}$, dado por:
\begin{equation*}
z^{-1} = \left( \frac{a}{a^2 + b^2}, \frac{-b}{a^2 + b^2} \right),
\end{equation*}

es decir, es tal que:

\begin{equation*}
z \cdot z^{-1} = (1,0).
\end{equation*}

Entonces es fácil verificar, usando las propiedades de los números reales, que $\mathbb{C}$ con la suma y el producto recién definidos satisface las propiedades de campo.

Observación 2.1.
Sean $a, b, c, d$ números reales. Sabemos que las parejas ordenadas $(a, b)$ y $(c, d)$ son iguales, es decir $(a, b) = (c, d)$, si y solo si $a=c$ y $b=d$, por lo que la igualdad entre números complejos está sujeta a dicha condición.
Además, si $a \neq b$, entonces $(a, b) \neq (b, a)$, esto es, como parejas ordenadas $(a, b)$ y $(b, a)$ son diferentes, por lo que como números complejos también lo son.

Procedemos ahora a analizar un subconjunto importante de los números complejos, es decir los números de la forma $z = (a, 0)$, con $a \in \mathbb{R}$. A partir de ahora denotaremos al número real $a$ por el número complejo $(a, 0)$.

Observación 2.2
Sean $a, b \in \mathbb{R}$, entonces:

\begin{equation*}
(a, 0) + (b, 0) = (a+b, 0), \quad \text{es decir} \quad a+b.
\end{equation*}

\begin{equation*}
(a, 0) \cdot (b, 0) = (ab, 0), \quad \text{es decir} \quad ab.
\end{equation*}

Notamos que los números complejos de la forma $(a, 0)$ se comportan con respecto a la suma y la multiplicación definidas en (1) y (2) como los números reales. Lo anterior se debe a que el mapeo $a \mapsto (a,0)$ define un isomorfismo de $\mathbb{R}$ en $\mathbb{C}$, es decir:

Proposición 2.1.
La función $\phi: \mathbb{R} \rightarrow \mathbb{C}$ dada por $\phi(a) = (a,0)$ satisface:

  1. $\phi$ es inyectiva.
  2. $\varphi(a+b) = \varphi(a)+\varphi(b)$ y $\varphi(ab) = \varphi(a)\cdot\varphi(b)$.
  3. $\varphi(0) = (0,0)$ y $\varphi(1) = (1,0)$.
  4. $\varphi(-a) = -\varphi(a)$.
  5. Si $a \in \mathbb{R}$, con $a\neq0$, entonces $\varphi(a^{-1}) = \left(\varphi(a)\right)^{-1}$.

Demostración.

  1. La inyectividad se sigue de la observación 2.1.
  2. Observación 2.2.
  3. Se sigue de la definición.
  4. Se deja como ejercicio al lector.
  5. Supongamos que $a \in \mathbb{R}$, con $a \neq 0$, entonces $\phi(a) = (a, 0) \neq (0,0)$ y :

\begin{equation*}
(1, 0) = \phi(1) = \phi(a a^{-1}) = \phi(a)\cdot\phi\left(a^{-1}\right).
\end{equation*}

Entonces $\phi\left(a^{-1}\right) = \left(\phi(a)\right)^{-1}$.

$\blacksquare$

De acuerdo con este resultado, podemos trabajar de manera indistinta con este conjunto de números complejos y los números reales, como si fuesen el mismo conjunto.

Por otra parte, el conjunto de los números complejos de la forma $(0,b)$, con $b \in \mathbb{R}$, será considerado como el conjunto de los números imaginarios puros.

Si definimos a $i:=(0, 1)$, la unidad imaginaria, entonces notamos que:

\begin{equation*}
i^2 = (0, 1) \cdot (0, 1) = (0 – 1, 0) = (-1, 0), \quad \text{es decir} \quad -1.
\end{equation*}
De esta forma podemos concluir que $i = (0, 1)$ es la raíz cuadrada de $-1$. Además tenemos que:

\begin{equation*}
a + ib = (a, 0) + (0, 1) \cdot (b, 0) = (a, 0) + (0, b) = (a, b).
\end{equation*}

De acuerdo a lo anterior, es posible dar la siguiente:

Definición 2.2. (Número complejo.)
Un número complejo es un número de la forma $z = a+ib$ donde $a$ y $b$ son números reales e $i$ es la unidad imaginaria.
Al número real $a$ se le conoce como la parte real de $z$ y se denota como Re$(z)$, mientras que al número real $b$ se le conoce como la parte imaginaria de $z$ y se le denota como Im$(z)$. Además, si Re$(z) = 0$, entonces se dice que $z$ es un número imaginario puro.

Ejemplo 2.1.

  • a) Si $z = 9 \,-\, 6i$, entonces Re$(z) = 9$, mientras que Im$(z) = -6$.
  • b) Si $z = -8i$, entonces Re$(z) = 0$, mientras que Im$(z) = -8$. En este caso $z$ es un número imaginario puro.

Considerando la definición 2.2 y la proposición 2.1, es posible considerar a $\mathbb{R}$ como un subconjunto de $\mathbb{C}$, de forma que todo número real es un número complejo cuya parte imaginaria es igual a cero.

Definición 2.3. (Conjugado de un número complejo.)
Dado un número complejo $z=a+ib$, se define el conjugado de $z$ como el número complejo:
\begin{equation*}
\overline{z} = a \,-\, ib.
\end{equation*}

Ejemplo 2.2.

  • a) Si $z = 6 + 5i$, entonces $\bar{z} = 6 \,-\, 5i$.
  • b) Si $z = -5 – i$, entonces $\bar{z} = -5 + i$.

Definición 4. (Operaciones Aritméticas).
Sean $z_1 = a_1 + ib_1, z_2 = a_2 + i b_2 \in \mathbb{C}$, entonces se definen las siguientes operaciones:

  1. Suma.
    \begin{equation*}
    z_1 + z_2 = (a_1 + ib_1) + (a_2 + i b_2) = (a_1 + a_2) + i(b_1 + b_2)
    \end{equation*}
  2. Resta.
    \begin{equation*}
    z_1 – z_2 = (a_1 + ib_1) – (a_2 + i b_2) = (a_1 – a_2) + i(b_1 – b_2).
    \end{equation*}
  3. Multiplicación.
    \begin{equation*}
    z_1 \cdot z_2 = (a_1 + ib_1) \cdot (a_2 + i b_2) = (a_1a_2 – b_1b_2) + i (b_1a_2 + a_1b_2).
    \end{equation*}
  4. División. Para $z_2 \neq 0$:
    \begin{equation*}
    \frac{z_1}{z_2} = \frac{a_1 + ib_1}{a_2 + i b_2} \frac{a_2 – ib_2}{a_2 – i b_2} =\left(\frac{a_1 a_2 + b_1 b_2}{a_2^2 + b_2^2}\right) + i\left( \frac{b_1a_2 – a_1 b_2}{a_2^2 + b_2^2}\right).
    \end{equation*}

Observación 2.3.
Notemos que si $z=a+ib \in \mathbb{C}$, entonces:
\begin{equation*}
z \cdot \overline{z} = (a+ib) \cdot (a-ib) = (a^2 – (-b^2)) + i(ab-ab) = a^2 + b^2.
\end{equation*}
\begin{equation*}
z + \overline{z} = (a+ib) + (a-ib) = 2a = 2\,\text{Re}(z), \quad \Longrightarrow \quad \text{Re}(z) = \frac{ z + \overline{z}}{2}.
\end{equation*}
\begin{equation*}
z – \overline{z} = (a+ib) – (a-ib) = 2ib = 2\,i\,\text{Im}(z), \quad \Longrightarrow \quad \text{Im}(z) = \frac{ z – \overline{z}}{2i}.
\end{equation*}

Observación 2.4.
A partir de ahora, si es claro que se está efectuando el producto entre números complejos, entonces se omitirá el símbolo “$\cdot$” para indicarlo.

Ejemplo 2.3.
Sean $z_1 = 2 + 4i$ y $z_2 = -3 + 8i$. Calculemos:

  • a) $ \quad z_1 + z_2$,
  • b) $\quad z_1 z_2$.

Solución.

  • a) $ \quad z_1 + z_2 = (2 + 4i) + (-3 + 8i) = (2-3) + (4+8)i = -1 + 12i$.
  • b) $ \quad z_1 z_2 = (2 + 4i) (-3 + 8i) = \left[2(-3) – 4(8)\right] + \left[4(-3) + 2(8)\right]i = -38 + 4i$.

De acuerdo con las definiciones 2.3 y 2.4 es fácil probar las siguientes propiedades:

Proposición 2.2.
Sean $z, w \in \mathbb{C}$, entonces:

  1. $\overline{z \pm w} = \overline{z} \pm \overline{w}$.
  2. $\overline{z w} = \overline{z} \,\overline{w}$.
  3. Si $w \neq 0$, entonces $\overline{\left(\frac{z}{w}\right)} = \frac{\overline{z}}{\overline{w}}$.
  4. $\overline{\overline{z}} = z$.
  5. $z$ es un número real si y solo si $z = \overline{z}$.

Demostración. Sean $z=a_1 + i b_1$ y $w=a_2 + i b_2$, tenemos que:


  1. \begin{align*}
    \overline{z+w} & = \overline{(a_1 + i b_1) + (a_2 + i b_2)} \\
    & = \overline{(a_1 + a_2) + i (b_1 + b_2)} \\
    & = (a_1 + a_2) – i (b_1 + b_2) \\
    & = (a_1 – ib_2) + (a_2 – i b_2) \\
    & = \overline{a_1 + ib_1} + \overline{a_2 + i b_2}\\
    & = \overline{z} + \overline{w}.
    \end{align*}
  1. Ejercicio.
  2. Si $w \neq 0$, entonces:
    \begin{align*}
    \overline{\left(\frac{z}{w}\right)} & = \overline{\left(\frac{a_1 + i b_1}{a_2 + i b_2}\right)} \\
    & = \overline{\left(\frac{a_1 a_2 + b_1 b_2 }{a_1^2 + a_2^2}\right) + i \left(\frac{b_1 a_2 – a_1 b_2 }{a_1^2 + a_2^2}\right)}\\
    & = \left(\frac{a_1 a_2 + b_1 b_2 }{a_1^2 + a_2^2}\right) – i \left(\frac{b_1 a_2 – a_1 b_2 }{a_1^2 + a_2^2}\right)\\
    & = \frac{\overline{\left(a_1 + i b_1\right)}}{\overline{\left(a_2 + i b_2\right)}}\\
    & = \frac{\overline{z}}{\overline{w}}.
    \end{align*}
  1. Ejercicio.
  1. Ejercicio.

Observación 2.5.
Notemos que las propiedades 1 y 2 de la proposición 2.2 se pueden generalizar mediante inducción matemática para un número finito de números complejos, esto es, para $z_1, z_2, \ldots, z_n \in \mathbb{C}$, $n\geq2$, se cumple que:
\begin{equation*}
\overline{z_1 + z_2 + \cdots + z_n} = \overline{z_1} +\overline{z_2} + \cdots + \overline{z_n}.
\end{equation*}

\begin{equation*}
\overline{z_1 z_2 \cdots z_n} = \overline{z_1} \, \overline{z_2} \,\overline{z_n}. \end{equation*}

Tarea moral

  1. Verifica que el conjunto de los números complejos $\mathbb{C}$ con las operaciones definidas en (2.1) y (2.2) satisface los axiomas de campo, es decir, verificar las propiedades de la definición de campo.
  2. En la proposición 2.1 argumenta porqué se cumple la suprayectividad de la función en el inciso 1 y completa la demostración del inciso 4.
  3. Completa las demostraciones de los incisos (1), (2), (4) y (5) de la proposición 2.2.
  4. Prueba los resultados de la observación 2.5 utilizando inducción matemática. ¿Se puede generalizar la propiedad (3) de la proposición 2.2?
  5. Identifica la parte real y la parte imaginaria de los siguientes números complejos:
  • a) $\dfrac{3+5i}{1 + 7i}$.
  • b) $\left(\dfrac{-1+i\sqrt{3}}{2}\right)^3$.
  • c) $\left(\dfrac{i}{3-i}\right) \left(\dfrac{1}{2+3i}\right)$.

Más adelante…

En esta segunda entrada hemos dado una definición formal de lo que es un número complejo. Realizamos la construcción del campo de los números complejos, analizando la relación que existe entre $\mathbb{R}$ y $\mathbb{C}$ como conjuntos. También definimos las operaciones aritméticas básicas de estos números e introducimos una nueva operación llamada la conjugación compleja.

Es importante notar que la extensión del campo de los números reales al campo de los números complejos nos permite dar solución a ecuaciones como $z^2 + 1 = 0$, la cual en $\mathbb{R}$ no tenía solución, mientras que en $\mathbb{C}$ tenemos que los números $z = \pm i$ satisfacen dicha ecuación. En general, notaremos que el campo de los números complejos $\mathbb{C}$ es algebraicamente cerrado, de hecho es la clausura algebraica de $\mathbb{R}$, por lo que siempre será posible hallar soluciones para polinomios con coeficientes en $\mathbb{C}$ de grado $n\geq1$. Más aún, dichos polinomios tendrán exactamente $n$ raíces, lo cual probaremos más adelante cuando veamos el Teorema Fundamental del Álgebra.

En la siguiente entrada daremos una interpretación geométrica de estos números y sus operaciones, por lo que definiremos una nueva cantidad en $\mathbb{C}$ que nos permitirá realizar una mejor comprensión y caracterización de estos números de acuerdo con su posición en un plano, así como la obtención de nuevos resultados y propiedades que nos permitan diferenciarlos de los números reales.

Entradas relacionadas

Álgebra Superior II: Compatibilidad del orden con las operaciones de los naturales

Por Roberto Manríquez Castillo

Introducción

En las entradas anteriores, nos encargamos de definir con toda formalidad la estructura con la que hemos estado familiarizados desde hace mucho; sin embargo, en principio, la forma en que definimos el orden y las distintas operaciones, no parece ser que.

Para finalizar con el estudio de los números naturales, veremos las importantes relaciones que hay entre el orden que definimos para $\mathbb{N}$ en la entrada anterior, y las operaciones que hemos trabajado a lo largo de este tema. Para esto, nuevamente ocuparemos el Principio de Inducción.

Una equivalencia del orden

Aunque como mencionamos en la introducción, la forma en que definimos el orden, no parece tener mucha relación con las operaciones definidas, usando la definición de la suma, podemos dar una definición equivalente del orden en $\mathbb{N}$, en el siguiente teorema, demostramos que en efecto, ambas caracterizaciones son equivalentes.

Teorema.Si $n,m$ son números naturales, se tiene que $n<m$ si y sólo si existe $k\in\mathbb{N}\setminus\{0\}$ tal que n+k=m.

Demostración. Procedamos por inducción sobre $n$.

Si $n=0$, si $0<m$, entonces $m\in \mathbb{N}\setminus\{0\}$ y $n+m=0+m=m$. Recíprocamente, si existe $k\in\mathbb{N}\setminus\{0\}$ tal que $0+k=m$, tendremos que $k=m$, por lo que $m\neq 0$ y por lo tanto $0<m$. Con esto probamos la base de inducción.

Supongamos que el resultado es válido para alguna $n$ y probemos que el resultado para $\sigma(n)$ es decir, que si $m\in\mathbb{N}$ se tiene que $\sigma(n)<m\Leftrightarrow$ existe $k\in\mathbb{N}\setminus\{0\}$ tal que $\sigma(n)+k=m$.

Verifiquemos la ida de la demostración. Supongamos que $\sigma(n)<m$, entonces $n<m$, por lo que por la hipótesis de inducción concluimos que existe $k\neq 0$ tal que $n+k=m$, como $k\neq0$, existe $k’$ tal que $\sigma(k’)=k$, entonces tenemos que

\begin{align*}
m&=n+k\\
&=n+\sigma(k’)\\
&=\sigma(n)+k’
\end{align*}

Notemos además que $k’\neq 0 $, ya que si $k’=0$, entonces $m=\sigma(n)$ lo cual es un contradicción.

Para el regreso, supongamos que existe $k\neq 0$ tal que $\sigma(n)+k=m$ y demostremos que $\sigma(n)\in m$. Como $\sigma(n)+k=m$, concluimos que $n+ \sigma(k)=m$, por lo que $n<m$ y por lo visto en la entrada de La relación de orden en los naturales, tendremos que $\sigma(n)\leq m$. Si $\sigma(n)=m$, entonces cancelando, obtenemos que $k=0$, lo cual es absurdo, entonces solo queda que $\sigma(n)<m$. Con esto concluimos la inducción y la prueba.

$\square$

El orden y las operaciones

Con el anterior resultado, es más fácil ver las relaciones que tendrán el orden con las operaciones, por ejemplo, la siguiente.

Teorema. Si $n<m$ y $l\in\mathbb{N}$, entonces $n+l<m+l$.

Demostración. Como $n<m$, entonces existe $k\neq 0$ tal que $n+k=m$, de donde $n+l+k=m+l$, pero justo esa es la definición de que $n+l<m+l$.

$\square$

Corolario. Si $a<b$ y $c<d$, entonces $a+c<b+d$.

Demostración. Como $a<b$, entonces $a+c<b+c$, y como $c<d$, tenemos que $b+c<b+d$. Por la transitividad del orden, obtenemos el resultado.

$\square$

Finalizamos la entrada, marcando la relación entre el orden y la multiplicación.

Teorema. Si $n<m$ y $l\in\mathbb{N}\setminus\{0\}$, entonces $n\cdot l<m\cdot l$

Demostración. Como $n<m$ entonces existe $k\neq 0$ tal que $n+k=m$, por lo que $nl+lk=ml$, sin embargo, como $l$ y $k$ son distintos de cero, entonces $lk$ también es distinto de cero, por lo que $nl<ml$ justo como debíamos probar.

$\square$

Más adelante…

Con esta entrada, terminamos el estudio de los números naturales, por lo que en la siguiente entrada empezaremos con el estudio de los números enteros. Sin embargo, toda la teoría que hemos desarrollado hasta el momento será la base para poder dar una definición precisa de qué son los números enteros. También nos ayudará a definir sus operaciones, así que nos encontraremos con más oportunidades para practicar nociones de los números naturales.

Hay que hacer una especial mención a los principios de inducción y de buen orden, ya que jugarán un papel crucial a la hora de estudiar las propiedades de los enteros, que nos servirán para desarrollar lo que conocemos como teoría de números.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $a<b$ y $c<d$, entonces $ac<bd$, no es necesario suponer que los números son distintos de cero.
  2. Si $n<m$ y $l\neq 0$, entonces $n^l<m^l$. Sugerencia, usa inducción sobre $l$.
  3. Si $n<m$ y $l\neq 0$, entonces $l^n<l^m$.
  4. Si $n<m$, entonces $n!<m!$.
  5. Demuestra que si $n,m\in\mathbb{N}\setminus\{0\}$, entonces $(1+m)^n\geq 1+nm$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Probabilidad I: Construcción de σ-álgebras

Por Octavio Daniel Ríos García

Introducción

En la entrada pasada dimos comienzo a la construcción de la teoría matemática de la probabilidad. Introdujimos los conceptos de espacio muestral y σ-álgebra. Estos dos son las piedras angulares de la probabilidad. En consecuencia, en esta sesión estudiaremos algunas propiedades importantes de los σ-álgebras. En particular, será de importancia la capacidad de construir σ-álgebras a partir de familias dadas de conjuntos. Esto es, veremos cómo, dada una colección de conjuntos $\mathscr{C}$, existe un σ-álgebra de tamaño mínimo que tiene como subconjunto a $\mathscr{C}$. Así, construiremos un σ-álgebra muy interesante en el contexto de la probabilidad.

Construir σ-álgebras a partir de familias de conjuntos

Mencionamos en la entrada anterior que un σ-álgebra es una familia de conjuntos a los cuales se les asignará una «calificación», llamada «probabilidad». Es decir, que dado $\Omega$ un espacio muestral y $\mathscr{F} \subset \mathscr{P}(\Omega)$ un σ-álgebra sobre $\Omega$, los elementos de $\mathscr{F}$ con los conjuntos que consideraremos como «calificables».

En consecuencia, resulta interesante plantear la siguiente situación. Supón que tenemos una familia de conjuntos $\mathscr{C} \subseteq \mathscr{P}(\Omega)$. Piensa que esta familia de subconjuntos de $\Omega$ es muy importante. Al ser muy importante, nos gustaría poder «calificar» a todos sus elementos. Sin embargo, no sabemos si $\mathscr{C}$ es un σ-álgebra. ¿Será posible construir un σ-álgebra $\mathscr{L}$ tal que $\mathscr{C} \subseteq \mathscr{L}$? La respuesta es sí, y está dada por el siguiente teorema.


Teorema. Dado $\Omega$ un conjunto y $\mathscr{C}$ una familia de subconjuntos de $\Omega$ ($\mathscr{C} \subseteq \mathscr{P}(\Omega)$), existe un único σ-álgebra sobre $\Omega$ de tamaño mínimo $\mathscr{L}$ tal que $\mathscr{C} \subseteq \mathscr{L}$.

Debido a la unicidad, este σ-álgebra es llamado el σ-álgebra generado por $\mathscr{C}$, y es denotado por $\sigma(\mathscr{C})$.


Demostración. Sea $\Gamma$ la familia de todos los σ-álgebras sobre $\Omega$ que contienen a $\mathscr{C}$. De manera un poco informal, es el siguiente conjunto:

\[ \Gamma = \left\lbrace \mathscr{F} \subseteq \mathscr{P}(\Omega) \mid \text{$\mathscr{F}$ es un $\sigma$-álgebra} \, \land \, \mathscr{C} \subseteq \mathscr{F} \right\rbrace \]

Observa que $\Gamma \neq \emptyset$, pues vimos en la sesión anterior que $\mathscr{P}(\Omega)$ es un σ-álgebra. Por lo tanto, $\mathscr{P}(\Omega) \in \Gamma$. Sea $\mathscr{L}$ la intersección de todos los elementos de $\Gamma$. Es decir,

\[ \mathscr{L} = \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}. \]

Esta intersección está bien definida pues $\Gamma \neq \emptyset$. Por construcción, $\mathscr{C} \subseteq \mathscr{L}$, pues $\mathscr{C}$ es subconjunto de todos los $\mathscr{F} \in \Gamma$, y $\mathscr{L}$ es la intersección de todos esos $\mathscr{F}$. De igual forma, para cualquier $\mathscr{F} \in \Gamma$ se cumple que $\mathscr{L} \subseteq \mathscr{F}$. Veamos que $\mathscr{L}$ es un σ-álgebra.

  1. Primero, veamos que $\Omega \in \mathscr{L}$. Sabemos que todos los elementos de $\Gamma$ son σ-álgebras sobre $\Omega$. En consecuencia, para cualquier $\mathscr{F} \in \Gamma$ se cumple que $\Omega \in \mathscr{F}$. Por lo tanto, $\Omega \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$, que por la definición de $\mathscr{L}$ demuestra que $\Omega \in \mathscr{L}$.
  2. Veamos ahora que para cualquier $E \in \mathscr{L}$ se tiene que $E^{\mathsf{c}} \in \mathscr{L}$. Sea $E \in \mathscr{L}$. Por definición de $\mathscr{L}$, esto implica que $E \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$. Es decir, para todo $\mathscr{F} \in \Gamma$, se cumple que $E \in \mathscr{F}$. Como cada uno de los $\mathscr{F}$ es σ-álgebra, se sigue que para todo $\mathscr{F} \in \Gamma$ se cumple que $E^{\mathsf{c}} \in \mathscr{F}$. Por consiguiente, $E^{\mathsf{c}} \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$. Así, se concluye que $E^{\mathsf{c}} \in \mathscr{L}$.
  3. Finalmente, sea $\{ E_{n} \}_{n=1}^{\infty}$ tal que para todo $n \in \mathbb{N}^{+}$ se cumple que $E_{n} \in \mathscr{L}$. Debemos de demostrar que $\bigcup_{n=1}^{\infty}E_{n} \in \mathscr{L}$. Para ello, observa que si para todo $n \in \mathbb{N}^{+}$ se cumple que $E_{n} \in \mathscr{L}$, entonces también es cierto que para todo $n \in \mathbb{N}^{+}$ se cumple que $E_{n} \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$, por la definición de $\mathscr{L}$. Ahora, esto significa que para cualquier $\mathscr{F} \in \Gamma$, todos los $E_{n}$ cumplen que $E_{n} \in \mathscr{F}$; y como los $\mathscr{F}$ son σ-álgebras, se sigue que $\bigcup_{n=1}^{\infty}E_{n} \in \mathscr{F}$. Por lo tanto, $\bigcup_{n=1}^{\infty}E_{n} \in \bigcap_{\mathscr{F} \in \Gamma} \mathscr{F}$, y así, queda demostrado que $\bigcup_{n=1}^{\infty}E_{n} \in \mathscr{L}$.

Estas tres propiedades demuestran que $\mathscr{L}$ es un σ-álgebra que contiene a $\mathscr{C}$. Además, por construcción, $\mathscr{L}$ es minimal en el sentido de que es subconjunto de cualquier otro σ-álgebra que contiene a $\mathscr{C}$.

Nos falta ver que $\mathscr{L}$ es único. Para hacerlo, supón que hay otro σ-álgebra $\mathscr{N}$ que satisface $\mathscr{C} \subseteq \mathscr{N}$ y que para todo σ-álgebra $\mathscr{F}$ tal que $\mathscr{C} \subseteq \mathscr{F}$, se tiene que $\mathscr{N} \subseteq \mathscr{F}$ (es decir, $\mathscr{N}$ es minimal). Como $\mathscr{N}$ es un σ-álgebra tal que $\mathscr{C} \subseteq \mathscr{N}$, se tiene que $\mathscr{N} \in \Gamma$. Más arriba comentamos que para cualquier $\mathscr{F} \in \Gamma$ se cumple que $\mathscr{L} \subseteq \mathscr{F}$. En particular, esto implica que $\mathscr{L} \subseteq \mathscr{N}$.

Por otro lado, supusimos que $\mathscr{N}$ es minimal, es decir, que si $\mathscr{F}$ es un σ-álgebra tal que $\mathscr{C} \subseteq \mathscr{F}$, se tiene que $\mathscr{N} \subseteq \mathscr{F}$. Ya vimos que $\mathscr{L}$ es un σ-álgebra que contiene a $\mathscr{C}$. En consecuencia, $\mathscr{N} \subseteq \mathscr{L}$.

Así, utilizando la igualdad por doble contención, queda demostrado que $\mathscr{N} = \mathscr{L}$. En conclusión, cualquier σ-álgebra que contiene a $\mathscr{C}$ y es minimal en el sentido de que es subconjunto de cualquier otro σ-álgebra que contiene a $\mathscr{C}$ resulta ser igual a $\mathscr{L}$.

$\Box$

¡Bien! Hay dos consecuencias importantes del teorema anterior. En primera, que podemos cronstruir σ-álgebras sobre cualquier conjunto. En segunda, y quizás no tan evidente, que existe una cantidad abundante de σ-álgebras.

Sin embargo, quizás ya notaste que la definición de σ-álgebra generado por una familia de conjuntos $\mathscr{C}$ es un poco intangible. Veamos algunos ejemplos para entender cómo es que funciona esta construcción.

Ejemplos. Sea $\Omega$ el siguiente conjunto:

\[ \Omega = \{ 1, 2, 3, 4, 5, 6 \}. \]

Sea $\mathscr{C} = \{ \{2\}, \{4\} \}$. Veamos qué conjunto es $\sigma(\mathscr{C})$. Primero, sabemos que $\sigma(\mathscr{C})$ debe de ser un σ-álgebra. Por ello, $\sigma(\mathscr{C})$ debe de satisfacer que $\Omega \in \sigma(\mathscr{C})$. Además, por definición de $\sigma(\mathscr{C})$, debe de cumplirse que $\mathscr{C} \subseteq \sigma(\mathscr{C})$. Es decir, se cumplen las siguientes dos pertenencias:

\begin{align}
\{2\} &\in \sigma(\mathscr{C}), \\
\{4\} &\in \sigma(\mathscr{C}).
\end{align}

Bien, entonces en principio $\sigma(\mathscr{C})$ se vería así:

\[ \sigma(\mathscr{C}) = \{ \{2\}, \{4\}, \{ 1, 2, 3, 4, 5, 6 \}, \ldots \}, \]

donde los puntos suspensivos representan los elementos de $\sigma(\mathscr{C})$ que todavía nos faltan. Ahora, sabemos que un σ-álgebra es cerrado bajo complementación. Por lo tanto, los complementos de cada uno de esos conjuntos deben de ser elementos de $\sigma(\mathscr{C})$. Es decir, se cumplen las siguientes pertenencias:

\begin{align}
\{2\}^{\mathsf{c}} = \{1,3,4,5,6 \} &\in \sigma(\mathscr{C}), \\
\{4\}^{\mathsf{c}} = \{1,2,3,5,6 \} &\in \sigma(\mathscr{C}), \\
\{1,2,3,4,5,6\}^{\mathsf{c}} = \emptyset &\in \sigma(\mathscr{C}).
\end{align}

Esto expande la cantidad de elementos en $\sigma(\mathscr{C})$, que va agarrando cada vez más forma:

\[ \sigma(\mathscr{C}) = \{ \emptyset, \{2\}, \{4\}, \{ 1, 3, 4, 5, 6 \}, \{ 1, 2, 3, 5, 6 \}, \{ 1, 2, 3, 4, 5, 6 \}, \ldots \}, \]

Finalmente, un σ-álgebra es cerrado bajo uniones numerables. En este ejemplo, $\Omega$ es finito, así que basta con que acompletemos a $\sigma(\mathscr{C})$ con todas las uniones finitas. Además, $\sigma(\mathscr{C})$ debe de ser cerrado bajo los complementos de las uniones resultantes. Sin embargo, observa que no es necesario meter esos complementos, y que basta con sacar las intersecciones de los conjuntos que ya tenemos. Esto gracias a las leyes de De Morgan: para cualesquiera $A$ y $B$ conjuntos se cumple que $(A \cup B)^{\mathsf{c}} = A^{\mathsf{c}} \cap B^{\mathsf{c}}$. Así, el siguiente paso es tomar todas las uniones e intersecciones posibles de los elementos de $\sigma(\mathscr{C})$ que tenemos.

Sin embargo, observa que algunas de las uniones e intersecciones de conjuntos que ya tenemos dan como resultado otros conjuntos que ya hemos incluido en $\sigma(\mathscr{C})$. Por ello, incluiré las uniones e intersecciones que resultan en conjuntos que todavía no están en $\sigma(\mathscr{C})$. Estas son:

\begin{align*} \{2\} \cup \{4\} = \{2,4\} &\in \sigma(\mathscr{C}), \\ \{1,3,4,5,6\} \cap \{1,2,3,5,6\} = \{1,3,5,6\} &\in \sigma(\mathscr{C}). \end{align*}

Nota que $\{2,4\}^{\mathsf{c}} = \{1,3,5,6\} = \{1,3,4,5,6\} \cap \{1,2,3,5,6\}$, que justo como mencionamos más arriba, cubre la cerradura bajo complementación para $\{2,4\}$. Así, queda completo $\sigma(\mathscr{C})$, que es el siguiente conjunto:

\[ \sigma(\mathscr{C}) = \{ \emptyset, \{2\}, \{4\}, \{2, 4\}, \{1,3,5,6\}, \{ 1, 3, 4, 5, 6 \}, \{ 1, 2, 3, 5, 6 \}, \{ 1, 2, 3, 4, 5, 6 \} \}. \]

Un buen ejercicio sería que verifiques que este conjunto que obtuvimos es, efectivamente, un σ-álgebra. En conclusión, en el caso del σ-álgebra generado por una familia finita de conjuntos, podemos seguir el siguiente método para su construcción.

  1. Dada $\mathscr{C}$ una familia finita de subconjuntos de $\Omega$, el primer paso es incluir a todos los elementos de $\mathscr{C}$ (ya que, por definición, $\mathscr{C} \subseteq \sigma(\mathscr{C})$). Además, por la primera propiedad de un σ-álgebra, también debe de cumplirse que $\Omega \in \sigma(\mathscr{C})$.
  2. Un σ-álgebra debe de ser cerrado bajo complementación. Por ello, el segundo paso es incluir a todos los complementos de los conjuntos incluidos en el paso anterior.
  3. Finalmente, tomar todas las uniones e intersecciones posibles de los conjuntos obtenidos en los dos pasos anteriores.

Un σ-álgebra de gran importancia

El ejemplo anterior exhibe una manera de construir el σ-álgebra generado por una familia finita de conjuntos. SIn embargo, esto se torna más abstracto cuando la familia no es finita. En particular, cuando $\Omega = \mathbb{R}$, sería interesante pensar en el σ-álgebra generado por la familia de intervalos de la siguiente forma:

\[ \mathscr{C}_{1} = \left\lbrace (-\infty, b] \mid b \in \mathbb{R} \right\rbrace. \]

Es decir, $\mathscr{C}_{1}$ es la familia de todos los intervalos no acotados por la izquierda, y cerrados por la derecha. En el contexto de la probabilidad es muy natural que, dado $b \in \mathbb{R}$, planteemos la siguiente situación. Si $x$ es el resultado de algún experimento donde el espacio muestral es $\mathbb{R}$ ¿es cierto que $x \leq b$? O dicho en otras palabras, ¿es cierto que $x \in (-\infty, b]$? Por ejemplo, «¿es cierto que el precio de un activo queda por debajo de algún valor fijo?» Esta es una pregunta que surgiría cuando entras en el contrato de un producto financiero derivado.

Observa que $\mathscr{C}_{1}$ no es un σ-álgebra, así que habría preguntas sobre $x$ que no podríamos contestar dentro de $\mathscr{C}_{1}$. Por ejemplo, $(-\infty, b]^{\mathsf{c}} = (b, \infty)$ no es un elemento de $\mathscr{C}_{1}$, por lo que la pregunta «¿es cierto que $x \in (b, \infty)$?» no tendría respuesta.

¡Ajá! Pero justamente, el teorema que vimos nos permite generar un σ-álgebra a partir de $\mathscr{C}_{1}$. Es decir, $\sigma(\mathscr{C}_{1})$ es el σ-álgebra más pequeño que contiene a todos los intervalos $(-\infty, b]$.

El σ-álgebra generado por esta última familia es muy importante, y es conocido como el σ-álgebra de Borel en $\mathbb{R}$, y es comúnmente denotado por $\mathscr{B}(\mathbb{R})$. Curiosamente, resulta que la manera en que obtuvimos a $\mathscr{B}(\mathbb{R})$ no es la única manera de hacerlo. Por ejemplo, sea $\mathscr{C}_{2}$ la siguiente familia de conjuntos:

\[ \mathscr{C}_{2} = {\left\lbrace (a, b] \mid a, b \in \mathbb{R} \land a < b \right\rbrace}. \]

¿Cuál será el σ-álgebra generado por $\mathscr{C}_{2}$? Veamos primero lo siguiente. Sean $a$, $b \in \mathbb{R}$ tales que $a < b$. Por la definición de $\mathscr{B}(\mathbb{R})$, se cumple que $(-\infty,a]$, $(-\infty,b] \in \mathscr{B}(\mathbb{R})$. Como $\mathscr{B}(\mathbb{R})$ es un σ-álgebra, $(-\infty,a]^{\mathsf{c}} = (a, \infty) \in \mathscr{B}(\mathbb{R})$. Por lo tanto, $(a, \infty) \cap (-\infty,b] = (a,b] \in \mathscr{B}(\mathbb{R})$. Esto es, para cualesquiera $a$, $b \in \mathbb{R}$ tales que $a < b$, se cumple que $(a,b] \in \mathscr{B}(\mathbb{R})$. Por lo tanto, se cumple que $\mathscr{C}_{2} \subseteq \mathscr{B}(\mathbb{R})$, y como $\mathscr{B}(\mathbb{R})$ es un σ-álgebra, se tiene que $\sigma(\mathscr{C}_{2}) \subseteq \mathscr{B}(\mathbb{R})$.

Ahora, sea $b \in \mathbb{R}$. Por la definición de $\sigma(\mathscr{C}_{2})$, para cualquier $n \in \mathbb{N}^{+}$ se cumple que $(b – n, b] \in \sigma(\mathscr{C}_{2})$. Esto pasa porque $b-n$ y $b$ son reales tales que $b – n < b$, por lo que $(b-n, b] \in \mathscr{C}_{2}$. Ahora, debido a que $\sigma(\mathscr{C}_{2})$ es un σ-álgebra, se cumple que

\[ \bigcup_{n=1}^{\infty} (b – n, b] \in \sigma(\mathscr{C}_{2}), \]

pues $\bigcup_{n=1}^{\infty} (b – n, b]$ es una unión numerable de elementos de $\sigma(\mathscr{C}_{2})$. Observa que

\[ \bigcup_{n=1}^{\infty} (b – n, b] = (-\infty, b], \]

ya que si $x$ es un número real tal que $x \in (-\infty,b]$, como consecuencia de la propiedad arquimediana en $\mathbb{R}$, existe $k \in \mathbb{Z}$ tal que $k < x \leq k + 1$. Como $k < x$ y $x \leq b$, se tiene que $k < b$. Luego, $b – (\lceil b \rceil – k) \leq b – (b – k) = k$, pues $b \leq \lceil b \rceil$. Además, como $k < b$ y $b \leq \lceil b \rceil$, se tiene que $\lceil b \rceil – k > 0$, y como $\lceil b \rceil$ y $k$ son enteros, $\lceil b \rceil – k$ también lo es. Esto es, $\lceil b \rceil – k \in \mathbb{N}^{+}$. Sea $n^{*} = \lceil b \rceil – k$. Observa que $b – n^{*} < k$, por lo que $b – n^{*} < x$, y como $x \leq b$, se tiene que

\[ x \in (b – n^{*}, b],\]

y como $\lceil b \rceil – k \in \mathbb{N}^{+}, podemos concluir que

\[ x \in \bigcup_{n=1}^{\infty} (b – n, b], \]

por lo que $(-\infty, b] \subseteq \bigcup_{n=1}^{\infty} (b – n, b]$. La otra contención es más sencilla de demostrar. Si $x$ es un real tal que $x \in \bigcup_{n=1}^{\infty} (b – n, b]$, entonces existe $m \in \mathbb{N}^{+}$ tal que $x \in (b – m, b]$. Esto asegura que $b- n < x \land x \leq b$. En particular, es cierto que $x \leq b$, por lo que $x \in (-\infty, b]$. Por lo tanto, $\bigcup_{n=1}^{\infty} (b – n, b] \subseteq (-\infty, b]$.

Esto demuestra que para cualquier $b \in \mathbb{R}$, el intervalo $(-\infty, b]$ es un elemento de $\sigma(\mathscr{C}_{2})$. Es decir, $\mathscr{C}_{1} \subseteq \sigma(\mathscr{C}_{2})$. Además, recuerda que $\mathscr{B}(\mathbb{R})$ es el σ-álgebra generado por $\mathscr{C}_{1}$, y que $\sigma(\mathscr{C}_{2})$ es un σ-álgebra. Esto implica que $\mathscr{B}(\mathbb{R}) \subseteq \sigma(\mathscr{C}_{2})$.

En conclusión, queda demostrado que $\mathscr{B}(\mathbb{R}) = \sigma(\mathscr{C}_{2})$. esto muestra que el σ-álgebra de Borel en $\mathbb{R}$ puede generarse a partir de $\mathscr{C}_{2}$.

Más aún, $\mathscr{B}(\mathbb{R})$ resulta ser el σ-álgebra generado por otras familias de intervalos muy parecidas. Las siguientes familias son algunas de ellas:

\begin{align*}
\mathscr{C}_{3} &= \left\lbrace [a, b) \mid a, b \in \mathbb{R} \land a < b\right\rbrace, \\
\mathscr{C}_{4} &= \left\lbrace (a, b) \mid a, b \in \mathbb{R} \land a < b \right\rbrace, \\
\mathscr{C}_{5} &= \left\lbrace [a, b] \mid a, b \in \mathbb{R} \land a < b \right\rbrace, \\
\mathscr{C}_{6} &= \left\lbrace (a, \infty) \mid a \in \mathbb{R} \right\rbrace, \\
\mathscr{C}_{7} &= \left\lbrace [a, \infty) \mid a \in \mathbb{R} \right\rbrace, \\
\mathscr{C}_{8} &= \left\lbrace (-\infty, b) \mid b \in \mathbb{R} \right\rbrace.
\end{align*}

Todas las familias anteriores generan el mismo σ-álgebra: $\mathscr{B}(\mathbb{R})$. La justificación de estos hechos es parecida a la que desarrollamos aquí, pero con algunos detalles distintos. Para pasar de un σ-álgebra a otro, se utilizan otras uniones o intersecciones numerables más mañosas. Por ejemplo, si tomas conjuntos en $\mathscr{C}_{4}$, digamos, con $a$, $b \in \mathbb{R}$ tales que $a < b$, y para cada $n \in \mathbb{N}^{+}$ tomas los conjuntos $(a, b + \frac{1}{n})$, al obtener la intersección de esta familia:

\[ \bigcap_{n=1}^{\infty} \left(a, b+\frac{1}{n} \right), \]

el intervalo resultante es el intervalo $(a, b]$. Es decir, haciendo una intersección numerable de elementos de $\mathscr{C}_{4}$, llegas a uno de $\mathscr{C}_{2}$. Algo parecido puede hacerse para pasar de $\mathscr{C}_{2}$ a $\mathscr{C}_{4}$, pero se haría con uniones numerables.

Finalmente, ¿recuerdas el álgebra de la entrada pasada? ¿El de las uniones disjuntas finitas de intervalos? Bueno, resulta que el σ-álgebra generado por ese álgebra es también $\mathscr{B}(\mathbb{R})$.

Tarea moral

Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu manejo de los conceptos abordados en esta entrada.

  • Retomando el ejemplo donde $\Omega = \{ 1, 2, 3, 4, 5, 6 \}$ y $\mathscr{C} = \{ \{2\}, \{4\}\}$, verifica que el conjunto
    \[\sigma(\mathscr{C}) = \{ \emptyset, \{2\}, \{4\}, \{2, 4\}, \{1,3,5,6\}, \{ 1, 3, 4, 5, 6 \}, \{ 1, 2, 3, 5, 6 \}, \{ 1, 2, 3, 4, 5, 6 \} \}\]es un σ-álgebra.
  • Sea $\Omega = \{ 1, 2, 3, 4, 5, 6 \}$.
    • Sea $\mathscr{C}_a = \{ \{1\}, \{3,5\}\}$. Determina $\sigma(\mathscr{C}_a)$.
    • Sea $\mathscr{C}_b = \{ \{1\}, \{2\}, \{3,4\}\}$. Determina $\sigma(\mathscr{C}_b)$.
  • Retomando el σ-álgebra de Borel en $\mathbb{R}$, $\mathscr{B}(\mathbb{R})$, demuestra que
    • El σ-álgebra generado por $\mathscr{C}_{4}$ es $\mathscr{B}(\mathbb{R})$ (puedes demostrar que $\sigma(\mathscr{C}_{4}) = \sigma(\mathscr{C}_{1})$ usando el bosquejo que propusimos).
    • El σ-álgebra generado por $\mathscr{C}_{5}$ es $\mathscr{B}(\mathbb{R})$ (puedes demostrar que $\sigma(\mathscr{C}_{5}) = \sigma(\mathscr{C}_{4})$).

Más adelante…

Esta entrada concluye nuestro estudio enfocado en los σ-álgebras. El σ-álgebra de Borel será necesario mucho más adelante cuando definamos lo que son las variables aleatorias continuas con valores en $\mathbb{R}$. Además, si decides cursar la materia de Teoría de la Medida, te encontrarás con el σ-álgebra de Borel y lo estudiarás con más profundidad. En particular, es de mucha importancia que $\mathscr{B}(\mathbb{R})$ pueda ser generado a partir de un álgebra de conjuntos. Esto pues hay un teorema muy importante (el Teorema de Extensión de Carathéodory) que permite extender la medida sobre el álgebra que asigna a cada intervalo su longitud (donde la longitud de $(a,b]$ es $b – a$) de manera única a $\mathscr{B}(\mathbb{R})$.

En la siguiente entrada abordaremos el concepto de medida de probabilidad, que será nuestra manera de asignar una «calificación» a los elementos de un σ-álgebra dado.

Entradas relacionadas