Probabilidad I: Medida de Probabilidad

Por Octavio Daniel Ríos García

Introducción

En la última sesión demostramos un teorema de vital importancia que permite construir un σ-álgebra a partir de cualquier familia dada de conjuntos. Con esto, ya tenemos los objetos necesarios para empezar a tratar con el concepto de «medida». Anteriormente comentamos que un σ-álgebra es el conjunto cuyos elementos son a los que podremos «calificar», es decir, los que podremos medir. En esta sesión describiremos la noción de «medir» los elementos de un σ-álgebra dado.

Definición de Medida de Probabilidad

Dado un espacio muestral $\Omega$ y $\mathscr{F}$ un σ-álgebra sobre $\Omega$, pretendemos asignar a cada $A \in \mathscr{F}$ un valor numérico. Para ello, en matemáticas utilizamos funciones. En este caso, necesitaremos una función que exprese nuestra noción de «probabilidad de ocurrencia». A cada elemento $A \in \mathscr{F}$ se le asignará un valor $\mathbb{P}(A) \in \mathbb{R}$ que deberá estar en el intervalo $[0,1]$. Así, el $0$ representará lo menos probable posible, y el $1$ lo más probable posible. Esta discusión da lugar a la definición de medida de probabilidad.


Definición. Sea $\Omega$ un conjunto y $\mathscr{F}$ un σ-álgebra sobre $\Omega$. Diremos que una función $\mathbb{P}\colon\mathscr{F} \longrightarrow \mathbb{R}$ es una medida de probabilidad si cumple las siguientes propiedades:

  1. Para todo $A \in \mathscr{F}$ se cumple que $\mathbb{P}(A) \geq 0$. Esto es, $\mathbb{P}$ es no-negativa.
  2. Si $\left\lbrace A_{n} \right\rbrace_{n=1}^{\infty}$ es una familia numerable de conjuntos ajenos dos a dos de $\mathscr{F}$, entonces
    \[ \mathbb{P}\left( \bigcup_{n=1}^{\infty} A_{n} \right) = \sum_{n=1}^{\infty} \mathbb{P}(A_{n}). \]Esta propiedad es conocida como σ-aditividad. Es decir, $\mathbb{P}$ es σ-aditiva.
  3. $\mathbb{P}(\emptyset) = 0$ y $\mathbb{P}(\Omega) = 1$.

Por familia numerable de conjuntos ajenos dos a dos, queremos decir que se cumple que

\[ \forall i, j \in \mathbb{N}^{+}\colon (i \neq j \implies A_{i} \cap A_{j} = \emptyset). \]

Es decir, que para cualesquiera índices $i$ y $j$, si $i$ es distinto de $j$, entonces los conjuntos $A_{i}$ y $A_{j}$ son ajenos.

En resumidas cuentas, una medida de probabilidad es cualquier función que satisface las tres propiedades de la definición anterior. Además, si $\Omega$ es un conjunto, $\mathscr{F}$ un σ-álgebra sobre $\Omega$, y $\mathbb{P}\colon\mathscr{F} \longrightarrow \mathbb{R}$ es una medida de probabilidad, la terna $(\Omega, \mathscr{F}, \mathbb{P})$ recibe el nombre de espacio de probabilidad. Es decir, a partir de ahora, cuando digamos que «$(\Omega, \mathscr{F}, \mathbb{P})$ es un espacio de probabilidad», se entenderá que $\Omega$, $\mathscr{F}$ y $\mathbb{P}$ son los objetos que corresponden.

Juntando todas nuestras herramientas

Ya que tenemos los conceptos más fundamentales de la probabilidad, hay que ver cómo encajan juntos. Para empezar, recuerda que el espacio muestral de un fenómeno aleatorio es el conjunto $\Omega$. Los elementos de este conjunto son todos los resultados posibles del fenómeno. Luego, tomaremos a $\mathscr{F}$, que es un σ-álgebra sobre $\Omega$. Finalmente, sobre $\mathscr{F}$ se define la medida de probabilidad $\mathbb{P}\colon \mathscr{F} \longrightarrow \mathbb{R}$.

Pero, ¿por qué se define la medida sobre el σ-álgebra? ¿Por qué no la definimos directamente sobre $\Omega$? Recuerda que los elementos de un σ-álgebra, a los cuales llamaremos eventos, son subconjuntos de $\Omega$. En la primera entrada de este curso justificamos las propiedades de un σ-álgebra. En particular, mencionamos que un evento $A \in \mathscr{F}$ burdamente cumple lo siguiente: Dado cualquier $\omega \in \Omega$ (es decir, dado cualquiera de los resultados posibles del fenómeno aleatorio), la pregunta «¿es cierto que $\omega \in A$» tiene respuesta. Por ello, cuando nuestra medida de probabilidad asigne el número $\mathbb{P}(A)$ al conjunto $A$, ese número expresa cuál es la probabilidad de que sea cierto que $\omega \in A$. En otras palabras, entre $0$ y $1$, ¿qué tan probable es que ocurra cualquiera de los resultados en $A$? La respuesta será $\mathbb{P}(A)$. Por este motivo, el número $\mathbb{P}(A)$ suele leerse como «la probabilidad del evento $A$», o simplemente, «la probabilidad de $A$».

Justificando las propiedades de una medida de probabilidad

Por otro lado, veamos un poco sobre la motivación de las propiedades de una medida de probabilidad. La no-negatividad surge muy naturalmente de nuestra restricción de la medida al intervalo $[0,1]$. Por otro lado, la σ-aditividad tiene dos razones de ser. Primero, observa que la σ-aditividad implica la aditividad finita. Si $A_{1}$, $A_{2}$, … , $A_{n} \in \mathscr{F}$ son $n$ eventos cualesquiera que son ajenos dos a dos, podemos definir la siguiente familia numerable de conjuntos:

\[ E_{1} = A_{1}, E_{2} = A_{2}, E_{3} = A_{3}, \ldots, E_{n} = A_{n}, E_{n+1} = \emptyset, E_{n+2} = \emptyset, \ldots, \]

Es decir, para cada $k \in \mathbb{N}$ tal que $k \geq n+1$, se define $E_{k} = \emptyset$. Esta es una familia numerable de eventos ajenos (observa que la intersección de cualesquiera dos eventos de la familia resulta ser vacía). Por lo tanto, podemos aplicar la σ-aditividad de $\mathbb{P}$. Esto es, se tiene que

\[ \mathbb{P}\left( \bigcup_{k=1}^{\infty} E_{k} \right) = \sum_{k=1}^{\infty} \mathbb{P}(E_{k}), \]

pero recuerda que para cada $k \geq n+1$, se tiene que $E_{k} = \emptyset$, y para cada $k \leq n$, se cumple que $E_{k} = A_{k}$. Por un lado, esto significa que

\[ \bigcup_{k=1}^{\infty} E_{k} = \left( \bigcup_{k=1}^{n} E_{k} \right) \cup \left( \bigcup_{k=n+1}^{\infty} E_{k} \right) = \left( \bigcup_{k=1}^{n} A_{k} \right) \cup (\emptyset) = \bigcup_{k=1}^{n} A_{k}. \]

Por otro lado, tenemos que

\begin{align*}
\sum_{k=1}^{\infty} \mathbb{P}(E_{k}) &= \sum_{k=1}^{n} \mathbb{P}(E_{k}) + \sum_{k=n+1}^{\infty} \mathbb{P}(E_{k}) \\&= \sum_{k=1}^{n} \mathbb{P}(A_{k}) + \sum_{n=3}^{\infty} \mathbb{P}(\emptyset) \\
&= \sum_{k=1}^{n} \mathbb{P}(A_{k}) + \sum_{n=1}^{\infty} 0 \\
&= \sum_{k=1}^{n} \mathbb{P}(A_{k})
\end{align*}

Esto nos permite concluir que

\[ \mathbb{P}\left(\bigcup_{k=1}^{n} A_{k}\right) = \sum_{k=1}^{n} \mathbb{P}(A_{k}). \]

En conclusión, cualquier medida de probabilidad es finitamente aditiva. En particular, es finitamente aditiva para $n = 2$, por lo que si se tienen $A_{1}$, $A_{2} \in \mathscr{F}$ eventos ajenos, se sigue que $\mathbb{P}(A_{1} \cup A_{2}) = \mathbb{P}(A_{1}) + \mathbb{P}(A_{2})$.

La σ-aditividad y, en consecuencia, la aditividad, obedecen a nuestra intuición de medir la probabilidad de dos o más eventos que no comparten elementos. Si $A$ y $B$ son eventos ajenos, cuando un $\omega$ es uno de los elementos de $A$, no puede ser un elemento de $B$. Por ello, como la probabilidad de que el resultado del fenómeno aleatorio sea alguno de los elementos de $A$ es $\mathbb{P}(A)$, este valor no expresa nada sobre la probabilidad de que el resultado del fenómeno sea un elemento de $B$. Análogamente, $\mathbb{P}(B)$ tampoco expresa nada sobre la probabilidad de que el resultado sea un elemento de $A$. Burdamente, cuando $A$ y $B$ son eventos ajenos, $\mathbb{P}(A)$ y $\mathbb{P}(B)$ no expresan la probabilidad de algo en común.

Por lo tanto, sumar estos dos valores resulta en la probabilidad de que el resultado sea un elemento exclusivamente de $A$ o exclusivamente de de $B$. Pero al ser ajenos, esto es lo mismo que expresar la probabilidad de que el resultado sea un elemento de $A \cup B$. Esto motiva que cuando $A$ y $B$ son eventos ajenos, $\mathbb{P}(A\cup B) = \mathbb{P}(A) + \mathbb{P}(B)$. Esta misma idea se extiende al caso de una familia numerable de eventos ajenos, y es la que motiva la σ-aditividad.

Finalmente, la última propiedad establece que $\mathbb{P}(\emptyset) = 0$ y $\mathbb{P}(\Omega) = 1$. ¿Por qué le pedimos a $\mathbb{P}$ que cumpla esto? Recordando que $0$ representa lo más improbable y $1$ lo más probable posible, que $\mathbb{P}(\emptyset) = 0$ expresa que la probabilidad de algo lógicamente imposible debe de ser $0$. Mucho cuidado, el evento $\emptyset$ no representa «que no ocurra nada», esa es una interpretación errónea de $\emptyset$ como evento. Por otro lado, $\mathbb{P}(\Omega) = 1$ se pide porque la probabilidad de que el resultado sea cualquiera de los resultados posibles debe de ser la más alta posible, pues siempre se obtiene alguno de los elementos de $\Omega$ como resultado.

Ejemplo básico de medida de probabilidad

Sean $\Omega = \{ 1, 2, 3 \}$ y $\mathscr{F} = \mathscr{P}(\Omega)$. Sea $\mathbb{P}\colon \mathscr{F} \longrightarrow \mathbb{R}$ la función dada por la siguiente regla de correspondencia: para cada $A \in \mathscr{F}$, definimos

\[ \mathbb{P}(A) = \frac{\left| A \right|}{\left| \Omega \right|}, \]

donde $\left| A \right|$ es la cardinalidad de $A$. Esto es, $|A|$ es el número de elementos que tiene $A$. Primero, tenemos que ver que $(\Omega, \mathscr{F}, \mathbb{P})$ es un espacio de probabilidad. Ya sabemos que $\Omega$ es un conjunto y que $\mathscr{P}(\Omega)$ es un σ-álgebra sobre $\Omega$. Nos falta ver que $\mathbb{P}$ es una medida de probabilidad. Es decir, hay que ver que satisface las propiedades de una medida de probabilidad.

  1. Primero, hay que verificar que para cualquier evento $A \in \mathscr{F}$ se cumple que $\mathbb{P}(A) \geq 0$. En efecto, para cualquier conjunto finito $A$ se tiene que $\left| A \right| \in \mathbb{N}$. Además, $\Omega \neq \emptyset$, por lo que $|\Omega| \neq 0$. Por lo tanto, $\frac{|A|}{|\Omega|}$ está bien definido, y se cumple que $\frac{|A|}{|\Omega|} \geq 0$. En conclusión, para cualquier evento $A \in \mathscr{F}$ se cumple que $\mathbb{P}(A) \geq 0$.
  2. Para ver la segunda propiedad, como $\Omega$ es finito, basta con ver que $\mathbb{P}$ es finitamente aditiva. Sean $A$, $B \in \mathscr{F}$ eventos cualesquiera tales que $A \cap B = \emptyset$. Debemos de demostrar que $\mathbb{P}(A \cup B) = \mathbb{P}(A) + \mathbb{P}(B)$. Observa que como $A$ y $B$ son finitos y $A \cap B = \emptyset$, se tiene que $|A \cup B| = |A| + |B|$. Así, tenemos que
    \[ \frac{|A \cup B|}{|\Omega|} = \frac{|A|+|B|}{|\Omega|} = \frac{|A|}{|\Omega|} + \frac{|B|}{|\Omega|}, \]y por la definición de $\mathbb{P}$, podemos concluir que $\mathbb{P}(A \cup B) = \mathbb{P}(A) + \mathbb{P}(B)$.
  3. Finalmente, como $|\emptyset| = 0$, se tiene que $\mathbb{P}(\emptyset) = 0$, y por la definición de $\mathbb{P}$, tenemos que $\mathbb{P}(\Omega) = \frac{|\Omega|}{|\Omega|} = 1$.

Bien, con esto hemos demostrado que $(\Omega, \mathscr{F}, \mathbb{P})$ es un espacio de probabilidad.

Ahora veamos algunos aspectos más prácticos de este ejemplo. Por ejemplo, ¿cuál será la probabilidad de que el resultado de este fenómeno sea $3$? Para obtenerla, hay que encontrar a qué evento nos referimos. En este caso, nos interesa que el resultado sea $3$. Así, el evento en cuestión sería aquel que tenga como único elemento a $3$, es decir, $\{ 3 \}$. Bien, entonces la probabilidad de que el resultado sea $3$ es $\mathbb{P}(\{3\})$. Utilicemos la definición de $\mathbb{P}$ para el cálculo:

\begin{align*}
\mathbb{P}(\{3\}) &= \frac{|\{3\}|}{|\Omega|} \\ &= \frac{|\{3\}|}{|\{1, 2, 3\}|} \\ &= \frac{1}{3},
\end{align*}

así, $\mathbb{P}(\{3\}) = \frac{1}{3}$, por lo que la probabilidad de que el resultado de este fenómeno sea $3$ es $\frac{1}{3}$, o $0.33333\ldots$ Hay quienes escriben la probabilidad de un evento de manera porcentual. De esta forma, la probabilidad de que el resultado sea $3$ es $33.333\ldots\%$.

Hagamos otra pregunta. ¿Cuál es la probabilidad de que el resultado de este fenómeno sea un número impar? Hay que encontrar primero el evento que contiene todos los resultados impares. Esto es, sería el siguiente conjunto

\[ B = \{ \omega \in \Omega \mid \exists k \in \mathbb{Z}\colon \omega = 2k + 1 \}, \]

que para este $\Omega$ es muy sencillo: son $1$ y $3$. Así, $B = \{1,3\}$, y podemos calcular la probabilidad de $B$ usando la expresión que define a $\mathbb{P}$ como sigue.

\begin{align*}
\mathbb{P}(B) &= \mathbb{P}(\{1, 3\}) \\ &= \frac{|\{1,3\}|}{|\Omega|} \\ &= \frac{|{1,3}|}{|{1,2,3}|} \\ &= \frac{2}{3}.
\end{align*}

Por lo tanto, la probabilidad d e que el resultado de este fenómeno sea un número impar es $\frac{2}{3}$, o bien $0.6666\ldots$, o $66.666\ldots\%$.

Para terminar con este ejemplo, veamos algo relacionado con la aditividad de $\mathbb{P}$. Ya vimos que $\mathbb{P}$ es aditiva. ¿Qué pasa si sumamos las probabilidades de dos eventos que no son ajenos? Por ejemplo, sean $C_{1} = \{1,2\}$ y $C_{2} = \{2,3\}$. Primero, se tiene que

\begin{align*}
\mathbb{P}(C_{1}) = \mathbb{P}(\{1,2\}) = \frac{2}{3}, \\
\mathbb{P}(C_{1}) = \mathbb{P}(\{2,3\}) = \frac{2}{3},
\end{align*}

por lo que $\mathbb{P}(C_{1}) + \mathbb{P}(C_{2}) = \frac{4}{3}$, y $\frac{4}{3} > 1$. ¿Qué falló aquí? Llegamos a un número que es mayor a $1$, ¿no debería de pasar que $\mathbb{P}(C_{1}) + \mathbb{P}(C_{2})$ es la probabilidad de algún evento? El problema está en que $C_{1}$ y $C_{2}$ no son ajenos. Observa que $C_{1} \cap C_{2} = \{1,2\} \cap \{2,3\} = \{2\}$. Nota que $\mathbb{P}(C_{1})$ expresa «la probabilidad de que el resultado del experimento sea un elemento de $C_{1}$». En términos más amigables, $\mathbb{P}(C_{1})$ expresa la probabilidad de que el resultado sea $1$ o $2$. Es decir, en esta cantidad se incluye la posibilidad de que el resultado sea $2$. De manera similar, $\mathbb{P}(C_{2})$ expresa la probabilidad de que el resultado sea $2$ o $3$. Por ello, en el momento en el que sumamos $\mathbb{P}(C_{1})$ y $\mathbb{P}(C_{2})$, estamos contabilizando la probabilidad de que el resultado sea $2$ más de una vez, algo que no debemos de hacer.

Así, se confirma que cuando $C_{1}$ y $C_{2}$ son eventos que no son ajenos, la probabilidad de $\mathbb{P}(C_{1} \cup C_{2})$ no coincide con $\mathbb{P}(C_{1}) + \mathbb{P}(C_{2})$.

Tarea moral

Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu manejo de los conceptos abordados en esta entrada.

  • Sean $\Omega = \{1,2,3,4\}$ y $\mathscr{F} = \mathscr{P}(\Omega)$. Definimos la siguiente función auxiliar $p\colon \Omega \rightarrow \mathbb{R}$ mediante las siguientes reglas de correspondencia:
    \begin{align*}
    p(1) = \frac{1}{4}, \quad p(2) = \frac{1}{4}, \quad p(3) = \frac{1}{8}, \quad p(4) = \frac{3}{8}.
    \end{align*} Sea $\mathbb{P}\colon \mathscr{F} \longrightarrow \mathbb{R}$ la función dada por: Para cada $A \in \mathscr{F}$, definimos
    \begin{align*}
    \mathbb{P}(A) = \sum_{k \in A} p(k).
    \end{align*} Por ejemplo, $\mathbb{P}(\{1,3\}) = p(1) + p(4) = \frac{1}{4} + \frac{3}{8}$. Adicionalmente, se define $\mathbb{P}(\emptyset) = 0$.
    • Demuestra que $(\Omega, \mathscr{F}, \mathbb{P})$ es un espacio de probabilidad.
    • ¿Cuál es la probabilidad de que el resultado del fenómeno en este ejercicio sea un número par?
    • ¿Cuál es la probabilidad de que el resultado sea un número impar?
  • Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad. Sean $A$, $B \in \mathscr{F}$ tales que $A \cap B \neq \emptyset$. ¿Qué le sumarías (o restarías) a $\mathbb{P}(A) + \mathbb{P}(B)$ para obtener una expresión que sí sea igual a $\mathbb{P}(A) + \mathbb{P}(B)$? Daremos la respuesta a esta pregunta en la próxima sesión, pero comienza a pensarlo.
  • En la entrada mencionamos que el evento $\emptyset$ no representa «que no ocurra nada», y que debe de interpretarse como el evento «imposible». ¿Por qué? Por ejemplo, retomando cuando $\Omega = \{1,2,3\}$, es claro que $\{1 \} \cap \{3\} = \emptyset$. ¿Tiene sentido que su probabilidad sea $0$? ¿Existe algún resultado $\omega \in \Omega$ tal que $\omega \in \{1 \} \cap \{3 \}$?

Más adelante…

En esta sesión tocamos las propiedades que hacen que una función sea considerada una medida de probabilidad. Estas propiedades tienen consecuencias que abordaremos en una entrada posterior. Antes de hacerlo, en la siguiente entrada abordaremos ciertas minucias sobre la interpretación de las operaciones con eventos en el contexto de la probabilidad.

Entradas relacionadas

Álgebra Lineal II: Teorema de Gauss

Por Diego Ligani Rodríguez Trejo

Introducción

En la entrada anterior vimos un recordatorio de las formas bilineales, cuadráticas y sus polares. En esta entrada continuaremos recordando algunas propiedades vistas previamente enfocándonos en el teorema de Gauss y su demostración. Esto nos dará una pequeña pista de la relación entre las formas cuadráticas y matrices.

Además, con el teorema de Gauss obtendremos un algoritmo para poder escribir cualquier forma cuadrática en una forma estandarizada. Esto nos llevará más adelante a plantear la ley de inercia de Sylvester.

Preparaciones para el teorema de Gauss

Antes de empezar con el teorema, veamos una propiedad de las formas cuadráticas en $\mathbb{R}^n$. Tomemos $e_1,\ldots, e_n$ la base canónica de $\mathbb{R}^n$. Tomemos $q$ una forma cuadrática de $\mathbb{R}^n$ y $b$ su forma polar.

Cualquier vector $x=(x_1,\ldots,x_n)$ de $\mathbb{R}^n$ se escribe como $ (x_1,\ldots,x_n)=\sum_{i=1}^n x_i e_i$. Por lo que hicimos en la entrada anterior tenemos entonces:

$$q(x)=b(x,x)=\sum_{i=1}^n \sum_{j=1}^n x_i x_j b(e_i, e_j).$$

Para simplificar la notación definamos $a_{ij}:=b(e_i,e_j)$. Podemos «ver» todos los sumandos en la siguiente expresión:

\begin{align*} q(x)& =x_1^2a_{11}+ x_1x_2a_{12} + \dots + x_1x_na_{1n} \\
&+x_2x_1a_{21}+ x_2^2a_{22} + \dots +x_2x_na_{2n} \\
&\vdots \qquad \qquad \qquad \qquad \qquad \qquad \\
&+x_nx_1a_{n1} + x_nx_2a_{n2} + \dots + x_n^2 a_{nn} \end{align*}

Aquí hay algunos términos «puros» de la forma $a_{ii}x_i^2$. Se encuentran en la «diagonal». Tenemos también algunos términos «mixtos» de la forma $a_{ij}x_ix_j$ con $i\neq j$. Por la simetría de $b$, en los términos mixtos tenemos $a_{ij}=a_{ji}$. Al separar en términos puros y mixtos obtenemos entonces la siguiente expresión:

\begin{align}q(x)= \sum_{i=1}^na_{ii}x_i^2+ 2\sum_{1 \leq i < j \leq n} a_{ij} x_i x_j .\end{align}

Usaremos esto más abajo.

Teorema de Gauss de formas cuadráticas

Teorema. Sea $q$ una forma cuadrática en $V=\mathbb{R}^n$. Existen reales $\alpha_1, \dots , \alpha_r $ y formas lineales $l_1, \dots l_r$ de $V$ linealmente independientes tales que, para todo $x \in V$ se tiene
$$q(x)= \sum_{i=1}^r \alpha _i (l_i(x))^2.$$

Recordemos que la independencia lineal de las formas $l_1,\ldots,l_r$ sucede en el espacio dual $V^*$.

Demostración. Procedamos por inducción sobre $n$. De la igualdad $(1)$, cuando $n=1$ la forma cuadrática es de la forma $q(x)=a_{11}x_1^2$. Al definir $\alpha_1=a_{11}$ y $l_1(x)=x_1$ obtenemos la forma deseada.

Supongamos que el teorema se cumple para $n-1$. De la igualdad $(1)$ sabemos que $q$ se puede escribir como sigue:

\begin{align*} q(x)= \sum_{i=1}^n a_{ii} x_i^2 + 2\sum_{1 \leq i < j \leq n} a_{ij} x_ix_j. \end{align*}

Tenemos tres posibilidades:

  • Que todos los $a_{ii}$ y todos los $a_{ij}$ sean cero. Este caso es inmediato pues entonces $q$ es la forma cuadrática cero y podemos tomar $l_1(x)=x_1$ y $\alpha_1=0$.
  • Que algún $a_{ii}$ sea distinto de cero.
  • Que todos los $a_{ii}$ sean cero, pero algún $a_{ij}$ sea distinto de cero.

Hagamos cada uno de los últimos dos casos por separado. Comencemos por el caso en el que algún $a_{ii}$ es distinto de cero. Sin pérdida de generalidad (¿por qué?) podemos suponer que es $a_{nn}$.

Apartando los términos que tienen $x_n$ de los que no obtenemos:

\begin{align*} \sum_{i=1}^n a_{ii}x_i^2=a_{nn} x_n^2 + \sum_{i=1}^{n-1} a_{ii} x_i^2. \end{align*}

y

\begin{align*} 2\sum_{1 \leq i < j \leq n} a_{ij}x_ix_j= 2\left(\sum_{i=1}^{n-1} a_{in} x_i\right)x_n + 2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j\end{align*}

Con esto

\begin{align*} q(x)=a_{nn}x_n^2 + 2\left(\sum_{i=1}^{n-1} a_{in} x_i\right)x_n + \sum_{i=1}^{n-1} a_{ii} x_i^2 + 2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j .\end{align*}

Si bien esta expresión se ve complicada, en realidad podemos pensar que en términos de la variable $x_n$ es «simplemente una cuadrática». Basados en los primeros dos términos podemos completar un binomio al cuadrado como sigue:

\begin{align*} q(x)= a_{nn} \left(x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2- a_{nn}\left(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2 + \sum_{i=1}^{n-1} a_{ii}x_i^2+2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j.\end{align*}

Notemos que la expresión

\begin{align*} – a_{nn}\left(\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \right)^2 + \sum_{i=1}^{n-1} a_{ii}x_i^2+2\sum_{1 \leq i < j \leq n-1} a_{ij}x_ix_j \end{align*}

ya no tiene a la variable $x_n$ y que de hecho es una forma cuadrática en las variables $x_1,\ldots, x_{n-1}$ (¿por qué?). De este modo, podemos aplicarle hipótesis inductiva para obtener que existen escalares $\alpha_1,\ldots, \alpha_r$ y formas lineales $l’_1,\ldots,l’_r$ linalmente independientes de $\mathbb{R}^{n-1}$ tales que

\begin{align*} q'(x_1,\dots , x_{n-1})= \sum_{i=1}^r \alpha_i (l_i'(x))^2.\end{align*}

Si bien estas $l’_i$ son formas lineales de $\mathbb{R}^{n-1}$, también podemos pensarlas como formas lineales de $\mathbb{R}^n$. Formalmente, tomamos $l_i:\mathbb{R}^n\to \mathbb{R}$ dada por $l_i(x_1,\ldots,x_n)=l’_i(x_1,\ldots,x_{n-1})$. Para finalizar, definimos

\begin{align*} l_{r+1}(x_1, \dots , x_n)= x_n+\sum_{i=1}^{n-1} \frac{a_{in}}{a_{nn}}x_i \text{,} \qquad \alpha_{r+1}=a_{nn}.\end{align*}

De aquí, obtenemos la expresión deseada para $q$:

\begin{align*} q(x)= \sum_{i=1}^{r+1} \alpha_i (l_i(x))^2 \end{align*}

Falta argumentar por qué las $l_i$ son linealmente independientes. Si una combinación lineal de ellas da cero, como $l_{r+1}$ es la única que involucra a $x_n$, entonces su coeficiente debe ser cero. Así, obtendríamos una combinación lineal de $l_1,\ldots,l_r$ igualada a cero. Pero esta es una combinación lineal de $l’_1,\ldots,l’_r$. Por hipótesis inductiva, estas son linealmente independientes así que todos los coeficientes deben ser cero.

Lo anterior termina el caso para cuando hay algún «término puro». Falta el caso en el que todos los «términos puros» tienen coeficiente cero, pero hay por lo menos un «término mixto». Por la igualdad $(1)$ tenemos que la forma cuadrática se ve así:

\begin{align*}q(x)= 2\sum_{1 \leq i < j \leq n} a_{ij} x_i x_j .\end{align*}

Sin pérdida de generalidad podemos suponer que el término mixto que no es cero es el $a_{n-1,n}$ (¿por qué?). La idea es ahora separar a los términos que tienen $x_{n-1}$ ó $x_n$ de los que no, y utilizar la siguientes identidades algebraicas que se valen para cualesquiera $A,B,C, D, E$ (haz las cuentas):

\begin{align} Ax_{n-1}x_n+Bx_{n-1}+Cx_n=A\left(x_{n-1}+\frac{C}{A}\right) \left(x_n+\frac{B}{A}\right)-\frac{BC}{A},\end{align}

\begin{align} DE= \frac{1}{4}(D+E)^2 – \frac{1}{4} (D-E)^2.\end{align}

Al realizar la separación nos queda:

\begin{align*} q(x)= 2a_{n-1,n}x_{n-1}x_n +2\sum_{i=1}^{n-2}a_{in}x_ix_n+ 2\sum_{i=1}^{n-2}a_{i,n-1}x_ix_{n-1} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij}. \end{align*}

Así, podemos usar la identidad $(2)$ con los siguientes valores

\begin{align*}
A &=2a_{n-1.n},\\
B&=2\sum_{i=1}^{n-2}a_{i,n-1}x_i,\\
C&=2\sum_{i=1}^{n-2}a_{i,n}x_i
\end{align*}

para obtener que $q$ es:

\begin{align*} A\left(x_{n-1}+\frac{C}{A}\right) \left(x_n+\frac{B}{A}\right)-\frac{BC}{A} + 2\sum_{1 \leq i < j \leq n-2} x_i x_j a_{ij} \end{align*}

Al primer sumando podemos reescribirlo usando la identidad $(3)$ como

\begin{align*}\frac{A}{4}\left(x_{n-1}+x_n+\frac{B+C}{A}\right)^2-\frac{A}{4}\left( x_{n-1}-x_n-\frac{B-C}{A}\right)^2 \end{align*}

A la expresión conformada por los últimos dos sumandos le podemos aplicar hipótesis inductiva (¿por qué?) para escribirla de la forma \begin{align*} q'(x_1, \dots , x_{n-2})= \sum_{i=1}^r \alpha’_i (l’_i(x_1, \dots , x_{n-2}))^2 \end{align*} con $l’_1,\ldots, l’_r$ formas lineales linealmente independientes de $\mathbb{R}^{n-2}$. Como en el caso anterior, podemos «convertir» estas formas lineales a formas lineales $l_1,\ldots,l_r$ en $\mathbb{R}^n$. Al agregar las siguientes dos formas lineales

\begin{align*}
l_{r+1}(x)&= x_{n-1}+x_n+\frac{B+C}{A}\\
l_{r+2}(x)&= x_{n-1}-x_n-\frac{B-C}{A}
\end{align*}

y tomar $\alpha_{r+1}=\frac{A}{4}$, $\alpha_{r+2}=-\frac{A}{4}$, obtenemos la expresión deseada:
\begin{align*} q(x)= \sum_{i=1}^{r+2} \alpha_i (l_i(x))^2. \end{align*}

La demostración de que en efecto $l_1,\ldots,l_{r+2}$ son linealmente independientes queda como ejercicio.

Así por principio de inducción tenemos que el teorema de Gauss se cumple para cualquier forma cuadrática $q$ en $\mathbb{R}^n$ para todo $n\geq 1$ entero.

$\square$

Más adelante…

Debido a la longitud de esta demostración, los ejemplos serán reservados para la siguiente entrada.

Las formas cuadráticas, aunque interesantes, muestran estar limitadas por cómo las definimos, ya que se definen sólo en espacios vectoriales reales. En las siguientes entradas expandiremos un poco esta definición para también abarcar al menos espacios vectoriales complejos y luego nos enfocaremos en un tipo especial de éstas.

Además, al principio de la entrada se dieron pistas a que existe una relación entre formas bilineales y matrices, esto será explorado posteriormente.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Sea $q$ una forma cuadrática en $\mathbb{R}^n$ y $x=(x_1, \dots, x_n)$. Muestra que \begin{align*} q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \text{ con } a_{ij}=b(e_i,e_j). \end{align*}
  2. Sea $A$ la matriz con entradas $a_{ij}$ dadas en el problema anterior. ¿Qué podrías afirmar acerca de $A$ sin importar la $q$ elegida?
  3. Sea $A=[a_{ij}]$ una matriz simétrica en $M_n(\mathbb{R})$ y definamos
    \begin{align*} q: \mathbb{R}^n \rightarrow \mathbb{R} \text{ dada por } q(x)=\sum_{i,j=1}^na_{ij}x_ix_j \end{align*} ¿Es $q$ así definida una forma cuadrática? ¿Es necesario que $A$ sea simétrica?
  4. Demuestra que las formas lineales definidas en el segundo caso de la demostración del teorema de Gauss en efecto son linealmente independientes.
  5. Sean $\alpha _1, \dots , \alpha_r $ números reales y $l_1 , \dots , l_r$ formas lineales, linealmente independientes en $\mathbb{R}^n$ y $x \in \mathbb{R}^n$. Definamos $q$ como sigue:
    \begin{align*} q(x)=\sum_i^n \alpha_i l_i(x)\end{align*}
    ¿Es $q$ así definida una forma cuadrática en $\mathbb{R}^n$?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Probabilidad I-Videos: Probabilidad geométrica

Por Aurora Martínez Rivas

Introducción

La definición “clásica” se usó durante muchos años, pero luego de analizar algunos ejemplos especiales, estos llevaron a cierta modificación de la definición y a la construcción de un concepto de probabilidad para los casos en los que es concebible incluso un conjunto infinito de resultados. Este concepto es el de probabilidad geométrica.

Probabilidad geométrica

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE 104721: “Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM”. Sitio web del proyecto: https://www.matematicasadistancia.com.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

En un plano sea $\Omega$ cierta región y supongamos en ella hay otras dos regiones $A$ y $B$, todas con área finita y bien definida. Prueba que la definición de la probabilidad geométrica usando como medida el área, satisface las siguientes propiedades:

  • $P(\emptyset)=0$ y $P\left(\Omega\right)=1$.
  • $P\left(A\right)\geq0$ para cualquier evento A.
  • $P\left(A^c\right)=1-P(A)$.
  • $P\left(A\bigcup B\right)=P\left(A\right)+P(B)$ cuando A y B son ajenos.
  • $P(A\bigcup\ B)=P\left(A\right)+P\left(B\right)-P(A\bigcap\ B)$. 

Más adelante…

Así como la probabilidad geométrica ayuda a extender la definición de probabilidad clásica para casos con un espacio muestral no finito, en la siguiente entrada de video veremos la interpretación frecuentista de la probabilidad que nos brinda una alternativa para cuando no necesariamente los posibles resultados son equiprobables.

Entradas relacionadas

Variable Compleja I: El campo de los números complejos $\mathbb{C}$

Por Pedro Rivera Herrera

Introducción

Aunque la teoría de los números complejos ha ido formalizándose a lo largo del tiempo, el término «imaginario» ha trascendido hasta nuestros días. Es claro que dicha expresión está ligada con la concepción con la que surgieron dichos números y que es simplemente una forma para referirse a dichos números. El término «complejo» fue introducido por primera vez por el matemático Carl Friedrich Gauss, mientras que el símbolo $i$, para denotar a $\sqrt{-1}$, fue introducido por primera vez por el matemático Leonhard Euler.

Durante el siglo XVI se encontraron soluciones para las ecuaciones $x^2+2x+2 = 0$ y $x^3=6x+4$, tales como $1+\sqrt{-1}$ y $\sqrt[3]{2+\sqrt{-2}}+\sqrt[3]{2-\sqrt{-2}}$ respectivamente, lo cual generó incertidumbre entre los matemáticos de la época, puesto que expresiones como $\sqrt{-1}$ y $\sqrt{-2}$ no tenían sentido. Conforme se iba desarrollando la teoría de los números complejos, para evitar expresiones como las anteriores, se optó por definir una nueva cantidad, la unidad imaginaria, denotada por el símbolo $i$, la cual es caracterizada por cumplir la propiedad $i^2 = -1$, es decir, es la raíz cuadrada de $-1$. Considerando esta notación las expresiones $\sqrt{-1}$ y $\sqrt{-2}$ ahora pueden reescribirse como $i$, $i\sqrt{2}$, respectivamente.

El campo de los números complejos $\mathbb{C}$

Definición 2.1. (El campo de los números complejos.)
El campo de los números complejos, denotado por $\mathbb{C}$, es el conjunto formado por pares ordenados de números reales $z=(a, b)$, dotado con las operaciones binarias de suma y multiplicación definidas respectivamente como:

\begin{equation*}
(a, b) + (c, d) = (a+c, b+d). \tag{2.1}
\end{equation*}

\begin{equation*}
(a, b) \cdot (c, d) = (ac – bd, ad + bc). \tag{2.2}
\end{equation*}

Considerando a $(0,0)$ y $(1,0)$ como los neutros aditivo y multiplicativo respectivamente, es decir, tales que para todo $z=(a,b)\in\mathbb{C}$:

\begin{equation*}
(0,0) + (a,b) = (a,b).
\end{equation*}

\begin{equation*}
(1,0) \cdot (a,b) = (a,b).
\end{equation*}

Y para $z=(a, b) \in \mathbb{C}$ distinto de cero, su inverso multiplicativo, denotado como $z^{-1}$, dado por:
\begin{equation*}
z^{-1} = \left( \frac{a}{a^2 + b^2}, \frac{-b}{a^2 + b^2} \right),
\end{equation*}

es decir, es tal que:

\begin{equation*}
z \cdot z^{-1} = (1,0).
\end{equation*}

Entonces es fácil verificar, usando las propiedades de los números reales, que $\mathbb{C}$ con la suma y el producto recién definidos satisface las propiedades de campo.

Observación 2.1.
Sean $a, b, c, d$ números reales. Sabemos que las parejas ordenadas $(a, b)$ y $(c, d)$ son iguales, es decir $(a, b) = (c, d)$, si y solo si $a=c$ y $b=d$, por lo que la igualdad entre números complejos está sujeta a dicha condición.
Además, si $a \neq b$, entonces $(a, b) \neq (b, a)$, esto es, como parejas ordenadas $(a, b)$ y $(b, a)$ son diferentes, por lo que como números complejos también lo son.

Procedemos ahora a analizar un subconjunto importante de los números complejos, es decir los números de la forma $z = (a, 0)$, con $a \in \mathbb{R}$. A partir de ahora denotaremos al número real $a$ por el número complejo $(a, 0)$.

Observación 2.2
Sean $a, b \in \mathbb{R}$, entonces:

\begin{equation*}
(a, 0) + (b, 0) = (a+b, 0), \quad \text{es decir} \quad a+b.
\end{equation*}

\begin{equation*}
(a, 0) \cdot (b, 0) = (ab, 0), \quad \text{es decir} \quad ab.
\end{equation*}

Notamos que los números complejos de la forma $(a, 0)$ se comportan con respecto a la suma y la multiplicación definidas en (1) y (2) como los números reales. Lo anterior se debe a que el mapeo $a \mapsto (a,0)$ define un isomorfismo de $\mathbb{R}$ en $\mathbb{C}$, es decir:

Proposición 2.1.
La función $\phi: \mathbb{R} \rightarrow \mathbb{C}$ dada por $\phi(a) = (a,0)$ satisface:

  1. $\phi$ es inyectiva.
  2. $\varphi(a+b) = \varphi(a)+\varphi(b)$ y $\varphi(ab) = \varphi(a)\cdot\varphi(b)$.
  3. $\varphi(0) = (0,0)$ y $\varphi(1) = (1,0)$.
  4. $\varphi(-a) = -\varphi(a)$.
  5. Si $a \in \mathbb{R}$, con $a\neq0$, entonces $\varphi(a^{-1}) = \left(\varphi(a)\right)^{-1}$.

Demostración.

  1. La inyectividad se sigue de la observación 2.1.
  2. Observación 2.2.
  3. Se sigue de la definición.
  4. Se deja como ejercicio al lector.
  5. Supongamos que $a \in \mathbb{R}$, con $a \neq 0$, entonces $\phi(a) = (a, 0) \neq (0,0)$ y :

\begin{equation*}
(1, 0) = \phi(1) = \phi(a a^{-1}) = \phi(a)\cdot\phi\left(a^{-1}\right).
\end{equation*}

Entonces $\phi\left(a^{-1}\right) = \left(\phi(a)\right)^{-1}$.

$\blacksquare$

De acuerdo con este resultado, podemos trabajar de manera indistinta con este conjunto de números complejos y los números reales, como si fuesen el mismo conjunto.

Por otra parte, el conjunto de los números complejos de la forma $(0,b)$, con $b \in \mathbb{R}$, será considerado como el conjunto de los números imaginarios puros.

Si definimos a $i:=(0, 1)$, la unidad imaginaria, entonces notamos que:

\begin{equation*}
i^2 = (0, 1) \cdot (0, 1) = (0 – 1, 0) = (-1, 0), \quad \text{es decir} \quad -1.
\end{equation*}
De esta forma podemos concluir que $i = (0, 1)$ es la raíz cuadrada de $-1$. Además tenemos que:

\begin{equation*}
a + ib = (a, 0) + (0, 1) \cdot (b, 0) = (a, 0) + (0, b) = (a, b).
\end{equation*}

De acuerdo a lo anterior, es posible dar la siguiente:

Definición 2.2. (Número complejo.)
Un número complejo es un número de la forma $z = a+ib$ donde $a$ y $b$ son números reales e $i$ es la unidad imaginaria.
Al número real $a$ se le conoce como la parte real de $z$ y se denota como Re$(z)$, mientras que al número real $b$ se le conoce como la parte imaginaria de $z$ y se le denota como Im$(z)$. Además, si Re$(z) = 0$, entonces se dice que $z$ es un número imaginario puro.

Ejemplo 2.1.

  • a) Si $z = 9 \,-\, 6i$, entonces Re$(z) = 9$, mientras que Im$(z) = -6$.
  • b) Si $z = -8i$, entonces Re$(z) = 0$, mientras que Im$(z) = -8$. En este caso $z$ es un número imaginario puro.

Considerando la definición 2.2 y la proposición 2.1, es posible considerar a $\mathbb{R}$ como un subconjunto de $\mathbb{C}$, de forma que todo número real es un número complejo cuya parte imaginaria es igual a cero.

Definición 2.3. (Conjugado de un número complejo.)
Dado un número complejo $z=a+ib$, se define el conjugado de $z$ como el número complejo:
\begin{equation*}
\overline{z} = a \,-\, ib.
\end{equation*}

Ejemplo 2.2.

  • a) Si $z = 6 + 5i$, entonces $\bar{z} = 6 \,-\, 5i$.
  • b) Si $z = -5 – i$, entonces $\bar{z} = -5 + i$.

Definición 4. (Operaciones Aritméticas).
Sean $z_1 = a_1 + ib_1, z_2 = a_2 + i b_2 \in \mathbb{C}$, entonces se definen las siguientes operaciones:

  1. Suma.
    \begin{equation*}
    z_1 + z_2 = (a_1 + ib_1) + (a_2 + i b_2) = (a_1 + a_2) + i(b_1 + b_2)
    \end{equation*}
  2. Resta.
    \begin{equation*}
    z_1 – z_2 = (a_1 + ib_1) – (a_2 + i b_2) = (a_1 – a_2) + i(b_1 – b_2).
    \end{equation*}
  3. Multiplicación.
    \begin{equation*}
    z_1 \cdot z_2 = (a_1 + ib_1) \cdot (a_2 + i b_2) = (a_1a_2 – b_1b_2) + i (b_1a_2 + a_1b_2).
    \end{equation*}
  4. División. Para $z_2 \neq 0$:
    \begin{equation*}
    \frac{z_1}{z_2} = \frac{a_1 + ib_1}{a_2 + i b_2} \frac{a_2 – ib_2}{a_2 – i b_2} =\left(\frac{a_1 a_2 + b_1 b_2}{a_2^2 + b_2^2}\right) + i\left( \frac{b_1a_2 – a_1 b_2}{a_2^2 + b_2^2}\right).
    \end{equation*}

Observación 2.3.
Notemos que si $z=a+ib \in \mathbb{C}$, entonces:
\begin{equation*}
z \cdot \overline{z} = (a+ib) \cdot (a-ib) = (a^2 – (-b^2)) + i(ab-ab) = a^2 + b^2.
\end{equation*}
\begin{equation*}
z + \overline{z} = (a+ib) + (a-ib) = 2a = 2\,\text{Re}(z), \quad \Longrightarrow \quad \text{Re}(z) = \frac{ z + \overline{z}}{2}.
\end{equation*}
\begin{equation*}
z – \overline{z} = (a+ib) – (a-ib) = 2ib = 2\,i\,\text{Im}(z), \quad \Longrightarrow \quad \text{Im}(z) = \frac{ z – \overline{z}}{2i}.
\end{equation*}

Observación 2.4.
A partir de ahora, si es claro que se está efectuando el producto entre números complejos, entonces se omitirá el símbolo “$\cdot$” para indicarlo.

Ejemplo 2.3.
Sean $z_1 = 2 + 4i$ y $z_2 = -3 + 8i$. Calculemos:

  • a) $ \quad z_1 + z_2$,
  • b) $\quad z_1 z_2$.

Solución.

  • a) $ \quad z_1 + z_2 = (2 + 4i) + (-3 + 8i) = (2-3) + (4+8)i = -1 + 12i$.
  • b) $ \quad z_1 z_2 = (2 + 4i) (-3 + 8i) = \left[2(-3) – 4(8)\right] + \left[4(-3) + 2(8)\right]i = -38 + 4i$.

De acuerdo con las definiciones 2.3 y 2.4 es fácil probar las siguientes propiedades:

Proposición 2.2.
Sean $z, w \in \mathbb{C}$, entonces:

  1. $\overline{z \pm w} = \overline{z} \pm \overline{w}$.
  2. $\overline{z w} = \overline{z} \,\overline{w}$.
  3. Si $w \neq 0$, entonces $\overline{\left(\frac{z}{w}\right)} = \frac{\overline{z}}{\overline{w}}$.
  4. $\overline{\overline{z}} = z$.
  5. $z$ es un número real si y solo si $z = \overline{z}$.

Demostración. Sean $z=a_1 + i b_1$ y $w=a_2 + i b_2$, tenemos que:


  1. \begin{align*}
    \overline{z+w} & = \overline{(a_1 + i b_1) + (a_2 + i b_2)} \\
    & = \overline{(a_1 + a_2) + i (b_1 + b_2)} \\
    & = (a_1 + a_2) – i (b_1 + b_2) \\
    & = (a_1 – ib_2) + (a_2 – i b_2) \\
    & = \overline{a_1 + ib_1} + \overline{a_2 + i b_2}\\
    & = \overline{z} + \overline{w}.
    \end{align*}
  1. Ejercicio.
  2. Si $w \neq 0$, entonces:
    \begin{align*}
    \overline{\left(\frac{z}{w}\right)} & = \overline{\left(\frac{a_1 + i b_1}{a_2 + i b_2}\right)} \\
    & = \overline{\left(\frac{a_1 a_2 + b_1 b_2 }{a_1^2 + a_2^2}\right) + i \left(\frac{b_1 a_2 – a_1 b_2 }{a_1^2 + a_2^2}\right)}\\
    & = \left(\frac{a_1 a_2 + b_1 b_2 }{a_1^2 + a_2^2}\right) – i \left(\frac{b_1 a_2 – a_1 b_2 }{a_1^2 + a_2^2}\right)\\
    & = \frac{\overline{\left(a_1 + i b_1\right)}}{\overline{\left(a_2 + i b_2\right)}}\\
    & = \frac{\overline{z}}{\overline{w}}.
    \end{align*}
  1. Ejercicio.
  1. Ejercicio.

Observación 2.5.
Notemos que las propiedades 1 y 2 de la proposición 2.2 se pueden generalizar mediante inducción matemática para un número finito de números complejos, esto es, para $z_1, z_2, \ldots, z_n \in \mathbb{C}$, $n\geq2$, se cumple que:
\begin{equation*}
\overline{z_1 + z_2 + \cdots + z_n} = \overline{z_1} +\overline{z_2} + \cdots + \overline{z_n}.
\end{equation*}

\begin{equation*}
\overline{z_1 z_2 \cdots z_n} = \overline{z_1} \, \overline{z_2} \,\overline{z_n}. \end{equation*}

Tarea moral

  1. Verifica que el conjunto de los números complejos $\mathbb{C}$ con las operaciones definidas en (2.1) y (2.2) satisface los axiomas de campo, es decir, verificar las propiedades de la definición de campo.
  2. En la proposición 2.1 argumenta porqué se cumple la suprayectividad de la función en el inciso 1 y completa la demostración del inciso 4.
  3. Completa las demostraciones de los incisos (1), (2), (4) y (5) de la proposición 2.2.
  4. Prueba los resultados de la observación 2.5 utilizando inducción matemática. ¿Se puede generalizar la propiedad (3) de la proposición 2.2?
  5. Identifica la parte real y la parte imaginaria de los siguientes números complejos:
  • a) $\dfrac{3+5i}{1 + 7i}$.
  • b) $\left(\dfrac{-1+i\sqrt{3}}{2}\right)^3$.
  • c) $\left(\dfrac{i}{3-i}\right) \left(\dfrac{1}{2+3i}\right)$.

Más adelante…

En esta segunda entrada hemos dado una definición formal de lo que es un número complejo. Realizamos la construcción del campo de los números complejos, analizando la relación que existe entre $\mathbb{R}$ y $\mathbb{C}$ como conjuntos. También definimos las operaciones aritméticas básicas de estos números e introducimos una nueva operación llamada la conjugación compleja.

Es importante notar que la extensión del campo de los números reales al campo de los números complejos nos permite dar solución a ecuaciones como $z^2 + 1 = 0$, la cual en $\mathbb{R}$ no tenía solución, mientras que en $\mathbb{C}$ tenemos que los números $z = \pm i$ satisfacen dicha ecuación. En general, notaremos que el campo de los números complejos $\mathbb{C}$ es algebraicamente cerrado, de hecho es la clausura algebraica de $\mathbb{R}$, por lo que siempre será posible hallar soluciones para polinomios con coeficientes en $\mathbb{C}$ de grado $n\geq1$. Más aún, dichos polinomios tendrán exactamente $n$ raíces, lo cual probaremos más adelante cuando veamos el Teorema Fundamental del Álgebra.

En la siguiente entrada daremos una interpretación geométrica de estos números y sus operaciones, por lo que definiremos una nueva cantidad en $\mathbb{C}$ que nos permitirá realizar una mejor comprensión y caracterización de estos números de acuerdo con su posición en un plano, así como la obtención de nuevos resultados y propiedades que nos permitan diferenciarlos de los números reales.

Entradas relacionadas

Álgebra Superior II: Compatibilidad del orden con las operaciones de los naturales

Por Roberto Manríquez Castillo

Introducción

En las entradas anteriores, nos encargamos de definir con toda formalidad la estructura con la que hemos estado familiarizados desde hace mucho; sin embargo, en principio, la forma en que definimos el orden y las distintas operaciones, no parece ser que.

Para finalizar con el estudio de los números naturales, veremos las importantes relaciones que hay entre el orden que definimos para $\mathbb{N}$ en la entrada anterior, y las operaciones que hemos trabajado a lo largo de este tema. Para esto, nuevamente ocuparemos el Principio de Inducción.

Una equivalencia del orden

Aunque como mencionamos en la introducción, la forma en que definimos el orden, no parece tener mucha relación con las operaciones definidas, usando la definición de la suma, podemos dar una definición equivalente del orden en $\mathbb{N}$, en el siguiente teorema, demostramos que en efecto, ambas caracterizaciones son equivalentes.

Teorema.Si $n,m$ son números naturales, se tiene que $n<m$ si y sólo si existe $k\in\mathbb{N}\setminus\{0\}$ tal que n+k=m.

Demostración. Procedamos por inducción sobre $n$.

Si $n=0$, si $0<m$, entonces $m\in \mathbb{N}\setminus\{0\}$ y $n+m=0+m=m$. Recíprocamente, si existe $k\in\mathbb{N}\setminus\{0\}$ tal que $0+k=m$, tendremos que $k=m$, por lo que $m\neq 0$ y por lo tanto $0<m$. Con esto probamos la base de inducción.

Supongamos que el resultado es válido para alguna $n$ y probemos que el resultado para $\sigma(n)$ es decir, que si $m\in\mathbb{N}$ se tiene que $\sigma(n)<m\Leftrightarrow$ existe $k\in\mathbb{N}\setminus\{0\}$ tal que $\sigma(n)+k=m$.

Verifiquemos la ida de la demostración. Supongamos que $\sigma(n)<m$, entonces $n<m$, por lo que por la hipótesis de inducción concluimos que existe $k\neq 0$ tal que $n+k=m$, como $k\neq0$, existe $k’$ tal que $\sigma(k’)=k$, entonces tenemos que

\begin{align*}
m&=n+k\\
&=n+\sigma(k’)\\
&=\sigma(n)+k’
\end{align*}

Notemos además que $k’\neq 0 $, ya que si $k’=0$, entonces $m=\sigma(n)$ lo cual es un contradicción.

Para el regreso, supongamos que existe $k\neq 0$ tal que $\sigma(n)+k=m$ y demostremos que $\sigma(n)\in m$. Como $\sigma(n)+k=m$, concluimos que $n+ \sigma(k)=m$, por lo que $n<m$ y por lo visto en la entrada de La relación de orden en los naturales, tendremos que $\sigma(n)\leq m$. Si $\sigma(n)=m$, entonces cancelando, obtenemos que $k=0$, lo cual es absurdo, entonces solo queda que $\sigma(n)<m$. Con esto concluimos la inducción y la prueba.

$\square$

El orden y las operaciones

Con el anterior resultado, es más fácil ver las relaciones que tendrán el orden con las operaciones, por ejemplo, la siguiente.

Teorema. Si $n<m$ y $l\in\mathbb{N}$, entonces $n+l<m+l$.

Demostración. Como $n<m$, entonces existe $k\neq 0$ tal que $n+k=m$, de donde $n+l+k=m+l$, pero justo esa es la definición de que $n+l<m+l$.

$\square$

Corolario. Si $a<b$ y $c<d$, entonces $a+c<b+d$.

Demostración. Como $a<b$, entonces $a+c<b+c$, y como $c<d$, tenemos que $b+c<b+d$. Por la transitividad del orden, obtenemos el resultado.

$\square$

Finalizamos la entrada, marcando la relación entre el orden y la multiplicación.

Teorema. Si $n<m$ y $l\in\mathbb{N}\setminus\{0\}$, entonces $n\cdot l<m\cdot l$

Demostración. Como $n<m$ entonces existe $k\neq 0$ tal que $n+k=m$, por lo que $nl+lk=ml$, sin embargo, como $l$ y $k$ son distintos de cero, entonces $lk$ también es distinto de cero, por lo que $nl<ml$ justo como debíamos probar.

$\square$

Más adelante…

Con esta entrada, terminamos el estudio de los números naturales, por lo que en la siguiente entrada empezaremos con el estudio de los números enteros. Sin embargo, toda la teoría que hemos desarrollado hasta el momento será la base para poder dar una definición precisa de qué son los números enteros. También nos ayudará a definir sus operaciones, así que nos encontraremos con más oportunidades para practicar nociones de los números naturales.

Hay que hacer una especial mención a los principios de inducción y de buen orden, ya que jugarán un papel crucial a la hora de estudiar las propiedades de los enteros, que nos servirán para desarrollar lo que conocemos como teoría de números.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $a<b$ y $c<d$, entonces $ac<bd$, no es necesario suponer que los números son distintos de cero.
  2. Si $n<m$ y $l\neq 0$, entonces $n^l<m^l$. Sugerencia, usa inducción sobre $l$.
  3. Si $n<m$ y $l\neq 0$, entonces $l^n<l^m$.
  4. Si $n<m$, entonces $n!<m!$.
  5. Demuestra que si $n,m\in\mathbb{N}\setminus\{0\}$, entonces $(1+m)^n\geq 1+nm$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»