Anteriormente revisamos una definición intuitiva del límite con la finalidad de facilitar la comprensión de la definición formal. En esta entrada se dará la definición formal, así como algunos ejemplos para que el concepto sea comprendido en su totalidad.
Definición formal de límite
Retomemos la idea intuitiva a la que llegamos al final de la entrada anterior: logramos que $f$ se aproxime arbitrariamente, $\varepsilon$, a $L$ siempre que logremos que $x$ esté lo suficientemente cerca, $\delta$, de $x_0$ sin ser $x_0.$
Observación. Notemos que la última parte la podemos expresar como $0<|x-x_0|< \delta$, pues al pedir que la distancia entre $x$ y $x_0$ sea mayor que $0$ se captura la idea de que $x \neq x_0$.
Es importante resaltar que estamos dando por hecho que se puede evaluar la función $f$ en valores de $x$ cercanos a $x_0$. Es por ello que se presenta la siguiente definición.
Definición. Sea $ A \subset \mathbb{R}$. Un punto $x_0 \in \mathbb{R}$ es un punto de acumulación de $A$ si para todo $\delta > 0$ existe al menos un punto $x \in A$, $x \neq x_0$, tal que $|x-x_0| < \delta$.
Dada la definición anterior, si consideramos una función $f: A \to \mathbb{R}$, para calcular el límite, y asegurar que podemos evaluar $f$ en valores $x$ cercanos a $x_0$, deberemos pedir que $x_0$ sea punto de acumulación del dominio de la función, $A$. Con esto, tenemos todos los elementos para dar la definición de límite.
Definición. Sean $A \subset \mathbb{R}$ y $x_0$ un punto de acumulación de $A$. Para una función $f: A \to \mathbb{R}$, decimos que $L$ es el límite de $f$ en $x_0$ si para todo $\varepsilon > 0$ existe algún $\delta > 0$ tal que, para todo $x \in A$, si $0<|x-x_0|< \delta$, entonces $|f(x)-L|< \varepsilon.$
A continuación tenemos una imagen que nos permitirá visualizar la definición:
En la imagen podemos ver que si definimos un valor arbitrario $\varepsilon >0$, entonces lo que buscamos es un valor positivo $\delta$, tal que si $x$ está a una distancia menor que $\delta$ con respecto a $x_0$, entonces eso implique que $f(x)$ esté a una distancia menor que $\varepsilon$ con respecto a $L.$
A continuación revisaremos un ejemplo sencillo aplicando la definición.
Ejemplo 1. Demuestra que $$\lim_{x \to -1} \frac{x^2-5x-6}{x+1} = -7.$$
Demostración. Sea $\varepsilon >0$. Notemos que si $x \neq -1$, entonces
Hagamos algunos comentarios respecto a la demostración. Como primer paso, establecimos un valor arbitrario positivo para $\varepsilon$. Después hicimos algunas manipulaciones algebraicas que nos permitieron simplificar la expresión original en una más simple con la cual logramos encontrar el valor de $\delta$ que sería útil, en este caso, ese valor fue justamente el mismo que $\varepsilon$.
Entonces si $|x-2| < 1$, por (1) y (2), tenemos lo siguiente \begin{align*} \left\lvert f(x) – \frac{7}{4}\right\rvert & = \frac{1}{|4x|} \cdot |x-2| \\ \\ & < \frac{1}{4} \cdot |x-2|.\\ \end{align*}
Previamente acotamos $|x-2|$ por el valor $1$, pero de la última expresión se sigue que deberemos acotarlo también por $4 \varepsilon$ para llegar a nuestro objetivo, tomemos así $\delta = min\{1, 4 \varepsilon\}.$
Si $0<|x- 2| \leq \delta$. Es decir, si $|x- 2| \leq 1$ y $|x- 2| \leq 4\varepsilon$, entonces $$\left\lvert f(x) – \frac{7}{4}\right\rvert < \frac{1}{4} |x-2| \leq \frac{1}{4} \cdot 4\varepsilon.$$ $$ \therefore \left\lvert f(x) – \frac{7}{4}\right\rvert < \varepsilon.$$
$\square$
Nuevamente haremos énfasis en los pasos generales de la demostración. Iniciamos dando un valor de $\varepsilon$ arbitrario, y la tarea es encontrar el valor $\delta >0$ que acote la distancia entre $x$ y $x_0 = 2$ de tal manera que los valores de la función $f$ se aproximen a $L$ lo suficiente para que su distancia sea menor que $\varepsilon.$
Trabajemos ahora sobre el siguiente ejemplo.
Ejemplo 3. Para todo $x_0 \in \mathbb{R}$ se tiene que $$\lim_{x \to x_0} x^2 = x_0^2.$$
Demostración.
Sea $\varepsilon > 0$ y $x_0 \in \mathbb{R}$. Notemos que
$|x^2 – x_0^2| = |x-x_0||x+x_0|.$
Haciendo uso de una manipulación análoga al del ejemplo anterior, podemos ver que si $|x-x_0| < 1$, entonces
Cabe resaltar que en el ejemplo anterior usamos la propiedad $|x_0|-|x| \leq |x-x_0|$, ya que la intención es acotar al recíproco de $x$. En este caso, se emplea $|x|-|x_0| \leq |x-x_0|$, puesto que buscamos acotar directamente a $x$.
En esta ocasión queremos que $|x-x_0| < 1$ y, por la última expresión, también queremos que $|x-x_0| <\frac{\varepsilon}{1+2|x_0|}$, definimos así $\delta = min \{ 1, \frac{\varepsilon}{1+2|x_0|} \}$. Si $0 < |x-x_0| < \delta$, entonces
Esto implica que $$|x^2-x_0^2| < \varepsilon.$$ $$\therefore \lim_{x \to x_0} x^2 = x_0^2.$$
$\square$
Unicidad del límite de una función
Después de haber revisado estos ejemplos, la definición de límite de una función (también llamada definición épsilon-delta), estamos listos para revisar la primera propiedad del límite.
Proposición. El límite de una función en $x_0$ es único, es decir, si $f$ tiende a $L$ en $x_0$ y $f$ tiende a $L’$ en $x_0$, entonces $L = L’.$
Demostración. Sea $\varepsilon > 0$. Como $f$ tiende a $L$ y $L’$ en $x_0$, entonces para $\frac{\varepsilon}{2} > 0$ existen $\delta_1 > 0$ y $\delta_2 > 0$ tales que
Como $\varepsilon$ es un valor arbitrario positivo, podemos concluir que $L-L’ = 0$, es decir, $L=L’.$
$\square$
Más adelante…
En la siguiente entrada revisaremos con detalle varias propiedades que tienen los límites para lo cual haremos uso de una bella relación existente entre el límite de una sucesión y el de una función. Una vez revisadas estas propiedades, el cálculo de los límites se hará considerablemente más simple.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
Usando la definición épsilon-delta, demuestra lo siguiente:
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»
Durante las dos últimas entradas conocimos un poco de la geometría de las soluciones a ecuaciones diferenciales de primer orden, aún sin conocerlas explícitamente. En esta entrada resolveremos por primera vez de manera analítica algunas de ellas. En particular, resolveremos ecuaciones del tipo $a_{0}(t)\frac{dy}{dt}+a_{1}(t)y=0$, que llamaremos ecuaciones homogéneas. Primero encontraremos la solución a la ecuación de forma general, y posteriormente resolveremos algunos ejemplos particulares.
Ecuaciones lineales homogéneas
En el primer video resolvemos la ecuación lineal homogénea de primer orden en su forma general.
En el segundo video ponemos en práctica lo aprendido en el video anterior para resolver un par de ecuaciones diferenciales.
Tarea moral
Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.
Encuentra la solución general a la ecuación $\frac{dy}{dt}+e^{t}y=0$.
Resuelve el problema de condición inicial $t^2\frac{dy}{dt}+\sqrt{t}y=0$ ; $y(0)=5$. Encuentra el intervalo donde la solución está definida.
Antes de resolver analíticamente, esboza las soluciones a la ecuación $\frac{dP}{dt}=kP$, con $k>0$, $P(t) \geq 0, \forall t \in \mathbb{R}$, que modela el crecimiento de una población. (Para mayor referencia a esta ecuación revisa la primer entrada de este curso). Si no recuerdas cómo hacerlo, te recomiendo revisar la entrada anterior.
Encuentra la solución general a la ecuación anterior.
Compara las soluciones que dibujaste en el tercer ejercicio con las soluciones que encontraste en el cuarto ejercicio. ¿Qué observas?
Más adelante
Ya sabemos cómo resolver ecuaciones homogéneas. Ahora vamos a ver el otro lado de la moneda, es decir, vamos a resolver ecuaciones no homogéneas.
En la siguiente entrada estudiaremos dos métodos para resolver éste tipo de ecuaciones: primero por medio de una función que llamaremos factor integrante, y más adelante por el método de variación de parámetros en el cual las ecuaciones homogéneas nos serán de mucha ayuda.
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»
En esta entrada estudiaremos el teorema de Tales y algunas aplicaciones. Este teorema nos dice que dos rectas paralelas cortan a otras dos en segmentos proporcionales.
En la entrada anterior definimos el área de un rectángulo y vimos que como consecuencia de esto el área de un triángulo rectángulo era el semiproducto de sus catetos. En esta ocasión necesitaremos hablar del área de un triángulo en general.
Denotaremos al área de un triángulo $\triangle ABC$ como $(\triangle ABC)$.
Área del triángulo
Proposición 1. El área de un triángulo es el producto de la altura trazada por uno de sus vértices por la base o lado contrario a dicho vértice.
Demostración. Sea $\triangle ABC$ un triángulo, tracemos la altura desde el vértice $A$, existen dos posibilidades, el pie de la altura $D$, se encuentra en el segmento $BC$ o está en la extensión del segmento.
Caso 1, $D \in BC$.
Figura 1
Notemos que se forman dos triángulos rectángulos, $\triangle ABD$ y $\triangle ADC$. $\Rightarrow (\triangle ABC) = (\triangle ABD) + (\triangle ADC)$ $= \dfrac{BD \times AD}{2} + \dfrac{DC \times AD}{2}$ $= \dfrac{(BD + DC)AD}{2} = \dfrac{BC \times AD}{2}$.
Caso 2, $D \notin BC$.
Figura 2
Notemos que se forman dos triángulos rectángulos, $\triangle ADB$ y $\triangle ADC$. $\Rightarrow (\triangle ABC) = (\triangle ADC) – (\triangle ADB)$ $= \dfrac{ DC \times AD }{2} – \dfrac{DB \times AD}{2}$ $= \dfrac{(DC – DB)AD}{2} = \dfrac{BC \times AD}{2}$.
$\blacksquare$
Proposición 2. Si dos triángulos tienen una misma altura entonces las razones entre sus áreas es igual a la razón entre las bases perpendiculares a las alturas.
Demostración. Sean $\triangle ABC$ y $\triangle A’B’C’$ dos triángulos tales que las alturas trazadas desde $A$ y $A’$ son iguales, digamos $h$.
Teorema 1, de Tales. Sean $\triangle ABC$, $B’$ y $C’$ en $AB$ y $AC$ respectivamente tales que $B’C’ \parallel BC$, entonces $i)$ $\dfrac{AB}{B’B} = \dfrac{AC}{C’C}$, $\dfrac{AB}{AB’} = \dfrac{AC}{AC’}$ y $\dfrac{AB’}{B’B} = \dfrac{AC’}{C’C}$, $ii)$ $\dfrac{AB}{AB’} = \dfrac{AC}{AC’} = \dfrac{BC}{B’C’}$.
Demostración. Como $\triangle B’C’B$ y $\triangle B’C’C$ tienen la misma base $B’C’$ y están contenidos en las mismas paralelas, lo que implica que su altura es la misma, entonces tienen la misma área.
De las escuaciones $(1)$ y $(2)$ y la proposición 2 obtenemos $\dfrac{(\triangle AC’B)}{(B’C’B)} = \dfrac{(\triangle AB’C)}{(\triangle B’C’C)}$ $\Rightarrow \dfrac{AB}{B’B} = \dfrac{AC}{C’C}$.
Notemos que $\dfrac{AB}{B’B} = \dfrac{AC}{C’C}$, $\dfrac{AB}{AB’} = \dfrac{AC}{AC’}$ y $\dfrac{AB’}{B’B} = \dfrac{AC’}{C’C}$ son equivalentes.
Para la parte $ii)$ trazamos una paralela a $AB$ por $C’$ que interseca a $BC$ en $D$, por la parte $i)$, se cumple $\dfrac{AC}{AC’} = \dfrac{BC}{BD}$.
Figura 5
Como $\square B’BDC$ es paralelogramo $BD = B’C’$ $\Rightarrow \dfrac{AC}{AC’} = \dfrac{BC}{B’C’}$.
$\blacksquare$
Reciproco del teorema de Tales.
Teorema 2, reciproco del teorema de Tales. Sean $\triangle ABC$, $B’$ y $C’$ en $AB$ y $AC$ respectivamente tales que, $\dfrac{AB}{B’B} = \dfrac{AC}{C’C}$ o $\dfrac{AB}{AB’} = \dfrac{AC}{AC’}$ o $\dfrac{AB’}{B’B} = \dfrac{AC’}{C’C}$, entonces $B’C’ \parallel BC$.
Demostración. Supongamos que $B’C’$ y $BC$ no son paralelas, sea $D \in AC$ tal que $B’D \parallel BC$, por el teorema de Tales, $\dfrac{AB}{B’B} = \dfrac{AC}{DC}$.
Figura 6
Pero por hipótesis $\dfrac{AB}{B’B} = \dfrac{AC}{C’C}$, y por transitividad $\dfrac{AC}{DC} = \dfrac{AC}{C’C}$ $\Rightarrow DC = C’C \Rightarrow D = C’ \Rightarrow B’C’ \parallel BC$.
Por la equivalencia entre las expresiones $\dfrac{AB}{B’B} = \dfrac{AC}{C’C}$, $\dfrac{AB}{AB’} = \dfrac{AC}{AC’}$ y $\dfrac{AB’}{B’B} = \dfrac{AC’}{C’C}$, queda demostrado el teorema.
$\blacksquare$
Teorema de la bisectriz
Teorema 3, de la bisectriz. Las bisectrices interna y externa del ángulo de un triángulo dividen al lado opuesto en segmentos proporcionales a los otros dos lados del triángulo.
Demostración. Consideremos un triángulo $\triangle ABC$ y la bisectriz interior de $A$, la cual interseca a $BC$ en $D$.
Trazamos la paralela a $AD$ por $C$, y sea $E$ la intersección de la extensión de $AB$ con la paralela.
Figura 7
Como $AD \parallel CE$ entonces $\angle BAD = \angle AEC$ por ser ángulos correspondientes entre paralelas y $\angle DAC = \angle ECA$ por ser ángulos alternos internos entre paralelas.
Ya que $AD$ es bisectriz de $A$ entonces $\angle BAD = \angle DAC$ y por lo tanto $\angle AEC = \angle ECA$ $\Rightarrow \triangle ACE$ es isósceles, es decir, $AC = AE$.
Aplicando el teorema de Tales a $\triangle BCE$ tenemos que $\dfrac{BD}{DC} = \dfrac{AB}{AE} = \dfrac{AB}{AC}$.
$\blacksquare$
Definición. Una ceviana es un segmento que tiene extremos en el vértice de un triángulo y en el lado opuesto a dicho vértice.
Reciproco del teorema de la bisectriz
Teorema 4, reciproco del teorema de la bisectriz. Si una ceviana divide internamente al lado de un triángulo en segmentos proporcionales a los otros lados del triángulo entonces es la bisectriz interna del ángulo por donde pasa.
Demostración. Sea $\triangle ABC$ y $AD$ con $D \in BC$ tal que $\dfrac{AB}{AC} = \dfrac{BD}{DC}$.
Extendemos $AB$ del lado de $A$ hasta $E$ talque $AE = AC$ (figura 7), como $\triangle AEC$ es isósceles entonces $\begin{equation} \angle AEC = \angle ECA. \end{equation}$
En el triángulo $\triangle BCE$ tenemos que $\dfrac{AB}{AE} = \dfrac{BD}{DC}$, por el reciproco del teorema de Tales, $AD \parallel EC$, $\Rightarrow \angle BAD = \angle AEC$, por ser ángulos correspondientes, $\Rightarrow \angle DAC = \angle ECA$, por ser ángulos alternos internos.
Por $(3)$ se sigue que $\angle BAD = \angle DAC$, por lo tanto, $AD$ es la bisectriz interna de $A$.
$\blacksquare$
El caso para la bisectriz exterior se deja como ejercicio.
Construcciones
Problema. Dados dos segmentos y un segmento unitario, construye el producto y el cociente de los segmentos dados.
Solución. Sean $a$ y $b$ la magnitud de los segmentos dados.
Sea $AB$ el segmento unitario, extendemos $AB$ hasta $B’$ tal que $BB’ = a$.
Levantamos sobre $AB$ en $A$ un segmento $AC = b$, unimos $B$ con $C$ y trazamos por $B’$ la paralela a $BC$.
Sea $C’$ la intersección de $AC$ con la paralela trazada, por el teorema de Tales aplicado a $\triangle AB’C’$, $\dfrac{AB}{BB’} = \dfrac{AC}{CC’} $. $\Rightarrow AB \times CC’ = AC \times BB’ $ $\Rightarrow CC’ = ab$.
Figura 8
Para el cociente seguimos el mismo procedimiento, pero esta vez con $AB = a$ y $BB’ = 1$, por el teorema de Tales obtendremos $a = \dfrac{b}{CC’} \Rightarrow CC’ = \dfrac{b}{a}$.
Figura 9
$\blacksquare$
Más adelante…
En la siguiente entrada y con la ayuda del Teorema de Tales veremos otra herramienta importante en el estudio de la geometría, los criterios de semejanza de triángulos.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
Muestra que la suma de las distancias de un punto interior a los lados de un triangulo equilátero es constante. Este resultado es conocido como teorema de Viviani.
Figura 10
$i)$ Muestra que si dos rectas $l_{1}$ y $l_{2}$ son transversales a tres paralelas $AA’$, $BB’$ y $CC’$ (figura 11), entonces $\dfrac{AB}{BC} = \dfrac{A’B’}{B’C’}$. $ii)$ Recíprocamente si $\dfrac{AB}{BC} = \dfrac{A’B’}{B’C’}$ y dos de las tres rectas $AA’$, $BB’$, $CC’$son paralelas, entonces las tres rectas son paralelas.
Figura 11
Usando el teorema de Tales, $i)$ muestra que el segmento que une puntos medios de dos lados de un triangulo es paralelo e igual a la mitad del tercer lado, $ii)$ recíprocamente muestra que si una recta pasa por el punto medio de un triangulo y es paralela a un segundo lado entonces pasa por el punto medio del tercer lado.
Prueba que un segmento que pasa por el vértice de un triangulo divide externamente al lado opuesto en segmentos proporcionales a los restantes lados del triangulo si y solo si es la bisectriz exterior del ángulo.
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»
A lo largo del tiempo el desarrollo de las Matemáticas ha sido una constante abstracción entre lo real y lo necesario. Es claro que la necesidad de resolver distintas problemáticas ha sido la motivación para dar soluciones que a su vez permitan desarrollar nuevas teorías que den sustento y validez a dichos planteamientos. Muchos de los resultados y de las teorías que tenemos actualmente parecen haber sido trabajados de manera consecutiva, sin embargo hoy sabemos que se han dado de forma independiente, y que algunas de las ramas de las Matemáticas que convergen en teorías más generales fueron, en principio, abordadas en distinto tiempo y con distinto enfoque. El hecho de que hoy podamos entender conceptos que parecen evidentes es gracias a todo este desarrollo.
Tanto la definición como el concepto que tenemos hoy en día sobre lo que es un número complejo han cambiado durante el desarrollo de la teoría de los Números Complejos. Con ánimos de plantear soluciones a problemas como ecuaciones cuadráticas y cubicas, pero sobre todo de entender y explicar expresiones que requerían hablar de algunas “cantidades sofisticadas”, como les llamó Cardano, se ha desarrollado la teoría que hoy conocemos como Variable Compleja. Aunque estos números estuvieron presentes en problemas matemáticos desde el primer siglo, como en cálculos de volúmenes de pirámides hechos por Herón de Alejandría alrededor del año 75 D.C., este concepto se tuvo que abstraer primero para poder comprender expresiones en las que se tenían raíces de números negativos. Del mismo modo en que el concepto de número negativo en principio parecía inconcebible, tanto que se les llego a llamar “falsos números”, los números complejos fueron tratados en ocasiones como “cantidades imposibles”, ya que no eran aceptados por estar fuera de lo real.
Antecedentes
En la historia de los números complejos aparecen nombres de grandes matemáticos que en su tiempo hicieron algún aporte en la teoría y comprensión de estos números, por lo que es importante mencionar algunos de sus resultados con la finalidad de entender un poco mejor el origen de la Variable Compleja.
Aunque los primeros resultados trascendentes al trabajar con números complejos se dieron durante el siglo XVI, desde los primeros siglos algunos matemáticos hindúes como Bhaskara Acharya (486 D.C.) y Mahavira Acharya (850 D.C.) tenían en sus trabajos escritos como “el cuadrado tanto de un número positivo como de un número negativo es positivo y la raíz cuadrada de un número positivo es doble: positiva y negativa, mientras que no existe la raíz cuadrada de un número negativo, porque no existen números negativos al elevarlos al cuadrado” y “como es natural, una cantidad negativa no es una cantidad al cuadrado, por lo que no tiene raíz cuadrada”. Estas ideas nos dejan claro que el contexto para hablar de un número complejo, tal y como lo conocemos ahora, no era favorable. Fue hasta el año de 1545 cuando el matemático italiano Girolamo Cardano, publicó su libro Ars Magna (El Gran Arte), en el cual describía métodos algebraicos para resolver ecuaciones cuadráticas y cúbicas, cuando los números complejos comenzaron a ser necesarios.
La importancia del trabajo de Cardano está en que reconoce la necesidad de trabajar con “cantidades sofisticadas” para dar solución a ecuaciones que se habían catalogado como “imposibles”. Es quizás la sutileza que observó Cardano en sus soluciones la que abre un nuevo capítulo para los números complejos.
Si deseas conocer más acerca de la historia de los números complejos y los resultados de Cardano puedes consultar los libros An Introduction to Complex Analysis de Agarwal, Ravi P., Numbers de Ebbinghaus, H.D., y Ars Magna or the Rules of Algebra by Girolamo Cardano traducido al inglés por Richard Witmer.
con $p= – \frac{b^2}{3a^2} + \frac{c}{a}$ y $q = \frac{2b^3}{27a^3} – \frac{bc}{3a^2} + \frac{d}{a}$.
$\blacksquare$
De acuerdo con el resultado anterior, dada una ecuación cúbica como en (1.1), para reducirla a una ecuación sin el término cuadrático basta con usar un cambio de variable de la forma $x=y-\frac{b}{3a}$.
Teorema 1. (Fórmula de Cardano.) Sean $a, b, c, d \in \mathbb{R}$ con $a \neq 0$. Las raíces de la ecuación cúbica:
Donde $p= – \dfrac{b^2}{3a^2} + \dfrac{c}{a}$ y $q = \dfrac{2b^3}{27a^3} – \dfrac{bc}{3a^2} + \dfrac{d}{a}$.
Demostración. Dadas las hipótesis, de acuerdo con el Lema 1 tenemos que la ecuación (1.2), utilizando el cambio de variable $x=y-\frac{b}{3a}$, se puede simplificar como: \begin{equation*} y^3 + py + q = 0, \tag{1.4} \end{equation*}
donde $p= – \dfrac{b^2}{3a^2} + \dfrac{c}{a}$ y $q = \dfrac{2b^3}{27a^3} – \dfrac{bc}{3a^2} + \dfrac{d}{a}$.
de donde obtenemos: \begin{align*} \left(\alpha + \beta\right)^3 – 3\alpha\beta \left(\alpha + \beta\right) – \left(\alpha^3 + \beta^3\right) = 0. \tag{1.5} \end{align*}
Si definimos $q = – \left(\alpha^3 + \beta^3\right)$ y $p = – 3\alpha\beta$ en (1.5), entonces $y = \alpha + \beta$ es una solución de (1.4). Tenemos entonces que: \begin{align*} p = -3 \alpha \beta \quad \Longrightarrow \quad \left(\alpha \beta\right)^3 = -\left(\frac{p}{3}\right)^3.\\ \tag{1.6} q = – \left(\alpha^3 + \beta^3\right) \quad \Longrightarrow \quad \alpha^3 + \beta^3 = -q. \end{align*}
De (1.6) se sigue que $\beta^3 = -\frac{p^3}{27 \alpha^3}$, por lo que podemos obtener la siguiente ecuación en términos de $\alpha^3$: \begin{align*} -q &= \alpha^3 + \beta^3\\ &= \alpha^3 -\frac{p^3}{27 \alpha^3}, \end{align*}
Considerando que tenemos 2 raíces cuadradas y 3 raíces cúbicas, entonces hay en total 6 raíces, pero dadas las condiciones en (1.6), tenemos que fijado un valor de $\alpha$, entonces el valor de $\beta$ está determinado por la igualdad $p = – 3\alpha \beta$, lo cual nos garantiza que (1.4) tiene solo 3 soluciones, que de acuerdo con lo anterior son de la forma:
Observación 1.1. El resultado de Cardano parecía no tener sentido en el caso en que $\left(\dfrac{q}{2}\right)^2 + \left(\dfrac{p}{3}\right)^3< 0$, sin embargo fue la sutileza de Cardano la que le permitió asumir que trabajar con «cantidades sofisticadas», a decir expresiones donde aparecían números negativos dentro de raíces cuadradas, daba resultados útiles aunque fuera de lo real. Cardano mostró que las ecuaciones cúbicas con ésta condición tenían soluciones reales dadas como suma de raíces cúbicas imaginarias.
Ejemplo 1. Consideremos las siguientes ecuaciones:
a) $ \quad x^3 – 30x -36 =0$.
b) $ \quad x^3 – 15x – 4 = 0$.
Es claro que estas ecuaciones no eran consideradas “imposibles” desde que $x = 6$ es solución de a) y $x = 4$ es solución de b). Sin embargo usando la fórmula de Cardano obtenemos las siguientes soluciones:
a) Tenemos que $p = -30 $ y $q = -36$, entonces sustituyendo en la solución del Corolario 1 tenemos que: \begin{align*} x & = \sqrt[3]{18 + \sqrt{-676}} + \sqrt[3]{18 – \sqrt{-676}}\\ & = \sqrt[3]{18 + \sqrt{-1} \, 26} + \sqrt[3]{18 – \sqrt{-1} \, 26}. \end{align*}
b) Tenemos que $p = -15 $ y $q = -4$, entonces sustituyendo en la solución del Corolario 1 tenemos que: \begin{align*} x & = \sqrt[3]{2 + \sqrt{-121}} + \sqrt[3]{2 – \sqrt{-121}}\\ & = \sqrt[3]{2 + \sqrt{-1} \, 11} + \sqrt[3]{2 – \sqrt{-1} \, 11}. \end{align*}
Lo que observó Cardano claramente era cuestionable, aunque fue hasta 1572 que el matemático italiano Rafael Bombelli en su libro «L’Algebra» desarrolló las reglas básicas del álgebra de los números complejos. Usando la notación moderna para $\sqrt{-1}$, es decir la letra $i$, misma que fue usada por primera vez por el matemático Leonhard Euler, Bombelli estableció que:
$(\pm 1)i = \pm i $.
$(\pm 1)(-i) = \mp i $.
$(+i)(+i) = -1$.
$(-i)(+i) = (+i)(-i) = +1$.
Es entonces cuando los resultados que aparentemente no tenían sentido alguno lo cobran gracias a Bombelli, quien estableció la forma correcta de operar con estos números, tanto que mediante el uso de las propiedades de los números reales manipula las expresiones obtenidas por Cardano resolviendo así que:
Todo el desarrollo anterior fue posible gracias al trabajo hecho por Bombelli. Después de Cardano y Bombelli hubo aportaciones de grandes matemáticos como Descartes, Leibniz, Euler, Wallis, Wessel, Argand, Gauss, Cauchy, Hamilton, entre otros, quienes colaboraron en el desarrollo y comprensión de estos números y su teoría, la construcción moderna que tenemos hoy en día de los números complejos, su operabilidad, interpretación geométrica, incluso su mismo nombre, es sin duda el resultado de la abstracción y unificación de todas estas ideas.
Observación 1.2. Es importante mencionar que a lo largo de este curso haremos uso de las siguientes notaciones para referirnos a los distintos conjuntos:
Encuentra las otras dos raíces cúbicas de las ecuaciones a) y b) del ejemplo 1. ¿También son reales?
Consideremos al discriminante $\triangle = \left( \dfrac{q}{2} \right)^2 + \left( \dfrac{p}{3} \right)^3$. De acuerdo con los ejemplos, notamos que las raíces reales estaban dadas como suma de raíces cúbicas complejas en el caso en que $\triangle<0$. ¿Qué pasa cuando $\triangle = 0$ y $\triangle>0$?.
Considera las siguientes ecuaciones:
a) $ \quad x^3 + 6x + 20 = 0$.
b) $ \quad x^3 -6x – 4 = 0 $.
Utilizando la fórmula de Cardano encuentra la solución y de ser necesario realiza un poco de álgebra para simplificar los resultados, observa que $x=-2$ es una solución para ambas ecuaciones ¿Cómo es su discriminante $\triangle$ ?
Resuelve el siguiente problema planteado por el matemático chino Qin Jinshao en el siglo XIII:
Una ciudad está rodeada por una muralla circular con dos puertas, una al norte y otra al sur. Saliendo por la puerta norte y caminando 3 li hacia el norte se llega hasta un árbol. Saliendo por la puerta sur, hay que caminar 9 li hacia el este para ver el mismo árbol. Calcular el diámetro de la ciudad.
Hint: considera que ambos triángulos del esquema anterior son semejantes.
Considera el siguiente problema, el cual llegó a considerarse insoluble:
Divide 10 en dos partes, tales que su producto sea igual a 40.
Es decir, encuentra los números $x, y$ tales que:
\begin{align*} x+y = 10,\\ xy = 40. \end{align*}
Es fácil ver que no existen soluciones reales para este problema. Sin embargo, haciendo un poco de cuentas obtendríamos que $x=5+\sqrt{-15}$ y $y=5-\sqrt{-15}$ son las soluciones a nuestro problema. ¿Consideras entonces que $\sqrt{-1}$ es un factor clave en las soluciones de algunas ecuaciones insolubles en los reales?
Más adelante…
Hasta ahora hemos motivado la necesidad de trabajar con números complejos. Es posible realizar un análisis más exhaustivo de la solución para ecuaciones cúbicas, considerando casos particulares y determinando las condiciones necesarias para la existencia de raíces reales e imaginarias, pero esto se escapa de los objetivos del curso, por lo que dejaremos hasta aquí este pequeño resumen histórico de la construcción y desarrollo de los números complejos.
En la siguiente entrada haremos la construcción formal de los números complejos como un campo, definiremos propiamente lo que entenderemos por un número complejo, así como sus operaciones algebraicas y algunas propiedades importantes que nos permitirán ir trabajando con estos números e interpretarlos mejor desde una perspectiva geométrica.
En la entrada antepasada definimos lo que es una medida de probabilidad. Esto es, dimos una lista de propiedades que debe de cumplir una función para llamarla «medida de probabilidad». Como en toda teoría matemática, esto da lugar a más propiedades. Por ello, en esta entrada veremos varios resultados que se desprenden de la definición de medida de probabilidad.
Regla de complementación
Dado $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad, puede pasarnos que obtener la probabilidad de un evento es muy difícil. Sin embargo, quizás calcular la probabilidad de su complemento sea más fácil. Por ello, veamos primero una propiedad que relaciona la probabilidad de un evento con la de su complemento.
Proposición. Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad. Para cualquier evento $A \in \mathscr{F}$ se cumple que
Demostración. Sea $A \in \mathscr{F}$ un evento. Nuestro objetivo es demostrar que $\mathbb{P}(A^{\mathsf{c}}) = 1 − \mathbb{P}(A)$. Para hacerlo, recuerda que en la entrada antepasada vimos que una medida de probabilidad es finitamente aditiva. Además, nota que $A \cap A^{\mathsf{c}} = \emptyset$; es decir, $A$ y $A^{\mathsf{c}}$ son ajenos. En consecuencia, se cumple que
Por otro lado, por la definición del complemento relativo se tiene que $A \cup A^{\mathsf{c}} = \Omega$, con lo que $\mathbb{P}(A \cup A^{\mathsf{c}}) = \mathbb{P}(\Omega) = 1$. Por lo tanto, se sigue que
Finalmente, despejando a $\mathbb{P}(A^{\mathsf{c}})$, obtenemos que $\mathbb{P}(A^{\mathsf{c}}) = 1 − \mathbb{P}(A)$, que es justamente lo que queríamos demostrar.
$\square$
Esta propiedad será útil en numerosos ejemplos de conteo que veremos más adelante.
¿Qué pasa con la probabilidad de la unión de dos eventos?
En la entrada antepasada nos encontramos con un problema. Al momento de obtener la suma de las probabilidades de dos eventos $A$ y $B$ que no son ajenos, podía salirnos más de $1$. Sin embargo, había una pista de qué podíamos hacer al respecto. Notamos que contábamos algo más de una vez. Más precisamente, contamos $A \cap B$ más de una vez. Además, en la tarea moral te sugerimos que pensaras qué hacerle a $\mathbb{P}(A) + \mathbb{P}(B)$ para que coincida con $\mathbb{P}(A\cup B)$. La siguiente proposición nos da la respuesta.
Proposición. Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad. Sean $A$, $B \in \mathscr{F}$ eventos cualesquiera. Entonces se cumple que
\[ \mathbb{P}(A \cup B) + \mathbb{P}(A \cap B) = \mathbb{P}(A) + \mathbb{P}(B). \]
Demostración. Sean $A$, $B \in \mathscr{F}$ eventos. Primero, aplicando algunas propiedades de las operaciones de conjuntos, podemos ver lo siguiente:
\begin{align*} A &= A \cap \Omega \\ &= A \cap (B \cup B^{\mathsf{c}}) \\ &= (A \cap B) \cup (A \cap B^{\mathsf{c}}) \\ &= (A \cap B) \cup (A \smallsetminus B). \end{align*}
Además, observa que $(A \cap B) \cap (A \smallsetminus B) = \emptyset$. De manera similar, se tiene que
\[ B = (A \cap B) \cup (B \smallsetminus A), \]
y además, $(A \cap B) \cap (B \smallsetminus A) = \emptyset$. En consecuencia, por la aditividad finita de $\mathbb{P}$, podemos ver que
\begin{equation} \label{sum} \mathbb{P}(A) + \mathbb{P}(B) = \mathbb{P}(A \cap B) + \mathbb{P}(A \smallsetminus B) + \mathbb{P}(A \cap B) + \mathbb{P}(B \smallsetminus A). \end{equation}
Ahora, observa que $A \cup B = (A \smallsetminus B) \cup (A \cap B) \cup (B \smallsetminus A)$, y que los tres conjuntos en esta unión son ajenos entre sí. Por la aditividad finita de $\mathbb{P}$, esto implica que
\begin{equation} \label{partition} \mathbb{P}((A \smallsetminus B) \cup (A \cap B) \cup (B \smallsetminus A)) = \mathbb{P}(A \smallsetminus B) + \mathbb{P}(A \cap B) + \mathbb{P}(B \smallsetminus A). \end{equation}
Luego, sustituyendo \eqref{sum} en \eqref{partition} y utilizando que $A \cup B = (A \smallsetminus B) \cup (A \cap B) \cup (B \smallsetminus A)$,
\begin{align*} \mathbb{P}(A) + \mathbb{P}(B) &= \mathbb{P}(A \cap B) + \mathbb{P}((A \smallsetminus B) \cup (A \cap B) \cup (B \smallsetminus A)) \\ &= \mathbb{P}(A \cap B) + \mathbb{P}(A \cup B). \end{align*}
que corresponde a «quitar» la parte que contamos más de una vez en la probabilidad de $A \cup B$. En resumen, esta proposición nos da una expresión para calcular la probabilidad de cualquier unión de dos eventos sin necesidad de que estos sean ajenos. Esta propiedad es conocida como el principio de inclusión-exclusión para $2$ eventos.
Interpretación visual del principio de inclusión-exclusión
En el caso para $2$ eventos, podemos representar visualmente los eventos $A$ y $B$ mediante un diagrama de Venn-Euler. En la siguiente figura están representados $A$ y $B$.
Figura. Animación de lo que ocurre al obtener $\mathbb{P}(A) + \mathbb{P}(B)$. Observa que $A \cap B$ se ve más oscuro porque lo contamos $2$ veces.
Al colorearlos, estamos pensando que lo coloreado de color rojo representa a $\mathbb{P}(A)$, y lo de color verde representa a $\mathbb{P}(B)$. Además, los coloreamos con una opacidad baja para que se note que la parte en donde se traslapan, que es $A \cap B$, se colorea dos veces cuando sumamos las áreas sombreadas por separado: esto lo comentamos previamente, en $\mathbb{P}(A) + \mathbb{P}(B)$ se cuenta $2$ veces a $A \cap B$. Por ello, para obtener $\mathbb{P}(A \cup B)$ se le resta $\mathbb{P}(A \cap B)$ a $\mathbb{P}(A) + \mathbb{P}(B)$.
Figura. $\mathbb{P}(A \cup B)$ sería el valor representado por colorear a todo $A \cup B$, sin que haya porciones más oscuras.
En la figura anterior resaltamos con la misma opacidad a todo $A \cup B$ con azul. Al restarle $\mathbb{P}(A \cap B)$ a $\mathbb{P}(A) + \mathbb{P}(B)$ aseguramos que $A \cap B$ no se contabiliza $2$ veces.
Principio de inclusión-exclusión para más eventos
El principio de inclusión-exclusión aplica para cualquier familia finita de eventos. Por ejemplo, sean $A_{1}$, $A_{2}$ y $A_{3}$ eventos. Podemos aplicar el principio de inclusión-exclusión (al cual abreviaremos P.I.E. por ahora) para $2$ eventos a $A_{1} \cup A_{2}$ y $A_{3}$. Es decir, se tiene que
En conclusión, obtuvimos una fórmula para el cálculo de la probabilidad de la unión de cualesquiera $3$ eventos.
Interpetación visual del P.I.E. para tres eventos
Nuevamente podemos auxiliarnos de un diagrama de Venn-Euler para representar visualmente a los $3$ eventos.
Figura. Animación que muestra $3$ conjuntos. Se sombrea primero cada uno individualmente, luego dos a dos, y luego los tres, para exhibir los pedazos que se contabilizan más de una vez.
Con rojo representamos a $\mathbb{P}(A)$, con verde a $\mathbb{P}(B)$ y con ámbar a $\mathbb{P}(C)$. En la animación anterior se muestra cada una de las regiones por separado, luego dos a dos, y luego las tres juntas. Así, se exhibe que estamos contabilizando más de una vez algunas de las regiones del diagrama, y pone en evidencia cuáles son las que deberíamos de quitar.
Figura. $\mathbb{P}(A \cup B \cup C)$ sería el valor representado por el área coloreada de morado, sin que haya áreas más opacas que otras.
En esta última figura, representamos el valor $\mathbb{P}(A \cup B \cup C)$ con el área de color morado. Aquí pasan más cosas que en el caso de $2$ eventos. Recuerda que la expresión que obtuvimos para $\mathbb{P}(A \cup B \cup C)$ es
\begin{align*} \mathbb{P}(A \cup B \cup C) = \mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C) − \mathbb{P}(A \cap B) − \mathbb{P}(A \cap C) − \mathbb{P}(B \cap C) + \mathbb{P}(A \cap B \cap C). \end{align*}
Al sumar $\mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C)$, las intersecciones dos a dos de los eventos se contabilizan una vez más de lo que deberían, es lo mismo lo que nos pasó con el caso para $2$ eventos. Por ello, restamos la probabilidad de cada intersección dos a dos. Sin embargo, observa que esto provoca un daño colateral: quitamos $3$ veces a $\mathbb{P}(A \cap B \cap C)$, porque $A \cap B$, $A \cap C$ y $B \cap C$ contienen a $A \cap B \cap C$. Pero en $\mathbb{P}(A) + \mathbb{P}(B) + \mathbb{P}(C)$ también lo contabilizamos $3$ veces. Así que estamos omitiendo $\mathbb{P}(A \cap B \cap C)$, razón por la que se le suma $\mathbb{P}(A \cap B \cap C)$ a la expresión.
Generalización del P.I.E.
El principio de inclusión-exclusión puede generalizarse para cuando se tienen $n \in \mathbb{N}^{+}$ eventos. Esto lo pondremos como un teorema, aunque omitiremos su demostración.
Teorema. Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad. Entonces para cualquier $n \in \mathbb{N}^{+}$ y cualesquiera eventos $A_{1}$, $A_{2}$, …, $A_{n} \in \mathscr{F}$, se cumple que
La segunda fórmula se ve un poco fea, pero en realidad no es tan horrible. Observa que se trata de una «suma de sumas». Es decir, para cada $k \in \{1, \ldots, n\}$, el $k$-ésimo término de esa suma es una suma. Lo más complicado está en cada una de estas sumas: están indicadas por $I$, que se refiere a que el índice es un subconjunto de $\{1, \ldots, n\}$. Lo importante de este índice es que $|I| = k$, es decir, hay un término por cada subconjunto de $\{1, \ldots, n\}$ de cardinalidad $k$. Además, cada uno de estos términos es la probabilidad de la intersección sobre todos los $A_{j}$ para los cuales $j \in I$.
Ejemplo. Obtengamos la expresión para $3$ eventos a partir de la segunda fórmula. Sean $A_{1}$, $A_{2}$ y $A_{3}$ eventos. Entonces
La suma de afuera cuenta con $3$ términos, porque es la suma de $1$ a $3$. Cada uno de sus términos es una suma, en la que hay que sustituir los respectivos valores de $k$. Así que nos queda:
Veamos el primer término. Este corresponde a la suma sobre todos los $I \subseteq \{1,2,3\}$ tales que $|I| = 1$. Los subconjuntos de cardinalidad $1$ de $\{1,2,3\}$ son $3$: $\{1\}$, $\{2\}$ y $\{3\}$, por lo que hay un término en esa suma por cada uno de ellos. Es decir,
y observa que las intersecciones en cada término son simplemente $A_{1}$, $A_{2}$ y $A_{3}$, porque la intersección es únicamente sobre $\{1\}$, $\{2\}$ y $\{3\}$, respectivamente. Así,
Para el segundo término, el índice $I$ son todos los subconjuntos de $\{ 1, 2, 3\}$ de cardinalidad $2$, que nuevamente son $3$: $\{ 1, 2 \}$, $\{1,3\}$ y $\{2,3\}$. Por lo tanto,
Finalmente, para el último término, el índice corre por todos los subconjuntos de $\{1,2,3\}$ de cardinalidad $3$, y sólamente hay uno de estos: $\{1,2,3\}$. Por ello, se tiene que
que es justamente la expresión que habíamos obtenido previamente.
Tarea moral
Los siguientes ejercicios son opcionales. Es decir, no formarán parte de tu calificación. Sin embargo, te recomiendo resolverlos para que desarrolles tu dominio de los conceptos abordados en esta entrada.
Sea $(\Omega, \mathscr{F}, \mathbb{P})$ un espacio de probabilidad, y sean $A$, $B$, $C$ y $D$ eventos. Obtén una fórmula para obtener $\mathbb{P}(A \cup B \cup C \cup D)$. Para ello, te proponemos dos caminos:
Sugerencia 1. Sigue un camino similar al que seguimos para obtener el P.I.E. para $3$ eventos. Es decir, aplica los P.I.E. que ya tienes (para $2$ y para $3$ eventos) de manera conveniente. Como pista, aplica el P.I.E. para $3$ eventos a $(A \cup B)$, $C$ y $D$.
Sugerencia 2. Utiliza cualquiera de las fórmulas del último teorema de esta entrada para $n = 4$ y haz el desarrollo correctamente.
Intenta demostrar el último teorema de esta entrada. Esto puede hacerse por inducción sobre $n$, el número de elementos en la familia finita de eventos.
Sugerencia. Utiliza inducción fuerte. Es decir, primero observa que la igualdad es cierta para $1$. Luego, demuestra que para cualquier $n$, si la igualdad es verdadera para cada $k \in \{1,\ldots, n\}$, entonces es cierta para $n+1$. En este paso será necesario que uses la de $2$ eventos y la de $n$ eventos para proceder.
Más adelante…
En esta entrada vimos dos propiedades muy importantes de una medida de probabilidad: la regla de complementación y el principio de inclusión-exclusión. La primera será de mucha utilidad cuando veamos algunos ejercicios de conteo, en donde buscaremos calcular la probabilidad de eventos que parecen muy complicados en principio, pero que esta regla facilitará el cálculo. Por otro lado, el principio de inclusión-exclusión es una herramienta un poco complicada, pero que permite el cálculo de la probabilidad de la unión de cualesquiera $n$ eventos, sin importar si son ajenos o no.
En la siguiente entrada veremos algunas propiedades más de una medida de probabilidad. Una vez que terminemos con las propiedades que tiene cualquier medida de probabilidad, centraremos nuestra atención en nuestros primeros ejemplos concretos de medida de probabilidad, cuya relevancia histórica los hace destacables.