Esta entrada es parte de una serie de notas sobre demostraciones matemáticas. Sin embargo, para llegar a la importancia de demostrar, hablaremos previamente de un pequeño mundo en donde habitan seres fantásticos a quienes les interesa mucho la lógica y para quienes es fundamental poder deducir únicamente verdades. Este lugar lo vistaremos a lo largo de varias entradas y lo que acordemos a partir de ahora será cierto más adelante. Así que presta atención.
El mundo de los Blorgs
Antes de que pienses que te equivocaste de entrada debido al cuento que está por comenzar, déjame decirte que todo está relacionado con la teoría que hemos estado platicando. Sin embargo, antes de comenzar a aplicarla, vamos a conocer a los Blorgs.
Imagina el mundo de los Blorgs. Es un mundo paralelo al nuestro que se puede encontrar en aquel mundo que existe más allá de lo que la esquina del espejo deja ver. Es un lugar que se parece un poco al piso sobre el que estamos, despierta con casi los mismos tonos del alba por la mañana pero con algunas cosas distintas.
Para empezar estamos hablando de un mundo en el que habitan mayoritariamente criaturas llamadas Blorgs. Aquellos que alguna vez los vieron, comentan que curiosamente son pequeñas criaturas parecidas a los conejos. Y con algunas otras descripciones en mente, podríamos empezar a clasificar los Blorgs de acuerdo a distintas características como por ejemplo su dieta, su rutina, dónde viven, etc. Pero se decidió que era mejor clasificarlos según su color, y aquí es donde las cosas se ponen interesantes.
Por un lado están los Blergs, estos son las criaturas rojas que viven por las montañas. Después podemos considerar a los Blargs que son aquellos Blorgs verdes y viven debajo del mar, no son muy sociales pero es lo que hay. Finalmente están los Blurgs que son azules y prefieren vivir en el bosque. Entonces, podemos dividir a los Blorgs en sus razas: Blergs, Blargs y Blurgs. Algo importante que tenemos que decir también: ningún Blorg tiene más de un color.
Quizá sean de color distinto y vivan en lugares diferentes, pero esto no les impide tener algunas cosas en común. Por ejemplo, todos los Blurgs comen pescados, pues tienen un lago cerca de su bosque, y al ser los Blargs marinos, también comen pescados. El hecho de haber vivido tanto tiempo en terreno alto, hizo que los Blergs prefieran cultivar sus cosechas: frutos dulces y verduras siempre comen. Por alguna razón, será costumbre o creencia, todos los Blorgs comen los lunes, es decir, que cada criatura come una vez a la semana. Eso les ha ayudado a no depender tanto de la comida en el día a día. Aunque aquí es donde los Blurgs no coinciden: ellos no esperan tanto y también comen algo los viernes.
La vida siendo Blorg
Tristemente, los Blargs no pueden salir del mar, pues a pesar de ser Blorgs, el salir del agua les despinta lo verde y les quita fuerza. Es por esto que casi no hablan con sus contrapartes terrestres. Por otro lado los Blerg y los Blurg se llevan muy bien. Los Blurgs comparten la madera que tienen con los Blergs y los Blergs comparten los cultivos que hacen con los Blurgs (aunque no para comer, los Blurgs más bien usan los lindos colores de los frutos rojos para pintar).
No está de más decir que todos los Blergs son amigos de todos los Blurgs. Esto hace que los Blargs se sientan más ajenos a ellos, pues aunque sí se llevan con los Blurgs, prefieren juntarse con los delfines que viven junto a ellos. Los blurgs son amistosos con los Blargs y Blergs, y siempre están dispuestos a negociar peces a cambio de paseos a lo largo del mar. Pero nadie se queja, así es la vida siendo un Blorg.
De esta manera, podemos resumir la información que sabemos de los Blorgs en el siguiente diagrama:
Sobre Axios y demostraciones matemáticas
Una cualidad que podemos saber de los Blorgs es que ellos le llaman al lugar en donde viven «Axios» y dentro de ella, no hacen diferencia entre lo que es una característica o costumbre, ellos no tienen una palabra para cada una de ellas. En su lugar usan la palabra «Axioma«* (¿recuerdas qué significa esta palabra?). Esto quiere decir que para los Blargs, ser verdes es un axioma, al igual que para ellos hablar con delfines o comer peces es un axioma.
Así que es natural poder hacer conclusiones a partir de estos Axiomas. Por ejemplo: ¿Qué opinarías si te digo que todos los Blorgs comen peces? ¿O si te digo que todos los Blorgs que viven en montañas comen los lunes? Pues quizá puedas dar respuesta a estas preguntas intuitivamente. Pero, ¿cómo es que nos aseguramos que la respuesta es correcta o no?
En Axios no basta con decir que todos los Blorgs que viven en las montañas comen los lunes. Los Blorgs no entienden la intuición, pero nosotros sí. A ellos hay que convencerlos con demostraciones, a ellos tenemos que explicarles mediante lógica el porqué una proposición sucede. Es decir que si queremos afirmar que todos los Blorgs que viven en las montañas comen los lunes, tenemos que decir paso a paso el porqué es así. Y esto lo lograremos sólo mediante reglas de inferencia válidas. Vamos a anotar esto que acabamos de decir como una definición (¿recuerdas qué era una definición?):
Definición. Una demostración matemática es el uso de pasos lógicos usando reglas de inferencia válidas para llegar de la veracidad de ciertas hipótesis a la veracidad de una conclusión.
La intuición con inferencia
Para introducir un poco más qué van a ser las demostraciones en las matemáticas, vamos a pensar en Legos, aquellos pequeños bloques que encajan unos con otros con los que se pueden armar lo que se te ocurra. Y piensa a las reglas de inferencia como las instrucciones para armar algo.
Imagina que queremos armar un cuarto con una mesa, cama y lámpara con estas piezas. Primero, tendríamos que armar una mesa, para lo cual necesitamos armar las patas y después la superfice. Las reglas de inferencia nos van a ayudar diciéndonos: las patas hay que acomodarlas de cierta manera junto a la superficie para que se haga una mesa. Y una vez construida la mesa, ahora podemos usar otras reglas de inferencia para crear la cama y otras para la lámpara, juntando las tres partes (mesa, cama y lámpara) tendríamos hecho un cuarto.
Así, si quisiéramos «demostrar» cómo se hace un cuarto con estas piezas de Lego, tendríamos que explicar cómo se hace la lámpara, cómo se hace la cama y cómo la mesa. Esto es lo que haremos en matemáticas: construir cosas dando las instrucciones adecuadas. Incluso podríamos ir más allá: Una vez que sabemos cómo construir un cuarto, podríamos también demostrar cómo se hace una cocina y un baño. Entonces si tuviéramos ese conocimiento de cómo se hacen estos tres, podríamos construir una casa. Y después sabiendo cómo se construyen casas, podríamos crear ciudades y países enteros. Pero como todo: un paso a la vez.
Armando piezas con los Blorgs
Nuestras piezas de Lego con los Blorgs van a ser los axiomas. Ahora si le dijeramos a un Blorg que los Blorgs verdes comen peces, no nos creería. Debemos darle una demostración de esto:
Proposición. Los Blorgs verdes comen peces.
Demostración.Para empezar, vamos a notar que es una proposición del tipo «Si $x$ es un Blorg verde, entonces $x$ come peces». Esto es lo que queremos demostrar. Para ello, vamos a ir armando poco a poco el argumento con las piezas que sí conocemos:
Usaremos que todos los Blorgs verdes son Blargs. Es decir «si $x$ es un Blorg verde, entonces $x$ es un Blarg»
Usaremos que todos los Blargs comen peces. Es decir «si $x$ es un Blarg, entonces $x$ come peces»
En las demostraciones vamos a ir usando cosas que ya conocemos (en este caso los axiomas) para poder ir aplicando pasos lógicos y reglas de inferencia para llegar a la conclusión deseada. Entonces como queremos ver que todos los Blorgs verdes comen peces, entonces resulta natural «agarrar» o «elegir» un Blorg verde y ver que ese Blorg come peces (si pasa con un Blorg verde, pasará para todos los Blorgs verdes pues todos nuestros pasos lógicos aplicarán para todos los Blorgs verdes). Así que empecemos considerando a $x$ un Blorg verde . Sabemos que «si $x$ es un Blorg verde, entonces $x$ es un Blarg» entonces como nuestro $x$ es un Blorg verde, entonces es un Blarg.
Ahora, sabemos que nuestro $x$ es un Blarg, pero además sabemos que «si $x$ es un Blarg, entonces $x$ come peces» entonces también nuestro Blarg come peces. Por lo tanto los Blorgs verdes comen peces.
$\square$
¿Viste cómo es que hicimos la demostración? Si consideramos
$ P(x) : x$ es blorg verde,
$ Q(x) : x$ es blarg,
$ R(x) : x$ come peces,
entonces realmente lo que hicimos fue usar la siguiente regla de inferencia válida:
$$ \begin{array}{rl} & P \Rightarrow Q \\ & Q \Rightarrow R \\ \hline \therefore & P \Rightarrow R \end{array}.$$
La razón por la que $P\Rightarrow Q$ y $Q\Rightarrow R$ los tomamos como premisas, es porque acordamos que son axiomas. Recuerda que los axiomas los tomamos como verdaderos.
En este caso solo usamos una regla de inferencia. Más veremos cómo se pueden usar varias reglas de inferencia en una misma demostración. Apenas estamos empezando este tema, así que si aún tienes muchas dudas, no te preocupes y vuelve a leer la demostración si es necesario.
Notas
Estas son algunas anotaciones del artículo y no es necesario que las sepas, únicamente son curiosidades o temas por aparte que forman parte de cultura matemática
* Esta palabra viene del griego ἀξίωμα que significa «lo que se considera justo» y de hecho viene de la palabra ἄξιος (áxios) que significa «valioso» y en la antigua grecia se consideraban aquellas cosas que parecían evidentes y no hacía falta justificar.
Más adelante…
Apenas estamos empezando a explicar qué son estas «demostraciones matemáticas». En el mundo de la matemática no hay algo como el recetario de las demostraciones, pero hay ideas o formas de pensar los problemas que te servirán para tener una idea de por dónde empezar a pensar a la hora de demostrar. Así que en las siguientes entradas vamos a ver algunas de estas «formas» de pensar los problemas y lo haremos con ayuda de los Blorgs.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
¿Qué color necesita tener un Blorg para ser amigo de los delfines?
¿Es cierto que existe un Blorg que coma frutos rojos en viernes?
¿Qué argumentos lógicos podrías usar para demostrar que todo Blorg rojo come los lunes? ¿Y qué argumentos usarías para demostrar que si un Blorg vive en el mar, entonces no come los viernes? Finalmente, ¿puedes argumentar por que si un Blorg no es Blurg, entonces sus Blorg amigos comen los viernes?
Verifica que
$$ \begin{array}{rl} & P \Rightarrow Q \\ & Q \Rightarrow R \\ \hline \therefore & P \Rightarrow R \end{array}$$
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»
Antes de entrar de lleno a lo que será una parte importante en tu carrera en las matemáticas, vamos a establecer algunas definiciones que nos permiten aterrizar un poco la idea de usar una serie de proposiciones para ‘demostrar’ otras cosas. En esta entrada veremos algo llamado inferencias matemáticas.
La implicación para deducir verdades
Pensemos un momento en las siguientes dos expresiones:
$$P \qquad P\Rightarrow Q,.$$
¿Qué sucedería si acordamos o sabemos por cualquier razón, que $P$ es verdadera y que $P\Rightarrow Q$ es verdadera? Entonces, debe pasar forzosamente que $Q$ debe ser verdadera. En efecto, esto podemos verificarlo en una tabla de verdad:
$P$
$Q$
$P\Rightarrow Q$
$0$
$0$
$1$
$0$
$1$
$1$
$1$
$0$
$0$
$1$
$1$
$1$
El único renglón en donde $P$ es $1$ y $P\Rightarrow Q$ es $1$ es el cuarto renglón, en el cual en efecto $Q$ es $1$. De la veracidad de $P$ y $P\Rightarrow Q$ se obtiene la veracidad de $Q$. Esto es muy importante, pues nos dice que de $P$ y de $P\Rightarrow Q$ se puede deducir $Q$.
Pensemos ahora en la siguiente fórmula proposicional:
$$(P \land (P \Rightarrow Q)) \Rightarrow Q $$
Por lo que entendemos del $\Rightarrow$ de la derecha, estamos diciendo algo similar a lo que pusimos arriba: «$P$ y $P\Rightarrow Q$ implican $Q$». Abajo haremos una conexión más explícita.
Por el momento, puedes tomar el siguiente ejemplo. Imagina que sabes que las siguientes dos cosas son ciertas simultáneamente:
Si $n$ es un entero impar, entonces $n+1$ es un entero par.
$n$ es un entero impar.
¿Qué podrías concluir a partir de la veracidad de estas dos oraciones? Que $n+1$ es un entero par. Más concretamente, imagina por un momento que no sabes si 8 es impar o par, pero que sí sabemos la veracidad de la primera oración de arriba y que $7$ es impar. Esta información es suficiente para saber que 8 es par, ¿No lo crees?
Inferencias matemáticas: premisas y conclusiones
Lo que hicimos en el ejemplo de la sección anterior fue tomar dos proposiciones $P\Rightarrow Q$ y $Q$ y que acordamos/sabemos que simultánteamente eran verdaderas. A partir de las veracidades de ellas, logramos concluir la veracidad de otra proposición $P$. Nuestro argumento de que «la veracidad de las premisas hizo que la conclusión fuera verdadera» fue a través de la tabla de verdad. Decimos que usamos una inferencia matemática o una regla de inferencia.
Más formalmente, una regla de inferencia está conformada por unas premisas $P_1, P_2,\ldots, P_n$, que son usualmente fórmulas proposicionales en ciertas variables proposicionales que estamos usando; y una conclusión $Q$ que también es una fórmula proposicional. La regla de inferencia es entonces la fórmula proposicional
Hasta aquí hemos definido qué es una regla de inferencia. Pero hay reglas de inferencia válidas y otras que no lo son. Es decir, hay algunas inferencias matemáticas que son válidas: a partir de la veracidad de las premisas se puede obtener la veracidad de la conclusión (como en el ejemplo que discutimos en la sección anterior). Y hay otras que no, que son inválidas. Es decir, son inferencias matemáticas en las que aunque las premisas sean verdaderas, no podemos concluir nada de la veracidad de la conclusión. ¿Cómo saber cuáles reglas de inferencia son válidas y cuáles no?
Volvamos de nuevo a nuestro ejemplo. Las premisas en este caso son $P$ y $P \Rightarrow Q$ y la conclusión es $Q$. Ahora veamos la tabla de verdad de la regla de inferencia $(P \land (P \Rightarrow Q)) \Rightarrow Q $:
$P$
$Q$
$P \Rightarrow Q$
$P \land (P \Rightarrow Q)$
$(P \land (P \Rightarrow Q)) \Rightarrow Q $
$0$
$0$
0
0
1
$0$
$1$
0
0
1
$1$
$0$
1
0
1
$1$
$1$
1
1
1
¿Notas algo peculiar? ¡Pues resulta que la regla de inferencia que dijimos es una tatuología!
En el caso en donde una regla de inferencia sea una tautología, diremos que es una regla de inferencia válida .
Los ingredientes de la validez
Ahora que tenemos las partes de las inferencias matemáticas, veamos un poco su comportamiento para ver cuándo en efecto es verdadera. Esto a la vez nos ayudará a entender la noción de «de la veracidad de las premisas sale la veracidad de la conclusión».
y queremos ver si es válida, pero no queremos hacer todos los renglones de la tabla de verdad. Podemos ahorrarnos mucho trabajo como sigue.
En el lado izquierdo tenemos la conjunción $P_1 \land P_2 \land \dots \land P_n$. Si alguna de las premisas fuera falsa, esta conjunción sería falsa. Pero entonces la implicación $\text{Lado izquierdo}\Rightarrow Q$ sería verdadera (recuerda que en las implicaciones si el lado izquierdo es falso, la implicación es verdadera). Así, todos los renglones de la tabla de verdad donde alguna premisa sea falsa, tendremos gratuitamente que la regla de inferencia es verdadera.
Nos quedan los casos en los que todas las premisas son verdaderas. En ellos, tenemos que ver que la conclusión $Q$ también es verdadera. Así, para ver que la regla de inferencia es válida, basta ver que «en aquellos casos que las premisas son verdaderas, la conclusión también lo es».
Y al revés también se vale. Imagina que sabes que la regla de inferencia es válida y que sabes la veracidad de todas las premisas. Entonces, la conjunción $P_1 \land P_2 \land \dots \land P_n$ es verdadera y, así, forzosamente $Q$ es verdadera. En resumen:
«Si una regla de inferencia es válida (es una tautología), y sus premisas son verdaderas, entonces la conclusión es verdadera. Y viceversa, una regla de inferencia es válida cuando hemos visto que en todas las situaciones que las premisas son verdaderas, la conclusión también».
Algunos ejemplos sencillos de inferencias matemáticas válidas
A continuación vamos a ver algunos ejemplos de algunas inferencias matemáticas válidas.
La regla de inferencia válida más simple que se nos puede ocurrir es la siguiente:
$$ \begin{array}{rl}& P\\ \hline \therefore & P \end{array}$$
En donde básicamente estamos diciendo que si tenemos la premisa $P$ entonces va a pasar $P$, lo cual es muy fácil de verificar incluso platicado. Para ver que esta inferencia es válida, necesitamos que $P\Rightarrow P$ sea una tautología. Si $P$ es verdadero, la implicación es verdadera. Si $P$ es falso, la implicación (al tener su antecedente falso), es verdadera.
Veamos otro ejemplo. Considera que tenemos como premisas a $P$ y $Q$ y como conclusión a $P\land Q$. En este caso tendríamos la regla de inferencia:
Esto claramente es válido, pues la proposición $(P \land Q) \Rightarrow (P \land Q)$ siempre es cierta.
Nota que para que una regla de inferencia no sea válida, se tenga que tener ‘un caso’ en que las premisas sean ciertas y la conclusión no. Por ejemplo, considera la siguiente regla de inferencia que nos diría algo así como que «de cualquier cosa $P$ podemos deducir cualquier cosa $Q$»:
$$ \begin{array}{rl} & P \\ \hline \therefore & Q \end{array}$$
Esta regla de inferencia no es válida (¡qué bueno!). La razón es que la implicación $P\Rightarrow Q$ no es una tautología. Para ver esto, notemos que si $P$ es verdadero y $Q$ es falso, entonces $P\Rightarrow Q$ es falso.
Un ejemplo más complicado de inferencia válida
Ahora hagamos un ejemplo más elaborado, en el que aprovecharemos lo que platicamos sobre «pensar que las premisas son verdaderas». Imaginemos que queremos pensar que la siguiente inferencia es válida:
$$ \begin{array}{rl} & P \Rightarrow Q \\ & Q \Rightarrow R \\ & Q\Rightarrow S \\ &(R\land S) \Rightarrow T \\ & P \\ \hline \therefore & T.\end{array}$$
Si alguna premisa fuera falsa, entonces el antecedente de la conjunción de las premisas es falso, y así la implicación de la inferencia sería verdadera: en los casos en los que alguna premisa es falsa, entonces no hay nada que hacer. Así, pensemos, ¿qué pasa si todas las premisas son verdaderas?
Como $P$ es verdadera y $P\Rightarrow Q$ es verdadera, entonces $Q$ es verdadera. Pero ahora, sabiendo que $Q$ es verdadera y $Q\Rightarrow R$ es verdadera, entonces $R$ es verdadera. De manera similar, $S$ es verdadera.
Como tenemos que $R$ y $S$ son verdaderas, entonces $R\land S$ es verdadera. Y como también $(R\land S) \Rightarrow T$ es verdadera, entonces $T$ es verdadera. ¡Hemos logrado el objetivo! A partir de la veracidad de las premisas llegamos a la veracidad de $T$. ¡Yay! Entonces al suponer que todas nuestras premisas fueron verdaderas, y aplicando un poco de «lógica» llegamos a que nuestra conclusión es verdadera.
Un poco de esto se va a tratar la matemática que sigue. A partir de ahora vamos a empezar a usar esta forma de pensar, estamos rascando la fibra de la matemática y con ello empieza el viaje hacia un bosque lleno de distintas áreas, desde el álgebra y el cálculo, pasando por la geometría y la probabilidad. Todas ellas llevan la capa de la matemática porque partirán de un tronco común que nosotros estamos sentando en estas entradas. Dentro de poco verás cómo todo esto se relaciona al quehacer matemático.
Más adelante…
Acabamos de establecer uno de los cimientos sobre el cuál se sustenta el pensamiento deductivo: realizar inferencias matemáticas. Es como pensaremos de ahora en adelante. No te preocupes si aún no puedes expresar bien la lógica detrás de las reglas de inferencia o sus trucos. Esto apenas comienza, pues en las siguientes entradas relacionaremos lo visto ahora con los bloques que construirán a la matemática: las demostraciones. Y por ahí conocerás un cuento que te introducirá a esta idea.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
Prueba que $P \Rightarrow P$ es una regla de inferencia válida.
Verifica que las siguientes reglas de inferencia son válidas con tablas de verdad:
$$ \begin{array}{rl} & \neg P \Rightarrow \neg Q \\ & \neg P \\ \hline \therefore & \neg Q \end{array}$$
$$ \begin{array}{rl} & P \lor Q \\ & \neg P \\ \hline \therefore & Q \end{array}$$
Ahora haz lo mismo pero da un razonamiento «deductivo» (supón que todas las premisas y explica por qué la conclusión es cierta) de porqué es válida la siguiente regla de inferencia:
$$ \begin{array}{rl} & P \Rightarrow Q \\ & Q \Rightarrow R \\ \hline \therefore & P \Rightarrow R \end{array}$$
Revisa la Tabla de reglas de inferencia en la página de Wikipedia para conocer más reglas de inferencia válidas. Muestra que en efecto son reglas de inferencia válidas haciendo las tablas que verifiquen la tautología requerida.
Cuando estamos viendo si una regla de inferencia es válida, podemos «ir agregando cosas verdaderas que vayamos deduciendo a las premisas» y usarlas a su vez para seguir deduciendo nuevas cosas. El objetivo de este ejercicio es que demuestres esto. Muestra que si $P_1 \land P_2 \land \ldots \land P_n \Rightarrow Q$ es una inferencia válida y $P_1 \land P_2 \land \ldots \land P_n \land Q \Rightarrow R$ es una inferencia válida, entonces $P_1 \land P_2 \land \ldots \land P_n \Rightarrow R$ es una inferencia válida. En otras palabras, ¡prueba que la siguiente inferencia es válida! $$ \begin{array}{rl} & P_1 \land P_2 \land \ldots \land P_n \Rightarrow Q\\ & P_1 \land P_2 \land \ldots \land P_n \land Q \Rightarrow R \\ \hline \therefore & P_1 \land P_2 \land \ldots \land P_n \Rightarrow R. \end{array}$$
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»
En esta entrada, con la ayuda de varias fórmulas y resultados que hemos visto hasta ahora, mostraremos algunas desigualdades geométricas básicas e importantes, entre ellas la desigualdad entre las medias geométrica y aritmética, y la desigualdad de Erdos Mordell.
Medias armónica, geométrica, aritmética y cuadrática
Teorema 1. Dados dos segmentos de longitudes $a$ y $b$ tenemos las siguientes desigualdades: $\dfrac{2ab}{a + b} \leq \sqrt{ab} \leq \dfrac{a + b}{2} \leq \sqrt{\dfrac{a^2 + b^2}{2}}$.
De izquierda a derecha estas cantidades se conocen como media armónica, media geométrica, media aritmética y media cuadrática de $a$ y $b$.
Demostración. Tracemos un semicírculo tomando como diámetro un segmento $BC$ de longitud $a + b$ y sea $D \in BC$ tal que $BD = a$ y $DC = b$, en $D$ levantamos una perpendicular a $BC$ que corta al arco $\overset{\LARGE{\frown}}{CB}$ en $A$, entonces $\triangle ABC$ es un triángulo rectángulo con $\angle A = \dfrac{\pi}{2}$.
Por criterio de semejanza AA $\triangle ADB \sim \triangle CDA$ y tenemos que $\dfrac{AD}{CD} = \dfrac{BD}{AD}$.
Por lo tanto $AD$ es la media geométrica de $BD$ y $DC$, esto es $AD^2 = BD \times CD$.
Figura 1
Consideremos $O$ el punto medio de $BC$, sea $E \in AO$ tal que $DE \perp AO$, como $\triangle ADO \sim \triangle AED$ entonces $\dfrac{AD}{AE} = \dfrac{AO}{AD}$ $\Rightarrow AE = \dfrac{2AD^2}{2AO} = \dfrac{2BD \times DC}{BC} = \dfrac{2ab}{a + b}$.
Por el teorema de Pitágoras en $\triangle AED$ $AD^2 = AE^2 + DE^2 \Rightarrow AE \leq AD \Rightarrow \dfrac{2ab}{a + b} \leq \sqrt{ab}$.
Por el teorema de Pitágoras en $\triangle ADO$ $AO^2 = AD^2 + DO^2 \Rightarrow AD \leq AO \Rightarrow \sqrt{ab} \leq \dfrac{a + b}{2}$.
Ahora tracemos $OF$ el radio perpendicular a $BC$, entonces $OD = \dfrac{a + b}{2} – a = \dfrac{b – a}{2}$.
Aplicando el teorema de Pitágoras a $\triangle ODF$ obtenemos, $DF^2 = OF^2 + OD^2 = (\dfrac{b – a}{2})^2 + (\dfrac{a + b}{2})^2 =\dfrac{a^2 + b^2}{2}$.
Corolario. Sean $w$, $x$, $y$, $z$ números reales positivos entonces: $wxyz \leq (\dfrac{w + x + y + z}{4})^4$, y la igualdad se da si y solo si $w = x = y = z$.
Demostración. Aplicamos la desigualdad entre las medias geométrica y aritmética a los pares de números $w$, $x$; $y$, $z$. $\sqrt{wx} \leq \dfrac{w + x}{2}$, $\sqrt{yz} \leq \dfrac{y + z}{2}$.
Por lo tanto, $\sqrt{wxyz} \leq (\dfrac{w + x}{2}) (\dfrac{y + z}{2})$.
Ahora volvemos a usar la desigualdad entre las medias geométrica y aritmética $\sqrt{\dfrac{(w + x)}{2} \dfrac{(y + z)}{2}} \leq \dfrac{\dfrac{w + x}{2} + \dfrac{y + z}{2}}{2} = \dfrac{w + x + y + z}{4}$
Por lo tanto, $\sqrt[4]{wxyz} \leq \sqrt{\dfrac{(w + x)}{2} \dfrac{(y + z)}{2}} \leq \dfrac{w + x + y + z}{4}$.
En consecuencia, $wxyz \leq (\dfrac{w + x + y + z}{4})^4$.
$\blacksquare$
Desigualdad de Erdos Mordell
Lema de Mordell. Sea $\triangle ABC$ y $P$ un punto en su interior, considera $D$, $E$ y $F$ las proyecciones de $P$ a los lados $BC$, $AC$ y $AB$ respectivamente, entonces $PA \sin A \geq PF \sin B + PE \sin C$.
Demostración. Notemos que la circunferencia con diámetro $PA$ pasa por $F$ y por $E$, pues $AP$ subtiende ángulos rectos en $F$ y $E$.
Figura 2
Por la ley extendida de los senos, $\sin BAC = \sin (\pi – BAC) = \sin EPF = \dfrac{EF}{PA}$, esto implica que $PA \sin A = EF$.
Sean $G$ y $H$ las proyecciones de $E$ y $F$ respectivamente en la recta que pasa por $P$ y $D$.
$\square FBDP$ es cíclico, pues $PB$ subtiende ángulos rectos en $F$ y $D$, entonces $\angle DBA$ y $\angle FPD$ son y suplementarios por lo tanto $\sin DBA = \sin HPF = \dfrac{FH}{FP}$.
Como resultado $FP \sin B = FH$, igualmente podemos ver que $PE \sin C = EG$.
Sea $I = EF \cap HP$, por el teorema de Pitágoras podemos ver que $IE \geq GE$ y $FI \geq FH$,
Por lo tanto, $PA \sin A \geq PF \sin B + PE \sin C$.
$\blacksquare$
Teorema 2, desigualdad de Erdos Mordell. Sea $\triangle ABC$ y $P$ un punto en su interior, considera $D$, $E$ y $F$ las proyecciones de $P$ a los lados $BC$, $AC$ y $AB$ respectivamente, entonces $PA + PB + PC \geq 2(PD + PE + PF)$.
$= PF(\dfrac{\sin^2A + \sin^2 B}{\sin A \sin B}) + PE(\dfrac{\sin^2 A + \sin^2 C}{\sin A \sin C}) + PD(\dfrac{\sin^2 B + \sin^2 C}{\sin B \sin C})$.
Sustituimos $a$ y $b$ por $a^2$ y $b^2$ en la desigualdad entre las medias geométrica y aritmética $\dfrac{a^2 + b^2}{2} \geq \sqrt{a^2b^2}$, por lo tanto, $\dfrac{a^2 + b^2}{ab} \geq 2$.
Aplicamos esto a nuestra suma y como resultado obtenemos $PA + PB + PC \geq 2(PD + PE + PF)$.
$\blacksquare$
Problema 1. Sea $\triangle ABC$ e $I$ su incentro, considera $P$, $Q$ y $R$ los puntos medios de los arcos $\overset{\LARGE{\frown}}{BC}$, $\overset{\LARGE{\frown}}{CA}$ y $\overset{\LARGE{\frown}}{AB}$ que no contienen a los vértices de $\triangle ABC$, entonces $IP + IQ + IR \geq IA + IB + IC$.
Solución. Sean $D = PQ \cap CR$, $E = QR \cap AP$ y $F = RP \cap BQ$.
Figura 3
Por la entrada anterior sabemos que $Q$ es el centro de una circunferencia que pasa por $I$, $A$ y $C$, y que $R$ es el centro de una circunferencia que pasa por $I$, $A$ y $B$, entonces $QA = QI$ y $RA = RI$.
Por lo tanto, $\square ARIQ$ es un rombo, de esto se sigue que $QR \perp AI$ y $AE = IE$.
Igualmente vemos que $RP \perp BI$, $BF = IF$ y $PQ \perp CI$, $CD = ID$.
Aplicamos la desigualdad de Erdos Mordell a $\triangle PQR$ y al punto $I$ $IP + IQ + IR \geq 2(ID + IE + IF) = 2(\dfrac{IC}{2} + \dfrac{IA}{2} + \dfrac{IB}{2})$.
En conclusión, $IP + IQ + IR \geq IA + IB + IC$.
$\blacksquare$
Desigualdades de Euler y de Padoa
Proposición 1, desigualdad de Euler. El circunradio $R$ y el inradio $r$ de todo triangulo cumplen $R \geq 2r$ y la igualdad se cumple si y solo si el triángulo es equilátero.
Demostración. La fórmula de Euler nos asegura que $0 \leq OI^2 = R(R – 2r) = R^2 – 2Rr$, donde $I$ es el incentro y $O$ el circuncentro del triángulo.
Como resultado, $R \geq 2r$.
$\blacksquare$
Proposición 2, desigualdad de Padoa. Sea $\triangle ABC$ con lados $c = AB$, $a = BC$ y $b = AC$ entonces $abc \geq (a + b – c)(a + c – b)(b + c – a)$.
Demostración. Sean $s = \dfrac{a + b + c}{2}$, $R$ el circunradio y $r$ el inradio de $\triangle ABC$, entonces tenemos las siguientes fórmulas para el área de $\triangle ABC$: $(\triangle ABC) = \sqrt{s(s – a)(s – b)(s – c)} = \dfrac{abc}{4R} = rs$.
Notemos lo siguiente $(a + b – c)(a + c – b)(b + c – a) = (2s – 2)(2s – 2b)(2s – 2a) = 8(s – c)(s – b)(s – a) $ $= \dfrac{8(\triangle ABC)^2 }{s} = \dfrac{8r^2s^2}{s} = 8r^2s$.
Por otro lado, $abc = 4Rrs$.
Por lo tanto, la desigualdad que queremos mostrar es equivalente a $8r^2s \leq 4Rrs$ que a su vez es equivalente a $2r \leq R$, lo cual es cierto por la proposición anterior.
$\blacksquare$
Transformación de Ravi
Recordemos que las tangentes desde un punto a una circunferencia son iguales, por lo que los puntos de tangencia del incírculo de un triángulo, divide al perímetro del triángulo en tres pares de segmentos iguales, así que podemos expresar a los lados de un triángulo de esta manera para resolver algunas desigualdades geométricas.
$a = BC = y + z$, $b = AC = x + z$, $c = AB = x + y$.
Figura 4
Problema 2. Para los ángulos internos de un triángulo $\triangle ABC$ tenemos la siguiente desigualdad. $\sin \dfrac{A}{2} \sin \dfrac{B}{2} \sin \dfrac{C}{2} \leq \dfrac{1}{8}$.
Solución. Usando la identidad para el seno del ángulo medio y la ley de los cosenos tenemos: $\sin^2 \dfrac{A}{2} = \dfrac{1}{2}(1 – \cos A) = \dfrac{1}{2}(1 + \dfrac{a^2 – (b^2 + c^2)}{2bc})$ $= \dfrac{a^2 – (b – c)^2}{4bc} = \dfrac{y^2 + 2yz + z^2 – (z – y)^2}{4bc} = \dfrac{yz}{bc}$.
A continuación despejamos y hacemos el producto $\sin \dfrac{A}{2} \sin \dfrac{B}{2} \sin \dfrac{C}{2} = \dfrac{\sqrt{yz}\sqrt{xz}\sqrt{xy}}{abc}$.
Ahora aplicamos la desigualdad entre las medias geométrica y aritmética $\dfrac{\sqrt{yz}\sqrt{xz}\sqrt{xy}}{abc} \leq \dfrac{1}{abc}(\dfrac{y + z}{2})(\dfrac{x + z}{2})(\dfrac{x + y}{2}) = \dfrac{abc}{8abc} = \dfrac{1}{8}$.
Por lo tanto, $\sin \dfrac{A}{2} \sin \dfrac{B}{2} \sin \dfrac{C}{2} \leq \dfrac{1}{8}$.
$\blacksquare$
Desigualdad de Nesbitt
Proposición 3. Sean $a$, $b$ y $c$ tres números positivos entonces la siguiente desigualdad es cierta $(a +b + c)(\dfrac{1}{a} + \dfrac{1}{b} + \dfrac{1}{c}) \geq 9$.
Demostración. La desigualdad entre las medias geométrica y aritmética puede ser vista como $\dfrac{a}{b} + \dfrac{b}{a} \geq 2\sqrt{\dfrac{a}{b} \dfrac{b}{a}} = 2$.
Donde la última desigualdad se obtiene al aplicar la proposición anterior.
Por lo tanto, $\dfrac{a}{b + c} + \dfrac{b}{a + c} + \dfrac{c}{a + b} \geq \dfrac{3}{2}$.
$\blacksquare$
Desigualdad de Weitzenböck
Proposición 5. Desigualdad de Weitzenböck. Si $a$, $b$, $c$ son las longitudes de los lados de $\triangle ABC$ entonces $a^2 + b^2 + c^2 \geq 4\sqrt{3} (\triangle ABC)$.
Demostración. De acuerdo a la fórmula de Herón $(\triangle ABC) = \sqrt{s(s – a)(s – b)(s – c)}$ $= \sqrt{(\dfrac{a + b + c}{2})(\dfrac{b + c – a}{2})(\dfrac{a + c – b}{2})(\dfrac{a + b – c}{2})}$ $= \dfrac{1}{4} \sqrt{2(a^2b^2 + a^2c^2 + b^2c^2) – (a^4 + b^4 + c^4)}$.
Por otro lado $\begin{equation} (a^2 – b^2)^2 + (b^2 – c^2)^2 + (c^2 – a^2)^2 \geq 0 \end{equation}$
De la desigualdad $(1)$ podemos notar que la igualdad ocurre si y solo si $a = b = c$, es decir el triángulo es equilátero.
$\blacksquare$
Más adelante…
En la próxima entrada estudiaremos algunas propiedades de las medianas y el centroide de un triángulo.
Tarea moral
A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.
Sea $P$ un punto en el interior de un triangulo $\triangle ABC$, muestra que al menos uno de los ángulos $\angle BAP$, $\angle CBP$ y $\angle ACP$ es igual a $\dfrac{\pi}{6}$.
Considera $P$ un punto en el interior de $\triangle ABC$ cuyo circunradio es $R$, demuestra que $\dfrac{PA}{BC^2} + \dfrac{PB}{AC^2} + \dfrac{PC}{AB^2} \geq \dfrac{1}{R}$.
Sea $P$ un punto en el interior de $\triangle ABC$, denota por $R_a$, $R_b$, $R_c$ los circunradios de los triángulos $\triangle PBC$, $\triangle PAC$ y $\triangle PAB$ respectivamente, prueba que $\dfrac{PB \times PC}{R_a} + \dfrac{PA \times PC}{R_b} + \dfrac{PA \times PB}{R_c} \leq PA + PB + PC$.
Si $a$, $b$ y $c$ son los lados de un triangulo prueba que $(a + b)(b + c)(a + c) \geq 8(a + b – c)(b + c – a)(a + c -b)$.
Sean $\triangle ABC$, $AD$, $BE$, $CF$, sus alturas y $H$ el ortocentro muestra que: $i)$ $\dfrac{AD}{HD} + \dfrac{BE}{HE} + \dfrac{CF}{HF} \geq 9$, $ii)$ $\dfrac{HD}{HA} + \dfrac{HE}{HB} + \dfrac{HF}{HC} \geq \dfrac{3}{2}$.
Figura 5
Sea $\triangle ABC$ un triángulo rectángulo con catetos $a$ y $b$ e hipotenusa $c$, muestra que se cumple la siguiente desigualdad $a + b \leq \sqrt{2}c$.
Considera $A’$ y $B’$ los puntos medios de $BC$ y $AC$ en $\triangle ABC$, muestra que $3(BC + AC) > 2(AA’ + BB’)$.
Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»
En la entrada anterior definimos el módulo de un número complejo en términos de su parte real e imaginaria. De manera geométrica observamos que el módulo nos determina la distancia que hay entre un número complejo y el origen. Por otra parte sabemos que el módulo en $\mathbb{C}$ cumple ciertas propiedades como el ser un número real no negativo y la desigualdad del triángulo. Por lo que razonando de manera análoga al caso en $\mathbb{R}^2$, mediante el módulo definiremos la distancia entre dos números complejos $z_1$ y $z_2$ como la longitud del segmento de recta que los une, figura 26.
El objetivo de esta entrada es describir algunos lugares geométricos en el plano complejo $\mathbb{C}$, haciendo uso de nuestros resultados de Geometría Analítica, para familiarizarnos con algunos conjuntos de puntos en el plano complejo con los cuales trabajaremos en la siguiente entrada y que en general nos serán de utilidad para describir de manera geométrica a los conjuntos de puntos de $\mathbb{C}$ que cumplan alguna propiedad en particular.
Métrica euclidiana en $\mathbb{C}$
Para comenzar esta entrada, primeramente consideremos la siguiente:
Definición 6.1. (Métrica euclidiana.) Sean $z_1 = a_1 + ib_1$ y $z_2 = a_2 + ib_2$ números complejos. Definimos la distancia entre $z_2$ y $z_1$, denotada por $d(z_2, z_1)$, como: \begin{equation*} d(z_2, z_1) = |z_2 \, – \, z_1| = \sqrt{\left(a_2 \, – \, a_1\right)^2 + \left(b_2 \, – \, b_1\right)^2}. \end{equation*}
A esta distancia se le conoce como la distancia o métrica euclidiana de $\mathbb{C}$, figura 26.
Figura 26: Distancia euclidiana entre $z_2$ y $z_1$.
Por nuestros cursos de Geometría Analítica sabemos que al hablar de un lugar geométrico nos referimos a un conjunto de puntos que satisfacen una condición dada. Entonces podemos interpretar de manera geométrica a una ecuación como el lugar geométrico de los puntos en el plano cuyas coordenadas la satisfacen. En este sentido, consideraremos a los lugares geométricos del plano complejo como conjuntos de puntos en $\mathbb{R}^2$ que satisfacen una ecuación y viceversa, por lo que será necesario expresar en términos de números complejos las ecuaciones de los lugares geométricos de $\mathbb{R}^2$.
De acuerdo con las entradas anteriores sabemos que podemos ubicar a un número complejo en el plano, pensado como un par ordenado de números reales, en coordenadas cartesianas o coordenadas polares. Sin embargo, considerando la observación 2.3 sabemos que para $z\in\mathbb{C}$ se cumple: \begin{equation*} \text{Re}(z) = \frac{z+\overline{z}}{2}, \quad \text{Im}(z) = \frac{z-\overline{z}}{2i}. \end{equation*}
Lo anterior nos motiva a dar la siguiente:
Definición 6.2. (Coordenadas conjugadas complejas.) Dado un número complejo $z = x+iy$, es posible representarlo en el plano complejo mediante las coordenadas $(z,\overline{z})$, a las cuales llamaremos coordenadas conjugadas complejas o simplemente coordenadas conjugadas considerando: \begin{equation*} x = \frac{z+\overline{z}}{2}, \quad y = \frac{z-\overline{z}}{2i}. \end{equation*}
Observación 6.1. Recordemos que para $A,C,D,E,F\in\mathbb{R}$ la ecuación general de segundo grado: \begin{equation*} Ax^2 + Cy^2 +Dx + Ey + F = 0, \tag{6.1} \end{equation*}
nos determina algunos lugares geométricos en $\mathbb{R}^2$. Analicemos dos de ellos para identificarlos en el plano complejo.
Dado $A=C=0$ en la ecuación (6.1), entonces se obtiene la ecuación general de la recta: \begin{equation*} Dx + Ey + F = 0. \end{equation*}
De acuerdo con la definición 6.2, podemos expresar la ecuación de la recta utilizando coordenadas conjugadas como sigue: \begin{align*} D\left(\frac{z+\overline{z}}{2}\right) + E\left(\frac{z-\overline{z}}{2i}\right) + F = 0,\\ \\ \Longrightarrow \quad z\left(D-iE\right) + \overline{z}\left(D+iE\right) +2F = 0. \end{align*}
Haciendo $a=D+iE$ y $b=2F$, tenemos: \begin{equation*} \mathcal{L}: \,\, z\overline{a}+\overline{z}a + b = 0, \tag{6.1.1} \end{equation*}
la cual llamaremos ecuación general de la recta $\mathcal{L}$ en $\mathbb{C}$.
Si tenemos $A=C\neq0$ en la ecuación (6.1), entonces se obtiene la ecuación general de la circunferencia: \begin{equation*} A(x^2+y^2) + Dx + Ey + F = 0. \end{equation*}
De acuerdo con la definición 6.2, podemos expresar la ecuación general de la circunferencia utilizando coordenadas conjugadas como sigue: \begin{align*} A z\overline{z} + D\left(\frac{z+\overline{z}}{2}\right) + E\left(\frac{z-\overline{z}}{2i}\right) + F = 0,\\ \\ \Longrightarrow \quad z\overline{z} + z \left(\frac{D-iE}{2A}\right) + \overline{z}\left(\frac{D+iE}{2A}\right) + \frac{F}{A} = 0. \end{align*}
Haciendo $a=\frac{D+iE}{2A}$ y $b=\frac{F}{A}$, tenemos: \begin{equation*} z\overline{z} + z\overline{a}+\overline{z}a + b = |\,z\,|^2 + z\overline{a}+\overline{z}a + b = 0, \tag{6.1.2} \end{equation*}
la cual llamaremos ecuación general de la circunferencia en $\mathbb{C}$ cuyo centro es $-a$ y su radio es $\sqrt{|\,a\,|^2 – b}$.
Ejemplo 6.1. Expresemos las siguientes ecuaciones en términos de las coordenadas conjugadas:
a) Ecuación de una recta en el plano cartesiano $2x+3y=7$.
b) Ecuación de una circunferencia en el plano cartesiano $x^2+(y-1)^2 = 25$.
por lo que, considerando la observación 6.1, con $a = -i$ y $b = -24$ tenemos: \begin{align*} z\overline{z} – 2\left(\frac{z-\overline{z}}{2i}\right) -24 = 0,\\ \\ \Longrightarrow \quad z\overline{z} + z\overline{a} + \overline{z}a + b = 0, \tag{6.1.4} \end{align*}
la ecuación de una circunferencia en el plano complejo cuyo centro es $-a = i$ y su radio es $\sqrt{|i|^2 – (-24)} = \sqrt{25} = 5$, figura 32.
Al igual que en $\mathbb{R}^2$, es posible describir a la recta $\mathcal{L}$ en el plano complejo mediante su forma paramétrica considerando dos puntos $z_1,z_2\in\mathbb{C}$, $z_1\neq z_2$ y $z_2 \neq 0$, tales que $z_1$ está sobre la recta y el segmento de recta que va del origen a $z_2$ es paralelo a la recta, figura 28(a), entonces la recta $\mathcal{L}$ en $\mathbb{C}$, en su forma paramétrica, está dada como el conjunto de puntos $z\in\mathbb{C}$ tales que: \begin{equation*} z = z_1 + z_2t, \quad t\in\mathbb{R}. \tag{6.1.5} \end{equation*}
Si se tiene que $z_1$ y $z_2$, con $z_1\neq z_2$, son puntos de la recta, entonces la forma paramétrica de la ecuación de la recta $\mathcal{L}$, en $\mathbb{C}$, figura 28(b), se puede obtener como el conjunto de puntos $z\in\mathbb{C}$ tales que: \begin{equation*} z = z_1 + (z_2 \,-\, z_1)t, \quad t\in\mathbb{R}. \tag{6.1.6} \end{equation*}
Figura 28: Gráficas de una recta en su forma paramétrica en $\mathbb{C}$.
(a) Ecuación paramétrica de una recta $\mathcal{L}$ en $\mathbb{C}$ que pasa por $z_1$ y tiene dirección $z_2$.(b) Ecuación paramétrica de una recta $\mathcal{L}$ en $\mathbb{C}$ que pasa por dos puntos, $z_1$ y $z_2$.
Observación 6.2. Dado que $z_2 \neq 0$ en (6.1.5), notemos que: \begin{equation*} t = \frac{z \,-\, z_1}{z_2} \in \mathbb{R} \quad \Longleftrightarrow \quad \operatorname{Im}\left(\frac{z \,-\, z_1}{z_2}\right) = 0, \end{equation*}
por lo que una forma equivalente de expresar a una recta $\mathcal{L}$ dada por (6.1.5) es: \begin{equation*} \mathcal{L} = \left\{ z\in\mathbb{C} \,:\, \operatorname{Im}\left(\frac{z \,-\, z_1}{z_2}\right) = 0 \right\}. \end{equation*}
Una pregunta interesante que podemos hacernos es ¿qué lugares geométricos describen las siguientes ecuaciones? \begin{equation*} \operatorname{Im}\left(\frac{z \,-\, z_1}{z_2}\right) > 0, \end{equation*}
Analicemos la primera desigualdad. Sin pérdida de generalidad, desde que $z_2$ sólo nos determina la dirección de $\mathcal{L}$ entonces podemos suponer que $|\,z_2\,| = 1$. Sean $z_2 = \operatorname{cis}(\beta)$ y $z=r\,\operatorname{cis}(\theta)$.
Notemos que si $z_1=0$, tenemos por (6.1.5) una recta que pasa por el origen, además: \begin{equation*} \operatorname{Im}\left(\frac{z}{z_2}\right) = \operatorname{Im}\left(r\operatorname{cis}(\theta\,-\,\beta)\right) = r\operatorname{sen}(\theta-\beta) > 0, \end{equation*}
dado que $r=|\,z\,|\geq 0$, entonces $\operatorname{sen}(\theta-\beta) > 0$, lo cual se cumple si $\beta < \theta < \pi + \beta$. Por lo que la primera ecuación con $z_1 = 0$ nos describe un semiplano a la izquiera de la recta $\mathcal{L}$ que pasa por el origen, figura 29(a).
Si ahora consideramos el caso en que $z_1 \neq 0$, entonces por (6.1.5) tenemos una recta $\mathcal{L}$ que pasa por $z_1$ y es paralela a $z_2$, por lo que en dicho caso la ecuación $\operatorname{Im}\left(\dfrac{z \,-\, z_1}{z_2}\right) > 0$ nos describe al semiplano a la izquierda de la recta $\mathcal{L}$, figura 29(b).
Realizando un razonamiento análogo para la ecuación $\operatorname{Im}\left(\dfrac{z \,-\, z_1}{z_2}\right) < 0$, podemos concluir que dicha ecuación nos describe el semiplano a la derecha de una recta $\mathcal{L}$ que pasa por $z_1$ y es paralela a $z_2$, figura 30.
Figura 29: Gráficas de un semiplano izquierdo o superior en $\mathbb{C}$.
(a) Semiplano $\operatorname{Im\left(\frac{z}{z_2}\right)}>0$ a la izquierda de la recta $\mathcal{L}$ dada por $z = z_2 t$.(b) Semiplano $\operatorname{Im\left(\frac{z-z_1}{z_2}\right)}>0$ a la izquierda de la recta $\mathcal{L}$ dada por $z = z_1 + z_2 t$.
Figura 30: Semiplano derecho o inferior $\operatorname{Im\left(\frac{z-z_1}{z_2}\right)}<0$ en el plano complejo $\mathbb{C}$.
Observación 6.3. Otra forma de describir una recta $\mathcal{L}$ en el plano complejo $\mathbb{}$ es la siguiente. Sean $z_1, z_2 \in \mathbb{C}$, con $z_1 \neq z_2$. Notemos que la ecuación: \begin{equation*} |\,z \,-\, z_1\,| = |\,z \,-\, z_2\,|, \end{equation*}
nos dice que la distancia de $z \in \mathbb{C}$ a los puntos $z_1$ y $z_2$ es la misma, es decir que $z$ está en la mediatriz del segmento que une a $z_1$ con $z_2$, figura 31.
Figura 31: Mediatriz $\mathcal{L}$ del segmento que va de $z_1$ a $z_2$ en $\mathbb{C}$.
Por otra parte, sabemos que la ecuación (6.1) determina otras cónicas además de la circunferencia, por lo que es posible proceder del mismo modo que en los dos casos de la observación 6.1 para obtener las ecuaciones correspondientes a dichos lugares geométricos. Sin embargo podemos hacer uso de la distancia euclidiana de $\mathbb{C}$ para describir dichos lugares geométricos mediante sus definiciones, es decir pensando a las cónicas como conjuntos de puntos que satisfacen ciertas condiciones relacionadas con la distancia entre puntos.
Consideremos el ejemplo 6.1, inciso b, sabemos que dicha circunferencia está centrada en $-a=i$ y tiene radio $\rho = 5$. De acuerdo con la definición de una circunferencia sabemos que los puntos cuya distancia al centro $i$ sea igual a 5 pertenecen a la circunferencia descrita por la ecuación (6.1.4), lo cual podemos expresarlo como el conjunto de números complejos $z$ tales que: \begin{align*} |\,z \,-\, i\,| = 5 \quad \Longleftrightarrow \quad |\,z \,-\, i\,|^2 = 25. \tag{6.1.7} \end{align*}
Figura 32: Circunferencia en $\mathbb{C}$ de radio $\rho=5$ y centro $-a=i$ con algunos de sus puntos.
Notemos que podemos reescribir (6.1.7) como (6.1.4) utilizando las propiedades del módulo: \begin{align*} |\,z\,-\,i\,|^2 & = (z\,-\,i)\left(\overline{z}-\overline{i}\right)\\ & = |\,z\,|^2 – \, \overline{i}z -i\overline{z} + |\,i\,|^2\\ & = z\overline{z} + zi \, – \, \overline{z}i + 1\\ & = z\overline{z} + z\overline{a} + \overline{z}a + 1\\ & = 25. \end{align*}
Considerando (6.1.7) es fácil ver que los puntos $z_1 = 5+i$, $z_2 = 6i$, $z_3 = -5 + i$ y $z_4 = -4i$ pertenecen a dicha circunferencia, figura 32.
Lo anterior nos deja ver que tanto (6.1.4) como (6.1.7) nos describen al mismo lugar geométrico en el plano complejo, es decir una circunferencia de radio $\rho=5$ centrada en $i$.
Podemos generalizar el resultado anterior para describir a una circunferencia en el plano complejo expresando a la ecuación (6.1.2) mediante la definición de dicho lugar geométrico, es decir, como el conjunto de números complejos $z$ que equidistan del punto $z_0=-a$, donde $a$ está dada como en (6.1.2), llamado centro, una distancia $\rho$, llamada radio: \begin{equation*} |\,z – z_0\,| = \rho \quad \Longleftrightarrow \quad |\,z – z_0\,|^2 = \rho^2. \tag{6.1.8} \end{equation*}
Figura 33: Circunferencia en $\mathbb{C}$ de radio $\rho$ y centro $z_0$.
Una pregunta que podemos plantearnos es ¿qué lugares geométricos nos describen las siguientes desigualdades? \begin{align*} |\,z – z_0\,| < \rho,\\ |\,z – z_0\,| > \rho. \end{align*}
De manera geométrica es claro que la primera desigualdad nos describe a los puntos $z\in\mathbb{C}$ que se encuentran dentro de la circunferencia de radio $\rho$ y centro $z_0$, sin considerar propiamente a los que caen en dicha circunferencia. Mientras que la segunda desigualdad nos describe a los puntos en $z\in\mathbb{C}$ que caen fuera de la circunferencia centrada en $z_0$ y de radio $\rho$, sin considerar tampoco a los puntos de la circunferencia.
Figura 34: Punto $w\in\mathbb{C}$ dentro de la circunferencia $|\,z-z_0\,|=\rho$ y punto $\zeta\in\mathbb{C}$ fuera de la circunferencia $|\,z-z_0\,|=\rho$.
De acuerdo con la observación 3.3, tenemos que para un número complejo $z\neq0$: \begin{equation*} z^{-1} = \frac{1}{z} = \frac{\overline{z}}{| \, z \, |^2}. \end{equation*}
Analicemos los siguientes casos:
Si $|\,z\,|>1$, entonces $\dfrac{1}{|\,z\,|}<1$.
Si $|\,z\,|<1$, entonces $\dfrac{1}{|\,z\,|}>1$.
Si $|\,z\,|=1$, entonces $\dfrac{1}{|\,z\,|}=1$.
Geométricamente esto nos dice que para los números complejos $z$ que están fuera de la circunferencia unitaria su inverso multiplicativo está dentro de la circunferencia unitaria. Por otro parte, para los números complejos $z$ que están dentro de la circunferencia unitaria se tiene que su inverso multiplicativo está fuera de dicha circunferencia, mientras que para los números complejos $z$ que pertenecen a la circunferencia unitaria se tiene que su inverso multiplicativo también es un punto de dicha circunferencia.
Figura 35: Punto $w\in\mathbb{C}$ dentro de la circunferencia unitaria $|\,z\,|=1$. Punto $\zeta\in\mathbb{C}$ fuera de la circunferencia unitaria $|\,z\,|=1$ y el número complejo $i$ en la circunferencia unitaria $|\,z\,|=1$.
Recordemos que en $\mathbb{R}^2$ la ecuación ordinaria de una circunferencia con centro en $(x_0, y_0)$ y radio $\rho$ es: \begin{equation*} (x-x_0)^2 + (y-y_0)^2 = \rho^2. \end{equation*}
Haciendo $x(t) = \rho \operatorname{cos}(t) + x_0$ y $y(t) = \rho \operatorname{sen}(t) + y_0$, con $t\in[0,2\pi)$, obtenemos una ecuación paramétrica de dicha circunferencia.
Si consideramos a los números complejos $z$ en su forma polar, es decir $z=\rho \operatorname{cis}(\theta)$, tales que $\theta\in[0,2\pi)$, y a un punto fijo $z_0=x_0 + i y_0 \in\mathbb{C}$, entonces podemos describir a una cirunferencia en $\mathbb{C}$ de forma paramétrica como el conjunto de puntos: \begin{equation*} \{ w\in\mathbb{C} \, : \, w = z_0 + z \}. \end{equation*}
Proposición 6.1. (Distancia de un punto a una recta en $\mathbb{C}$.) Para un punto $z_0\in\mathbb{C}$, su distancia a una recta $\mathcal{L}$ dada por $z\overline{a} + \overline{z}a + b = 0$ está dada por: \begin{equation*} \frac{|\,z_0\overline{a} + \overline{z_0}a + b\,|}{2\,|\,a\,|}. \tag{6.1.9} \end{equation*}
Demostración. Sea $z_0 = x_0 + iy_0\in\mathbb{C}$. Sabemos que en $\mathbb{R}^2$ la distancia de un punto $P(x_0,y_0)$ a una recta $Dx + Ey + F = 0$ está dada por: \begin{equation*} \frac{|\,Dx_0 + Ey_0 + F \,|}{\sqrt{D^2 + E^2}}. \tag{6.1.10} \end{equation*}
De acuerdo con la observación 6.1 sabemos que podemos expresar una recta de la forma $Dx + Ey + F = 0$ como $z\overline{a} + \overline{z}a + b = 0$ donde $a = D + iE$ y $b=2F$. Por otra parte tenemos que: \begin{equation*} 2D = a + \overline{a}, \quad i2E = a – \overline{a}. \end{equation*}
Lo anterior nos deja ver que podemos utilizar (6.1.10) para obtener la distancia del punto $z_0 = x_0 + iy_0$ a la recta $z\overline{a}+\overline{z}a + b = 0$ como: \begin{align*} \frac{|\,Dx_0 + Ey_0 + F \,|}{\sqrt{D^2 + E^2}} &= \frac{|\,z_0\overline{a}+\overline{z_0}a + b \,|}{\sqrt{(a+\overline{a})^2 + \left(-i(a – \overline{a})\right)^2}}\\ & = \frac{|\,z_0\overline{a}+\overline{z_0}a + b \,|}{\sqrt{4\,|\,a\,|^2}}\\ & = \frac{|\,z_0\overline{a}+\overline{z_0}a + b \,|}{2\,|\,a\,|}. \end{align*}
$\blacksquare$
Proposición 6.2. (Distancia de un punto a una recta en su forma paramétrica en $\mathbb{C}$.) Sea $\mathcal{L}$ la recta en $\mathbb{C}$ dada por $z = z_1 + t z_2$, $z_2 \neq 0$. La distancia mínima $\delta$ de un punto $z_0 \in \mathbb{C}$ a la recta $\mathcal{L}$ es: \begin{equation*} \delta = \left|\, \frac{\operatorname{Im}\left((z-z_1)\overline{z_2}\right)}{\overline{z_2}} \,\right| = \left|\, \frac{(z – z_1)\overline{z_2} – \overline{(z-z_1)z_2}}{2\,\overline{z_2}} \,\right|. \end{equation*}
Demostración. Sea $f(t) = |\,z \,-\, z_1 -tz_2\,|^2$. Es claro que $f:\mathbb{R} \longrightarrow [0,\infty)$ es una función bien definida.
De acuerdo con la proposición 3.1 tenemos que: \begin{align*} f(t) & = |\,z \,-\, z_1 -tz_2\,|^2\\ & = |\,z \,-\, z_1\,|^2 \,-\, 2t\,\operatorname{Re}\left((z-z_1)\overline{z_2}\right) + t^2 |\,z_2\,|^2. \end{align*}
Entonces el mínimo se alzanza en: \begin{equation*} t = \frac{\operatorname{Re}\left((z-z_1)\overline{z_2}\right)}{|\,z_2\,|^2}. \end{equation*}
Dado que $z_2\neq0$, entonces $\dfrac{z_2}{|\,z_2\,|^2} = \dfrac{1}{\overline{z_2}}$.
Considerando la observación 2.3 y evaluando a $f$ en el mínimo obtenemos la distancia buscada al cuadrado, es decir: \begin{align*} \delta^2 &= \left|\,(z-z_1) \,-\, z_2\left[\frac{\operatorname{Re}\left((z-z_1)\overline{z_2}\right)}{|\,z_2\,|^2}\right] \,\right|^2\\ &= \left|\,\frac{2(z-z_1)\overline{z_2} \,-\, (z-z_1)\overline{z_2} \,-\, \overline{(z-z_1)}z_2}{2\, \overline{z_2}} \,\right|^2\\ &= \left|\,\frac{(z-z_1)\overline{z_2} \,-\, \overline{(z-z_1)}z_2}{2\, \overline{z_2}} \,\right|^2\\ &= \left|\,\frac{1}{\overline{z_2}}\frac{(z-z_1)\overline{z_2} \,-\, \overline{(z-z_1)}z_2}{2i} \,\right|^2\\ &=\left|\,\frac{\operatorname{Im}\left((z-z_1)\overline{z_2}\right)}{\overline{z_2}}\,\right|^2. \end{align*}
Por lo que tomando raíz cuadrada se sigue el resultado.
$\blacksquare$
Es claro que al usar la definición de un lugar geométrico es posible asociarle una ecuación a dicho conjunto y representarlo en el plano complejo $\mathbb{C}$. Por ejemplo, recordemos las definiciones de los siguientes lugares geométricos:
Parábola. Se define una parábola como el lugar geométrico de los puntos en $\mathbb{C}$ tales que la distancia entre estos y un punto fijo, llamado foco $f$, es igual a la distancia entre dichos puntos y una recta fija, llamada directriz $\mathcal{D}$.
Sin pérdida de generalidad, analicemos el caso de una parábola horizontal, es decir una parábola cuya directriz $\mathcal{D}$ es paralela al eje imaginario. En $\mathbb{R}^2$ sabemos que dichas rectas son de la forma $x = p$, con $p\in\mathbb{R}$ constante, por lo que para $z=x+iy\in\mathbb{C}$ tenemos que: \begin{align*} x \,-\, p = 0 \quad & \Longleftrightarrow \quad z+\overline{z} – 2p = 0\\ \\ & \Longleftrightarrow \quad \text{Re}(z) – p = 0. \tag{6.1.11} \end{align*}
De acuerdo con (6.1.1), de la observación 6.1 tenemos que la ecuación de una directriz $\mathcal{D}$ paralela al eje imaginario cumple que $a=1$ y $b = -2p$, por lo que considerando la definición de la parábola y la proposición 6.1, tenemos que una parábola con foco $f\in\mathbb{C}$ y directriz $\mathcal{D}$ vertical dada por (6.1.11) es el lugar geométrico de los puntos $z\in\mathbb{C}$ tales que: \begin{equation*} \frac{|\,z + \overline{z}+ b\,|}{2\,} = |\,z-f\,|. \tag{6.1.12} \end{equation*}
Observación 6.3. Para el caso de una parábola vertical se procede de manera análoga utilizando el hecho de que para $z=x+iy\in\mathbb{C}$ se tiene que $y=\text{Im}(z)=\frac{z-\overline{z}}{2i}$ y que su directriz $\mathcal{D}$ es paralela al eje real.
Observación 6.4. Considerando la definición de la párabola es posible obtener una ecuación más general que nos permita describir a dicho lugar geométrico. Suponiendo que la directriz $\mathcal{D}$ de una párabola está dada por la ecuación paramétrica $z_1 + tz_2$, con $t\in\mathbb{R}$, y que su foco es el punto $f\in\mathbb{C}$, entonces la ecuación de dicha párabola es: \begin{equation*} \left(\operatorname{Im}\left((z-z_1)\overline{z_2}\right)\right)^2 = |\,z_2\,|^2 \, |\,z-f\,|^2. \end{equation*}
Elipse. Se define a la elipse como el lugar geométrico de los puntos en $\mathbb{C}$ tales que la suma de sus distancias a dos puntos fijos $f_1,f_2\in\mathbb{C}$, llamados focos, es constante, es decir los $z\in\mathbb{C}$ tales que: \begin{align*} |\,z-f_1\,| + |\,z-f_2\,| = 2a,\\ \\ \text{con} \,\, 2a>|\,f_1 \,-\, f_2\,|.\tag{6.1.13} \end{align*}
De acuerdo con nuestros cursos de Geometría sabemos que dados los focos de una elipse es posible identificar si se trata de una elipse vertical u horizontal, además al punto $z_0\in\mathbb{C}$ tal que $|\,z_0 \,-\, f_1\,| = |\,z_0 \,-\, f_2\,|=c$ se le conoce como el centro de la elipse y al valor $|\,f_1\,-\,f_2\,| =2c$ se le llama la distancia focal. Por otra parte tenemos que la constante $2a$ determina al eje mayor, mientras que $\frac{|\,f_1\,-\,f_2\,|}{2a} = \frac{2c}{2a} = \frac{c}{a}$ nos da la excentricidad de la elipse.
¿Qué lugares geométricos nos describen las siguientes desigualdades? \begin{align*} |\,z-f_1\,| + |\,z-f_2\,| < 2a,\\ |\,z-f_1\,| + |\,z-f_2\,| > 2a. \end{align*}
De manera geométrica es claro que la primera ecuación nos describe al conjunto de puntos $z\in\mathbb{C}$ que se encuentran dentro de la elipse con focos $f_1, f_2$ y con eje mayor $2a$. Por otra parte, la segunda ecuación nos describe a los $z\in\mathbb{C}$ que se encuentran fuera de dicha elipse, en ambos casos ninguna de las ecuaciones considera a los puntos $z\in\mathbb{C}$ que caen sobre la elipse, figura 36.
Hipérbola. Se define a la hipérbola como el lugar geométrico de los puntos $z\in\mathbb{C}$ tales que el valor absoluto de las distancias a dos puntos fijos $f_1,f_2\in\mathbb{C}$, llamados focos, es igual a una cantidad constante, positiva y menor que la distancia entre los focos, es decir: \begin{align*} |\,|z-f_1|-|z-f_2|\,| = 2a,\\ \\ \text{con} \,\, 2a<|\,f_1 \,-\, f_2\,|.\tag{6.1.14} \end{align*}
Donde $|\,f_1\,-\,f_2\,|=2c$ es la distancia focal y al punto $z_0\in\mathbb{C}$ tal que $|\,z_0\,-\,f_1\,|=|\,z_0\,-\,f_2\,|=c$ se le denomina el centro. La excentricidad de la hipérbola está dada por $\frac{|\,f_1\,-\,f_2\,|}{2a} = \frac{2c}{2a} = \frac{c}{a}$.
Figura 36: Punto $\zeta\in\mathbb{C}$ fuera de la elipse centrada en $z_0\in\mathbb{C}$ con focos $f_1, f_2\in\mathbb{C}$. El centro $z_0$ cae dentro de la elipse desde que $|\,z_0-f_1\,|+|\,z_0-f_2\,| = 2c < 2a$.
Observación 6.5. Notemos que las ecuaciones (6.1.12), (6.1.13) y (6.1.14) obtenidas para estas tres cónicas corresponden a las ecuaciones ordinarias de las cónicas en $\mathbb{R}^2$, por lo que podemos preguntarnos sobre las ecuaciones generales para dichos lugares geométricos, solo recordemos que para hablar de estas expresiones debemos considerar los casos en que sea una cónica horizontal o vertical obtenidos de la ecuación (6.1). Recuerda que la ecuación (6.1) excluye a las cónicas que están rotadas en $\mathbb{R}^2$.
Observación 6.6. Hasta ahora hemos utilizado las definiciones, como lugares geométricos, de estas tres cónicas para determinar sus ecuaciones. Sin embargo, de nuestros cursos de Geometría Analítica sabemos que es posible caracterizar a las cónicas mediante el concepto de excentricidad, es decir podemos determinar a las cónicas considerando a una recta fija $\mathcal{D}\in\mathbb{C}$, llamada directriz y a un punto fijo $f\in\mathbb{C}$, llamado foco. Si definimos a $e$ una cantidad positiva como la excentricidad, entonces el conjunto de puntos $z\in\mathbb{C}$ tales que la razón de su distancia a $f$ y a la recta $\mathcal{D}$ es siempre igual a $e$ es una sección cónica, la cual está dada por:
a) Si $e < 1$, entonces es una elipse.
b) Si $e = 1$, entonces es una párabola.
c) Si $e > 1$, entonces es una hipérbola.
El caso en que $e=0$ nos determina una circunferencia.
Puedes consultar la sección 10.6 del libro Calculus: Early transcendentals de J. Stewart para revisar esta caracterización de las secciones cónicas en $\mathbb{R}^2$.
Considerando esta forma de determinar a las cónicas, es posible utilizar la ecuación de la párabola dada en la observación 6.5 para determinar a la elipse y la hipérbola.
Ejemplo 6.2.
a) Hallar la ecuación de la parábola cuyo foco está en $f=3+i$ y su directriz $\mathcal{D}$ está dada por $z+\overline{z}+6 = 0$.
Solución. De acuerdo con la definición de la parábola sabemos que se debe satisfacer (6.1.12), es decir: \begin{align*} \frac{|\,z + \overline{z}+ 6\,|}{2\,} = |\,z-(3+i)\,|\\ \\ \underset{(6{.}1{.}11)}{\Longleftrightarrow} \quad |\,\text{Re}(z) + 3\,|= |\,z-(3+i)\,|. \end{align*}
Notemos que $\operatorname{Re}(z) + 3 \in \mathbb{R}$, por lo que, considerando la proposición 3.1: \begin{align*} |\,\text{Re}(z) + 3\,|^2= |\,z-(3+i)\,|^2\\ \\ \Longleftrightarrow \quad \left(\text{Re}(z) + 3\right)^2 = |\,z\,|^2 – 2\,\text{Re}(z(3-i)) + |\,3+i\,|^2. \end{align*}
Desarrollando lo anterior y utilizando la proposición 3.1 tenemos: \begin{equation*} |\,z\,|^2 – \text{Re}^2(z) – 12\,\text{Re}(z) + 2\,\text{Re}(iz) + 1 = 0, \end{equation*}
la cual es la ecuación de una parábola en $\mathbb{C}$ cuyo foco es $f=3+i$ y su directriz es $\text{Re}(z)=-3$, figura 37.
Si consideramos a $z=x+iy$, entonces la ecuación anterior corresponde a una parábola en $\mathbb{R}^2$ dada por: \begin{equation*} y^2-2y-12x+1=0. \end{equation*}
Figura 37: Parábola en $\mathbb{C}$ con vértice en $v=i$, foco $f=3+i$ y directriz Re$(z) = -3$.
b) Hallar la ecuación de una elipse que tiene un foco $f_1 = -5+i$, su centro es $z_0 = x_0 +iy_0 = -1+i$ y que pasa por el punto $z_1=-1-2i$.
Solución. Considerando la definición de la elipse, el segundo foco $f_2$ debe satisfacer que $c=|z_0-f_2|=|z_0-f_1|=4$. De manera geométrica sabemos que $f_1, f_2$ y $z_0$ deben ser colineales, por lo que el segundo foco es $f_2 = (x_0+c)+i y_0 = (-1+4) + i = 3+i$. Considerando que $z_1=-1-2i$ pertenece a la elipse, entonces por (6.1.13) tenemos que: \begin{align*} |\,z_1-(-5+i)\,|+ |\,z_1-(3+i)\,| & = |\,4-3i\,| + |\,-4-3i\,|\\ & = 10\\ & = 2a. \end{align*}
Entonces $a = 5$, por lo que la ecuación que describe a la elipse, figura 38, es: \begin{equation*} |\,z-f_1\,| + |\,z-f_2\,| = 10. \end{equation*}
Figura 38: Elipse en $\mathbb{C}$ con centro en $z_0=-1+i$ y focos $f_1=-5+i$, $f_2=3+i$.
c) Encontrar la ecuación de la hipérbola cuyos focos son $f_1=-(\sqrt{20}+3)-3i$, $f_2=(\sqrt{20}-3)-3i$ y que pasa por el punto $z_1=(\sqrt{12}-3)-3i$.
Solución. De acuerdo con la definición de la hipérbola, como el punto $z_1$ dado pertenece a dicho lugar geométrico entonces debe satisfacer (6.1.14), es decir: \begin{align*} |\,|\,z_1\,-\,f_1\,| – |\,z_1\,-\,f_2\,|\,| & = |\, |\,\sqrt{12}+\sqrt{20}\,| – |\,\sqrt{12}-\sqrt{20}\,|\,|\\ & = |\,4\sqrt{3}\,|\\ & = 4\sqrt{3}\\ & = 2a. \end{align*}
Entonces $a=2\sqrt{3}$, por lo que la ecuación de la hipérbola, figura 39, es: \begin{equation*} |\,|z+\sqrt{20}+3+3i|-|z-\sqrt{20}+3+3i|\,| = 4\sqrt{3}. \end{equation*}
Figura 39: Hipérbola en $\mathbb{C}$ con centro en $z_0=-3-3i$ y focos $f_1=-(\sqrt{20}+3)-3i$, $f_2=(\sqrt{20}-3)-3i$.
Tarea moral
Considerando la definición de la parábola como lugar geométrico en $\mathbb{C}$, desarrolla la observación 6.3 y determina la ecuación de una parábola vertical. Argumenta tu resultado.
La observación 6.4 nos proporciona una ecuación general de una párabola. Prueba dicha ecuación. Hint: utiliza la proposición 6.3. Comprueba con el ejemplo 6.2 inciso (a) que el resultado es correcto ¿Obtuviste la misma ecuación?
De acuerdo con la observación 6.5, desarrolla la ecuación (6.1) y trata de determinar las ecuaciones generales de las tres cónicas considerando coordenas conjugadas complejas.
¿Qué lugares geométricos representan las siguientes ecuaciones? Haz una representación de dichos conjuntos en el plano complejo $\mathbb{C}$.
a) Los $z\in\mathbb{C}$ tales que $z = \overline{z}$.
b) Los $z\in\mathbb{C}$ tales que $-\theta < \operatorname{Arg}\,z < \theta$.
c) Los $z\in\mathbb{C}$ tales que $0 < \operatorname{Im}(z) < \pi$ y $-\pi < \operatorname{Re}(z) < \pi$.
d) Los $z\in\mathbb{C}$ tales que $|\,z-1\,|^2+|\,z+1\,|^2<8$.
e) Los $z\in\mathbb{C}$ tales que $|\,z-1-i\,|+|\,z+1+i\,|\leq 2$.
Considera la definición de la hipérbola y la definición de la párabola ¿Es posible hablar de los puntos que se encuentran dentro y fuera de dichos lugares geométricos? Observa que en el caso de una circunferencia y una elipse dichos puntos se daban mediante las siguientes desigualdades respectivamente: \begin{equation*} |\,z-z_0\,| < \rho \quad \text{y} \quad |\,z-z_0\,| > \rho, \end{equation*}
Sean $z_1, z_2, z_3\in\mathbb{C}$ tales que $|\,z_1\,| = |\,z_2\,| = |\,z_3\,|$ y $z_1 + z_2 + z_3 = 0$. Prueba que $z_1, z_2$ y $z_3$ son los vértices de un triángulo equilatero inscrito en la circunferencia unitaria.
Muestra que el lugar geométrico de los puntos $z\in\mathbb{C}$ tales que $|\,z^2 – a^2\,| = a^2$, con $a\in\mathbb{R}$ una constante, es una lemniscata de Bernoulli.
Sean $z_1, z_2, z_3\in\mathbb{C}$ los vértices de un triángulo en el plano complejo $\mathbb{C}$. Prueba que dicho triángulo es equilatero si y solo si: \begin{equation*} \frac{1}{z_1 – z_2} + \frac{1}{z_2 – z_3} + \frac{1}{z_3 – z_1} = 0, \end{equation*}es decir si y solo si $z_1^2+z_2^2+z_3^2 = z_1 z_2 + z_2 z_3 + z_3 z_1$.
Sean $z_1,z_2,z_3\in\mathbb{C}$ tres puntos distintos. Prueba que dichos puntos caen en la misma recta si y solo si: \begin{equation*} \frac{z_1 – z_2}{z_1 – z_3} = t, \end{equation*} donde $t$ es un número real.
Más adelante…
En esta entrada hemos definido la distancia entre dos puntos $z$ y $w$ en el plano complejo $\mathbb{C}$ siguiendo la idea de hablar de la distancia entre dichos puntos como la longitud del segmento de recta que los une, a la cual llamamos la distancia o métrica euclidiana. Dicha definición de distancia nos permitió describir algunos lugares geométricos en el plano complejo $\mathbb{C}$ haciendo uso de nuestros resultados de geometría y las propiedades del módulo en $\mathbb{C}$.
Es de nuestro interés describir estos lugares geométricos en el plano complejo $\mathbb{C}$ porque nos permite reconocer qué puntos pertenecen o no a un conjunto mediante una condición dada. Esto nos motivará a definir el concepto de disco o vecindad en la siguiente entrada, mediante el cual podremos caracterizar mejor a los conjuntos de $\mathbb{C}$ y con ello a los puntos que los conforman.
La siguiente entrada analizaremos a detalle la distancia recién definida y veremos que resulta ser una función definida en $\mathbb{C}\times\mathbb{C}$ y que toma valores en $[0, \infty)$, la cual recibe propiamente el nombre de métrica. Consideraremos al espacio métrico formado por $\mathbb{C}$ y la métrica euclidiana $d$ y describiremos la topología inducida en $\mathbb{C}$ por dicha métrica. Además probaremos algunos resultados de dicho espacio métrico.
En la entrada anterior vimos que al igual que en $\mathbb{R}^2$, en el plano complejo es posible trabajar con coordenadas polares para representar a un número complejo en su «forma polar», utilizando su módulo y un ángulo. Primeramente definimos al argumento de un número complejo, el cual resultó no ser único, sino que en realidad existe todo un conjunto de ángulos que nos permite representar a un número complejo de manera indistinta, por lo que fue conveniente el considerar a un ángulo en particular, llamado el argumento principal. Considerando la forma polar de un número complejo fue posible dar una interpretación geométrica al producto y división de números complejos. Además obtuvimos algunos resultados importantes, como la fórmula de De Moivre, que nos serán de utilidad a lo largo de esta entrada y en general para poder operar de forma más sencilla a los números complejos.
En esta entrada nuestro objetivo será plantear una ecuación de la forma $w^n = z$, con $n\in\mathbb{N}^+$ y $w,z\in\mathbb{C}$, $z\neq 0$, analizarla y darle solución. Una vez resuelta dicha ecuación, tendrá sentido el pensar en potencias racionales de números complejos.
Raíces de un número complejo.
Definición 5.1. (Raíz $n$-ésima.) Sea $z \in \mathbb{C}$, con $z\neq0$. Un número complejo $w$ es llamado una raíz $n$-ésima de $z$ si $w^n = z$, y se denota como $w = z^{1/n}$.
Proposición 5.1. (Raíces $n$-ésimas.) Sea $z\in \mathbb{C}$, $z\neq0$, en su forma polar $z=r\,\text{cis}(\theta)$ y sea $n \in \mathbb{N^+}$. Entonces existen exactamente $n$ raíces $n$-ésimas distintas, las cuales están dadas por: \begin{equation*} w_k = \sqrt[n]{r} \, \text{cis}\left(\frac{\theta+2\pi k}{n}\right), \quad \text{para} \quad k = 0,1,\ldots,n-1. \end{equation*}
Demostración. Dadas las hipótesis, primeramente verifiquemos que el número complejo $w_k$ propuesto cumple la definición 5.1. De acuerdo con la fórmula de De Moivre tenemos que: \begin{align*} \left(w_k\right)^n & = \left(\sqrt[n]{r}\right)^n \, \text{cis}\left(n \left[\frac{\theta+2\pi k}{n}\right]\right)\\ & = \left(\sqrt[n]{r}\right)^n \, \text{cis}\left(\theta+2\pi k\right). \end{align*}
Dado que las funciones seno y coseno son $2\pi$-periódicas, es decir, para todo $k\in\mathbb{Z}$ se cumple: \begin{equation*} \operatorname{sen}(\theta + 2\pi k) = \operatorname{sen}(\theta),\quad \operatorname{cos}(\theta + 2\pi k) = \operatorname{cos}(\theta). \end{equation*}
Entonces se tiene que $z = r\,\text{cis}(\theta)= \left(w_k\right)^n$.
Lo anterior nos motiva a encontrar un número complejo $w = \rho \, \text{cis}(\phi)$ tal que $w^n = z$, es decir: \begin{equation*} \rho^n \, \text{cis}(n\phi) = r \, \text{cis}(\theta). \end{equation*}
Considerando la igualdad entre números complejos se tiene que: \begin{align*} \rho^n = r,\\ \text{cos}(n\phi) = \text{cos}(\theta),\\ \text{sen}(n\phi) = \text{sen}(\theta). \end{align*}
Desde que los argumentos de ambos números complejos están determinados módulo $2\pi$, entonces de lo anterior tenemos que: \begin{equation*} \rho = \sqrt[n]{r}, \end{equation*}
Notemos que para $k=0,1,\ldots,n-1$ se obtienen ya $n$ raíces $n$-ésimas distintas, las cuales tienen el mismo módulo $\sqrt[n]{r}$, pero distinto argumento. Para probar esto consideremos el siguiente:
Lema 5.1. Sean $n\in\mathbb{N^+}$, $k’, k \in \mathbb{Z}$ y sea $w_k = \sqrt[n]{r} \, \text{cis}\left(\frac{\theta + 2\pi k}{n}\right)$. Entonces: \begin{equation*} k’ \equiv k \,\, (\text{mod}\, n) \quad \text{si y solo si} \quad w_{k’} = w_k. \end{equation*}
Observación 5.1. La congruencia módulo $n$, representada por el símbolo $\equiv$, es una relación de equivalencia en $\mathbb{Z}$, la cual se define como sigue:
Para $a,b\in\mathbb{Z}$ y $n\in\mathbb{N}^+$, diremos que $a$ es congruente con $b$ módulo $n$ si y solo si $a-b$ es divisible por $n$ y se escribe como: \begin{equation*} a \equiv b \,\, (\text{mod}\, n). \end{equation*}
Demostración. $\Rightarrow)$ Dadas las hipótesis, sin pérdida de generalidad tenemos que: \begin{equation*} k’ \equiv k \,\, (\text{mod}\, n) \quad \Longrightarrow \quad k’ = k + nm, \, \, \, \text{para algún} \,\, m\in\mathbb{Z} \,\,\, \text{y} \, \, 0\leq k<n. \end{equation*}
$(\Leftarrow$ Dadas las hipótesis, tenemos que si $w_k’ = w_k$, entonces: \begin{equation*} \sqrt[n]{r} \, \text{cis}\left(\frac{\theta + 2\pi k’}{n}\right) = \sqrt[n]{r} \, \text{cis}\left(\frac{\theta + 2\pi k}{n}\right), \end{equation*}
por lo que, considerando la igualdad entre números complejos: \begin{align*} \text{cos}\left(\frac{\theta + 2\pi k’}{n}\right) = \text{cos}\left(\frac{\theta + 2\pi k}{n}\right),\\ \text{sen}\left(\frac{\theta + 2\pi k’}{n}\right) = \text{sen}\left(\frac{\theta + 2\pi k}{n}\right). \end{align*}
De donde se sigue que: \begin{equation*} \frac{\theta + 2\pi k’}{n} = \frac{\theta + 2\pi k}{n} + 2 \pi m, \quad \text{para algún} \,\, m\in \mathbb{Z}. \end{equation*}
Por lo que: \begin{equation*} k’ = k + nm, \quad \text{para algún} \,\, m\in \mathbb{Z}, \end{equation*}
lo cual implica que $k’ \equiv k \, \, (\text{mod}\,n)$.
$\blacksquare$
De acuerdo con el lema anterior, concluimos que existen a lo más $n$ raíces $n$-ésimas distintas $w_k$ correspondientes a $k = 0, 1, \ldots, n-1$ y que son de la forma: \begin{equation*} w_k = \sqrt[n]{r} \, \text{cis}\left(\frac{\theta + 2\pi k}{n}\right). \end{equation*}
$\blacksquare$
Observación 5.2. Notemos que la expresión $z^{1/n}$ es $n$-valuada, es decir, no representa un único valor, sino al conjunto de $n$ raíces $n$-ésimas, formado por las raíces $w_k$ con $k=0,1,\ldots,n-1$, del número complejo $z\neq0$.
Definición 5.2. (Raíz $n$-ésima principal.) Sea $z\neq0$ un número complejo. Llamaremos como raíz $n$-ésima principal de $z$ al único valor de $z^{1/n}$ tal que tenga como argumento al argumento principal de $z$, $\text{Arg}\,z$, es decir a la raíz dada por $k=0$.
Ejemplo 5.1.
a) Hallar las 5 raíces quintas de $z_1 = 1+i$.
b) Hallar las 4 raíces cuartas de $z_2 = i$.
c) Hallar las 3 raíces quintas de $z_3 = -\sqrt{2} -i\,\sqrt{2}$.
Figura 20: Gráfica de los números complejos $z_1, z_2$ y $z_3$ en el plano complejo.
Solución. Para los tres números complejos, resolveremos utilizando su argumento principal $\text{Arg}\,z$.
a) Notemos que $z_1 = 1+i$ se encuentra en el primer cuadrante, por lo que:
Por otra parte, tenemos que $r_1=|\,z_1\,|=\sqrt{2}$. Entonces, por la proposición 5.1 se tiene que las 5 raíces quintas de $z_1$ están dadas por: \begin{equation*} w_k = \left(\sqrt{2}\right)^{\frac{1}{5}}\,\text{cis}\left(\frac{\frac{\pi}{4}+2\pi k}{5}\right), \quad \text{para} \, \, k = 0,1,2,3,4. \end{equation*}
Por lo que: \begin{equation*} z^{1/5} = \left\{ \sqrt[10]{2}\,\text{cis}\left(\frac{\pi}{20}\right),\sqrt[10]{2}\,\text{cis}\left(\frac{9\pi}{20}\right),\sqrt[10]{2}\,\text{cis}\left(\frac{17\pi}{20}\right),\sqrt[10]{2}\,\text{cis}\left(\frac{5\pi}{4}\right),\sqrt[10]{2}\,\text{cis}\left(\frac{33\pi}{20}\right)\right\}. \end{equation*}
De acuerdo con la definición 5.2, $w_0 = \sqrt[10]{2}\,\text{cis}\left(\frac{\pi}{20}\right)$ es la raíz quinta principal de $z_1$.
Por otra parte, tenemos que $r_2=|\,z_2\,|=1$. Entonces, considerando la proposición 5.1, tenemos que las 4 raíces cuartas de $z_2$ están dadas por: \begin{equation*} w_k = 1^{\frac{1}{4}}\,\text{cis}\left(\frac{\frac{\pi}{2}+2\pi k}{4}\right), \quad \text{para} \, \, k = 0,1,2,3. \end{equation*}
Por lo que: \begin{equation*} z^{1/4} = \left\{\text{cis}\left(\frac{\pi}{8}\right),\text{cis}\left(\frac{5\pi}{8}\right),\text{cis}\left(\frac{9\pi}{8}\right),\text{cis}\left(\frac{13\pi}{8}\right)\right\}. \end{equation*}
Considerando la definición 5.2, se tiene que $w_0 = \text{cis}\left(\frac{\pi}{8}\right)$ es la raíz cuarta principal de $z_2$.
c) Notemos que $z_3 = -\sqrt{2}-i\,\sqrt{2}$ se encuentra en el tercer cuadrante, por lo que:
Por otra parte, tenemos que $r_3=|\,z_3\,|=2$. De acuerdo con la proposición 5.1, las 3 raíces cúbicas de $z_3$ están dadas por: \begin{equation*} w_k = \sqrt[3]{2}\,\text{cis}\left(\frac{\frac{-3\pi}{4}+2\pi k}{3}\right), \quad \text{para} \, \, k = 0,1,2. \end{equation*}
Por lo que: \begin{equation*} z^{1/3} = \left\{\sqrt[3]{2}\,\text{cis}\left(\frac{-\pi}{4}\right), \sqrt[3]{2}\,\text{cis}\left(\frac{5\pi}{12}\right), \sqrt[3]{2}\,\text{cis}\left(\frac{13\pi}{12}\right)\right\}. \end{equation*}
De acuerdo con la definición 5.2, se tiene que $w_0 = \sqrt[3]{2}\,\text{cis}\left(\frac{-\pi}{4}\right)$ es la raíz cúbica principal de $z_3$.
Notemos que las raíces $n$-ésimas tienen una intepretación geométrica, es decir, las raíces $n$-esimas de un número complejo $z$ coinciden con los vértices de un póligono regular de $n$ lados, el cual está inscrito en una circunferencia de radio $\sqrt[n]{r}$ centrada en el origen.
Considerando los números complejos del ejemplo 5.1 tenemos que:
Figura 21: Gráfica de las 5 raíces quintas de $z_1$.
Figura 22: Gráfica de las 4 raíces cuartas de $z_2$.
Figura 23: Gráfica de las 3 raíces cúbicas de $z_3$.
Un caso particular importante es cuando $z=1$. Si se plantea la ecuación $w^n = z$, entonces a las soluciones se les llama las raíces $n$-ésimas de la unidad. Considerando que el argumento principal de $z=1$ es $\text{Arg}\,z = 0$ y $r = |\,z\,| =1$, entonces la forma polar de la unidad es $z=\text{cis}(0)$. De acuerdo con la proposición 5.1 se tiene que las raíces de la unidad están dadas por: \begin{equation*} w_k = \sqrt[n]{1}\,\text{cis}\left(\frac{0 + 2 \pi k}{n}\right)= \text{cis}\left(\frac{2 \pi k}{n}\right), \quad \text{para}\, \, k=0,1,\ldots,n-1. \end{equation*}
Si definimos $\omega = \text{cis}\left(\frac{2 \pi}{n}\right)$, entonces por la fórmula de De Moivre se tiene que $\omega^k$, con $k=0,1,\ldots,n-1 $, determina las $n$ raíces $n$-ésimas de la unidad, es decir: \begin{equation*} 1, \omega, \omega^2, \omega^3, \ldots, \omega^{n-1}. \end{equation*}
Ejemplo 5.2. De acuerdo con lo anterior, tenemos que las 3 raíces cúbicas de la unidad están determinadas por: \begin{equation*} \omega = \text{cis}\left(\frac{2\pi}{3}\right) = -\frac{1}{2} + i\,\frac{\sqrt{3}}{2}, \end{equation*}
Figura 24: Gráfica de las 3 raíces cúbicas de la unidad.
Observación 5.3. Es interesante notar que mediante las raíces $n$-ésimas de la unidad es posible encontrar las raíces $n$-ésimas de cualquier $z\in\mathbb{C}$, $z\neq0$, ya que es posible reescribir la fórmula de la proposición 5.1 como sigue: \begin{align*} w_k & = \sqrt[n]{r} \, \text{cis}\left(\frac{\theta + 2 \pi k}{n}\right)\\ & = \sqrt[n]{1} \, \text{cis}\left(\frac{2 \pi k}{n}\right) \sqrt[n]{r} \, \text{cis}\left(\frac{\theta}{n}\right)\\ & = \sqrt[n]{r} \, \omega^k \, \zeta, \end{align*}
donde $\omega = \text{cis}\left(\frac{2 \pi}{n}\right)$, $\zeta = \text{cis}\left(\frac{\theta}{n}\right)$ y $k=0,1,\ldots,n-1$. Entonces para un número complejo $z\neq0$, sus $n$ raíces $n$-ésimas son: \begin{equation*} \sqrt[n]{r} \, \zeta, \sqrt[n]{r} \, \omega \, \zeta, \sqrt[n]{r} \, \omega^2 \, \zeta,\ldots, \sqrt[n]{r} \, \omega^{n-1} \, \zeta. \end{equation*}
Dichas raíces coinciden con los vértices de un polígono de $n$ lados, inscrito en la circunferencia de radio $\sqrt[n]{r}$.
Ejemplo 5.3. Encontremos las 3 raíces cúbicas de $z=-8i$. Utilizando el argumento principal de $z$, tenemos que $\text{Arg}\,z=-\frac{\pi}{2}$ y $r = |\,z\,| = 8$, por lo que: \begin{align*} \sqrt[3]{r} = \sqrt[3]{8} = 2,\ \zeta = \text{cis}\left(\frac{-\frac{\pi}{2}}{3}\right) = \text{cis}\left(\frac{-\pi}{6}\right) = \frac{1}{2}\left(\sqrt{3} – i\right). \end{align*}
Considerando la observación 5.3, tenemos que las 3 raíces cúbicas de $z=-8i$ están dadas por: \begin{equation*} \sqrt[3]{r} \, \zeta, \sqrt[3]{r} \, \omega \, \zeta, \sqrt[3]{r}\, \omega^2 \, \zeta, \end{equation*}
donde $\omega = \text{cis}\left(\frac{2\pi}{3}\right)$ determina las 3 raíces cúbicas de la unidad, como en el ejemplo anterior, entonces: \begin{align*} w_0 = 2(1)\left[\frac{1}{2}\left(\sqrt{3} – i\right)\right] = \sqrt{3} – i,\\ w_1 = 2\left(-\frac{1}{2} + i\,\frac{\sqrt{3}}{2}\right)\left[\frac{1}{2}\left(\sqrt{3} – i\right)\right] = 2i,\\ w_2 = 2\left(-\frac{1}{2} – i\,\frac{\sqrt{3}}{2}\right)\left[\frac{1}{2}\left(\sqrt{3} – i\right)\right] = -\sqrt{3} – i. \end{align*}
Figura 25: Gráfica de las 3 raíces cúbicas de $z=-8i$.
Observación 5.4. Supongamos que $m,n \in \mathbb{N^+}$ son tales que no tienen divisores comunes y sean $z, w \in \mathbb{C}$ con $z=r\,\text{cis}(\theta)\neq0$. Es posible definir las potencias racionales de $z$, es decir $z^{m/n}$. Para entender mejor esta idea pensemos en la ecuación $w^n = z^m$. Entonces es posible mostrar que existen $n$ soluciones distintas para dicha ecuación, las cuales están dadas por las raíces $n$-ésimas de $z^m$ y son de la forma: \begin{equation*} w_k = \sqrt[n]{r^m}\,\text{cis}\left(\frac{m(\theta+2 \pi k)}{n}\right), \quad \text{para}\,\, k=0,1,\ldots,n-1. \end{equation*}
Lo anterior nos dice entonces que los conjuntos $\left(z^m\right)^{1/n}$ y $\left(z^{1/n}\right)^m$ deben ser el mismo, a decir el conjunto $z^{m/n}$.
Tarea moral
Determina las 3 raíces cúbicas de $z_1=-125$ y las 8 raíces octavas de $z_2=\dfrac{16i}{1+i}$. En ambos casos identifica a la raíz $n$-ésima principal correspondiente y realiza un gráfico de las raíces.
Considera la observación 5.4 y prueba el resultado. Argumenta porqué los conjuntos de raíces son los mismos.
Sean $a$ y $b$ dos números reales y $n\in\mathbb{N}^+$. Demuestra que todas las raíces de la ecuación: \begin{equation*} \left(\frac{1+iz}{1-iz}\right)^n = a+ib, \end{equation*}
son reales si y solo si $a^2 + b^2 =1$.
Resuelve la ecuación $ (z+1)^5 = z^5$.
Encuentra todas las soluciones de la ecuación $w^2 = (-1+i)^5$.
Sea $z = \operatorname{cis}\left(\frac{2\pi}{n}\right)$. Prueba que para $n\geq 2$ se cumple: \begin{equation*} 1+ z + z^2 + \cdots + z^{n-1} = 0. \end{equation*}
Más adelante…
Como habíamos visto en la entrada anterior, el trabajar con un número complejo en su forma polar nos permitió caracterizar a las potencias enteras de un números complejo en términos de sus módulos y sus argumentos, lo cual fue de utilidad para trabajar con el concepto de raíz $n$-ésima de un número complejo y dar soluciones a ecuaciones de la forma $w^n=z$. Además vimos que es posible caracterizar a dichas soluciones de manera geométrica.
A diferencia de $\mathbb{R}$, notamos que el campo de los números complejos $\mathbb{C}$ es cerrado bajo la radicación, es decir que para todo $z\in\mathbb{C}$ se cumple que el conjunto de números complejos $z^{1/n}$, $n\in\mathbb{N}^+$, sigue siendo un subconjunto de $\mathbb{C}$.
En la siguiente entrada retomaremos el concepto del módulo y sus propiedades con la finalidad de introducir una métrica en $\mathbb{C}$, la cual nos permitirá seguir describiendo desde una perspectiva geométrica a los números complejos y hablar de algunos lugares geométricos del plano complejo.