Geometría Analítica I: Elipses

Por Héctor Morales

Introducción

Probablemente recuerdas un ejercicio muy común que se hace en las primarias en México: cuando se enseña a los niños sobre el Sistema Solar, comúnmente se les pide hacer una maqueta con esferas de unicel. Si alguna vez hiciste este ejercicio, tal vez recuerdas que las supuestas trayectorias de estos planetas en nuestra maqueta se distribuían como una serie de círculos concéntricos que iban aumentando en tamaño, con el «Sol» en su centro.

Por otro lado, si te interesa la astronomía, seguramente estás familiarizado con las Leyes de Kepler, una de ellas nos dice «Todos los planetas se mueven alrededor del Sol siguiendo órbitas elípticas. El Sol está en uno de los focos de la elipse.» Entonces, resulta que las trayectorias de los planetas no son círculos, si no «elipses», y todo este tiempo nuestra maqueta estuvo mal (¿o no tanto?). Si las elipses son tan importantes como para permitirnos visualizar el movimiento de un planeta, podrás darte cuenta de la importancia de tener una descripción analítica de esta figura; y por qué nos interesa estudiarla a fondo.

En esta entrada haremos justo eso: discutiremos desde cómo trazar una elipse en papel, pasando por su definición formal hasta obtener una expresión analítica que nos permitirá leer toda la información geométrica de la figura.

Dibujando y definiendo una elipse

Si alguna vez has visto un arbusto con forma elíptica (algo así como un círculo achatado), tal vez te has preguntado ¿cómo obtuvo esa forma? El método más sencillo para dibujar una elipse consiste en fijar dos tachuelas a una superficie de papel, amarrar holgadamente un hilo entre ellas y luego, manteniendo la tensión del hilo, girar el lápiz. Si intentas por tu cuenta este procedimiento, podrás ver que obtuviste una figura como la siguiente:

Elipse dibujada con el «Método del
Jardinero»

Esta figura es una de las secciones cónicas que estudiaremos durante el curso; como ya lo sugiere el método que usamos para dibujarla («Método del jardinero»), su definición tiene tres elementos importantes: dos puntos fijos y un tercer punto que se mueve manteniendo una suma de distancias totales constante. Sin más preámbulos, abordemos la definición de elipse con la que trabajaremos.

Definición. Las elipses son el lugar geométrico de los puntos cuya suma de distancias a dos puntos fijos llamados focos es constante. De tal manera que una elipse $\mathcal{E}$ queda totalmente determinada por la ecuación:

\begin{equation}
d(\mathbf{x}, \mathbf{p})+d(\mathbf{x}, \mathbf{q})=2 a
\end{equation}

donde $\mathbf{p}$ y $\mathbf{q}$ son los focos y $a$ es una constante positiva, llamada semieje mayor, tal que 2 a>d(\mathbf{p}, \mathbf{q}).

Un pregunta natural que te puede surgir al considerar esta definición es el por qué incluir el coeficiente $2$. La respuesta es que se incluye para que quede claro que si los focos coinciden, $\mathbf{p}=\mathbf{q}$, entonces se obtiene un círculo de radio $a$ y centro en el foco; dicho de una forma más explícita ¡Resulta que los círculos son un tipo especial de elipse!

Antes de continuar te invito a que manipules el siguiente recuadro interactivo de GeoGebra para familiarizarte con las elipses. Observa cómo cambiar el eje mayor y el eje menor la redefine totalmente; además cómo la figura es totalmente dependiente de la posición de sus focos.

Ahora, debes considerar que esta ecuación, poniéndole coordenadas a los focos, incluye raíces cuadradas por las distancias, lo cual la hace ver un poco intimidante. Veamos un caso especial que nos permitirá escribir a la ecuación de la elipse de una forma más agradable. Con este desarrollo, queremos llegar a la ecuación canónica de la elipse.

Supongamos que el centro de la elípse $\mathcal{E}$, i.e., el punto medio entre los focos, está en el origen y que además los focos están en el eje $x .$ Entonces tenemos que $\mathbf{p}=(c, 0)$ y $\mathbf{q}=(-c, 0)$ para alguna $c$ tal que $0<c<a$ (donde ya suponemos que la elipse no es un círculo al pedir $0<c$ ). Es fácil ver que entonces la intersección de $\mathcal{E}$ con el eje $x$ consiste de los puntos $(a, 0) \mathrm{y}$ $(-a, 0)$, pues la ecuación $(2.8)$ para puntos $(x, 0)$ es

\begin{equation}
|x-c|+|x+c|=2 a
\end{equation}

que sólo tiene las soluciones $x=a$ y $x=-a$, y de aquí el nombre de «semieje mayor» para la constante $a$. Como el eje $y$ es ahora la mediatriz de los focos, en él, es decir en los puntos $(0, y)$, la ecuación se vuelve:

\begin{equation}
\sqrt{c^{2}+y^{2}}=a
\end{equation}

que tiene soluciones $y=\pm b$, donde $b>0$, llamado el semieje menor de la elipse $\mathcal{E}$. es tal que:

\begin{equation}
b^{2}=a^{2}-c^{2} .
\end{equation}

Puedes guiarte con la siguiente figura para entender el desarrollo que acabamos de hacer:

Semieje mayor y semieje menor de una elipse.

Ahora sí, consideremos la ecuación $(2.8)$, que $\operatorname{con} \mathrm{x}=(x, y) \mathrm{y}$ la definición de nuestros focos se expresa:

$$
\sqrt{(x-c)^{2}+y^{2}}+\sqrt{(x+c)^{2}+y^{2}}=2 a
$$

Si elevamos al cuadrado directamente a esta ecuación, en el lado izquierdo nos quedaría un incomodo término con raíces. Así que conviene pasar a una de las dos raíces al otro lado, para obtener

$$
\sqrt{(x-c)^{2}+y^{2}}=2 a-\sqrt{(x+c)^{2}+y^{2}}
$$

Elevando al cuadrado se tiene

$$
(x-c)^{2}+y^{2}=4 a^{2}-4 a \sqrt{(x+c)^{2}+y^{2}}+(x+c)^{2}+y^{2}
$$

$$
x^{2}-2 c x+c^{2}=4 a^{2}-4 a \sqrt{(x+c)^{2}+y^{2}}+x^{2}+2 c x+c^{2}
$$

$$
4 a \sqrt{(x+c)^{2}+y^{2}}=4 a^{2}+4 c x
$$

$$
a \sqrt{(x+c)^{2}+y^{2}}=a^{2}+c x
$$

Elevando de nuevo al cuadrado, nos deshacemos de la raíz, y después, agrupando términos, obtenemos

$$
a^{2}\left((x+c)^{2}+y^{2}\right)=a^{4}+2 a^{2} c x+c^{2} x^{2}
$$

$$
a^{2} x^{2}+2 a^{2} c x+a^{2} c^{2}+a^{2} y^{2}=a^{4}+2 a^{2} c x+c^{2} x^{2}
$$

$$
\left(a^{2}-c^{2}\right) x^{2}+a^{2} y^{2}=a^{2}\left(a^{2}-c^{2}\right)
$$

$$
b^{2} x^{2}+a^{2} y^{2}=a^{2} b^{2}
$$

que, dividiendo entre $a^{2} b^{2}$, se escribe finalmente como

\begin{equation}
\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}=1
\end{equation}

llamada la ecuación canónica de la elipse centrada en el origen.

Después de este largo desarrollo pudimos llegar a una ecuación sencilla que nos permite leer toda la información geométrica de la elipse: su centro y la magnitud de su semieje mayor y semieje menor. Observa cómo ahora podemos demostrar sencillamente una de las afirmaciones que hicimos en esta entrada: si en la ecuación canónica de la elipse centrada en el origen hacemos $a=b$, es decir, forzamos a que la figura tenga el semieje mayor y el semieje menor iguales obtenemos la ecuación $x^2+y^2=a^2$ que es la expresión analítica de una circunferencia centrada en el origen.

Con estas herramientas estamos listos para realizar algunos ejercicios. En el primero obtendremos la ecuación de la elipse a partir de la definición, y en el segundo veremos cómo podemos extraer toda la información geométrica de la elipse a partir de su ecuación.

Ejercicio. Encuentra la ecuación de la elipse con fonoces en $(0,3)$ y $(0,-3)$ para la cual la suma de las distancias del foco a cada uno de sus puntos es $6\sqrt{3}$.

Utilizando la definición propuesta al inicio de esta entrada, nuestra elipse será el conjunto de puntos que cumplen la condición:

$$
d(\mathbf{x}, \mathbf{p})+d(\mathbf{x}, \mathbf{q})=2 a
$$

Aplicando la fórmula de la distancia que utilizando en la primera unidad del curso y considerando el valor de la constante $2a$ tenemos que

$$
\sqrt{x^{2}+(y-3)^{2}}+\sqrt{x^{2}+(y+3)^{2}}=6 \sqrt{3}
$$

Esto, lo podemos reescribir como

$$
\sqrt{x^{2}+(y-3)^{2}}=6 \sqrt{3}-\sqrt{x^{2}+(y+3)^{2}}
$$

Si elevamos ambos lados al cuadrado, llegamos a que

$$
x^{2}+(y-3)^{2}=108-12 \sqrt{3} \sqrt{x^{2}+(y+3)^{2}}+x^{2}+(y+3)^{2}
$$

Si te das cuenta, podemos cancelar algunos términos; y en nuestro caso nos conviene dividir ambos lados de la ecuación anterior entre $12$.Si reducimos la expresión anterior, tenemos que

$$
\sqrt{3} \sqrt{x^{2}+(y+3)^{2}}=9+y
$$

Una vez más elevamos ambos lados al cuadrado y llegamos a que

$$
3 x^{2}+2 y^{2}=54
$$

Lo cual es lo mismo a

$$
\frac{x^{2}}{27}+\frac{y^{2}}{18}=1
$$

que es la ecuación de la elipse en su forma canónica.

Ejercicio. ¿Cuál es la ecuación canónica de la elipse que tiene como vértices a los puntos $(\pm 8,0)$ y como focos a $(\pm 5,0)$?

Los focos están en el eje $x$, entonces el eje mayor estará también sobre el eje $x$. Así, la ecuación tendrá esta forma

$$
\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}=1
$$

Como los vértices son $(\pm 8,0)$, entonces $a=8$ y $a^{2} = 64$. Y puesto que los focos son $(\pm 5,0)$, entonces $c=5$ y $c^2 = 25$. Ahora, sabemos que los focos y los vértices están relacionados por la siguiente ecuación $c^{2}=a^{2}-b^{2}$. Si resolvemos para $b^2$ tenemos que $b^2=39$. Por lo tanto, la ecuación canónica de esta elipse será:

$$
\frac{x^{2}}{64}+\frac{y^{2}}{39}=1
$$

Más adelante…

En esta entrada aprendimos lo básico sobre una elipse: su definición, sus elementos y la ecuación canónica que la representa. Nos falta hablar de sus propiedades focales y del concepto de excentricidad, estos términos serán el tema de la siguiente entrada. Una vez que hayamos concluido nuestro estudio de las elipses, empezaremos a hablar de hipérbolas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Dibuja la elipse $\frac{x^{2}}{36}+\frac{y^{2}}{4}=1$ en algún programa de computadora e identifica sus elementos. Sugerencia: puedes utilizar GeoGebra, Mathematica, Matlab, Python o GNU plot.
  • Considera la siguiente ecuación de elipse $9 x^{2}+4 y^{2}=36$; encuentra sus focos, su semieje mayor, su semieje menor y dibújala.
  • Encuentra el área de una elipse con semieje mayor $a$ y semieje menor $b$. Sugerencia: Considera la ecuación canónica de una elipse centrada en el origen, despeja para $x$ e integra sobre $x$ sólo un cuadrante; eligiendo correctamente los límites de integración. El resultado de la integral multiplícalo por $4$. Cuidado, la integral es trigonométrica.

Entradas relacionadas

Geometría Analítica I: Forma vectorial de círculos, tangentes y polares

Por Héctor Morales

Introducción

En la entrada anterior construimos un puente entre la intuición que tenemos de las circunferencias y el estudio formal que podemos hacer de ellas utilizando las herramientas de la geometría analítica. Ahora queremos ir más allá de las propiedades básicas del círculo, como lo son su centro y su radio, para abordar propiedades un poco más avanzadas; sus rectas tangentes y polares.

Veremos a lo largo de esta entrada cómo la ecuación vectorial de la circunferencia nos prueba su utilidad al abordar problemas geométricos tales como encontrar puntos de tangencia sobre una circunferencia, hacer demostraciones que involucren las secantes de un círculo, entre otros.

Líneas tangentes a un círculo

Antes de abordar el tema de las líneas tangentes a un círculo, mencionaremos brevemente un problema físico que nos puede motivar a estudiarlo. El problema de la polea consiste en encontrar la longitud de un cable que conecta a dos circunferencias de radio $r_1$ y $r_2$ que no se cruzan; cuyos centros están separados por una distancia $P$. Aunque sea un problema en apariencia sencillo su solución requiere de herramientas como líneas bitangentes, ángulos verticales y congruencia. Pese a que la su solución no es trivial, es un problema de ingeniería bastante importante, pues se usa en el diseño de aeroplanos, bicicletas, autos, etc. No escribiremos explícitamente la solución a este problema, por el momento sólo diremos que para resolverlo es fundamental utilizar el concepto de línea tangente.

Problema de la polea

Ahora que comentamos una motivación, empezaremos a discutir el concepto de línea tangente. Intuitivamente podemos pensar que las líneas tangentes son las que tocan a una circunferencia en uno solo de sus puntos. Esto tiene varias implicaciones; la primera de ellas es que podemos pensar en las tangentes como las normales a los radios (los segmentos del centro a sus puntos). Empezaremos proponiendo la definición de las líneas tangentes y haremos una discusión detallada de cada uno de los elementos de esta definición.

Definición. Si $\mathbf{a}$ es un punto del círculo $\mathcal{C}$ dado por la ecuación vectorial

\begin{equation}
(\boldsymbol{x}-\mathbf{p}) \cdot(\boldsymbol{x}-\mathbf{p})=\mathrm{r}^{2}
\end{equation}

entonces su línea tangente es la recta $\ell$ normal a $(\mathbf{a} – \mathbf{p})$ y que pasa por $\mathbf{a}$.

Esta definición tiene algunas implicaciones interesantes que para los elementos que la constituyen que vale la pena observar con detalle. La primera es que, puesto que $\mathbf{a}$ es el punto más cercano a $\mathbf{p}$ en esta recta, para cualquier otro punto $x \in \ell$ se tiene que $\mathrm{d}(\boldsymbol{x}, \mathbf{p})>\mathrm{r}$. Dicho de una forma más sencilla: cualquier otro punto que no sea el punto de tangencia estará alejado del centro del círculo una distancia mayor que el radio. Puedes observar la figura para convencerte de este hecho.

Línea tangete del círculo y punto de tangencia.

Continuando nuestra exploración de los elementos de la definición que acabamos de presentar, observa que el círculo $\mathcal{C}$ parte el plano en dos pedazos; el interior donde $\mathrm{d}(\boldsymbol{x}, \mathbf{p})<\mathrm{r}$, y el exterior donde $\mathrm{d}(\boldsymbol{x}, \mathbf{p})>\mathrm{r}$, de esta forma $\ell$ está contenida en el exterior salvo por el punto $a \in \mathcal{C}$.

Para obtener una expresión analítica de las líneas tangentes conviene recordar las herramientas vectoriales que fueron presentadas durante la primera unidad, te podrás dar cuenta que si utilizamos la forma de la ecuación normal de recta con los elementos de nuestra definición, podemos ver que la recta $\ell$ está dada por la ecuación

\begin{equation}
\boldsymbol{x} \cdot(\boldsymbol{a}-\mathbf{p})=\boldsymbol{a} \cdot(\boldsymbol{a}-\mathbf{p}),
\end{equation}

esta ecuación tiene una manera más interesante de escribirse; si restamos $\mathbf{p} \cdot(\mathbf{a}-\mathbf{p})$ a ambos lados, se obtiene:

$$
\mathbf{x} \cdot(\mathbf{a}-\mathbf{p})-\mathbf{p} \cdot(\mathbf{a}-\mathbf{p})=\mathbf{a} \cdot(\mathbf{a}-\mathbf{p})-\mathbf{p} \cdot(\mathbf{a}-\mathbf{p})
$$

$$
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})=(\mathbf{a}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})
$$

$$
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})=r^{2}
$$

Esta forma de escribir la ecuación será importante en la siguiente sección cuando abordemos las rectas polares, sin embargo, antes de pasar a la siguiente sección hagamos un ejemplo sobre cómo encontrar la tangente de una circunferencia.

Ejemplo. Supongamos que tenemos un círculo con centro en $(4,-3)$ y radio $5$. Encuentre la línea de tangencia que pasa por el punto $(4,2)$.

Primero tenemos que verificar que el punto está dentro de la circunferencia. Si escribimos la ecuación cartesiana de nuestro círculo

\begin{equation}
(x-4)^{2} + (x+3)^{2}=25
\end{equation}

y sustituimos el punto $(4,2)$. Podemos darnos cuenta que el punto sí está en la circunferencia. Como ya vimos que está sobre el círculo, sólo tenemos que sustituir en la expresión analítica de la línea tangente

\begin{equation}
\boldsymbol{x} \cdot(\boldsymbol{a}-\mathbf{p})=\boldsymbol{a} \cdot(\boldsymbol{a}-\mathbf{p})
\end{equation}

los valores del punto de tangencia y el centro de la circunferencia. Haciendo esto tenemos que:

\begin{equation}
\boldsymbol{x} \cdot ((4,2)-(4,-3)) =\boldsymbol{a} \cdot ((4,2)-(4,-3))
\end{equation}

Por lo tanto, la ecuación de la línea tangente será:

\begin{equation}
\boldsymbol{x} \cdot (0,5) =\boldsymbol{a} \cdot (0,5)
\end{equation}

Escrito en forma cartesiana, tenemos que la recta tangente a nuestra circunferencia a través de ese punto es $y=2$.

Como vimos en nuestro ejemplo, obtener la expresión analítica de la línea tangente a través de un punto es muy fácil si recordamos la definición vectorial. Para terminar esta sección utiliza el siguiente recuadro interactivo para explorar diferentes líneas tangentes de una circunferencia. Nota cómo el punto de tangencia siempre se encuentra en los «bordes» del círculo. ¿Podríamos generalizar vectorialmente el concepto de tangencia para puntos que no se encuentran sobre la circunferencia?

Líneas polares de un círculo

Para empezar nuestro estudio de las líneas polares de un círculo, recuerda el último desarrollo algebraico que hicimos en la sección anterior: ese en el cual sustituimos $\mathbf{a}$ en una de las instancias de $\mathbf{x}$ en la ecuación vectorial. Recuerda cómo en el caso de la línea tangente, consideramos que el punto $\mathbf{a}$ estaba sobre la circunferencia. Con esto en mente, estamos listos para dar una definición de línea polar.

Definición. Consideremos un punto $\mathbf{a}$ en el plano, diferente del centro $(\mathbf{a} \neq \mathbf{p})$, diremos que $\ell_{a}$ es la recta polar de $\mathbf{a}$ respecto al círculo $\mathcal{C}$ y definiremos $\ell_{a}$ como

\begin{equation}
\ell_{\mathbf{a}}: \quad(\boldsymbol{x}-\mathbf{p}) \cdot(\boldsymbol{a}-\mathbf{p})=\mathrm{r}^{2}
\end{equation}

De la definición, se sigue que cuando $\boldsymbol{a} \in \mathcal{C}$ su polar $\ell_{\mathbf{a}}$ es su tangente. Como te puedes dar cuenta, las líneas polares son algo así como una generalización de las líneas tangentes; estamos repitiendo los desarrollos algebraicos que utilizamos en la primera sección sin restringirnos a los puntos que están sobre la circunferencia. Nuestra definición de líneas polares tiene varias consecuencias interesantes; una de ellas es que si el punto $\mathbf{a}$ está en el interior del círculo, entonces $\ell_{a}$ no lo intersecta (está totalmente contenida en el exterior), y que si está en el exterior (el punto $\mathbf{b}$ en la siguiente figura), entonces lo corta, y además lo corta en los dos puntos de $\mathcal{C}$ a los cuales se pueden trazar tangentes.

Existen tres posibles casos, que el punto polar esté dentro de la circunferencia, fuera o que esté sobre ella. El último caso se exploró a detalle en la primera parte de esta entrada.

Vamos a demostrar los enunciados que presentamos en el párrafo anterior. Para esto, expresemos las ecuación $\ell_{a}$ en su forma normal; desarrollando [numero de ecuación de la definición] se obtiene:

\begin{equation}
\boldsymbol{x} \cdot(\boldsymbol{a}-\mathbf{p})=\mathrm{r}^{2}+\mathbf{p} \cdot(\boldsymbol{a}-\mathbf{p})
\end{equation}

Esto indica que $\ell_{a}$ es perpendicular al vector que va de $\mathbf{p}$ a $\mathbf{a}$. Ahora veamos cuál es su punto de intersección con la recta que pasa por $\mathbf{p}$ y $\mathbf{a}$. Parametricemos esta última recta con $\mathbf{p}$ de cero y $\mathbf{a}$ de uno (es decir como $\mathbf{p}+\mathbf{t}(\mathbf{a}-\mathbf{p})$) y podemos despejar $t$ al sustituir en la variable $\mathbf{x}$ de la ecuación anterior (o bien, esto se ve más directo al sustituir en la [numero de ecuación de la definición] ), para obtener

\begin{equation}
t=\frac{r^{2}}{(\mathbf{a}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})}=\frac{r^{2}}{d(\mathbf{p}, \mathbf{a})^{2}} .
\end{equation}

Entonces la distancia de $\mathbf{p}$ a $\ell_{a}$ es

\begin{equation}
\mathrm{d}\left(\mathbf{p}, \ell_{a}\right)=\mathrm{t} \mathrm{d}(\mathbf{p}, \mathbf{a})=\frac{\mathrm{r}^{2}}{\mathrm{~d}(\mathbf{p}, \mathbf{a})}=\left(\frac{\mathrm{r}}{\mathrm{d}(\mathbf{p}, \mathbf{a})}\right) \mathrm{r}
\end{equation}

y tenemos lo primero que queríamos probar: si $\mathrm{d}(\mathbf{p}, \boldsymbol{a})<\mathrm{r}$ entonces $\mathrm{d}\left(\mathbf{p}, \ell_{\mathbf{a}}\right)>\mathrm{r}$; y al revés, si $\mathrm{d}(\mathbf{p}, \mathbf{a})>\mathrm{r}$ entonces $\mathrm{d}\left(\mathbf{p}, \ell_{\mathbf{a}}\right)<\mathrm{r}$. Dicho de otra manera, si el punto $\mathbf{a}$ está muy cerca de $\mathbf{p}$, su polar está muy lejos, y al revés, sus distancias al centro $\mathbf{p}$ se comportan como inversos «alrededor de r».

Para demostrar la segunda de nuestras afirmaciones, supongamos ahora que $\mathrm{d}(\mathbf{p}, \mathbf{a})>\mathrm{r}$, y sea $\mathbf{c}$ un punto en $\ell_{a} \cap \mathcal{C}$ (que sabemos que existe pues $\ell_{a}$ pasa por el interior de $\mathcal{C}$). Puesto que $\mathbf{c} \in \ell_{\mathrm{a}}$, se cumple la ecuación

\begin{equation}
(\mathbf{c}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})=\mathbf{r}^{2}
\end{equation}

Pero entonces $\mathbf{a}$ cumple la ecuación de $\ell_{c}$ que es la tangente a $\mathcal{C}$ en $\mathbf{c}$; es decir, la línea de $\mathbf{a}$ a $\mathbf{c}$ es tangente al círculo. Este argumento, visto de una forma todavía más general nos dice que para cualesquiera dos puntos $\mathbf{a}$ y $\mathbf{b}$ (distintos de $\mathbf{p}$) se tiene que

\begin{equation}
a \in \ell_{b} \Leftrightarrow \mathbf{b} \in \ell_{a}
\end{equation}

Y los puntos del círculo son los únicos para los cuales se cumple que $\mathbf{a} \in \ell_{a}$. Puedes apoyarte en la siguiente figura para seguir el desarrollo anterior.

Date cuenta cómo a lo largo de este procedimiento sin querer aprendimos a calcular los puntos de tangencia a un círculo desde un punto exterior $\mathbf{a}$. A saber, de la ecuación lineal de su polar, $\ell_{a}$, se despeja alguna de las dos variables y se sustituye en la ecuación del círculo. Esto nos da una ecuación de segundo grado en la otra variable que se puede resolver, y nos da dos raíces. Sustituyéndolas de nuevo en la ecuación de la polar se obtiene el otro par de coordenadas.

Para dejar bien claro este procedimiento, hagamos un ejercicio sobre cómo encontrar los puntos de tangencia desde un punto fuera de la circunferencia.

Ejemplo. Supongamos que tenemos un círculo con centro en $(3,-1)$ y radio $2$, encontraremos los puntos de tangencia desde el punto $\mathbf{a}=(1,3)$.

Podemos iniciar de dos maneras diferentes: la primera es utilizando lo que aprendimos en la entrada anterior, escribiendo directamente la ecuación vectorial de la circunferencia. Si hacemos esto, encontraremos que la circunferencia tiene la siguiente expresión vectorial

\begin{equation}
((x, y)-(3,-1)) \cdot((x, y)-(3,-1))=4 .
\end{equation}

Otra alternativa sería primero escribir la ecuación cartesiana y luego desarrollarla para pasarla a su forma vectorial; de ambas maneras, lo importante es escribir a la circunferencia en su forma vectorial. Ahora, para conocer los puntos de tangencia desde $\mathbf{a}=(1,3)$ sustituimos en la forma alternativa de la ecuación de la tangente:

$$((x, y)-(3,-1)) \cdot((1,3)-(3,-1))=4$$
$$(x-3, y+1) \cdot(-2,4)=4$$
$$-2 x+4 y+10=4$$
$$x-2 y=3 .$$

De aquí, para encontrar $\ell_{a} \cap \mathcal{C}$, conviene sustituir $x=3+2 y$ en la ecuación original del círculo para obtener

\begin{equation}
\begin{aligned}
(3+2 y)^{2}+y^{2}-6(3+2 y)+2 y &=-6 \
5 y^{2}+2 y-3 &=0
\end{aligned}
\end{equation}

Las raíces de esta ecuación cuadrática se pueden obtener utilizando la fórmula general:

\begin{equation}
y=\frac{-2 \pm \sqrt{4+60}}{10}=\frac{-2 \pm 8}{10}
\end{equation}

que nos da los valores $y_{0}=-1$ y $y_{1}=\frac{3}{5}$. Y estos, al sustituir de nuevo la ecuación de la polar nos dan los puntos de tangencia de $\mathbf{a}$; que son $(1,-1)$ y $\frac{1}{5}(21,3)$. Puedes verificar que satisfacen la ecuación del círculo sustituyendo en la ecuación lineal de la polar, y que efectivamente sus tangentes pasan por $\mathbf{a}$.

Para finalizar esta entrada te invito a que experimentes un momento con el recuadro interactivo. Nota cómo las líneas polares se convierten en las líneas tangentes cuando haces que el punto $\mathbf{a}$ esté sobre la circunferencia.

Más adelante…

En esta entrada finalizamos nuestra discusión de las circunferencias; la primera de las secciones cónicas que abordamos en nuestro curso. En la siguiente entrada podrás ver una serie de ejercicios para familiarizarte con la manipulación algébrica o vectorial de los conceptos que hemos introducido hasta ahora. En las siguientes entradas continuaremos nuestro estudio de las secciones cónicas hablando de parábolas, hipérbolas y elipses. Veremos cómo no es tan fácil dar una ecuación vectorial para el resto de las secciones cónicas; esto lo entenderemos tan pronto como empecemos a hablar de parábolas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra los puntos de tangencia: al círculo $x^{2}-2 x+y^{2}-4 y=-3$ desde el punto $(-1,2)$. Sugerencia: puedes consultar el segundo ejercicio realizado en esta entrada.
  • Demuestra que si $\mathbf{c}$ es un punto exterior (al círculo $\mathcal{C}$ con centro $P$ ) entonces su recta a $P$ biseca sus dos tangentes a $\mathcal{C}$. Y además que las distancias a sus pies en $\mathcal{C}$ (es decir, a los puntos de tangencia) son iguales. Sugerencia: Puedes utilizar la siguiente figura para tu demostración y pensar en el teorema de Pitágoras y en el criterio de congruencia LLL.

Entradas relacionadas

Geometría Analítica I: Círculos

Por Héctor Morales

Introducción

En nuestra vida cotidiana podemos encontrar muchos ejemplos de circunferencias. Desde la forma de una rueda, hasta el contorno de una taza y por supuesto en muchos fenómenos físicos como la trayectoria de una partícula en un campo magnético o el movimiento de un satélite alrededor de un planeta. Esta familiaridad que tenemos con las circunferencias, hacen que ésta sea la sección cónica más fácil de reconocer, pues incluso sin estudios formales en geometría estamos familiarizados con sus propiedades.

En esta entrada del blog propondremos una definición formal para la circunferencia; partiendo de la definición de la circunferencia como lugar geométrico, llegaremos a la ecuación cartesiana con la que probablemente ya estés familiarizado. Abordaremos la ecuación vectorial del círculo y vamos a ver qué ventajas tiene sobre la ecuación cartesiana.

Ecuación cartesiana de circunferencia

Probablemente en algún curso previo de álgebra o de geometría te hayas encontrado con el círculo unitario $\mathbb{S}^{1}$, definido por la ecuación

\begin{equation}
x^{2}+y^{2}=1
\end{equation}

Para generalizar las nociones que tenemos del círculo unitario a una circunferencia arbitraria, consideremos ahora a cualquier otro círculo $\mathcal{C}$. Tiene un centro $\mathbf{p}=(h, k)$, un radio $r>0$ y es el lugar geométrico de los puntos cuya distancia a $\mathbf{p}$ es $r$. Es decir, $\mathcal{C}=\left\lbrace\mathbf{x} \in \mathbb{R}^{2} \mid d(\mathbf{x}, \mathbf{p})=r\right\rbrace$; o bien, $\mathcal{C}$ está definido por la ecuación

\begin{equation}
d(\mathbf{x}, \mathbf{p})=r.
\end{equation}

La información geométrica clave de una circunferencia son su centro y su radio. Ambos se pueden pensar en términos de sus coordenadas cartesianas, o bien como vectores.

Puesto que ambos lados de esta ecuación son positivos, es equivalente a la igualdad de sus cuadrados que en coordenadas cartesianas toma la forma

\begin{equation}
(x-h)^{2}+(y-k)^{2}=r^{2}
\end{equation}

Así, todos los círculos de $\mathbb{R}^{2}$ están determinados por una ecuación cuadrática en las variables $x$ y $y$. Cuando la ecuación tiene la forma anterior, podemos leer inmediatamente toda la información geométrica (el centro y el radio). Lamentable, la mayoría de las veces que nos encontremos con ecuaciones de circunferencias las encontraremos «disfrazadas» como

\begin{equation}
x^{2}+y^{2}-2 h x-2 k y=\left(r^{2}-h^{2}-k^{2}\right)
\end{equation}

Es fácil ver que esta forma de escribir la circunferencia se obtiene al desarrollar la primera expresión. Veamos un ejemplo de cómo pasar una ecuación de circunferencia a su forma reducida.

Ejemplo. Consideremos la ecuación

\begin{equation}
x^{2}+y^{2}-6 x+2 y=-6 \text { . }
\end{equation}

Tenemos que determinar si la ecuación anterior define un círculo, y en caso de que así sea, qué características tiene. Lo primero que tenemos que hacer es completar los cuadrados, sumando en ambos lados las constantes que faltan

\begin{equation}
(x^{2}-6 x+9)+(y^{2}+2 y+1) =-6+9+1 \rightarrow (x-3)^{2}+(y+1)^{2} =4
\end{equation}

Claramente si desarrollamos esta última ecuación obtenemos la original. Así, podemos concluir que la ecuación define al círculo con centro en $(3,-1)$ y radio $2$.

Para terminar esta sección, puedes utilizar la ventana interactiva de GeoGebra para familiarizarte con la ecuación cartesiana de la circunferencia. Varía el radio y el centro del círculo y observa cómo cambia la ecuación. Intenta hacer una circunferencia por cada uno de los cuadrantes del plano poniendo mucha atención cómo cambian los signos dentro de los sumandos. Prueba casos límite ¿qué pasa si el radio el cero? ¿Un punto es una circunferencia?

Ecuación vectorial de circunferencia

Si nuestra ecuación cartesiana de circunferencia ya nos permitía «leer» toda la información geométrica de un círculo completando cuadrados, te puede parecer superfluo proponer una definición vectorial de la circunferencia. La motivación que tenemos para hacer esto es que una definición vectorial, al no hacer referencia a las coordenadas, tiene sentido en cualquier dimensión. Esto quiere decir que a diferencia de la ecuación cartesiana que sólo nos sirve para $\mathbb{R}^{2}$, una ecuación vectorial nos permitirá definir esferas en $\mathbb{R}^{3}$ y en dimensiones mayores.

Sin más preámbulo, diremos que el círculo $C$ con centro $\mathbf{p}$ y radio $r$ está definido por la ecuación

\begin{equation}
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{x}-\mathbf{p})=r^{2}
\end{equation}

Si tienes dificultades entendiendo por qué se utilizó el producto punto, te ayudará recordar que en la primera unidad de nuestro curso definimos la distancia euclidiana entre dos vectores (o norma) como el producto punto (o producto interior) del vector consigo mismo. En nuestro caso, sólo partimos de la definición de circunferencia como el lugar geométrico de todos los puntos que equidistan de un mismo punto y aplicamos la definición vectorial de distancia.

La ecuación, que llamaremos ecuación vectorial del círculo, se puede también reescribir como

\begin{equation}
\mathbf{x} \cdot \mathbf{x}-2 \mathbf{p} \cdot \mathbf{x}+\mathbf{p} \cdot \mathbf{p}=r^{2}
\end{equation}

Veamos un ejemplo de la ecuación vectorial del círculo para familiarizarnos con ella.

Ejemplo. Considere la circunferencia con centro en $(3,1)$ y radio $2$. Encuentre su ecuación vectorial y su ecuación cartesiana. Demuestre que ambas ecuaciones son equivalentes.

Lo primero que tenemos que hacer es obtener la ecuación vectorial de la circunferencia. Utilizando la definición que acabamos de escribir en esta entrada, podemos ver que la ecuación que buscamos es

\begin{equation}
(\mathbf{x}-(3,1)) \cdot(\mathbf{x}-(3,1))= 4
\end{equation}

También utilizando la definición para la ecuación cartesiana

\begin{equation}
(x-3)^{2}+(y-1)^{2}=4
\end{equation}

Estas dos expresiones, son las ecuaciones que buscamos. Sólo nos falta demostrar su equivalencia. Recordando las propiedades del producto punto que introducimos en la unidad anterior

\begin{equation}
\begin{array}{l}
(\mathbf{x}-(3,1)) \cdot (\mathbf{x}-(3,1)) = 4 \\
((x,y)-(3,1)) \cdot ((x,y)-(3,1)) = 4 \\
(x-3,y-1) \cdot (x-3,y-1) = 4 \\
(x-3)^{2}+(y-1)^{2}=4
\end{array}
\end{equation}

¡Listo! Ya nos convencimos que la ecuación cartesiana y la ecuación vectorial son equivalentes cuando estamos trabajando en $\mathbb{R}^{2}$. Por el momento, conservemos la idea de que la ecuación vectorial es un poco más general y de ella se puede extraer mucha información geométrica interesante.

Para finalizar esta sección, utiliza el siguiente recuadro interactivo para familiarizarte con la ecuación vectorial del círculo. Manipula el centro y el radio para ver cómo se reescribe la ecuación y entiende muy bien cómo el producto punto es la operación clave de la definición. ¿Puedes encontrar los parámetros adecuados para hacer que en ambos interactivos tengamos círculos equivalentes con diferentes formas de escribir la ecuación?

Más adelante…

En esta entrada discutimos detalladamente las definiciones cartesianas y vectorial de la circunferencia, propusimos algunos ejemplos para familiarizarnos con estas expresiones y aprendimos a «leer» la información geométrica que guardan. Sin embargo, no hemos acabado nuestro estudio de las circunferencias. En las siguientes entradas abordaremos el tema de las rectas tangentes y polares y resolveremos algunos ejercicios relacionados a estas secciones cónicas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • ¿Cuáles de las siguientes ecuaciones son ecuaciones de un círculo? Y en su caso, ¿de cuál?

\begin{equation}
\begin{array}{l}
x^{2}-6 x+y^{2}-4 y=12 \\
x^{2}+4 x+y^{2}+2 y=11 \\
2 x^{2}+8 x+2 y^{2}-4 y=-8 \\
x^{2}-4 x+y^{2}-2 y=-6 \\
4 x^{2}+4 x+y^{2}-2 y=4
\end{array}
\end{equation}

  • ¿Cuál es el lugar geométrico de los centros de los círculos que pasan por dos puntos (distintos) $a$ y $b$? Sugerencia: considera la definición geométrica de la circunferencia como el conjunto de puntos que equidistan de un centro y ten en cuenta la definición vectorial de la mediatriz.
  • Sean $p$ y $q$ dos puntos distintos en el plano. ¿Para cuáles números reales $c$, se tiene que la siguiente ecuación define un círculo? En su caso, ¿cuál es el radio y dónde está su centro?

\begin{equation}
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{x}-\mathbf{q})=c
\end{equation}

  • Determinar la ecuación, centro y radio de la circunferencia que pasa por los tres puntos $A(-1,1)$, $B(3,5)$ y $C(5,-3)$. Sugerencia: considera que la ecuación buscada tiene la forma $x^2 + y^2 + Dx+ Ey + F= 0$, luego sustituye la información que te ofrece el problema para llegar a un sistema de ecuaciones y resuelvelo.

Entradas relacionadas

Álgebra Superior II: El principio del buen orden

Por Roberto Manríquez Castillo

Introducción

En la entrada pasada definimos una relación de orden en el conjunto de números naturales, más aun, probamos algunas propiedades de esta nueva relación, de las cuales, la más importante fue que este orden era un orden total. Ya en los ejercicios morales, vimos que podíamos restringir esta relación a cualquier número natural $n$ para definir un orden en los conjuntos con $n$ elementos.

En esta entrada definiremos una de las propiedades más importantes del orden en los naturales: el principio de buena ordenación, veremos que en cierto sentido es equivalente al principio de inducción, y daremos una breve presentación a algunos otros conjuntos que en este sentido se comportan de forma similar a los naturales.

La propiedad de buena ordenación

Pensemos en un número natural $n\neq 0$ con el orden que este hereda de $\mathbb{N}$, abusando de la notación, podemos escribir de forma ordenada a $n$ como $\{0<1<…<n-1\}$, parece ser que no habrá muchas sorpresas a la hora de estudiar a los números como conjuntos ordenados. Sin embargo, vale la pena notar que debido a lo que probamos en la sección de El tamaño de los naturales, cualquier subconjunto $A$ de $n$ será finito. Gracias a esto, y a que demostramos que el orden es total, podemos comparar todos los elementos de $A$ y fijarnos en el menor de todos ellos. Antes de formalizar esta prueba, recordaremos qué significa que un elemento de un conjunto sea mínimo.

Definición. Si $A$ es un conjunto ordenado por $\leq$, decimos que $a_0\in A$ es un elemento mínimo, si para todo $a\in A$ se tiene que $a_0\leq a$.

Ahora sí, enunciamos y demostramos nuestro primer teorema.

Teorema. Si $n\neq 0$ y $A\subseteq n$ es distinto del vacío, entonces existe $a_0$ mínimo en $A$.

Demostración. El hecho de que $A$ sea un conjunto finito no necesita más demostración que la que se mencionó en el párrafo anterior. Entonces podemos proceder por inducción sobre $m=\vert A\vert$.

Como $A\neq \emptyset$ la base de inducción se probará para $m=1$. Es decir que $A=\{a\}$, evidentemente, el elemento $a$ es el mínimo de $A$.

Supongamos ahora que si un conjunto no vacío tiene $m$ elementos, entonces tiene un elemento mínimo y supongamos que $A$ es un conjunto con $\sigma(m)$ elementos. Como $A$ es no vacío, entonces podemos elegir algún $a\in A$ arbitrario, entonces el conjunto $A\setminus\{a\}$ es un conjunto con $m$ elementos, y por la hipótesis de inducción, tiene un mínimo, llamémoslo $a’$. Como el orden en $A$ es el de los naturales, y este es total, $a’$ y $a$ son comparables, llamemos $a_0$ al mínimo entre estos dos elementos y demostremos que $a_0$ es el mínimo de $A$.

Sea $x\in A$ arbitrario, si $x=a$, ya terminamos, pues por definición $a_0\leq a$, en caso contrario $x \in A\setminus\{a\}$, pero como $a’$ es el mínimo de este conjunto, entonces $a’\leq x$, y como $a_0\leq a’$, por transitividad concluimos que $a_0\leq x$, por lo que $A$ sí tiene mínimo.

$\square$

Como mencionamos antes, la propiedad de que todos los subconjuntos de un conjunto arbitrario tengan mínimo elemento es importante, por lo que damos la siguiente definición.

Definición. Si $B$ es un conjunto ordenado por $\leq$, decimos que $B$ tiene la propiedad del buen orden si todo subconjunto no vacío de $B$ tiene un mínimo.

Entonces el teorema anterior puede ser reformulado como

Teorema. Si $n$ es un número natural, entonces $n$ está bien ordenado.

El conjunto de los números naturales está bien ordenado.

Un error lógico, sería asumir que por el teorema anterior, el conjunto de los números naturales también cumple la propiedad del buen orden, ya que a diferencia de cualquier número natural, en $\mathbb{N}$ existen conjuntos con una infinidad de elementos; sin embargo, aunque esta prueba no funcione, no se sigue que $\mathbb{N}$ no esté bien ordenado, es por esto que enunciamos el siguiente teorema.

Teorema. $\mathbb{N}$ satisface la propiedad del buen orden.

Demostración. Sea $A$ un subconjunto no vacío de números naturales, procedamos por contradicción, es decir, supongamos que $A$ no tiene elemento mínimo. Consideremos $B=\{n\in\mathbb{N}\mid m\leq n \Rightarrow m\notin A\}$, veamos que B es inductivo.

Evidentemente $0$ está en $B$, porque si no, existiría $m\leq 0$ tal que $m\in A$, como el único natural menor o igual a $0$ es $0$, tenemos que $0\in A$, pero entonces, $0$ sería un mínimo de $A$, ya que es menor o igual a todo natural.

Supongamos entonces que $n\in B$ y demostremos que $\sigma(n)\in B$, supongamos que no, entonces existirá $m\leq\sigma(n)$, tal que $m\in A$, como $m\in A$, por la definición de $B$, debe ocurrir que $n<m$ y por uno de los resultados de la entrada pasada, tenemos que $\sigma(n) \leq m$, por la antisimetría del orden, tenemos que $m=\sigma(n)$.

De nuevo usemos reducción al absurdo para probar que $\sigma(m)$ es un mínimo de $A$, si no lo fuera, existiría $a \in A$ tal que es falso que $\sigma(n)\leq a$, esto implicaría que es falso que $n<a$, es decir que $a\leq n$ y como $n\in B$, esto implicaría que $a\notin A $ lo cual es absurdo, entonces $\sigma(n)$ sí es un mínimo de $A$, pero de nuevo, esto es contradictorio con la suposición de que $A$ no tenía elemento mínimo, esta contradicción se deriva de suponer que $\sigma(n)\notin B$, entonces $\sigma(n)\in B$, por lo que el paso inductivo queda probado y $B=\mathbb{N}$.

Como $B=\mathbb{N}$, debe ocurrir que $A= \emptyset$ ya que si $a\in A$, como $a\leq \sigma(a)$, por la definición de $B$ debería pasar que $\sigma(a)\notin B$, contradiciendo que $B=\mathbb{N}$, pero desde un inicio, supusimos que $A\neq \emptyset$, esto quiere decir que suponer que $A$ no tiene mínimo es absurdo. Entonces, concluimos que $A$ sí debe de tener un elemento mínimo.

$\square$

El principio de inducción y el principio del buen orden

La idea de una prueba más corta de este resultado se da en los ejercicios morales; sin embargo, damos esta prueba para ver como el principio de inducción prueba el del buen orden. De forma análoga podemos demostrar el principio de inducción a partir del principio del buen orden.

Teorema. Supongamos cierto que $\mathbb{N}$ satisface la propiedad del buen orden, entonces, el principio de inducción también es cierto.

Demostración. Sea $A$ un conjunto inductivo, debemos de demostrar que $A=\mathbb{N}$, supongamos que no lo es, entonces $\mathbb{N}\setminus A\neq\emptyset$, por lo que, por el principio del buen orden, este conjunto tiene un elemento mínimo, sea $n$ el mínimo. Como $A$ es inductivo, $0\in A$. por lo que $n\neq 0$, entonces existe un $m$ tal que $\sigma(m)=n$, como $n$ es el mínimo, de $\mathbb{N}\setminus A$, tenemos que $m\notin \mathbb{N}\setminus A$, por lo que $m\in A$, pero como $A$ es inductivo, $\sigma(m)=n\in A$, lo cual es una contradicción, entonces, $A=\mathbb{N}$.

$\square$

En $\mathbb{N}$, existe otra formulación equivalente al principio de inducción, llamado principio de inducción fuerte, y dice que

Teorema. Si $A$ es un conjunto tal que:

  • $0\in A$.
  • Es cierto que si $n\in A$ y para todo $m\leq n$, se tiene que también $m\in A$ entonces $\sigma(n)\in A$.

Entonces $A=\mathbb{N}$.

Los detalles de la prueba se mencionan en uno de los ejercicios morales.

Conjuntos bien ordenados

Antes de estudiar otros conjuntos bien ordenados damos la siguiente proposición elemental.

Teorema. Si $A$ es un conjunto bien ordenado por $\leq$, entonces $A$ es un orden lineal.

Demostración. Sean $a,b\in A$, consideremos el conjunto $\{a,b\}\subset A$, como $A$ es un buen orden, entonces, este subconjunto tiene un elemento mínimo, es decir que $a\leq b$ ó $b\leq a$, esto quiere decir que los elementos son comparables.

$\square$

Hemos demostrado que todo número natural y el conjunto de los naturales, tienen un buen orden natural, una pregunta natural es si estos son los únicos conjuntos bien ordenados, la respuesta es que no; sin embargo hay varias cosas que analizar.

Lo primero que mencionaremos, es que todo conjunto finito $A$ y linealmente ordenado, satisface la propiedad del buen orden y más aun, se puede probar que si $\vert A\vert=n$, entonces el orden de $A$ y de $n$ son indistinguibles, detallamos esta afirmación en uno de los problemas de la tarea moral.

El caso infinito es más complicado, ya que existen muchos conjuntos numerables que pueden ordenarse de forma distinta a $\mathbb{N}$ y aun así tener la propiedad del buen orden, en realidad, es muy sencillo construirlos, como mencionamos en el siguiente teorema.

Teorema. Si $A$ es un conjunto bien ordenado bajo $\leq$, entonces $\sigma(A)$ es un conjunto bien ordenado con el orden $\leq’=\leq\cup\bigcup_{a\in \sigma(A)}(a,A)$.

Demostración. El hecho de que $\leq’$ es un orden, será un ejercicio moral, veamos que $\leq’$ está bien ordenado. Sea $B\subseteq \sigma(A)$ distinto del vacío, entonces debemos encontrar un elemento mínimo para $B$. Si $B=\{A\}$ el resultado es trivial.

Entonces supongamos que $B\neq\{A\}$ y consideremos $B\setminus \{A\}\subseteq A$, el cual es distinto del vacío. Como $A$ es un buen orden, entonces, existe $b$ elemento mínimo para este conjunto, afirmamos que $b$ también es un elemento mínimo para $B$. Para ver esto, sea $b’\in B$, si $b’\in B\setminus \{A\}\subseteq A$ el resultado se sigue de la definición de $b$, mientras que si $b’=A$, tenemos que $b’\leq A$ ya que por definición $(b’,A)\in \leq’$. Con esto finaliza la prueba.

$\square$

Aplicando el teorema anterior a $\mathbb{N}$, tenemos que $\mathbb{N}\cup\{\mathbb{N}\}$ es un buen orden con $\leq$ definido como $a\leq b$ si y solo si $a\in b$ o $a=b$, sin embargo, a diferencia de $\mathbb{N}$, este conjunto tiene un máximo, dígase $\mathbb{N}$ (ahora visto como elemento).

Otra cosa curiosa que podemos notar del conjunto $\sigma(\mathbb{N})$ es que aunque el principio del buen orden es válido, el principio de inducción no lo es, a diferencia de como pasaba en $\mathbb{N}$, en realidad, esta no es la única propiedad que perdemos, por ejemplo, en $\sigma(\mathbb{N})$, el cero no es el único elemento sin un antecesor, en realidad, esta es una de las razones por las que la prueba del principio de inducción a partir del principio del buen orden no es válida para este conjunto.

El estudio de los buenos ordenes es importante en Teoría de conjuntos y está muy relacionada con la teoría de conjuntos transitivos.

Más adelante…

Ya que hemos estudiado la propiedad más importante del orden en los naturales. solo falta ver como es que esta propiedad se relaciona con las operaciones que definimos, los resultados vistos en esta sección y en la siguiente, serán muy importantes en los siguientes temas que desarrollemos, ya que serán la base de muchos resultados, sobre todo al ver los resultados de la teoría de números en $\mathbb{Z}$, donde el orden, la inducción y el buen orden tendrán papeles fundamentales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Si $A$ es un conjunto con $n$ elementos, y $\leq_A$ es un orden total en $A$, demuestra que existe una función $f:n \longrightarrow A$ tal que $n\leq m \Leftrightarrow f(n)\leq_A f(m)$. Sugerencia: Usa inducción sobre $n$ y después el principio del buen orden.
  2. Prueba el principio del buen orden a partir del axioma de regularidad y de la definición de $<$. Sugerencia: recuerda que el axioma de regularidad prohíbe la existencia de sucesiones infinitas de conjuntos tales que $…\in a_2\in a_1\in a_0$.
  3. Demuestra que en $\mathbb{N}$, el principio de inducción fuerte es equivalente al principio de inducción. Sugerencia: Prueba el principio de inducción fuerte a partir del débil, y el principio del buen orden a partir del fuerte.
  4. Usando la notación del último teorema, demuestra que $\leq’$ sí define una relación de orden en $\sigma(A)$.
  5. Si $A$ es un conjunto bien ordenado e infinito con $a_0$ elemento mínimo, prueba que existe una función $f:\mathbb{N}\longrightarrow A$ tal que $f(0)= a_0$ y si $n\leq m$ entonces $f(n)\leq f(m)$. Sugerencia: Usa la técnica que se ocupó a la hora de demostrar que los naturales son el conjunto infinito más pequeño.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: La relación de orden en los naturales

Por Roberto Manríquez Castillo

Introducción

Seguramente desde que construimos de forma intuitiva el conjunto de números naturales, te diste cuenta de que nuestra forma de generar nuevos números a través de la función sucesor, nos daba una jerarquía de qué número natural iba primero, y quien era el que inmediatamente le seguía. Así, el primer natural debería de ser el $0$, el cual debería ser menor a todos los demás. Después, seguiría $\sigma(0)=1$ el cual debería ser menor al sucesor de cualquier otro número. Este razonamiento podría seguir de forma inductiva para los demás números.

En esta entrada abordaremos el problema de cómo organizar el conjunto de naturales. Hay varias formas de definir esta relación. Pero el trabajo que realizamos en las dos entradas pasadas nos permitirá atacar dos problemas de manera sencilla: el de definir el orden en $\mathbb{N}$ y el de demostrar sus propiedades.

El orden parcial en $\mathbb{N}$

Recordemos que si $n$ es un número natural distinto de cero, entonces $n=\{0,1,…,n-1\}$. Entonces de forma intuitiva podemos afirmar que cada número natural tienen por elementos a todos los naturales «menores» a él. Usando esta idea, podemos dar las siguientes dos definiciones.

Definición. Si $n,m\in \mathbb{N}$, decimos que $n$ es menor que $m$, en símbolos, $n<m$ si $n\in m$.

Definición. Si $n,m\in \mathbb{N}$, decimos que $n$ es menor o igual que $m$, en símbolos $n\leq m$ si $n\in m$ o $n=m$.

Antes de lanzarnos a probar propiedades de estas relaciones, comenzaremos con verificar la segunda de ellas define un orden parcial.

Teorema. La relación $\leq$ es un orden parcial en $\mathbb{N}$.

Demostración. Recordemos que según la definición de orden parcial, debemos probar que $\leq$ es reflexiva, transitiva y antisimétrica, hagamos esto por pasos.

$\leq$ es reflexiva: Si $m$ es un natural, tenemos que $m=m$, por lo que por nuestra definición, podemos escribir que $m\leq m$.

$\leq$ es transitiva: Sean $n,m,l$ naturales tales que $n\leq m$ y $m\leq l$. Debemos demostrar que $n\leq l$. Si $n=m$ o $m=l$ la conclusión es inmediata de las hipótesis. En otro caso, tenemos que que $n\in m$ y $m\in l$. Como $l$ es un número natural, es un conjunto transitivo, entonces $n\in l$, por lo que $n\leq l$.

$\leq$ es antisimétrica: Si $n,m$ son naturales tales que $n\leq m$ y $m\leq n$, debemos demostrar que $n=m$. Para ver esto, procedamos por contradicción. Supongamos que no son iguales, entonces $n\in m$ y $m\in n$. Pero como ya hemos mencionado anteriormente, el hecho de que dos conjuntos pertenezcan mutuamente al otro es contradictorio con el axioma de regularidad. Entonces debe suceder que $n=m$ como queríamos.

$\square$

Propiedades del orden en los naturales

Ya mostramos que $\leq$ es un orden parcial en $\mathbb{N}$. Probemos otras propiedades que esperamos que satisfaga. Empezamos con la que mencionamos en la introducción de la entrada.

Teorema. $0\leq n$ para todo natural $n$

Demostración. Si $n=0$, el resultado se sigue de manera automática. Si $n\neq 0$, el resultado se sigue de que ya demostramos que $0$ está en cada natural distinto de $0$.

$\square$

La siguiente propiedad que probaremos es que la función sucesor sí preserva el orden que definimos.

Teorema. Si $n,m\in\mathbb{N}$ y $n<m$, entonces $\sigma(n)<\sigma(m)$

Demostración. Procedamos por inducción sobre $m$. Para el caso base debemos probar que la afirmación $n<0\Rightarrow\sigma(n)<0$, es verdadera. Sin embargo, el antecedente siempre es falso, ya que $n<0$ quiere decir que $n\in\emptyset$ lo cual es absurdo. Como el antecedente siempre es falso, entonces la base de inducción es verdadera.

Supongamos que para alguna $m$ se tiene que si $n<m$, entonces $\sigma(n)< \sigma(m)$. Debemos probar que el resultado es cierto para $\sigma(m)$. Supongamos entonces que $n<\sigma(m)$. Debemos probar que $\sigma(n)<\sigma( \sigma(m))$.

Como $n<\sigma(m)$, tenemos que $n\in \sigma(m)=m\cup \{m\}$, así que tenemos dos casos: $n\in m$ o $n\in\{m\}$.

Si $n\in m$, por hipótesis inductiva $\sigma(n)\in \sigma(m)$. Como $\sigma(m)\in \sigma(\sigma(m))$ y los naturales son transitivos, tenemos $\sigma(n)\in \sigma(\sigma(m))$, es decir, $\sigma(n)< \sigma(\sigma(m))$, como queríamos.

Finalmente, si $n\in \{m\}$, entonces $n=m$, pero así $\sigma(n)=\sigma(n)\in \sigma(\sigma(m))$, de modo que $\sigma(n)<\sigma(\sigma(m))$, como queríamos.

$\square$

El orden en los naturales es total

De entre los órdenes parciales hay un tipo de órdenes especiales: aquellos en los que cualesquiera dos elementos se pueden comparar. A estos se les conoce como órdenes totales. Los resultados de esta sección muestran que la relación $\leq$ en $\mathbb{N}$ es un orden total.

Un paso intermedio para demostrar esto es ver que si un número natural es menor que otro, entonces la función sucesor «no nos puede llevar muy lejos».

Teorema. Si $n,m$ son naturales tales que $m<n$, entonces se tiene que $\sigma(m)\leq n$.

Demostración. La hipótesis es imposible cuando $n=0$, pues no hay ningún natural menor a cero. Así, $n$ debe ser sucesor de algún otro natural, digamos $n=\sigma(k)$.

De $m<\sigma(k)$ tenemos que $m\in k\cup \{k\}$, así que $m\in k$, o $m=k$. Si $m\in k$, entonces $m<k$ y por el teorema anterior tenemos que $\sigma(m)<\sigma(k)=n$. Si $m=k$, entonces $\sigma(m)=\sigma(k)=n$. En cualquier caso tenemos $\sigma(m)\leq n$.

$\square$

El anterior teorema es equivalente a la afirmación siguiente.

Corolario. Si $n,m\in\mathbb{N}$, son tales que $m<n$ pero es falso que $\sigma(m)< n$, entonces $\sigma(m)=n$.

En estos momentos es conveniente regresar a leer las dos pruebas de los teoremas anteriores, y notar que en las demostraciones, cuando suponíamos que era falso que $n<m$ nunca supusimos que $n\geq m$. Sólo apelábamos directamente a la negación de la definición. Haber usado $n\geq m$ hubiera sido un error. En primer lugar, porque aún no hemos definido el símbolo $\geq$. Y en segundo lugar, porque aún no hemos descartado una cuarta posibilidad: que $n$ y $m$ no sean comparables. En realidad esto es imposible, pero hay que demostrarlo. En $\mathbb{N}$ el orden es total y de hecho satisface la propiedad de tricotomía que enunciamos a continuación.

Teorema. Para cualesquiera $n$ y $m$ naturales se cumple una y sólo una de las siguientes afirmaciones

  • $n=m$
  • $n< m$
  • $m< n$

Demostración. Ya hemos demostrado mediante el axioma de regularidad que estas proposiciones son mutuamente excluyentes. Sólo queda demostrar que siempre sucede por lo menos una de ellas. Demostraremos esto por inducción sobre $n$.

El caso base se reduce a probar que para cualquier $m$, se tiene que $0=m$, $0\in m$ o $m\in 0$. El primer teorema que probamos muestra que siempre se da la primera o la segunda opción.

Supongamos ahora que el resultado es cierto para alguna $n$. Debemos probarlo para $\sigma(n)$. Entonces sea $m\in\mathbb{N}$ arbitrario. Por hipótesis de inducción, $m$ es comparable con $n$, entonces podemos considerar tres casos:

$m=n$. Este caso es trivial porque entonces $m\in\sigma(n)$.

$m< n$. De nuevo tenemos que $m\in n\in \sigma(n)$, y por transitividad (del orden o de los conjuntos), tenemos que $m\in\sigma(n)$.

$n< m$. Por el teorema anterior, tenemos que en este caso, $\sigma(n)<m$ ó $\sigma(n)=m$.

De cualquier forma $\sigma(n)$ y $m$ son comparables. Esto termina la demostración.

$\square$

Para finalizar, hacemos la observación de que definir los símbolos $>$ y $\geq$ en $\mathbb{N}$ es sencillo. Simplemente, diremos que $n\geq m$ cuando $m\leq n$. Así mismo, diremos que $n>m$ cuando $m<n$.

Más adelante…

Ya empezamos a probar las propiedades del orden en $\mathbb{N}$. Sin embargo, falta ver una de las más importantes: el principio del buen orden. Esta lo veremos en la entrada siguiente. También veremos que, en cierto sentido, es equivalente al principio de inducción.

Otra cosa más que falta es ver que el orden que definimos «se comporta bien» con las operaciones de suma y producto en $\mathbb{N}$. Esto resultará de suma importancia para entradas posteriores.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $n\leq m$, entonces $n<\sigma(m)$.
  2. Prueba que $n\leq m$ si y sólo si $n\subseteq m$.
  3. Generaliza el teorema de que $\in$ define un orden en $\mathbb{N}$, a que $\in$ define un orden en cualquier conjunto transitivo.
  4. Demuestra que $\leq$, restringido a $n \times n$ es un orden total en el conjunto $n$.
  5. Encuentra un conjunto $A$ con tantos elementos como números naturales y una forma de ordenarlo linealmente, tal que $A$ tiene elemento máximo.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»