Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Geometría Analítica I: Forma vectorial de círculos, tangentes y polares

Por Héctor Morales

Introducción

En la entrada anterior construimos un puente entre la intuición que tenemos de las circunferencias y el estudio formal que podemos hacer de ellas utilizando las herramientas de la geometría analítica. Ahora queremos ir más allá de las propiedades básicas del círculo, como lo son su centro y su radio, para abordar propiedades un poco más avanzadas; sus rectas tangentes y polares.

Veremos a lo largo de esta entrada cómo la ecuación vectorial de la circunferencia nos prueba su utilidad al abordar problemas geométricos tales como encontrar puntos de tangencia sobre una circunferencia, hacer demostraciones que involucren las secantes de un círculo, entre otros.

Líneas tangentes a un círculo

Antes de abordar el tema de las líneas tangentes a un círculo, mencionaremos brevemente un problema físico que nos puede motivar a estudiarlo. El problema de la polea consiste en encontrar la longitud de un cable que conecta a dos circunferencias de radio $r_1$ y $r_2$ que no se cruzan; cuyos centros están separados por una distancia $P$. Aunque sea un problema en apariencia sencillo su solución requiere de herramientas como líneas bitangentes, ángulos verticales y congruencia. Pese a que la su solución no es trivial, es un problema de ingeniería bastante importante, pues se usa en el diseño de aeroplanos, bicicletas, autos, etc. No escribiremos explícitamente la solución a este problema, por el momento sólo diremos que para resolverlo es fundamental utilizar el concepto de línea tangente.

Problema de la polea

Ahora que comentamos una motivación, empezaremos a discutir el concepto de línea tangente. Intuitivamente podemos pensar que las líneas tangentes son las que tocan a una circunferencia en uno solo de sus puntos. Esto tiene varias implicaciones; la primera de ellas es que podemos pensar en las tangentes como las normales a los radios (los segmentos del centro a sus puntos). Empezaremos proponiendo la definición de las líneas tangentes y haremos una discusión detallada de cada uno de los elementos de esta definición.

Definición. Si $\mathbf{a}$ es un punto del círculo $\mathcal{C}$ dado por la ecuación vectorial

\begin{equation}
(\boldsymbol{x}-\mathbf{p}) \cdot(\boldsymbol{x}-\mathbf{p})=\mathrm{r}^{2}
\end{equation}

entonces su línea tangente es la recta $\ell$ normal a $(\mathbf{a} – \mathbf{p})$ y que pasa por $\mathbf{a}$.

Esta definición tiene algunas implicaciones interesantes que para los elementos que la constituyen que vale la pena observar con detalle. La primera es que, puesto que $\mathbf{a}$ es el punto más cercano a $\mathbf{p}$ en esta recta, para cualquier otro punto $x \in \ell$ se tiene que $\mathrm{d}(\boldsymbol{x}, \mathbf{p})>\mathrm{r}$. Dicho de una forma más sencilla: cualquier otro punto que no sea el punto de tangencia estará alejado del centro del círculo una distancia mayor que el radio. Puedes observar la figura para convencerte de este hecho.

Línea tangete del círculo y punto de tangencia.

Continuando nuestra exploración de los elementos de la definición que acabamos de presentar, observa que el círculo $\mathcal{C}$ parte el plano en dos pedazos; el interior donde $\mathrm{d}(\boldsymbol{x}, \mathbf{p})<\mathrm{r}$, y el exterior donde $\mathrm{d}(\boldsymbol{x}, \mathbf{p})>\mathrm{r}$, de esta forma $\ell$ está contenida en el exterior salvo por el punto $a \in \mathcal{C}$.

Para obtener una expresión analítica de las líneas tangentes conviene recordar las herramientas vectoriales que fueron presentadas durante la primera unidad, te podrás dar cuenta que si utilizamos la forma de la ecuación normal de recta con los elementos de nuestra definición, podemos ver que la recta $\ell$ está dada por la ecuación

\begin{equation}
\boldsymbol{x} \cdot(\boldsymbol{a}-\mathbf{p})=\boldsymbol{a} \cdot(\boldsymbol{a}-\mathbf{p}),
\end{equation}

esta ecuación tiene una manera más interesante de escribirse; si restamos $\mathbf{p} \cdot(\mathbf{a}-\mathbf{p})$ a ambos lados, se obtiene:

$$
\mathbf{x} \cdot(\mathbf{a}-\mathbf{p})-\mathbf{p} \cdot(\mathbf{a}-\mathbf{p})=\mathbf{a} \cdot(\mathbf{a}-\mathbf{p})-\mathbf{p} \cdot(\mathbf{a}-\mathbf{p})
$$

$$
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})=(\mathbf{a}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})
$$

$$
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})=r^{2}
$$

Esta forma de escribir la ecuación será importante en la siguiente sección cuando abordemos las rectas polares, sin embargo, antes de pasar a la siguiente sección hagamos un ejemplo sobre cómo encontrar la tangente de una circunferencia.

Ejemplo. Supongamos que tenemos un círculo con centro en $(4,-3)$ y radio $5$. Encuentre la línea de tangencia que pasa por el punto $(4,2)$.

Primero tenemos que verificar que el punto está dentro de la circunferencia. Si escribimos la ecuación cartesiana de nuestro círculo

\begin{equation}
(x-4)^{2} + (x+3)^{2}=25
\end{equation}

y sustituimos el punto $(4,2)$. Podemos darnos cuenta que el punto sí está en la circunferencia. Como ya vimos que está sobre el círculo, sólo tenemos que sustituir en la expresión analítica de la línea tangente

\begin{equation}
\boldsymbol{x} \cdot(\boldsymbol{a}-\mathbf{p})=\boldsymbol{a} \cdot(\boldsymbol{a}-\mathbf{p})
\end{equation}

los valores del punto de tangencia y el centro de la circunferencia. Haciendo esto tenemos que:

\begin{equation}
\boldsymbol{x} \cdot ((4,2)-(4,-3)) =\boldsymbol{a} \cdot ((4,2)-(4,-3))
\end{equation}

Por lo tanto, la ecuación de la línea tangente será:

\begin{equation}
\boldsymbol{x} \cdot (0,5) =\boldsymbol{a} \cdot (0,5)
\end{equation}

Escrito en forma cartesiana, tenemos que la recta tangente a nuestra circunferencia a través de ese punto es $y=2$.

Como vimos en nuestro ejemplo, obtener la expresión analítica de la línea tangente a través de un punto es muy fácil si recordamos la definición vectorial. Para terminar esta sección utiliza el siguiente recuadro interactivo para explorar diferentes líneas tangentes de una circunferencia. Nota cómo el punto de tangencia siempre se encuentra en los «bordes» del círculo. ¿Podríamos generalizar vectorialmente el concepto de tangencia para puntos que no se encuentran sobre la circunferencia?

Líneas polares de un círculo

Para empezar nuestro estudio de las líneas polares de un círculo, recuerda el último desarrollo algebraico que hicimos en la sección anterior: ese en el cual sustituimos $\mathbf{a}$ en una de las instancias de $\mathbf{x}$ en la ecuación vectorial. Recuerda cómo en el caso de la línea tangente, consideramos que el punto $\mathbf{a}$ estaba sobre la circunferencia. Con esto en mente, estamos listos para dar una definición de línea polar.

Definición. Consideremos un punto $\mathbf{a}$ en el plano, diferente del centro $(\mathbf{a} \neq \mathbf{p})$, diremos que $\ell_{a}$ es la recta polar de $\mathbf{a}$ respecto al círculo $\mathcal{C}$ y definiremos $\ell_{a}$ como

\begin{equation}
\ell_{\mathbf{a}}: \quad(\boldsymbol{x}-\mathbf{p}) \cdot(\boldsymbol{a}-\mathbf{p})=\mathrm{r}^{2}
\end{equation}

De la definición, se sigue que cuando $\boldsymbol{a} \in \mathcal{C}$ su polar $\ell_{\mathbf{a}}$ es su tangente. Como te puedes dar cuenta, las líneas polares son algo así como una generalización de las líneas tangentes; estamos repitiendo los desarrollos algebraicos que utilizamos en la primera sección sin restringirnos a los puntos que están sobre la circunferencia. Nuestra definición de líneas polares tiene varias consecuencias interesantes; una de ellas es que si el punto $\mathbf{a}$ está en el interior del círculo, entonces $\ell_{a}$ no lo intersecta (está totalmente contenida en el exterior), y que si está en el exterior (el punto $\mathbf{b}$ en la siguiente figura), entonces lo corta, y además lo corta en los dos puntos de $\mathcal{C}$ a los cuales se pueden trazar tangentes.

Existen tres posibles casos, que el punto polar esté dentro de la circunferencia, fuera o que esté sobre ella. El último caso se exploró a detalle en la primera parte de esta entrada.

Vamos a demostrar los enunciados que presentamos en el párrafo anterior. Para esto, expresemos las ecuación $\ell_{a}$ en su forma normal; desarrollando [numero de ecuación de la definición] se obtiene:

\begin{equation}
\boldsymbol{x} \cdot(\boldsymbol{a}-\mathbf{p})=\mathrm{r}^{2}+\mathbf{p} \cdot(\boldsymbol{a}-\mathbf{p})
\end{equation}

Esto indica que $\ell_{a}$ es perpendicular al vector que va de $\mathbf{p}$ a $\mathbf{a}$. Ahora veamos cuál es su punto de intersección con la recta que pasa por $\mathbf{p}$ y $\mathbf{a}$. Parametricemos esta última recta con $\mathbf{p}$ de cero y $\mathbf{a}$ de uno (es decir como $\mathbf{p}+\mathbf{t}(\mathbf{a}-\mathbf{p})$) y podemos despejar $t$ al sustituir en la variable $\mathbf{x}$ de la ecuación anterior (o bien, esto se ve más directo al sustituir en la [numero de ecuación de la definición] ), para obtener

\begin{equation}
t=\frac{r^{2}}{(\mathbf{a}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})}=\frac{r^{2}}{d(\mathbf{p}, \mathbf{a})^{2}} .
\end{equation}

Entonces la distancia de $\mathbf{p}$ a $\ell_{a}$ es

\begin{equation}
\mathrm{d}\left(\mathbf{p}, \ell_{a}\right)=\mathrm{t} \mathrm{d}(\mathbf{p}, \mathbf{a})=\frac{\mathrm{r}^{2}}{\mathrm{~d}(\mathbf{p}, \mathbf{a})}=\left(\frac{\mathrm{r}}{\mathrm{d}(\mathbf{p}, \mathbf{a})}\right) \mathrm{r}
\end{equation}

y tenemos lo primero que queríamos probar: si $\mathrm{d}(\mathbf{p}, \boldsymbol{a})<\mathrm{r}$ entonces $\mathrm{d}\left(\mathbf{p}, \ell_{\mathbf{a}}\right)>\mathrm{r}$; y al revés, si $\mathrm{d}(\mathbf{p}, \mathbf{a})>\mathrm{r}$ entonces $\mathrm{d}\left(\mathbf{p}, \ell_{\mathbf{a}}\right)<\mathrm{r}$. Dicho de otra manera, si el punto $\mathbf{a}$ está muy cerca de $\mathbf{p}$, su polar está muy lejos, y al revés, sus distancias al centro $\mathbf{p}$ se comportan como inversos «alrededor de r».

Para demostrar la segunda de nuestras afirmaciones, supongamos ahora que $\mathrm{d}(\mathbf{p}, \mathbf{a})>\mathrm{r}$, y sea $\mathbf{c}$ un punto en $\ell_{a} \cap \mathcal{C}$ (que sabemos que existe pues $\ell_{a}$ pasa por el interior de $\mathcal{C}$). Puesto que $\mathbf{c} \in \ell_{\mathrm{a}}$, se cumple la ecuación

\begin{equation}
(\mathbf{c}-\mathbf{p}) \cdot(\mathbf{a}-\mathbf{p})=\mathbf{r}^{2}
\end{equation}

Pero entonces $\mathbf{a}$ cumple la ecuación de $\ell_{c}$ que es la tangente a $\mathcal{C}$ en $\mathbf{c}$; es decir, la línea de $\mathbf{a}$ a $\mathbf{c}$ es tangente al círculo. Este argumento, visto de una forma todavía más general nos dice que para cualesquiera dos puntos $\mathbf{a}$ y $\mathbf{b}$ (distintos de $\mathbf{p}$) se tiene que

\begin{equation}
a \in \ell_{b} \Leftrightarrow \mathbf{b} \in \ell_{a}
\end{equation}

Y los puntos del círculo son los únicos para los cuales se cumple que $\mathbf{a} \in \ell_{a}$. Puedes apoyarte en la siguiente figura para seguir el desarrollo anterior.

Date cuenta cómo a lo largo de este procedimiento sin querer aprendimos a calcular los puntos de tangencia a un círculo desde un punto exterior $\mathbf{a}$. A saber, de la ecuación lineal de su polar, $\ell_{a}$, se despeja alguna de las dos variables y se sustituye en la ecuación del círculo. Esto nos da una ecuación de segundo grado en la otra variable que se puede resolver, y nos da dos raíces. Sustituyéndolas de nuevo en la ecuación de la polar se obtiene el otro par de coordenadas.

Para dejar bien claro este procedimiento, hagamos un ejercicio sobre cómo encontrar los puntos de tangencia desde un punto fuera de la circunferencia.

Ejemplo. Supongamos que tenemos un círculo con centro en $(3,-1)$ y radio $2$, encontraremos los puntos de tangencia desde el punto $\mathbf{a}=(1,3)$.

Podemos iniciar de dos maneras diferentes: la primera es utilizando lo que aprendimos en la entrada anterior, escribiendo directamente la ecuación vectorial de la circunferencia. Si hacemos esto, encontraremos que la circunferencia tiene la siguiente expresión vectorial

\begin{equation}
((x, y)-(3,-1)) \cdot((x, y)-(3,-1))=4 .
\end{equation}

Otra alternativa sería primero escribir la ecuación cartesiana y luego desarrollarla para pasarla a su forma vectorial; de ambas maneras, lo importante es escribir a la circunferencia en su forma vectorial. Ahora, para conocer los puntos de tangencia desde $\mathbf{a}=(1,3)$ sustituimos en la forma alternativa de la ecuación de la tangente:

$$((x, y)-(3,-1)) \cdot((1,3)-(3,-1))=4$$
$$(x-3, y+1) \cdot(-2,4)=4$$
$$-2 x+4 y+10=4$$
$$x-2 y=3 .$$

De aquí, para encontrar $\ell_{a} \cap \mathcal{C}$, conviene sustituir $x=3+2 y$ en la ecuación original del círculo para obtener

\begin{equation}
\begin{aligned}
(3+2 y)^{2}+y^{2}-6(3+2 y)+2 y &=-6 \
5 y^{2}+2 y-3 &=0
\end{aligned}
\end{equation}

Las raíces de esta ecuación cuadrática se pueden obtener utilizando la fórmula general:

\begin{equation}
y=\frac{-2 \pm \sqrt{4+60}}{10}=\frac{-2 \pm 8}{10}
\end{equation}

que nos da los valores $y_{0}=-1$ y $y_{1}=\frac{3}{5}$. Y estos, al sustituir de nuevo la ecuación de la polar nos dan los puntos de tangencia de $\mathbf{a}$; que son $(1,-1)$ y $\frac{1}{5}(21,3)$. Puedes verificar que satisfacen la ecuación del círculo sustituyendo en la ecuación lineal de la polar, y que efectivamente sus tangentes pasan por $\mathbf{a}$.

Para finalizar esta entrada te invito a que experimentes un momento con el recuadro interactivo. Nota cómo las líneas polares se convierten en las líneas tangentes cuando haces que el punto $\mathbf{a}$ esté sobre la circunferencia.

Más adelante…

En esta entrada finalizamos nuestra discusión de las circunferencias; la primera de las secciones cónicas que abordamos en nuestro curso. En la siguiente entrada podrás ver una serie de ejercicios para familiarizarte con la manipulación algébrica o vectorial de los conceptos que hemos introducido hasta ahora. En las siguientes entradas continuaremos nuestro estudio de las secciones cónicas hablando de parábolas, hipérbolas y elipses. Veremos cómo no es tan fácil dar una ecuación vectorial para el resto de las secciones cónicas; esto lo entenderemos tan pronto como empecemos a hablar de parábolas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Encuentra los puntos de tangencia: al círculo $x^{2}-2 x+y^{2}-4 y=-3$ desde el punto $(-1,2)$. Sugerencia: puedes consultar el segundo ejercicio realizado en esta entrada.
  • Demuestra que si $\mathbf{c}$ es un punto exterior (al círculo $\mathcal{C}$ con centro $P$ ) entonces su recta a $P$ biseca sus dos tangentes a $\mathcal{C}$. Y además que las distancias a sus pies en $\mathcal{C}$ (es decir, a los puntos de tangencia) son iguales. Sugerencia: Puedes utilizar la siguiente figura para tu demostración y pensar en el teorema de Pitágoras y en el criterio de congruencia LLL.

Entradas relacionadas

Geometría Analítica I: Círculos

Por Héctor Morales

Introducción

En nuestra vida cotidiana podemos encontrar muchos ejemplos de circunferencias. Desde la forma de una rueda, hasta el contorno de una taza y por supuesto en muchos fenómenos físicos como la trayectoria de una partícula en un campo magnético o el movimiento de un satélite alrededor de un planeta. Esta familiaridad que tenemos con las circunferencias, hacen que ésta sea la sección cónica más fácil de reconocer, pues incluso sin estudios formales en geometría estamos familiarizados con sus propiedades.

En esta entrada del blog propondremos una definición formal para la circunferencia; partiendo de la definición de la circunferencia como lugar geométrico, llegaremos a la ecuación cartesiana con la que probablemente ya estés familiarizado. Abordaremos la ecuación vectorial del círculo y vamos a ver qué ventajas tiene sobre la ecuación cartesiana.

Ecuación cartesiana de circunferencia

Probablemente en algún curso previo de álgebra o de geometría te hayas encontrado con el círculo unitario $\mathbb{S}^{1}$, definido por la ecuación

\begin{equation}
x^{2}+y^{2}=1
\end{equation}

Para generalizar las nociones que tenemos del círculo unitario a una circunferencia arbitraria, consideremos ahora a cualquier otro círculo $\mathcal{C}$. Tiene un centro $\mathbf{p}=(h, k)$, un radio $r>0$ y es el lugar geométrico de los puntos cuya distancia a $\mathbf{p}$ es $r$. Es decir, $\mathcal{C}=\left\lbrace\mathbf{x} \in \mathbb{R}^{2} \mid d(\mathbf{x}, \mathbf{p})=r\right\rbrace$; o bien, $\mathcal{C}$ está definido por la ecuación

\begin{equation}
d(\mathbf{x}, \mathbf{p})=r.
\end{equation}

La información geométrica clave de una circunferencia son su centro y su radio. Ambos se pueden pensar en términos de sus coordenadas cartesianas, o bien como vectores.

Puesto que ambos lados de esta ecuación son positivos, es equivalente a la igualdad de sus cuadrados que en coordenadas cartesianas toma la forma

\begin{equation}
(x-h)^{2}+(y-k)^{2}=r^{2}
\end{equation}

Así, todos los círculos de $\mathbb{R}^{2}$ están determinados por una ecuación cuadrática en las variables $x$ y $y$. Cuando la ecuación tiene la forma anterior, podemos leer inmediatamente toda la información geométrica (el centro y el radio). Lamentable, la mayoría de las veces que nos encontremos con ecuaciones de circunferencias las encontraremos «disfrazadas» como

\begin{equation}
x^{2}+y^{2}-2 h x-2 k y=\left(r^{2}-h^{2}-k^{2}\right)
\end{equation}

Es fácil ver que esta forma de escribir la circunferencia se obtiene al desarrollar la primera expresión. Veamos un ejemplo de cómo pasar una ecuación de circunferencia a su forma reducida.

Ejemplo. Consideremos la ecuación

\begin{equation}
x^{2}+y^{2}-6 x+2 y=-6 \text { . }
\end{equation}

Tenemos que determinar si la ecuación anterior define un círculo, y en caso de que así sea, qué características tiene. Lo primero que tenemos que hacer es completar los cuadrados, sumando en ambos lados las constantes que faltan

\begin{equation}
(x^{2}-6 x+9)+(y^{2}+2 y+1) =-6+9+1 \rightarrow (x-3)^{2}+(y+1)^{2} =4
\end{equation}

Claramente si desarrollamos esta última ecuación obtenemos la original. Así, podemos concluir que la ecuación define al círculo con centro en $(3,-1)$ y radio $2$.

Para terminar esta sección, puedes utilizar la ventana interactiva de GeoGebra para familiarizarte con la ecuación cartesiana de la circunferencia. Varía el radio y el centro del círculo y observa cómo cambia la ecuación. Intenta hacer una circunferencia por cada uno de los cuadrantes del plano poniendo mucha atención cómo cambian los signos dentro de los sumandos. Prueba casos límite ¿qué pasa si el radio el cero? ¿Un punto es una circunferencia?

Ecuación vectorial de circunferencia

Si nuestra ecuación cartesiana de circunferencia ya nos permitía «leer» toda la información geométrica de un círculo completando cuadrados, te puede parecer superfluo proponer una definición vectorial de la circunferencia. La motivación que tenemos para hacer esto es que una definición vectorial, al no hacer referencia a las coordenadas, tiene sentido en cualquier dimensión. Esto quiere decir que a diferencia de la ecuación cartesiana que sólo nos sirve para $\mathbb{R}^{2}$, una ecuación vectorial nos permitirá definir esferas en $\mathbb{R}^{3}$ y en dimensiones mayores.

Sin más preámbulo, diremos que el círculo $C$ con centro $\mathbf{p}$ y radio $r$ está definido por la ecuación

\begin{equation}
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{x}-\mathbf{p})=r^{2}
\end{equation}

Si tienes dificultades entendiendo por qué se utilizó el producto punto, te ayudará recordar que en la primera unidad de nuestro curso definimos la distancia euclidiana entre dos vectores (o norma) como el producto punto (o producto interior) del vector consigo mismo. En nuestro caso, sólo partimos de la definición de circunferencia como el lugar geométrico de todos los puntos que equidistan de un mismo punto y aplicamos la definición vectorial de distancia.

La ecuación, que llamaremos ecuación vectorial del círculo, se puede también reescribir como

\begin{equation}
\mathbf{x} \cdot \mathbf{x}-2 \mathbf{p} \cdot \mathbf{x}+\mathbf{p} \cdot \mathbf{p}=r^{2}
\end{equation}

Veamos un ejemplo de la ecuación vectorial del círculo para familiarizarnos con ella.

Ejemplo. Considere la circunferencia con centro en $(3,1)$ y radio $2$. Encuentre su ecuación vectorial y su ecuación cartesiana. Demuestre que ambas ecuaciones son equivalentes.

Lo primero que tenemos que hacer es obtener la ecuación vectorial de la circunferencia. Utilizando la definición que acabamos de escribir en esta entrada, podemos ver que la ecuación que buscamos es

\begin{equation}
(\mathbf{x}-(3,1)) \cdot(\mathbf{x}-(3,1))= 4
\end{equation}

También utilizando la definición para la ecuación cartesiana

\begin{equation}
(x-3)^{2}+(y-1)^{2}=4
\end{equation}

Estas dos expresiones, son las ecuaciones que buscamos. Sólo nos falta demostrar su equivalencia. Recordando las propiedades del producto punto que introducimos en la unidad anterior

\begin{equation}
\begin{array}{l}
(\mathbf{x}-(3,1)) \cdot (\mathbf{x}-(3,1)) = 4 \\
((x,y)-(3,1)) \cdot ((x,y)-(3,1)) = 4 \\
(x-3,y-1) \cdot (x-3,y-1) = 4 \\
(x-3)^{2}+(y-1)^{2}=4
\end{array}
\end{equation}

¡Listo! Ya nos convencimos que la ecuación cartesiana y la ecuación vectorial son equivalentes cuando estamos trabajando en $\mathbb{R}^{2}$. Por el momento, conservemos la idea de que la ecuación vectorial es un poco más general y de ella se puede extraer mucha información geométrica interesante.

Para finalizar esta sección, utiliza el siguiente recuadro interactivo para familiarizarte con la ecuación vectorial del círculo. Manipula el centro y el radio para ver cómo se reescribe la ecuación y entiende muy bien cómo el producto punto es la operación clave de la definición. ¿Puedes encontrar los parámetros adecuados para hacer que en ambos interactivos tengamos círculos equivalentes con diferentes formas de escribir la ecuación?

Más adelante…

En esta entrada discutimos detalladamente las definiciones cartesianas y vectorial de la circunferencia, propusimos algunos ejemplos para familiarizarnos con estas expresiones y aprendimos a «leer» la información geométrica que guardan. Sin embargo, no hemos acabado nuestro estudio de las circunferencias. En las siguientes entradas abordaremos el tema de las rectas tangentes y polares y resolveremos algunos ejercicios relacionados a estas secciones cónicas.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • ¿Cuáles de las siguientes ecuaciones son ecuaciones de un círculo? Y en su caso, ¿de cuál?

\begin{equation}
\begin{array}{l}
x^{2}-6 x+y^{2}-4 y=12 \\
x^{2}+4 x+y^{2}+2 y=11 \\
2 x^{2}+8 x+2 y^{2}-4 y=-8 \\
x^{2}-4 x+y^{2}-2 y=-6 \\
4 x^{2}+4 x+y^{2}-2 y=4
\end{array}
\end{equation}

  • ¿Cuál es el lugar geométrico de los centros de los círculos que pasan por dos puntos (distintos) $a$ y $b$? Sugerencia: considera la definición geométrica de la circunferencia como el conjunto de puntos que equidistan de un centro y ten en cuenta la definición vectorial de la mediatriz.
  • Sean $p$ y $q$ dos puntos distintos en el plano. ¿Para cuáles números reales $c$, se tiene que la siguiente ecuación define un círculo? En su caso, ¿cuál es el radio y dónde está su centro?

\begin{equation}
(\mathbf{x}-\mathbf{p}) \cdot(\mathbf{x}-\mathbf{q})=c
\end{equation}

  • Determinar la ecuación, centro y radio de la circunferencia que pasa por los tres puntos $A(-1,1)$, $B(3,5)$ y $C(5,-3)$. Sugerencia: considera que la ecuación buscada tiene la forma $x^2 + y^2 + Dx+ Ey + F= 0$, luego sustituye la información que te ofrece el problema para llegar a un sistema de ecuaciones y resuelvelo.

Entradas relacionadas

Álgebra Superior II: El principio del buen orden

Por Roberto Manríquez Castillo

Introducción

En la entrada pasada definimos una relación de orden en el conjunto de números naturales, más aun, probamos algunas propiedades de esta nueva relación, de las cuales, la más importante fue que este orden era un orden total. Ya en los ejercicios morales, vimos que podíamos restringir esta relación a cualquier número natural $n$ para definir un orden en los conjuntos con $n$ elementos.

En esta entrada definiremos una de las propiedades más importantes del orden en los naturales: el principio de buena ordenación, veremos que en cierto sentido es equivalente al principio de inducción, y daremos una breve presentación a algunos otros conjuntos que en este sentido se comportan de forma similar a los naturales.

La propiedad de buena ordenación

Pensemos en un número natural $n\neq 0$ con el orden que este hereda de $\mathbb{N}$, abusando de la notación, podemos escribir de forma ordenada a $n$ como $\{0<1<…<n-1\}$, parece ser que no habrá muchas sorpresas a la hora de estudiar a los números como conjuntos ordenados. Sin embargo, vale la pena notar que debido a lo que probamos en la sección de El tamaño de los naturales, cualquier subconjunto $A$ de $n$ será finito. Gracias a esto, y a que demostramos que el orden es total, podemos comparar todos los elementos de $A$ y fijarnos en el menor de todos ellos. Antes de formalizar esta prueba, recordaremos qué significa que un elemento de un conjunto sea mínimo.

Definición. Si $A$ es un conjunto ordenado por $\leq$, decimos que $a_0\in A$ es un elemento mínimo, si para todo $a\in A$ se tiene que $a_0\leq a$.

Ahora sí, enunciamos y demostramos nuestro primer teorema.

Teorema. Si $n\neq 0$ y $A\subseteq n$ es distinto del vacío, entonces existe $a_0$ mínimo en $A$.

Demostración. El hecho de que $A$ sea un conjunto finito no necesita más demostración que la que se mencionó en el párrafo anterior. Entonces podemos proceder por inducción sobre $m=\vert A\vert$.

Como $A\neq \emptyset$ la base de inducción se probará para $m=1$. Es decir que $A=\{a\}$, evidentemente, el elemento $a$ es el mínimo de $A$.

Supongamos ahora que si un conjunto no vacío tiene $m$ elementos, entonces tiene un elemento mínimo y supongamos que $A$ es un conjunto con $\sigma(m)$ elementos. Como $A$ es no vacío, entonces podemos elegir algún $a\in A$ arbitrario, entonces el conjunto $A\setminus\{a\}$ es un conjunto con $m$ elementos, y por la hipótesis de inducción, tiene un mínimo, llamémoslo $a’$. Como el orden en $A$ es el de los naturales, y este es total, $a’$ y $a$ son comparables, llamemos $a_0$ al mínimo entre estos dos elementos y demostremos que $a_0$ es el mínimo de $A$.

Sea $x\in A$ arbitrario, si $x=a$, ya terminamos, pues por definición $a_0\leq a$, en caso contrario $x \in A\setminus\{a\}$, pero como $a’$ es el mínimo de este conjunto, entonces $a’\leq x$, y como $a_0\leq a’$, por transitividad concluimos que $a_0\leq x$, por lo que $A$ sí tiene mínimo.

$\square$

Como mencionamos antes, la propiedad de que todos los subconjuntos de un conjunto arbitrario tengan mínimo elemento es importante, por lo que damos la siguiente definición.

Definición. Si $B$ es un conjunto ordenado por $\leq$, decimos que $B$ tiene la propiedad del buen orden si todo subconjunto no vacío de $B$ tiene un mínimo.

Entonces el teorema anterior puede ser reformulado como

Teorema. Si $n$ es un número natural, entonces $n$ está bien ordenado.

El conjunto de los números naturales está bien ordenado.

Un error lógico, sería asumir que por el teorema anterior, el conjunto de los números naturales también cumple la propiedad del buen orden, ya que a diferencia de cualquier número natural, en $\mathbb{N}$ existen conjuntos con una infinidad de elementos; sin embargo, aunque esta prueba no funcione, no se sigue que $\mathbb{N}$ no esté bien ordenado, es por esto que enunciamos el siguiente teorema.

Teorema. $\mathbb{N}$ satisface la propiedad del buen orden.

Demostración. Sea $A$ un subconjunto no vacío de números naturales, procedamos por contradicción, es decir, supongamos que $A$ no tiene elemento mínimo. Consideremos $B=\{n\in\mathbb{N}\mid m\leq n \Rightarrow m\notin A\}$, veamos que B es inductivo.

Evidentemente $0$ está en $B$, porque si no, existiría $m\leq 0$ tal que $m\in A$, como el único natural menor o igual a $0$ es $0$, tenemos que $0\in A$, pero entonces, $0$ sería un mínimo de $A$, ya que es menor o igual a todo natural.

Supongamos entonces que $n\in B$ y demostremos que $\sigma(n)\in B$, supongamos que no, entonces existirá $m\leq\sigma(n)$, tal que $m\in A$, como $m\in A$, por la definición de $B$, debe ocurrir que $n<m$ y por uno de los resultados de la entrada pasada, tenemos que $\sigma(n) \leq m$, por la antisimetría del orden, tenemos que $m=\sigma(n)$.

De nuevo usemos reducción al absurdo para probar que $\sigma(m)$ es un mínimo de $A$, si no lo fuera, existiría $a \in A$ tal que es falso que $\sigma(n)\leq a$, esto implicaría que es falso que $n<a$, es decir que $a\leq n$ y como $n\in B$, esto implicaría que $a\notin A $ lo cual es absurdo, entonces $\sigma(n)$ sí es un mínimo de $A$, pero de nuevo, esto es contradictorio con la suposición de que $A$ no tenía elemento mínimo, esta contradicción se deriva de suponer que $\sigma(n)\notin B$, entonces $\sigma(n)\in B$, por lo que el paso inductivo queda probado y $B=\mathbb{N}$.

Como $B=\mathbb{N}$, debe ocurrir que $A= \emptyset$ ya que si $a\in A$, como $a\leq \sigma(a)$, por la definición de $B$ debería pasar que $\sigma(a)\notin B$, contradiciendo que $B=\mathbb{N}$, pero desde un inicio, supusimos que $A\neq \emptyset$, esto quiere decir que suponer que $A$ no tiene mínimo es absurdo. Entonces, concluimos que $A$ sí debe de tener un elemento mínimo.

$\square$

El principio de inducción y el principio del buen orden

La idea de una prueba más corta de este resultado se da en los ejercicios morales; sin embargo, damos esta prueba para ver como el principio de inducción prueba el del buen orden. De forma análoga podemos demostrar el principio de inducción a partir del principio del buen orden.

Teorema. Supongamos cierto que $\mathbb{N}$ satisface la propiedad del buen orden, entonces, el principio de inducción también es cierto.

Demostración. Sea $A$ un conjunto inductivo, debemos de demostrar que $A=\mathbb{N}$, supongamos que no lo es, entonces $\mathbb{N}\setminus A\neq\emptyset$, por lo que, por el principio del buen orden, este conjunto tiene un elemento mínimo, sea $n$ el mínimo. Como $A$ es inductivo, $0\in A$. por lo que $n\neq 0$, entonces existe un $m$ tal que $\sigma(m)=n$, como $n$ es el mínimo, de $\mathbb{N}\setminus A$, tenemos que $m\notin \mathbb{N}\setminus A$, por lo que $m\in A$, pero como $A$ es inductivo, $\sigma(m)=n\in A$, lo cual es una contradicción, entonces, $A=\mathbb{N}$.

$\square$

En $\mathbb{N}$, existe otra formulación equivalente al principio de inducción, llamado principio de inducción fuerte, y dice que

Teorema. Si $A$ es un conjunto tal que:

  • $0\in A$.
  • Es cierto que si $n\in A$ y para todo $m\leq n$, se tiene que también $m\in A$ entonces $\sigma(n)\in A$.

Entonces $A=\mathbb{N}$.

Los detalles de la prueba se mencionan en uno de los ejercicios morales.

Conjuntos bien ordenados

Antes de estudiar otros conjuntos bien ordenados damos la siguiente proposición elemental.

Teorema. Si $A$ es un conjunto bien ordenado por $\leq$, entonces $A$ es un orden lineal.

Demostración. Sean $a,b\in A$, consideremos el conjunto $\{a,b\}\subset A$, como $A$ es un buen orden, entonces, este subconjunto tiene un elemento mínimo, es decir que $a\leq b$ ó $b\leq a$, esto quiere decir que los elementos son comparables.

$\square$

Hemos demostrado que todo número natural y el conjunto de los naturales, tienen un buen orden natural, una pregunta natural es si estos son los únicos conjuntos bien ordenados, la respuesta es que no; sin embargo hay varias cosas que analizar.

Lo primero que mencionaremos, es que todo conjunto finito $A$ y linealmente ordenado, satisface la propiedad del buen orden y más aun, se puede probar que si $\vert A\vert=n$, entonces el orden de $A$ y de $n$ son indistinguibles, detallamos esta afirmación en uno de los problemas de la tarea moral.

El caso infinito es más complicado, ya que existen muchos conjuntos numerables que pueden ordenarse de forma distinta a $\mathbb{N}$ y aun así tener la propiedad del buen orden, en realidad, es muy sencillo construirlos, como mencionamos en el siguiente teorema.

Teorema. Si $A$ es un conjunto bien ordenado bajo $\leq$, entonces $\sigma(A)$ es un conjunto bien ordenado con el orden $\leq’=\leq\cup\bigcup_{a\in \sigma(A)}(a,A)$.

Demostración. El hecho de que $\leq’$ es un orden, será un ejercicio moral, veamos que $\leq’$ está bien ordenado. Sea $B\subseteq \sigma(A)$ distinto del vacío, entonces debemos encontrar un elemento mínimo para $B$. Si $B=\{A\}$ el resultado es trivial.

Entonces supongamos que $B\neq\{A\}$ y consideremos $B\setminus \{A\}\subseteq A$, el cual es distinto del vacío. Como $A$ es un buen orden, entonces, existe $b$ elemento mínimo para este conjunto, afirmamos que $b$ también es un elemento mínimo para $B$. Para ver esto, sea $b’\in B$, si $b’\in B\setminus \{A\}\subseteq A$ el resultado se sigue de la definición de $b$, mientras que si $b’=A$, tenemos que $b’\leq A$ ya que por definición $(b’,A)\in \leq’$. Con esto finaliza la prueba.

$\square$

Aplicando el teorema anterior a $\mathbb{N}$, tenemos que $\mathbb{N}\cup\{\mathbb{N}\}$ es un buen orden con $\leq$ definido como $a\leq b$ si y solo si $a\in b$ o $a=b$, sin embargo, a diferencia de $\mathbb{N}$, este conjunto tiene un máximo, dígase $\mathbb{N}$ (ahora visto como elemento).

Otra cosa curiosa que podemos notar del conjunto $\sigma(\mathbb{N})$ es que aunque el principio del buen orden es válido, el principio de inducción no lo es, a diferencia de como pasaba en $\mathbb{N}$, en realidad, esta no es la única propiedad que perdemos, por ejemplo, en $\sigma(\mathbb{N})$, el cero no es el único elemento sin un antecesor, en realidad, esta es una de las razones por las que la prueba del principio de inducción a partir del principio del buen orden no es válida para este conjunto.

El estudio de los buenos ordenes es importante en Teoría de conjuntos y está muy relacionada con la teoría de conjuntos transitivos.

Más adelante…

Ya que hemos estudiado la propiedad más importante del orden en los naturales. solo falta ver como es que esta propiedad se relaciona con las operaciones que definimos, los resultados vistos en esta sección y en la siguiente, serán muy importantes en los siguientes temas que desarrollemos, ya que serán la base de muchos resultados, sobre todo al ver los resultados de la teoría de números en $\mathbb{Z}$, donde el orden, la inducción y el buen orden tendrán papeles fundamentales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Si $A$ es un conjunto con $n$ elementos, y $\leq_A$ es un orden total en $A$, demuestra que existe una función $f:n \longrightarrow A$ tal que $n\leq m \Leftrightarrow f(n)\leq_A f(m)$. Sugerencia: Usa inducción sobre $n$ y después el principio del buen orden.
  2. Prueba el principio del buen orden a partir del axioma de regularidad y de la definición de $<$. Sugerencia: recuerda que el axioma de regularidad prohíbe la existencia de sucesiones infinitas de conjuntos tales que $…\in a_2\in a_1\in a_0$.
  3. Demuestra que en $\mathbb{N}$, el principio de inducción fuerte es equivalente al principio de inducción. Sugerencia: Prueba el principio de inducción fuerte a partir del débil, y el principio del buen orden a partir del fuerte.
  4. Usando la notación del último teorema, demuestra que $\leq’$ sí define una relación de orden en $\sigma(A)$.
  5. Si $A$ es un conjunto bien ordenado e infinito con $a_0$ elemento mínimo, prueba que existe una función $f:\mathbb{N}\longrightarrow A$ tal que $f(0)= a_0$ y si $n\leq m$ entonces $f(n)\leq f(m)$. Sugerencia: Usa la técnica que se ocupó a la hora de demostrar que los naturales son el conjunto infinito más pequeño.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: La relación de orden en los naturales

Por Roberto Manríquez Castillo

Introducción

Seguramente desde que construimos de forma intuitiva el conjunto de números naturales, te diste cuenta de que nuestra forma de generar nuevos números a través de la función sucesor, nos daba una jerarquía de qué número natural iba primero, y quien era el que inmediatamente le seguía. Así, el primer natural debería de ser el $0$, el cual debería ser menor a todos los demás. Después, seguiría $\sigma(0)=1$ el cual debería ser menor al sucesor de cualquier otro número. Este razonamiento podría seguir de forma inductiva para los demás números.

En esta entrada abordaremos el problema de cómo organizar el conjunto de naturales. Hay varias formas de definir esta relación. Pero el trabajo que realizamos en las dos entradas pasadas nos permitirá atacar dos problemas de manera sencilla: el de definir el orden en $\mathbb{N}$ y el de demostrar sus propiedades.

El orden parcial en $\mathbb{N}$

Recordemos que si $n$ es un número natural distinto de cero, entonces $n=\{0,1,…,n-1\}$. Entonces de forma intuitiva podemos afirmar que cada número natural tienen por elementos a todos los naturales «menores» a él. Usando esta idea, podemos dar las siguientes dos definiciones.

Definición. Si $n,m\in \mathbb{N}$, decimos que $n$ es menor que $m$, en símbolos, $n<m$ si $n\in m$.

Definición. Si $n,m\in \mathbb{N}$, decimos que $n$ es menor o igual que $m$, en símbolos $n\leq m$ si $n\in m$ o $n=m$.

Antes de lanzarnos a probar propiedades de estas relaciones, comenzaremos con verificar la segunda de ellas define un orden parcial.

Teorema. La relación $\leq$ es un orden parcial en $\mathbb{N}$.

Demostración. Recordemos que según la definición de orden parcial, debemos probar que $\leq$ es reflexiva, transitiva y antisimétrica, hagamos esto por pasos.

$\leq$ es reflexiva: Si $m$ es un natural, tenemos que $m=m$, por lo que por nuestra definición, podemos escribir que $m\leq m$.

$\leq$ es transitiva: Sean $n,m,l$ naturales tales que $n\leq m$ y $m\leq l$. Debemos demostrar que $n\leq l$. Si $n=m$ o $m=l$ la conclusión es inmediata de las hipótesis. En otro caso, tenemos que que $n\in m$ y $m\in l$. Como $l$ es un número natural, es un conjunto transitivo, entonces $n\in l$, por lo que $n\leq l$.

$\leq$ es antisimétrica: Si $n,m$ son naturales tales que $n\leq m$ y $m\leq n$, debemos demostrar que $n=m$. Para ver esto, procedamos por contradicción. Supongamos que no son iguales, entonces $n\in m$ y $m\in n$. Pero como ya hemos mencionado anteriormente, el hecho de que dos conjuntos pertenezcan mutuamente al otro es contradictorio con el axioma de regularidad. Entonces debe suceder que $n=m$ como queríamos.

$\square$

Propiedades del orden en los naturales

Ya mostramos que $\leq$ es un orden parcial en $\mathbb{N}$. Probemos otras propiedades que esperamos que satisfaga. Empezamos con la que mencionamos en la introducción de la entrada.

Teorema. $0\leq n$ para todo natural $n$

Demostración. Si $n=0$, el resultado se sigue de manera automática. Si $n\neq 0$, el resultado se sigue de que ya demostramos que $0$ está en cada natural distinto de $0$.

$\square$

La siguiente propiedad que probaremos es que la función sucesor sí preserva el orden que definimos.

Teorema. Si $n,m\in\mathbb{N}$ y $n<m$, entonces $\sigma(n)<\sigma(m)$

Demostración. Procedamos por inducción sobre $m$. Para el caso base debemos probar que la afirmación $n<0\Rightarrow\sigma(n)<0$, es verdadera. Sin embargo, el antecedente siempre es falso, ya que $n<0$ quiere decir que $n\in\emptyset$ lo cual es absurdo. Como el antecedente siempre es falso, entonces la base de inducción es verdadera.

Supongamos que para alguna $m$ se tiene que si $n<m$, entonces $\sigma(n)< \sigma(m)$. Debemos probar que el resultado es cierto para $\sigma(m)$. Supongamos entonces que $n<\sigma(m)$. Debemos probar que $\sigma(n)<\sigma( \sigma(m))$.

Como $n<\sigma(m)$, tenemos que $n\in \sigma(m)=m\cup \{m\}$, así que tenemos dos casos: $n\in m$ o $n\in\{m\}$.

Si $n\in m$, por hipótesis inductiva $\sigma(n)\in \sigma(m)$. Como $\sigma(m)\in \sigma(\sigma(m))$ y los naturales son transitivos, tenemos $\sigma(n)\in \sigma(\sigma(m))$, es decir, $\sigma(n)< \sigma(\sigma(m))$, como queríamos.

Finalmente, si $n\in \{m\}$, entonces $n=m$, pero así $\sigma(n)=\sigma(n)\in \sigma(\sigma(m))$, de modo que $\sigma(n)<\sigma(\sigma(m))$, como queríamos.

$\square$

El orden en los naturales es total

De entre los órdenes parciales hay un tipo de órdenes especiales: aquellos en los que cualesquiera dos elementos se pueden comparar. A estos se les conoce como órdenes totales. Los resultados de esta sección muestran que la relación $\leq$ en $\mathbb{N}$ es un orden total.

Un paso intermedio para demostrar esto es ver que si un número natural es menor que otro, entonces la función sucesor «no nos puede llevar muy lejos».

Teorema. Si $n,m$ son naturales tales que $m<n$, entonces se tiene que $\sigma(m)\leq n$.

Demostración. La hipótesis es imposible cuando $n=0$, pues no hay ningún natural menor a cero. Así, $n$ debe ser sucesor de algún otro natural, digamos $n=\sigma(k)$.

De $m<\sigma(k)$ tenemos que $m\in k\cup \{k\}$, así que $m\in k$, o $m=k$. Si $m\in k$, entonces $m<k$ y por el teorema anterior tenemos que $\sigma(m)<\sigma(k)=n$. Si $m=k$, entonces $\sigma(m)=\sigma(k)=n$. En cualquier caso tenemos $\sigma(m)\leq n$.

$\square$

El anterior teorema es equivalente a la afirmación siguiente.

Corolario. Si $n,m\in\mathbb{N}$, son tales que $m<n$ pero es falso que $\sigma(m)< n$, entonces $\sigma(m)=n$.

En estos momentos es conveniente regresar a leer las dos pruebas de los teoremas anteriores, y notar que en las demostraciones, cuando suponíamos que era falso que $n<m$ nunca supusimos que $n\geq m$. Sólo apelábamos directamente a la negación de la definición. Haber usado $n\geq m$ hubiera sido un error. En primer lugar, porque aún no hemos definido el símbolo $\geq$. Y en segundo lugar, porque aún no hemos descartado una cuarta posibilidad: que $n$ y $m$ no sean comparables. En realidad esto es imposible, pero hay que demostrarlo. En $\mathbb{N}$ el orden es total y de hecho satisface la propiedad de tricotomía que enunciamos a continuación.

Teorema. Para cualesquiera $n$ y $m$ naturales se cumple una y sólo una de las siguientes afirmaciones

  • $n=m$
  • $n< m$
  • $m< n$

Demostración. Ya hemos demostrado mediante el axioma de regularidad que estas proposiciones son mutuamente excluyentes. Sólo queda demostrar que siempre sucede por lo menos una de ellas. Demostraremos esto por inducción sobre $n$.

El caso base se reduce a probar que para cualquier $m$, se tiene que $0=m$, $0\in m$ o $m\in 0$. El primer teorema que probamos muestra que siempre se da la primera o la segunda opción.

Supongamos ahora que el resultado es cierto para alguna $n$. Debemos probarlo para $\sigma(n)$. Entonces sea $m\in\mathbb{N}$ arbitrario. Por hipótesis de inducción, $m$ es comparable con $n$, entonces podemos considerar tres casos:

$m=n$. Este caso es trivial porque entonces $m\in\sigma(n)$.

$m< n$. De nuevo tenemos que $m\in n\in \sigma(n)$, y por transitividad (del orden o de los conjuntos), tenemos que $m\in\sigma(n)$.

$n< m$. Por el teorema anterior, tenemos que en este caso, $\sigma(n)<m$ ó $\sigma(n)=m$.

De cualquier forma $\sigma(n)$ y $m$ son comparables. Esto termina la demostración.

$\square$

Para finalizar, hacemos la observación de que definir los símbolos $>$ y $\geq$ en $\mathbb{N}$ es sencillo. Simplemente, diremos que $n\geq m$ cuando $m\leq n$. Así mismo, diremos que $n>m$ cuando $m<n$.

Más adelante…

Ya empezamos a probar las propiedades del orden en $\mathbb{N}$. Sin embargo, falta ver una de las más importantes: el principio del buen orden. Esta lo veremos en la entrada siguiente. También veremos que, en cierto sentido, es equivalente al principio de inducción.

Otra cosa más que falta es ver que el orden que definimos «se comporta bien» con las operaciones de suma y producto en $\mathbb{N}$. Esto resultará de suma importancia para entradas posteriores.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $n\leq m$, entonces $n<\sigma(m)$.
  2. Prueba que $n\leq m$ si y sólo si $n\subseteq m$.
  3. Generaliza el teorema de que $\in$ define un orden en $\mathbb{N}$, a que $\in$ define un orden en cualquier conjunto transitivo.
  4. Demuestra que $\leq$, restringido a $n \times n$ es un orden total en el conjunto $n$.
  5. Encuentra un conjunto $A$ con tantos elementos como números naturales y una forma de ordenarlo linealmente, tal que $A$ tiene elemento máximo.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: El tamaño de los naturales y de cada natural

Por Roberto Manríquez Castillo

Introducción

En la entrada pasada, demostramos que todo número natural es el conjunto formado por los elementos $\{0,1,…,n-1\}$. Esto nos dice intuitivamente que cada número natural $n$, tiene exactamente $n$ elementos. Pero, de modo formal, ¿qué quiere decir que un conjunto tenga $n$ elementos? Esto lo precisaremos en esta entrada. Más aun, siguiendo esta idea, definiremos que quiere decir que un conjunto sea infinito. Después, veremos las propiedades que los conjuntos finitos e infinitos tienen.

El tamaño de los conjuntos

A la hora de pensar en determinar el tamaño de un conjunto, uno podría aventurarse y empezar a contar los elementos de este uno por uno. Esta forma de aproximar el problema no sólo parece muy laboriosa, sino que también presenta el problema de que no todos los conjuntos tienen la propiedad de que se pueda enlistar a sus elementos (aunque no lo definimos aún, seguramente has escuchado que el conjunto $\mathbb{R}$ de números reales no cumple esta propiedad).

De entrada, parecería que el problema de catalogar a los conjuntos por su tamaño es más complicado de lo que parece. Sin embargo, hay una idea famosa que viene a salvar la situación.

Imagina que eres el acomodador de una sala de cine con una cantidad desconocida de asientos (incluso posiblemente infinita) y que quieres sentar en ellos a un cierto conjunto de espectadores (cuya cantidad también se desconoce). Como dijimos anteriormente, la labor de contar todos los asientos de la sala podría ser demasiado complicada. ¿Cómo podríamos cerciorarnos de que cada espectador podrá tener un asiento?

La respuesta es inusualmente sencilla. La mejor forma de cerciorarse de que todos puedan sentarse, es pidiéndoles que se sienten. Si logran hacerlo de modo que a cada asistente le toque exactamente un asiento y no sobren asientos, podremos decir que hay el mismo número de personas que de lugares.

Notemos que de esta forma no necesitamos saber de forma explícita cuántas sillas hay, ni cuantas personas asistieron a la función, para saber que hay la misma cantidad de personas que de sillas. Formalmente hablando, hemos dado una relación entre el conjunto de personas y el de asientos.

Recordemos que a una relación entre conjuntos se le llama función si a cada elemento de nuestro dominio le corresponde uno y solo un elemento del codominio. Más aún, si a todo elemento del codominio, está relacionado con uno del dominio, la función se llamará suprayectiva. Si una función satisface que los elementos del codominio se relacionan con a lo más un elemento del dominio, se le llama función inyectiva. Cuando ambas condiciones se satisfacen, diremos que la función es biyectiva.

Nota que en el ejemplo de la sala de cine, si logramos hacer que todos los asistentes se sienten sin que sobre alguna silla, entonces la función que damos es una función biyectiva. Con estas observaciones, introducimos la siguiente definición.

Definición. Diremos que dos conjuntos $A$ y $B$ tienen la misma cantidad de elementos, o la misma cardinalidad, si existe una función biyectiva entre ellos. En este caso escribimos $\vert A\vert=\vert B \vert$.

El tamaño del conjunto $\mathbb{N}$

Aunque los conjuntos finitos parecen ser más cercanos a nuestra realidad, será más interesante definir primero qué son los conjuntos infinitos. Para ello usaremos una de las propiedades «raras» que estos tienen.

Definición. Diremos que un conjunto $X$ es infinito si existe un subconjunto propio $Y$ de $X$ y una función $f:X\to Y$ biyectiva entre ambos conjuntos.

Recuerda que un subconjunto propio es cualquier subconjunto que no sea el conjunto original. En otras palabras, un conjunto es infinito si tiene el mismo tamaño que alguno de sus subconjuntos propios.

Definición. Diremos que un conjunto es finito si no es infinito.

La propiedad que usamos para caracterizar a los conjuntos infinitos fue muy novedosa cuando se enunció por primera vez. Incluso con los años fue el origen de aparentes paradojas al sentido común. Si el tema te parece interesante, puedes leer o ver algún vídeo sobre el famoso Hotel de Hilbert.

Con nuestra definición lista, empezaremos a catalogar los conjuntos que ya conocemos en finitos e infinitos.

Teorema. El conjunto $\mathbb{N}$ de números naturales es infinito.

Demostración. Para demostrar esto, consideraremos el conjunto $\mathbb{N}\setminus\{0\}$. Este es un subconjunto propio de $\mathbb{N}$. Tomemos la función $\sigma:\mathbb{N}\to \mathbb{N}\setminus\{0\}$. De acuerdo con la definición de conjunto infinito hay que demostrar que $\sigma$ es biyectiva, es decir, que es inyectiva y suprayectiva.

El hecho de que el codominio esté bien definido y que $\sigma$ sea inyectiva, fue demostrado en la entrada La construcción de los naturales, a la hora de probar los axiomas de Peano. La prueba de la suprayectividad se dejó como un ejercicio moral en la entrada de Principio de inducción y teoremas de recursión, ya que se usó para la prueba del teorema de Recursión débil. De cualquier forma, a continuación damos esa prueba.

Demostraremos que $\{0\}\cup \sigma(\mathbb{N})$ es inductivo. Evidentemente $0\in\mathbb{N}$ , y si $n\in \{0\}\cup\sigma(\mathbb{N})$, entonces es trivial que $\sigma(n)\in\sigma(\mathbb{N})$. Entonces $\{0\}\cup \sigma(\mathbb{N})=\mathbb{N}$, por lo que $\sigma(n)$ sí es suprayectiva y por lo tanto biyectiva. Con esto se concluye la prueba.

$\square$

La idea de determinar si dos conjuntos tienen la misma cantidad de elementos usando funciones se puede extender un poco más. La usaremos a continuación para definir cuándo un conjunto tiene al menos tantos elementos como otro.

Definición. Decimos que un conjunto $A$ tiene a lo más tantos elementos como un conjunto $B$ si existe una función inyectiva $f:A\to B$. En este caso, escribimos $\vert A\vert\leq \vert B \vert$.

Todo número natural es finito

Como hemos visto, los conjuntos infinitos se comportan de forma inesperada. Sin embargo los conjuntos finitos sí se comportarán de una forma más intuitiva. El teorema siguiente ejemplifica esto.

Teorema. Si $A$ es un conjunto finito, y $f:A\to A$, entonces son equivalentes las siguientes tres afirmaciones:

  1. $f$ es biyectiva
  2. $f$ es inyectiva
  3. $f$ es suprayectiva

Demostración. Evidentemente, $1)\Rightarrow 2)$ y $1)\Rightarrow 3)$. Si logramos demostrar la equivalencia entre $2)$ y $3)$ terminaremos, pues al tener uno, tendríamos el otro y por lo tanto tendríamos ambas partes de la definición de biyectividad.

$2)\Rightarrow 3)$ Supongamos que $f$ es inyectiva y supongamos que $f$ no es suprayectiva. Entonces $f:A\to f(A)$ es una biyección de $A$ con un subconjunto propio, lo cual diría que $A$ es infinito. Esto es una contradicción, así que $f$ debe ser suprayectiva.

$3)\Rightarrow 2)$ Si $f$ es suprayectiva, entonces tiene inversa derecha, es decir, existe $g:A\to A$ tal que $f\circ g=Id_A$. A partir de esta igualdad se puede probar que $g$ es inyectiva. En efecto, si $g(a)=g(b)$, entonces $f(g(a))=f(g(b))$, pero entonces $a=b$. Por la implicación del párrafo anterior, $g$, también es suprayectiva. Pero con esto se puede mostrar que $f$ es inyectiva. Si tenemos $a$ y $b$ tales que $f(a)=f(b)$, tomemos $c$ y $d$ tales que $g(c)=a$ y $g(d)=b$. De aquí, $c=f(g(c))=f(g(d))=d$ y por lo tanto $a=g(c)=g(d)=b$.

$\square$

Sigamos estudiando propiedades de los conjuntos infinitos. El siguiente resultado es bastante intuitivo: si le quitamos un elemento a un conjunto infinito, sigue siendo infinito. La demostración es algo elaborada pues debemos hacerla a partir de nuestras definiciones.

Lema 1. Si $X$ es un conjunto infinito y $x\in X$, entonces $X\setminus \{x\}$ también es un conjunto infinito.

Demostración. Sea $f:X\to A $ una biyección de $X$ a un subconjunto propio $A$. Tenemos que considerar dos casos: que $x\notin A$ o que $x\in A$. Comencemos con el caso $x\notin A$.

Para mostrar que $X\setminus \{x\}$ es infinito, utilizaremos como subconjunto a $A\setminus\{f(x)\}$ y como función a la restricción de $f$ a $X\setminus\{x\}$. Debemos demostrar que $A\setminus\{f(x)\}$ es un subconjunto propio de $X\setminus \{x\}$ y que dicha restricción es una biyección.

Lo primero sucede ya que $$A\setminus\{f(x)\}\subsetneq A\subseteq X\setminus \{x\}.$$ El hecho de que $f:X\setminus \{x\}\to A\setminus\{f(x)\}$ sea una biyección es consecuencia directa de que originalmente $f:X\to A $ era una biyección. Los detalles quedan como tarea moral.

Si por el contrario $x\in A$, como $A\subsetneq X$ debe existir $x’\in X\setminus A$. Consideremos la función

\begin{align*}
&g: & &X & &\longrightarrow & (A\cup \{x’&\})\setminus \{x\}& \\
& & &y & &\mapsto & f(&y) &\text{ si } y\neq f^{-1}(x) \\
& & f^{-1}&(x) & &\mapsto & &x’ &
\end{align*}

Veamos que $g$ es una biyección entre $X$ y $(A\cup \{x’\})\setminus \{x\}$. Lo primero que notamos es que el codominio está bien definido ya que para todo $y\in X$ se tiene que $g(y)\neq x$ (¿por qué?).

Además es inyectiva, ya que si $g(y)=g(z)$, con $y\neq f^{-1}(x)\neq z$, entonces se tiene que $f(y)=g(y)=g(z)=f(z)$, y por la inyectividad de $f$ se tiene que $y=z$. Mientras que si $y=f^{-1}(x)$, tenemos que $g(y)=x’=g(z)$ si $z\neq f^{-1}(x)$, tendríamos que $x’=f(z)$, por lo que $x’\in A$ lo cual es absurdo, entonces $z=f^{-1}(x)=y$, así $g$ es efectivamente inyectiva.

Para probar que es suprayectiva, consideremos $z\in(A\cup \{x’\})\setminus \{x\}$. Si $z=x’$, entonces $g(f^{-1}(x))=x’$, mientras que si $z\in A\setminus \{x\}$, por la suprayectvidad de $f$, debe de existir $y$ tal que $f(y)=z$. Además $y\neq f^{-1}(x)$ ya que si lo fuera $f(f^{-1}(x))=x=z$, lo cual sería absurdo. Se tiene entonces que $g(y)=f(y)=z$.

Con esto probamos que $g$ es una biyección de $X$ a un subconjunto propio al que no pertenece $x$. Para concluir, aplicamos el primer caso.

$\square$

Usando el lema anterior es fácil dar un corolario importante sobre conjuntos finitos, cuya prueba queda como un ejercicio.

Corolario. Si $X$ es un conjunto finito, y $x$ es un conjunto arbitrario, entonces $X\cup \{x\}$ es también un conjunto finito.

Armados con este corolario, podemos dar uno de los teoremas importantes de esta entrada.

Teorema. Si $n$ es un natural, entonces $n$ es un conjunto finito.

Demostración. Procedamos por inducción. Si $n=0$, entonces $n=\emptyset$, entonces $n$ no tiene subconjuntos propios con los que pueda biyectarse, ya que no tiene subconjuntos propios. Entonces por vacuidad el vacío es finito.

Supongamos que $n$ es un natural finito. Debemos demostrar que $\sigma(n) $ es también finito. Pero como $\sigma(n)=n\cup\{n\}$, el paso inductivo es consecuencia del corolario anterior. Con esto concluimos la inducción.

$\square$

Caracterizando los conjuntos finito e infinitos

Ya probamos que cada número natural es finito y que el conjunto de todos los naturales es infinito. Lo siguiente que haremos es ver que estos conjuntos nos sirven para catalogar a todos los demás conjuntos en finitos o infinitos. Comenzamos con un lema bastante intuitivo: si con conjunto tiene un subconjunto infinito, entonces es infinito.

Lema 2. Si $X$ es infinito y $X\subset Y$ entonces $Y$ también es infinito.

Demostración. Como $X$ es infinito, existe una biyección $f$ entre $X$ y uno de sus subconjuntos propios $A$. Consideremos entonces $(Y\setminus X)\cup A\subsetneq Y$, y demos una biyección entre $Y$ y este conjunto dada por

\begin{align*}
&g: & &Y & &\longrightarrow &(Y\setminus &X)\cup A & \\
& & &y & &\mapsto & &y &\text{ si } y\notin Y\setminus X\\
& & &x & &\mapsto & f(&x) &\text{ si } x\in X
\end{align*}

Probaremos que esta función es una biyección. Primero, veamos que es inyectiva. Esto se debe a que si $g(x)=g(y)$ y $x\in X$, entonces $g(y)=g(x)=f(x)\in A\subset X$, entonces $g(y)$ está en $X$, y como $Y\setminus X$ es enviado en si mismo, debe pasar que $y$ también está en $X$, por lo que $f(y)=g(y)=f(x)$ y por la inyectividad de $f$, tenemos que $y=x$. Por el contrario, si $x\notin X$, se tiene que $g(x)=x=g(y)$ entonces $g(y)\notin X$, por lo que $y$ tampoco puede estar en $X$, así, $g(y)=y=x$.

Veamos ahora que la función es suprayectiva. Si $z\in(Y\setminus X)\cup A$, consideremos dos casos: $z\in Y\setminus X$ en cuyo caso $g(z)=z$, o $z\in A$, por lo que por la suprayectividad de $f$, debemos tener que existe $x\in X$ tal que $z=f(x)=g(x)$. Así, $g$ es suprayectiva y por lo tanto es una biyección..

$\square$

Ahora sí, pasamos a demostrar los teoremas con los que concluiremos la entrada.

Teorema. El conjunto de números naturales es el conjunto infinito más pequeño, es decir, que si $X$ es un conjunto infinito, entonces $\vert\mathbb{N}\vert\leq\vert X\vert$.

Demostración. Como $X$ es infinito, debe ser distinto del vacío. Así, existe $x_0\in X$. Consideremos el conjunto $X\setminus \{x_0\}$, por el lema 1 que demostramos, este es de nuevo infinito. Una vez más, no es vacío, entonces existe $x_1\in X\setminus \{x_0\}$, y el conjunto $X\setminus\{x_0,x_1\}=(X\setminus \{x_0\})\setminus\{x_1\}$ será de nuevo infinito. Procediendo de manera recursiva, podemos dar una función

\begin{align*}
h: &\mathbb{N} \to X \\
& n \mapsto x_n
\end{align*}

tal que todos los $x_n$ son distintos entre sí (esto se puede demostrar inductivamente). Pero entonces $h$ es una función inyectiva de $\mathbb{N}$ al conjunto $X$, que es precisamente nuestra definición de que $\vert\mathbb{N}\vert\leq \vert X\vert $.

$\square$

El regreso del teorema anterior es evidentemente cierto, es decir que si un conjunto $X$ cumple que $\vert\mathbb{N}\vert\leq \vert X\vert $, entonces $X$ es infinito. Queda como ejercicio demostrarlo.

Para finalizar la entrada, damos un resultado análogo al anterior, para conjuntos finitos.

Teorema. Si $X$ es un conjunto finito, entonces existe $n\in\mathbb{N}$ tal que $\vert X\vert =\vert n\vert$.

Demostración. Si $X=\emptyset$, entonces $\vert\emptyset\vert= \vert X\vert $. Si $X$ no es vacío, entonces existe $x_0\in X$. Consideremos entonces $X\setminus \{x_0\}$. Si este conjunto es vacío, significa que $X=\{x_0\}$ y claramente podríamos biyectarlo con el conjunto $\sigma(0)=\{0\}$. Si por el contrario, $X\setminus \{x_0\}\neq \emptyset$, podemos elegir $x_1\in X\setminus \{x_0\}$ y verificar la misma condición.

Necesariamente debemos de terminar en algún momento pues, de otro modo, podremos usar el teorema de recursión para construir una función inyectiva de $\mathbb{N}$ a $X$. Esto diría que $X$ sería infinito, lo cual sería absurdo.

Entonces debe ocurrir que existe una $n$ tal que $X\setminus\{x_0,x_1,…,x_n\}$ es vacío, por lo que $X=\{x_0,x_1,…,x_n\}$, y por lo tanto podemos biyectarlo con $\sigma(n)$.

$\square$

Más adelante…

Así como los conjuntos transitivos, la teoría que se desarrolla al estudiar las cardinalidades de los conjuntos es un área de estudio importante en la teoría de conjuntos. Aunque no lo veremos a profundidad, la teoría que acabamos de desarrollar es suficiente para comparar la cardinalidad de la mayoría de los conjuntos que veamos con total precisión. Esto será cierto para, conjuntos como $\mathbb{Z}$ (el de los números enteros) o $\mathbb{Q}$ (el de los números racionales). No será sino hasta que definamos el conjunto de números reales que tendremos un conjunto con una cardinalidad estrictamente mayor que la de $\mathbb{N}$.

En la siguiente entrada definiremos el orden de los naturales, para lo cual de nuevo pensaremos a los números naturales como conjuntos. Más aún, las propiedades que estudiamos en la entrada pasada, serán de suma importancia a la hora de definir el buen orden de un conjunto. Esta es una propiedad que usamos anteriormente sin prueba, cuando demostramos el teorema de Recursión.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Supón que diriges un hotel con tantas habitaciones como números naturales. Supón que todas tus habitaciones se encuentran ocupadas, y de repente llega una persona solicitando un cuarto. ¿Cómo puedes hospedarlo sin desalojar a ningún cliente? Supón ahora que después llega un camión con tantas personas como números naturales, todas buscando un cuarto. ¿De qué forma puedes acomodarlos a ellos y a todos los clientes ya hospedados?
  2. Completa los detalles de la prueba del lema 1.
  3. Demuestra el corolario de la entrada: Si $X$ es un conjunto finito, y $x$ es un conjunto arbitrario, entonces $X\cup \{x\}$ es también un conjunto finito.
  4. Demuestra que si $X$ es tal que $\vert\mathbb{N}\vert\leq \vert X\vert $, entonces $X$ es infinito.
  5. Demuestra por inducción que si $X$ es infinito y $A$ es un subconjunto con $k$ elementos, entonces $X\setminus A$ es infinito. Si $A$ tiene tantos elementos como naturales, ¿el resultado sigue siendo cierto?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»