Archivo de la etiqueta: funciones

Álgebra Superior II: El tamaño de los naturales y de cada natural

Introducción

En la entrada pasada, demostramos que todo número natural es el conjunto formado por los elementos $\{0,1,…,n-1\}$. Esto nos dice intuitivamente que cada número natural $n$, tiene exactamente $n$ elementos. Pero, de modo formal, ¿qué quiere decir que un conjunto tenga $n$ elementos? Esto lo precisaremos en esta entrada. Más aun, siguiendo esta idea, definiremos que quiere decir que un conjunto sea infinito. Después, veremos las propiedades que los conjuntos finitos e infinitos tienen.

El tamaño de los conjuntos

A la hora de pensar en determinar el tamaño de un conjunto, uno podría aventurarse y empezar a contar los elementos de este uno por uno. Esta forma de aproximar el problema no sólo parece muy laboriosa, sino que también presenta el problema de que no todos los conjuntos tienen la propiedad de que se pueda enlistar a sus elementos (aunque no lo definimos aún, seguramente has escuchado que el conjunto $\mathbb{R}$ de números reales no cumple esta propiedad).

De entrada, parecería que el problema de catalogar a los conjuntos por su tamaño es más complicado de lo que parece. Sin embargo, hay una idea famosa que viene a salvar la situación.

Imagina que eres el acomodador de una sala de cine con una cantidad desconocida de asientos (incluso posiblemente infinita) y que quieres sentar en ellos a un cierto conjunto de espectadores (cuya cantidad también se desconoce). Como dijimos anteriormente, la labor de contar todos los asientos de la sala podría ser demasiado complicada. ¿Cómo podríamos cerciorarnos de que cada espectador podrá tener un asiento?

La respuesta es inusualmente sencilla. La mejor forma de cerciorarse de que todos puedan sentarse, es pidiéndoles que se sienten. Si logran hacerlo de modo que a cada asistente le toque exactamente un asiento y no sobren asientos, podremos decir que hay el mismo número de personas que de lugares.

Notemos que de esta forma no necesitamos saber de forma explícita cuántas sillas hay, ni cuantas personas asistieron a la función, para saber que hay la misma cantidad de personas que de sillas. Formalmente hablando, hemos dado una relación entre el conjunto de personas y el de asientos.

Recordemos que a una relación entre conjuntos se le llama función si a cada elemento de nuestro dominio le corresponde uno y solo un elemento del codominio. Más aún, si a todo elemento del codominio, está relacionado con uno del dominio, la función se llamará suprayectiva. Si una función satisface que los elementos del codominio se relacionan con a lo más un elemento del dominio, se le llama función inyectiva. Cuando ambas condiciones se satisfacen, diremos que la función es biyectiva.

Nota que en el ejemplo de la sala de cine, si logramos hacer que todos los asistentes se sienten sin que sobre alguna silla, entonces la función que damos es una función biyectiva. Con estas observaciones, introducimos la siguiente definición.

Definición. Diremos que dos conjuntos $A$ y $B$ tienen la misma cantidad de elementos, o la misma cardinalidad, si existe una función biyectiva entre ellos. En este caso escribimos $\vert A\vert=\vert B \vert$

El tamaño del conjunto $\mathbb{N}$

Aunque los conjuntos finitos parecen ser más cercanos a nuestra realidad, será más interesante definir primero qué son los conjuntos infinitos. Para ello usaremos una de las propiedades «raras» que estos tienen.

Definición. Diremos que un conjunto $X$ es infinito si existe un subconjunto propio $Y$ de $X$ y una función $f:X\to Y$ biyectiva entre ambos conjuntos.

Recuerda que un subconjunto propio es cualquier subconjunto que no sea el conjunto original. En otras palabras, un conjunto es infinito si tiene el mismo tamaño que alguno de sus subconjuntos propios.

Definición. Diremos que un conjunto es finito si no es infinito.

La propiedad que usamos para caracterizar a los conjuntos infinitos fue muy novedosa cuando se enunció por primera vez. Incluso con los años fue el origen de aparentes paradojas al sentido común. Si el tema te parece interesante, puedes leer o ver algún video sobre el famoso Hotel de Hilbert.

Con nuestra definición lista, empezaremos a catalogar los conjuntos que ya conocemos en finitos e infinitos.

Teorema. El conjunto $\mathbb{N}$ de números naturales es infinito.

Demostración. Para demostrar esto, consideraremos el conjunto $\mathbb{N}\setminus\{0\}$. Este es un subconjunto propio de $\mathbb{N}$. Tomemos la función $\sigma:\mathbb{N}\to \mathbb{N}\setminus\{0\}$. De acuerdo con la definición de conjunto infinito hay que demostrar que $\sigma$ es biyectiva, es decir, que es inyectiva y suprayectiva.

El hecho de que el codominio esté bien definido y que $\sigma$ sea inyectiva, fue demostrado en la entrada La construcción de los naturales, a la hora de probar los axiomas de Peano. La prueba de la suprayectividad se dejó como un ejercicio moral en la entrada de Principio de inducción y teoremas de recursión, ya que se usó para la prueba del teorema de Recursión débil. De cualquier forma, a continuación damos esa prueba.

Demostraremos que $\{0\}\cup \sigma(\mathbb{N})$ es inductivo. Evidentemente $0\in\mathbb{N}$ , y si $n\in \{0\}\cup\sigma(\mathbb{N})$, entonces es trivial que $\sigma(n)\in\sigma(\mathbb{N})$. Entonces $\{0\}\cup \sigma(\mathbb{N})=\mathbb{N}$, por lo que $\sigma(n)$ sí es suprayectiva y por lo tanto biyectiva. Con esto se concluye la prueba

$\square$

La idea de determinar si dos conjuntos tienen la misma cantidad de elementos usando funciones se puede extender un poco más. La usaremos a continuación para definir cuándo un conjunto tiene al menos tantos elementos como otro.

Definición. Decimos que un conjunto $A$ tiene a lo más tantos elementos como un conjunto $B$ si existe una función inyectiva $f:A\to B$. En este caso, escribimos $\vert A\vert\leq \vert B \vert$.

Todo número natural es finito

Como hemos visto, los conjuntos infinitos se comportan de forma inesperada. Sin embargo los conjuntos finitos sí se comportarán de una forma más intuitiva. El teorema siguiente ejemplifica esto.

Teorema. Si $A$ es un conjunto finito, y $f:A\to A$, entonces son equivalentes las siguientes tres afirmaciones:

  1. $f$ es biyectiva
  2. $f$ es inyectiva
  3. $f$ es suprayectiva

Demostración. Evidentemente, $1)\Rightarrow 2)$ y $1)\Rightarrow 3)$. Si logramos demostrar la equivalencia entre $2)$ y $3)$ terminaremos, pues al tener uno, tendríamos el otro y por lo tanto tendríamos ambas partes de la definición de biyectividad.

$2)\Rightarrow 3)$ Supongamos que $f$ es inyectiva y supongamos que $f$ no es suprayectiva. Entonces $f:A\to f(A)$ es una biyección de $A$ con un subconjunto propio, lo cual diría que $A$ es infinito. Esto es una contradicción, así que $f$ debe ser suprayectiva.

$3)\Rightarrow 2)$ Si $f$ es suprayectiva, entonces tiene inversa derecha, es decir, existe $g:A\to A$ tal que $f\circ g=Id_A$. A partir de esta igualdad se puede probar que $g$ es inyectiva. En efecto, si $g(a)=g(b)$, entonces $f(g(a))=f(g(b))$, pero entonces $a=b$. Por la implicación del párrafo anterior, $g$, también es suprayectiva. Pero con esto se puede mostrar que $f$ es inyectiva. Si tenemos $a$ y $b$ tales que $f(a)=f(b)$, tomemos $c$ y $d$ tales que $g(c)=a$ y $g(d)=b$. De aquí, $c=f(g(c))=f(g(d))=d$ y por lo tanto $a=g(c)=g(d)=b$.

$\square$

Sigamos estudiando propiedades de los conjuntos infinitos. El siguiente resultado es bastante intuitivo: si le quitamos un elemento a un conjunto infinito, sigue siendo infinito. La demostración es algo elaborada pues debemos hacerla a partir de nuestras definiciones.

Lema 1. Si $X$ es un conjunto infinito y $x\in X$, entonces $X\setminus \{x\}$ también es un conjunto infinito

Demostración. Sea $f:X\to A $ una biyección de $X$ a un subconjunto propio $A$. Tenemos que considerar dos casos: que $x\notin A$ o que $x\in A$. Comencemos con el caso $x\notin A$.

Para mostrar que $X\setminus \{x\}$ es infinito, utilizaremos como subconjunto a $A\setminus\{f(x)\}$ y como función a la restricción de $f$ a $X\setminus\{x\}$. Debemos demostrar que $A\setminus\{f(x)\}$ es un subconjunto propio de $X\setminus \{x\}$ y que dicha restricción es una biyección.

Lo primero sucede ya que $$A\setminus\{f(x)\}\subsetneq A\subseteq X\setminus \{x\}.$$ El hecho de que $f:X\setminus \{x\}\to A\setminus\{f(x)\}$ sea una biyección es consecuencia directa de que originalmente $f:X\to A $ era una biyección. Los detalles quedan como tarea moral.

Si por el contrario $x\in A$, como $A\subsetneq X$ debe existir $x’\in X\setminus A$. Consideremos la función

\begin{align*}
&g: & &X & &\longrightarrow & (A\cup \{x’&\})\setminus \{x\}& \\
& & &y & &\mapsto & f(&y) &\text{ si } y\neq f^{-1}(x) \\
& & f^{-1}&(x) & &\mapsto & &x’ &
\end{align*}

Veamos que $g$ es una biyección entre $X$ y $(A\cup \{x’\})\setminus \{x\}$. Lo primero que notamos es que el codominio está bien definido ya que para todo $y\in X$ se tiene que $g(y)\neq x$ (¿por qué?).

Además es inyectiva, ya que si $g(y)=g(z)$, con $y\neq f^{-1}(x)\neq z$, entonces se tiene que $f(y)=g(y)=g(z)=f(z)$, y por la inyectividad de $f$ se tiene que $y=z$. Mientras que si $y=f^{-1}(x)$, tenemos que $g(y)=x’=g(z)$ si $z\neq f^{-1}(x)$, tendríamos que $x’=f(z)$, por lo que $x’\in A$ lo cual es absurdo, entonces $z=f^{-1}(x)=y$, así $g$ es efectivamente inyectiva.

Para probar que es suprayectiva, consideremos $z\in(A\cup \{x’\})\setminus \{x\}$. Si $z=x’$, entonces $g(f^{-1}(x))=x’$, mientras que si $z\in A\setminus \{x\}$, por la suprayectvidad de $f$, debe de existir $y$ tal que $f(y)=z$. Además $y\neq f^{-1}(x)$ ya que si lo fuera $f(f^{-1}(x))=x=z$, lo cual sería absurdo. Se tiene entonces que $g(y)=f(y)=z$.

Con esto probamos que $g$ es una biyección de $X$ a un subconjunto propio al que no pertenece $x$. Para concluir, aplicamos el primer caso.

$\square$

Usando el lema anterior es fácil dar un corolario importante sobre conjuntos finitos, cuya prueba queda como un ejercicio.

Corolario. Si $X$ es un conjunto finito, y $x$ es un conjunto arbitrario, entonces $X\cup \{x\}$ es también un conjunto finito.

Armados con este corolario, podemos dar uno de los teoremas importantes de esta entrada.

Teorema. Si $n$ es un natural, entonces $n$ es un conjunto finito.

Demostración. Procedamos por inducción. Si $n=0$, entonces $n=\emptyset$, entonces $n$ no tiene subconjuntos propios con los que pueda biyectarse, ya que no tiene subconjuntos propios. Entonces por vacuidad el vacío es finito.

Supongamos que $n$ es un natural finito. Debemos demostrar que $\sigma(n) $ es también finito. Pero como $\sigma(n)=n\cup\{n\}$, el paso inductivo es consecuencia del corolario anterior. Con esto concluimos la inducción.

$\square$

Caracterizando los conjuntos finito e infinitos

Ya probamos que cada número natural es finito y que el conjunto de todos los naturales es infinito. Lo siguiente que haremos es ver que estos conjuntos nos sirven para catalogar a todos los demás conjuntos en finitos o infinitos. Comenzamos con un lema bastante intuitivo: si con conjunto tiene un subconjunto infinito, entonces es infinito.

Lema 2. Si $X$ es infinito y $X\subset Y$ entonces $Y$ también es infinito.

Demostración. Como $X$ es infinito, existe una biyección $f$ entre $X$ y uno de sus subconjuntos propios $A$. Consideremos entonces $(Y\setminus X)\cup A\subsetneq Y$, y demos una biyección entre $Y$ y este conjunto dada por

\begin{align*}
&g: & &Y & &\longrightarrow &(Y\setminus &X)\cup A & \\
& & &y & &\mapsto & &y &\text{ si } y\notin Y\setminus X\\
& & &x & &\mapsto & f(&x) &\text{ si } x\in X
\end{align*}

Probaremos que esta función es una biyección. Primero, veamos que es inyectiva. Esto se debe a que si $g(x)=g(y)$ y $x\in X$, entonces $g(y)=g(x)=f(x)\in A\subset X$, entonces $g(y)$ está en $X$, y como $Y\setminus X$ es enviado en si mismo, debe pasar que $y$ también está en $X$, por lo que $f(y)=g(y)=f(x)$ y por la inyectividad de $f$, tenemos que $y=x$. Por el contrario, si $x\notin X$, se tiene que $g(x)=x=g(y)$ entonces $g(y)\notin X$, por lo que $y$ tampoco puede estar en $X$, así, $g(y)=y=x$.

Veamos ahora que la función es suprayectiva. Si $z\in(Y\setminus X)\cup A$, consideremos dos casos: $z\in Y\setminus X$ en cuyo caso $g(z)=z$, o $z\in A$, por lo que por la suprayectividad de $f$, debemos tener que existe $x\in X$ tal que $z=f(x)=g(x)$. Así, $g$ es suprayectiva y por lo tanto es una biyección..

$\square$

Ahora sí, pasamos a demostrar los teoremas con los que concluiremos la entrada.

Teorema. El conjunto de números naturales es el conjunto infinito más pequeño, es decir, que si $X$ es un conjunto infinito, entonces $\vert\mathbb{N}\vert\leq\vert X\vert$

Demostración. Como $X$ es infinito, debe ser distinto del vacío. Así, existe $x_0\in X$. Consideremos el conjunto $X\setminus \{x_0\}$, por el lema 1 que demostramos, este es de nuevo infinito. Una vez más, no es vacío, entonces existe $x_1\in X\setminus \{x_0\}$, y el conjunto $X\setminus\{x_0,x_1\}=(X\setminus \{x_0\})\setminus\{x_1\}$ será de nuevo infinito. Procediendo de manera recursiva, podemos dar una función

\begin{align*}
h: &\mathbb{N} \to X \\
& n \mapsto x_n
\end{align*}

tal que todos los $x_n$ son distintos entre sí (esto se puede demostrar inductivamente). Pero entonces $h$ es una función inyectiva de $\mathbb{N}$ al conjunto $X$, que es precisamente nuestra definición de que $\vert\mathbb{N}\vert\leq \vert X\vert $

$\square$

El regreso del teorema anterior es evidentemente cierto, es decir que si un conjunto $X$ cumple que $\vert\mathbb{N}\vert\leq \vert X\vert $, entonces $X$ es infinito. Queda como ejercicio demostrarlo.

Para finalizar la entrada, damos un resultado análogo al anterior, para conjuntos finitos.

Teorema. Si $X$ es un conjunto finito, entonces existe $n\in\mathbb{N}$ tal que $\vert X\vert =\vert n\vert$.

Demostración. Si $X=\emptyset$, entonces $\vert\emptyset\vert= \vert X\vert $. Si $X$ no es vacío, entonces existe $x_0\in X$. Consideremos entonces $X\setminus \{x_0\}$. Si este conjunto es vacío, significa que $X=\{x_0\}$ y claramente podríamos biyectarlo con el conjunto $\sigma(0)=\{0\}$. Si por el contrario, $X\setminus \{x_0\}\neq \emptyset$, podemos elegir $x_1\in X\setminus \{x_0\}$ y verificar la misma condición.

Necesariamente debemos de terminar en algún momento pues, de otro modo, podremos usar el teorema de recursión para construir una función inyectiva de $\mathbb{N}$ a $X$. Esto diría que $X$ sería infinito, lo cual sería absurdo.

Entonces debe ocurrir que existe una $n$ tal que $X\setminus\{x_0,x_1,…,x_n\}$ es vacío, por lo que $X=\{x_0,x_1,…,x_n\}$, y por lo tanto podemos biyectarlo con $\sigma(n)$

$\square$

Tarea moral

  • Supón que diriges un hotel con tantas habitaciones como números naturales. Supón que todas tus habitaciones se encuentran ocupadas, y de repente llega una persona solicitando un cuarto. ¿Cómo puedes hospedarlo sin desalojar a ningún cliente? Supón ahora que después llega un camión con tantas personas como números naturales, todas buscando un cuarto. ¿De qué forma puedes acomodarlos a ellos y a todos los clientes ya hospedados?
  • Completa los detalles de la prueba del lema 1.
  • Demuestra el corolario de la entrada: Si $X$ es un conjunto finito, y $x$ es un conjunto arbitrario, entonces $X\cup \{x\}$ es también un conjunto finito.
  • Demuestra que si $X$ es tal que $\vert\mathbb{N}\vert\leq \vert X\vert $, entonces $X$ es infinito.
  • Demuestra por inducción que si $X$ es infinito y $A$ es un subconjunto con $k$ elementos, entonces $X\setminus A$ es infinito. Si $A$ tiene tantos elementos como naturales, ¿el resultado sigue siendo cierto?

Más adelante…

Así como los conjuntos transitivos, la teoría que se desarrolla al estudiar las cardinalidades de los conjuntos es un área de estudio importante en la teoría de conjuntos. Aunque no lo veremos a profundidad, la teoría que acabamos de desarrollar es suficiente para comparar la cardinalidad de la mayoría de los conjuntos que veamos con total precisión. Esto será cierto para, conjuntos como $\mathbb{Z}$ (el de los números enteros) o $\mathbb{Q}$ (el de los números racionales). No será sino hasta que definamos el conjunto de números reales que tendremos un conjunto con una cardinalidad estrictamente mayor que la de $\mathbb{N}$.

En la siguiente entrada definiremos el orden de los naturales, para lo cual de nuevo pensaremos a los números naturales como conjuntos. Más aún, las propiedades que estudiamos en la entrada pasada, serán de suma importancia a la hora de definir el buen orden de un conjunto. Esta es una propiedad que usamos anteriormente sin prueba, cuando demostramos el teorema de Recursión.

Entradas relacionadas

Álgebra Lineal I: Espacios vectoriales

Introducción

En la primer unidad de este curso de álgebra lineal estudiamos a profundidad al conjunto $F^n$ con sus operaciones de suma y multiplicación por escalar. Luego, hablamos de las matrices en $M_{m,n}(F)$ y vimos cómo pensarlas como transformaciones lineales. Les dimos una operación de producto que en términos de transformaciones lineales se puede pensar como la composición. Luego, hablamos de la forma escalonada reducida de una matriz y cómo llevar cualquier matriz a esta forma usando reducción gaussiana. Esto nos permitió resolver sistemas de ecuaciones lineales homogéneos y no homogeneos, así como encontrar inversas de matrices. Las habilidades desarrolladas en la primer parte del curso serán de mucha utilidad para la segunda, en donde hablaremos de espacios vectoriales.

En esta entrada definiremos el concepto de espacio vectorial y vectores. Para hacer esto, tomaremos como motivación el espacio $F^n$, que ya conocemos bien. Sin embargo, hay muchos otros ejemplos de objetos matemáticos que satisfacen la definición que daremos. Hablaremos de algunos de ellos.

En el transcurso de la unidad también hablaremos de otros conceptós básicos, como la de subespacio. Hablaremos de conjuntos linealmente independientes, de generadores y de bases. Esto nos llevará a establecer una teoría de la dimensión de un espacio vectorial. Las bases son de fundamental importancia pues en el caso de dimensión finita, nos permitirán pensar a cualquier espacio vectorial «como si fuera $F^n$ «. Más adelante precisaremos en qué sentido es esto.

Después, veremos cómo pasar de un espacio vectorial a otro mediante transformaciones lineales. Veremos que las transformaciones entre espacios vectoriales de dimensión finita las podemos pensar prácticamente como matrices, siempre y cuando hayamos elegido una base para cada espacio involucrado. Para ver que estamos haciendo todo bien, debemos verificar que hay una forma sencilla de cambiar esta matriz si usamos una base distinta, y por ello estudiaremos a las matrices de cambio de base.

Esta fuerte relación que existe entre transformaciones lineales y y matrices nos permitirá llevar información de un contexto a otro. Además, nos permitirá definir el concepto de rango para una matriz (y transformación vectorial). Hasta ahora, sólo hemos distinguido entre matrices invertibles y no invertibles. Las matrices invertibles corresponden a transformaciones lineales que «guardan toda la información». El concepto de rango nos permitirá entender de manera más precisa cuánta información guardan las transformaciones lineales no invertibles.

Recordando a $F^n$

Antes de definir el concepto de espacio vectorial en toda su generalidad, recordemos algunas de las cosas que suceden con $F^n$. De hecho, puedes pensar en algo mucho más concreto como $\mathbb{R}^4$.

Como recordatorio, comenzamos tomando un campo $F$ y dijimos que, para fines prácticos, podemos pensar que se trata de $\mathbb{R}$ y $\mathbb{C}$. A los elementos de $F$ les llamamos escalares.

Luego, consideramos todas las $n$-adas de elementos de $F$ y a cada una de ellas le llamamos un vector. A $F^n$ le pusimos una operación de suma, que tomaba dos vectores en $F^n$ y nos daba otro. Además, le pusimos una operación de producto por escalar, la cual tomaba un escalar en $F$ y un vector en $F^n$ y nos daba como resultado un vector. Para hacer estas operaciones procedíamos entrada a entrada.

Sin embargo, hay varias propiedades que demostramos para la suma y producto por escalar, para las cuales ya no es necesario hablar de las entradas de los vectores. Mostramos que todo lo siguiente pasa:

  1. (Asociatividad de la suma) Para cualesquiera vectores $u,v,w$ en $F^n$ se cumple que $(u+v)+w=u+(v+w)$.
  2. (Conmutatividad de la suma) Para cualesquiera vectores $u,v$ en $F^n$ se cumple que $u+v=v+u$.
  3. (Identidad para la suma) Existe un vector $0$ en $F^n$ tal que $u+0=u=0+u$.
  4. (Inversos para la suma) Para cualquier vector $u$ en $F^n$ existe un vector $v$ en $F^n$ tal que $u+v=0=v+u$.
  5. (Distributividad para la suma escalar) Para cualesquiera escalares $a,b$ en $F$ y cualquier vector $v$ en $F^n$ se cumple que $(a+b)v=av+bv$.
  6. (Distributividad para la suma vectorial) Para cualquier escalar $a$ en $F$ y cualesquiera vectores $v,w$ en $F^n$ se cumple que $a(v+w)=av+aw$.
  7. (Identidad de producto escalar) Para la identidad multiplicativa $1$ del campo $F$ y cualquier vector $v$ en $F^n$ se cumple que $1v=v$.
  8. (Compatibilidad de producto escalar) Para cualesquiera dos escalares $a,b$ en $F$ y cualquier vector $v$ en $F^n$ se cumple que $(ab)v=a(bv)$.

Los primeros cuatro puntos son equivalentes a decir que la operación suma en $F^n$ es un grupo conmutativo. Resulta que hay varios objetos matemáticos que satisfacen todas estas ocho propiedades o axiomas de espacio vectorial, y cuando esto pasa hay muchas consecuencias útiles que podemos deducir. La esencia del álgebra lineal precisamente consiste en deducir todo lo posible en estructuras que tienen las ocho propiedades anteriores. Estas estructuras son tan especiales, que tienen su propio nombre: espacio vectorial.

Definición de espacio vectorial

Estamos listos para la definición crucial del curso.

Definición. Sea $F$ un campo. Un espacio vectorial sobre el campo $F$ es un conjunto $V$ con operaciones de suma y producto por escalar, que denotaremos por \begin{align*}
+:& V\times V \to V \quad \text{y}\\
\cdot:& F\times V \to V,
\end{align*}

para las cuales se cumplen las ocho propiedades de la sección anterior. En otras palabras:

  • El conjunto $V$ es un grupo conmutativo con la suma
  • Se tiene asociatividad para la suma escalar y la suma vectorial
  • Se tiene identidad y compatibilidad de la mulltiplicación escalar.

A los elementos de $F$ les llamamos escalares. A los elementos de $F^n$ les llamamos vectores. Para hacer restas, las definimos como $u-v=u+(-v)$, donde $-v$ es el inverso aditivo de $v$ con la suma vectorial. Usualmente omitiremos el signo de producto escalar, así que escribiremos $av$ en vez de $a\cdot v$ para $a$ escalar y $v$ vector.

La definición da la impresión de que hay que verificar muchas cosas. De manera estricta, esto es cierto. Sin embargo, de manera intuitiva hay que pensar que a grandes rasgos los espacios vectoriales son estructuras en donde podemos sumar elementos entre sí y multiplicar vectores por escalares (externos) sin que sea muy complicado.

Como ya mencionamos, el conjunto $F^n$ con las operaciones de suma y multiplicación por escalar que se hacen entrada por entrada es un espacio vectorial sobre $F$. En lo que resta de la entrada, hablaremos de otros ejemplos de espacios vectoriales que nos encontraremos frecuentemente.

Espacios vectoriales de matrices

Otros ejemplos de espacios vectoriales con los que ya nos encontramos son los espacios de matrices. Dado un campo $F$ y enteros positivos $m$ y $n$, el conjunto de matrices en $M_{m,n}(F)$ es un espacio vectorial en donde la suma se hace entrada a entrada y la multiplicación escalar también.

¿Qué es lo que tenemos que hacer para mostrar que en efecto esto es un espacio vectorial? Se tendrían que verificar las 8 condiciones en la definición de espacio vectorial. Esto lo hicimos desde la primer entrada del curso, en el primer teorema de la sección «Operaciones de vectores y matrices». Vuelve a leer ese teorema y verifica que en efecto se enuncian todas las propiedades necesarias.

Aquí hay que tener cuidado entonces con los términos que se usan. Si estamos hablando del espacio vectorial $F^n$, las matrices no forman parte de él, y las matrices no son vectores. Sin embargo, si estamos hablando del espacio vectorial $M_{m,n}(F)$, entonces las matrices son sus elementos, y en este contexto las matrices sí serían vectores.

Ejemplo. Sea $\mathbb{F}_2$ el campo con $2$ elementos. Consideremos $M_{2}(\mathbb{F}_2)$. Este es un espacio vectorial. Tiene $16$ vectores de la forma $\begin{pmatrix} a & b \\ c & d \end{pmatrix}$, en donde cada entrada es $0$ o $1$. La suma y la multiplicación por escalar se hacen entrada a entrada y con las reglas de $\mathbb{F}_2$. Por ejemplo, tenemos $$\begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix} + \begin{pmatrix} 0 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}.$$

$\square$

Espacios vectoriales de funciones

Ahora veremos algunos ejemplos de espacios vectoriales cuyos elementos son funciones. Esto puede parecer algo abstracto, pero en unos momentos veremos algunos ejemplos concretos que nos pueden ayudar a entender mejor.

Sea $F$ un campo y consideremos cualquier conjunto $X$. Consideremos el conjunto $V$ de todas las posibles funciones de $X$ a $F$. A este conjunto queremos ponerle operaciones de suma y de multiplicación por escalar.

Para definir la suma, tomemos dos funciones que van de $X$ a $F$, digamos $f:X\to F$ y $g:X\to F$. Definiremos a la función $f+g$ como la función que a cada $x$ en $X$ lo manda a $f(x)+g(x)$. Aquí estamos usando la suma del campo $F$. En símbolos, $(f+g):X\to F$ tiene regla de asignación $$(f+g)(x)=f(x)+g(x).$$

Para definir el producto por escalar, tomamos una función $f:X\to F$ y un escalar $c$ en el campo $F$. La función $cf$ será la función $cf:X\to F$ con regla de asignación $$(cf)(x)=cf(x)$$ para todo $x$ en $X$.

Resulta que el conjunto $V$ de funciones de $X$ a $F$ con estas operaciones de suma y producto, es un espacio vectorial. Podemos probar, por ejemplo, la asociatividad de la suma. Para ello, la primer cosa que necesitamos mostrar es la asociatividad de la suma. Es decir, que si tenemos $f:X\to F$, $g:X\to F$ y $h:X\to F$, entonces $$(f+g)+h = f+ (g+h).$$

Esta es una igualdad de funciones. Para que sea cierta, tenemos que verificarla en todo el dominio, así que debemos mostrar que para todo $x$ en $X$ tenemos que $$((f+g)+h)(x)=(f+(g+h))(x).$$

Para demostrar esto, usemos la definición de suma de funciones y la asociatividad de la suma del campo $F$. Con ello, podemos realizar la siguiente cadena de igualdades:

\begin{align*}
((f+g)+h)(x)&=(f+g)(x)+h(x)\\
&=(f(x)+g(x)) + h(x) \\
&=f(x) + (g(x)+h(x)) \\
&=f(x) + (g+h)(x)\\
&=(f+(g+h))(x).
\end{align*}

Así, la suma en $V$ es asociativa. El resto de las propiedades se pueden demostrar con la misma receta:

  • Se enuncia la igualdad de funciones que se quiere mostrar.
  • Para que dicha igualdad sea cierta, se tiene que dar en cada elemento del dominio, así que se evalúa en cierta $x$.
  • Se prueba la igualdad usando las definiciones de suma y producto por escalar, y las propiedades de campo de $F$.

Ejemplo. El ejemplo anterior es muy abstracto, pues $X$ puede ser cualquier cosa. Sin embargo, hay muchos espacios de funciones con los cuales se trabaja constantemente. Por ejemplo, si el campo es el conjunto $\mathbb{R}$ de reales y $X$ es el intervalo $[0,1]$, entonces simplemente estamos hablando de las funciones que van de $[0,1]$ a los reales.

Si tomamos $f:[0,1]\to \mathbb{R}$ y $g:[0,1]\to \mathbb{R}$ dadas por \begin{align*}f(x)&= \sin x – \cos x\\ g(x) &= \cos x + x^2,\end{align*} entonces su suma simplemente es la función $f+g:[0,1]\to \mathbb{R}$ definida por $(f+g)(x)=\sin x + x^2$. Si tomamos, por ejemplo, el escalar $2$, entonces la función $2f:[0,1]\to \mathbb{R}$ no es nada más que aquella dada por
$$(2f)(x)= 2\sin x – 2\cos x.$$

Así como usamos el intervalo $[0,1]$, pudimos también haber usado al intervalo $[-2,2)$, al $(-5,\infty]$, o a cualquier otro.

$\square$

Espacios vectoriales de polinomios

Otro ejemplo de espacios vectoriales que nos encontraremos frecuentemente son los espacios de polinomios. Si no recuerdas con precisión cómo se construyen los polinomios y sus operaciones, te recomendamos repasar este tema con material disponible aquí en el blog.

Dado un campo $F$ y un entero positivo $n$ usaremos $F[x]$ para referirnos a todos los polinomios con coeficientes en $F$ y usaremos $F_n[x]$ para referirnos a aquellos polinomios con coeficientes en $F$ y grado a lo más $n$. Aunque el polinomio cero no tiene grado, también lo incluiremos en $F_n[x]$.

Ejemplo. Si $F$ es $\mathbb{C}$, el campo de los números complejos, entonces todos los siguientes son polinomios en $\mathbb{C}[x]$: \begin{align*}p(x)&=(2+i)x^6 + (1+i),\\ q(x)&=3x^2+2x+1,\\ r(x)&=5x^7+(1-3i)x^5-1.\end{align*}

Tanto $p(x)$ como $q(x)$ están en $\mathbb{C}_6[x]$, pues su grado es a lo más $6$. Sin embargo, $r(x)$ no está en $\mathbb{C}_6[x]$ pues su grado es $7$.

El polinomio $q(x)$ también es un elemento de $\mathbb{R}[x]$, pues tiene coeficientes reales. Pero no es un elemento de $\mathbb{R}_1[x]$ pues su grado es demasiado grande.

$\square$

Recuerda que para sumar polinomios se tienen que sumar los coeficientes de grados correspondientes. Al hacer multiplicación por escalar se tienen que multiplicar cada uno de los coeficientes. De esta forma, si $f(x)=x^2+1$ y $g(x)=x^3+\frac{x^2}{2}-3x-1$, entonces $$(f+g)(x)=x^3+\frac{3x^2}{2}-3x,$$ y $$(6g)(x)=6x^3+3x^2-18x-6.$$

Resulta que $F[x]$ con la suma de polinomios y con el producto escalar es un espacio vectorial. Puedes verificar cada uno de los axiomas por tu cuenta.

Observa que la suma de dos polinomios de grado a lo más $n$ tiene grado a lo más $n$, pues no se introducen términos con grado mayor que $n$. Del mismo modo, si tenemos un polinomio con grado a lo más $n$ y lo multiplicamos por un escalar, entonces su grado no aumenta. De esta forma, podemos pensar a estas operaciones como sigue:
\begin{align*}
+:& F_n[x] \times F_n[x] \to F_n[x]\\
\cdot: & F\times F_n[x] \to F_n[x].
\end{align*}

De esta forma, $F_n[x]$ con la suma de polinomios y producto escalar de polinomios también es un espacio vectorial.

Tarea moral

  • A partir de los axiomas de espacio vectorial, muestra lo siguiente para un espacio vectorial $V$:
    • La identidad de la suma vectorial es única, es decir, que si existe otro elemento $e$ en $V$ tal que $u+e=u=e+u$ para todo $u$ en $V$, entonces $e=0$.
    • Que si $0$ es la identidad aditiva del campo $F$ y $v$ es cualquier vector en $V$, entonces $0v$ es la identidad de la suma vectorial. En símbolos, $0v=0$, donde el primer $0$ es el de $F$ y el segundo el de $V$.
    • Se vale la regla de cancelación para la suma vectorial, es decir, que si $u,v,w$ son vectores en $V$ y $u+v=u+w$, entonces $v=w$.
    • Se vale la regla de cancelación para el producto escalar, es decir, que si $a$ es un escalar no cero del campo $F$ y $u,v$ son vectores de $V$ para los cuales $au=av$, entonces $u=v$.
    • Que el inverso aditivo de un vector $v$ para la suma vectorial en $V$ es precisamente $(-1)v$, es decir, el resultado de hacer la multiplicación escalar de $v$ con el inverso aditivo del $1$ del campo $F$.
  • Sea $V$ un espacio vectorial sobre $\mathbb{R}$. Sean $u$, $v$ y $w$ vectores en $V$. Justifica la siguiente igualdad enunciando de manera explícita todos los axiomas de espacio vectorial que uses $$u+5v-3w+2u-8v= -3(w+v-u).$$
  • Termina de demostrar que en efecto los espacios de funciones con la suma y producto escalar que dimos son espacios de funciones.
  • Enlista todos los polinomios de $(\mathbb{F}_2)_3[x]$. A continuación hay algunos: $$0, x+1, x^2+x, x^3+1.$$ Para cada uno de ellos, encuentra quien es su inverso aditivo para la suma vectorial de $(\mathbb{F}_2)_3[x]$.

Más adelante…

Ya dimos la definición de espacio vectorial y vimos varios ejemplos. Dentro de algunas entradas veremos como conseguir muchos más espacios vectoriales.

En el último ejemplo pasa algo curioso: el espacio $F_n[x]$ es un subconjunto del espacio $F[x]$ y además es un espacio vectorial con las mismas operaciones que $F[x]$. Este es un fenómeno muy importante en álgebra lineal. Decimos que $F_n[x]$ es un subespacio de $F[x]$. En la siguiente entrada definiremos en general qué es un subespacio de un espacio vectorial y veremos algunas propiedades que tienen los subespacios.

Entradas relacionadas

Seminario de Resolución de Problemas: El teorema del valor medio

Introducción

Las funciones continuas son bonitas pues tienen la propiedad del valor intermedio y además alcanzan sus valores extremos. Las funciones diferenciables en un intervalo también tienen un par de teoremas que hablan acerca de algo que sucede «dentro del intervalo». Estos son el teorema de Rolle, del cual platicamos en la entrada anterior, y el teorema del valor medio. Ambos nos permiten encontrar en el intervalo un punto en el que la derivada tiene un valor específico.

Teorema de Rolle. Sean $a<b$ reales y $f:[a,b]\to \mathbb{R}$ una función continua en el intervalo $[a,b]$ y diferenciable en el intervalo $(a,b)$. Supongamos que $f(a)=f(b)$. Entonces existe un punto $c\in (a,b)$ tal que $f'(c)=0$.

Teorema del valor medio. Sean $a<b$ reales y $f:[a,b]\to \mathbb{R}$ una función continua en el intervalo $[a,b]$ y diferenciable en el intervalo $(a,b)$. Entonces existe un punto $c\in (a,b)$ tal que $$f'(c)=\frac{f(b)-f(a)}{b-a}.$$

En la entrada anterior vimos aplicaciones del teorema de Rolle a resolución de problemas matemáticos. En esta entrada hablaremos brevemente de la intuición geométrica del teorema del valor medio, de algunas de sus consecuencias inmediatas y de cómo usar al teorema y sus consecuencias para resolver problemas concretos.

La intuición geométrica del teorema del valor medio

El teorema del valor medio dice que una función diferenciable en $(a,b)$ y continua en $[a,b]$ cumple que hay un punto $c$ tal que el valor de la derivada en $c$ es igual a la pendiente de la recta que une los puntos del plano $(a,f(a))$ y $(b,f(b))$. En la siguiente figura, se marca en azul el punto $c$ en donde la pendiente de la tangente es lo que queremos, es decir, la pendiente entre los puntos rojos.

Intuición geométrica del teorema del valor medio
Intuición geométrica del teorema del valor medio

En varios problemas en los que se usa el teorema del valor medio, o bien en los cuales se pide demostrar enunciados parecidos a lo que dice el teorema del valor medio, es conveniente hacer una figura para entender la intuición geométrica del problema.

Consecuencias del teorema del valor medio

Si $f$ y $g$ son funciones continuas en $[a,b]$ y diferenciables en $(a,b)$ entonces se pueden deducir los siguientes resultados a partir del teorema del valor medio. No profundizamos en las demostraciones, y dejamos su verificación como un ejercicio de práctica.

Proposición. Si $f'(x)=0$ para toda $x$ en $(a,b)$, entonces $f$ es constante.

Proposición. Si $f'(x)=g'(x)$ para toda $x$ en $(a,b)$, entonces existe una constante $c$ tal que $f(x)=g(x)+c$ para toda $x$.

Proposición. Si $f'(x)>0$ para toda $x$ en $(a,b)$, entonces $f$ es una función estrictamente creciente. Si $f'(x)<0$ en $(a,b)$, entonces $f$ es una función estrictamente decreciente.

Cuando $f'(x)\geq 0$ y $f'(x)\leq 0$, tenemos resultados análogos que dicen que es no decreciente y no creciente, respectivamente.

Veamos algunas aplicaciones de los resultados anteriores.

Problema. Sean $f:\mathbb{R}\to \mathbb{R}$ y $g:\mathbb{R}\to \mathbb{R}$ funciones tales que para todo par de reales $x$ y $y$ se cumple que $$|f(x)+g(y)-f(y)-g(x)|\leq (x-y)^2.$$ Demuestra que $f$ y $g$ varían sólo por una constante aditiva.

Sugerencia pre-solución. Identifica cuál de las proposiciones anteriores puedes usar. Hay que tener cuidado con las hipótesis, pues en el enunciado no se habla de la diferenciabilidad de ninguna de las funciones involucradas.

Solución. Podría ser tentador usar la segunda proposición que enunciamos arriba, pero no tenemos hipótesis acerca de la diferenciabilidad de $f$ o de $g$. Sin embargo, vamos a mostrar que sí se puede mostrar que $f-g$ es diferenciable en todo real, y que su derivada es $0$ en todo real. Para ello, definamos $h=f-g$ y notemos que la hipótesis dice que $|h(x)-h(y)|\leq (x-y)^2.$

A partir de aquí, notemos que por la hipótesis, para $x\neq y$, $$\frac{|h(y)-h(x)|}{|y-x|}\leq \frac{(y-x)^2}{|y-x|} = |y-x|,$$ y el límite de esta última expresión conforme $y\to x$ es $0$, de modo que $$\left|\lim_{y\to x} \frac{h(y)-h(x)}{y-x}\right|=\lim_{y\to x} \frac{|h(y)-h(x)|}{|y-x|} = 0.$$ Esto muestra que para cualquier $x$ se tiene que $h$ es diferenciable en $x$ y su derivada es igual $0$ en todo $x$. De este modo, $h$ es una función constante, y por lo tanto existe un $c$ tal que $f(x)=g(x)+c$ para todo $x$.

$\square$

Veamos cómo el teorema del valor medio nos puede ayudar a demostrar desigualdades.

Problema. Sea $f:\mathbb{R}\to \mathbb{R}$ una función dos veces diferenciable tal que $f»(x)\geq 0$ para todo $x$. Demuestra que para todo par de reales $a$ y $b$ con $a<b$ se tiene que $$f\left(\frac{a+b}{2}\right) \leq \frac{f(a)+f(b)}{2}.$$

Sugerencia pre-solución. Haz una figura para convencerte de que el resultado es cierto. En el enunciado del problema, la función está siendo enunciada en tres valores, $a$, $b$ y $\frac{a+b}{2}$. Esto te dará una pista de dónde usar el teorema del valor medio.

Solución. Por el teorema del valor medio, existe un real $r$ en el intervalo $\left(a,\frac{a+b}{2}\right)$ para el cual $$\frac{f\left(\frac{a+b}{2}\right)-f(a)}{\frac{a+b}{2}-a} = f'(r).$$

De manera similar, existe un real $s$ en el intervalo $\left(\frac{a+b}{2},b\right)$ para el cual $$\frac{f(b)-f\left(\frac{a+b}{2}\right)}{b-\frac{a+b}{2}} = f'(s).$$

Como $f»(x)>0$ para todo real $x$, tenemos que $f’$ es una función creciente, y como $r<s$, tenemos entonces que $f'(r)<f'(s)$. De esta forma, $$ \frac{f\left(\frac{a+b}{2}\right)-f(a)}{\frac{a+b}{2}-a}<\frac{f(b)-f\left(\frac{a+b}{2}\right)}{b-\frac{a+b}{2}}.$$ Notemos que el denominador de ambos lados es $\frac{b-a}{2}$. Cancelando los denominadores y reacomodando los términos en esta desigualdad, obtenemos la desigualdad deseada.

$\square$

Problemas resueltos con el teorema del valor medio y otras técnicas

Veamos algunos problemas que combinan el teorema del valor medio con otras técnicas de solución de problemas.

Problema. Sea $f(x)$ una función diferenciable en $(0,1)$ y continua en $[0,1]$ con $f(0)=0$ y $f(1)=1$. Muestra que existen puntos distintos $a,b,c,d$ en el intervalo $[0,1]$ tales que $$\frac{1}{f'(a)}+ \frac{1}{f'(b)} + \frac{1}{f'(c)} + \frac{1}{f'(d)} = 4.$$

Sugerencia pre-solución. Para resolver el problema, hay que combinar el teorema del valor medio con el teorema del valor intermedio. El primer paso del problema es encontrar reales $p<q<r$ tales que $f$ valga en ellos $1/4$, $2/4$ y $3/4$.

Solución. Como $f(0)=0$, $f(1)=1$ y $0<1/4<1$, por el teorema del valor intermedio existe un real $p$ en $(0,1)$ tal que $f(p)=1/4$. De manera similar, existe un real $q$ en $(p,1)$ tal que $f(q)=2/4$ y un real $r$ en $(q,1)$ tal que $f(r)=3/4$.

Aplicando el teorema del valor medio a los intervalos $[0,p]$, $[p,q]$, $[q,r]$ y $[r,1]$ obtenemos reales $a,b,c,d$ respectivamente tales que

\begin{align*}
f'(a)&=\frac{f(p)-f(0)}{p-0}=\frac{1/4}{p}\\
f'(b)&=\frac{f(q)-f(p)}{q-p}=\frac{1/4}{q-p} \\
f'(c)&=\frac{f(r)-f(q)}{r-q}=\frac{1/4}{r-q} \\
f'(d)&=\frac{f(1)-f(r)}{1-r}=\frac{1/4}{1-r}.
\end{align*}

Estos son los valores de $a,b,c,d$ que queremos pues

\begin{align*}
\frac{1}{f'(a)}+ \frac{1}{f'(b)} + \frac{1}{f'(c)} + \frac{1}{f'(d)} &= 4(1-r+r-q+q-p+p)\\
&=4.
\end{align*}

$\square$

Problema. Sean $a$, $b$ y $c$ números distintos. Muestra que la siguiente expresión $$\frac{(x-a)(x-b)}{(c-a)(c-b)}+ \frac{(x-b)(x-c)}{(a-b)(a-c)} + \frac{(x-c)(x-a)}{(b-c)(b-c)}$$ no depende del valor de $x$.

Sugerencia pre-solución. Encuentra la derivada de la expresión. Puedes aprovechar la simetría para hacer menos cuentas.

Solución. Usando la regla del producto, la derivada del primer sumando es
\begin{align*}
\frac{(x-a)+(x-b)}{(c-a)(c-b)}&=\frac{(2x-a-b)(b-a)}{(a-b)(b-c)(c-a)}\\
&=\frac{2x(b-a)+a^2-b^2}{(a-b)(b-c)(c-a)}.
\end{align*}

Por simetría, las derivadas de los otros dos términos tienen el mismo denominador que esta y en el numerador tienen, respectivamente,
\begin{align*}
&2x(c-b)+b^2-c^2\quad \text{y}\\
&2x(a-c)+c^2-a^2,
\end{align*} de modo que al sumar las tres expresiones obtenemos cero. Así, la derivada de la expresión es cero y por lo tanto es constante.

$\square$

Hay otro argumento para resolver el problema anterior, que usa teoría de polinomios. A grandes rasgos, la expresión es un polinomio de grado $2$, que toma tres veces el valor $1$, de modo que debe ser igual al polinomio constante $1$.

Más problemas

Hay más ejemplos de problemas relacionados con el teorema del valor medio en la Sección 6.6 del libro Problem Solving through Problems de Loren Larson.

Seminario de Resolución de Problemas: El teorema del valor intermedio

Introducción

El teorema del valor intermedio nos dice que si $f: [a, b] \to \mathbb{R}$ es una función continua, entonces para todo $y$ entre $f(a)$ y $f(b)$, existe un número $c \in [a, b]$ tal que $f(c)=y$. La forma de pensar este teorema es que «las funciones continuas no se pueden saltar valores que quedan entre dos valores que ya tomaron», o bien «las funciones continuas no dan brincos en su imagen».

Veamos algunos problemas que se resuelven usando este teorema

Una aplicación directa del teorema del valor intermedio

Problema 1. Muestra que la ecuación $2x^3+7x^2-27x=-18$ tiene una solución en el intervalo $[-7,-5]$.

Sugerencia pre-solución. Formula un problema equivalente definiendo una función continua $f$ para la cual si $f(x)=0$, entonces $x$ es solución a la ecuación.

Solución. La ecuación la podemos ver como $2x^3+7x^2-27x+18=0$. Consideremos la función $$f(x)=2x^3+7x^2-27x+18.$$ Como $f(x)$ es una función polinomial, sabemos que es continua en $\mathbb{R}$, así que es continua en el intervalo $[-7,-5]$. Lo que queremos ver es que existe un $c$ entre $-7$ y $-5$, tal que $f(c)=0$. Para esto, tenemos que evaluar la función en $-7$ y en $-5$.

Tenemos que:

$f(-7)=-136$ y $f(-5)=78$.

Tenemos que $0$ está entre $-136$ y $78$. Así, por el teorema del valor intermedio, debe de existir un número $c$ entre $-7$ y $-5$ de tal forma que $f(c)=0$. Por lo tanto $2x^3+7x^2-27x=-18$ tiene una solución entre $-5$ y $-7$.

$\square$

Notemos que no se encontró el valor de la raíz de la ecuación, sin embargo mostramos la existencia de esta. Esta es una de las características del teorema del valor intermedio: exhibir la existencia de algo sin necesidad de encontrarlo explícitamente.

Definir una buena función

En ocasiones podemos definir dos funciones para un problema y hacerlas interactuar para obtener una sola función continua que nos permite resolver un problema.

Problema 2. Un montañista empezó a escalar una montaña el sábado a las 8:00 hrs y llegó a la cima a las 18:00 hrs del mismo día. Decidió pasar la noche en la cima de la montaña. El día domingo empezó a descender a las 8:00 hrs y llegó al punto de partida a las 18:00 hrs. Prueba que hubo una hora en la que en ambos días estuvo a la misma altura de la montaña.

Sugerencia pre-solución. Plantea el problema usando dos funciones continuas que denoten la altura conforme pasa el tiempo en ambos días. Tienes mucha flexibilidad, así que usa notación efectiva para simplificar los cálculos.

Solución. Veamos que para este problema, podemos establecer dos funciones continuas para describir el cambio de altura con respecto al tiempo en horas, una para el ascenso y otra para el descenso del montañista en ambos días.

Sean $h_1(t)$, y $h_2(t)$ las funciones que representan el ascenso y el descenso del montañista respectivamente. En otras palabras, $h_1(t)$ y $h_2(t)$ denotan la altura en la que está el montañista tras $t$ horas después de haber comenzado su ascenso y descenso, respectivamente. Como amabas funciones son continuas en el intervalo de tiempo $[0, 10]$ (esto es porque tardó $10$ horas para ascender y $10$ horas para descender), tenemos que la función $g(t)=h_2(t)-h_1(t)$ tiene que ser continua en $[0, 10]$ también.

Ahora bien, sea $M$ la altura en la cima de la montaña. Tenemos lo siguiente:

$h_1(0)=0$, $h_1(10)=M$ y $h_2(0)=M$, $h_2(10)=0$.

Así, $g(0)=M$ y $g(10)=-M$. A su vez, $0$ está entre $-M$ y $M$, por lo que aplicando el teorema del valor intermedio, debe de existir un $t_0$ en el intervalo $[0, 10]$ tal que $g(t_0)=0$.

Y como

$g(t)=h_2(t)-h_1(t)$,

entonces

$g(t_0)=h_2(t_0)-h_1(t_0)$

$0=h_2(t_0)-h_1(t_0)$

$h_1(t_0)=h_2(t_0).$

Con esto podemos concluir que en el tiempo $t_0$ el día domingo estuvo a la misma altura que el día sábado al tiempo $t_0$.

$\square$

Definir un buen intervalo

En algunas ocasiones no es directo qué valores tenemos que usar como los extremos del intervalo al que aplicaremos el teorema del valor intermedio. Un ingrediente adicional que se necesita en el siguiente problema es elegir de manera correcta el extremo derecho.

Problema 3. Prueba que si $n$ es un entero positivo y $x_0 > 0$, entonces existe un único número positivo $x$ tal que $x^n=x_0$.

Sugerencia pre-solución. Necesitarás modificar el problema un poco. Se quiere encontrar una solución a $x^n=x_0$. Limítate a encontrarla en el intervalo $[0,c]$ para una buena elección de $c$.

Solución. Sea $c$ un número mayor que $1$ de tal forma que $0<x_0<c$. Si consideramos la función $f(x)=x^n$, tenemos que dicha función es continua en el intervalo $[0, c]$, y tenemos que

$f(0)=0$ y $f(c)=c^n.$

Como $$0<x_0<c<c^n,$$ tenemos que $x_0$ está en el intervalo $(0,c)$, y por el teorema del valor intermedio, tenemos que existe $x$ en el intervalo $(0,c)$ tal que $f(x)=x_0$, que usando la definición de $f$ quiere decir que $$x^n=x_0.$$

No puede existir otro además de $x_0$ ya que la función $f(x)=x^n$ es creciente en el intervalo $[0,c]$.

$\square$

Más ejemplos

Puedes encontrar más problemas que se pueden resolver usando el teorema del valor intermedio en el libro Problem Solving Strategies de Loren Larson, en la Sección 6.2.

Un problema de saltamontes en cuarentena

Nota de Leo: Esta es una entrada invitada de Adán Medrano Martín del Campo. Nos platicará de un problema de saltamontes (de hecho, de dos) y de funciones en los enteros.

$$\text{Tu}\in \text{Casa}$$

$$\text{Tu}\in \text{Casa}$$

$$\text{Tu}\in \text{Casa}$$

Esto nos aconsejó muy atinadamente el Dr. Hugo López-Gatell Ramírez hace unos pocos días, ya que México y la mayoría del mundo está en cuarentena a causa de la enfermedad COVID19.

Cada vez más y más personas buscamos nuevas actividades para hacer en casa. Junto con Leo Martínez, David Torres (aka Gato) y Pablo Meré, administro el grupo de facebook InsOMMnia, el cual sirve de plataforma para discutir y realizar actividades olímpicamente productivas. A modo de amenizar la cuarentena, hice un video en vivo explicando la solución a un problema que me pareció particularmente agradable por varias razones:

En esta entrada, quisiera platicarles el problema y su solución. Antes de esto, recordemos el problema que apareció en la OMM 2019.

La Momia: OMM 2019

Problema 5. Sean $a>b$ dos números enteros positivos, primos relativos entre sí. En un camino recto, en el cual está marcado cada centímetro $n$, para todo entero $n$, un saltamontes hará algunos saltos comenzando en la marca de $0$ cm y siguiendo las siguientes reglas:

  • Cuando cierto minuto sea múltiplo de $a$ y no múltiplo de $b$, saltará $a$ centímetros hacia adelante.
  • Cuando cierto minuto sea múltiplo de $b$ y no múltiplo de $a$, saltará $b$ centímetros hacia atrás.
  • Cuando cierto minuto sea múltiplo de $a$ y múltiplo de $b$, saltará $a-b$ centímetros hacia adelante.
  • Cuando un minuto no es múltiplo de $a$ ni de $b$, el saltamontes no se mueve del lugar en el que está.

Determina todas las marcas a las que puede llegar el saltamontes.

Nota de Leo: Este es un excelente problema para explorarse buscando un patrón.

Sin dar un spoiler de la solución a dicho problema, el enunciado puede traducirse al siguiente problema de equivalente.

Problema 5′: Sean $a>b$ enteros primos positivos primos relativos entre sí y sea $f:\mathbb{N}\to\mathbb{Z}$ la función dada por
$$f(n)=a\left\lfloor\frac{n}{a}\right\rfloor-b\left\lfloor\frac{n}{b}\right\rfloor.$$
Determina la imagen de $f$.

Uno puede jugar un poco con la función definida arriba, y llegar a la respuesta usando propiedades de dicha función. El objetivo de mostrarles este enunciado equivalente, es que muchas veces ciertos problemas que hablan de ciertos procesos pueden describirse (y resolverse) en términos de funciones construidas apropiadamente.

El problema que resolveremos cae en la categoría opuesta, pues es un problema sobre una función, al cual se le puede dar una interpretación de un saltamontes haciendo… algo.

El Vampiro: Romania TST 2019

Problema: Sean $a<b<c$ enteros positivos y sea $f:\mathbb{N}\to \mathbb{N}$ una función dada por
$$f(n)=\begin{cases}
n-a & n>c \\
f(f(n+b)) & n\leq c
\end{cases}$$
Determina la cantidad de enteros positivos $n$ tales que $f(n)=n$.

«Y eso qué tiene que ver con un saltamontes?» podrías pensar en este momento. ¡Ha ha! Mira ahora este problema de saltamontes.

Problema’: Sean $a<b<c$ enteros positivos. Un saltamontes se encuentra sobre un entero $n>0$ en la recta real positiva, donde hay pasto en los enteros positivos menores o iguales que $c$, y lava en los enteros mayores a $c$. Inicialmente, el saltamontes tiene una vida, y mientras el saltamontes tenga al menos una vida, se dispondrá a saltar de la siguiente manera:

  • Si el saltamontes se encuentra en el pasto, el saltamontes gana una vida y salta $b$ enteros hacia adelante.
  • Si el saltamontes se encuentra en la lava, el saltamontes pierde una vida y salta $a$ enteros hacia atrás.

Cuando el saltamontes tiene $0$ vidas, este muere y deja de moverse. Determina todas las posiciones iniciales del saltamontes tal que el saltamontes morirá en su posición inicial.

Saltamontes, lava, pasto y vidas
Problema visto como vidas, pasto, lava y saltamontes.

A que no se lo esperaban. (Honestamente yo tampoco, pero últimamente tengo más tiempo libre). Tal vez este problema inspire algún mini juego en alguna entrega futura de The Legend of Zelda.

Y, ¿cómo resolvemos algo así?

El Santo: venciendo a la momia y al vampiro

Spoiler Alert:

A continuación resolveremos los problemas, en caso que estés intentándolos y no quieras ver sus soluciones

La clave para ambos problemas es: ¡usar residuos y propiedades de las funciones en juego!

Solución al problema 5 del nacional

Notemos que al dividir $n$ entre $a$ y entre $b$, obtenemos
$$n=a\left\lfloor \frac{n}{a}\right\rfloor+r_{a}$$ y $$n=b\left\lfloor \frac{n}{b}\right\rfloor+r_{b}$$
donde

$$0\leq r_{a}\leq a-1$$ y $$0\leq r_{b}\leq b-1$$
son precisamente los residuos que resultan de la división. Notemos entonces que

\begin{align*}
f(n)&=a\left\lfloor\frac{n}{a}\right\rfloor-b\left\lfloor\frac{n}{b}\right\rfloor\\
&=\left(n-b\left\lfloor \frac{n}{b}\right\rfloor\right)-\left(n-a\left\lfloor \frac{n}{a}\right\rfloor\right)\\
&=r_{b}-r_{a}
\end{align*}

por lo que $f(n)$ simplemente depende de la diferencia entre $r_{b}$ y $r_{a}$. Por el Teorema Chino del Residuo, o simplemente mirando exclusivamente a los múltiplos de $a$ y de $b$ entre $1$ y $ab$, aparecen como diferencia todos los posibles enteros en el intervalo

$$[-a+1, b-1]$$
lo cual compone la imagen de $f$, que es lo que buscábamos.

$\square$

¡Genial! Mirar los residuos fue clave en el problema de saltamontes del nacional. En particular, no lo usamos en nuestra solución, pero $f$ resulta ser una función periódica, con periodo $ab$. Esto es gracias a que $a$ y $b$ son primos relativos, y por lo tanto cada pareja de residuos $r_{a}, r_{b}$ se repiten exactamente cada $ab$ enteros.

La periodicidad será una propiedad clave en la solución del problema del selectivo rumano. Comenzamos mostrando una exploración del problema.

Exploración del problema del selectivo rumano

Los puntos $n$ tales que $f(n)=n$ son llamados puntos fijos. En la formulación como problema de saltamontes, corresponden a que el saltamontes muera justo donde empezó: «muera» es que ya no haya $f$, empieza con una vida, osea una $f$.

Notemos que si $n>c$, entonces $n$ no es un punto fijo, pues

$$f(n)=n-a\neq n.$$
Esto nos dice que los puntos fijos son menores o iguales que $c$. Ahora, notemos que (recordemos que $a<b<c$)

\begin{align*}
f(c)&=f(f(c+b))\\
&=f(c+b-a)=c+b-2a
\end{align*}

y esto nos lleva a considerar que números cercanos a $c$, dentro de un intervalo de tamaño $b-a$, tendrán un valor similar. En efecto, si $0\leq r<b-a$ entonces

\begin{align*}f(c-r)&=f(f(c-r+b))\\&=f(c-r+b-a)\\&=c-r+b-2a.\end{align*}
Ahora, veamos que restando $b-a$ a $c$, perdemos este patrón, pues

\begin{align*}f(c-b+a)&=f(f(c+a))\\&=f(c)\\&=c+b-2a\end{align*}
¡Hemos regresado a un valor ya conocido! Esto nos lleva a la hipótesis de que $f$ es periódica con periodo $b-a$ en el intervalo $[1, c]$. Formalicemos estas observaciones.

Un par de lemas para el problema rumano

La manera de enunciar formalmente las observaciones anteriores esto es, por ejemplo, via el siguiente lema:

Lema 1: Sea $n=c-r-k(b-a)$ un entero positivo menor o igual que $c$ donde $k\geq 0$ y $0\leq r<b-a$. Entonces
$$f(n)=c-r+b-2a.$$

(Prueba del lema 1): Procederemos por descenso en los enteros positivos. Construiremos una secuencia de valores iguales, con distinta cantidad de $f$’s compuestas, de la siguiente manera: comenzamos con
$$z_{0}=n=c-r-k(b-a)$$
y definimos

$$z_{i+1}=\begin{cases}
z_{i}-a & z_{i}>c \\
z_{i}+b & z_{i}\leq c
\end{cases}$$

para todo $i\geq 0$. Además, escribiremos

$$z_{i}=c-r-y_{i}b+x_{i}a$$
donde $x_{0}=y_{0}=k$, y ambas secuencias $\left\{x_{i}\right\}$ y $\left\{y_{i}\right\}$ decrecen, definiendo

$$x_{i+1}=\begin{cases}
x_{i}-1 & z_{i}>c \\
x_{i} & z_{i}\leq c
\end{cases}$$ y

$$y_{i+1}=\begin{cases}
y_{i} & z_{i}>c \\
y_{i}-1 & z_{i}\leq c
\end{cases}$$
Habiendo definido esto, tenemos que

$$f(n)=f^{(1+x_{i}-y_{i})}(z_{i})$$
para todo $i\geq 0$.


Observemos que si $y_{i}=-1$ entonces $z_{i}=c-r+b+x_{i}a>c$ si se cumple que $x_{i}\geq -1$. Más aún, observemos el siguiente lema:

Lema 2: Para todo $i\geq 0$, tenemos que $y_{i}\geq 0$ implica que $y_{i+1}\leq x_{i+1}$.

(Prueba del lema 2): Procedemos por inducción. Para $i=0$ esto es claro, pues
$$y_{1}=k-1<k=x_{1}.$$
Ahora, supongamos que $x_{i}\geq y_{i}\geq 0$. Si $x_{i}>y_{i}$ entonces

$$x_{i+1}\geq x_{i}-1\geq y_{i}\geq y_{i+1}.$$
Si $x_{i}=y_{i}$ entonces tenemos que

$$z_{i}=c-r-y_{i}(b-a)\leq c$$
por lo que $z_{i+1}=z_{i}+b$ y esto implica que

$$x_{i+1}=x_{i}>y_{i}-1=y_{i+1}.$$

$\square$

Hemos probado pues que las secuencias $\left\{x_{i}\right\}$ y $\left\{y_{i}\right\}$ decrecen, y mientras $y_{i}\geq 0$, tendremos que $x_{i+1}\geq y_{i+1}$. ¿Cómo hemos de proseguir con esto?

La clave es notar la existencia de la menor $m$ tal que $y_{m}=-1$, donde es claro que $y_{m-1}=0$. Si $m=1$ entonces $y_{0}=x_{0}=k=0$, y ya hemos cubierto ese caso arriba, así que asumiremos que $m>1$. Tenemos que $y_{m-2}\geq 0$ por lo que, por el lema 2,

$$x_{m-1}\geq y_{m-1}=0$$
y como $y_{m}=y_{m-1}-1$ entonces $x_{m}=x_{m-1}\geq 0$. Esto implica que

\begin{align*}z_{m}&=c-r+b+x_{m}a\\&\geq c-r+b\\&>c\end{align*}
por lo que para todo $j>m$ se tiene que $x_{j+1}=x_{j}-1$

$$z_{m+x_{m}+1}=c-r+b-a$$
y tenemos que $y_{m+x_{m}+1}=x_{m+x_{m}+1}=-1$, lo que muestra que

\begin{align*}f(n)&=f(z_{m+x_{m}+1})\\&=f(c-r+b-a)\\&=c-r+b-2a.\end{align*}

$\square$

Juntando todo

Vaya, después de arduo trabajo hemos mostrado la periodicidad de $f$. Lo que falta únicamente, es usar esto para hacer una conclusión sobre los puntos fijos. Notemos que los únicos valores de $f$ en el dominio $[1, c]$ son $c-r+b-2a$ para $0\leq r<b-a$, así que solo estos valores pueden ser puntos fijos de $f$. De hecho, cada uno de esos valores es un punto fijo si y solo si podemos encontrar una $k\geq 0$ tal que

$$c-r-k(b-a)=c-r+b-2a$$, lo cual sucede si y sólo si $(k+1)(b-a)=a$, o bien justo cuando $b-a\mid a$, por lo que si $b-a$ divide a $a$, todos nuestros $b-a$ valores son puntos fijos, y si $b-a$ no divide a $a$, ningún valor es un punto fijo. Hemos concluido entonces.

$\square$

Antes de regresar a la cuarentena

Espero que hayan pasado un rato agradable pensando en este problema, y espero que hayan entendido 4 lecciones:

  • Quédate en casa
  • Quédate en casa
  • Quédate en casa
  • Es una buena idea usar residuos y secuencias jugando con enteros.

Con esto me despido y, ¡hasta la próxima!