El problema
Les comparto un problema que se me ocurrió en las (muchas) horas que he pasado en el carro escuchando música, cuando vivía en la Ciudad de México. El estéreo del carro ordena las canciones alfabéticamente. Tiene un botón que permite «avanzar una canción». Pero a veces tarda mucho: si estoy escuchando «Adele – Hello», hay que apretar el botón muchas veces para llegar a «Shakira – Dónde están los ladrones».
En esas épocas descubrí una estrategia «intuitiva» para llegar más rápido a la canción. La idea es la siguiente: pasar temporalmente al modo de «canción aleatoria», apretar el botón unas cuantas veces para acercarme a la canción que quiero (en el ejemplo anterior, digamos que después de dos o tres veces el botón me lleva a «Paquita la del Barrio – Rata de dos Patas»), y de ahí quitar el aleatorio y avanzar normal. Eso, intuitivamente, siempre me ahorró muchos pasos. El problema consiste en encontrar la estrategia óptima, en donde se permiten mezclar pasos normales y aleatorios.
Para eso, voy a plantear un problema muy concreto. De aquí en adelante supondré que el lector sabe un poco de probabilidad. Pensemos que hay
En la imagen de aquí abajo se muestra un ejemplo de una forma de apretar los botones para

Ese es el enunciado del problema. De aquí en adelante empiezo a hablar de ideas para resolverlo, así que si quieres intentarlo, este es el momento correcto.
Primeras ideas
Notemos que la estrategia «siempre
Sin embargo, suena a que la estrategia esbozada al inicio de esta entrada es intuitivamente mejor: usar el
La solución
Vamos a mostrar que la mejor estrategia en valor esperado es la siguiente: «apretar el botón
El primer argumento es que en cada paso, lo que hace la estrategia sólo depende de en qué canción estamos. En efecto, el paso
El segundo argumento es que, si en algún momento de la estrategia usamos el botón
Ahora, afirmo lo siguiente. Si la estrategia óptima es apretar
Lo que acabamos de probar es que la estrategia óptima se ve de la siguiente manera para algún entero
A estas alturas ya podemos calcular explícitamente el valor esperado de pasos en esta estrategia. El evento «llegar a alguno de los últimos
Así, en total usamos
Aquí arriba hicimos un poquito de trampa. En realidad
Conclusión y otros problemas
Está cool que hayamos bajado la cantidad de pasos que se necesitan de valor esperado de algo que era
Hacer esta estrategia en la vida real es un poco complicado pues los estéreos no muestran el número exacto de la canción en la que se está, además de que es difícil memorizar a qué canción le toca qué número. Pero a veces sí muestran el nombre de la canción y más o menos «se le puede aproximar».
Hay un par de variantes interesantes. Una es ¿qué sucede si además de tener botón
La otra variante es la siguiente. La estrategia óptima, como está descrita arriba, tiene un problema: es posible que nunca termine, o que tome muchísimos pasos en terminar (esto será muy improbable y por eso el valor medio se compensa). Así, imaginemos que queremos la restricción adicional de que la estrategia que usemos nunca use más de, digamos, 4n pasos. En esta variante: ¿cuál es la estrategia óptima? ¿cuántos pasos toma?
¿Ahora qué?
Si te gustó esta entrada, puedes compartirla o revisar otras relacionadas con matemáticas a nivel universitario:
- Una demostración del teorema de la función inversa
- Un ejemplo de aplicación del teorema de la función inversa
- Los teoremas fundamentales de los cuadraditos, o bien, una introducción amigable a los teoremas fundamentales del cálculo
- Un problema de probabilidad y escuchar música
- Mariposa de siete equivalencias de invertibilidad de matrices