Archivo de la etiqueta: geometría

Álgebra Superior II: Desigualdades de polinomios reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior mostramos el teorema de factorización para polinomios con coeficientes reales. Lo que haremos ahora es ver que podemos aplicarlo en la resolución de desigualdades de polinomios en $\mathbb{R}[x]$. El objetivo es que, al final de la entrada, entendamos cómo se pueden resolver problemas como los siguientes:

Problema 1. Determina todos los números $x$ en $\mathbb{R}$ para los cuales $$x^6-12x^4-49x^2-30 > 3x^5-48x^3-51x+6.$$

Problema 2. Determina todos los números $x$ en $\mathbb{R}$ para los cuales $$\frac{1}{x}>x^3-x^2+1.$$

Antes de hablar de resolución de desigualdades de polinomios, veremos una forma alternativa de factorizar en $\mathbb{R}[x]$ usando potencias.

Teorema de factorización de polinomios reales con potencias

De acuerdo al teorema de factorización en $\mathbb{R}[x]$, un polinomio $p(x)$ se puede factorizar de manera única en factores lineales y factores cuadráticos con discriminante negativo. De ser necesario, podemos agrupar los factores lineales iguales y reordenarlos para llegar a una factorización de la forma $$a(x-r_1)^{\alpha_1}\cdots(x-r_m)^{\alpha_m}(x^2-b_1x+c_1)\cdots (x^2-b_{n}x+c_{n}),$$ en donde:

  • $a$ es un real distinto de cero,
  • $\alpha_1,\ldots,\alpha_m$ y $n$ son enteros positivos tales que $2n+\sum_{i=1}^m \alpha_i$ es igual al grado de $p(x)$,
  • para cada $i$ en $\{1,\ldots,m\}$ se tiene que $r_i$ es raíz real de $p(x)$ y $r_1<r_2<\ldots<r_m$
  • para cada $j$ en $ \{1,\ldots,n\}$ se tiene que $b_j,c_j$ son reales tales que $b_j^2-4c_j<0$.

Observa que los $r_i$ son ahora distintos y que están ordenados como $r_1<\ldots<r_m$. De aquí, obtenemos que $(x-r_i)^{\alpha_i}$ es la mayor potencia del factor lineal $x-r_i$ que divide a $p(x)$. Este número $\alpha_i$ se usa frecuentemente, y merece una definición por separado.

Definición. Sea $p(x)$ un polinomio en $\mathbb{R}[x]$ y $r$ una raíz de $p(x)$. La multiplicidad de $r$ como raíz de $p(x)$ es el mayor entero $\alpha$ tal que $$(x-r)^\alpha \mid p(x).$$ Decimos también que $r$ es una raíz de multiplicidad $\alpha$.

Ejemplo. El polinomio $k(x)=x^4-x^3-3x^2+5x-2$ se factoriza como $(x-1)^3(x+2)$. Así, la multiplicidad de $1$ como raíz de $k(x)$ es $3$. Además, $-2$ es una raíz de $k(x)$ de multiplicidad $1$.

$\triangle$

Después hablaremos de una forma práctica en la que podemos encontrar la multiplicidad de una raíz, cuando hablemos de continuidad de polinomios y sus derivadas.

Desigualdades de polinomios reales factorizados

Supongamos que tenemos un polinomio $p(x)$ no constante en $\mathbb{R}[x]$ para el cual conocemos su factorización en la forma $$a(x-r_1)^{\alpha_1}\cdots(x-r_m)^{\alpha_m}(x^2-b_1x+c_1)\cdots (x^2-b_{n}x+c_{n}),$$ y que queremos determinar para qué valores reales $r$ se cumple que $$p(r)>0.$$

Daremos por cierto el siguiente resultado, que demostraremos cuando hablemos de continuidad de polinomios.

Proposición. Las evaluaciones en reales de un polinomio cuadrático y mónico en $\mathbb{R}[x]$ de discriminante negativo, siempre son positivas.

Lo que nos dice este resultado es que, para fines de la desigualdad que queremos resolver, podemos ignorar los factores cuadráticos en la factorización de $p(x)$ pues

$$a(x-r_1)^{\alpha_1}\cdots(x-r_m)^{\alpha_m}(x^2-b_1x+c_1)\cdots (x^2-b_{n}x+c_{n})$$ y $$a(x-r_1)^{\alpha_1}\cdots(x-r_m)^{\alpha_m}$$ tienen el mismo signo.

Por la miasma razón, podemos ignorar aquellos factores lineales con exponente par, y de los de exponente impar, digamos $(x-r)^{2\beta +1}$ obtenemos una desigualdad equivalente si los remplazamos por exponente $1$, pues $(x-r)^{2\beta}$ es positivo y por lo tanto no cambia el signo de la desigualdad si lo ignoramos.

En resumen, cuando estamos resolviendo una desigualdad del estilo $p(x)>0$ podemos, sin cambiar el conjunto solución, reducirla a una de la forma $$q(x):=a(x-r_1)(x-r_2)\ldots(x-r_m)>0.$$ La observación clave para resolver desigualdades de este estilo está resumida en el siguiente resultado.

Proposición. Tomemos un polinomio $q(x)$ en $\mathbb{R}[x]$ de la forma $$q(x)=a(x-r_1)(x-r_2)\ldots(x-r_m)$$ con $r_1<\ldots<r_m$ reales.

Si $m$ es par:

  • Para reales $r$ en la unión de intervalos $$(-\infty,r_1)\cup(r_2,r_3)\cup\ldots \cup (r_{m-2},r_{m-1})\cup (r_m,\infty),$$ la evaluación $q(r)$ tiene el mismo signo que $a$
  • Para reales $r$ en la unión de intervalos $$(r_1,r_2)\cup(r_3,r_4)\cup\ldots \cup (r_{m-3},r_{m-2})\cup (r_{m-1},r_m),$$ la evaluación $q(r)$ tiene signo distinto al de $a$.

Si $m$ es impar:

  • Para reales $r$ en la unión de intervalos $$(r_1,r_2)\cup(r_3,r_4)\cup\ldots \cup (r_{m-2},r_{m-1})\cup (r_m,\infty),$$ la evaluación $q(r)$ tiene el mismo signo que $a$.
  • Para reales $r$ en la unión de intervalos $$(-\infty,r_1)\cup(r_2,r_3)\cup\ldots \cup (r_{m-3},r_{m-2})\cup (r_{m-1},r_m),$$ la evaluación $q(r)$ tiene signo distinto al de $a$.

Demostración. El producto $(r-r_1)(r-r_2)\ldots(r-r_m)$ es positivo si y sólo si tiene una cantidad par de factores negativos. Si $r>r_m$, todos los factores son positivos, y por lo tanto $q(r)$ tiene el mismo signo que $a$ cuando $r$ está en el intervalo $(r_m,\infty)$.

Cada que movemos $r$ de derecha a izquierda y cruzamos un valor $r_i$, cambia el signo de exactamente uno de los factores, y por lo tanto la paridad de la cantidad de factores negativos. El resultado se sigue de hacer el análisis de casos correspondiente.

$\square$

Veamos cómo podemos utilizar esta técnica para resolver desigualdades polinomiales que involucran a un polinomio que ya está factorizado en irreducibles.

Problema 1. Determina para qué valores reales $x$ se tiene que $$-2(x-5)^7(x+8)^4(x+2)^3(x+10)(x^2-x+2)^3$$ es positivo.

Solución. Por la discusión anterior, podemos ignorar el polinomio cuadrático del final, pues es irreducible. También podemos ignorar los factores lineales con potencia par, y podemos remplazar las potencias impares por unos. Así, basta con encontrar los valores reales de $x$ para los cuales $$q(x)=-2(x-5)(x+2)(x+10)$$ es positivo. Tenemos $3$ factores, así que estamos en el caso de $m$ impar en la proposición.

Las tres raíces, en orden, son $-10, -2, 5$. Por la proposición, para $x$ en la unión de intervalos $$(-\infty,-10)\cup (-2,5)$$ se tiene que $q(x)$ tiene signo distinto al de $a=-2$ y por lo tanto es positivo. Para $x$ en el conjunto $$(-10,-2)\cup (5,\infty)$$ se tiene que $q(x)$ tiene signo igual al de $a=-2$, y por lo tanto es negativo. De esta forma, la respuesta es el conjunto $$(-\infty,-10)\cup (-2,5).$$

Puedes dar clic aquí para ver en GeoGebra las gráfica de $q(x)$ y del polinomio original, y verificar que tienen el mismo signo en los mismos intervalos.

$\triangle$

Si estamos resolviendo una desigualdad y el valor de $a$ en la factorización es positivo, es un poco más práctico ignorarlo desde el principio, pues no afecta a la desigualdad.

Problema 2. Determina para qué valores reales $x$ se tiene que $$7(x+7)^{13}(x+2)^{31}(x-5)^{18}(x^2+1)$$ es positivo.

Solución. Tras las cancelaciones correspondientes, obtenemos la desigualdad equivalente $$(x+7)(x+2)>0.$$

Las raíces del polinomio que aparece son $-7$ y $-2$. De acuerdo a la proposición, estamos en el caso con $m$ par. De esta forma, la expresión es negativa en el intervalo $(-7,-2)$ y es positiva en la unión de intervalos $$(-\infty,-7)\cup (-2,\infty).$$

$\triangle$

Otras desigualdades de polinomios y manipulaciones algebraicas

Si tenemos otras expresiones polinomiales, también podemos resolverlas con ideas similares, solo que a veces se tienen que hacer algunas manipulaciones previas para llevar la desigualdad a una de la forma $p(x)>0$.

Problema. Determina todos los números $x$ en $\mathbb{R}$ para los cuales $$x^6-12x^4-49x^2-30 > 3x^5-48x^3-51x+6.$$

Solución. El problema es equivalente a encontrar los reales $x$ para los cuales $$x^6-3x^5+12x^4+48x^3-29x^2+51x-36>0.$$ El polinomio del lado izquierdo se puede factorizar como $(x-3)^2(x-1)(x+4)(x^2+1)$, así que obtenemos el problema equivalente $$(x-3)^2(x-1)(x+4)(x^2+1)>0,$$ que ya sabemos resolver. El resto de la solución queda como tarea moral.

Puedes ver la gráfica del polinomio $$(x-3)^2(x-1)(x+4)(x^2+1)$$ en GeoGebra si das clic aquí.

$\triangle$

Tener cuidado al multiplicar por denominadores

Hay que tener cuidado al realizar algunas manipulaciones algebraicas, pues pueden cambiar el signo de la desigualdad que estamos estudiando. Veamos un ejemplo donde sucede esto.

Problema. Determina todos los números $x$ en $\mathbb{R}$ para los cuales $$\frac{1}{x}>x^3-x^2+1.$$

Solución. La expresión no está definida en $x=0$, pues se anula un denominador. Supongamos entonces que $x\neq 0$, y recordémoslo al expresar la solución final. Vamos a multiplicar la desigualdad por $x$, pero tenemos que hacer casos.

Si $x>0$, entonces el signo de desigualdad no se altera y obtenemos la desigualdad equivalente $$0>x^4-x^3+x-1=(x-1)(x+1)(x^2-x+1).$$ El factor cuadrático es irreducible y lo podemos ignorar. Si estuviéramos trabajando en todo $\mathbb{R}$, el conjunto solución sería el intervalo $(-1,1)$. Sin embargo, tenemos que restringir este conjunto solución sólo al caso en el que estamos, es decir, $x>0$. Así, para este caso sólo los reales en $(0,1)$ son solución.

Si $x<0$, entonces el signo de la desigualdad sí se altera, y entonces obtenemos la desigualdad equivalente $$0<x^4-x^3+x-1=(x-1)(x+1)(x^2-x+1).$$ De nuevo podemos ignorar el factor cuadrático. La desigualdad tiene solución en todo $\mathbb{R}$ al conjunto $(-\infty,-1)\cup (1,\infty)$, pero en este caso debemos limitarlo adicionalmente con la restricción $x<0$. De este modo, las soluciones para este caso están en el intervalo $(-\infty,-1)$.

Ahora sí, juntando ambos casos, tenemos que el conjunto solución final es $$(-\infty,-1)\cup(0,1).$$

Puedes ver la gráfica en GeoGebra de $\frac{1}{x}-x^3+x^2-1$ dando clic aquí. Ahí puedes verificar que esta expresión es positiva exactamente en el conjunto que encontramos.

$\triangle$

Más adelante…

Como queda claro, resulta ser útil tener un polinomio en su forma factorizada para resolver desigualdades de polinomios reales. En los ejemplos que dimos en esta entrada, se dieron las factorizaciones de los polinomios involucrados. En el resto del curso veremos herramientas que nos permitirán encontrar la factorización de un polinomio o, lo que es parecido, encontrar sus raíces:

  • Veremos propiedades de continuidad de polinomios para mostrar la existencia de raíces para polinomios reales en ciertos intervalos.
  • El teorema del factor nos dice que si $r$ es raíz de $p(x)$, entonces $x-r$ divide a $p(x)$. Sin embargo, no nos dice cuál es la multiplicidad de $r$. Veremos que la derivada de un polinomio nos puede ayudar a determinar eso.
  • También veremos el criterio de la raíz racional, que nos permite enlistar todos los cantidatos a ser raíces racionales de un polinomio $p(x)$ con coeficientes racionales.
  • Finalmente, veremos que para los polinomios de grado $3$ y $4$ hay formas de obtener sus raíces de forma explícita, mediante las fórmulas de Cardano y de Ferrari.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Completa la solución del problema enunciado en la sección de manipulaciones algebraicas.
  2. Encuentra el conjunto solución de números reales $x$ tales que $$(x+1)(x+2)^2(x+3)^3(x+4)^4>0.$$
  3. Determina las soluciones reales a la desigualdad $$\frac{x-1}{x+2}>\frac{x+2}{x-1}.$$ Ten cuidado con los signos. Verifica tu respuesta en este enlace de GeoGebra, que muestra la gráfica de $f(x)=\frac{x-1}{x+2}-\frac{x+2}{x-1}$.
  4. Realiza las gráficas de otros polinomios de la entrada en GeoGebra para verificar las soluciones dadas a las desigualdades de polinomios.
  5. Revisa esta entrada, en donde se hablan de aplicaciones de desigualdades polinomiales para un problema de un concurso de matemáticas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Seminario de Resolución de Problemas: Desigualdad de Cauchy-Schwarz

Por Leonardo Ignacio Martínez Sandoval

Introducción

Seguimos con las entradas de temas de desigualdades. Con anterioridad ya hablamos de desigualdades básicas y de desigualdades con medias. En esta ocasión estudiaremos una desigualdad muy versátil: la desigualdad de Cauchy-Schwarz.

En su versión más simple, lo que dice la desigualdad de Cauchy-Schwarz es lo siguiente.

Desigualdad (de Cauchy-Schwarz). Para cualesquiera números reales $a_1,\ldots,a_n$ y $b_1,\ldots,b_n$ se tiene que $$|a_1b_1+\ldots+a_nb_n| \leq \sqrt{a_1^2+\ldots+a_n^2} \sqrt{b_1^2+\ldots+b_n^2}.$$

Primero, veremos cómo se demuestra esta desigualdad. Luego, veremos varios problemas en los que se puede aplicar. Finalmente, hablaremos un poco de sus extensiones a espacios vectoriales.

La demostración polinomial de la desigualdad de Cauchy-Schwarz

Una forma de demostrar la desigualdad de Cauchy-Schwarz es usando inducción sobre $n$. Hay otra demostración usando polinomios. Veamos esa demostración, pues tiene la idea útil de usar argumentos polinomiales para demostrar igualdades.

Consideremos la expresión $$p(t)=\sum_{i=1}^n (a_i+b_i t)^2.$$ Como es una suma de cuadrados, esta expresión es no negativa. Haciendo los cuadrados, y desarrollando la suma, podemos escribirla de la siguiente forma, que nos dice que es un polinomio cuadrático en $t$:

\begin{align*}
\sum_{i=1}^n (a_i+b_i t)^2&=\sum_{i=1}^n \left(a_i^2 + 2a_ib_i t + b_i^2 t^2\right)\\
&=\sum_{i=1}^n a_i^2 + \left(2\sum_{i=1}^n a_ib_i \right)t + \left(\sum_{i=1}^n b_i^2\right)t^2.
\end{align*}

De esta forma $p(t)$ es un polinomio cuadrático y siempre toma valores no negativos. Así, a lo más puede tener una raíz $t$, por lo que su discriminante es menor o igual a $0$:

$$ \left(2\sum_{i=1}^n a_ib_i \right)^2-4\left(\sum_{i=1}^n a_i^2\right)\left(\sum_{i=1}^n b_i^2\right)\leq 0$$

Al pasar el segundo término sumando al otro lado y dividir entre $4$ queda

$$\left(\sum_{i=1}^n a_ib_i \right)^2\leq \left(\sum_{i=1}^n a_i^2\right)\left(\sum_{i=1}^n b_i^2\right).$$

Al sacar raíz cuadrada de ambos lados hay que tener cuidado de poner un valor absoluto al lado izquierdo. Al hacer esto, se obtiene el resultado deseado: $$\left|\sum_{i=1}^n a_ib_i \right|\leq \sqrt{\sum_{i=1}^n a_i^2}\cdot \sqrt{\sum_{i=1}^n b_i^2}.$$

Observa que la igualdad se da si y sólo si el discriminante es $0$, lo cual sucede si y sólo si el polinomio tiene una raíz $t$. Cuando esto pasa, cada uno de los sumandos al cuadrado de $p(t)$ debe ser $0$. Así, existe un real $t$ tal que $a_i=-tb_i$ para todo $i=1,\ldots,n$. Esto lo podemos decir en términos vectoriales como que «la igualdad se da si y sólo si el vector $(a_1,\ldots,a_n)$ es un múltiplo escalar del vector $(b_1,\ldots,b_n)$ » .

Un problema sobre acotar el valor de una variable

Problema. Sean $a,b,c,d$ números reales tales que
\begin{align*}
a+b+c+d&=6\\
a^2+b^2+c^2+d^2&=12.
\end{align*}
¿Cuál es el máximo valor que puede tener $d$?

Sugerencia. Aplica la desigualdad de Cauchy-Schwarz a las ternas $(a,b,c)$ y $(1,1,1)$.

Solución. Aplicando la desigualdad a las ternas $(a,b,c)$ y $(1,1,1)$ obtenemos que $$|a+b+c|\leq \sqrt{a^2+b^2+c^2}\cdot{\sqrt{3}}.$$ Usando las hipótesis sobre $a,b,c,d$, tenemos que esta desigualdad es equivalente a $|6-d|\leq \sqrt{3}\cdot {\sqrt{12-d^2}$. Elevando al cuadrado de ambos lados, obtenemos las desigualdades equivalentes
\begin{align*}
36-12d+d^2&\leq 3(12-d^2)\\
36-12d+d^2&\leq 36-3d^2\\
4d^2-12d&\leq 0\\
4d(d-3)&\leq 0.
\end{align*}

Para que se satisfaga esta desigualdad, tiene que pasar o bien que simultáneamente $d\leq 0$ y $d\geq 3$ (lo cual es imposible), o bien que simultáneamente $d\geq 0$ y $d\leq 3$. En conclusión, esto acota el máximo valor posible de $d$ con $3$.

En efecto, existe una solución con $d=3$. De acuerdo al caso de igualdad de la desigualdad de Cauchy-Schwarz, debe pasar cuando $(a,b,c)$ es un múltiplo escalar de $(1,1,1)$, es decir, cuando $a=b=c$. Como $a+b+c+d=6$ y queremos $d=3$, esto forza a que $a=b=c=1$. Y en efecto, tenemos que con esta elección $$a^2+b^2+c^2+d^2=1+1+1+9=12.$$

$\square$

Aplicando Cauchy-Schwarz en un problema con el circunradio

A veces podemos aprovechar información implícita en un problema geométrico y combinarla con la desigualdad de Cauchy-Schwarz. Veamos un problema en el que sucede esto.

Problema. Sea $P$ un punto en el interior del triángulo $ABC$ y $p,q,r$ las distancias de $P$ a los lados $BC, CA, AB$ respectivamente, que tienen longitudes $a,b,c$, respectivamente. Sea $R$ el circunradio de $ABC$. Muestra que $$\sqrt{p}+\sqrt{q}+\sqrt{r} \leq \sqrt{\frac{a^2+b^2+c^2}{2R}}.$$

Sugerencia pre-solución. Necesitarás aplicar la desigualdad de Cauchy-Schwarz más de una vez. Haz una figura para entender la expresión $ap+bq+cr$. Necesitarás también la fórmula que dice que se puede calcular el área $T$ de un triángulo mediante la fórmula $$T=\frac{abc}{R}.$$

Solución. Lo primero que haremos es aplicar la desigualdad de Cauchy-Schwarz en las ternas $(\sqrt{ap},\sqrt{bq},\sqrt{cr})$ y $(1/\sqrt{a},1/\sqrt{b},1/\sqrt{c})$ para obtener $$\sqrt{p}+\sqrt{q}+\sqrt{r}\leq \sqrt{ap+bq+cr}\cdot\sqrt{\frac{1}{a}+\frac{1}{b}+\frac{1}{c}}.$$

Observa que $ap$ es dos veces el área de $\triangle BCP$. De manera similar, tenemos que $bq$ y $cr$ son las áreas de $\triangle CAP$ y $\triangle ABP$ respectivamente. Así, si llamamos $T$ al área de $\triangle ABC$ tenemos que $ap+bq+cr=2T$. Otra expresión para el área de $\triangle ABC$ en términos de su circunradio $R$ es $$T=\frac{abc}{4R}.$$ En otras palabras, $ap+bq+cr=\frac{abc}{2R}$.

Esto nos permite continuar con la desigualdad como sigue:
\begin{align*}
\sqrt{p}+\sqrt{q}+\sqrt{r} &\leq \sqrt{\frac{abc}{2R}}\cdot\sqrt{\frac{1}{a}+\frac{1}{b}+\frac{1}{c}}\\
&=\sqrt{\frac{abc}{2R}}\cdot\sqrt{\frac{ab+bc+ca}{abc}}\\
&=\sqrt{\frac{ab+bc+ca}{2R}}.
\end{align*}

Esto es casi la desigualdad que queremos. Para terminar, basta mostrar que $$ab+bc+ca\leq a^2+b^2+c^2.$$ Esto se puede hacer de varias formas (intenta hacerlo usando la desigualdad MA-MG). Pero para continuar viendo la versatilidad de la desigualdad de Cauchy-Schwarz, observa que se puede deducir de ella aplicándola a las ternas $(a,b,c)$ y $(b,c,a)$.

$\square$

En el problema anterior, ¿para qué puntos $P$ se alcanza la igualdad?

Cauchy-Schwarz más allá de los números reales

Lo que está detrás de la desiguadad de Cauchy-Schwarz es en realidad la noción de producto interior en álgebra lineal. En cualquier espacio vectorial sobre los reales que tenga un producto interior $\langle \cdot, \cdot \rangle$ se satisface una desigualdad del tipo de la de Cauchy-Schwarz. No entraremos en los detalles de la teoría que se necesita desarrollar, pues eso se estudia en un curso de álgebra lineal. Sin embargo, enunciaremos el teorema y veremos una forma de aplicarlo.

Teorema (desigualdad de Cauchy-Schwarz). Si $V$ es un espacio vectorial con producto interior $\langle \cdot, \cdot \rangle$ entonces para cualesquiera dos vectores $u$ y $v$ se satisface que $$|\langle u , v\rangle|\leq \sqrt{\langle u , u\rangle}\cdot \sqrt{\langle v , v\rangle}.$$

Se puede mostrar que bajo las hipótesis del teorema la función $\norm{u}:=\langle u , u\rangle$ es una norma. Como platicamos con anterioridad, una norma satisface la desigualdad del triángulo, que en espacios vectoriales tiene un nombre especial.

Teorema (desigualdad de Minkowski). Si $V$ es un espacio vectorial con producto interior $\langle \cdot, \cdot \rangle$ y $\norm{u}:=\langle u , u\rangle$, entonces para cualesquiera dos vectores $u$ y $v$ se satisface que $$\norm{u}+\norm{v}\geq \norm{u+v}.$$

Es relativamente sencillo ver que las desigualdades de Cauchy-Schwarz y de Minkowski son «equivalentes», en el sentido de que se puede mostrar una fácilmente suponiendo la otra y viceversa.

La desigualdad de Cauchy-Schwarz que usamos en las secciones anteriores es para el producto interior en $\mathbb{R}^n$ dado por $$\langle (a_1,\ldots,a_n),(b_1,\ldots,b_n) \rangle = a_1b_1+\ldots + a_nb_n,$$ al cual le llamamos el producto punto.

Si tenemos a $V$ el espacio vectorial de las funciones continuas reales en el intervalo $[0,1]$, entonces $$\langle f,g\rangle = \int_0^1 f(x)g(x) \, dx$$ es un producto interior para $V$. Esto nos puede ayudar a resolver algunos problemas.

Problema. Sea $f:[0,1]\to \mathbb{R}^+$ una función continua. Muestra que $$\left ( \int_0^1 f(x)\, dx \right) \left (\int_0^1 \frac{1}{f(x)}\, dt \right) \geq 1.$$

Sugerencia pre-solución. Aplica la desigualdad de Cauchy-Schwarz con el producto interior que discutimos antes de esta entrada.

Solución. Tomemos el producto interior $$\langle f,g\rangle = \int_0^1 f(x)g(x) \, dx$$ en el espacio vectorial de funciones reales y continuas en $[0,1]$. Como la imagen de $f$ está en los reales positivos, podemos definir la función $h:[0,1]\to \mathbb{R}^+$ dada por $h(x)=\sqrt{f(x)}$.

Tenemos que
\begin{align*}
\left \langle h, \frac{1}{h}\right \rangle &= \int_0^1 h(x)\cdot \frac{1}{h(x)}\, dx\\
&=\int_0^1 1\, dx\\
&=1.
\end{align*}

Por otro lado,

\begin{align*}
\langle h, h \rangle &= \int_0^1 h(x)\cdot h(x)\, dx\\
&=\int_0^1 f(x)\, dx.
\end{align*}

y

\begin{align*}
\left\langle \frac{1}{h}, \frac{1}{h} \right\rangle&= \int_0^1 \frac{1}{h(x)}\cdot \frac{1}{h(x)}\, dx\\
&=\int_0^1 \frac{1}{f(x)}\, dx
\end{align*}

La conclusión se sigue entonces de manera inmediata de la desigualdad de Cauchy-Schwarz para $\langle \cdot, \cdot \rangle$.

$\square$

Más problemas

Puedes encontrar más problemas que usan la desigualdad de Cauchy-Schwarz en la sección 7.1 del libro Problem Solving through Problems de Loren Larson. También puedes consultar más técnicas y problemas en el libro Desigualdades de la Olimpiada Mexicana de Matemáticas.

Seminario de Resolución de Problemas: Geometría analítica

Por Fabian Ferrari

Introducción

La geometría analítica se puede considerar la fusión de las ideas de la geometría euclidiana y el álgebra. Una de las funcionalidades de la geometría analítica es resolver problemas de geometría de una manera analítica, partiendo de la ubicación de los objetos geométricos en el plano cartesiano. A continuación veremos algunos problemas de la geometría analítica.

Un problema de rectas y puntos notables de un triángulo

Problema: Dado el triangulo $\triangle ABC$ inscrito en una circunferencias. Denotemos como $P$ a su baricentro y como $O$ a su circuncentro. Además, supongamos que $A(0,0)$, $B(a,0)$ y $C(b,c)$.
Expresa las coordenadas de $P$ y $O$ en términos de $a$, $b$ y $c$.

Solución: Tenemos que el baricentro $P$ es la intersección de las medianas del triángulo. Basta con que encontremos las ecuaciones de dos de las medianas para establecer un sistema de ecuaciones y encontrar las coordenadas de $P$.

Para obtener las medianas tenemos que determinar los puntos medios de los lados del triángulo.

Consideraremos los puntos los puntos medios de $AB$ y de $AC$, los cuales son $P_{m_{AB}}(\frac{a}{2},0)$ y $P_{m_{AC}}(\frac{b}{2},\frac{c}{2})$ respectivamente.

Ahora, determinamos la ecuación de la mediana que pasa por el punto medio de $AC$ y el vértice $B$


\begin{equation*}
\begin{align*}
y-\frac{c}{2}&=\frac{-\frac{c}{2}}{\frac{2a-b}{2}}(x-\frac{b}{2})\\
2y-c&=-\frac{c}{2a-b}(2x-b)\\
(2a-b)(2y-c)&=-2cx+bx\\
2(2a-b)y-2ac+bc&=-2cx+bc\\
2cx+2(2a-b)y&=2ac\\
cx+(2a-b)y&=ac
\end{alig*}
\end{equation*}

Para la mediana que pasa por el vértice $C$ y por el punto medio de $AB$, tenemos que

\begin{equation*}
\begin{align*}
y&=\frac{c}{\frac{2b-a}{2}}(x-\frac{a}{2})\\
(2b-a)y&=2cx-ac\\
2cx+(a-2b)y&=ac
\end{align*}
\end{equation*}

Establecemos el sistema de ecuaciones

\begin{equation*}
\begin{align*}
cx+(2a-b)y  &=ac \\
2cx + (a-2b)y &=ac
\end{align*}
\end{equation*}

Cuya solución es $x=\frac{ac+bc}{3}$ y $y=\frac{c}{3}$

Por lo tanto el punto del baricentro está dado por

\begin{equation*}
P\left(\frac{ac+bc}{3}, \frac{c}{3}\right)
\end{equation*}

Para obtener la coordenada del circuncentro tenemos que determinar las ecuaciones de las mediatrices y con ello calcular su intersección.

Tenemos que como la pendiente del segmento $AB$ es igual a $0$, tenemos entonces que la mediatriz del segmento es

\begin{equation*}
x=\frac{a}{2}
\end{equation*}

Por otro lado tenemos que la pendiente del segmento $AC$ es igual a $\frac{c}{b-a}$ con lo que la pendiente de la mediatriz de $AC$ es $\frac{a-b}{c}$, con lo que su ecuación está dada por

\begin{equation*}
\begin{align*}
y-\frac{c}{2}&=\frac{a-b}{c}(x-\frac{b}{2})\\
y&=\frac{2(a-b)(x-\frac{b}{2}+c^2}{2c}
\end{align*}
\end{equation*}

Sustituyendo $x=\frac{a}{2}$, tenemos que

\begin{equation*}
y=\frac{(a-b)^2+c^2}{2c}
\end{equation*}

Así, podemos concluir que el punto del circuncentro está dado por $O\left(\frac{a}{2},\frac{(a-b)^2+c^2}{2c}\right)$

$\square$

Recta tangente a una circunferencia


Problema: Encuentra la relación entre los parámetros $a$, $b$ y $c$ tales que la línea recta $l:\frac{x}{a}+\frac{y}{b}=1$ sea tangente a la circunferencia $C: x^2+y^2=c^2$.

Solución: Tenemos que la circunferencia está centrada el el origen $O(0,0)$ y tiene radio $r=c$.

Así, se debe cumplir que la distancia de la recta al origen debe de ser igual a $c$ para que se cumpla que sea tangente a la circunferencia.

i.e.

\begin{equation*}
\d(l,O)=\frac{|\frac{0}{a}+\frac{0}{b}-1|}{\sqrt{\frac{1}{a}+\frac{1}{b}}}=c
\end{equation*}

Tenemos entonces que

\begin{equation*}
\begin{align*}
\frac{|-1|}{\sqrt{\frac{1}{a}+\frac{1}{b}}}&=c\\
c^2\left(\frac{a+b}{ab}\right)&=1\\
\frac{a+b}{ab}&=\frac{1}{c^2}
\end{align*}
\end{equation*}

Concluimos que la condición que deben de cumplir los parámetros para que se cumpla que la recta $l$ sea tangente a la circunferencia $C$ es

\begin{equation*}
c^2=\frac{ab}{a+b}
\end{equation*}

$\square$

Circunferencia que pasa por tres puntos

Problema: Consideremos una circunferencia con centro en el origen y radio $1$. Si $M$ es un punto de la circunferencia, $N$ un punto diametralmente opuesto a $M$ y $A(2,3)$ un punto fuera de la circunferencia. Determina el lugar geométrico formado por los centros de las circunferencias que pasan por $M$, $N$ y $A$ al variar $M$

Solución: Sea $M(a,b)$, tenemos que $N$ por ser diametralmente opuesto está dado por $N(-a,-b)$. Si denotamos como $C_1(x,y)$ al centro de la circunferencia que pasa por $M$, $N$ y $A$, tenemos que las distancias desde los puntos dados al centro $C_1(x,y)$ son todas iguales.

\begin{equation*}
d(C_1,M)=d(C_1,N)=d(C_1,A)
\end{equation*}

Además,

\begin{equation*}
\begin{align*}
&d(C_1,M)=\sqrt{(x-a)^2+(y-b)^2}\\
&d(C_1,N)=\sqrt{(x+a)^2+(y+b)^2}\\
&d(C_1,A)=\sqrt{(x-2)^2+(y-3)^2}
\end{align*}
\end{equation*}

Como $d(C_1,M)=d(C_1,N)$ tenemos que

\begin{equation*}
\begin{align*}
(x-a)^2+(y-b)^2&=\sqrt{(x+a)^2+(y+b)^2}\\
-2ax-2by&=2ax+2by\\
ax+by&=0
\end{align*}
\end{equation*}

Por otro lado tenemos que $d(C_1,N)=d(C_1,M)$, entonces

\begin{equation*}
\begin{align*}
(x-a)^2+(y-b)^2&=(x-2)^2+(y-3)^2\\
-2ax-2by+a^2+b^2&=-4x-6y+2^2+3^2\\
-2ax-2by+1&=-4x-6y+4+9\\
-2ax-2by&=-4x-6y+12\\
-ax-by&=-2x-3y+6\\
(a-2)x+(b-3)y&=-6
\end{align*}
\end{equation*}

Al hacer la diferencia de esta última ecuación con la primera que obtuvimos, tenemos la ecuación:

\begin{equation*}
\begin{align*}
2x+3y&=6\\
2x+3y-6&=0
\end{align*}
\end{equation*}

Lo cual nos describe una línea recta

Por lo tanto, el lugar geométrico formado por los centros de las circunferencias que pasan por $M$, $N$ y $A$ al variar $M$, es la recta con ecuación general $2x+3y-6=0$

$\square$


Más problemas

Puedes encontrar más problemas de Geometría Analítica en la sección 8.2 del libro Problem Solving through Problems de Loren Larson.

Seminario de Resolución de Problemas: Sucesiones aritméticas y geométricas

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta y las siguientes entradas platicaremos varios temas relacionados con sucesiones, y cómo se aplican a la resolución de problemas matemáticos. Comenzaremos recordando qué es una sucesión y estudiando a las sucesiones aritméticas y geométricas. Más adelante, platicaremos de los siguientes tipos de sucesiones:

  • Periódicas
  • Acotadas
  • Recursivas
  • Con recursiones lineales
  • Monótonas
  • Convergentes

Supondremos que el que lee estas notas está al menos un poco familiarizado con estos conceptos. De cualquier forma, recordaremos las definiciones que vayamos necesitando.

Recordatorio de sucesiones

Una sucesión formalmente es una función de los naturales a un conjunto $X$. Aunque esta es la definición formal, es bastante más práctico pensar a una sucesión como ciertos elementos de $X$ en donde hay uno que es el primero, después del cual aparecen más, uno tras otro.

En muchos problemas, $X$ es un conjunto de números, como los naturales, enteros, racionales o reales. Sin embargo, $X$ también puede ser un conjunto de funciones, de polinomios, de figuras geométricas o de prácticamente cualquier otra cosa. Por ejemplo, en topología algebraica son de interés ciertas sucesiones de grupos.

Usaremos la notación $\{x_n\}$ para referirnos a una sucesión. Aunque usa llaves (como si fuera conjunto), en realidad los elementos están «ordenados de izquierda a derecha», entonces se tiene que pensar como $$\{x_n\}=(x_0,x_1,x_2,x_3,\ldots).$$ El término $x_n$ es el $n$-ésimo término de la sucesión.

Podemos definir a una sucesión de manera implícita mediante una fórmula, o mediante forma explícita escribiendo algunos de sus términos cuando el patrón que sigue es muy claro (lo cual no siempre pasa). Por ejemplo, la sucesión $\{x_n\}$ tal que para todo $n\geq 0$, tenemos $x_n=1$ es explícitamente la sucesión $$1,1,1,1,1,\ldots,$$ mientras que la sucesión $\{y_n\}$ tal que para todo $n\geq 0$ se tiene $y_n=n(n+1)$ es explícitamente la sucesión $$0, 2, 6, 12, 20, \ldots.$$

A partir de la forma implícita podemos dar tantos términos como queramos de la forma explícita, pero lo contrario no es cierto. Algunos acertijos se tratan de tomar pocos términos de una sucesión dada de manera explícita, y preguntar cuál es el siguiente término, o bien cuál es la regla general.

En términos formales, la respuesta no es única, pues la sucesión, en teoría, podría continuar como sea. Sin embargo, como acertijo es divertido encontrar una regla fácil de enunciar y que funcione siempre. Algunas sucesiones en las que se puede hacer esto son las siguientes:

  • $1,1,1,1,1,1,1,\ldots$
  • $1,2,3,4,5,6,7,\ldots$
  • $2,4,6,8,10,12,14,\ldots$
  • $1,\frac{1}{2},\frac{1}{4},\frac{1}{8},\frac{1}{16},\frac{1}{32}, \frac{1}{64},\ldots$
  • $i, 1, 2, 3i, 5, 8i, 13, 21i, \ldots$
  • $1,\sqrt{2},\sqrt{3},2,\sqrt{5},\sqrt{6},\sqrt{7},\ldots$
  • $4,3,2,1,4,3,2,1,4,3,\ldots$

En todos estos ejemplos, la sucesión tiene cierto patrón u orden. Pero hay muchas otras sucesiones que no tienen un patrón claro para enunciarlas de forma implícita, o bien en las que este patrón es más difícil de encontrar:

  • $3,1,4,1,5,9,2,6,5,\ldots$
  • $4,13,0,1,7,18,54,\ldots$
  • $2,1,24,6,720,120,40320,5040,\ldots$

Como ya comentamos, la forma explícita de una sucesión tiene el problema de que no sabemos cuáles términos siguen. Si en un problema aplicamos la heurística de buscar un patrón y tenemos que los primeros términos de una sucesión son $$2,4,6,8,10,12$$ por muy tentador que sea no podemos garantizar que el siguiente será $14$, hasta que no tengamos una demostración para ello.

Es posible que resolviendo problemas, o en otro quehacer matemático, encuentres los primeros términos de una sucesión de enteros y quieras saber cuál es. Una herramienta muy útil para ello es Enciclopedia en Línea de Sucesiones en Enteros (OEIS). Tiene un buscador en el que pones los primeros términos, y de ahí te sugiere algunas sucesiones que pueden ser la que estás buscando.

Problema. Para un entero $n\geq 1$, se toman $n$ puntos distintos sobre la orilla de una circunferencia. Se dibujan todos los segmentos entre pares de esos puntos. Se sabe que no hay tres de esos segmentos que coincidan en el interior de la circunferencia. ¿En cuántas regiones queda dividida el área de la circunferencia?

Sugerencia pre-solución. Haz varias figuras para hacer casos pequeños y buscar un patrón. Ten cuidado, pues el patrón no es el que puedes deducir inmediatamente.

Solución. Veamos qué sucede con casos pequeños. Cuando tenemos un punto, no hay segmentos y sólo queda $1$ región. Si tenemos dos puntos, se hace un segmento y tenemos $2$ regiones. Para tres puntos, queda un triángulo y tres regiones a sus lados, así que son $4$ regiones en total. Las siguientes figuras muestran que para cuatro y cinco puntos tenemos $8$ y $16$ regiones en total:

Casos de cuatro y cinco puntos

Así, la sucesión de cuántas regiones hay hasta ahora va así de manera explícita: $$1,2,4,8,16$$

Parecería que es la sucesión de potencias de dos, y que la respuesta sería entonces $2^{n-1}$. Pero esto es incorrecto. Al hacer un caso más, nos damos cuenta de esto, pues para seis puntos tenemos únicamente $31$ regiones:

Caso de seis puntos

Cuando estamos haciendo matemáticas, o resolviendo un problema con acceso a internet, podemos poner esta sucesión en la OEIS para ver si hay algo que nos pueda ayudar.

Realizando la búsqueda, obtenemos varios resultados, y el segundo resultado tiene exactamente la descripción que queremos. La OEIS tiene una sección de fórmulas que podemos usar.

Ahí, dice que la cantidad de regiones es $$\binom{n-1}{0}+\binom{n-1}{1}+\binom{n-1}{2}+\binom{n-1}{3}+\binom{n-1}{4},$$ (lo cual se puede probar usando inducción) y de hecho, usando la definición de coeficientes binomiales, se puede ver que la expresión anterior es igual a $$\frac{n^4 – 6n^3 + 23n^2 – 18n + 24}{24}.$$

$\square$

Sucesiones aritméticas

Una sucesión aritmética es una sucesión en la cual de un término al siguiente siempre hay una misma diferencia. Un ejemplo es la sucesión $$1,4,7,10,13,16,19,\ldots,$$ que construimos de modo que la diferencia de un término al siguiente siempre sea $3$.

Si conocemos el término inicial $a_0=a$ de una sucesión aritmética y la diferencia $d$, entonces conocemos todos los términos. En efecto, se puede probar inductivamente que $a_n=a+nd$.

Esta fórmula es muy útil para trabajar con sucesiones aritméticas. Por ejemplo, si sabemos que $\{a_n\}$ es una sucesión aritmética tal que $a_5=30$ y $a_7=48$, entonces por un lado $$a_7-a_5=48-30=18,$$ y por otro $$a_7-a_5=(a+7d)-(a+5d)=2d.$$ De este modo, la diferencia es $d=9$, y el término inicial es $a=a_7-7\cdot 9=48-63=-15$.

Problema. Muestra que en cualquier sucesión aritmética de enteros con diferencia $d>0$ que tenga al menos un número al cubo $k^3$, tiene una infinidad de cubos.

Sugerencia pre-solución. Usa una identidad algebraica.

Solución. Podemos suponer sin perder generalidad que $k>0$. Para que una sucesión aritmética sea de enteros, su diferencia tiene que ser un número entero. Así, $d$ es un entero positivo.

Como $k^3$ es uno de los términos y la diferencia es $d$, entonces $k^3+nd$ también es un término para cualquier entero positivo $n$. En particular, lo es para los enteros de la forma $n=3mk^2+3m^2dk+m^3d^2$, con $m$ un entero positivo. De esta forma, $$k^3+3mdk^2+3m^2d^2k+m^3d^3=(k+md)^3$$ es un término de la sucesión para todo entero positivo $m$, así que la sucesión tiene una infinidad de cubos.

$\square$

Una observación sencilla, pero útil, es que si $\{a_n\}$ es una sucesión aritmética de enteros con término inicial $a$ y diferencia $d>0$, entonces los términos de $a$ son exactamente los números $m\geq a$ tales que $m\equiv a \pmod d$. Las sucesiones aritméticas juegan un papel importante en algunos resultados de teoría de números, por ejemplo, el siguiente teorema.

Teorema de Dirichlet. Sean $a$ y $b$ enteros primos relativos. En la sucesión de enteros $\{a+bn\}$ hay una infinidad de primos. De manera equivalente, hay una infinidad de primos $p$ tales que $p\equiv a \pmod b$.

Sucesiones geométricas

Si tenemos una sucesión en la cual para pasar de un término al siguiente siempre multiplicamos por un mismo número, entonces tenemos una sucesión geométrica. Estos son tres ejemplos:

  • $1,2,4,816,32,64,\ldots$
  • $2020,0,0,0,0,0,\ldots$
  • $64,96,144,216,324,486,729,\ldots$

La primera está construida de modo que hay que multiplicar por $2$ para pasar de un término al siguiente. La segunda de modo que hay que multiplicar por $0$. En la última se multiplica por $\frac{3}{2}$. Parece que la última sucesión es de enteros, pero el siguiente término ya no es entero, pues es $\frac{2187}{2}$.

De nuevo, si el término inicial es $a_0=a$ y la razón (el número por el que se multiplica en cada paso) es $r$, entonces una sencilla inducción muestra que el término $a_n$ es $ar^n$. Si $a=0$, la sucesión es toda igual a $0$. Si $r=0$, a partir del segundo término la sucesión es $0$. En otro caso, conociendo dos valores de una sucesión geométrica podemos conocer información acerca de $r$.

Problema. La sucesión de números complejos $\{a_n\}$ es geométrica y cumple que $a_6=a_{24}=2020$. ¿Qué posibles valores puede tener $a_0$?

Sugerencia pre-solución. Usa la fórmula para sucesiones geométricas. Como estás trabajando en $\mathbb{C}$, recuerda considerar todas las posibilidades que te da la aritmética de complejos.

Solución. Si el término inicial de la sucesión es $a_0=a$ y la razón es $r$, sabemos que $ar^6=2020=ar^{24}$. La primer igualdad implica $r\neq 0$ y $a=2020r^{-6}\neq 0$. La igualdad entre la primera y última igualdad implica que $r^{18}=1$, que podemos escribir como $(r^6)^3=1$. De aquí, $r^6$ puede ser cualquier cúbica de la unidad, y por lo tanto $r^{-6}$ también. De esta forma, $a=2020\omega$, con $\omega$ cualquier raíz cúbica de la unidad.

$\square$

Un problema de sucesiones geométricas y aritméticas

En el siguiente problema se mezclan los dos tipos de sucesiones de los que hemos hablado.

Problema. La sucesión $\{x_n\}$ es aritmética. La sucesión $\{y_n\}$ es geométrica. Tenemos que

\begin{align*}
x_1+y_1&=1\\
x_2+y_2&=8\\
x_3+y_3&=10\\
x_4+y_4&=32.
\end{align*}

Determina el valor de $x_5+y_5$.

Sugerencia pre-solución. Modifica el problema a encontrar los términos iniciales, diferencia y razón de las sucesiones. Usa las fórmulas para cada tipo de sucesión.

Solución. Supongamos que $\{x_n\}$ tiene término inicial $x_0=a$ y diferencia $d$. Supongamos que $\{y_n\}$ tiene término inicial $y_0=s$ y razón $r$. Vamos a determinar $a,d,r,s$. Usando las fórmulas para sucesiones aritmétricas y geométricas, las ecuaciones de la hipótesis se pueden reescribir como sigue:

\begin{align*}
a+d + rs&=1\\
a+2d + r^2s&=8\\
a+3d + r^3s&=10\\
a+4d + r^4s&=32.
\end{align*}

Restando la primera ecuación de la segunda, la segunda de la tercera, y la tercera ecuación de la cuarta, tenemos las siguientes tres ecuaciones:

\begin{align*}
d + r(r-1) s &= 7\\
d+r^2(r-1)s &= 2\\
d + r^3(r-1)s &= 22.
\end{align*}

Restando la primer ecuación de la segunda, y la segunda ecuación de la tercera, tenemos las siguientes dos ecuaciones:

\begin{align*}
r(r-1)^2 s &= -5\\
r^2(r-1)^2 s &= 20.
\end{align*}

De aquí, $s\neq 0$, $r\neq 0$ y $r\neq 1$. Multiplicando la primer ecuación por $-4$, tenemos que $$-4r(r-1)^2s=20=r^2(r-1)^2s.$$ Cancelando $r(r-1)^2s$ (pues no es cero) de ambos lados, obtenemos que $r=-4$. Así, la primera ecuación se transforma en $-4(25)s=-5$, por lo que $s=1/20$.

De la ecuación $d+r(r-1)s=7$, obtenemos entonces $d=7-1=6$. Finalmente, de la ecuación $a+d+rs=1$, obtenemos $a=1-6+1/5=-\frac{24}{5}$.

En resumen, $$a=-\frac{24}{5}, d=6, s=\frac{1}{20}, r=-4.$$

De esta forma,
\begin{align*}
x_5+y_5&=a+5d+rs^5\\
&=-\frac{24}{5}+30-\frac{4^5}{20}\\
&=-26.
\end{align*}

$\square$

Más problemas

Esta entrada es una extensión de las secciones 1, 2 y 3 del curso de sucesiones que impartí para los entrenadores de la Olimpiada Mexicana de Matemáticas. Puedes consultar las notas de este curso en el siguiente PDF, en donde hay más problemas de práctica:

Álgebra Lineal I: Ángulos, norma, distancia y desigualdad de Minkowski

Por Leonardo Ignacio Martínez Sandoval

Introducción

Estamos listos para hablar de varias nociones geométricas como ángulo, norma, distancia y de la desigualdad de Minkowski. Antes de hacer eso, hagamos un breve repaso de qué hemos hecho en estas últimas entradas.

Primero, hablamos de formas bilineales y de su formas cuadráticas asociadas. Segundo, vimos cómo a través de la identidad de polarización podemos asignar una única forma bilineal simétrica a una forma cuadrática. Finalmente, en la última entrada nos enfocamos en las formas bilineales simétricas que cumplían cierta condición de positividad.

En esa misma entrada definimos producto interior, que simplemente es una forma bilineal simétrica y positiva definida. También definimos la norma de un vector en un espacio con producto interior $\langle \cdot, \cdot \rangle$, que era $$\Vert x \Vert = \sqrt{\langle x, x \rangle}.$$

Finalmente, en la entrada anterior probamos la siguiente versión general de la desigualdad de Cauchy-Schwarz:

Teorema (desigualdad de Cauchy-Schwarz). Sea $b:V\times V\to \mathbb{R}$ una forma bilineal simétrica y $q$ su forma cuadrática asociada.

  • Si $b$ es positiva, entonces para todo $x$ y $y$ en $V$ tenemos que $$b(x,y)^2\leq q(x)q(y).$$ Si $x$ y $y$ son linealmente dependientes, se da la igualdad.
  • Además, si $b$ es positiva definida y $x$ y $y$ son linealmente independientes, entonces la desigualdad es estricta.

Ángulos

Fijemos $V$ un espacio vectorial sobre los reales con producto interior. En la entrada anterior vimos que la desigualdad de Cauchy-Schwarz implica que para cualesquiera vectores $x$ y $y$ en $V$ tenemos que $$|\langle x, y \rangle| \leq \Vert x \Vert \cdot \Vert y \Vert.$$

Si $x$ y $y$ son vectores distintos de cero, podemos reescribir la desigualdad anterior como $$-1\leq \frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}\leq 1.$$ Esto justifica la siguiente definición.

Definición. Sean $x$ y $y$ vectores no nulos. Definimos al ángulo entre $x$ y $y$ como el único ángulo $\theta$ en el intervalo $[0,\pi]$ tal que $$\cos \theta = \frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}.$$

Observa que $\theta=\frac{\pi}{2}$ si y sólo si $\frac{\langle x, y \rangle}{\Vert x \Vert \cdot \Vert y \Vert}=0$. Esto ocurre si y sólo si $\langle x, y \rangle=0$. Este caso es particularmente importante, y por ello recibe una definición especial.

Definición. Decimos que $x$ y $y$ son ortogonales si $\langle x, y \rangle=0$.

Para empezar, veamos un ejemplo sencillo de ortogonalidad.

Ejemplo 1. Tomemos $\mathbb{R}^5$ con el producto interior canónico, es decir, el producto punto. Los vectores $u=(1,0,-4,0,5)$ y $v=(0,3,0,-2,0)$ tienen producto punto $$\langle u, v \rangle=1\cdot 0 + 0\cdot 3 + (-4)\cdot 0 + 0 \cdot (-2) + 5 \cdot 0=0,$$ así que son ortogonales.

$\triangle$

Ahora, veamos un ejemplo un poco más elaborado, del cálculo de un ángulo en un espacio vectorial de funciones.

Ejemplo 2. Anteriormente vimos que $\mathcal{C}[0,1]$ tiene un producto interior $$\langle f, g \rangle=\int_0^1 f(x)g(x)\, dx.$$ Calculemos el ángulo entre $f(x)=x^2$ y $g(x)=x^3$ con este producto interior. Primero, calculamos $\Vert f \Vert$ y $\Vert g \Vert$ como sigue
\begin{align*}
\Vert f \Vert^2 &= \int_0^1 x^4 \,dx = \frac{1}{5}\\
\Vert g \Vert^2 &= \int_0^1 x^6 \,dx = \frac{1}{7},
\end{align*}

de donde $\Vert f \Vert = \frac{1}{\sqrt{5}}$ y $\Vert g \Vert = \frac{1}{\sqrt{7}}$.

Luego, calculamos
\begin{align*}
\langle f,g \rangle &=\int_0^1 f(x)g(x) \, dx\\
&=\int_0^1 x^5 \, dx\\
&=\frac{1}{6}.
\end{align*}

Como esperaríamos por la desigualdad de Cauchy-Schwarz, tenemos la siguiente desigualdad:
\begin{align*}
\langle f,g \rangle &= \frac{1}{6}\leq \frac{1}{\sqrt{35}}=\Vert f \Vert \Vert g \Vert.
\end{align*}

El ángulo entre $f$ y $g$ es entonces
\begin{align*}
\theta &= \arccos\left(\frac{\langle f, g \rangle}{\Vert f \Vert \cdot \Vert g \Vert}\right)\\
&=\arccos\left(\frac{1/6}{1/\sqrt{35}}\right)\\
&=\arccos\left(\frac{\sqrt{35}}{6}\right).
\end{align*}

$\triangle$

Desigualdad de Minkowski

Hay una forma un poco distinta de escribir la desigualdad de Cauchy-Schwarz. La enunciamos a continuación.

Teorema (desigualdad de Minkowski). Sean $x$ y $y$ vectores de un espacio vectorial $V$ con una forma cuadrática positiva $q$. Entonces $$\sqrt{q(x)}+\sqrt{q(y)}\geq \sqrt{q(x+y)}.$$

Demostración. Sea $b$ la forma polar de $q$. Recordemos que $$q(x+y)=q(x)+2b(x,y)+q(y).$$

Como $q$ es forma cuadrática positiva, la desigualdad que queremos mostrar es equivalente a la siguiente desigualdad obtenida de elevar ambos lados al cuadrado:

\begin{align*}
q(x)+2\sqrt{q(x)q(y)}+q(y)&\geq q(x+y)\\
&=q(x)+2b(x,y)+q(y).
\end{align*}

Cancelando $q(x)+q(y)$ de ambos lados y dividiendo entre $2$, obtenemos la desigualdad equivalente
\begin{align*}
\sqrt{q(x)q(y)}\geq b(x,y).
\end{align*}

Si $b(x,y)<0$, esta desigualdad es claramente cierta. Si $b(x,y)\geq 0$, esta desigualdad es equivalente a la obtenida de elevarla al cuadrado, es decir, $$q(x)q(y)\geq b(x,y)^2,$$ que es precisamente la desigualdad de Cauchy-Schwarz.

$\square$

De producto interior a norma

Estamos listos para mostrar algunas propiedades importantes de la noción de norma que definimos para espacios vectoriales reales con producto interior.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior con norma asociada $\Vert \cdot \Vert$. Se cumple que

  1. $\Vert v \Vert \geq 0$ para todo $v$ en $V$, con igualdad si y sólo si $v=0$.
  2. $\Vert cv \Vert =|c|\Vert v \Vert$ para todo $v$ en $V$ y real $c$.
  3. (Desigualdad del triángulo) $\Vert v \Vert + \Vert w \Vert \geq \Vert v+w \Vert$ para todo par de vectores $v$ y $w$ en $V$.

Demostración. Sea $b$ el producto interior de $V$. El punto 1 se sigue de que $b$ es positiva definida. El punto 2 se sigue de que $b$ es bilineal, pues $b(cv,cv)=c^2b(v,v)$, de modo que $$\Vert cv \Vert = \sqrt{c^2} \Vert v \Vert =|c| \Vert v \Vert.$$ El punto 3 es la desigualdad de Minkowski.

$\square$

En general, si tenemos un espacio vectorial $V$ sobre los reales y una función $\Vert \cdot \Vert:V \to \mathbb{R}$ que satisface los puntos 1 a 3 de la proposición anterior, decimos que $\Vert \cdot \Vert$ es una norma para $V$. Hay algunas normas que no se pueden obtener a través de un producto interior.

Ejemplo. Consideremos $V=M_n(\mathbb{R})$. El producto de Frobenius de las matrices $A$ y $B$ está dado por $$\langle A,B\rangle = \text{tr}(^tA B).$$ Se puede mostrar que el producto de Frobenius es un producto interior. La norma de Frobenius es la norma inducida por este producto, es decir, $$\Vert A \Vert = \sqrt{\text{tr}(^tAA)}.$$

Por la desigualdad de Minkowski, tenemos que para cualesquiera dos matrices $A$ y $B$ tenemos que $$\sqrt{\text{tr}(^t(A+B)(A+B))}\leq \sqrt{\text{tr}(^tAA)} + \sqrt{\text{tr}(^tBB)}.$$

En particular, si tomamos a la identidad $I$, tenemos que su norma de Frobenius es $\sqrt{n}$. Esto muestra la siguiente desigualdad, válida para cualquier matriz $A$ en $M_n(\mathbb{R})$:

$$\sqrt{\text{tr}((^tA+I)(A+I))}\leq \sqrt{\text{tr}(^tAA)}+ \sqrt{n}.$$

$\triangle$

De norma a distancia

Podemos pensar a la norma de un vector $v$ como qué tan lejos está del vector $0$. También nos gustaría poder hablar de qué tan lejos están cualesquiera dos vectores de un espacio vectorial con producto interior. Por esta razón, introducimos la siguiente definición.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{R}$ con producto interior de norma $\Vert \cdot \Vert$. La distancia asociada a este producto interior es la función $d:V\times V\to \mathbb{R}$ tal que $d(x,y)=\Vert x-y\Vert.$ A $d(x,y)$ le llamamos la distancia entre $x$ y $y$.

El siguiente resultado se sigue de las propiedades de la norma de un producto interior. Su demostración queda como tarea moral.

Proposición. Si $V$ es un espacio vectorial sobre $\mathbb{R}$ con producto interior de distancia $d$, entonces:

  1. $d(x,y)\geq 0$ para todos $x$ y $y$ en $V$ y es igual a $0$ si y sólo si $x=y$.
  2. $d(x,y)=d(y,x)$ para todos $x$ y $y$ en $V$.
  3. $d(x,z)+d(z,y)\geq d(x,y)$ para todos $x$, $y$ y $z$ en $V$.

En general, si tenemos cualquier conjunto $X$ (no hace falta que sea un espacio vectorial), a una función $d$ que satisface los puntos 1 a 3 de la proposición anterior se le conoce como una métrica para $X$. Cualquier norma en un espacio vectorial $V$ (no sólo las de producto interior) induce una métrica en $V$. Sin embargo, hay métricas de espacios vectoriales que no vienen de una norma.

Más adelante…

Retomando conceptos ya definidos como la norma de un vector, en esta entrada vimos cómo encontrar el ángulo entre dos vectores no-nulos y se llegó a una forma natural de introducir la ortogonalidad entre dos vectores. Así mismo, se demostraron algunas propiedades de la norma asociada a un producto interior, siendo la última una forma distinta de expresar la desigualdad de Cauchy-Schwarz, usando la desigualdad de Minkowski. Finalmente, se definió el concepto de distancia entre dos vectores.

En entradas posteriores, usaremos estos conceptos para estudiar bases ortogonales, que tienen usos en conceptos matemáticos más avanzados como el análisis de Fourier o la teoría de polinomios ortogonales.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Toma $\mathbb{R}^4$ con el producto interior canónico (producto punto). Determina la norma de $(3,4,0,1)$. Encuentra el ángulo entre los vectores $(1,0,2,5)$ y $(4,5,0,-3)$.
  • Muestra que el producto de Frobenius es un producto interior en $M_n(\mathbb{R})$.
  • Demuestra la proposición de propiedades de la distancia

Considera $V=\mathbb{R}_3[x]$ el espacio vectorial de polinomios con coeficientes reales y grado a lo más $3$. Definimos $$\langle p,q \rangle = \sum_{j=1}^5 p(j)q(j).$$

  • Muestra que $\langle \cdot, \cdot \rangle$ así definido es un producto interior.
  • Encuentra el ángulo entre los polinomios $1+x^2$ y $2x-3x^3$.
  • Para cada entero positivo $n$, determina la norma del polinomio $1+nx^3$.
  • Determina la distancia entre los polinomios $1$ y $1+x+x^2+x^3$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»