Archivo de la etiqueta: desigualdades

Seminario de Resolución de Problemas: Rango de matrices y el teorema de factorización PJQ

Por Leonardo Ignacio Martínez Sandoval

Introducción

El algunas ocasiones es suficiente saber si una matriz es invertible o no. Sin embargo, esta es una distinción muy poco fina. Hay algunos otros problemas en los que se necesita decir más acerca de la matriz. Podemos pensar que una matriz invertible, como transformación lineal, «guarda toda la información» al pasar de un espacio vectorial a otro. Cuando esto no sucede, nos gustaría entender «qué tanta información se guarda». El rango de matrices es una forma de medir esto. Si la matriz es de m×n, el rango es un número entero que va de cero a n. Mientras mayor sea, «más información guarda».

Por definición, el rango de una matriz A de m×n es igual a la dimensión del subespacio vectorial de Rm generado por los vectores columna de A. Una matriz de n×n tiene rango n si y sólo si es invertible.

Si pensamos a A como la transformación lineal de Rn a Rm tal que XAX, entonces el rango es precisamente la dimensión de la imagen de A. Esto permite extender la definición de rango a transformaciones lineales arbitrarias, y se estudia con generalidad en un curso de álgebra lineal.

En las siguientes secciones enunciaremos sin demostración algunas propiedades del rango de matrices y las usaremos para resolver problemas.

Propiedades del rango de matrices

Comenzamos enunciando algunas propiedades del rango de matrices

Teorema. Sean m, n y p enteros. Sea B una matriz de n×p, y A, A matrices de m×n. Sean además P una matriz de n×p cuya transformación lineal asociada es suprayectiva y Q una matriz de r×m cuya transformación lineal asociada es inyectiva. Entonces:

  1. rank(A)min(m,n)
  2. rank(AB)min(rank(A),rank(B))
  3. rank(A+A)rank(A)+rank(A)
  4. rank(QA)=rank(A)
  5. rank(AP)=rank(A)

Consideremos el siguiente problema, tomado del libro Essential Linear Algebra de Titu Andreescu.

Problema. Las matrices A y B tienen entradas reales. La matriz A es de 3×3, la matriz B es de 2×3 y además AB=(011101112). Determina el valor del producto BA.

Sugerencia pre-solución. Un paso intermedio clave es mostrar que el producto BA es invertible.

Solución. Para empezar, afirmamos que (AB)2=AB. Esto se puede verificar directamente haciendo el producto de matrices.

Luego, afirmamos que el rango de AB es 2. En efecto, eso se puede hacer fácilmente por definición. Por un lado, la suma de las primeras dos columnas es igual a la tercera, así que el espacio vectorial que generan las tres es de dimensión a lo más dos. Pero es al menos dos, pues las primeras dos columnas son linealmente independientes. Esto muestra la afirmación.

Ahora, usando la propiedad (2) del teorema dos veces, tenemos que
rank(BA)rank(A(BA))rank(A(BA)B)=rank((AB)2)=rank(AB)=2.

Así, BA es una matriz de 2×2 de rango 2 y por lo tanto es invertible.

Consideremos ahora el producto (BA)3. Desarrollando y usando que (AB)2=AB, tenemos que

(BA)3=BABABA=B(AB)2A=BABA=(BA)2.

Como BA es invertible, entonces (BA)2 tiene inversa. Si multiplicamos la igualdad (BA)3=(BA)2 por esa inversa, obtenemos que BA=I2.

◻

El teorema anterior nos permite acotar por arriba el rango del producto de dos matrices. También hay una desigualdad que nos permite acotar por abajo el rango de dicho producto, cuando las matrices son cuadradas.

Teorema (desigualdad de Sylvester). Para matrices A y B de n×n, se tiene que rank(AB)rank(A)+rank(B)n.

Problema. La matriz A es de 2020×2020. Muestra que:

  • Si A tiene rango 2017, entonces la matriz A673 no puede ser la matriz de 2020×2020 de puros ceros, es decir, O2020.
  • Si A tiene rango 2016, entonces la matriz A673 puede ser la matriz O2020.

Sugerencia pre-solución. Enuncia una afirmación más general relacionada con el rango que puedas probar por inducción utilizando la desigualdad de Sylvester.

Solución. Para la primer parte, probaremos primero algo más general. Afirmamos que si M es una matriz de n×n de rango ns y k es un entero positivo, entonces el rango de la matriz Mk es por lo menos nks. Procedemos por inducción sobre k. Si k=1, el resultado es cierto pues M tiene rango ns=n1s.

Supongamos el resultado para cierto entero k. Usando la desigualdad de Sylverster y la hipótesis inductiva, tenemos que
rank(Ak+1)rank(Ak)+rank(A)n(nks)+(ns)n=n(k+1)s.

Esto muestra la afirmación general.

Si regresamos a la primer parte del problema original y aplicamos el resultado anterior, tenemos que A673 es una matriz de rango por lo menos 20206733=20202019=1. De esta forma, A673 no puede ser la matriz 0.

Hagamos ahora la segunda parte del problema. Para ello, debemos construir una matriz A de 2020×2020 de rango 2016 tal que A673 sea la matriz 0. Para ello, consideremos la matriz A tal que sus primeras 4 columnas sean iguales al vector 0, y que sus columnas de la 5 a la 2020 sean los vectores canónicos e1,,e2016.

Esta matriz claramente es de rango 2016, pues el espacio generado por sus columnas es el espacio generado por e1,,e2016, que es de dimensión 2016. Por otro lado, se puede mostrar inductivamente que para k=1,,505, se tiene que Ak es una matriz en donde sus columnas de 1 a 4k son todas el vector 0, y sus columnas de 4k+1 a 2020 son e1,,e20204k. En particular, A505=O2020, y entonces A673 también es la matriz de puros ceros.

◻

Equivalencias de rango de matrices

Hay muchas formas alternativas para calcular el rango de una matriz. El siguiente teorema resume las equivalencias más usadas en resolución de problemas.

Teorema. Sea A una matriz de m×n con entradas reales. Los siguientes números son todos iguales:

  • El rango de A, es decir, la dimensión del espacio vectorial generado por los vectores columna de A.
  • La dimensión del espacio vectorial generado por los vectores fila de A. Observa que esto es, por definición, el rango de la transpuesta de A.
  • La cantidad de filas no cero que tiene la forma escalonada reducida de A.
  • (Teorema de rango-nulidad) ndimker(A), donde ker(A) es el espacio vectorial de soluciones a AX=0.
  • El tamaño más grande de una submatriz cuadrada de A que sea invertible.
  • La cantidad de eigenvalores complejos distintos de cero contando multiplicidades algebraicas.

Problema. Determina todos los posibles rangos que pueden tener las matrices con entradas reales de la forma (abcdbadccdabdcba).

Sugerencia pre-solución. Comienza haciendo casos pequeños. Para dar los ejemplos y mostrar que tienen el rango deseado, usa el teorema de equivalencia de rango para simplificar algunos argumentos.

Solución. El rango de una matriz de 4×4 es un entero de 0 a 4. Debemos ver cuáles de estos valores se pueden alcanzar con matrices de la forma dada.

Tomando a=b=c=d=0, obtenemos la matriz O4, que tiene rango 0. Si a=b=c=d=1, obtenemos la matriz de puros unos, que tiene rango 1. Además, si a=1 y b=c=d=0, obtenemos la matriz identidad, que tiene rango 4.

Si a=b=1 y c=d=0, obtenemos la matriz A=(1100110000110011). Esta matriz tiene sólo dos columnas diferentes, así que su rango es a lo más dos. Pero tiene como submatriz a la matriz I2=(1001), que tiene rango 2, entonces el rango de A es al menos 2. De esta forma, el rango de A es 2.

Veamos ahora que el rango puede ser 3. Para ello, damos un argumento de determinantes. Llamemos s=a+b+c+d. Sumando las tres últimas filas a la primera y factorizando s, tenemos que
|abcdbadccdabdcba|=|ssssbadccdabdcba|=s|1111badccdabdcba|.

Así, si tomamos a=b=c=1 y d=3, entonces s=0 y por lo tanto la matriz B que obtenemos no es invertible, así que su rango es a lo más tres. Pero además es de rango al menos tres pues B tiene como submatriz a (113131311), que es invertible pues su determinante es 33311+27=160.

Concluimos que los posibles rangos que pueden tener las matrices de esa forma son 0,1,2,3,4.

◻

El teorema de factorización PJQ

Existen diversos teoremas que nos permiten factorizar matrices en formas especiales. De acuerdo a lo que pida un problema, es posible que se requiera usar uno u otro resultado. El teorema de factorización más útil para cuando se están resolviendo problemas de rango es el siguiente.

Teorema (factorización PJQ). Sea A una matriz de m×n y r un entero en {0,,min(m,n)}. El rango de A es igual a r si y sólo si existen matrices invertibles P de m×m y Q de n×n tales que A=PJrQ, en donde Jr es la matriz de m×n cuyas primeras r entradas de su diagonal principal son 1 y todas las demás entradas son cero, es decir, en términos de matrices de bloque, Jr=(IrOr,nrOmr,rOmr,nr).

Como evidencia de la utilidad de este teorema, sugerimos que intentes mostrar que el rango por columnas de una matriz es igual al rango por filas, usando únicamente la definición. Esto es relativamente difícil. Sin embargo, con el teorema PJQ es inmediato. Si A es de m×n y tiene rango r, entonces su factorización PJQ es de la forma A=PJrQ. Entonces al transponer obtenemos
tA=tQtJrtP.

Esto es de nuevo un factorización PJQ, con tJr la matriz de n×m que indica que tA es de rango r.

Veamos ahora un problema clásico en el que se puede usar la factorización PJQ.

Problema. Sea A una matriz de m×n y rango r. Muestra que:

  • A puede ser escrita como la suma de r matrices de rango 1.
  • A no puede ser escrita como la suma de r1 o menos matrices de rango 1.

Sugerencia pre-solución. Para la primer parte, usa el teorema PJQ. Para la segunda parte, usa desigualdades del rango.

Solución. Tomemos A=PJrQ una factorización PJQ de A.

Hagamos la primer parte. Para ello, para cada i=1,,r, consideremos la matriz Li de m×n tal que su i-ésima entrada en la diagonal principal es 1 y el resto de sus entradas son iguales a 0.

Por un lado, Li es de rango 1, pues tiene sólo una columna distinta de cero. De este modo, rank(PLiQ)rank(PLi)rank(Li)=1, y como P y Q son invertibles, rank(PLiQ)rank(Li)1. Así, para cada i=1,,r, se tiene que Li es de rango 1.

Por otro lado, Jr=L1+L2++Lr, así que
A=PJrQ=P(L1+L2++Lr)Q=PL1Q+PL2Q++PLrQ.

Esto expresa a A como suma de r matrices de rango 1.

Para la segunda parte del problema, usamos repetidamente que el rango es subaditivo. Si tenemos matrices B1,,Bs matrices de m×n, entonces
rank(B1+B2++Bs)rank(B1)+rank(B2++Bs)rank(B1)+rank(B2)+rank(B3++Bs)vdotsrank(B1)+rank(B2)++rank(Bs).

Si cada Bi es de rango 1, entonces su suma tiene rango a lo más s.

Así, la suma de r1 o menos matrices de rango 1 tiene rango a lo más r1, y por lo tanto no puede ser igual a A.

◻

Más problemas

Puedes encontrar más problemas de rango de una matriz en la Sección 5.4 del libro Essential Linear Algebra de Titu Andreescu. El teorema PJQ, así como muchos problemas ejemplo, los puedes encontrar en el Capítulo 5 del libro Mathematical Bridges de Andreescu, Mortici y Tetiva.

Álgebra Superior II: Desigualdades de polinomios reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior mostramos el teorema de factorización para polinomios con coeficientes reales. Lo que haremos ahora es ver que podemos aplicarlo en la resolución de desigualdades de polinomios en R[x]. El objetivo es que, al final de la entrada, entendamos cómo se pueden resolver problemas como los siguientes:

Problema 1. Determina todos los números x en R para los cuales x612x449x230>3x548x351x+6.

Problema 2. Determina todos los números x en R para los cuales 1x>x3x2+1.

Antes de hablar de resolución de desigualdades de polinomios, veremos una forma alternativa de factorizar en R[x] usando potencias.

Teorema de factorización de polinomios reales con potencias

De acuerdo al teorema de factorización en R[x], un polinomio p(x) se puede factorizar de manera única en factores lineales y factores cuadráticos con discriminante negativo. De ser necesario, podemos agrupar los factores lineales iguales y reordenarlos para llegar a una factorización de la forma a(xr1)α1(xrm)αm(x2b1x+c1)(x2bnx+cn), en donde:

  • a es un real distinto de cero,
  • α1,,αm y n son enteros positivos tales que 2n+i=1mαi es igual al grado de p(x),
  • para cada i en {1,,m} se tiene que ri es raíz real de p(x) y r1<r2<<rm
  • para cada j en {1,,n} se tiene que bj,cj son reales tales que bj24cj<0.

Observa que los ri son ahora distintos y que están ordenados como r1<<rm. De aquí, obtenemos que (xri)αi es la mayor potencia del factor lineal xri que divide a p(x). Este número αi se usa frecuentemente, y merece una definición por separado.

Definición. Sea p(x) un polinomio en R[x] y r una raíz de p(x). La multiplicidad de r como raíz de p(x) es el mayor entero α tal que (xr)αp(x). Decimos también que r es una raíz de multiplicidad α.

Ejemplo. El polinomio k(x)=x4x33x2+5x2 se factoriza como (x1)3(x+2). Así, la multiplicidad de 1 como raíz de k(x) es 3. Además, 2 es una raíz de k(x) de multiplicidad 1.

Después hablaremos de una forma práctica en la que podemos encontrar la multiplicidad de una raíz, cuando hablemos de continuidad de polinomios y sus derivadas.

Desigualdades de polinomios reales factorizados

Supongamos que tenemos un polinomio p(x) no constante en R[x] para el cual conocemos su factorización en la forma a(xr1)α1(xrm)αm(x2b1x+c1)(x2bnx+cn), y que queremos determinar para qué valores reales r se cumple que p(r)>0.

Daremos por cierto el siguiente resultado, que demostraremos cuando hablemos de continuidad de polinomios.

Proposición. Las evaluaciones en reales de un polinomio cuadrático y mónico en R[x] de discriminante negativo, siempre son positivas.

Lo que nos dice este resultado es que, para fines de la desigualdad que queremos resolver, podemos ignorar los factores cuadráticos en la factorización de p(x) pues

a(xr1)α1(xrm)αm(x2b1x+c1)(x2bnx+cn) y a(xr1)α1(xrm)αm tienen el mismo signo.

Por la miasma razón, podemos ignorar aquellos factores lineales con exponente par, y de los de exponente impar, digamos (xr)2β+1 obtenemos una desigualdad equivalente si los remplazamos por exponente 1, pues (xr)2β es positivo y por lo tanto no cambia el signo de la desigualdad si lo ignoramos.

En resumen, cuando estamos resolviendo una desigualdad del estilo p(x)>0 podemos, sin cambiar el conjunto solución, reducirla a una de la forma q(x):=a(xr1)(xr2)(xrm)>0. La observación clave para resolver desigualdades de este estilo está resumida en el siguiente resultado.

Proposición. Tomemos un polinomio q(x) en R[x] de la forma q(x)=a(xr1)(xr2)(xrm) con r1<<rm reales.

Si m es par:

  • Para reales r en la unión de intervalos (,r1)(r2,r3)(rm2,rm1)(rm,), la evaluación q(r) tiene el mismo signo que a
  • Para reales r en la unión de intervalos (r1,r2)(r3,r4)(rm3,rm2)(rm1,rm), la evaluación q(r) tiene signo distinto al de a.

Si m es impar:

  • Para reales r en la unión de intervalos (r1,r2)(r3,r4)(rm2,rm1)(rm,), la evaluación q(r) tiene el mismo signo que a.
  • Para reales r en la unión de intervalos (,r1)(r2,r3)(rm3,rm2)(rm1,rm), la evaluación q(r) tiene signo distinto al de a.

Demostración. El producto (rr1)(rr2)(rrm) es positivo si y sólo si tiene una cantidad par de factores negativos. Si r>rm, todos los factores son positivos, y por lo tanto q(r) tiene el mismo signo que a cuando r está en el intervalo (rm,).

Cada que movemos r de derecha a izquierda y cruzamos un valor ri, cambia el signo de exactamente uno de los factores, y por lo tanto la paridad de la cantidad de factores negativos. El resultado se sigue de hacer el análisis de casos correspondiente.

◻

Veamos cómo podemos utilizar esta técnica para resolver desigualdades polinomiales que involucran a un polinomio que ya está factorizado en irreducibles.

Problema 1. Determina para qué valores reales x se tiene que 2(x5)7(x+8)4(x+2)3(x+10)(x2x+2)3 es positivo.

Solución. Por la discusión anterior, podemos ignorar el polinomio cuadrático del final, pues es irreducible. También podemos ignorar los factores lineales con potencia par, y podemos remplazar las potencias impares por unos. Así, basta con encontrar los valores reales de x para los cuales q(x)=2(x5)(x+2)(x+10) es positivo. Tenemos 3 factores, así que estamos en el caso de m impar en la proposición.

Las tres raíces, en orden, son 10,2,5. Por la proposición, para x en la unión de intervalos (,10)(2,5) se tiene que q(x) tiene signo distinto al de a=2 y por lo tanto es positivo. Para x en el conjunto (10,2)(5,) se tiene que q(x) tiene signo igual al de a=2, y por lo tanto es negativo. De esta forma, la respuesta es el conjunto (,10)(2,5).

Puedes dar clic aquí para ver en GeoGebra las gráfica de q(x) y del polinomio original, y verificar que tienen el mismo signo en los mismos intervalos.

Si estamos resolviendo una desigualdad y el valor de a en la factorización es positivo, es un poco más práctico ignorarlo desde el principio, pues no afecta a la desigualdad.

Problema 2. Determina para qué valores reales x se tiene que 7(x+7)13(x+2)31(x5)18(x2+1) es positivo.

Solución. Tras las cancelaciones correspondientes, obtenemos la desigualdad equivalente (x+7)(x+2)>0.

Las raíces del polinomio que aparece son 7 y 2. De acuerdo a la proposición, estamos en el caso con m par. De esta forma, la expresión es negativa en el intervalo (7,2) y es positiva en la unión de intervalos (,7)(2,).

Otras desigualdades de polinomios y manipulaciones algebraicas

Si tenemos otras expresiones polinomiales, también podemos resolverlas con ideas similares, solo que a veces se tienen que hacer algunas manipulaciones previas para llevar la desigualdad a una de la forma p(x)>0.

Problema. Determina todos los números x en R para los cuales x612x449x230>3x548x351x+6.

Solución. El problema es equivalente a encontrar los reales x para los cuales x63x5+12x4+48x329x2+51x36>0. El polinomio del lado izquierdo se puede factorizar como (x3)2(x1)(x+4)(x2+1), así que obtenemos el problema equivalente (x3)2(x1)(x+4)(x2+1)>0, que ya sabemos resolver. El resto de la solución queda como tarea moral.

Puedes ver la gráfica del polinomio (x3)2(x1)(x+4)(x2+1) en GeoGebra si das clic aquí.

Tener cuidado al multiplicar por denominadores

Hay que tener cuidado al realizar algunas manipulaciones algebraicas, pues pueden cambiar el signo de la desigualdad que estamos estudiando. Veamos un ejemplo donde sucede esto.

Problema. Determina todos los números x en R para los cuales 1x>x3x2+1.

Solución. La expresión no está definida en x=0, pues se anula un denominador. Supongamos entonces que x0, y recordémoslo al expresar la solución final. Vamos a multiplicar la desigualdad por x, pero tenemos que hacer casos.

Si x>0, entonces el signo de desigualdad no se altera y obtenemos la desigualdad equivalente 0>x4x3+x1=(x1)(x+1)(x2x+1). El factor cuadrático es irreducible y lo podemos ignorar. Si estuviéramos trabajando en todo R, el conjunto solución sería el intervalo (1,1). Sin embargo, tenemos que restringir este conjunto solución sólo al caso en el que estamos, es decir, x>0. Así, para este caso sólo los reales en (0,1) son solución.

Si x<0, entonces el signo de la desigualdad sí se altera, y entonces obtenemos la desigualdad equivalente 0<x4x3+x1=(x1)(x+1)(x2x+1). De nuevo podemos ignorar el factor cuadrático. La desigualdad tiene solución en todo R al conjunto (,1)(1,), pero en este caso debemos limitarlo adicionalmente con la restricción x<0. De este modo, las soluciones para este caso están en el intervalo (,1).

Ahora sí, juntando ambos casos, tenemos que el conjunto solución final es (,1)(0,1).

Puedes ver la gráfica en GeoGebra de 1xx3+x21 dando clic aquí. Ahí puedes verificar que esta expresión es positiva exactamente en el conjunto que encontramos.

Más adelante…

Como queda claro, resulta ser útil tener un polinomio en su forma factorizada para resolver desigualdades de polinomios reales. En los ejemplos que dimos en esta entrada, se dieron las factorizaciones de los polinomios involucrados. En el resto del curso veremos herramientas que nos permitirán encontrar la factorización de un polinomio o, lo que es parecido, encontrar sus raíces:

  • Veremos propiedades de continuidad de polinomios para mostrar la existencia de raíces para polinomios reales en ciertos intervalos.
  • El teorema del factor nos dice que si r es raíz de p(x), entonces xr divide a p(x). Sin embargo, no nos dice cuál es la multiplicidad de r. Veremos que la derivada de un polinomio nos puede ayudar a determinar eso.
  • También veremos el criterio de la raíz racional, que nos permite enlistar todos los cantidatos a ser raíces racionales de un polinomio p(x) con coeficientes racionales.
  • Finalmente, veremos que para los polinomios de grado 3 y 4 hay formas de obtener sus raíces de forma explícita, mediante las fórmulas de Cardano y de Ferrari.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Completa la solución del problema enunciado en la sección de manipulaciones algebraicas.
  2. Encuentra el conjunto solución de números reales x tales que (x+1)(x+2)2(x+3)3(x+4)4>0.
  3. Determina las soluciones reales a la desigualdad x1x+2>x+2x1. Ten cuidado con los signos. Verifica tu respuesta en este enlace de GeoGebra, que muestra la gráfica de f(x)=x1x+2x+2x1.
  4. Realiza las gráficas de otros polinomios de la entrada en GeoGebra para verificar las soluciones dadas a las desigualdades de polinomios.
  5. Revisa esta entrada, en donde se hablan de aplicaciones de desigualdades polinomiales para un problema de un concurso de matemáticas.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Seminario de Resolución de Problemas: Desigualdad de Cauchy-Schwarz

Por Leonardo Ignacio Martínez Sandoval

Introducción

Seguimos con las entradas de temas de desigualdades. Con anterioridad ya hablamos de desigualdades básicas y de desigualdades con medias. En esta ocasión estudiaremos una desigualdad muy versátil: la desigualdad de Cauchy-Schwarz.

En su versión más simple, lo que dice la desigualdad de Cauchy-Schwarz es lo siguiente.

Desigualdad (de Cauchy-Schwarz). Para cualesquiera números reales a1,,an y b1,,bn se tiene que |a1b1++anbn|a12++an2b12++bn2.

Primero, veremos cómo se demuestra esta desigualdad. Luego, veremos varios problemas en los que se puede aplicar. Finalmente, hablaremos un poco de sus extensiones a espacios vectoriales.

La demostración polinomial de la desigualdad de Cauchy-Schwarz

Una forma de demostrar la desigualdad de Cauchy-Schwarz es usando inducción sobre n. Hay otra demostración usando polinomios. Veamos esa demostración, pues tiene la idea útil de usar argumentos polinomiales para demostrar igualdades.

Consideremos la expresión p(t)=i=1n(ai+bit)2. Como es una suma de cuadrados, esta expresión es no negativa. Haciendo los cuadrados, y desarrollando la suma, podemos escribirla de la siguiente forma, que nos dice que es un polinomio cuadrático en t:

i=1n(ai+bit)2=i=1n(ai2+2aibit+bi2t2)=i=1nai2+(2i=1naibi)t+(i=1nbi2)t2.

De esta forma p(t) es un polinomio cuadrático y siempre toma valores no negativos. Así, a lo más puede tener una raíz t, por lo que su discriminante es menor o igual a 0:

(2i=1naibi)24(i=1nai2)(i=1nbi2)0

Al pasar el segundo término sumando al otro lado y dividir entre 4 queda

(i=1naibi)2(i=1nai2)(i=1nbi2).

Al sacar raíz cuadrada de ambos lados hay que tener cuidado de poner un valor absoluto al lado izquierdo. Al hacer esto, se obtiene el resultado deseado: |i=1naibi|i=1nai2i=1nbi2.

Observa que la igualdad se da si y sólo si el discriminante es 0, lo cual sucede si y sólo si el polinomio tiene una raíz t. Cuando esto pasa, cada uno de los sumandos al cuadrado de p(t) debe ser 0. Así, existe un real t tal que ai=tbi para todo i=1,,n. Esto lo podemos decir en términos vectoriales como que «la igualdad se da si y sólo si el vector (a1,,an) es un múltiplo escalar del vector (b1,,bn) » .

Un problema sobre acotar el valor de una variable

Problema. Sean a,b,c,d números reales tales que
a+b+c+d=6a2+b2+c2+d2=12.
¿Cuál es el máximo valor que puede tener d?

Sugerencia. Aplica la desigualdad de Cauchy-Schwarz a las ternas (a,b,c) y (1,1,1).

Solución. Aplicando la desigualdad a las ternas (a,b,c) y (1,1,1) obtenemos que |a+b+c|a2+b2+c23. Usando las hipótesis sobre a,b,c,d, tenemos que esta desigualdad es equivalente a $|6-d|\leq \sqrt{3}\cdot {\sqrt{12-d^2}$. Elevando al cuadrado de ambos lados, obtenemos las desigualdades equivalentes
3612d+d23(12d2)3612d+d2363d24d212d04d(d3)0.

Para que se satisfaga esta desigualdad, tiene que pasar o bien que simultáneamente d0 y d3 (lo cual es imposible), o bien que simultáneamente d0 y d3. En conclusión, esto acota el máximo valor posible de d con 3.

En efecto, existe una solución con d=3. De acuerdo al caso de igualdad de la desigualdad de Cauchy-Schwarz, debe pasar cuando (a,b,c) es un múltiplo escalar de (1,1,1), es decir, cuando a=b=c. Como a+b+c+d=6 y queremos d=3, esto forza a que a=b=c=1. Y en efecto, tenemos que con esta elección a2+b2+c2+d2=1+1+1+9=12.

◻

Aplicando Cauchy-Schwarz en un problema con el circunradio

A veces podemos aprovechar información implícita en un problema geométrico y combinarla con la desigualdad de Cauchy-Schwarz. Veamos un problema en el que sucede esto.

Problema. Sea P un punto en el interior del triángulo ABC y p,q,r las distancias de P a los lados BC,CA,AB respectivamente, que tienen longitudes a,b,c, respectivamente. Sea R el circunradio de ABC. Muestra que p+q+ra2+b2+c22R.

Sugerencia pre-solución. Necesitarás aplicar la desigualdad de Cauchy-Schwarz más de una vez. Haz una figura para entender la expresión ap+bq+cr. Necesitarás también la fórmula que dice que se puede calcular el área T de un triángulo mediante la fórmula T=abcR.

Solución. Lo primero que haremos es aplicar la desigualdad de Cauchy-Schwarz en las ternas (ap,bq,cr) y (1/a,1/b,1/c) para obtener p+q+rap+bq+cr1a+1b+1c.

Observa que ap es dos veces el área de BCP. De manera similar, tenemos que bq y cr son las áreas de CAP y ABP respectivamente. Así, si llamamos T al área de ABC tenemos que ap+bq+cr=2T. Otra expresión para el área de ABC en términos de su circunradio R es T=abc4R. En otras palabras, ap+bq+cr=abc2R.

Esto nos permite continuar con la desigualdad como sigue:
p+q+rabc2R1a+1b+1c=abc2Rab+bc+caabc=ab+bc+ca2R.

Esto es casi la desigualdad que queremos. Para terminar, basta mostrar que ab+bc+caa2+b2+c2. Esto se puede hacer de varias formas (intenta hacerlo usando la desigualdad MA-MG). Pero para continuar viendo la versatilidad de la desigualdad de Cauchy-Schwarz, observa que se puede deducir de ella aplicándola a las ternas (a,b,c) y (b,c,a).

◻

En el problema anterior, ¿para qué puntos P se alcanza la igualdad?

Cauchy-Schwarz más allá de los números reales

Lo que está detrás de la desiguadad de Cauchy-Schwarz es en realidad la noción de producto interior en álgebra lineal. En cualquier espacio vectorial sobre los reales que tenga un producto interior , se satisface una desigualdad del tipo de la de Cauchy-Schwarz. No entraremos en los detalles de la teoría que se necesita desarrollar, pues eso se estudia en un curso de álgebra lineal. Sin embargo, enunciaremos el teorema y veremos una forma de aplicarlo.

Teorema (desigualdad de Cauchy-Schwarz). Si V es un espacio vectorial con producto interior , entonces para cualesquiera dos vectores u y v se satisface que |u,v|u,uv,v.

Se puede mostrar que bajo las hipótesis del teorema la función u:=u,u es una norma. Como platicamos con anterioridad, una norma satisface la desigualdad del triángulo, que en espacios vectoriales tiene un nombre especial.

Teorema (desigualdad de Minkowski). Si V es un espacio vectorial con producto interior , y u:=u,u, entonces para cualesquiera dos vectores u y v se satisface que u+vu+v.

Es relativamente sencillo ver que las desigualdades de Cauchy-Schwarz y de Minkowski son «equivalentes», en el sentido de que se puede mostrar una fácilmente suponiendo la otra y viceversa.

La desigualdad de Cauchy-Schwarz que usamos en las secciones anteriores es para el producto interior en Rn dado por (a1,,an),(b1,,bn)=a1b1++anbn, al cual le llamamos el producto punto.

Si tenemos a V el espacio vectorial de las funciones continuas reales en el intervalo [0,1], entonces f,g=01f(x)g(x)dx es un producto interior para V. Esto nos puede ayudar a resolver algunos problemas.

Problema. Sea f:[0,1]R+ una función continua. Muestra que (01f(x)dx)(011f(x)dt)1.

Sugerencia pre-solución. Aplica la desigualdad de Cauchy-Schwarz con el producto interior que discutimos antes de esta entrada.

Solución. Tomemos el producto interior f,g=01f(x)g(x)dx en el espacio vectorial de funciones reales y continuas en [0,1]. Como la imagen de f está en los reales positivos, podemos definir la función h:[0,1]R+ dada por h(x)=f(x).

Tenemos que
h,1h=01h(x)1h(x)dx=011dx=1.

Por otro lado,

h,h=01h(x)h(x)dx=01f(x)dx.

y

1h,1h=011h(x)1h(x)dx=011f(x)dx

La conclusión se sigue entonces de manera inmediata de la desigualdad de Cauchy-Schwarz para ,.

◻

Más problemas

Puedes encontrar más problemas que usan la desigualdad de Cauchy-Schwarz en la sección 7.1 del libro Problem Solving through Problems de Loren Larson. También puedes consultar más técnicas y problemas en el libro Desigualdades de la Olimpiada Mexicana de Matemáticas.

Seminario de Resolución de Problemas: Desigualdades básicas

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas correspondientes a esta parte del curso aprenderemos varias técnicas que nos permitirán resolver problemas que involucren desigualdades. El área es enorme y hay libros enteros dedicados a ello. Nosotros sólo veremos algunas técnicas. Comenzaremos con desigualdades básicas y nos enfocaremos en los siguientes temas:

  • Desigualdad x20 y desigualdad del triángulo
  • Desigualdades de medias
  • La desigualdad de Cauchy-Schwarz
  • Técnicas de cálculo en desigualdades

En esta entrada veremos el primer inciso, que consiste de dos ideas muy sencillas:

Desigualdad x20. El cuadrado de cualquier número real es mayor o igual a cero. Es cero si y sólo si el número es cero.

Desigualdad del triángulo. Si V es un espacio vectorial con norma , entonces para cualesquiera vectores u y v se tiene que u+vu+v.

La desigualdad x20 parece muy inocente. Sin embargo, es una herramienta muy versátil cuando se combina con manipulaciones algebraicas creativas. La desigualdad del triángulo la estamos enunciando para espacios vectoriales con norma en general. Dos casos particulares que a lo mejor te son más familiares son los siguientes:

Desigualdad del triángulo para R. Si a y b son números reales, entonces |a|+|b||a+b|.

Desigualdad del triángulo en Rn. Si ABC es un triángulo en el plano (o dimensiones más altas) , de lados de longitudes AB=c, BC=a y CA=b, entonces
a+bcb+cac+ab.

Si una de las igualdades se da, ABC es un triángulo degenerado, es decir, con sus tres vértices alineados. En otro caso, todas las desigualdades son estrictas.

Veamos aplicaciones de estas desigualdades básicas.

La desigualdad a2+b22ab

Comenzaremos probando de dos formas distintas una desigualdad que también resulta útil en otras ocasiones.

Problema. Sean a y b números reales mayores o iguales a cero. Muestra que a+b2ab, y que la igualdad se da si y sólo si a y b son iguales.

A esta desigualdad se le conoce como la desigualdad MA-MG para dos números reales. También forma parte de las desigualdades básicas que te ayudará conocer. Se llama así pues en el lado izquierdo tenemos a la media aritmética de los números a y b, y al lado derecho tenemos la media geométrica de los números a y b. En realidad la desigualdad se vale para más reales no negativos, pero esto lo veremos en otra entrada.

Sugerencia pre-solución. El problema se puede resolver tanto de manera algebraica, (usando x20) como de manera geométrica (usando la desigualdad del triángulo).

Para resolverlo de la primera forma, trabaja hacia atrás. Haz manipulaciones algebraicas para formular problemas equivalentes hasta que llegues a una desigualdad obvia.

Para resolverlo de la segunda forma, haz una figura en la que puedas representar tanto a la media geométrica como a la aritmética. Una forma de hacerlo es comenzar con una semicircunferencia de diámetro a+b.

Para identificar el caso de igualdad, haz un análisis de casos.

Solución algebraica. Queremos mostrar que a+b2ab. Pasando el dos multiplicando, y luego 2ab restando al lado izquierdo, esta desigualdad igualdad ocurre si y sólo si a+b2ab0. En el lado izquierdo identificamos un binomio al cuadrado, que se puede factorizar para dar la desigualdad equivalente (ab)20.

Esta desigualdad es de la forma x20, así que es claramente cierta. La igualdad ocurre si y sólo si ab=0, lo cual sucede si y sólo si a=b. Todos los pasos que hicimos son reversibles. Esto termina la solución.

◻

Solución geométrica. Consideremos la siguiente figura, en donde tenemos una semicircunferencia de diámetro AB=a+b y centro O. Aquí C es un punto en AB tal que AC=a y entonces CB=b. Además, D es un punto sobre la circunferencia tal que DC es perpendicular a AB. Llamemos d=CD.

Prueba visual de la desigualdad entre la media aritmética y media geométrica usando desigualdades básicas
Prueba visual de MA-MG

Como AOD y BOD son isósceles por tener dos lados iguales al radio de la circunferencia, tenemos que ADO=DAO y BDO=DBO. Usando estas igualdades y que la suma de los ángulos internos de ABD es 180, se puede mostrar que el ángulo ADB es de 90.

De este modo, ACD y DCB son semejantes (por ser ambos semejantes a ABD por criterio AA). Por la semejanza, tenemos que ad=db, de donde d=ab.

Para terminar la demostración, tomamos un punto E sobre DO tal que EOC=ECO. Por la desigualdad del triángulo en DEC, tenemos que

ab=DCDE+EC=DE+EO=DO=a+b2.

Con esto demostramos la desigualdad. Para terminar el problema, necesitamos ver cuándo se dan los casos de igualdad. Se tiene la igualdad si y sólo si DEC es un triángulo degenerado, lo cual sucede si y sólo si E está en el segmento DC. Esto sólo es posible cuando DO es perpendicular a AB, lo cual sucede si y sólo si C=O, si y sólo si AC=CB, si y sólo si a=b.

◻

Desigualdades básicas aplicadas a un problema de la Olimpiada Mexicana de Matemáticas

El siguiente problema apareció como parte de los exámenes selectivos que el Comité Nacional de la Olimpiada Mexicana de Matemáticas envía a los estados para seleccionar a sus estudiantes en distintas etapas. Tiene muchas formas de resolverse, pero veamos cómo se puede resolver con desigualdades básicas.

Problema. Sean a,b,c,d reales positivos con a2+b2+c2+d2=4. Muestra que a5+b5+c5+d5a+b+c+d

Sugerencia pre-solución. Modifica el problema a mostrar como desigualdad auxiliar que para un real no negativo x se tiene que x52x2x+20. Esta desigualdad se puede demostrar usando que los cuadrados son no negativos.

Solución. Vamos a probar primero la desigualdad x52x2x+20. Para que sea un poco más fácil, factorizaremos la expresión del lado izquierdo.

Notemos que 1 es una raíz de x52x2x+2, de modo que por el teorema del factor podemos factorizar x1 del polinomio. Obtenemos que x52x2x+2=(x1)(x4+x3+x2x2).

Notemos que, nuevamente, 1 es una raíz de (x4+x3+x2x2). Al factorizar x1 de nuevo, obtenemos que x52x2x+2=(x1)2(x3+2x2+3x+2).

Ya estamos listos para probar la desigualdad que queremos. Notemos que (x1)20 y que x3+2x2+3x+2 es mayor o igual que cero para x0 pues es un polinomio con puros coeficientes positivos. Esto prueba la desigualdad auxiliar. Reescribiéndola, tenemos que x52x2+x2. Aplicándola en esta forma a los cuatro reales positivos a,b,c,d del problema, y usando que la suma de cuadardos es 4, obtenemos que
a5+b5+c5+d52(a2+b2+c2+d2)+a+b+c+d8=24+a+b+c+d8=a+b+c+d.

Esto termina el problema.

◻

El primer paso parece un poco artificial. ¿Por qué queremos probar esa desigualdad auxiliar? En otra entrada de blog escribí cómo se puede llegar a las ideas de esta solución.

Desigualdad del triángulo aplicada a la construcción de tetraedros

Si pegamos cuatro triángulos equiláteros en el espacio se hace un tetraedro regular. De manera similar, si pegamos cuatro triángulos como el siguiente, también se hace un tetraedro en el espacio:

Pegar cuatro triángulos congruentes para hacer un tetraedro

La intuición nos dice que debería poderse con cualquier triángulo. Pero esta intuición está mal.

Problema. Sea ABC un triángulo con un ángulo mayor a 90. Muestra que no existe ningún tetraedro en el espacio tal que sus cuatro caras sean congruentes a ABC.

Sugerencia pre-solución. Procede por contradicción. Por simetría, puedes asumir que el ángulo mayor a 90 es el ángulo en A. Usa como punto auxiliar al punto medio de BC y usa desigualdades.

Solución. Una observación inicial es que si ABC es un triángulo, M es el punto medio de BC y su ángulo interno en A es mayor a 90, entonces 2AM<BC. Esto se muestra trazando una circunferencia de diámetro BC.

Desigualdad para la mediana en términos del ángulo que hace.

De hecho,

  • Un punto X está sobre la circunfencia si y sólo si BXC=90, si y sólo si OX=OA.
  • X está dentro de la circunferencia si y sólo si BXC>90, si y sólo si OX<OA y
  • X está fuera de la circunferencia si y sólo si BXC<90, si y sólo si OX>OA.

Resolvamos el problema. Sin pérdida de generalidad, el ángulo en A es mayor a 90. Entonces AM<BC2, de donde 2AM<BC.

Supongamos que se pudiera hacer en el espacio un tetraedro WXYZ tal que cada una de las caras es congruente al triángulo ABC. Sin pérdida de generalidad, tenemos que
WX=YZ=ABXY=ZW=BCWY=XZ=CA.

Tomemos el punto medio M de XY. En ZMW, tenemos que
ZM=AMWM=AM.

Así, usando la desigualdad del triángulo en ZMW tenemos que 2AM=ZM+WMZW=BC.

Esto es una contradicción con la desigualdad 2AM<BC que ya habíamos mostrado.

◻

Más problemas

Puedes encontrar más problemas de desigualdades básicas en la sección 7.1 del libro Problem Solving through Problems de Loren Larson. También puedes consultar más técnicas y problemas en el libro Desigualdades de la Olimpiada Mexicana de Matemáticas.

Álgebra Lineal I: Problemas de desigualdades vectoriales

Por Ayax Calderón

Introducción

En esta entrada practicaremos las dos desigualdades vectoriales que hemos visto anteriormente: la desigualdad de Cauchy – Schwarz y con la desigualdad de Minkowski. Veremos que de ellas se obtiene información valiosa sobre los espacios con producto interior.

Como ya se menciono en otras entradas del blog, estos espacios son muy importantes más allá del álgebra lineal, pues también aparecen en otros áreas como el análisis matemático, variable compleja, probabilidad, etc. Así mismo, los espacios vectoriales con producto interior tienen muchas aplicaciones en el mundo real. Por esta razón es muy importante aprender a detectar cuándo podemos usar desigualdades vectoriales.

Problemas resueltos

Comencemos con algunos problemas de desigualdades vectoriales que usan la desigualdad de Cauchy-Schwarz.

Problema 1. Demuestra que si f:[a,b]R es una función continua, entonces

(abf(t)dt)2(ba)abf(t)2dt.

Demostración. Sea V=C([a,b],R) el espacio de las funciones continuas de [a,b] en los reales.

Veamos que ,:V×VR definido por f,g=abf(t)g(t)dt es una forma bilineal simétrica.

Sea fV fija. Veamos que gf,g es lineal.

Sean g,hV y kF, entonces

f,g+hk=abf(t)(g(t)+kh(t))dt=ab(f(t)g(t)+kf(t)h(t))dt=abf(t)g(t)dt+kabf(t)h(t)dt=f,g+kf,h.

Análogamente se ve que si gV fija, entonces ff,g es lineal.

Luego,
f,g=abf(t)g(t)dt=abg(t)f(t)dt=g,f.
Por lo tanto , es una forma bilineal simétrica.

Ahora observemos que , es positiva.
f,f=abf(t)2dt0 pues f2(t)0. Aunque no lo necesitaremos, mostremos además que que , es positiva definida. Si f tiene algún valor c en el interior de [a,b] en la que f(c)0, como es continua, hay un ϵ>0 tal que en todo el intervalo (cϵ,c+ϵ) se cumple que |f| es mayor que |f(c)|/2, de modo que
f,f=abf2(t)dtcϵc+ϵf2(t)dtcϵc+ϵf(c)24dt=ϵf(c)22>0.

Así, para que f,f sea 0, es necesario que f sea 0 en todo el intervalo (a,b) y por continuidad, que sea cero en todo [a,b].

Sea q la forma cuadrática asociada a ,.
En vista de todo lo anterior, podemos aplicar la desigualdad de Cauchy -Schwarz tomando g la función constante 1, es decir, tal que g(x)=1 para todo x en [a,b], la cual claramente es continua.

Entonces, Misplaced & que substituyendo las definiciones es
(abf(t)dt)2(abf(t)2dt)(ab12dt)=(ba)abf(t)2dt

◻

Problema 2. a) Sean x1,,xnR. Demuestra que
(x12++xn2)(1x12++1xn2)n2.
b) Demuestra que si f:[a,b](0,) es una función continua, entonces (abf(t)dt)(ab1f(t)dt)(ba)2

Demostración. a) Considera Rn con el producto interior usual. Sean a,bRn dados por
a=(x1,,xn)b=(1x1,,1xn).

La desigualdad de Cauchy-Schwarz afirma que |a,b|ab. Se tiene que

a,b=(x1,,xn)(1x1,,1xn)=1+1++1=n,

de modo que
|n|ab=(x12++xn2)(1x12++1xn2).

Si elevamos al cuadrado ambos extremos de esta igualdad, obtenemos la desigualdad deseada.

◻

b) En el problema 1 de esta entrada vimos que f,g=abf(t)g(t)dt es un producto interior para el espacio de funciones continuas en [a,b], y el espacio de este problema es un subespacio del de funciones continuas, así que también define un producto interior aquí.

Para la función f dada, definamos ϕ(t)=f(t) y ψ(t)=1f(t).
Notemos que ϕ y ψ son continuas, y además como t[a,b] se tiene f(t)(0,), también tenemos que ψ(t),ϕ(t)(0,).

Aplicando la desigualdad de Cauchy-Schwarz ϕ,ψ2ϕ,ϕψ,ψ.

Entonces
(abϕ(t)ψ(t)dt)2(abϕ(t)2dt)(abψ(t)2dt).

Luego, substituyendo los valores de ϕ y ψ:
(abf(t)1f(t)dt)2(abf(t)dt)(ab1f(t)dt).

Finalmente, haciendo la integral a la izquierda:
(ba)2(abf(t)dt)(ab1f(t)dt).

◻

Hay algunos problemas de desigualdades en los reales que necesitan que usemos herramientas de desigualdades vectoriales.

Problema 3. Sean x,y,z números mayores que 1, tales que 1x+1y+1z=2. Muestre que
x+y+xx1+y1+z1.


Demostración. Considera R3 con el producto interior usual y u,vR3 con
u=(x1x,y1y,z1z),v=(x,y,z).

Aplicamos la desigualdad de Cauchy-Schwarz a u y v:

x1+y1+z1x1x+y1y+z1zx+y+z=(1+1+1)(1x+1y+1z)x+y+z=32x+y+z=x+y+z.

Por lo tanto, x+y+xx1+y1+z1.

◻

Problema 4. Sea f:[a,b](0,) una función continua.
Demuestre que abf(t)dt((ba)abf(t)2dt)12.

Demostración. Ya vimos que f,g=abf(t)g(t)dt es un producto interior para el espacio de funciones continuas.
Considera g la función constante 1.

Aplicando la desigualdad de Minkowski se tiene que
f+g,f+gf,f+g,g

Tenemos entonces que:

(ab(f(t)+1)2dt)12(abf(t)2dt)12+(abdt)12.

Desarrollando el cuadrado en el lado izquierdo,
(abf(t)2dt+2abf(t)dt+(ba))12(abf(t)2dt)12+(ba)12

Luego, elevando ambos lados de la ecuación al cuadrado
abf(t)2dt+2abf(t)dt+(ba)
abf(t)2dt+2ba(abf(t)2dt)12+(ba)

Finalmente, cancelando términos igual en ambos lados, obtenemos la desigualdad deseada

abf(t)dt((ba)abf(t)2dt)12.

◻

Tarea Moral

  • Resuelve el problema 2.b usando la desigualdad de Minkowski.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»