Archivo del Autor: Leonardo Ignacio Martínez Sandoval

Acerca de Leonardo Ignacio Martínez Sandoval

Hola. Soy Leonardo Martínez. Soy Profesor de Tiempo Completo en la Facultad de Ciencias de la UNAM. Hice un doctorado en Matemáticas en la UNAM, un postdoc en Israel y uno en Francia. Además, me gusta colaborar con proyectos de difusión de las matemáticas como la Olimpiada Mexicana de Matemáticas.

Seminario de Resolución de Problemas: La integral

Por Leonardo Ignacio Martínez Sandoval

Introducción

Ya hemos cubierto varios temas de cálculo y resolución de problemas. Comenzamos platicando acerca de continuidad y de dos teoremas importantes para funciones continuas: el teorema del valor intermedio y el teorema del valor extremo. Después, hablamos acerca de derivadas y de dos teoremas importantes para funciones diferenciables: el teorema de Rolle y el teorema del valor medio. Luego, vimos que la diferenciabilidad también nos ayuda a encontrar límites de cocientes y potencias de formas indefinidas mediante la regla de L’Hôpital. En esta entrada y la siguiente hablaremos de la integral y cómo las ideas detrás de su construcción, así como sus propiedades, pueden ayudar a resolver problemas.

Para entender esta sección bien, es importante que conozcas la construcción de la integral de Riemann en una variable, así como sus propiedades principales. También supondremos que conoces las técnicas usuales para resolver integrales. Esto se hace durante el primer año de un curso de cálculo a nivel licenciatura. También puedes revisarlo en la literatura clásica, como el libro de Cálculo de Spivak.

Usar la integral como un área

La integral es por definición un límite de sumas superiores o inferiores. Hay problemas en los que podemos aprovechar esto para entender una suma o una sucesión. A grandes rasgos lo que hacemos es:

  • Interpretar la sucesión o serie como una suma de areas correspondiente a una suma superior o inferior de cierta integral $\int f(x) \,dx$.
  • Usar lo que sabemos de integración para poder decir algo del área dada por $\int f(x)\, dx$
  • Regresar esta información al problema original.

Veamos un ejemplo de esto.

Problema. Calcula el siguiente límite $$\lim_{n\to \infty} \left(\frac{1}{n}+\frac{1}{n+1}+\ldots+\frac{1}{2n-1}\right).$$

La cantidad de términos de este límite depende de $n$, así que no podemos hacerlos uno por uno. No hay una forma sencilla de hacer la suma. Tampoco parece que podamos usar la regla de L’Hôpital. Lo que haremos es entender a la expresión dentro del límite de manera geométrica.

Sugerencia pre-solución. Haz una figura con la que puedas relacionar el límite que buscamos con cierta área que puedas expresar en términos de una integral.

Solución. Consideremos la gráfica de la función $f(x)=\frac{1}{x}$ en el intervalo $[n,2n]$ y el área debajo de esta gráfica, que mostramos en verde a continuación.

Integral de 1/x en el intervalo de n a 2n.
Gráfica de $1/x$ en el intervalo $[n,2n]$

Notemos que la suma que aparece en el problemas corresponde a sumar las áreas de los rectángulos de base $1$ y alturas $\frac{1}{n}$, $\frac{1}{n+1}$, $\ldots$, $\frac{1}{2n-1}$, que podemos encontrar en azul en la siguiente figura.

Cota con suma superior
Dar una cota inferior para nuestra expresión.

Así, obtenemos que podemos acotar inferiormente nuestra suma de la siguiente manera:

\begin{align*}
\frac{1}{n}+\ldots+\frac{1}{2n-1} &> \int_n^{2n} \frac{1}{x}\, dx\\
&= (\log x) \Big|_n^{2n} \\
&= \log 2.
\end{align*}

De manera similar, podemos pensar ahora en rectángulos que queden por debajo de la gráfica de la función, y que en total su area es menor que el valor de la integral. Los mostramos a continuación en color rojo:

Cota con suma inferior
Dar una cota superior para nuestra expresión (un poco cambiada)

De aquí, podemos dar la siguiente cota:

\begin{align*}
\frac{1}{n+1}+\ldots+\frac{1}{2n} &< \int_n^{2n} \frac{1}{x}\, dx\\
&= (\log x) \Big|_n^{2n} \\
&= \log 2.
\end{align*}

Si juntamos ambas desigualdades, deducimos que $$\log 2< \frac{1}{n}+\ldots+\frac{1}{2n-1}<\left(\frac{1}{n}-\frac{1}{2n}\right) + \log 2.$$

Ahora sí podemos hacer $n\to \infty$. Como ambos lados de la desigualdad convergen a $\log 2$, tenemos que la sucesión que nos interesa también debe converger a $\log 2$.

$\square$

Traducir a una integral y usar técnicas de integración

Hay varias técnicas que podemos usar para realizar integrales: cambio de variable, integración trigonométrica, integración por partes, integración por fracciones parciales, etc. En algunas ocasiones podemos transformar un problema a una integral, aplicar una de estas técnicas, y luego regresar al contexto original. Veamos un ejemplo de esto.

Problema. Demuestra que para cualquier par de enteros positivos $m$ y $n$ tenemos que $$\sum_{k=0}^n (-1)^k \binom{n}{k}\frac{1}{k+m+1} = \sum_{k=0}^m (-1)^k \binom{m}{k} \frac{1}{k+n+1}.$$

Sugerencia pre-solución. Intenta formular un problema equivalente aprovechando que para cualquier entero no negativo $r$ se tiene que $\frac{1}{r+1}=\int_0^1 t^r \, dt$. Tendrás que usar esto varias veces, usar la fórmula de binomio de Newton y después aprovechar una simetría para hacer un cambio de variable.

Solución. Notemos que $$\frac{1}{k+m+1}=\int_0^1 t^{k+m} \, dt.$$ Substituyendo en la expresión de la izquierda, obtenemos que la suma buscada es $$\sum_{k=0}^n(-1)^k\binom{n}{k}\int_0^1t^{k+m}\, dt.$$ Usando la linealidad de la integral y la fórmula del binomio de Newton tenemos que esta suma es igual a
\begin{align*}
&\int_0^1 \sum_{k=1}^n (-1)^k \binom{n}{k} t^{k+m}\, dt \\
=& \int_0^1 t^m(1-t)^n \, dt.
\end{align*}

Con el cambio de variable $s=1-t$, la integral anterior es igual a $$\int_0^1 s^n(1-s)^m.$$ Pero por un argumento inverso al que hicimos para llegar a la primer integral, esta segunda integral es igual a $$\sum_{k=0}^m (-1)^k\binom{m}{k}\frac{1}{k+n+1}.$$

Esto es justo el lado derecho en la identidad que queríamos.

$\square$

El teorema de Lebesgue

No todas las funciones son integrables con la definición de Riemann (que aquí simplemente llamaremos «ser integrable»), pues puede ser que el límite de las sumas superiores no sea igual al de las sumas inferiores. Un resultado profundo en cálculo es el criterio de Lebesgue, que caracteriza aquellas funciones acotadas que tienen integral de Riemann en un intervalo.

Teorema (criterio de Lebesgue). Una función acotada $f:[a,b]\to \mathbb{R}$ es integrable si y sólo si su conjunto de discontinuidades tiene medida $0$.

El teorema de Lebesgue da una prueba sencilla de que si $f$ y $g$ son integrables, entonces su producto también, lo cual no es fácil de probar a partir de la definición. A continuación esbozamos esta prueba.

Las discontinuidades de $f^2$ están contenidas en las de $f$, de modo que si $f$ es integrable, por el teorema de Lebesgue $f^2$ también. Además, suma y resta de integrables es sencillo ver que es integrable, de modo que $(f+g)^2$ también lo es. Para concluir, notamos que $$fg=\frac{(f+g)^2-f^2-g^2}{2},$$ de modo que $fg$ es integrable.

Veamos un problema que combina varias de las ideas de cálculo que hemos visto.

Problema. Si $f:[a,b]\to \mathbb{R}$ es una función tal que $f+\sin(f)$ es integrable, entonces $f$ también es integrable.

Sugerencia pre-solución. Usa el criterio de Lebesgue. Necesitarás estudiar las discontinuidades con cuidado, para lo cual es útil recordar cómo interactúan las funciones continuas con las sucesiones convergentes.

Solución. Como $f+\sin(f)$ es integrable, entonces es acotada. Así, $f$ también lo es. La función $g(x)=x+\sin(x)$ tiene derivada $1+\cos(x)\geq 0$ y que es $0$ sólo en un conjunto discreto de puntos, de modo que es estrictamente creciente. Además, los límites en $-\infty$ y $\infty$ son $-\infty$ e $\infty$ respectivamente. Por el teorema del valor intermedio, pasa por todos los reales. Así, $g$ es una función biyectiva.

Mostraremos que las discontinuidades de $f$ están contenidas en las de $f+\sin(f)$, o bien, dicho de otra forma, que si $f+\sin(f)$ es continua en $x$, entonces $f$ también. Tomemos una sucesión $\{x_n\}$ que converge a $x$. Como $f+\sin(f)$ es continua en $x$, tenemos que $\{f(x_n)+\sin(f(x_n))\}$ converge a $f(x)+\sin(f(x))=g(f(x))$.

Como $f$ es una función acotada, la sucesión $\{f(x_n)\}$ es acotada, y para ver que converge a un límite, basta ver que toda subsucesión convergente converge al mismo límite. Tomemos una subsucesión convergente digamos, al límite $L$. Tendríamos que $g(L)=g(f(x))$, y como $g$ es biyectiva tendríamos que $L=f(x)$. En otras palabras, toda subsucesión convergente de $\{f(x_n)\}$ converge a $f(x)$. De esta forma, $\{f(x_n)\}$ converge a $f(x)$. Con esto concluimos que $f$ es continua en $x$.

Concluimos que el conjunto de discontinuidades de $f$ está contenido en el de $f+\sin(f)$, el cual tiene medida $0$. De este modo, el de $f$ también tiene medida $0$ y por el criterio de Lebesgue, es integrable.

$\square$

Más problemas

Hay más ejemplos de problemas relacionados con la integral en la Sección 6.8 del libro Problem Solving through Problems de Loren Larson.

Álgebra Superior II: Norma y distancia en los complejos

Por Leonardo Ignacio Martínez Sandoval

Introducción

Ya definimos a $\mathbb{C}$ y sus operaciones. También definimos y dimos las propiedades de la conjugación compleja. Ahora hablaremos de la norma en los números complejos.

Definición. Dado el número complejo $w=a+bi$, su norma es $\sqrt{a^2+b^2}$. Denotamos a la norma de $w$ por $\Vert w \Vert$.

Ejemplo. La norma del complejo $\frac{1}{\sqrt{2}}+\frac{1}{\sqrt{2}}i$ es $$\sqrt{\left(\frac{1}{\sqrt 2}\right)^2+ \left(\frac{1}{\sqrt 2}\right)^2}=\sqrt{\left(\frac{1}{2}+\frac{1}{2}\right)}=\sqrt{1}=1.$$ La norma del complejo $-3i$ es $$\sqrt{0^2+(-3)^2}=\sqrt{9}=3.$$

$\triangle$

Cuando pensamos a los números complejos como elementos del plano, identificando al complejo $a+bi$ con el punto $(a,b)$, la norma es una forma de medir qué tan alejado está del origen.

A partir de la noción de norma podemos definir la noción de distancia, que dice qué tan lejos están dos complejos entre sí.

Definición. Para dos números complejos $w$ y $z$ definimos la distancia entre $w$ y $z$ como la norma de $w-z$, es decir, $\Vert w-z\Vert$. La denotamos por $d(w, z)$

Propiedades básicas de la norma en los complejos

La norma en los complejos está relacionada con otras operaciones definidas como sigue:

Teorema 1. Sean $w$ y $z$ números complejos. Entonces:

  1. La norma es la raíz del producto de un complejo por su conjugado, es decir, $\Vert z \Vert = \sqrt{z\overline{z}}.$
  2. $\Vert z \Vert$ es un número real no negativo.
  3. $\Vert z \Vert = 0$ si y sólo si $z=0$.
  4. La norma es multiplicativa, es decir, $\Vert zw \Vert = \Vert z \Vert \Vert w \Vert$.

Demostración. Si $z=a+ib$, entonces $\overline{z}=a-ib$, y por lo tanto

\begin{align*}
\sqrt{z\overline{z}}&=\sqrt{a^2-(ib)^2}\\
&=\sqrt{a^2+b^2}\\
&=\Vert z \Vert.
\end{align*}

La norma de $z=a+ib$ es la suma del cuadrado de dos reales. Cada uno de ellos es no negativo, así que esa suma es no negativa. De este modo, al sacar raíz cuadrada obtenemos un número real y no negativo. Para que este número sea cero, necesitamos que $a^2=b^2=0$, es decir, que $a=b=0$, lo cual sucede justo cuando $z=0$.

Para mostrar la última propiedad, se pueden tomar dos números complejos explícitos y hacer las cuentas. Sin embargo, también podemos probarla usando la primer propiedad y la conmutatividad del producto, de números complejos, como sigue:

$$\Vert zw \Vert ^2= zw\overline{zw} = z\overline{z} w\overline{w}= \Vert z \Vert^2 \Vert w \Vert ^2.$$

Sacando raíz cuadrada de ambos lados obtenemos el resultado deseado.

$\square$

Ejercicios que usan las propiedades básicas

Veamos algunas formas en las que podemos usar las propiedades anteriores, de la norma, en los complejos.

Ejercicio 1. Muestra que $z$ y $\overline{z}$ tienen la misma norma.

Solución. Usando que $\overline{\overline{z}}=z$, la propiedad 1 del Teorema 1 y la conmutatividad del producto en $\mathbb{C}$ tenemos que $$\Vert \overline{z}\Vert = \sqrt{\overline{z}z}=\sqrt{z\overline{z}} = \Vert z \Vert.$$

$\triangle$

El siguiente es un corolario de la propiedad 4 del Teorema 1, que se puede mostrar usando inducción. La prueba de este corolario se deja como tarea moral.

Corolario. Para $z$ un complejo y $n$ un natural, se tiene que $$\Vert z^n \Vert = \Vert z \Vert ^n.$$

Ejercicio 2. Determina la norma del complejo $$\left(3+4i\right)^{20}.$$

Solución. Tomemos $u=3+4i$. El problema nos pide determinar $\Vert u^{20} \Vert$. Una forma de hacerlo es realizar primero la operación $u^{20}$, pero esto parece ser complicado. En vez de eso, usamos el Corolario anterior. Para ello, notamos que $$\Vert u \Vert = \sqrt{3^2+4^2}= \sqrt{25}=5.$$

De este forma, por el corolario, la norma que buscamos es $$\Vert u^{20} \Vert = \Vert u \Vert ^{20}= 5^{20}.$$

$\triangle$

Ejercicio 3. Sea $z$ un número complejo. Muestra que los siguientes números complejos tienen la misma norma: $$z, -z, iz, -iz.$$

Solución. Se sigue de la propiedad $4$ del Teorema 1 y de que $$\Vert -1 \Vert = \Vert i \Vert = \Vert -i \Vert = 1.$$

$\square$

Ejercicio 4. Muestra que para un número real, $r$, su norma compleja coincide con su valor absoluto.

Solución. Usando la propiedad 1 del Teorema 1 y que $\overline{r}=r$, tenemos que $$\Vert r \Vert = \sqrt{\overline{r}r}=\sqrt{r^2}=|r|.$$

$\square$

La desigualdad del triángulo

¿Cómo se comporta la norma con la suma de los complejos? Lo responderemos en esta sección. Pero antes, de pasar al teorema 2 que contiene la respuesta, veamos un pequeño resultado auxiliar.

Lema. Si $z$ es un número complejo, entonces $|\text{Re}(z)| \leq \Vert z \Vert$ y $|\text{Im}(z)|\leq \Vert z \Vert$. La primer igualdad se da si y sólo si $z$ es un número real y la segunda si y sólo si $z$ es un número imaginario puro, es decir, si su parte real es $0$.

Demostración. Tomemos $z=a+ib$. Tenemos que $a^2\leq a^2+b^2$, de modo que sacando raíces cuadradas tenemos que $$|\text{Re}(z)| = |a| = \sqrt{a^2}\leq \sqrt{a^2+b^2}=\Vert z \Vert.$$ La igualdad se da si y sólo si $b=0$, lo cual sucede si y sólo si $z$ es real.

$\square$

La demostración de la segunda parte es análoga, y queda como tarea moral.

Teorema 2 (desigualdad del triángulo). Para dos números complejos $w$ y $z$ se tiene que $$\Vert w+z \Vert \leq \Vert w \Vert + \Vert z \Vert.$$ La igualdad se da si y sólo si $w$ es un múltiplo real de $z$, es decir, si y sólo si existe un real $r$ tal que $w=rz$.

Demostración. Tenemos que:
\begin{align*}
\Vert w+z \Vert^2 &= (w+z)\overline{(w+z)}\\
&=(w\overline{w}+w\overline{z}+\overline{w}z+z\overline{z})\\
&=\Vert w \Vert^2 + 2\text{Re}(w\overline{z}) + \Vert z \Vert^2.
\end{align*}

Podemos continuar usando la desigualdad del Lema anterior (notemos que se obtiene la igualdad si y sólo si $w\overline{z}$ es real)

\begin{align*}
&\leq \Vert w \Vert^2 + 2\Vert w\overline{z}\Vert + \Vert z \Vert^2\\
&=\Vert w \Vert ^2 + 2 \Vert w \Vert \Vert z \Vert + \vert z \Vert^2\\
&=\left(\Vert w \Vert + \Vert z \Vert \right)^2.
\end{align*}

Esta cadena de desigualdades se resume a $$ \Vert w+z \Vert^2 \leq \left(\Vert w \Vert + \Vert z \Vert \right)^2, $$ de donde sacando raíz cuadrada en ambos lados, obtenemos lo deseado.

Como observamos durante la demostración, la igualdad se da si y sólo si $w\overline{z}$ es un número real, es decir, si y sólo si existe un real $s$ tal que $w\overline{z}=s$. Multiplicando por $z$ de ambos lados, obtenemos que $$w\Vert z \Vert^2 = sz.$$ Si $z=0$, entonces $w=0$ y por lo tanto $w$ es trivialmente un múltiplo real de $z$. Si $z\neq 0$, entonces $w=\frac{s}{\Vert z \Vert ^2}\cdot z$ también es un múltiplo real de $z$, con $r=\frac{s}{\Vert z \Vert ^2}$. Esto termina el análisis, de los casos, de la igualdad.

$\square$

Propiedades de la distancia

En la introducción definimos la distancia entre dos números complejos $w$ y $z$ como la norma de $w-z$, en símbolos, $d(w,z)=\Vert w-z \Vert$. Para formalizar ideas veamos la siguiente definición.

Definición. Sea $X$ un conjunto y $e: X\times X\rightarrow \mathbb{R}^{+}\cup \lbrace 0\rbrace$ una función, $e$ es una métrica en $X$ si, para todo $x$, $y$ y $z\in X$, satisface que:

  1. $e(x, y)\geq 0$.
  2. $e(x, y)=0$ si, y sólo si, $x=y$.
  3. $e(x, y)=e(y, x)$.
  4. $e(x, y)\leq e(x, z) + e(y, z)$.

Observa que a partir de los teoremas 1 y 2, la distancia $d$ cumple las propiedades de esta definición, por lo que decimos que $d$ es una métrica en $\mathbb{C}$. Así tenemos el siguiente teorema.

Teorema 3. Sean $w$ y $z$ dos números complejos cualesquiera y $d(w, z)=\vert\vert w- z\vert\vert$. Entonces $d$ es una métrica en $\mathbb{C}$.

Demostrar este teorema es sencillo a partir de lo que ya vimos, así que su demostración queda como tarea moral.

Más adelante…

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Muestra la propiedad 4 del Teorema 1 usando de manera explícita las partes reales e imaginarias de los complejos $z$ y $w$.
  2. Demuestra el corolario de normas de potencias de complejos.
  3. Determina la norma del complejo $(12-5i)^{10}$.
  4. Determina la norma del complejo $(1+2i)(-3+4i)(5-6i)(-7-8i)$.
  5. Demuestra la segunda parte del Lema.
  6. Demuestra el Teorema 3.
  7. Sean $w=(3+4i)(5-i)$ y $z=(5-i)(4+2i)$. Determina $d(w,z)$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal I: Ortogonalidad y transformación transpuesta

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores ya estudiamos la noción de espacio dual y la de ortogonalidad. También vimos cómo a partir de la ortogonalidad podemos definir subespacios como intersección de hiperplanos. Como veremos a continuación, la ortogonalidad también nos permite definir qué quiere decir que consideremos la «transformación transpuesta» de una transformación lineal.

Antes de comenzar, vale la pena recordar también que cada transformación lineal entre espacios de dimensión finita puede ser expresada mediante una matriz que depende de la elección de bases de los espacios vectoriales. Como tal vez te imaginarás, la transformación transpuesta tendrá como matriz a la matriz transpuesta de la transformación original.

Esta intuición nos dice que hay que tener cuidado. Supongamos que estamos trabajando sobre un campo $F$. Si tenemos espacios vectoriales $V$ de dimensión $n$, $W$ de dimensión $m$ y una tranformación lineal $T:V\to W$, recordemos que, tras elegir bases, $T$ está representada por una matriz $A$ en $M_{m,n}(F)$, es decir, con $m$ filas y $n$ columnas.

Pero la matriz transpuesta $^t A$ es de $n$ filas y $m$ columnas, así que típicamente no representará a una transformación de $V$ a $W$, pues las dimensiones no necesariamente coinciden. Podríamos intentar construir una transformación de $W$ a $V$ para que las dimensiones coincidan, pero resulta que esto no es «tan natural», por razones en las que no profundizaremos.

Lo que sí resulta muy natural y fácil de definir es una transformación de $W^\ast$ a $V^\ast$, lo cual tendrá sentido pues ya probamos que $\dim W^\ast = \dim W$ y $\dim V^\ast = \dim V$, así que será representada por una matriz en $M_{n,m}$. Es un poco más difícil conceptualmente, pero las consecuencias matemáticas son más bonitas y útiles. Sin decir más, comenzamos con la teoría.

Definición y ejemplo de transformación transpuesta

Para definir «transformación transpuesta», le hacemos como sigue.

Definición. Sean $V$ y $W$ espacios vectoriales sobre un campo $F$ y sea $T:V\to W$ una transformación lineal. Definimos la transformación transpuesta de $T$, como la transformación $^tT:W^\ast \to V^\ast$ tal que a cada forma lineal $l$ en $W^\ast$ la manda a la forma lineal $^tT(l)$ en $V^\ast$ para la cual $$(^tT(l))(v)=l(T(v)).$$

Otra forma de escribir a la definición es mediante la notación de emparejamiento canónico: $$\langle ^tT(l),v\rangle=\langle l, T(v)\rangle.$$

Veamos un ejemplo para entender mejor la definición.

Ejemplo. Considera a $V=M_{2}(\mathbb{R})$ y $W=\mathbb{R}^2$. Considera la transformación lineal $T:V\to W$ dada por $$T\begin{pmatrix} a& b\\ c&d\end{pmatrix}=(a+b,c+d).$$

La transformación $^t T$ va a mandar a una forma lineal $l$ de $W$ a una forma lineal $^tT(l)$ de $V$. Las formas lineales $l$ en $W$ se ven de la siguiente forma $$l(x,y)=rx+sy.$$ La forma lineal $^tT(l)$ en $V$ debe satisfacer que $^tT(l)=l\circ T$. En otras palabras, para cualquier matriz $\begin{pmatrix} a& b\\ c&d\end{pmatrix}$ se debe tener
\begin{align*}
(^t T(l)) \begin{pmatrix} a& b\\ c&d\end{pmatrix} &= l(a+b,c+d)\\
&=r(a+b)+s(c+d)\\
&=ra+rb+sc+sd.
\end{align*}

Si tomamos la base canónica $E_{11}$, $E_{12}$, $E_{21}$, $E_{22}$ de $V$ y la base canónica $e_1,e_2$ de $W$, observa que la transformación $T$ tiene como matriz asociada a la matriz $$\begin{pmatrix} 1 & 1 & 0 & 0\\ 0 & 0 & 1 & 1\end{pmatrix}$$ (recuerda que se obtiene poniendo como columnas a los vectores coordenada de las imágenes de la base).

Por otro lado, los vectores de la base dual $e_1^\ast$ y $e_2^\ast$ «leen las coordenadas», de modo que $e_1^\ast(x,y)=x$ y $e_2^\ast(x,y)=y$. Por lo que vimos arriba, $(^t T)(e_1)$ es entonces la forma lineal $a+b$ y $(^t T)(e_2)$ es la forma lineal $c+d$. En términos de la base dual en $V^\ast$, estos son $E_{11}^\ast + E_{12}^\ast$ y $E_{21}^\ast+ E_{22}^\ast$ respectivamente. De esta forma, la transformación $^t T$ tiene matriz asociada $$\begin{pmatrix}1&0\\1&0\\0&1\\0&1\end{pmatrix}.$$

$\triangle$

Nota que en el ejemplo la transformación transpuesta tiene como matriz a la matriz transpuesta de la transformación original. Esto es algo que queremos que pase siempre, y más abajo lo demostramos.

Propiedades básicas de transformación transpuesta

Observa que la definición no necesita que $V$ y $W$ sean de dimensión finita. A continuación enunciamos y probamos algunos resultados que se valen también en el contexto de dimensión infinita.

Teorema 1. Tomemos $V$,$W$,$Z$ espacios vectoriales sobre un campo $F$ y $c$ en $F$. Sean $T_1,T_2: V \to W$ transformaciones lineales. Sea $T_3:W\to Z$ una transformación lineal. Se cumple todo lo siguiente:

  1. $^tT_1$ es una transformación lineal.
  2. $^t(T_1+cT_2)= {^tT_1} + c^tT_2$.
  3. $^t(T_3\circ T_1) = {^t T_1} \circ ^t T_3$.
  4. Si $V=W$ y $T_1$ es invertible, entonces $^t T_1$ también lo es y $(^t T_1)^{-1}= {^t (T_1^{-1})}$.

Para tener un poco más de intuición, observa cómo estas propiedades son análogas a las de transposición para matrices.

Demostración. Las partes 1 y 2 se demuestran usando cuidadosamente las definiciones. Haremos la demostración de $1$ y la demostración de $2$ queda como tarea moral. Para probar $1$, necesitamos probar que $^tT_1:W^\ast \to V^\ast$ es lineal, así que tomemos $l_1$, $l_2$ en $W^\ast$ y $a$ un escalar en $F$. Tenemos que demostrar que $$ ^tT_1(l_1+a l_2)= {^tT_1(l_1)}+ a ^tT_1(l_2).$$

Ésta es una igualdad de formas lineales en $V^\ast$, y para mostrar su validez tenemos que mostrar que se vale en cada $v\in V$. Por un lado,
\begin{align*}
^tT_1(l_1+a l_2)(v) &= (l_1+a l_2)(T_1(v))\\
&=l_1(T_1(v))+a l_2(T_1(v)).
\end{align*}

Por otro lado,
\begin{align*}
(^tT_1(l_1)+ a ^tT_1(l_2))(v)&= {^tT_1(l_1)(v)}+ a ^tT_1(l_2)(v)\\
&= l_1(T_1(v)) + a l_2(T_1(v)).
\end{align*}

En ambos casos obtenemos el mismo resultado, así que $^tT_1(l_1+a l_2)$ y $^tT_1(l_1)+ a ^tT_1(l_2)$ son iguales, mostrando que $^t T_1$ es lineal.

Pasemos a la parte 3. La igualdad $^t(T_3\circ T_1) = {^t T_1} \circ ^t T_3$ es una igualdad de transformaciones de $Z^\ast$ a $V^\ast$. Para verificar su veracidad, hay que ver que son iguales en cada elemento en su dominio. Tomemos entonces una forma lineal $l$ en $Z^\ast$. Queremos verificar la veracidad de $$ ^t(T_3\circ T_1)(l) = (^t T_1 \circ ^t T_3)(l),$$ que es una igualdad de formas lineales en $V^\ast$, de modo que tenemos que verificarla para cada $v$ en $V$. Por un lado,

\begin{align*}
^t(T_3\circ T_1)(l)(v)&=l((T_3\circ T_1)(v))\\&=l(T_3(T_1(v))),
\end{align*}

Por otro,
\begin{align*}
(^t T_1 \circ ^t T_3)(l)(v)&=(^tT_1(^t T_3 (l)))(v)\\&=(^t T_3 (l))(T_1(v))\\&=l(T_3(T_1(v))).
\end{align*}

En ambos casos obtenemos el mismo resultado.

Para la parte 4 basta notar que si $V=W$ y $T_1$ es invertible, entonces tiene una inversa $S:V\to V$, y por la parte $3$ tenemos que $$^t S\circ ^t T_1 = {^t(T_1\circ S)} = {^t \text{Id}_V} = \text{Id}_{V^\ast},$$

mostrando que $^t T_1$ tiene inversa $^tS$. Observa que estamos usando que la transpuesta de la transformación identidad es la identidad. Esto no lo hemos probado, pero lo puedes verificar como tarea moral.

$\square$

La matriz transpuesta es la matriz de la transformación transpuesta

Cuando estamos trabajando en espacios de dimensión finita, podemos mostrar que la matriz que le toca a la transformación transpuesta es precisamente la transpuesta de la matriz que le toca a la transformación original. Hacemos esto más preciso en el siguiente resultado.

Teorema 2. Sea $T:V\to W$ una transformación lineal entre espacios de dimensión finita y $B$ y $B’$ bases de $V$ y $W$ respectivamente. Si $A$ es la matriz de $T$ con respecto a $B$ y $B’$, entonces $^t A$ es la matriz de la transformación $^t T:W^\ast \to V^\ast$ con respecto a las bases duales $B’^\ast$ y $B^\ast$.

Demostración. Necesitamos definir algo de notación. Llamemos $n=\dim V$, $m=\dim W$, $B=\{b_1,\ldots, b_n\}$, $B’=\{c_1,\ldots, c_m\}$ y $A=[a_{ij}]$. Recordemos que la matriz $A$ está hecha por las coordenadas de las imágenes de la base $B$ en términos de la base $B’$, es decir, que por definición tenemos que para toda $j=1,\ldots, n$: \begin{equation}T(b_j)=\sum_{i=1}^{m} a_{ij} c_i.\end{equation}

La transformación $^t T:W^\ast \to V^\ast$ va de un espacio de dimensión $m$ a uno de dimensión $n$, así que en las bases $B’^\ast$ y $B^\ast$ se puede expresar como una matriz de $n$ filas y $m$ columnas. Afirmamos que ésta es la matriz $^t A$. Para ello, basta mostrar que las coordenadas de las imágenes de la base $B’^\ast$ en términos de la base $B^\ast$ están en las filas de $A$, es decir, que para todo $i=1, \ldots, m$ tenemos que $$^tT(c^\ast_i)=\sum_{j=1}^{n} a_{ij} b_j^\ast.$$

La anterior es una igualdad de formas lineales en $V^\ast$, de modo que para ser cierta tiene que ser cierta evaluada en todo $v$ en $V$. Pero por linealidad, basta que sea cierta para todo $b_j$ en la base $B$. Por un lado, usando (1),

\begin{align*}
^tT(c^\ast_i)(b_j)&=c^\ast_i(T(b_j))\\
&=c^\ast_i \left(\sum_{k=1}^{m} a_{kj} c_i\right)\\
&=\sum_{k=1}^{m} a_{kj} c^\ast_i(c_k)\\
&=a_{ij},
\end{align*}

en donde estamos usando que por definición de base dual $c_i^\ast (c_i)= 1$ y $c_j^\ast (c_i)=0$ si $i\neq j$. Por otro lado,

\begin{align*}
\left(\sum_{k=1}^{n} a_{ik} b_k^\ast\right)(b_j)&= \sum_{k=1}^{n} a_{ik} b_k^\ast(b_j)\\
&=a_{ij},
\end{align*}

en donde estamos usando linealidad y la definición de base dual para $B$.

Con esto concluimos la igualdad $$^tT(c^\ast_i)=\sum_{j=1}^{n} a_{ij} b_j^\ast,$$ que muestra que podemos leer las coordenadas de las evaluaciones de $^t T$ en $B’^\ast$ en términos de la base $B^\ast$ en las filas de $A$, por lo tanto podemos leerlas en las columnas de $^t A$. Esto muestra que $^t A$ es la matriz correspondiente a esta transformación en términos de las bases duales.

$\square$

Kernel e imagen de la transformación transpuesta

Finalmente, el siguiente resultado nos habla acerca de cómo están relacionadas las transformaciones transpuestas y la ortogonalidad.

Teorema 3. Sea $T:V\to W$ una transformación lineal entre espacios vectoriales de dimensión finita. Entonces

$$\ker (^t T) = (\Ima (T))^\bot,\quad \ker (T)=(\Ima (^t T))^\bot$$

y

$$\Ima (^t T) = (\ker(T))^\bot\,\quad \Ima (T)=(\ker(^t T))^\bot.$$

Demostración. Demostraremos la igualdad $\ker (^t T) = (\Ima (T))^\bot$. Notemos que $l \in \ker(^t T)$ si y sólo si $(^t T)(l)=0$, lo cual sucede si y sólo si $l\circ T = 0$. Pero esto último sucede si y sólo si para todo $v$ en $V$ se tiene que $l(T(v))=0$, que en otras palabras quiere decir que $l(w)=0$ para todo $w$ en $\Ima (T)$. En resumen, $l\in \ker(^t T)$ pasa si y sólo si $l$ se anula en todo $\Ima (T)$ es decir, si y sólo si está en $(\Ima (T))^\bot$.

El resto de las igualdades se demuestran de manera análoga, o alternativamente, usando la bidualidad canónica. Es un buen ejercicio hacerlo y se deja como tarea moral.

$\square$

Más adelante…

En esta entrada enunciamos un resultado muy importante: dada una transformación lineal $T$, su transformación transpuesta tiene como matriz asociada la matriz transpuesta de la matriz asociada de $T$. Este resultado nos permitirá calcular fácilmente la transpuesta de una transformación, como veremos en la entrada de problemas de este tema.

En la siguiente entrada del blog hablaremos por primera vez de formas bilineales: vamos a ver cómo nuestra discusión de transformaciones lineales facilitará mucho abordar este tema.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Muestra que la transpuesta de la transformación lineal $T:\mathbb{R}^2\to \mathbb{R}^2$ dada por $T(x,y)=T(7x+8y,6x+7y)$ es invertible. Encuentra a su transpuesta y a la inversa de la transpuesta explícitamente.
  • Muestra la parte $2$ del Teorema 1.
  • Muestra que la transpuesta de la transformación identidad es la identidad.
  • Demuestra el resto de las igualdades del Teorema 3.
  • Encuentra la transpuesta de la transformación traza que va de $M_n(\mathbb{R})$ a los reales. Recuerda que esta transformación manda a una matriz $A=[a_{ij}]$ a la suma de sus entradas en la diagonal principal, es decir $$A\mapsto a_{11}+a_{22}+\ldots+a_{nn}.$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Superior II: La conjugación compleja

Por Leonardo Ignacio Martínez Sandoval

Introducción

En una entrada anterior definimos el conjunto $\mathbb{C}$ de los números complejos. Vimos que sus elementos tienen la forma $a+bi$, donde $a$ y $b$ son números reales. Definimos las operaciones de suma y producto, y vimos que, con estas operaciones, $\mathbb{C}$ es un campo. En esta entrada hablaremos acerca de la conjugación compleja.

Definición. Sea $z=a+bi$ un número complejo. El conjugado de $z$ es el número complejo $a-bi$ que denotaremos como $\overline{z}$.

Ejemplo. Sea $z=5+8i$, entonces $\overline{z}=5-8i$. Si $z=\sqrt{3}-8\pi i $, entonces $\overline{z}=\sqrt{3}+8\pi i$.

En la entrada anterior justificamos que podíamos abandonar la notación de parejas, sin embargo en ocasiones seguirá siendo útil pensar al complejo $a+bi$ como el punto $(a,b)$ del plano. Si lo pensamos así, la conjugación compleja manda al punto $(a,b)$ en el punto $(a,-b)$, es decir, se comporta como una reflexión en el eje $x$.

La conjugación compleja se comporta como una reflexión en el eje x
La conjugación compleja se comporta como una reflexión en el eje $x$

Conjugación y operaciones complejas

La conjugación compleja «se comporta bien» con las operaciones definidas en $\mathbb{C}$. Este es el contenido de la siguiente proposición.

Proposición 1. Si $w$ y $z$ son números complejos, entonces:

  • El conjugado de la suma es la suma de los conjugados, es decir, $\overline{w+z}=\overline{w}+\overline{z}$.
  • El conjugado del producto es el producto de los conjugados, es decir, $\overline{wz}=\overline{w}\overline{z}$.

Demostración. Si escribimos a $w=a+bi$ y $z=c+di$ con $a,b,c,d$ números reales. Tenemos que
\begin{align*}
\overline{w+z}&=\overline{(a+c)+(b+d)i}\\
&=(a+c)-(b+d)i\\
&=(a-bi)+(c-di)\\
&=\overline{w}+\overline{z},
\end{align*} lo cual prueba la primera parte de la proposición. Por otro lado
\begin{align*}
\overline{wz}&=\overline{(ac-bd)+(ad+bc)i}\\
&=(ac-bd)-(ad+bc)i\\
&=(ac-(-b)(-d))+(a(-d)+b(-c))i\\
&=(a-bi)(c-di)\\
&=\overline{w}\overline{z},
\end{align*} lo cual prueba la segunda parte.

$\square$

Se pueden mostrar resultados análogos para la conjugación compleja de la resta y cociente. Esto se deja en la tarea moral.

Ejemplo. Considera los números complejos $5+4i$, $3+2i$ y $1-i$. Vamos a determinar el conjugado de su suma de dos formas distintas. Por un lado, si los sumamos obtenemos el complejo $$(5+3+1)+(4+2-1)i=9+5i,$$ cuyo conjugado es $9-5i$.

Por otro lado, podemos conjugar a cada uno de los números de manera independiente para obtener $5-4i$, $3-2i$ y $1+i$. Al hacer la suma de estos complejos, obtenemos $$(5+3+1)+(-4-2+1)i=9-5i.$$ En ambos casos obtenemos lo mismo.

$\triangle$

La conjugación compleja es autoinversa

Proposición 2. La operación «conjugar» es autoinversa, y por lo tanto es biyectiva.

Demostración. En efecto, si $z=a+bi$, entonces $$\overline{\overline{z}}=\overline{a-bi}=a+bi=z.$$

Para ver que conjugar es suprayectivo, tomemos $z$ en $\mathbb{C}$. Tenemos que $\overline{\overline{z}}=z$, de modo que $z$ está en la imagen de la operación conjugación.

Para ver que conjugar es inyectivo, tomemos $w$ y $z$ en $\mathbb{C}$ tales que $\overline{w}=\overline{z}$. Aplicando conjugación a esta igualdad, y usando la primer parte de la proposición, tenemos que $w=z$.

$\square$

Operaciones de un complejo con su conjugado

Sea $z=a+bi$ un número complejo, a $a$ le llamamos la parte real de $z$ y a $b$ le llamamos la parte imaginaria. Usamos la notación $a=\text{Re}(z)$ y $b=\text{Im}(z)$, respectivamente. Cuidado: la parte imaginaria es un número real. Se llama parte imaginaria porque es la que acompaña a $i$.

Si hacemos operaciones de un complejo con su conjugado, obtenemos valores especiales.

Proposición 3. Sea $z$ un número complejo. Entonces:

  • $z+\overline{z}=2\text{Re}(z)$
  • $z-\overline{z}=2\text{Im}(z) i$
  • $z\overline{z}=\text{Re}(z)^2+\text{Im}(z)^2$

La demostración de la Proposición 3 es sencilla y se deja como tarea moral.

Ejemplo. Si tomamos el número complejo $3+4i$ y le sumamos su conjugado $3-4i$, obtenemos el número real $6$, que es dos veces la parte real de $3+4i$.

Si hacemos la multiplicación $(3+4i)(3-4i)$, obtenemos también un número real: $$3^2-(4i)^2=9-(-16)=25.$$

$\square$

Como corolario de la Proposición 3, obtenemos lo siguiente.

Corolario. Si $z=\overline{z}$, entonces $z$ es un número real.

Demostración. Por la primera parte de la Proposición 3, tenemos que $2z=z+\overline{z}=2\text{Re}(z)$, de modo que $z=\text{Re}(z)$ y por lo tanto $z$ es un número real.

$\square$

Ejercicio. Muestra que el complejo $$\left(\frac{1+\sqrt{5}}{2}+\frac{1-\sqrt{5}}{2} i \right) \left(\frac{1+\sqrt{5}}{2}-\frac{1-\sqrt{5}}{2} i \right)$$ es un número real.

Solución. Podríamos hacer las cuentas y verificar que la parte imaginaria es $0$. Sin embargo, basta con notar que la expresión es el producto de un complejo con su conjugado, es decir, es de la forma $z\overline{z}$. De manera directa, por la última parte de la Proposición 3 obtenemos que es un número real.

$\square$

La conjugación compleja es (casi) el único automorfismo que fija a los reales

En las secciones anteriores vimos que la conjugación compleja deja fijos a los reales y que respeta las operaciones. En esta sección veremos que es la única operación, en $\mathbb{C}$, que hace esto sin ser la identidad.

Teorema. Si $\eta:\mathbb{C}\to \mathbb{C}$ es una función biyectiva. tal que:

  • $\eta$ no es la identidad.
  • $\eta(a)=a$ para todo $a$ real.
  • $\eta(w+z)=\eta(w)+\eta(z)$ para todo par de complejos $w$ y $z$.
  • $\eta(wz)=\eta(w)\eta(z)$ para todo par de complejos $w$ y $z$.

Entonces $\eta$ es la conjugación compleja.

Demostración. Sea $z=a+bi$, tenemos que

\begin{align*}
\eta(a+bi)&=\eta(a)+\eta(bi)\\
&=\eta(a)+\eta(b)\eta(i)\\
&=a+b\eta(i),
\end{align*}

así que basta determinar quién es $\eta(i)$. Por otro lado, como $-1$ es real, tenemos también que
\begin{align*}
-1&=\eta(-1)\\
&=\eta(i\cdot i)\\
&=\eta(i)\eta(i)\\
&=\eta(i)^2,
\end{align*}

de modo que $\eta(i)$ es una raíz de $-1$ y por lo tanto es $i$ o $-i$. Si $\eta(i)=i$, tendríamos que $\eta$ es la identidad, lo cual contradice nuestras hipótesis. Así, $\eta(i)=-i$ y por lo tanto $\eta$ es la conjugación compleja.

$\square$

Más adelante…

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Considera los números complejos $w_j=5+(2-j)i$, en donde $j$ es un entero en $\lbrace 0,1,2,3,4\rbrace$. Encuentra el valor de la suma $w_0+w_1+w_2+w_3+w_4$ y del producto $w_0w_1w_2w_3w_4$.
  2. Toma los números complejos $w$ y $z$. Muestra que $\overline{w-z}=\overline{w}-\overline{z}$ y que si $z\neq 0$, entonces $\overline{w/z}=\overline{w}/ \overline{z}$.
  3. Haz la demostración de la Proposición 3.
  4. ¿Cuáles números complejos satisfacen que $z^2=\overline{z}$?
  5. Sea $z$ un número complejo distinto de $0$. ¿Qué obtienes cuando realizas la división $z/\overline{z}$?

En el blog hay una entrada acerca de aplicaciones de la aritmética de números complejos a la resolución de problemas en matemáticas. No formará parte de la evaluación del curso, pero puede ayudarte a entender más profundamente lo que estamos haciendo y a motivar la teoría que desarrollamos.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Seminario de Resolución de Problemas: El teorema del valor medio

Por Leonardo Ignacio Martínez Sandoval

Introducción

Las funciones continuas son bonitas pues tienen la propiedad del valor intermedio y además alcanzan sus valores extremos. Las funciones diferenciables en un intervalo también tienen un par de teoremas que hablan acerca de algo que sucede «dentro del intervalo». Estos son el teorema de Rolle, del cual platicamos en la entrada anterior, y el teorema del valor medio. Ambos nos permiten encontrar en el intervalo un punto en el que la derivada tiene un valor específico.

Teorema de Rolle. Sean $a<b$ reales y $f:[a,b]\to \mathbb{R}$ una función continua en el intervalo $[a,b]$ y diferenciable en el intervalo $(a,b)$. Supongamos que $f(a)=f(b)$. Entonces existe un punto $c\in (a,b)$ tal que $f'(c)=0$.

Teorema del valor medio. Sean $a<b$ reales y $f:[a,b]\to \mathbb{R}$ una función continua en el intervalo $[a,b]$ y diferenciable en el intervalo $(a,b)$. Entonces existe un punto $c\in (a,b)$ tal que $$f'(c)=\frac{f(b)-f(a)}{b-a}.$$

En la entrada anterior vimos aplicaciones del teorema de Rolle a resolución de problemas matemáticos. En esta entrada hablaremos brevemente de la intuición geométrica del teorema del valor medio, de algunas de sus consecuencias inmediatas y de cómo usar al teorema y sus consecuencias para resolver problemas concretos.

La intuición geométrica del teorema del valor medio

El teorema del valor medio dice que una función diferenciable en $(a,b)$ y continua en $[a,b]$ cumple que hay un punto $c$ tal que el valor de la derivada en $c$ es igual a la pendiente de la recta que une los puntos del plano $(a,f(a))$ y $(b,f(b))$. En la siguiente figura, se marca en azul el punto $c$ en donde la pendiente de la tangente es lo que queremos, es decir, la pendiente entre los puntos rojos.

Intuición geométrica del teorema del valor medio
Intuición geométrica del teorema del valor medio

En varios problemas en los que se usa el teorema del valor medio, o bien en los cuales se pide demostrar enunciados parecidos a lo que dice el teorema del valor medio, es conveniente hacer una figura para entender la intuición geométrica del problema.

Consecuencias del teorema del valor medio

Si $f$ y $g$ son funciones continuas en $[a,b]$ y diferenciables en $(a,b)$ entonces se pueden deducir los siguientes resultados a partir del teorema del valor medio. No profundizamos en las demostraciones, y dejamos su verificación como un ejercicio de práctica.

Proposición. Si $f'(x)=0$ para toda $x$ en $(a,b)$, entonces $f$ es constante.

Proposición. Si $f'(x)=g'(x)$ para toda $x$ en $(a,b)$, entonces existe una constante $c$ tal que $f(x)=g(x)+c$ para toda $x$.

Proposición. Si $f'(x)>0$ para toda $x$ en $(a,b)$, entonces $f$ es una función estrictamente creciente. Si $f'(x)<0$ en $(a,b)$, entonces $f$ es una función estrictamente decreciente.

Cuando $f'(x)\geq 0$ y $f'(x)\leq 0$, tenemos resultados análogos que dicen que es no decreciente y no creciente, respectivamente.

Veamos algunas aplicaciones de los resultados anteriores.

Problema. Sean $f:\mathbb{R}\to \mathbb{R}$ y $g:\mathbb{R}\to \mathbb{R}$ funciones tales que para todo par de reales $x$ y $y$ se cumple que $$|f(x)+g(y)-f(y)-g(x)|\leq (x-y)^2.$$ Demuestra que $f$ y $g$ varían sólo por una constante aditiva.

Sugerencia pre-solución. Identifica cuál de las proposiciones anteriores puedes usar. Hay que tener cuidado con las hipótesis, pues en el enunciado no se habla de la diferenciabilidad de ninguna de las funciones involucradas.

Solución. Podría ser tentador usar la segunda proposición que enunciamos arriba, pero no tenemos hipótesis acerca de la diferenciabilidad de $f$ o de $g$. Sin embargo, vamos a mostrar que sí se puede mostrar que $f-g$ es diferenciable en todo real, y que su derivada es $0$ en todo real. Para ello, definamos $h=f-g$ y notemos que la hipótesis dice que $|h(x)-h(y)|\leq (x-y)^2.$

A partir de aquí, notemos que por la hipótesis, para $x\neq y$, $$\frac{|h(y)-h(x)|}{|y-x|}\leq \frac{(y-x)^2}{|y-x|} = |y-x|,$$ y el límite de esta última expresión conforme $y\to x$ es $0$, de modo que $$\left|\lim_{y\to x} \frac{h(y)-h(x)}{y-x}\right|=\lim_{y\to x} \frac{|h(y)-h(x)|}{|y-x|} = 0.$$ Esto muestra que para cualquier $x$ se tiene que $h$ es diferenciable en $x$ y su derivada es igual $0$ en todo $x$. De este modo, $h$ es una función constante, y por lo tanto existe un $c$ tal que $f(x)=g(x)+c$ para todo $x$.

$\square$

Veamos cómo el teorema del valor medio nos puede ayudar a demostrar desigualdades.

Problema. Sea $f:\mathbb{R}\to \mathbb{R}$ una función dos veces diferenciable tal que $f»(x)\geq 0$ para todo $x$. Demuestra que para todo par de reales $a$ y $b$ con $a<b$ se tiene que $$f\left(\frac{a+b}{2}\right) \leq \frac{f(a)+f(b)}{2}.$$

Sugerencia pre-solución. Haz una figura para convencerte de que el resultado es cierto. En el enunciado del problema, la función está siendo enunciada en tres valores, $a$, $b$ y $\frac{a+b}{2}$. Esto te dará una pista de dónde usar el teorema del valor medio.

Solución. Por el teorema del valor medio, existe un real $r$ en el intervalo $\left(a,\frac{a+b}{2}\right)$ para el cual $$\frac{f\left(\frac{a+b}{2}\right)-f(a)}{\frac{a+b}{2}-a} = f'(r).$$

De manera similar, existe un real $s$ en el intervalo $\left(\frac{a+b}{2},b\right)$ para el cual $$\frac{f(b)-f\left(\frac{a+b}{2}\right)}{b-\frac{a+b}{2}} = f'(s).$$

Como $f»(x)>0$ para todo real $x$, tenemos que $f’$ es una función creciente, y como $r<s$, tenemos entonces que $f'(r)<f'(s)$. De esta forma, $$ \frac{f\left(\frac{a+b}{2}\right)-f(a)}{\frac{a+b}{2}-a}<\frac{f(b)-f\left(\frac{a+b}{2}\right)}{b-\frac{a+b}{2}}.$$ Notemos que el denominador de ambos lados es $\frac{b-a}{2}$. Cancelando los denominadores y reacomodando los términos en esta desigualdad, obtenemos la desigualdad deseada.

$\square$

Problemas resueltos con el teorema del valor medio y otras técnicas

Veamos algunos problemas que combinan el teorema del valor medio con otras técnicas de solución de problemas.

Problema. Sea $f(x)$ una función diferenciable en $(0,1)$ y continua en $[0,1]$ con $f(0)=0$ y $f(1)=1$. Muestra que existen puntos distintos $a,b,c,d$ en el intervalo $[0,1]$ tales que $$\frac{1}{f'(a)}+ \frac{1}{f'(b)} + \frac{1}{f'(c)} + \frac{1}{f'(d)} = 4.$$

Sugerencia pre-solución. Para resolver el problema, hay que combinar el teorema del valor medio con el teorema del valor intermedio. El primer paso del problema es encontrar reales $p<q<r$ tales que $f$ valga en ellos $1/4$, $2/4$ y $3/4$.

Solución. Como $f(0)=0$, $f(1)=1$ y $0<1/4<1$, por el teorema del valor intermedio existe un real $p$ en $(0,1)$ tal que $f(p)=1/4$. De manera similar, existe un real $q$ en $(p,1)$ tal que $f(q)=2/4$ y un real $r$ en $(q,1)$ tal que $f(r)=3/4$.

Aplicando el teorema del valor medio a los intervalos $[0,p]$, $[p,q]$, $[q,r]$ y $[r,1]$ obtenemos reales $a,b,c,d$ respectivamente tales que

\begin{align*}
f'(a)&=\frac{f(p)-f(0)}{p-0}=\frac{1/4}{p}\\
f'(b)&=\frac{f(q)-f(p)}{q-p}=\frac{1/4}{q-p} \\
f'(c)&=\frac{f(r)-f(q)}{r-q}=\frac{1/4}{r-q} \\
f'(d)&=\frac{f(1)-f(r)}{1-r}=\frac{1/4}{1-r}.
\end{align*}

Estos son los valores de $a,b,c,d$ que queremos pues

\begin{align*}
\frac{1}{f'(a)}+ \frac{1}{f'(b)} + \frac{1}{f'(c)} + \frac{1}{f'(d)} &= 4(1-r+r-q+q-p+p)\\
&=4.
\end{align*}

$\square$

Problema. Sean $a$, $b$ y $c$ números distintos. Muestra que la siguiente expresión $$\frac{(x-a)(x-b)}{(c-a)(c-b)}+ \frac{(x-b)(x-c)}{(a-b)(a-c)} + \frac{(x-c)(x-a)}{(b-c)(b-c)}$$ no depende del valor de $x$.

Sugerencia pre-solución. Encuentra la derivada de la expresión. Puedes aprovechar la simetría para hacer menos cuentas.

Solución. Usando la regla del producto, la derivada del primer sumando es
\begin{align*}
\frac{(x-a)+(x-b)}{(c-a)(c-b)}&=\frac{(2x-a-b)(b-a)}{(a-b)(b-c)(c-a)}\\
&=\frac{2x(b-a)+a^2-b^2}{(a-b)(b-c)(c-a)}.
\end{align*}

Por simetría, las derivadas de los otros dos términos tienen el mismo denominador que esta y en el numerador tienen, respectivamente,
\begin{align*}
&2x(c-b)+b^2-c^2\quad \text{y}\\
&2x(a-c)+c^2-a^2,
\end{align*} de modo que al sumar las tres expresiones obtenemos cero. Así, la derivada de la expresión es cero y por lo tanto es constante.

$\square$

Hay otro argumento para resolver el problema anterior, que usa teoría de polinomios. A grandes rasgos, la expresión es un polinomio de grado $2$, que toma tres veces el valor $1$, de modo que debe ser igual al polinomio constante $1$.

Más problemas

Hay más ejemplos de problemas relacionados con el teorema del valor medio en la Sección 6.6 del libro Problem Solving through Problems de Loren Larson.