Archivo de la categoría: Matemáticas

Posts de matemáticas, la ciencia más cercana a las artes.

Seminario de Resolución de Problemas: El teorema del valor extremo

Por Fabian Ferrari

Introducción

En una entrada anterior, acerca de funciones continuas, mencionamos dos teoremas fundamentales que estas funciones satisfacen: el teorema del valor intermedio y el teorema del valor extremo. Ya hablamos acerca del teorema del valor intermedio en una entrada anterior. El objetivo de esta entrada es mencionar aplicaciones del teorema del valor extremo.

Como recordatorio, el teorema del valor extremo o teorema de los valores extremos nos dice que si una función $f(x)$ es continua en un intervalo cerrado $[a, b]$, entonces existen valores $c$ y $d$ en $[a, b]$ tales que $f(c) \leq f(x) \leq f(d)$ para toda $x$ en el intervalo $[a, b]$.

En otras palabras, lo que nos dice el teorema es que si una función es continua en un intervalo cerrado, tenemos que la función debe alcanzar un valor máximo y un valor mínimo dentro del intervalo.

Dos teoremas para funciones derivables

Aprovecharemos para mencionar dos teoremas importantes que se ocuparán más adelante. Las demostraciones de dichos teoremas tienen que ver con la aplicación del teorema del valor extremo, estos teoremas son el teorema de Rolle y el teorema del valor medio (no confundir con el teorema del valor intermedio).

Teorema de Rolle. Sean $a<b$ reales y $f:[a,b]\to\mathbb{R}$ una función continua en el intervalo $[a, b]$ y derivable en $(a, b)$. Se tiene que si $f(a)=f(b)$, entonces existe $c$ en $(a, b)$ tal que $f^\prime(c)=0$.

Sugerencia pre-demostración. Por el teorema del valor extremo, la función debe alcanzar un máximo y un mínimo en el intervalo. Divide en casos de acuerdo a dónde están estos valores, si en los extremos o no.

Demostración: Como $f(x)$ es una función continua en $[a, b]$, por el teorema del valor extremo tenemos que $f(x)$ alcanza un valor máximo y un valor mínimo en el intervalo $[a, b]$. Tenemos entonces los siguientes casos.

  • Caso i: Si el valor máximo y mínimo se encuentran en los extremos del intervalo, tenemos que la función $f(x)$ tiene que ser constante dado que $f(a)=f(b)$. y se tiene que $f^\prime(c)=0$ para todo $c$ en $[a, b]$.
  • Caso ii: Si el valor mínimo o máximo no están en los extremos. Sean $c_1$ y $c_2$ en $(a, b)$, los valores en los que la función alcanza su mínimo y máximo respectivamente. Alguno de estos no está en los extremos. Como $f(x)$ es derivable en $(a, b)$, tenemos que también va a ser derivable en alguno de los puntos $c_1$ y $c_2$, teniendo que $f^\prime(c_1)=0$ o $f^\prime(c_2)=0$, así que basta con tomar $c=c_1$ o $c=c_2$.

$\square$

Teorema del valor medio. Sean $a<b$ reales y $f:[a,b]\to\mathbb{R}$ una función continua en $[a, b]$ y diferenciable en $(a, b)$. Entonces existe un número $c$ en $(a, b)$ tal que

$\frac{f(b)-f(a)}{b-a}=f^\prime(c)$.

Demostración: Consideremos la siguiente función auxiliar:

$g(x)=(f(b)-f(a))x-(b-a)f(x)$

Tenemos que $g(x)$ es continua en $[a, b]$ y además es derivable en $(a,b)$. La derivada de $g(x)$ está dada por

$g^\prime(x)=f(b)-f(a)-(b-a)f^\prime(x)$

Como $g(x)$ es continua en $[a, b]$, tenemos que por el teorema del valor extremo, la función alcanza un máximo y un mínimo en el intervalo $[a, b]$. Haciendo las cuentas, $g(a)=g(b)$, de modo que si el máximo y mínimo ocurren en los extremos, entonces $g$ es constante y toda $c\in (a,b)$ satisface $g'(c)=0$

En otro caso, sea $c\in(a, b)$ el valor en donde $g(x)$ alcanza su mínimo o su máximo. Tenemos que $g^\prime(c)=0$.

Así, como $g^\prime(c)=f(b)-f(a)-(b-a)f^\prime(c)$, tenemos que:

$0=f(b)-f(a)-(b-a)f^\prime(c)$

$(b-a)f^\prime(c)=f(b)-f(a)$

$f^\prime(c)=\frac{f(b)-f(a)}{b-a}$

$\square$

Alternativamente, en la función anterior pudimos haber aplicado el teorema de Rolle directamente a la función $g$. En las siguientes entradas veremos aplicaciones de estos resultados a problemas concretos.

Aplicación del teorema del valor extremo a un problema

Problema. Se tiene un circulo de radio $r$, y una tangente $L$ que pasa por un punto $P$ de la circunferencia. De un punto cualquiera $R$ en la circunferencia se traza una paralela a $L$ que corta a la circunferencia en $Q$. Determina el área máxima que puede tener el triángulo $PQR$.

Sugerencia pre-solución. Antes que nada, haz una figura. Usa el teorema del valor extremo para asegurar la existencia del valor máximo. Para ello, necesitarás construir una función continua cuyo valor sea el área buscada. Puedes usar argumentos de simetría para conjeturar cuándo se alcanza el valor máximo.

Solución. Hacemos el siguiente diagrama para entender mejor el problema.

Diagrama del enunciado del problema

Fijémonos que las condiciones de la altura y la base del triángulo $PQR$ se pueden describir mediante la siguiente figura:

Condiciones para la altura y base del triángulo

Notemos que la altura del triángulo está dada por $r+h$, donde $h$ puede variar entre $-r$ y $r$. Este dibujo también nos es de ayuda para determinar el valor de la base. Por el teorema de Pitágoras y sabiendo que la distancia del centro $C$ a los puntos $R$ y $Q$ es igual a $r$, tenemos que la base del triángulo es igual a $2\sqrt{r^2-h^2}$.

Así, el área del triángulo está dada por $(\sqrt{r^2-h^2})(r+h)$, pero como $h$ varía, nos conviene ver el área en función de $h$.

$A(h)=\sqrt{r^2-h^2}(r+h),$

La función $A(h)$ es una función continua en el intervalo $[-r, r]$.

Notemos que cuando $h$ toma los valores de $-r$ y $r$, el valor del área es nulo, es decir que en estos valores alcanza el mínimo, lo cual quiere decir que por el teorema del valor extremo, el valor máximo lo alcanza en algún valor en $(-r, r)$.

Si derivamos la función $A(h)$, tenemos

$A^\prime(h)=\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}.$

Como sabemos que hay un máximo en el intervalo $(-r, r)$ y la derivada en este punto máximo debe ser igual a cero, hacemos $A^\prime(h)=0$.

Así,

$\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}=0.$

Resolviendo la ecuación tenemos que

$h=\frac{r}{2}.$

Así, el área máxima del triángulo $PQR$ es $$A=\sqrt{r^2-\left(\frac{r}{2}\right)^2}\left(r+\frac{r}{2}\right)=\frac{3\sqrt{3}r^2}{4}.$$

$\square$

Más ejemplos

Se pueden encontrar más problemas de aplicación del teorema del vaalor extremo en la Sección 6.4 del libro Problem Solving through Problems de Loren Larson.

Álgebra Lineal I: Bases duales, recetas y una matriz invertible

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior definimos el espacio dual de un espacio vectorial $V$. Así mismo, definimos las formas coordenadas, que son formas lineales asociadas a una base $B$ de $V$. Lo que hace la $i$-ésima forma coordenada en un vector $v$ es «leer» el $i$-ésimo coeficiente de $v$ expresado en la base $B$. Nos gustaría ver que estas formas coordenadas conforman bases del espacio dual.

Más concretamente, el objetivo de esta entrada es mostrar el teorema que enunciamos al final de la entrada anterior, hablar de problemas prácticos de bases duales y de mostrar un resultado interesante que relaciona bases, bases duales y la invertibilidad de una matriz.

Pequeño recordatorio

Como recordatorio, dada una base $B=\{e_1,\ldots,e_n\}$ de un espacio vectorial $V$ de dimensión finita $n$, podemos construir $n$ formas coordenadas $e_1^\ast,\ldots,e_n^\ast$ que quedan totalmente determinadas por lo que le hacen a los elementos de $B$ y esto es, por definición, lo siguiente:

$$
e_i^\ast(e_j)=
\begin{cases}
1\quad \text{ si $i=j$,}\\
0\quad \text{ si $i\neq j$.}
\end{cases}
$$

Recordemos también que dado un vector $v$ en $V$ podíamos construir a la forma lineal «evaluar en $v$», que era la forma $\text{ev}_v:V^\ast \to F$ dada por $\text{ev}_v(f)=f(v)$. Como manda elementos de $V^\ast$ a $F$, entonces pertenece a $V^{\ast \ast}$. A partir de esta definición, construimos la bidualidad canónica $\iota:V\to V^{\ast \ast}$ que manda $v$ a $\text{ev}_v$.

Finalmente, recordemos que dada una forma lineal $l$ y un vector $v$, usamos la notación $\langle l,v\rangle = l(v)$, y que esta notación es lineal en cada una de sus entradas. Todo esto lo puedes revisar a detalle en la entrada anterior.

El teorema de bases duales

El resultado que enunciamos previamente y que probaremos ahora es el siguiente.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ y $B=\{e_1,\ldots,e_n\}$ una base de $V$. Entonces el conjunto de formas coordenadas $B^\ast=\{e_1^\ast, \ldots,e_n^\ast\}$ es una base de $V^\ast$. En particular, $V^\ast$ es de dimensión finita $n$. Además, la bidualidad canónica $\iota:V\to V^{\ast \ast}$ es un isomorfismo de espacios vectoriales.

Antes de comenzar, convéncete de que cada una de las $e_i^\ast$ son formas lineales, es decir, transformaciones lineales de $V$ a $F$.

Demostración. Veremos que $B^\ast=\{e_1^\ast,\ldots,e_n^\ast\}$ es un conjunto linealmente independiente y que genera a $V^\ast$. Veamos lo primero. Tomemos una combinación lineal igual a cero, $$z:=\alpha_1 e_1^\ast + \alpha_2 e_2^\ast+\ldots + \alpha_n e_n^\ast=0.$$ Para cada $i=1,2,\ldots,n$, podemos evaluar la forma lineal $z$ en $e_i$.

Por un lado, $z(e_i)=0$, pues estamos suponiendo que la combinación lineal de $e_i^\ast$’s es (la forma lineal) cero. Por otro lado, analizando término a término y usando que los $e_i^\ast$ son la base dual, tenemos que si $i\neq j$ entonces $e_j^\ast(e_i)$ es cero, y si $i=j$, es $1$.

Así que el único término que queda es $\alpha_i e_i^\ast(e_i)=\alpha_i$. Juntando ambas observaciones, $\alpha_i=z(e_i)=0$, de modo que todos los coeficientes de la combinación lineal son cero. Asi, $B^\ast$ es linealmente independiente.

Ahora veremos que $B^\ast$ genera a $V^\ast$. Tomemos una forma lineal arbitraria $l$, es decir, un elemento en $V^\ast$. Al evaluarla en $e_1,e_2,\ldots,e_n$ obtenemos escalares $$\langle l, e_1\rangle,\langle l, e_2\rangle,\ldots,\langle l, e_n\rangle. $$ Afirmamos que estos son los coeficientes que nos ayudarán a poner a $l$ como combinación lineal de elementos de $B^\ast$. En efecto, para cualquier vector $v$ tenemos que

\begin{align*}
\left(\sum_{i=1}^n\langle l, e_i \rangle e_i^\ast\right) (v)
&= \sum_{i=1}^{n} \langle l, e_i \rangle \langle e_i^\ast, v \rangle \\
&= \sum_{i=1}^{n} \langle l, \langle e_i^\ast, v \rangle e_i \rangle \\
&=\left \langle l, \sum_{i=1}^n \langle e_i^\ast, v\rangle e_i \right \rangle\\
&= \langle l, v \rangle\\
&= l(v).
\end{align*}

La primer igualdad es por la definición de suma de transformaciones lineales. En la segunda usamos la linealidad de la segunda entrada para meter el escalar $\langle e_i^\ast , v\rangle$. La siguiente es de nuevo por la linealidad de la segunda entrada. En la penúltima igualdad usamos que justo $\langle e_i^\ast , v\rangle$ es el coeficiente que acompaña a $e_i$ cuando escribimos a $v$ con la base $B$. Esto muestra que $B^\ast$ genera a $V^\ast$.

Así, $B^\ast$ es base de $V^\ast$. Como $B^\ast$ tiene $n$ elementos, entonces $V^\ast$ tiene dimensión $n$.

La última parte del teorema consiste en ver que $\iota:V\to V^{\ast \ast}$ es un isomorfismo de espacios vectoriales. Por lo que acabamos de demostrar, $$\dim V = \dim V^\ast = \dim V^{\ast \ast}.$$ Así que basta con mostrar que $\iota$ es inyectiva pues, de ser así, mandaría a una base de $V$ a un conjunto linealmente independiente de $V^{\ast \ast}$ con $n$ elementos, que sabemos que es suficiente para que sea base. Como $\iota$ es transformación lineal, basta mostrar que el único vector que se va a la forma lineal $0$ de $V^\ast$ es el $0$ de $V$.

Supongamos que $v$ es tal que $\text{ev}_v=0$. Vamos a mostrar que $v=0$. Si $\text{ev}_v=0$, en particular para las formas coordenadas $e_i^\ast$ tenemos que $ \text{ev}_v(e_i^\ast)=0$. En otras palabras, $e_i^\ast(v)=0$ para toda $i$. Es decir, todas las coordenadas de $v$ en la base $B$ son $0$. Así, $v=0$. Con esto terminamos la prueba.

$\square$

La demostración anterior muestra cómo encontrar las coordenadas de una forma lineal $l$ en términos de la base $B^\ast$: basta con evaluar $l$ en los elementos de la base $B$. Recopilamos esto y la igualdad dual como una proposición aparte, pues resulta ser útil en varios contextos.

Proposición. Sea $V$ un espacio vectorial de dimensión finita $n$, $B=\{e_1,\ldots, e_n\}$ una base de $V$ y $B^\ast=\{e_1^\ast,\ldots,e_n^\ast\}$ la base dual. Entonces, para todo vector $v$ en $V$ y para toda forma lineal $l:V\to F$, tenemos que
\begin{align*}
v&= \sum_{i=1}^n \langle e_i^\ast, v\rangle e_i \quad \text{ y }\\
l&= \sum_{i=1}^{n} \langle l, e_i \rangle e_i^\ast.
\end{align*}

La traza de una matriz en $M_n(F)$ es la suma de las entradas en su diagonal principal. Es sencillo verificar que la función $\text{tr}:M_n(F)\to F$ que manda a cada matriz a su traza es una forma lineal, es decir, un elemento de $M_n(F)^\ast$.

Ejemplo. Considera el espacio vectorial de matrices $M_3(\mathbb{R})$. Sea $B=\{E_{ij}\}$ su base canónica. Expresa a la forma lineal traza en términos de la base dual $B^\ast$.

Solución. Tenemos que $\text{tr}(E_{ii})=1$ y que si $i\neq j$, entonces $\text{tr}(E_{ij})=0$. De esta forma, usando la fórmula de la proposición anterior,
\begin{align*}
\text{tr}&=\sum_{i,j} \text{tr}(E_{ij}) E_{ij}^\ast\\
&=E_{11}^\ast + E_{22}^\ast + E_{33}^\ast.
\end{align*} Observa que, en efecto, esta igualdad es correcta. Lo que hace $E_{ii}^\ast$ por definición es obtener la entrada $a_{ii}$ de una matriz $A=[a_{ij}]$.

La igualdad que encontramos dice que «para obtener la traza hay que extraer las entradas $a_{11}$, $a_{22}$, $a_{33}$ de $A$ y sumarlas». En efecto, eso es justo lo que hace la traza.

$\triangle$

Algunos problemas prácticos de bases duales

Ya que introdujimos el concepto de espacio dual y de base dual, hay algunos problemas prácticos que puede que queramos resolver.

  • Dada una base $v_1,\ldots,v_n$ de $F^n$, ¿cómo podemos encontrar a la base dual $v_1^\ast, \ldots, v_n^\ast$ en términos de la base dual $e_1^\ast, \ldots, e_n^\ast$ de la base canónica?
  • Dada una base $L=\{l_1,\ldots, l_n\}$ de $V^\ast$, ¿es posible encontrar una base $B$ de $V$ tal que $B^\ast = L$? De ser así, ¿cómo encontramos esta base?

A continuación mencionamos cómo resolver ambos problemas. Las demostraciones se quedan como tarea moral. En la siguiente entrada veremos problemas ejemplo resueltos.

  • La receta para resolver el primer problema es poner a $v_1,\ldots, v_n$ como vectores columna de una matriz $A$. Las coordenadas de $v_1^\ast,\ldots, v_n^\ast$ en términos de la base $e_1^\ast,\ldots,e_n^\ast$ están dados por las filas de la matriz $A^{-1}$.
  • La receta para resolver el segundo problema es tomar una base $B’=\{e_1,\ldots, e_n\}$ cualquiera de $V$ y considerar la matriz $A$ con entradas $A=[l_i(e_j)]$. La matriz $A^{-1}$ tiene como columnas a los vectores de coordenadas de la base $B$ que buscamos con respecto a la base $B’$.

¿Por qué la matriz $A$ de la segunda receta es invertible? Esto lo mostramos en la siguiente sección.

Un teorema de bases, bases duales e invertibilidad de matrices

La demostración del siguiente teorema usa varias ideas que hemos estado desarrollando con anterioridad. Usamos que:

  • Si $V$ es de dimensión finita $n$ y $B$ es un conjunto de $n$ vectores de $V$, entonces basta con que $B$ sea linealmente independiente para ser base. Esto lo puedes repasar en la entrada del lema de intercambio de Steinitz.
  • Una matriz cuadrada $A$ es invertible si y sólo si el sistema de ecuaciones $AX=0$ sólo tiene la solución trivial $X=0$. Esto lo puedes repasar en la entrada de equivalencias de matrices invertibles.
  • Una matriz cuadrada $A$ es invertible si y sólo si su transpuesta lo es.
  • El hecho de que la bidualidad canónica $\iota$ es un isomorfismo entre $V$ y $V^{\ast \ast}$.

Teorema. Sea $V$ un espacio vectorial de dimensión finita $n$ sobre el campo $F$. Sea $B=\{v_1,\ldots, v_n\}$ un conjunto de vectores en $V$ y $L=\{l_1,\ldots, l_n\}$ un conjunto de elementos de $V^\ast$, es decir, de formas lineales en $V$. Consideremos a la matriz $A$ en $M_n(F)$ dada por $$A=[l_i(v_j)].$$ La matriz $A$ es invertible si y sólo si $B$ es una base de $V$ y $L$ es una base de $V^\ast$.

Demostración. Mostraremos primero que si $B$ no es base, entonces $A$ no es invertible. Como $B$ tiene $n$ elementos y no es base, entonces no es linealmente independiente, así que existe una combinación lineal no trivial $$\alpha_1 v_1+\ldots+\alpha_n v_n=0.$$ De esta forma, si definimos $v=(\alpha_1,\ldots, \alpha_n)$, este es un vector no cero, y además, la $i$-ésima entrada de $Av$ es $$\alpha_1 l_i(v_1)+\ldots+\alpha_n l_i(v_n) = l_i(\alpha_1 v_1 + \ldots + \alpha_n v_n) = 0.$$ De este modo, $AX=0$ tiene una no solución trivial y por lo tanto no es invertible.

De manera similar, si $L$ no es base, entonces hay una combinación lineal no trivial $$\beta_1 L_1 + \ldots + \beta_n L_n =0$$ y entonces el vector $w=(\beta_1,\ldots,\beta_n)$ es una solución no trivial a la ecuación $^t A X=0$, por lo que $^t A$ no es invertible, y por lo tanto $A$ tampoco lo es.

Ahora veremos que si $L$ y $B$ son bases, entonces $A$ es invertible. Si $A$ no fuera invertible, entonces tendríamos una solución no trivial $(\alpha_1,\ldots,\alpha_n)$ a la ecuación $AX=0$. Como vimos arriba, esto quiere decir que para cada $i$ tenemos que $$ l_i(\alpha_1 v_1 + \ldots + \alpha_n v_n) = 0.$$ Como $l_i$ es base de $V^\ast$, esto implica que $l(\alpha_1 v_1 + \ldots + \alpha_n v_n)=0$ para toda forma lineal $l$, y como la bidualidad canónica es un isomorfismo, tenemos que $$\alpha_1 v_1 + \ldots + \alpha_n v_n=0.$$ Esto es imposible, pues es una combinación lineal no trivial de los elementos de $B$, que por ser base, son linealmente independientes.

$\square$

Más adelante…

Esta entrada es un poco abstracta, pues habla de bastantes transformaciones aplicadas a transformaciones, y eso puede resultar un poco confuso. Se verán problemas para aterrizar estas ideas. La importancia de entenderlas y manejarlas correctamente es que serán de utilidad más adelante, cuando hablemos de los espacios ortogonales, de transposición de transformaciones lineales y de hiperplanos.

La teoría de dualidad también tiene amplias aplicaciones en otras áreas de las matemáticas. En cierto sentido, la dualidad que vemos aquí es también la que aparece en espacios proyectivos. Está fuertemente relacionada con la dualidad que aparece en teoremas importantes de optimización lineal, que permiten en ocasiones reformular un problema difícil en términos de uno más fácil, pero con el mismo punto óptimo.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Usa la definición de linealidad para ver que las formas coordenadas $e_i^\ast$ en efecto son formas lineales.
  • Muestra que $\iota:V \to V^{\ast \ast}$, la bidualidad canónica, es una transformación lineal.
  • Justifica por qué la primer receta resuelve el primer problema práctico de bases duales.
  • Justifica por qué la segunda receta resuelve el segundo problema práctico de bases duales.
  • Sean $a_0,a_1,\ldots,a_n$ reales distintos. Considera el espacio vectorial $V=\mathbb{R}_n[x]$ de polinomios con coeficientes reales y grado a lo más $n$. Muestra que las funciones $\text{ev}_{a_i}:V\to \mathbb{R}$ tales que $\text{ev}_{a_i}(f)=f(a_i)$ son formas lineales linealmente independientes, y que por lo tanto son una base de $V^\ast$. Usa esta base, la base canónica de $V$ y el teorema de la última sección para mostrar que la matriz $$\begin{pmatrix} 1 & a_0 & a_0 ^2 & \ldots & a_0^n\\ 1 & a_1 & a_1^2 & \ldots & a_1^n\\ 1 & a_2 & a_2^2 & \ldots & a_2^n\\ & \vdots & & \ddots & \vdots \\ 1 & a_n & a_n^2 & \ldots & a_n^n\end{pmatrix}$$ es invertible.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Problemas de rango de transformaciones y matrices.

Por Ayax Calderón

Introducción

Con anterioridad vimos el concepto de rango de una matriz y rango de una transformación lineal, además del muy importante teorema de rango-nulidad y la desigualdad de Sylvester. Vimos también, como contenido optativo, el versátil teorema de la factorización $PJQ$. En esta ocasión nos enfocaremos en resolver problemas de rango que nos servirán para repasar dichos conceptos.

Problemas resueltos

Problema 1. Encuentra el kernel y el rango de la transformación lineal $T:\mathbb{R}_2[x] \longrightarrow \mathbb{R}_3[x]$ definida por $$T(f(x))=2f'(x) + \int _{0}^{x} 3f(t)dt.$$

Antes de comenzar a leer la solución, es conveniente que te convenzas de que $T$ es una transformación lineal y que está bien definida, es decir, que en efecto toma un polinomio de grado a lo más dos con coeficientes reales y lo lleva a un polinomio de grado a lo más tres con coeficientes reales.

Solución. Consideremos $\mathcal{B}=\{1, x, x^2\}$ la base canónica de $\mathbb{R}_2[x]$.
Entonces
\begin{align*}
\Ima(T)&=\text{span}(\{T(1),T(x),T(x^2)\})\\
&= \text{span}(\{3x,2+\frac{3}{2}x^2,4x+x^3\}).
\end{align*}

Para determinar el rango de $\Ima{T}$, colocamos a las coordenadas de estas imágenes en la siguiente matriz $A$,

$$A=\begin{pmatrix}
0 & 3 & 0 & 0\\
2 & 0 & \frac{3}{2} & 0\\
0 & 4 & 0 & 1 \end{pmatrix}$$

y con el algoritmo de reducción gaussiana llegamos a que

$$A_{red}=\begin{pmatrix}
1 & 0 & \frac{3}{4} & 0\\
0 & 1 & 0 & 0\\
0 & 0 & 0 & 1 \end{pmatrix}$$

Como $A_{red}$ tiene $3$ pivotes se sigue que $\rank(T)=3$.

Luego, por el teorema de rango nulidad se tiene que

\begin{align*}
3&=\dim(\mathbb{R}_2[x])\\
&= \dim (\ker (T))+\rank(T)\\
&=\dim(\ker(T))+3.
\end{align*}

Así, $\dim(\ker(T))=0$, por lo tanto $\ker(T)=\{0\}$.

$\triangle$

La desigualdad de Sylvester nos ayuda a acotar el rango de una suma de matrices por abajo. La desigualdad $$\rank(A+B)\leq \rank(A)+\rank(B)$$ nos ayuda a acotarlo por arriba. Combinar ambas ideas puede ser útil en problemas de rango de matrices.

Problema 2. Sea $A\in M_n(\mathbb{C})$ una matriz idempotente. Prueba que $$\rank(A)+\rank(I_n-A)=n.$$

Recuerda que una matriz es idempotente si $A^2=A$.

Solución. Como $A^2=A$, entonces $A(I_n – A)=O_n$.
Luego, por la desigualdad de Sylvester se tiene que
\begin{align*}
0&=\rank(O_n)\\
&=\rank(A(I_n-A))\\
&\geq \rank(A) + \rank(I_n-A)-n,
\end{align*}

entonces $$\rank(A)+\rank(I_n-A)\leq n.$$

Por otro lado, como para cualesquiera matrices $X,Y$ se tiene
$\rank(X+Y)\leq \rank(X)+\rank(Y)$, entonces
$$n=\rank(I_n)\leq \rank(A) + \rank(I_n-A),$$
de modo que $$n\leq \rank(A)+\rank(I_n – A).$$

Combinando ambas desigualdades, $$\rank(A)+\rank(I_n-A)=n.$$

$\square$

Problema 3. Encuentra el rango de la transformación lineal $T:\mathbb{R}_2[x]\longrightarrow M_2(\mathbb{R})$ definida por
$$T(f(x))=\begin{pmatrix}
f(1)-f(2) & 0\\
0 & f(0)\end{pmatrix}.$$

Solución. Para determinar el rango, basta tomar una base, encontrar la imagen de sus elementos bajo $T$ y determinar cuántos de estos elementos son linealmente independientes. Considera $\mathcal{B}=\{1,x,x^2\}$ la base canónica de $\mathbb{R}_2[x]$. Tenemos que

\begin{align*}
\Ima(T)&=\text{span}(T(\mathcal{B}))\\
&=\text{span}(\{T(1), T(x), T(x^2)\})\\
&=\text{span}\left(\left\{ \begin{pmatrix}
0 & 0\\
0 & 1\end{pmatrix}, \begin{pmatrix}
-1 & 0\\
0 & 0\end{pmatrix}, \begin{pmatrix}
-3 & 0\\
0 & 0\end{pmatrix} \right\} \right )\\
&=\text{span}\left (\left\{ \begin{pmatrix}
0 & 0\\
0 & 1\end{pmatrix}, \begin{pmatrix}
-1 & 0\\
0 & 0\end{pmatrix} \right\} \right ).
\end{align*}

Notemos también que $\mathcal{C}=\left\{ \begin{pmatrix}
0 & 0\\
0 & 1\end{pmatrix}, \begin{pmatrix}
-1 & 0\\
0 & 0\end{pmatrix}} \right\}$ es linealmente independiente.

Por lo tanto $\mathcal{C}$ es una base para $\Ima(T)$ y así $\rank(T)=2$.

$\triangle$

Problema 4. Sean $A\in M_{3,2}(\mathbb{R})$ y $B\in M_{2,3}(\mathbb{R})$ matrices tales que
$$AB=\begin{pmatrix}
2 & -2 & -4\\
-1 & 3 & 4\\
1 & -2 & -3\end{pmatrix} $$

Muestra que $BA$ es la identidad.

El enunciado no parece mostrar que este sea uno de los problemas de rango de matrices. Sin embargo, para poder resolverlo usaremos las herramientas que hemos desarrollado hasta ahora.

Partiremos el problema en los siguientes pasos.

  1. Verificar que $(AB)^2=AB$ y que $\rank(AB)=2$.
  2. Probar que $BA$ es invertible.
  3. Probar que $(BA)^3=(BA)^2$ y deducir que $BA=I_2$.

Solución.

1. Realizamos la operación matricial:

$$\begin{pmatrix}
2 & -2 & -4\\
-1 & 3 & 4\\
1 & -2 & -3\end{pmatrix}\begin{pmatrix}
2 & -2 & -4\\
-1 & 3 & 4\\
1 & -2 & -3\end{pmatrix}=\begin{pmatrix}
2 & -2 & -4\\
-1 & 3 & 4\\
1 & -2 & -3\end{pmatrix}$$

Ahora, aplicando reducción gaussiana en $AB$ obtenemos que $$(AB)_{red}=\begin{pmatrix}
1 & 0 & -1\\
0 & 1 & 1\\
0 & 0 & 0\end{pmatrix}.$$

Como $(AB)_{red}$ tiene sólo dos pivotes, entonces $\rank(AB)=2$.

2. Usando la desigualdad de rango para producto de matrices, obtenemos que
\begin{align*}
\rank(BA)&\geq \rank(A(BA)B)\\
&=\rank((AB)^2)\\
&=\rank(AB)=2.
\end{align*}

Entonces, $\rank(BA)\geq 2$. Por otro lado, como $BA\in M_2(\mathbb{R})$, entonces $\rank(BA)\leq 2$. Así, $\rank(BA)=2$ y $BA$ es una matriz en $M_2(\mathbb{R})$, así que es invertible.

3. Como $(AB)^2=AB$, entonces $B(AB)^2 A=B(AB)A=(BA)^2$. Por consiguiente $BABABA=(BA)^2$ y así $(BA)^3=(BA)^2$ y como $BA$ es invertible, podemos multiplicar en ambos lados de esta última igualdad por $((BA)^{-1})^2$ para obtener $BA=I_2$.

$\square$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Superior II: Racionales y expansiones decimales

Por Claudia Silva

Introducción

En la entrada anterior hablamos acerca de cómo se construyen los números racionales y los números reales. A los números reales que no son racionales les llamamos irracionales. En esta entrada, queremos hablar de algunas formas en las que podemos determinar si un número es racional o irracional.

Expresión decimal de un racional

A los reales los construimos como clases de equivalencia de cierto tipo de sucesiones, pero otra forma de pensarlos es mediante su expresión decimal. Una forma de detectar la racionalidad o irracionalidad de un número es mediante su expresión decimal.

Lo primero que haremos en esta entrada será verificar la validez de la observación 88 del libro Álgebra Superior de Bravo, Rincón, Rincón. Para quienes tiene dificultades para ver los vídeos, pueden seguir la demostración del libro tal cual. Recuerden que pueden conseguir el libro de manera gratuita en la página Plaza Prometeo.

El resultado es el siguiente.

Proposición. Un número $r$ es racional si y sólo si tiene una expresión decimal que se vuelva periódica.

Lo haremos desglosando el «sí» y el «sólo sí» en dos vídeos separados.

La ida:

Demostración de que un número real es racional, entonces éste tiene una expresión decimal periódica

El regreso:

Un número real con expansión decimal periódica es racional

Ejercicios de determinar si un número es racional

Ahora, un par de ejemplos (éstos también vienen el libro, son el 126 y uno similar al 127):

Dos ejemplos del Teorema: un real es racional sii tiene expansión decimal periódica.

Por último, probaremos que $\sqrt7$ no es racional:

Demostración de que raíz de 7 no es racional.

Este último ejercicio se los dejo escrito, para los que no puedan ver el video con tanta facilidad:

Ejercicio de mostrar que raiz de 7 no es racional

Más ejemplos

Aquí en el blog puedes ver otros ejemplos en los que se usa la expansión decimal de un número y otros argumentos de bases numéricas.

Más adelante…

Tarea moral

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Seminario de Resolución de Problemas: El teorema del valor intermedio

Por Fabian Ferrari

Introducción

El teorema del valor intermedio nos dice que si $f: [a, b] \to \mathbb{R}$ es una función continua, entonces para todo $y$ entre $f(a)$ y $f(b)$, existe un número $c \in [a, b]$ tal que $f(c)=y$. La forma de pensar este teorema es que «las funciones continuas no se pueden saltar valores que quedan entre dos valores que ya tomaron», o bien «las funciones continuas no dan brincos en su imagen».

Veamos algunos problemas que se resuelven usando este teorema

Una aplicación directa del teorema del valor intermedio

Problema 1. Muestra que la ecuación $2x^3+7x^2-27x=-18$ tiene una solución en el intervalo $[-7,-5]$.

Sugerencia pre-solución. Formula un problema equivalente definiendo una función continua $f$ para la cual si $f(x)=0$, entonces $x$ es solución a la ecuación.

Solución. La ecuación la podemos ver como $2x^3+7x^2-27x+18=0$. Consideremos la función $$f(x)=2x^3+7x^2-27x+18.$$ Como $f(x)$ es una función polinomial, sabemos que es continua en $\mathbb{R}$, así que es continua en el intervalo $[-7,-5]$. Lo que queremos ver es que existe un $c$ entre $-7$ y $-5$, tal que $f(c)=0$. Para esto, tenemos que evaluar la función en $-7$ y en $-5$.

Tenemos que:

$f(-7)=-136$ y $f(-5)=78$.

Tenemos que $0$ está entre $-136$ y $78$. Así, por el teorema del valor intermedio, debe de existir un número $c$ entre $-7$ y $-5$ de tal forma que $f(c)=0$. Por lo tanto $2x^3+7x^2-27x=-18$ tiene una solución entre $-5$ y $-7$.

$\square$

Notemos que no se encontró el valor de la raíz de la ecuación, sin embargo mostramos la existencia de esta. Esta es una de las características del teorema del valor intermedio: exhibir la existencia de algo sin necesidad de encontrarlo explícitamente.

Definir una buena función

En ocasiones podemos definir dos funciones para un problema y hacerlas interactuar para obtener una sola función continua que nos permite resolver un problema.

Problema 2. Un montañista empezó a escalar una montaña el sábado a las 8:00 hrs y llegó a la cima a las 18:00 hrs del mismo día. Decidió pasar la noche en la cima de la montaña. El día domingo empezó a descender a las 8:00 hrs y llegó al punto de partida a las 18:00 hrs. Prueba que hubo una hora en la que en ambos días estuvo a la misma altura de la montaña.

Sugerencia pre-solución. Plantea el problema usando dos funciones continuas que denoten la altura conforme pasa el tiempo en ambos días. Tienes mucha flexibilidad, así que usa notación efectiva para simplificar los cálculos.

Solución. Veamos que para este problema, podemos establecer dos funciones continuas para describir el cambio de altura con respecto al tiempo en horas, una para el ascenso y otra para el descenso del montañista en ambos días.

Sean $h_1(t)$, y $h_2(t)$ las funciones que representan el ascenso y el descenso del montañista respectivamente. En otras palabras, $h_1(t)$ y $h_2(t)$ denotan la altura en la que está el montañista tras $t$ horas después de haber comenzado su ascenso y descenso, respectivamente. Como amabas funciones son continuas en el intervalo de tiempo $[0, 10]$ (esto es porque tardó $10$ horas para ascender y $10$ horas para descender), tenemos que la función $g(t)=h_2(t)-h_1(t)$ tiene que ser continua en $[0, 10]$ también.

Ahora bien, sea $M$ la altura en la cima de la montaña. Tenemos lo siguiente:

$h_1(0)=0$, $h_1(10)=M$ y $h_2(0)=M$, $h_2(10)=0$.

Así, $g(0)=M$ y $g(10)=-M$. A su vez, $0$ está entre $-M$ y $M$, por lo que aplicando el teorema del valor intermedio, debe de existir un $t_0$ en el intervalo $[0, 10]$ tal que $g(t_0)=0$.

Y como

$g(t)=h_2(t)-h_1(t)$,

entonces

$g(t_0)=h_2(t_0)-h_1(t_0)$

$0=h_2(t_0)-h_1(t_0)$

$h_1(t_0)=h_2(t_0).$

Con esto podemos concluir que en el tiempo $t_0$ el día domingo estuvo a la misma altura que el día sábado al tiempo $t_0$.

$\square$

Definir un buen intervalo

En algunas ocasiones no es directo qué valores tenemos que usar como los extremos del intervalo al que aplicaremos el teorema del valor intermedio. Un ingrediente adicional que se necesita en el siguiente problema es elegir de manera correcta el extremo derecho.

Problema 3. Prueba que si $n$ es un entero positivo y $x_0 > 0$, entonces existe un único número positivo $x$ tal que $x^n=x_0$.

Sugerencia pre-solución. Necesitarás modificar el problema un poco. Se quiere encontrar una solución a $x^n=x_0$. Limítate a encontrarla en el intervalo $[0,c]$ para una buena elección de $c$.

Solución. Sea $c$ un número mayor que $1$ de tal forma que $0<x_0<c$. Si consideramos la función $f(x)=x^n$, tenemos que dicha función es continua en el intervalo $[0, c]$, y tenemos que

$f(0)=0$ y $f(c)=c^n.$

Como $$0<x_0<c<c^n,$$ tenemos que $x_0$ está en el intervalo $(0,c)$, y por el teorema del valor intermedio, tenemos que existe $x$ en el intervalo $(0,c)$ tal que $f(x)=x_0$, que usando la definición de $f$ quiere decir que $$x^n=x_0.$$

No puede existir otro además de $x_0$ ya que la función $f(x)=x^n$ es creciente en el intervalo $[0,c]$.

$\square$

Más ejemplos

Puedes encontrar más problemas que se pueden resolver usando el teorema del valor intermedio en el libro Problem Solving Strategies de Loren Larson, en la Sección 6.2.