Archivo de la etiqueta: problemas resueltos

Álgebra Lineal I: Problemas de dualidad y base dual

Introducción

El día de hoy, comenzaremos a resolver problemas sobre un nuevo tema: espacio dual. La parte teórica ya la hemos cubierto en entradas anteriores. En la entrada de introducción a dualidad definimos el espacio dual y las formas coordenadas. Después, en una siguiente entrada, de bases duales vimos que las formas coordenadas son una base del espacio dual, hablamos de ciertos problemas prácticos para resolver, y vimos un teorema que relaciona bases, bases duales y una matriz invertible. Ahora veremos aplicaciones de la teoría desarrollada y la usaremos para resolver problemas de dualidad prácticos.

Problemas prácticos resueltos

Uno de los problemas de dualidad que discutimos la ocasión anterior es expresar a una base dual de vectores en V en términos de la base dual de la base canónica. Veamos un ejemplo de esto.

Problema 1. Sean v_1,v_2,v_3,v_4 los vectores en \mathbb{R}^4 definidos como

    \[v_1=\begin{pmatrix} 1 \\ 1 \\ 1 \\ 1 \end{pmatrix}, v_2=\begin{pmatrix} 1 \\ 2 \\ 3 \\ 4 \end{pmatrix}, v_3=\begin{pmatrix} 0 \\ 0 \\ 1 \\ 2 \end{pmatrix}, v_4=\begin{pmatrix} 1 \\ 0 \\ 0 \\ 5 \end{pmatrix}.\]

Demuestra que V:=\{v_1,v_2,v_3,v_4\} es una base de \mathbb{R}^4 y encuentra la base dual de V en términos de e_i^\ast, donde e_i^\ast es la base dual de la base canónica de \mathbb{R}^4.

Solución. Dado que V está conformado por cuatro vectores y la dimensión de \mathbb{R}^4 es 4, basta con probar que son vectores linealmente independientes. Hay dos maneras de hacerlo.

Manera 1: Sean a,b,c,d \in \mathbb{R} tales que 0=av_1+bv_2+cv_3+dv_4. Esto da cuatro ecuaciones

    \begin{align*}0&=a+b+d\\0&=a+2b\\0&=a+3b+c\\0&=a+4b+2c+5d.\end{align*}

De la segunda obtenemos que a=-2b, sustituyendo en la primera y en la segunda d=2b-b=b, c=2b-3b=-b, y sustituyendo ésto en la cuarta, tenemos que 0=-2b+4b-2b+5b=5b. Por lo tanto a=b=c=d=0, implicando que los vectores en V son linealmente independientes, y por consiguiente forman una base de \mathbb{R}^4.

Manera 2: Hacer la reducción gaussiana en la matriz (A|I) donde A es la matriz cuyas columnas son los vectores de V. Entonces

    \[\left( \begin{array}{cccc|cccc} 1 & 1 & 0 & 1 & 1 & 0 & 0 & 0 \\ 1 & 2 & 0 & 0 & 0 & 1 & 0 & 0 \\ 1 & 3 & 1 & 0 & 0 & 0 & 1 & 0 \\ 1 & 4 & 2 & 5 & 0 & 0 & 0 & 1 \end{array} \right)\]

    \[\longrightarrow \left( \begin{array}{cccc|cccc} 1 & 1 & 0 & 1 & 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & -1 & -1 & 1 & 0 & 0 \\ 0 & 2 & 1 & -1 & -1 & 0 & 1 & 0 \\ 0 & 3 & 2 & 4 & -1 & 0 & 0 & 1 \end{array} \right)\]

    \[\longrightarrow  \left( \begin{array}{cccc|cccc} 1 & 1 & 0 & 1 & 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & -1 & -1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 1 & 1 & -2 & 1 & 0 \\ 0 & 0 & 2 & 7 & 2 & -3 & 0 & 1 \end{array} \right)\]

    \[\longrightarrow  \left( \begin{array}{cccc|cccc} 1 & 0 & 0 & 0 & 2 & -7/5 & 4/5 & -2/5 \\ 0 & 1 & 0 & 0 & -1 & 6/5 & -2/5 & 1/5 \\ 0 & 0 & 1 & 0 & 1 & -11/5 & 7/5 & -1/5 \\ 0 & 0 & 0 & 1 & 0 & 1/5 & -2/5 & 1/5 \end{array} \right)\]


Como podemos reducir a la identidad, los vectores iniciales son linealmente independientes y forman una base. Más aún, ya obtuvimos la inversa de A.

Ahora para obtener la base dual V^:=\{v_1^\ast,v_2^\ast,v_3^\ast,v_4^\ast\} de la base V, por lo visto en la última clase, podemos escribir V^\ast como combinación lineal de e_i^\ast, donde los coeficientes son las columnas de B:=^t(A^{-1}). Esta matriz es

    \[\begin{pmatrix} 2 & -1 & 1 & 0 \\ -7/5 & 6/5 & -11/5 & 1/5 \\ 4/5 & -2/5 & 7/5 & -2/5 \\ -2/5 & 1/5 & -1/5 & 1/5 \end{pmatrix}.\]

Por lo tanto,

    \[v_1^* = 2e_1^* -\frac{7}{5} e_2^* +\frac{4}{5} e_3^* -\frac{2}{5}e_4^*\]

    \[v_2^* = -e_1^* +\frac{6}{5} e_2^* -\frac{2}{5} e_3^* +\frac{1}{5}e_4^*\]

    \[v_3^* = e_1^* -\frac{11}{5} e_2^* +\frac{7}{5} e_3^* -\frac{1}{5}e_4^*\]

    \[v_4^* = \frac{1}{5} e_2^* -\frac{2}{5} e_3^* +\frac{1}{5}e_4^*\]

\square

Otro tipo de problemas de dualidad consisten en determinar algunos vectores en V cuya base dual sea una base dada de V^\ast.

Problema 2. Considera las siguientes formas lineales en \mathbb{R}^3:

    \begin{align*}l_1(x,y,z)&=x-y, \\l_2(x,y,z)&=y-z, \\l_3(x,y,z)&=x+y-z.\end{align*}

  1. Prueba que l_1,l_2,l_3 forman una base del dual de \mathbb{R}^3.
  2. Encuentra una base de \mathbb{R}^3 cuya base dual es l_1,l_2,l_3.

Solución. (1) Por el último teorema de la entrada de bases duales, sabemos que l_1,l_2,l_3 forman una base si la matriz A=[l_i(e_j)] es invertible, donde e_j es la base canónica de \mathbb{R}^3.

Para mostrar que A es invertible, calcularemos la forma escalonada reducida de la matríz (A|I). Entonces,

    \begin{align*}&\left( \begin{array}{ccc|ccc} 1 & -1 & 0 & 1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 1 & 0 \\ 1 & 1 & -1 & 0 & 0 & 1 \end{array} \right) \\\longrightarrow &\left( \begin{array}{ccc|ccc} 1 & -1 & 0 & 1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 1 & 0 \\ 0 & 2 & -1 & -1 & 0 & 1 \end{array} \right) \\ \longrightarrow &\left( \begin{array}{ccc|ccc} 1 & -1 & 0 & 1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 1 & 0 \\ 0 & 0 & 1 & -1 & -2 & 1 \end{array} \right) \\ \longrightarrow &\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 0 & -1 & 1 \\ 0 & 1 & 0 & -1 & -1 & 1 \\ 0 & 0 & 1 & -1 & -2 & 1 \end{array} \right)\end{align*}

Con esto concluimos que A es invertible, y por lo tanto l_1,l_2,l_3 forman una base del dual de \mathbb{R}^3.

(2) En el inciso anterior, calculamos la inversa de A, obteniendo

    \[A^{-1}=\begin{pmatrix} 0 & -1 & 1 \\ -1 & -1 & 1 \\ -1 & -2 & 1 \end{pmatrix}.\]


Recordemos que la base v_1,v_2,v_3 de \mathbb{R}^3 está determinada por las columnas de B=A^{-1}, entonces

    \[v_1=\begin{pmatrix} 0 \\ -1 \\ -1 \end{pmatrix}, \ v_2=\begin{pmatrix} -1 \\ -1 \\ -2 \end{pmatrix}, \ v_3=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}.\]

\square

Veamos otro ejemplo, el que veremos formas lineales un poco más interesantes, relacionadas con cálculo.

Problema 3. Sea V=\mathbb{C}_2[X] el espacio vectorial de polinomios de grado a lo más 2 con coeficientes complejos, y para cada P\in V definimos

    \begin{align*}l_1(P)&=P(0), \\ l_2(P)&=\int_0^1 P(x) dx, \\ l_3(P)&=\int_0^1 P(x)e^{-2\pi ix}dx.\end{align*}

  1. Prueba que l_1,l_2,l_3 pertenecen a V^*. Más aún, forman una base de V^*.
  2. Encuentra una base v_1,v_2,v_3 de V cuya base dual es l_1,l_2,l_3.

Solución. (1) No es difícil ver que son formas lineales, ya que l_1(P+Q)=P(0)+Q(0)=l_1(P)+l_1(Q), l_1(aP)=aP(0)=al_1(P) y l_2,l_3 son lineales por las propiedades de la integral.

Para probar que son base de V^*, lo haremos de manera similar al problema anterior. Sabemos que 1,x,x^2 forman la base canónica de V, entonces L:=\{l_1,l_2,l_3\} es una base de V^* si la matriz A=[l_i(e_j)] es invertible. Calculando

    \[l_1(1)=1, \  l_1(x)=l_1(x^2)=0,\]

    \[l_2(1)=1, \  l_2(x)=\int_0^1 xdx=\frac{1}{2},\]

    \[l_2(x^2)=\int_0^1 x^2 dx=\frac{1}{3},\]

    \[l_3(1)=\int_0^1 e^{-2\pi i x}dx=0, \ l_3(x)=\int_0^1 xe^{-2\pi i x}dx=\frac{i}{2\pi},\]

    \[l_3(x^2)=\int_0^1 x^2e^{-2\pi i x}dx=\frac{1+i\pi}{2\pi^2}.\]


(Para calcular l_3(x),l_3(x^2) se usa integración por partes). Entonces la matriz es

    \[A=\begin{pmatrix} 1 & 0 & 0 \\ 1 & 1/2 & 1/3 \\ 0 & \frac{i}{2\pi} & \frac{1+i\pi}{2\pi^2}  \end{pmatrix}.\]

Ahora, reduciremos la matriz (A|I) para «matar dos pájaros en un sólo tiro»: probar que A es invertible y, al mismo tiempo, encontrar A^{-1}. Tenemos que

    \begin{align*}&\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 1 & 1/2 & 1/3 & 0 & 1 & 0 \\ 0 & \frac{i}{2\pi} & \frac{1+i\pi}{2\pi^2} & 0 & 0 & 1 \end{array} \right)\\\longrightarrow &\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 0 & 1/2 & 1/3 & -1 & 1 & 0 \\ 0 & i\pi & 1+i\pi & 0 & 0 & 2\pi^2 \end{array} \right)\\\longrightarrow & \left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 0 & 3 & 2 & -6 & 6 & 0 \\ 0 & 1 & \frac{1+i\pi}{i\pi} & 0 & 0 & -2i\pi  \end{array} \right)\\\longrightarrow &\left( \begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & \frac{-6-6\pi i}{3+\pi i} & \frac{6+6\pi i}{3+\pi i} & \frac{-4\pi^2}{3+\pi i} \\ 0 & 0 & 1 & \frac{6\pi i}{3+\pi i} & \frac{-6\pi i}{3+\pi i} & \frac{6\pi^2}{3+\pi i} \end{array} \right)\end{align*}

Por lo tanto A es invertible, implicando que L es una base de V^*.

(2) Ya calculada en el inciso anterior, tenemos que

    \[A^{-1}=\frac{1}{3+\pi i} \begin{pmatrix} 3+\pi i & 0 & 0 \\ -6-6\pi i & 6+6\pi i & -4\pi^2 \\ 6\pi i & -6 \pi i & 6\pi^2 \end{pmatrix}.\]

De esta matriz leemos a las coordenadas de la base que estamos buscando en términos de la la base canónica \{1,x,x^2\}. Los renglones son los vectores de coordenadas. Por lo tanto, la base de V tal que L es la base dual es:

    \begin{align*}v_1&= \frac{1}{3+\pi i} \left(3+\pi i\right) \\v_2&= \frac{1}{3+\pi i} \left( -6-6\pi i+(6+6\pi i)x-4\pi^2x^2 \right) \\v_3&= \frac{1}{3+\pi i} \left( 6\pi i-6\pi ix+6\pi^2x^2  \right). \end{align*}

\square

Fórmula de interpolación de Lagrange

La teoría de dualidad tiene amplias aplicaciones. Con ella se puede probar un resultado clásico: podemos construir un polinomio de grado n que pase por n+1 puntos que nosotros queramos. En el siguiente ejercicio vemos los detalles.

Problema 4. (Interpolación de Lagrange) Sea V=\mathbb{R}_n[X] el espacio vectorial de polinomios de grado a lo más n con coeficientes reales. Sean x_0,\dots,x_n números reales distintos. Para 0\leq i \leq n definimos

    \[L_i(x)=\prod_{0\leq j\leq n, j\neq i} \frac{x-x_j}{x_i-x_j}.\]

  1. Demuestra que L_i(x_j)=\delta_{ij} para todo 1\leq i,j \leq n, donde \delta_{ij} es igual a 1 si i=j y es igual a 0 si i\neq j.
  2. Prueba que L_0,\dots,L_n forman una base de V.
  3. Encuentra la base dual de L_0,\dots,L_n.
  4. Prueba la Fórmula de Interpolación de Lagrange: para todo P\in V tenemos que

        \[P=\sum_{i=0}^n P(x_i)L_i.\]

  5. Demuestra que para cualquiera b_0,\dots,b_n \in\mathbb{R}, podemos encontrar un único polinomio P\in V tal que P(x_i)=b_i para todo 0\leq i \leq n. Este polinomio P es llamado el polinomio de interpolación de Lagrange asociado a b_0,\dots,b_n.

Solución. (1) Si j\neq i, entonces

    \[L_i(x_j)=\frac{x_j-x_j}{x_i-x_j}\cdot\prod_{k\neq j,i} \frac{x_j-x_k}{x_i-x_k}=0.\]

Por otro lado si i=j,

    \[L_i(x_j)=L_i(x_i)=\prod_{k\neq i} \frac{x_i-x_k}{x_i-x_k} =1 .\]

(2) Dado que dim(V)=n+1, cuya base canónica es 1,x,\ldots,x^n y L_0,\dots,L_n son n+1 vectores, para probar que son base, basta con demostrar que son linealmente independientes. Sean a_0,\dots,a_n tales que a_0L_0+\dots+a_nL_n=0. Evaluando en x_i y usando el inciso anterior, tenemos que

    \[0=\sum_{j=0}^n a_jL_j(x_i)=\sum_{j=0}^n a_j\delta_{ij}=a_i,\]

pero esto pasa cualquier 0\leq i \leq n. Por lo tanto L_0,\dots,L_n son linealmente independientes, y por consiguiente, son base de V.

(3) Por definición de la base dual L_i^*(L_j)=\delta_{ij}, y por el inciso (a) tenemos que L_j(x_i)=\delta_{ij}, entonces L_i^*(L_j)=L_j(x_i), para toda i,j. Ahora, fijamos i. Dado que L_0,\dots, L_n forman una base de V y dado que L_i^* es lineal, para toda P\in V, con P(x)=a_0L_0+a_1L_1+\ldots+a_nL_n, tenemos que

    \begin{align*}L_i^*(P)&=a_0L_i^*L_0)+\ldots+a_nL_i^\ast(L_n)\\&=a_0L_0(x_i)+\ldots+a_nL_n(x_i)\\&=P(x_i).\end{align}


Por lo tanto la base dual es L_i^*=\text{ev}_{x_i}.

(4) Sabemos que la base dual satisface que

    \[P=\sum_{i=0}^n \langle L_i^*,P \rangle L_i.\]

Pero por el inciso anterior, \langle L_i^*,P\rangle =L_i^*(P)=P(x_i), entonces P=\sum_i P(x_i)L_i.

(5) Definimos P=\sum_{i=0}^n b_iL_i. Por el inciso (1), tenemos que

    \[P(x_j)=\sum_i b_iL_i(x_j)=\sum_i b_i\delta_{ij}=b_j.\]

Entonces el polinomio existe. Falta probar la unicidad.

Suponemos que existe Q\in V tal que Q(x_i)=b_i para todo i. Notemos que P-Q es un polinomio de grado a lo más n (por definición) y (P-Q)(x_i)=0 para todo i, esto implica que P-Q tiene n+1 raíces distintas, lo cual es imposible si P-Q \neq 0, por lo tanto, P-Q=0, es decir P=Q.

\square

Observemos que este problema también se satisface para los polinomios con coeficientes complejos, V=\mathbb{C}_n[X].

Expresar integral como suma de evaluaciones

Terminamos esta entrada con el siguiente problema. El enunciado no menciona dualidad, pero podemos usar la teoría desarrollada hasta ahora para resolverlo.

Problema 5. Sean x_0,x_1,x_2\in [0,1], y sea V=\mathbb{R}_2[X]. Definimos el mapeo

    \[l(P)=\int_0^1 P(x)e^{-x} dx.\]

Demuestra que l es una forma lineal en V y prueba que existe una única tercia (a_0,a_1,a_2) de números reales tales que

    \[\int_0^1 P(x)e^{-x}dx=\sum_{i=0}^2 a_iP(x_i).\]

Solución. Debido a las propiedades de la integral, es fácil ver que l es lineal, ya que

    \begin{align*}l(aP+Q)&=\int_0^1 (aP(x)+Q(x))e^{-x} dx \\&= a\int_0^1 P(x)e^{-x}dx+\int_0^1 Q(x)e^{-x}dx \\&=al(P)+l(Q).\end{align*}

Usando el problema anterior, tenemos que L_0^*=\text{ev}_{x_0}, L_1^*=\text{ev}_{x_1} y L_2^*=\text{ev}_{x_2} forman una base de V^. Por lo tanto existen (a_0,a_1,a_2) tales que l=a_0L_0^*+a_1L_1^*+a_2L_2^*. Entonces

    \begin{align*}     \int_0^1 P(x)e^{-x}&=l(P)=\sum_{i=0}^2 a_iL_i^*(P) \\     &= \sum_{i=0}^2 a_iP(x_i). \end{align*}

Es fácil ver que es única esa tercia, ya que, si existiera otra (b_0,b_1,b_2) tal que

    \[l=b_0L_0^*+b_1L_1^*+b_2L_2^*,\]

esto implica que

    \[0=(a_0-b_0)L_0^*+(a_1-b_1)L_1^*+(a_2-b_2)L_2^*,\]

y dado que L_i^* son una base, tendríamos a_i=b_i.

\square

Álgebra Superior II: Simplificación, suma y producto de complejos

Introducción

En una entrada de blog anterior, construimos el campo de los números complejos y definimos sus operaciones básicas. Ahora resolveremos algunos problemas de operaciones con complejos.

Haremos dos tipos de problemas. El primer tipo se trata de simplificar expresiones en números complejos para que se vuelvan de la forma x+yi con x y y números reales. El segundo tipo es de realizar operaciones de suma, resta, producto y división de complejos, y luego simplificar.

Simplificación de expresiones complejas

Comenzamos con un video de simplificar expresiones de números complejos.

Expresar en la forma a+bi las expresiones…

Problemas de operaciones con complejos

Ahora vemos varios ejemplos de realizar sumas con números complejos.

Sumar números complejos

En todos los ejemplos del video, realizamos sólo sumas de dos números, pero se podrían realizar sumas con cualquier cantidad de sumandos. Por ejemplo, podemos considerar la suma

    \[(5+2i)+(8+i)-(1-7i).\]

¿Cuál sería el resultado de esta operación?

Finalmente, a continuación se muestra un video en donde see realizan operaciones de productos y de divisiones de números complejos.

Productos y divisiones de números complejos

En el video se define al conjugado del número complejo z=a+bi, que se denota por \overline{z} y se obtiene de cambiarle el signo a la parte imaginaria. Por ejemplo, \overline{4-5i}=4+5i. Si multiplicas a un número complejo a+bi por su conjugado, obtienes el real a^2+b^2. Esto es útil para quitar las partes imaginarias de los denominadores de expresiones fraccionales con complejos.

Más ejemplos y práctica extra

En otro curso, el Seminario de Resolución de Problemas, escribimos una entrada de cómo se pueden usar los números complejos para la resolución de problemas matemáticos. Ahí hay teoría más avanzada, pero puedes echarle un ojo para que veas lo que veremos más adelante en el curso.

En la página de Khan Academy en Español, puedes aprender más acerca de los números complejos, así como hacer muchos ejercicios de práctica.

Seminario de Resolución de Problemas: El teorema del valor extremo

Introducción

En una entrada anterior, acerca de funciones continuas, mencionamos dos teoremas fundamentales que estas funciones satisfacen: el teorema del valor intermedio y el teorema del valor extremo. Ya hablamos acerca del teorema del valor intermedio en una entrada anterior. El objetivo de esta entrada es mencionar aplicaciones del teorema del valor extremo.

Como recordatorio, el teorema del valor extremo o teorema de los valores extremos nos dice que si una función f(x) es continua en un intervalo cerrado [a, b], entonces existen valores c y d en [a, b] tales que f(c) \leq f(x) \leq f(d) para toda x en el intervalo [a, b].

En otras palabras, lo que nos dice el teorema es que si una función es continua en un intervalo cerrado, tenemos que la función debe alcanzar un valor máximo y un valor mínimo dentro del intervalo.

Dos teoremas para funciones derivables

Aprovecharemos para mencionar dos teoremas importantes que se ocuparán más adelante. Las demostraciones de dichos teoremas tienen que ver con la aplicación del teorema del valor extremo, estos teoremas son el teorema de Rolle y el teorema del valor medio (no confundir con el teorema del valor intermedio).

Teorema de Rolle. Sean a<b reales y f:[a,b]\to\mathbb{R} una función continua en el intervalo [a, b] y derivable en (a, b). Se tiene que si f(a)=f(b), entonces existe c en (a, b) tal que f^\prime(c)=0.

Sugerencia pre-demostración. Por el teorema del valor extremo, la función debe alcanzar un máximo y un mínimo en el intervalo. Divide en casos de acuerdo a dónde están estos valores, si en los extremos o no.

Demostración: Como f(x) es una función continua en [a, b], por el teorema del valor extremo tenemos que f(x) alcanza un valor máximo y un valor mínimo en el intervalo [a, b]. Tenemos entonces los siguientes casos.

  • Caso i: Si el valor máximo y mínimo se encuentran en los extremos del intervalo, tenemos que la función f(x) tiene que ser constante dado que f(a)=f(b). y se tiene que f^\prime(c)=0 para todo c en [a, b].
  • Caso ii: Si el valor mínimo o máximo no están en los extremos. Sean c_1 y c_2 en (a, b), los valores en los que la función alcanza su mínimo y máximo respectivamente. Alguno de estos no está en los extremos. Como f(x) es derivable en (a, b), tenemos que también va a ser derivable en alguno de los puntos c_1 y c_2, teniendo que f^\prime(c_1)=0 o f^\prime(c_2)=0, así que basta con tomar c=c_1 o c=c_2.

\square

Teorema del valor medio. Sean a<b reales y f:[a,b]\to\mathbb{R} una función continua en [a, b] y diferenciable en (a, b). Entonces existe un número c en (a, b) tal que

\frac{f(b)-f(a)}{b-a}=f^\prime(c).

Demostración: Consideremos la siguiente función auxiliar:

g(x)=(f(b)-f(a))x-(b-a)f(x)

Tenemos que g(x) es continua en [a, b] y además es derivable en (a,b). La derivada de g(x) está dada por

g^\prime(x)=f(b)-f(a)-(b-a)f^\prime(x)

Como g(x) es continua en [a, b], tenemos que por el teorema del valor extremo, la función alcanza un máximo y un mínimo en el intervalo [a, b]. Haciendo las cuentas, g(a)=g(b), de modo que si el máximo y mínimo ocurren en los extremos, entonces g es constante y toda c\in (a,b) satisface g'(c)=0

En otro caso, sea c\in(a, b) el valor en donde g(x) alcanza su mínimo o su máximo. Tenemos que g^\prime(c)=0.

Así, como g^\prime(c)=f(b)-f(a)-(b-a)f^\prime(c), tenemos que:

0=f(b)-f(a)-(b-a)f^\prime(c)

(b-a)f^\prime(c)=f(b)-f(a)

f^\prime(c)=\frac{f(b)-f(a)}{b-a}

\square

Alternativamente, en la función anterior pudimos haber aplicado el teorema de Rolle directamente a la función g. En las siguientes entradas veremos aplicaciones de estos resultados a problemas concretos.

Aplicación del teorema del valor extremo a un problema

Problema. Se tiene un circulo de radio r, y una tangente L que pasa por un punto P de la circunferencia. De un punto cualquiera R en la circunferencia se traza una paralela a L que corta a la circunferencia en Q. Determina el área máxima que puede tener el triángulo PQR.

Sugerencia pre-solución. Antes que nada, haz una figura. Usa el teorema del valor extremo para asegurar la existencia del valor máximo. Para ello, necesitarás construir una función continua cuyo valor sea el área buscada. Puedes usar argumentos de simetría para conjeturar cuándo se alcanza el valor máximo.

Solución. Hacemos el siguiente diagrama para entender mejor el problema.

Diagrama del enunciado del problema

Fijémonos que las condiciones de la altura y la base del triángulo PQR se pueden describir mediante la siguiente figura:

Condiciones para la altura y base del triángulo

Notemos que la altura del triángulo está dada por r+h, donde h puede variar entre -r y r. Este dibujo también nos es de ayuda para determinar el valor de la base. Por el teorema de Pitágoras y sabiendo que la distancia del centro C a los puntos R y Q es igual a r, tenemos que la base del triángulo es igual a 2\sqrt{r^2-h^2}.

Así, el área del triángulo está dada por (\sqrt{r^2-h^2})(r+h), pero como h varía, nos conviene ver el área en función de h.

A(h)=\sqrt{r^2-h^2}(r+h),

La función A(h) es una función continua en el intervalo [-r, r].

Notemos que cuando h toma los valores de -r y r, el valor del área es nulo, es decir que en estos valores alcanza el mínimo, lo cual quiere decir que por el teorema del valor extremo, el valor máximo lo alcanza en algún valor en (-r, r).

Si derivamos la función A(h), tenemos

A^\prime(h)=\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}.

Como sabemos que hay un máximo en el intervalo (-r, r) y la derivada en este punto máximo debe ser igual a cero, hacemos A^\prime(h)=0.

Así,

\frac{r^2-rh-2h^2}{\sqrt{r^2-h^2}}=0.

Resolviendo la ecuación tenemos que

h=\frac{r}{2}.

Así, el área máxima del triángulo PQR es

    \[A=\sqrt{r^2-\left(\frac{r}{2}\right)^2}\left(r+\frac{r}{2}\right)=\frac{3\sqrt{3}r^2}{4}.\]

\square

Más ejemplos

Se pueden encontrar más problemas de aplicación del teorema del vaalor extremo en la Sección 6.4 del libro Problem Solving through Problems de Loren Larson.

Álgebra Lineal I: Problemas de rango de transformaciones y matrices.

Introducción

En la entrada del viernes vimos el concepto de rango de una matriz y rango de una transformación lineal, además del muy importante teorema de rango nulidad y la desigualdad de Sylvester. Vimos también, como contenido optativo, el versátil teorema de la factorización PJQ. En esta ocasión nos enfocaremos en resolver problemas de rango que nos servirán para repasar dichos conceptos.

Problemas de rango resueltos

Problema 1. Encuentra el kernel y el rango de la transformación lineal T:\mathbb{R}_2[x] \longrightarrow \mathbb{R}_3[x] definida por

    \[T(f(x))=2f'(x) + \int _{0}^{x} 3f(t)dt.\]

Antes de comenzar a leer la solución, es conveniente que te convenzas de que T es una transformación lineal y que está bien definida, es decir, que en efecto toma un polinomio de grado a lo más dos con coeficientes reales y lo lleva a un polinomio de grado a lo más tres con coeficientes reales.

Solución. Consideremos \mathcal{B}=\{1, x, x^2\} la base canónica de \mathbb{R}_2[x].
Entonces

    \begin{align*}\Ima(T)&=span(\{T(1),T(x),T(x^2)\})\\&= span(\{3x,2+\frac{3}{2}x^2,4x+x^3\}).\end{align*}

Para determinar el rango de \Ima{T}, colocamos a las coordenadas de estas imágenes en la siguiente matriz A,

    \[A=\begin{pmatrix}0 & 3 & 0 & 0\\2 & 0 & \frac{3}{2} & 0\\0 & 4 & 0 & 1 \end{pmatrix}\]

y con el algoritmo de reducción gaussiana llegamos a que

    \[A_{red}=\begin{pmatrix}1 & 0 & \frac{3}{4} & 0\\0 & 1 & 0 & 0\\0 & 0 & 0 & 1 \end{pmatrix}\]

Como A_{red} tiene 3 pivotes se sigue que \rank(T)=3.

Luego, por el teorema de rango nulidad se tiene que

    \begin{align*}3&=\dim(\mathbb{R}_2[x])\\&= \dim (\ker (T))+\rank(T)\\&=\dim(\ker(T))+3.\end{align*}

Así, \dim(\ker(T))=0, por lo tanto \ker(T)=\{0\}

\square

La desigualdad de Sylvester nos ayuda a acotar el rango de una suma de matrices por abajo. La desigualdad

    \[\rank(A+B)\leq \rank(A)+\rank(B)\]

nos ayuda a acotarlo por arriba. Combinar ambas ideas puede ser útil en problemas de rango de matrices.

Problema 2. Sea A\in M_n(\mathbb{C}) una matriz idempotente. Prueba que

    \[rank(A)+rank(I_n-A)=n.\]

Recuerda que una matriz es idempotente si A^2=A.

Solución. Como A^2=A, entonces A(I_n - A)=O_n.
Luego, por la desigualdad de Sylvester se tiene que

    \begin{align*}0&=\rank(O_n)\\&=\rank(A(I_n-A))\\&\geq \rank(A) + \rank(I_n-A)-n, \end{align*}



entonces

    \[rank(A)+rank(I_n-A)\leq n\]

Por otro lado, como para cualesquiera matrices X,Y se tiene
rank(X+Y)\leq rank(X)+rank(Y), entonces

    \[rank(I_n)\leq rank(A) + rank(I_n-A),\]


de modo que

    \[n\leq rank(A)+rank(I_n - A).\]

Combinando ambas desigualdades,

    \[rank(A)+rank(I_n-A)=n.\]

\square

Problema 3. Encuentra el rango de la transformación lineal T:\mathbb{R}_2[x]\longrightarrow M_2(\mathbb{R}) definida por

    \[T(f(x))=\begin{pmatrix}f(1)-f(2) & 0\\0 & f(0)\end{pmatrix}.\]

Solución. Para determinar el rango, basta tomar una base, encontrar la imagen de sus elementos bajo T y determinar cuántos de estos elementos son linealmente independientes. Considera \mathcal{B}=\{1,x,x^2\} la base canónica de \mathbb{R}_2[x]. Tenemos que

    \begin{align*}\Ima(T)&=span(T(\mathcal{B}))\\&=span(\{T(1), T(x), T(x^2)\})\\&=span\left(\left\{ \begin{pmatrix}0 & 0\\0 & 1\end{pmatrix}, \begin{pmatrix}-1 & 0\\0 & 0\end{pmatrix}, \begin{pmatrix}-3 & 0\\0 & 0\end{pmatrix} \right\} \right )\\&=span\left (\left\{ \begin{pmatrix}0 & 0\\0 & 1\end{pmatrix}, \begin{pmatrix}-1 & 0\\0 & 0\end{pmatrix} \right\} \right ).\end{align*}

Notemos también que \mathcal{C}=\left\{ \begin{pmatrix}0 & 0\\0 & 1\end{pmatrix}, \begin{pmatrix}-1 & 0\\0 & 0\end{pmatrix}} \right\} es linealmente independiente.

Por lo tanto \mathcal{C} es una base para \Ima(T) y así \rank(T)=2.

\square

Problema 4. Sean A\in M_{3,2}(\mathbb{R}) y B\in M_{2,3}(\mathbb{R}) matrices tales que

    \[AB=\begin{pmatrix}2 & -2 & -4\\-1 & 3 & 4\\1 & -2 & -3\end{pmatrix}\]

Muestra que BA es la identidad.

El enunciado no parece mostrar que este sea uno de los problemas de rango de matrices. Sin embargo, para poder resolverlo usaremos las herramientas que hemos desarrollado hasta ahora.

Partiremos el problema en los siguientes pasos.

  1. Verificar que (AB)^2=AB y que \rank(AB)=2.
  2. Probar que BA es invertible.
  3. Probar que (BA)^3=(BA)^2 y deducir que BA=I_2.

Solución.

1. Realizamos la operación matricial:

    \[\begin{pmatrix}2 & -2 & -4\\-1 & 3 & 4\\1 & -2 & -3\end{pmatrix}\begin{pmatrix}2 & -2 & -4\\-1 & 3 & 4\\1 & -2 & -3\end{pmatrix}=\begin{pmatrix}2 & -2 & -4\\-1 & 3 & 4\\1 & -2 & -3\end{pmatrix}\]

Ahora, aplicando reducción gaussiana en AB obtenemos que

    \[(AB)_{red}=\begin{pmatrix}1 & 0 & -1\\0 & 1 & 1\\0 & 0 & 0\end{pmatrix}.\]

Como (AB)_{red} tiene sólo dos pivotes, entonces rank(AB)=2.

2. Usando la desigualdad de rango para producto de matrices, obtenemos que

    \begin{align*}\rank(BA)&\geq \rank(A(BA)B)\\&=\rank((AB)^2)\\&=\rank(AB)=2.\end{align*}

Entonces, \rank(BA)\geq 2. Por otro lado, como BA\in M_2(\mathbb{R}), entonces rank(BA)\leq 2. Así, rank(BA)=2 y BA es una matriz en M_2(\mathbb{R}), así que es invertible.

3. Como (AB)^2=AB, entonces B(AB)^2 A=B(AB)A=(BA)^2. Por consiguiente BABABA=(BA)^2 y así (BA)^3=(BA)^2 y como BA es invertible, podemos multiplicar en ambos lados de esta última igualdad por ((BA)^{-1})^2 para obtener BA=I_2.

\square

Seminario de Resolución de Problemas: El teorema del valor intermedio

Introducción

El teorema del valor intermedio nos dice que si f: [a, b] \to \mathbb{R} es una función continua, entonces para todo y entre f(a) y f(b), existe un número c \in [a, b] tal que f(c)=y. La forma de pensar este teorema es que «las funciones continuas no se pueden saltar valores que quedan entre dos valores que ya tomaron», o bien «las funciones continuas no dan brincos en su imagen».

Veamos algunos problemas que se resuelven usando este teorema

Una aplicación directa del teorema del valor intermedio

Problema 1. Muestra que la ecuación 2x^3+7x^2-27x=-18 tiene una solución en el intervalo [-7,-5].

Sugerencia pre-solución. Formula un problema equivalente definiendo una función continua f para la cual si f(x)=0, entonces x es solución a la ecuación.

Solución. La ecuación la podemos ver como 2x^3+7x^2-27x+18=0. Consideremos la función

    \[f(x)=2x^3+7x^2-27x+18.\]

Como f(x) es una función polinomial, sabemos que es continua en \mathbb{R}, así que es continua en el intervalo [-7,-5]. Lo que queremos ver es que existe un c entre -7 y -5, tal que f(c)=0. Para esto, tenemos que evaluar la función en -7 y en -5.

Tenemos que:

f(-7)=-136 y f(-5)=78.

Tenemos que 0 está entre -136 y 78. Así, por el teorema del valor intermedio, debe de existir un número c entre -7 y -5 de tal forma que f(c)=0. Por lo tanto 2x^3+7x^2-27x=-18 tiene una solución entre -5 y -7.

\square

Notemos que no se encontró el valor de la raíz de la ecuación, sin embargo mostramos la existencia de esta. Esta es una de las características del teorema del valor intermedio: exhibir la existencia de algo sin necesidad de encontrarlo explícitamente.

Definir una buena función

En ocasiones podemos definir dos funciones para un problema y hacerlas interactuar para obtener una sola función continua que nos permite resolver un problema.

Problema 2. Un montañista empezó a escalar una montaña el sábado a las 8:00 hrs y llegó a la cima a las 18:00 hrs del mismo día. Decidió pasar la noche en la cima de la montaña. El día domingo empezó a descender a las 8:00 hrs y llegó al punto de partida a las 18:00 hrs. Prueba que hubo una hora en la que en ambos días estuvo a la misma altura de la montaña.

Sugerencia pre-solución. Plantea el problema usando dos funciones continuas que denoten la altura conforme pasa el tiempo en ambos días. Tienes mucha flexibilidad, así que usa notación efectiva para simplificar los cálculos.

Solución. Veamos que para este problema, podemos establecer dos funciones continuas para describir el cambio de altura con respecto al tiempo en horas, una para el ascenso y otra para el descenso del montañista en ambos días.

Sean h_1(t), y h_2(t) las funciones que representan el ascenso y el descenso del montañista respectivamente. En otras palabras, h_1(t) y h_2(t) denotan la altura en la que está el montañista tras t horas después de haber comenzado su ascenso y descenso, respectivamente. Como amabas funciones son continuas en el intervalo de tiempo [0, 10] (esto es porque tardó 10 horas para ascender y 10 horas para descender), tenemos que la función g(t)=h_2(t)-h_1(t) tiene que ser continua en [0, 10] también.

Ahora bien, sea M la altura en la cima de la montaña. Tenemos lo siguiente:

h_1(0)=0, h_1(10)=M y h_2(0)=M, h_2(10)=0.

Así, g(0)=M y g(10)=-M. A su vez, 0 está entre -M y M, por lo que aplicando el teorema del valor intermedio, debe de existir un t_0 en el intervalo [0, 10] tal que g(t_0)=0.

Y como

g(t)=h_2(t)-h_1(t),

entonces

g(t_0)=h_2(t_0)-h_1(t_0)

0=h_2(t_0)-h_1(t_0)

h_1(t_0)=h_2(t_0).

Con esto podemos concluir que en el tiempo t_0 el día domingo estuvo a la misma altura que el día sábado al tiempo t_0.

\square

Definir un buen intervalo

En algunas ocasiones no es directo qué valores tenemos que usar como los extremos del intervalo al que aplicaremos el teorema del valor intermedio. Un ingrediente adicional que se necesita en el siguiente problema es elegir de manera correcta el extremo derecho.

Problema 3. Prueba que si n es un entero positivo y x_0 > 0, entonces existe un único número positivo x tal que x^n=x_0.

Sugerencia pre-solución. Necesitarás modificar el problema un poco. Se quiere encontrar una solución a x^n=x_0. Limítate a encontrarla en el intervalo [0,c] para una buena elección de c.

Solución. Sea c un número mayor que 1 de tal forma que 0<x_0<c. Si consideramos la función f(x)=x^n, tenemos que dicha función es continua en el intervalo [0, c], y tenemos que

f(0)=0 y f(c)=c^n.

Como

    \[0<x_0<c<c^n,\]

tenemos que x_0 está en el intervalo (0,c), y por el teorema del valor intermedio, tenemos que existe x en el intervalo (0,c) tal que f(x)=x_0, que usando la definición de f quiere decir que

    \[x^n=x_0.\]

No puede existir otro además de x_0 ya que la función f(x)=x^n es creciente en el intervalo [0,c].

\square

Más ejemplos

Puedes encontrar más problemas que se pueden resolver usando el teorema del valor intermedio en el libro Problem Solving Strategies de Loren Larson, en la Sección 6.2.