Archivo de la etiqueta: funciones

Álgebra Lineal I: Espacios vectoriales

Introducción

En la primer unidad de este curso de álgebra lineal estudiamos a profundidad al conjunto F^n con sus operaciones de suma y multiplicación por escalar. Luego, hablamos de las matrices en M_{m,n}(F) y vimos cómo pensarlas como transformaciones lineales. Les dimos una operación de producto que en términos de transformaciones lineales se puede pensar como la composición. Luego, hablamos de la forma escalonada reducida de una matriz y cómo llevar cualquier matriz a esta forma usando reducción gaussiana. Esto nos permitió resolver sistemas de ecuaciones lineales homogéneos y no homogeneos, así como encontrar inversas de matrices. Las habilidades desarrolladas en la primer parte del curso serán de mucha utilidad para la segunda, en donde hablaremos de espacios vectoriales.

En esta entrada definiremos el concepto de espacio vectorial y vectores. Para hacer esto, tomaremos como motivación el espacio F^n, que ya conocemos bien. Sin embargo, hay muchos otros ejemplos de objetos matemáticos que satisfacen la definición que daremos. Hablaremos de algunos de ellos.

En el transcurso de la unidad también hablaremos de otros conceptós básicos, como la de subespacio. Hablaremos de conjuntos linealmente independientes, de generadores y de bases. Esto nos llevará a establecer una teoría de la dimensión de un espacio vectorial. Las bases son de fundamental importancia pues en el caso de dimensión finita, nos permitirán pensar a cualquier espacio vectorial «como si fuera F^n «. Más adelante precisaremos en qué sentido es esto.

Después, veremos cómo pasar de un espacio vectorial a otro mediante transformaciones lineales. Veremos que las transformaciones entre espacios vectoriales de dimensión finita las podemos pensar prácticamente como matrices, siempre y cuando hayamos elegido una base para cada espacio involucrado. Para ver que estamos haciendo todo bien, debemos verificar que hay una forma sencilla de cambiar esta matriz si usamos una base distinta, y por ello estudiaremos a las matrices de cambio de base.

Esta fuerte relación que existe entre transformaciones lineales y y matrices nos permitirá llevar información de un contexto a otro. Además, nos permitirá definir el concepto de rango para una matriz (y transformación vectorial). Hasta ahora, sólo hemos distinguido entre matrices invertibles y no invertibles. Las matrices invertibles corresponden a transformaciones lineales que «guardan toda la información». El concepto de rango nos permitirá entender de manera más precisa cuánta información guardan las transformaciones lineales no invertibles.

Recordando a F^n

Antes de definir el concepto de espacio vectorial en toda su generalidad, recordemos algunas de las cosas que suceden con F^n. De hecho, puedes pensar en algo mucho más concreto como \mathbb{R}^4.

Como recordatorio, comenzamos tomando un campo F y dijimos que, para fines prácticos, podemos pensar que se trata de \mathbb{R} y \mathbb{C}. A los elementos de F les llamamos escalares.

Luego, consideramos todas las n-adas de elementos de F y a cada una de ellas le llamamos un vector. A F^n le pusimos una operación de suma, que tomaba dos vectores en F^n y nos daba otro. Además, le pusimos una operación de producto por escalar, la cual tomaba un escalar en F y un vector en F^n y nos daba como resultado un vector. Para hacer estas operaciones procedíamos entrada a entrada.

Sin embargo, hay varias propiedades que demostramos para la suma y producto por escalar, para las cuales ya no es necesario hablar de las entradas de los vectores. Mostramos que todo lo siguiente pasa:

  1. (Asociatividad de la suma) Para cualesquiera vectores u,v,w en F^n se cumple que (u+v)+w=u+(v+w).
  2. (Conmutatividad de la suma) Para cualesquiera vectores u,v en F^n se cumple que u+v=v+u.
  3. (Identidad para la suma) Existe un vector 0 en F^n tal que u+0=u=0+u.
  4. (Inversos para la suma) Para cualquier vector u en F^n existe un vector v en F^n tal que u+v=0=v+u.
  5. (Distributividad para la suma escalar) Para cualesquiera escalares a,b en F y cualquier vector v en F^n se cumple que (a+b)v=av+bv.
  6. (Distributividad para la suma vectorial) Para cualquier escalar a en F y cualesquiera vectores v,w en F^n se cumple que a(v+w)=av+aw.
  7. (Identidad de producto escalar) Para la identidad multiplicativa 1 del campo F y cualquier vector v en F^n se cumple que 1v=v.
  8. (Compatibilidad de producto escalar) Para cualesquiera dos escalares a,b en F y cualquier vector v en F^n se cumple que (ab)v=a(bv).

Los primeros cuatro puntos son equivalentes a decir que la operación suma en F^n es un grupo conmutativo. Resulta que hay varios objetos matemáticos que satisfacen todas estas ocho propiedades o axiomas de espacio vectorial, y cuando esto pasa hay muchas consecuencias útiles que podemos deducir. La esencia del álgebra lineal precisamente consiste en deducir todo lo posible en estructuras que tienen las ocho propiedades anteriores. Estas estructuras son tan especiales, que tienen su propio nombre: espacio vectorial.

Definición de espacio vectorial

Estamos listos para la definición crucial del curso.

Definición. Sea F un campo. Un espacio vectorial sobre el campo F es un conjunto V con operaciones de suma y producto por escalar, que denotaremos por

    \begin{align*}+:& V\times V \to V \quad \text{y}\\\cdot:& F\times V \to V,\end{align*}

para las cuales se cumplen las ocho propiedades de la sección anterior. En otras palabras:

  • El conjunto V es un grupo conmutativo con la suma
  • Se tiene asociatividad para la suma escalar y la suma vectorial
  • Se tiene identidad y compatibilidad de la mulltiplicación escalar.

A los elementos de F les llamamos escalares. A los elementos de F^n les llamamos vectores. Para hacer restas, las definimos como u-v=u+(-v), donde -v es el inverso aditivo de v con la suma vectorial. Usualmente omitiremos el signo de producto escalar, así que escribiremos av en vez de a\cdot v para a escalar y v vector.

La definición da la impresión de que hay que verificar muchas cosas. De manera estricta, esto es cierto. Sin embargo, de manera intuitiva hay que pensar que a grandes rasgos los espacios vectoriales son estructuras en donde podemos sumar elementos entre sí y multiplicar vectores por escalares (externos) sin que sea muy complicado.

Como ya mencionamos, el conjunto F^n con las operaciones de suma y multiplicación por escalar que se hacen entrada por entrada es un espacio vectorial sobre F. En lo que resta de la entrada, hablaremos de otros ejemplos de espacios vectoriales que nos encontraremos frecuentemente.

Espacios vectoriales de matrices

Otros ejemplos de espacios vectoriales con los que ya nos encontramos son los espacios de matrices. Dado un campo F y enteros positivos m y n, el conjunto de matrices en M_{m,n}(F) es un espacio vectorial en donde la suma se hace entrada a entrada y la multiplicación escalar también.

¿Qué es lo que tenemos que hacer para mostrar que en efecto esto es un espacio vectorial? Se tendrían que verificar las 8 condiciones en la definición de espacio vectorial. Esto lo hicimos desde la primer entrada del curso, en el primer teorema de la sección «Operaciones de vectores y matrices». Vuelve a leer ese teorema y verifica que en efecto se enuncian todas las propiedades necesarias.

Aquí hay que tener cuidado entonces con los términos que se usan. Si estamos hablando del espacio vectorial F^n, las matrices no forman parte de él, y las matrices no son vectores. Sin embargo, si estamos hablando del espacio vectorial M_{m,n}(F), entonces las matrices son sus elementos, y en este contexto las matrices sí serían vectores.

Ejemplo. Sea \mathbb{F}_2 el campo con 2 elementos. Consideremos M_{2}(\mathbb{F}_2). Este es un espacio vectorial. Tiene 16 vectores de la forma \begin{pmatrix} a & b \\ c & d \end{pmatrix}, en donde cada entrada es 0 o 1. La suma y la multiplicación por escalar se hacen entrada a entrada y con las reglas de \mathbb{F}_2. Por ejemplo, tenemos

    \[\begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix} + \begin{pmatrix} 0 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}.\]

\square

Espacios vectoriales de funciones

Ahora veremos algunos ejemplos de espacios vectoriales cuyos elementos son funciones. Esto puede parecer algo abstracto, pero en unos momentos veremos algunos ejemplos concretos que nos pueden ayudar a entender mejor.

Sea F un campo y consideremos cualquier conjunto X. Consideremos el conjunto V de todas las posibles funciones de X a F. A este conjunto queremos ponerle operaciones de suma y de multiplicación por escalar.

Para definir la suma, tomemos dos funciones que van de X a F, digamos f:X\to F y g:X\to F. Definiremos a la función f+g como la función que a cada x en X lo manda a f(x)+g(x). Aquí estamos usando la suma del campo F. En símbolos, (f+g):X\to F tiene regla de asignación

    \[(f+g)(x)=f(x)+g(x).\]

Para definir el producto por escalar, tomamos una función f:X\to F y un escalar c en el campo F. La función cf será la función cf:X\to F con regla de asignación

    \[(cf)(x)=cf(x)\]

para todo x en X.

Resulta que el conjunto V de funciones de X a F con estas operaciones de suma y producto, es un espacio vectorial. Podemos probar, por ejemplo, la asociatividad de la suma. Para ello, la primer cosa que necesitamos mostrar es la asociatividad de la suma. Es decir, que si tenemos f:X\to F, g:X\to F y h:X\to F, entonces

    \[(f+g)+h = f+ (g+h).\]

Esta es una igualdad de funciones. Para que sea cierta, tenemos que verificarla en todo el dominio, así que debemos mostrar que para todo x en X tenemos que

    \[((f+g)+h)(x)=(f+(g+h))(x).\]

Para demostrar esto, usemos la definición de suma de funciones y la asociatividad de la suma del campo F. Con ello, podemos realizar la siguiente cadena de igualdades:

    \begin{align*}((f+g)+h)(x)&=(f+g)(x)+h(x)\\&=(f(x)+g(x)) + h(x) \\&=f(x) + (g(x)+h(x)) \\&=f(x) + (g+h)(x)\\&=(f+(g+h))(x).\end{align*}

Así, la suma en V es asociativa. El resto de las propiedades se pueden demostrar con la misma receta:

  • Se enuncia la igualdad de funciones que se quiere mostrar.
  • Para que dicha igualdad sea cierta, se tiene que dar en cada elemento del dominio, así que se evalúa en cierta x.
  • Se prueba la igualdad usando las definiciones de suma y producto por escalar, y las propiedades de campo de F.

Ejemplo. El ejemplo anterior es muy abstracto, pues X puede ser cualquier cosa. Sin embargo, hay muchos espacios de funciones con los cuales se trabaja constantemente. Por ejemplo, si el campo es el conjunto \mathbb{R} de reales y X es el intervalo [0,1], entonces simplemente estamos hablando de las funciones que van de [0,1] a los reales.

Si tomamos f:[0,1]\to \mathbb{R} y g:[0,1]\to \mathbb{R} dadas por

    \begin{align*}f(x)&= \sin x - \cos x\\ g(x) &= \cos x + x^2,\end{align*}

entonces su suma simplemente es la función f+g:[0,1]\to \mathbb{R} definida por (f+g)(x)=\sin x + x^2. Si tomamos, por ejemplo, el escalar 2, entonces la función 2f:[0,1]\to \mathbb{R} no es nada más que aquella dada por

    \[(2f)(x)= 2\sin x - 2\cos x.\]

Así como usamos el intervalo [0,1], pudimos también haber usado al intervalo [-2,2), al (-5,\infty], o a cualquier otro.

\square

Espacios vectoriales de polinomios

Otro ejemplo de espacios vectoriales que nos encontraremos frecuentemente son los espacios de polinomios. Si no recuerdas con precisión cómo se construyen los polinomios y sus operaciones, te recomendamos repasar este tema con material disponible aquí en el blog.

Dado un campo F y un entero positivo n usaremos F[x] para referirnos a todos los polinomios con coeficientes en F y usaremos F_n[x] para referirnos a aquellos polinomios con coeficientes en F y grado a lo más n. Aunque el polinomio cero no tiene grado, también lo incluiremos en F_n[x].

Ejemplo. Si F es \mathbb{C}, el campo de los números complejos, entonces todos los siguientes son polinomios en \mathbb{C}[x]:

    \begin{align*}p(x)&=(2+i)x^6 + (1+i),\\ q(x)&=3x^2+2x+1,\\ r(x)&=5x^7+(1-3i)x^5-1.\end{align*}

Tanto p(x) como q(x) están en \mathbb{C}_6[x], pues su grado es a lo más 6. Sin embargo, r(x) no está en \mathbb{C}_6[x] pues su grado es 7.

El polinomio q(x) también es un elemento de \mathbb{R}[x], pues tiene coeficientes reales. Pero no es un elemento de \mathbb{R}_1[x] pues su grado es demasiado grande.

\square

Recuerda que para sumar polinomios se tienen que sumar los coeficientes de grados correspondientes. Al hacer multiplicación por escalar se tienen que multiplicar cada uno de los coeficientes. De esta forma, si f(x)=x^2+1 y g(x)=x^3+\frac{x^2}{2}-3x-1, entonces

    \[(f+g)(x)=x^3+\frac{3x^2}{2}-3x,\]

y

    \[(6g)(x)=6x^3+3x^2-18x-6.\]

Resulta que F[x] con la suma de polinomios y con el producto escalar es un espacio vectorial. Puedes verificar cada uno de los axiomas por tu cuenta.

Observa que la suma de dos polinomios de grado a lo más n tiene grado a lo más n, pues no se introducen términos con grado mayor que n. Del mismo modo, si tenemos un polinomio con grado a lo más n y lo multiplicamos por un escalar, entonces su grado no aumenta. De esta forma, podemos pensar a estas operaciones como sigue:

    \begin{align*}+:& F_n[x] \times F_n[x] \to F_n[x]\\\cdot: & F\times F_n[x] \to F_n[x].\end{align*}

De esta forma, F_n[x] con la suma de polinomios y producto escalar de polinomios también es un espacio vectorial.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • A partir de los axiomas de espacio vectorial, muestra lo siguiente para un espacio vectorial V:
    • La identidad de la suma vectorial es única, es decir, que si existe otro elemento e en V tal que u+e=u=e+u para todo u en V, entonces e=0.
    • Que si 0 es la identidad aditiva del campo F y v es cualquier vector en V, entonces 0v es la identidad de la suma vectorial. En símbolos, 0v=0, donde el primer 0 es el de F y el segundo el de V.
    • Se vale la regla de cancelación para la suma vectorial, es decir, que si u,v,w son vectores en V y u+v=u+w, entonces v=w.
    • Se vale la regla de cancelación para el producto escalar, es decir, que si a es un escalar no cero del campo F y u,v son vectores de V para los cuales au=av, entonces u=v.
    • Que el inverso aditivo de un vector v para la suma vectorial en V es precisamente (-1)v, es decir, el resultado de hacer la multiplicación escalar de v con el inverso aditivo del 1 del campo F.
  • Sea V un espacio vectorial sobre \mathbb{R}. Sean u, v y w vectores en V. Justifica la siguiente igualdad enunciando de manera explícita todos los axiomas de espacio vectorial que uses

        \[u+5v-3w+2u-8v= -3(w+v-u).\]

  • Termina de demostrar que en efecto los espacios de funciones con la suma y producto escalar que dimos son espacios de funciones.
  • Enlista todos los polinomios de (\mathbb{F}_2)_3[x]. A continuación hay algunos:

        \[0, x+1, x^2+x, x^3+1.\]

    Para cada uno de ellos, encuentra quien es su inverso aditivo para la suma vectorial de (\mathbb{F}_2)_3[x].

Más adelante…

Ya dimos la definición de espacio vectorial y vimos varios ejemplos. Dentro de algunas entradas veremos como conseguir muchos más espacios vectoriales.

En el último ejemplo pasa algo curioso: el espacio F_n[x] es un subconjunto del espacio F[x] y además es un espacio vectorial con las mismas operaciones que F[x]. Este es un fenómeno muy importante en álgebra lineal. Decimos que F_n[x] es un subespacio de F[x]. En la siguiente entrada definiremos en general qué es un subespacio de un espacio vectorial y veremos algunas propiedades que tienen los subespacios.

Entradas relacionadas

Seminario de Resolución de Problemas: El teorema del valor medio

Introducción

Las funciones continuas son bonitas pues tienen la propiedad del valor intermedio y además alcanzan sus valores extremos. Las funciones diferenciables en un intervalo también tienen un par de teoremas que hablan acerca de algo que sucede «dentro del intervalo». Estos son el teorema de Rolle, del cual platicamos en la entrada anterior, y el teorema del valor medio. Ambos nos permiten encontrar en el intervalo un punto en el que la derivada tiene un valor específico.

Teorema de Rolle. Sean a<b reales y f:[a,b]\to \mathbb{R} una función continua en el intervalo [a,b] y diferenciable en el intervalo (a,b). Supongamos que f(a)=f(b). Entonces existe un punto c\in (a,b) tal que f'(c)=0.

Teorema del valor medio. Sean a<b reales y f:[a,b]\to \mathbb{R} una función continua en el intervalo [a,b] y diferenciable en el intervalo (a,b). Entonces existe un punto c\in (a,b) tal que

    \[f'(c)=\frac{f(b)-f(a)}{b-a}.\]

En la entrada anterior vimos aplicaciones del teorema de Rolle a resolución de problemas matemáticos. En esta entrada hablaremos brevemente de la intuición geométrica del teorema del valor medio, de algunas de sus consecuencias inmediatas y de cómo usar al teorema y sus consecuencias para resolver problemas concretos.

La intuición geométrica del teorema del valor medio

El teorema del valor medio dice que una función diferenciable en (a,b) y continua en [a,b] cumple que hay un punto c tal que el valor de la derivada en c es igual a la pendiente de la recta que une los puntos del plano (a,f(a)) y (b,f(b)). En la siguiente figura, se marca en azul el punto c en donde la pendiente de la tangente es lo que queremos, es decir, la pendiente entre los puntos rojos.

Intuición geométrica del teorema del valor medio
Intuición geométrica del teorema del valor medio

En varios problemas en los que se usa el teorema del valor medio, o bien en los cuales se pide demostrar enunciados parecidos a lo que dice el teorema del valor medio, es conveniente hacer una figura para entender la intuición geométrica del problema.

Consecuencias del teorema del valor medio

Si f y g son funciones continuas en [a,b] y diferenciables en (a,b) entonces se pueden deducir los siguientes resultados a partir del teorema del valor medio. No profundizamos en las demostraciones, y dejamos su verificación como un ejercicio de práctica.

Proposición. Si f'(x)=0 para toda x en (a,b), entonces f es constante.

Proposición. Si f'(x)=g'(x) para toda x en (a,b), entonces existe una constante c tal que f(x)=g(x)+c para toda x.

Proposición. Si f'(x)>0 para toda x en (a,b), entonces f es una función estrictamente creciente. Si f'(x)<0 en (a,b), entonces f es una función estrictamente decreciente.

Cuando f'(x)\geq 0 y f'(x)\leq 0, tenemos resultados análogos que dicen que es no decreciente y no creciente, respectivamente.

Veamos algunas aplicaciones de los resultados anteriores.

Problema. Sean f:\mathbb{R}\to \mathbb{R} y g:\mathbb{R}\to \mathbb{R} funciones tales que para todo par de reales x y y se cumple que

    \[|f(x)+g(y)-f(y)-g(x)|\leq (x-y)^2.\]

Demuestra que f y g varían sólo por una constante aditiva.

Sugerencia pre-solución. Identifica cuál de las proposiciones anteriores puedes usar. Hay que tener cuidado con las hipótesis, pues en el enunciado no se habla de la diferenciabilidad de ninguna de las funciones involucradas.

Solución. Podría ser tentador usar la segunda proposición que enunciamos arriba, pero no tenemos hipótesis acerca de la diferenciabilidad de f o de g. Sin embargo, vamos a mostrar que sí se puede mostrar que f-g es diferenciable en todo real, y que su derivada es 0 en todo real. Para ello, definamos h=f-g y notemos que la hipótesis dice que |h(x)-h(y)|\leq (x-y)^2.

A partir de aquí, notemos que por la hipótesis, para x\neq y,

    \[\frac{|h(y)-h(x)|}{|y-x|}\leq \frac{(y-x)^2}{|y-x|} =  |y-x|,\]

y el límite de esta última expresión conforme y\to x es 0, de modo que

    \[\left|\lim_{y\to x} \frac{h(y)-h(x)}{y-x}\right|=\lim_{y\to x}  \frac{|h(y)-h(x)|}{|y-x|} = 0.\]

Esto muestra que para cualquier x se tiene que h es diferenciable en x y su derivada es igual 0 en todo x. De este modo, h es una función constante, y por lo tanto existe un c tal que f(x)=g(x)+c para todo x.

\square

Veamos cómo el teorema del valor medio nos puede ayudar a demostrar desigualdades.

Problema. Sea f:\mathbb{R}\to \mathbb{R} una función dos veces diferenciable tal que f''(x)\geq 0 para todo x. Demuestra que para todo par de reales a y b con a<b se tiene que

    \[f\left(\frac{a+b}{2}\right) \leq \frac{f(a)+f(b)}{2}.\]

Sugerencia pre-solución. Haz una figura para convencerte de que el resultado es cierto. En el enunciado del problema, la función está siendo enunciada en tres valores, a, b y \frac{a+b}{2}. Esto te dará una pista de dónde usar el teorema del valor medio.

Solución. Por el teorema del valor medio, existe un real r en el intervalo \left(a,\frac{a+b}{2}\right) para el cual

    \[\frac{f\left(\frac{a+b}{2}\right)-f(a)}{\frac{a+b}{2}-a} = f'(r).\]

De manera similar, existe un real s en el intervalo \left(\frac{a+b}{2},b\right) para el cual

    \[\frac{f(b)-f\left(\frac{a+b}{2}\right)}{b-\frac{a+b}{2}} = f'(s).\]

Como f''(x)>0 para todo real x, tenemos que f' es una función creciente, y como r<s, tenemos entonces que f'(r)<f'(s). De esta forma,

    \[\frac{f\left(\frac{a+b}{2}\right)-f(a)}{\frac{a+b}{2}-a}<\frac{f(b)-f\left(\frac{a+b}{2}\right)}{b-\frac{a+b}{2}}.\]

Notemos que el denominador de ambos lados es \frac{b-a}{2}. Cancelando los denominadores y reacomodando los términos en esta desigualdad, obtenemos la desigualdad deseada.

\square

Problemas resueltos con el teorema del valor medio y otras técnicas

Veamos algunos problemas que combinan el teorema del valor medio con otras técnicas de solución de problemas.

Problema. Sea f(x) una función diferenciable en (0,1) y continua en [0,1] con f(0)=0 y f(1)=1. Muestra que existen puntos distintos a,b,c,d en el intervalo [0,1] tales que

    \[\frac{1}{f'(a)}+ \frac{1}{f'(b)} + \frac{1}{f'(c)} + \frac{1}{f'(d)} = 4.\]

Sugerencia pre-solución. Para resolver el problema, hay que combinar el teorema del valor medio con el teorema del valor intermedio. El primer paso del problema es encontrar reales p<q<r tales que f valga en ellos 1/4, 2/4 y 3/4.

Solución. Como f(0)=0, f(1)=1 y 0<1/4<1, por el teorema del valor intermedio existe un real p en (0,1) tal que f(p)=1/4. De manera similar, existe un real q en (p,1) tal que f(q)=2/4 y un real r en (q,1) tal que f(r)=3/4.

Aplicando el teorema del valor medio a los intervalos [0,p], [p,q], [q,r] y [r,1] obtenemos reales a,b,c,d respectivamente tales que

    \begin{align*}f'(a)&=\frac{f(p)-f(0)}{p-0}=\frac{1/4}{p}\\f'(b)&=\frac{f(q)-f(p)}{q-p}=\frac{1/4}{q-p} \\ f'(c)&=\frac{f(r)-f(q)}{r-q}=\frac{1/4}{r-q} \\ f'(d)&=\frac{f(1)-f(r)}{1-r}=\frac{1/4}{1-r}. \end{align*}

Estos son los valores de a,b,c,d que queremos pues

    \begin{align*} \frac{1}{f'(a)}+ \frac{1}{f'(b)} + \frac{1}{f'(c)} + \frac{1}{f'(d)} &= 4(1-r+r-q+q-p+p)\\&=4.\end{align*}

\square

Problema. Sean a, b y c números distintos. Muestra que la siguiente expresión

    \[\frac{(x-a)(x-b)}{(c-a)(c-b)}+ \frac{(x-b)(x-c)}{(a-b)(a-c)} + \frac{(x-c)(x-a)}{(b-c)(b-c)}\]

no depende del valor de x.

Sugerencia pre-solución. Encuentra la derivada de la expresión. Puedes aprovechar la simetría para hacer menos cuentas.

Solución. Usando la regla del producto, la derivada del primer sumando es

    \begin{align*}\frac{(x-a)+(x-b)}{(c-a)(c-b)}&=\frac{(2x-a-b)(b-a)}{(a-b)(b-c)(c-a)}\\&=\frac{2x(b-a)+a^2-b^2}{(a-b)(b-c)(c-a)}.\end{align*}

Por simetría, las derivadas de los otros dos términos tienen el mismo denominador que esta y en el numerador tienen, respectivamente,

    \begin{align*}&2x(c-b)+b^2-c^2\quad \text{y}\\&2x(a-c)+c^2-a^2,\end{align*}

de modo que al sumar las tres expresiones obtenemos cero. Así, la derivada de la expresión es cero y por lo tanto es constante.

\square

Hay otro argumento para resolver el problema anterior, que usa teoría de polinomios. A grandes rasgos, la expresión es un polinomio de grado 2, que toma tres veces el valor 1, de modo que debe ser igual al polinomio constante 1.

Más problemas

Hay más ejemplos de problemas relacionados con el teorema del valor medio en la Sección 6.6 del libro Problem Solving through Problems de Loren Larson.

Seminario de Resolución de Problemas: El teorema del valor intermedio

Introducción

El teorema del valor intermedio nos dice que si f: [a, b] \to \mathbb{R} es una función continua, entonces para todo y entre f(a) y f(b), existe un número c \in [a, b] tal que f(c)=y. La forma de pensar este teorema es que «las funciones continuas no se pueden saltar valores que quedan entre dos valores que ya tomaron», o bien «las funciones continuas no dan brincos en su imagen».

Veamos algunos problemas que se resuelven usando este teorema

Una aplicación directa del teorema del valor intermedio

Problema 1. Muestra que la ecuación 2x^3+7x^2-27x=-18 tiene una solución en el intervalo [-7,-5].

Sugerencia pre-solución. Formula un problema equivalente definiendo una función continua f para la cual si f(x)=0, entonces x es solución a la ecuación.

Solución. La ecuación la podemos ver como 2x^3+7x^2-27x+18=0. Consideremos la función

    \[f(x)=2x^3+7x^2-27x+18.\]

Como f(x) es una función polinomial, sabemos que es continua en \mathbb{R}, así que es continua en el intervalo [-7,-5]. Lo que queremos ver es que existe un c entre -7 y -5, tal que f(c)=0. Para esto, tenemos que evaluar la función en -7 y en -5.

Tenemos que:

f(-7)=-136 y f(-5)=78.

Tenemos que 0 está entre -136 y 78. Así, por el teorema del valor intermedio, debe de existir un número c entre -7 y -5 de tal forma que f(c)=0. Por lo tanto 2x^3+7x^2-27x=-18 tiene una solución entre -5 y -7.

\square

Notemos que no se encontró el valor de la raíz de la ecuación, sin embargo mostramos la existencia de esta. Esta es una de las características del teorema del valor intermedio: exhibir la existencia de algo sin necesidad de encontrarlo explícitamente.

Definir una buena función

En ocasiones podemos definir dos funciones para un problema y hacerlas interactuar para obtener una sola función continua que nos permite resolver un problema.

Problema 2. Un montañista empezó a escalar una montaña el sábado a las 8:00 hrs y llegó a la cima a las 18:00 hrs del mismo día. Decidió pasar la noche en la cima de la montaña. El día domingo empezó a descender a las 8:00 hrs y llegó al punto de partida a las 18:00 hrs. Prueba que hubo una hora en la que en ambos días estuvo a la misma altura de la montaña.

Sugerencia pre-solución. Plantea el problema usando dos funciones continuas que denoten la altura conforme pasa el tiempo en ambos días. Tienes mucha flexibilidad, así que usa notación efectiva para simplificar los cálculos.

Solución. Veamos que para este problema, podemos establecer dos funciones continuas para describir el cambio de altura con respecto al tiempo en horas, una para el ascenso y otra para el descenso del montañista en ambos días.

Sean h_1(t), y h_2(t) las funciones que representan el ascenso y el descenso del montañista respectivamente. En otras palabras, h_1(t) y h_2(t) denotan la altura en la que está el montañista tras t horas después de haber comenzado su ascenso y descenso, respectivamente. Como amabas funciones son continuas en el intervalo de tiempo [0, 10] (esto es porque tardó 10 horas para ascender y 10 horas para descender), tenemos que la función g(t)=h_2(t)-h_1(t) tiene que ser continua en [0, 10] también.

Ahora bien, sea M la altura en la cima de la montaña. Tenemos lo siguiente:

h_1(0)=0, h_1(10)=M y h_2(0)=M, h_2(10)=0.

Así, g(0)=M y g(10)=-M. A su vez, 0 está entre -M y M, por lo que aplicando el teorema del valor intermedio, debe de existir un t_0 en el intervalo [0, 10] tal que g(t_0)=0.

Y como

g(t)=h_2(t)-h_1(t),

entonces

g(t_0)=h_2(t_0)-h_1(t_0)

0=h_2(t_0)-h_1(t_0)

h_1(t_0)=h_2(t_0).

Con esto podemos concluir que en el tiempo t_0 el día domingo estuvo a la misma altura que el día sábado al tiempo t_0.

\square

Definir un buen intervalo

En algunas ocasiones no es directo qué valores tenemos que usar como los extremos del intervalo al que aplicaremos el teorema del valor intermedio. Un ingrediente adicional que se necesita en el siguiente problema es elegir de manera correcta el extremo derecho.

Problema 3. Prueba que si n es un entero positivo y x_0 > 0, entonces existe un único número positivo x tal que x^n=x_0.

Sugerencia pre-solución. Necesitarás modificar el problema un poco. Se quiere encontrar una solución a x^n=x_0. Limítate a encontrarla en el intervalo [0,c] para una buena elección de c.

Solución. Sea c un número mayor que 1 de tal forma que 0<x_0<c. Si consideramos la función f(x)=x^n, tenemos que dicha función es continua en el intervalo [0, c], y tenemos que

f(0)=0 y f(c)=c^n.

Como

    \[0<x_0<c<c^n,\]

tenemos que x_0 está en el intervalo (0,c), y por el teorema del valor intermedio, tenemos que existe x en el intervalo (0,c) tal que f(x)=x_0, que usando la definición de f quiere decir que

    \[x^n=x_0.\]

No puede existir otro además de x_0 ya que la función f(x)=x^n es creciente en el intervalo [0,c].

\square

Más ejemplos

Puedes encontrar más problemas que se pueden resolver usando el teorema del valor intermedio en el libro Problem Solving Strategies de Loren Larson, en la Sección 6.2.

Un problema de saltamontes en cuarentena

Nota de Leo: Esta es una entrada invitada de Adán Medrano Martín del Campo. Nos platicará de un problema de saltamontes (de hecho, de dos) y de funciones en los enteros.

    \[\text{Tu}\in \text{Casa}\]

    \[\text{Tu}\in \text{Casa}\]

    \[\text{Tu}\in \text{Casa}\]

Esto nos aconsejó muy atinadamente el Dr. Hugo López-Gatell Ramírez hace unos pocos días, ya que México y la mayoría del mundo está en cuarentena a causa de la enfermedad COVID19.

Cada vez más y más personas buscamos nuevas actividades para hacer en casa. Junto con Leo Martínez, David Torres (aka Gato) y Pablo Meré, administro el grupo de facebook InsOMMnia, el cual sirve de plataforma para discutir y realizar actividades olímpicamente productivas. A modo de amenizar la cuarentena, hice un video en vivo explicando la solución a un problema que me pareció particularmente agradable por varias razones:

En esta entrada, quisiera platicarles el problema y su solución. Antes de esto, recordemos el problema que apareció en la OMM 2019.

La Momia: OMM 2019

Problema 5. Sean a>b dos números enteros positivos, primos relativos entre sí. En un camino recto, en el cual está marcado cada centímetro n, para todo entero n, un saltamontes hará algunos saltos comenzando en la marca de 0 cm y siguiendo las siguientes reglas:

  • Cuando cierto minuto sea múltiplo de a y no múltiplo de b, saltará a centímetros hacia adelante.
  • Cuando cierto minuto sea múltiplo de b y no múltiplo de a, saltará b centímetros hacia atrás.
  • Cuando cierto minuto sea múltiplo de a y múltiplo de b, saltará a-b centímetros hacia adelante.
  • Cuando un minuto no es múltiplo de a ni de b, el saltamontes no se mueve del lugar en el que está.

Determina todas las marcas a las que puede llegar el saltamontes.

Nota de Leo: Este es un excelente problema para explorarse buscando un patrón.

Sin dar un spoiler de la solución a dicho problema, el enunciado puede traducirse al siguiente problema de equivalente.

Problema 5′: Sean a>b enteros primos positivos primos relativos entre sí y sea f:\mathbb{N}\to\mathbb{Z} la función dada por

    \[f(n)=a\left\lfloor\frac{n}{a}\right\rfloor-b\left\lfloor\frac{n}{b}\right\rfloor.\]


Determina la imagen de f.

Uno puede jugar un poco con la función definida arriba, y llegar a la respuesta usando propiedades de dicha función. El objetivo de mostrarles este enunciado equivalente, es que muchas veces ciertos problemas que hablan de ciertos procesos pueden describirse (y resolverse) en términos de funciones construidas apropiadamente.

El problema que resolveremos cae en la categoría opuesta, pues es un problema sobre una función, al cual se le puede dar una interpretación de un saltamontes haciendo… algo.

El Vampiro: Romania TST 2019

Problema: Sean a<b<c enteros positivos y sea f:\mathbb{N}\to \mathbb{N} una función dada por

    \[f(n)=\begin{cases}n-a & n>c \\f(f(n+b)) & n\leq c\end{cases}\]


Determina la cantidad de enteros positivos n tales que f(n)=n.

«Y eso qué tiene que ver con un saltamontes?» podrías pensar en este momento. ¡Ha ha! Mira ahora este problema de saltamontes.

Problema’: Sean a<b<c enteros positivos. Un saltamontes se encuentra sobre un entero n>0 en la recta real positiva, donde hay pasto en los enteros positivos menores o iguales que c, y lava en los enteros mayores a c. Inicialmente, el saltamontes tiene una vida, y mientras el saltamontes tenga al menos una vida, se dispondrá a saltar de la siguiente manera:

  • Si el saltamontes se encuentra en el pasto, el saltamontes gana una vida y salta b enteros hacia adelante.
  • Si el saltamontes se encuentra en la lava, el saltamontes pierde una vida y salta a enteros hacia atrás.

Cuando el saltamontes tiene 0 vidas, este muere y deja de moverse. Determina todas las posiciones iniciales del saltamontes tal que el saltamontes morirá en su posición inicial.

Saltamontes, lava, pasto y vidas
Problema visto como vidas, pasto, lava y saltamontes.

A que no se lo esperaban. (Honestamente yo tampoco, pero últimamente tengo más tiempo libre). Tal vez este problema inspire algún mini juego en alguna entrega futura de The Legend of Zelda.

Y, ¿cómo resolvemos algo así?

El Santo: venciendo a la momia y al vampiro

Spoiler Alert:

A continuación resolveremos los problemas, en caso que estés intentándolos y no quieras ver sus soluciones

La clave para ambos problemas es: ¡usar residuos y propiedades de las funciones en juego!

Solución al problema 5 del nacional

Notemos que al dividir n entre a y entre b, obtenemos

    \[n=a\left\lfloor \frac{n}{a}\right\rfloor+r_{a}\]

y

    \[n=b\left\lfloor \frac{n}{b}\right\rfloor+r_{b}\]


donde

    \[0\leq r_{a}\leq a-1\]

y

    \[0\leq r_{b}\leq b-1\]


son precisamente los residuos que resultan de la división. Notemos entonces que

    \begin{align*}f(n)&=a\left\lfloor\frac{n}{a}\right\rfloor-b\left\lfloor\frac{n}{b}\right\rfloor\\&=\left(n-b\left\lfloor \frac{n}{b}\right\rfloor\right)-\left(n-a\left\lfloor \frac{n}{a}\right\rfloor\right)\\&=r_{b}-r_{a}\end{align*}



por lo que f(n) simplemente depende de la diferencia entre r_{b} y r_{a}. Por el Teorema Chino del Residuo, o simplemente mirando exclusivamente a los múltiplos de a y de b entre 1 y ab, aparecen como diferencia todos los posibles enteros en el intervalo

    \[[-a+1, b-1]\]


lo cual compone la imagen de f, que es lo que buscábamos.

\square

¡Genial! Mirar los residuos fue clave en el problema de saltamontes del nacional. En particular, no lo usamos en nuestra solución, pero f resulta ser una función periódica, con periodo ab. Esto es gracias a que a y b son primos relativos, y por lo tanto cada pareja de residuos r_{a}, r_{b} se repiten exactamente cada ab enteros.

La periodicidad será una propiedad clave en la solución del problema del selectivo rumano. Comenzamos mostrando una exploración del problema.

Exploración del problema del selectivo rumano

Los puntos n tales que f(n)=n son llamados puntos fijos. En la formulación como problema de saltamontes, corresponden a que el saltamontes muera justo donde empezó: «muera» es que ya no haya f, empieza con una vida, osea una f.

Notemos que si n>c, entonces n no es un punto fijo, pues

    \[f(n)=n-a\neq n.\]


Esto nos dice que los puntos fijos son menores o iguales que c. Ahora, notemos que (recordemos que a<b<c)

    \begin{align*}f(c)&=f(f(c+b))\\&=f(c+b-a)=c+b-2a\end{align*}

y esto nos lleva a considerar que números cercanos a c, dentro de un intervalo de tamaño b-a, tendrán un valor similar. En efecto, si 0\leq r<b-a entonces

    \begin{align*}f(c-r)&=f(f(c-r+b))\\&=f(c-r+b-a)\\&=c-r+b-2a.\end{align*}


Ahora, veamos que restando b-a a c, perdemos este patrón, pues

    \begin{align*}f(c-b+a)&=f(f(c+a))\\&=f(c)\\&=c+b-2a\end{align*}


¡Hemos regresado a un valor ya conocido! Esto nos lleva a la hipótesis de que f es periódica con periodo b-a en el intervalo [1, c]. Formalicemos estas observaciones.

Un par de lemas para el problema rumano

La manera de enunciar formalmente las observaciones anteriores esto es, por ejemplo, via el siguiente lema:

Lema 1: Sea n=c-r-k(b-a) un entero positivo menor o igual que c donde k\geq 0 y 0\leq r<b-a. Entonces

    \[f(n)=c-r+b-2a.\]

(Prueba del lema 1): Procederemos por descenso en los enteros positivos. Construiremos una secuencia de valores iguales, con distinta cantidad de f‘s compuestas, de la siguiente manera: comenzamos con

    \[z_{0}=n=c-r-k(b-a)\]


y definimos

    \[z_{i+1}=\begin{cases}z_{i}-a & z_{i}>c \\z_{i}+b & z_{i}\leq c\end{cases}\]



para todo i\geq 0. Además, escribiremos

    \[z_{i}=c-r-y_{i}b+x_{i}a\]


donde x_{0}=y_{0}=k, y ambas secuencias \left\{x_{i}\right\} y \left\{y_{i}\right\} decrecen, definiendo

    \[x_{i+1}=\begin{cases}x_{i}-1 & z_{i}>c \\x_{i} & z_{i}\leq c\end{cases}\]

y

    \[y_{i+1}=\begin{cases}y_{i} & z_{i}>c \\y_{i}-1 & z_{i}\leq c\end{cases}\]


Habiendo definido esto, tenemos que

    \[f(n)=f^{(1+x_{i}-y_{i})}(z_{i})\]


para todo i\geq 0.


Observemos que si y_{i}=-1 entonces z_{i}=c-r+b+x_{i}a>c si se cumple que x_{i}\geq -1. Más aún, observemos el siguiente lema:

Lema 2: Para todo i\geq 0, tenemos que y_{i}\geq 0 implica que y_{i+1}\leq x_{i+1}.

(Prueba del lema 2): Procedemos por inducción. Para i=0 esto es claro, pues

    \[y_{1}=k-1<k=x_{1}.\]


Ahora, supongamos que x_{i}\geq y_{i}\geq 0. Si x_{i}>y_{i} entonces

    \[x_{i+1}\geq x_{i}-1\geq y_{i}\geq y_{i+1}.\]


Si x_{i}=y_{i} entonces tenemos que

    \[z_{i}=c-r-y_{i}(b-a)\leq c\]


por lo que z_{i+1}=z_{i}+b y esto implica que

    \[x_{i+1}=x_{i}>y_{i}-1=y_{i+1}.\]

\square

Hemos probado pues que las secuencias \left\{x_{i}\right\} y \left\{y_{i}\right\} decrecen, y mientras y_{i}\geq 0, tendremos que x_{i+1}\geq y_{i+1}. ¿Cómo hemos de proseguir con esto?

La clave es notar la existencia de la menor m tal que y_{m}=-1, donde es claro que y_{m-1}=0. Si m=1 entonces y_{0}=x_{0}=k=0, y ya hemos cubierto ese caso arriba, así que asumiremos que m>1. Tenemos que y_{m-2}\geq 0 por lo que, por el lema 2,

    \[x_{m-1}\geq y_{m-1}=0\]


y como y_{m}=y_{m-1}-1 entonces x_{m}=x_{m-1}\geq 0. Esto implica que

    \begin{align*}z_{m}&=c-r+b+x_{m}a\\&\geq c-r+b\\&>c\end{align*}


por lo que para todo j>m se tiene que x_{j+1}=x_{j}-1

    \[z_{m+x_{m}+1}=c-r+b-a\]


y tenemos que y_{m+x_{m}+1}=x_{m+x_{m}+1}=-1, lo que muestra que

    \begin{align*}f(n)&=f(z_{m+x_{m}+1})\\&=f(c-r+b-a)\\&=c-r+b-2a.\end{align*}

\square

Juntando todo

Vaya, después de arduo trabajo hemos mostrado la periodicidad de f. Lo que falta únicamente, es usar esto para hacer una conclusión sobre los puntos fijos. Notemos que los únicos valores de f en el dominio [1, c] son c-r+b-2a para 0\leq r<b-a, así que solo estos valores pueden ser puntos fijos de f. De hecho, cada uno de esos valores es un punto fijo si y solo si podemos encontrar una k\geq 0 tal que

    \[c-r-k(b-a)=c-r+b-2a\]

, lo cual sucede si y sólo si (k+1)(b-a)=a, o bien justo cuando b-a\mid a, por lo que si b-a divide a a, todos nuestros b-a valores son puntos fijos, y si b-a no divide a a, ningún valor es un punto fijo. Hemos concluido entonces.

\square

Antes de regresar a la cuarentena

Espero que hayan pasado un rato agradable pensando en este problema, y espero que hayan entendido 4 lecciones:

  • Quédate en casa
  • Quédate en casa
  • Quédate en casa
  • Es una buena idea usar residuos y secuencias jugando con enteros.

Con esto me despido y, ¡hasta la próxima!

Álgebra Lineal I: Transformaciones lineales

Introducción

En entradas pasadas ya platicamos de espacios vectoriales y de subespacios. También desarrollamos teoría de dimensión para espacios vectoriales de dimensión finita. Para ello, hablamos de conjuntos generadores, de independientes y de bases. Esto nos ayuda a entender a los espacios vectoriales «uno por uno». Lo que queremos entender ahora es cómo interactúan los espacios vectoriales entre sí. Para ello, hablaremos de transformaciones lineales entre espacios vectoriales.

Ya platicamos un poco de transformaciones lineales cuando estudiamos F^n a detalle. En esa parte del curso, vimos cómo cualquier matriz en M_{m,n}(F) se podía ver como una transformación lineal de F^n a F^m y viceversa. Retomaremos varias de estas ideas, pues son fundamentales para esta unidad y las siguientes.

La idea de esta entrada es:

  • Dar la intuición y definición de transformaciones lineales en general
  • Probar propiedades básicas de las transformaciones lineales
  • Dar varios ejemplos de transformaciones lineales
  • Dar las definiciones de kernel (o núcleo) y de imagen para una transformación lineal.
  • Ver un ejemplo que abarque ambas definiciones
  • Finalmente, probar que el kernel y la imagen son subespacios vectoriales.

A grandes rasgos, las transformaciones lineales se pueden pensar como «funciones bonitas» entre espacios vectoriales que «preservan las operaciones de suma y multiplicación por escalar».

Definición de transformaciones lineales

Definición. Para V y W espacios vectoriales sobre un campo F, una transformación lineal entre V y W es una función T:V\to W tal que:

  • Para todo v_1 y v_2 en V se tiene que T(v_1+v_2)=T(v_1)+T(v_2). Esto informalmente se le conoce como que «T abre sumas».
  • Para todo v en V y c en el campo F se tiene que T(cv)=cT(v). A esto se le conoce como que «T saca escalares».

En la primer condición la suma de la izquierda (dentro del paréntesis) es «la suma de V» y la suma de la derecha es «la suma de W«. De manera similar, en la segunda condición el producto por escalar de la izquierda (dentro del paréntesis) es el de V y el de la derecha es el de W.

En lo que resta de esta entrada, supondremos que los espacios vectoriales son sobre un mismo campo F.

Ejemplos de tranformaciones lineales

Ejemplo. La función T:\mathbb{R}^2 \to \mathbb{R} dada por T(x,y)=x+y+1 no es una transformación lineal. De hecho falla en ambas condiciones. Falla en abrir sumas pues, por ejemplo, T(1,1)=3, T(2,2)=5, pero (1,1)+(2,2)=(3,3) y

    \[T(3,3)=7\neq 5 = T(1,1)+T(2,2.)\]

También falla en sacar escalares pues, por ejemplo

    \[T(4,2)=7\neq 8 = 2T(2,1).\]

\square

Ejemplo. La función T:\mathbb{R}^3 \to \mathbb{R}^3 dada por T(x,y,z)=(2x,2y,2z) es una transformación lineal.

Para convencernos de que esto es cierto, notemos que si v=(x,y,z) entonces la transformación está dada por T(v)=2v. Ahora, tomemos dos vectores v_1 y v_2 en V, y un real c. Tenemos por la asociatividad y conmutatividad de multiplicar por escalares en \mathbb{R}^3 que:

    \begin{align*}T(v_1+v_2)&=2(v_1+v_2)\\&=2v_1+2v_2\\&=T(v_1)+T(v_2),\end{align*}

y que

    \[T(cv_1)=2(cv_1)=c(2v_1)=cT(v_1).\]

Esto muestra que T es transformación lineal.

\square

Ejemplo. De hecho, para cualquier espacio vectorial V sobre el campo F y c un escalar de F, la función T:V\to V dada por T(v)=cv es una transformación lineal. El argumento es similar.

\square

Recuerda que F_n[x] es el espacio vectorial de polinomios con coeficientes en F y grado a lo más n. Recuerda también que hemos visto muchos tipos de espacios vectoriales, los F^n, los de polinomios, los de matrices, etc. Entre cualesquiera de ellos se pueden tener transformaciones lineales. La única condición es que sean espacios vectoriales sobre el mismo campo F.

Ejemplo. La función T:\mathbb{R}^2\to \mathbb{R}_2[x] que manda al vector (a,b) al polinomio x^2+(a-b)x+ab no es una transformación lineal. Esto lo podemos verificar viendo que falla la parte de sacar escalares. Por un lado

    \[2(T(1,1))=2(x^2+1)=2x^2+2,\]

mientras que por otro lado

    \[T(2,2)=x^2+4,\]

así que 2(T(1,1))\neq T(2,2), de modo que T no saca escalares.

\square

En cambio, si tomamos la función que manda al vector (a,b) al polinomio x^2+(a-b)x+a+b, puedes verificar por tu cuenta que sí es una transformación lineal.

Ejemplo. La función T:M_{2,3}(\mathbb{R})\to \mathbb{R}^3 que manda a la matriz

    \[M=\begin{pmatrix}a & b & c\\d & e & f\end{pmatrix}\]

al vector

    \[T(M):= (a-d, b-e, c-f)\]

es una transfomación lineal.

Veamos que T abre sumas. Tomemos dos matrices M_1=\begin{pmatrix}a_1 & b_1 & c_1\\d_1 & e_1 & f_1\end{pmatrix} y M_2=\begin{pmatrix}a_2 & b_2 & c_2\\d_2 & e_2 & f_2\end{pmatrix}. Por un lado

    \begin{align*}T(M_1)&=(a_1-d_1,b_1-e_1,c_1-f_1)\\T(M_2)&=(a_2-d_2,b_2-e_2,c_2-f_2),\end{align*}

de modo que sumando los vectores y reacomodando tenemos que

    \[T(M_1)+T(M_2)=((a_1+a_2)-(d_1+d_2),(b_1+b_2)-(e_1+e_2),(c_1+c_2)-(f_1+f_2)).\]

Por otro lado, si primero sumamos las matrices, obtenemos la matriz

    \[M_1+M_2=\begin{pmatrix}a_1+a_2 & b_1+b_2 & c_1+c_2\\d_1+d_2 & e_1+e_2 & f_1+f_2\end{pmatrix}.\]

Así,

    \[T(M_1+M_2)=((a_1+a_2)-(d_1+d_2),(b_1+b_2)-(e_1+e_2),(c_1+c_2)-(f_1+f_2)).\]

Esto muestra que T(M_1+M_2)=T(M_1)+T(M_2), es decir, que T abre sumas. Con un argumento parecido se puede mostrar que saca escalares.

\square

Ejemplo. La función T:\mathbb{R}^2\to \mathbb{R}_2[x] que manda al vector (a,b) al polinomio T(a,b)=(a+b)x^2+(a-b)x+b es una transformación lineal.

\square

Recuerda que C[0,1] es el espacio vectorial de funciones f:[0,1]\to \mathbb{R} continuas.

Ejemplo. La función T:C[0,1]\to \mathbb{R} que manda a la función f al real

    \[T(f):=\int_0^1 f(x)\, dx\]

es una transformación lineal. En efecto, para dos funciones f y g continuas en el [0,1] y un real c se tiene por definición de suma de funciones, de multiplicación por escalar y de propiedades de la integral que

    \begin{align*}\int_0^1 (f+g)(x)\, dx&=\int_0^1 f(x)+g(x)\, dx\\&=\int_0^1 f(x) \, dx+\int_0^1 g(x)\, dx\end{align*}

y que

    \begin{align*}\int_0^1 (cf)(x)\, dx &= \int_0^1 cf(x)\, dx \\&=c \int_0^1 f(x)\, dx.\end{align*}

En otras palabras, T(f+g)=T(f)+T(g) y T(cf)=cT(f).

\square

Propiedades básicas de transformaciones lineales

La definición de «transformación lineal» pide dos cosas por separado: abrir sumar y sacar escalares. Es bueno tenerlas por separado para referirnos a ellas individualmente. Sin embargo, la siguiente proposición nos ayuda a probar de manera más práctica que T es una transformación lineal.

Proposición (verificación abreviada). Sean V y W espacios vectoriales sobre un mismo campo F. T:V\to W es una transformación lineal si y sólo si para todo v_1,v_2 en V y c en F se tiene que

    \[T(cv_1+v_2)=cT(v_1)+T(v_2).\]

Demostración. En efecto, si T es transformación lineal, entonces T(cv_1)=cT(v_1) porque T saca escalares y así

    \begin{align*}T(cv_1+v_2)&=T(cv_1)+T(v_2)\\&=cT(v_1)+T(v_2).\end{align*}

Por otro lado, si se cumple T(cv_1+v_2)=cT(v_1)+T(v_2) para todos v_1 y v_2 vectores en V y c escalar en F, entonces con v_2=0 recuperamos que T saca escalares y con c=1 recuperamos que T abre sumas.

\square

Las transformaciones lineales mandan al cero de un espacio vectorial al cero del otro.

Proposición (cero va a cero). Sean V y W espacios vectoriales sobre un mismo campo. Si T:V\to W es una transformación lineal, entonces T(0)=0.

Demostración. El truco es encontrar T(0+0) de dos formas distintas. Por un lado, como 0+0=0, tenemos que T(0+0)=T(0). Por otro lado, como T abre sumas, tenemos que T(0+0)=T(0)+T(0). Así, tenemos que

    \[T(0)+T(0)=T(0).\]

Restando T(0) de ambos lados obtenemos T(0)=0.

\square

De hecho, hay otra forma de probar la proposición anterior usando que T saca escalares: T(0)=T(0\cdot 0)=0T(0)=0. Piensa en por qué cada una de estas igualdades se vale y por qué adentro del paréntesis que hay dos ceros, uno de ellos es vector y el otro escalar.

Las transformaciones lineales también «respetan» inversos aditivos.

Proposición (inversos aditivos van a inversos aditivos). Sean V y W espacios vectoriales sobre un mismo campo. Si T:V\to W es una transformación lineal, entonces T(-v)=-T(v).

La demostración es sencilla y la puedes pensar por tu cuenta.

El haber enunciado estas proposiciones nos puede ayudar para decir, de golpe, que algunas funciones no son transformaciones lineales: si una función falla en tener alguna de las propiedades anteriores, entonces no es transformación lineal.

Ejemplo. La transformación T:\mathbb{R}^2\to M_{2,2}(\mathbb{C}) que manda al vector real (a,b) a la matriz de entradas complejas T(a,b)=\begin{pmatrix}a+ib & a-ib \\a-ib & 1+abi\end{pmatrix} no es una transformación lineal pues manda al (0,0) a la matriz \begin{pmatrix}0 & 0 \\0 & 1\end{pmatrix}, la cual no es la matriz 0.

\square

Sin embargo, una pequeña advertencia. Es posible que T sí mande el 0 al 0, pero que de cualquier forma no sea una transformación lineal, debido a que falle por otras razones.

Ejemplo. La transformación T:\mathbb{R}^3 \to \mathbb{R}^3 dada por

    \[T(x,y,z)=(x+y+z,xy+yz+zx,xyz)\]

cumple que T(0,0,0)=(0,0,0), pero no es una transformación lineal pues no saca escalares. Por ejemplo,

    \[T(3,3,3)=(9,27,27)\neq 3(3,3,1)= 3T(1,1,1).\]

\square

Kernel e imagen de una transformación lineal

Tomemos T:V\to W una transformación lineal. Hay dos conjuntos muy importantes relacionados con T.

El kernel (o núcleo) de T es el conjunto de vectores en V que se van al vector 0 de W cuando les aplicamos T. En símbolos,

    \[\ker(T)=\{v\in V: T(v)=0\}.\]

La imagen de T son los vectores en W que se pueden escribir de la forma T(v) para algún v en V, es decir, es la imagen en el sentido clásico de teoría de conjuntos o de cálculo. En símbolos,

    \[\Ima(T)=\{T(v): v\in V\}.\]

Haciendo énfasis de nuevo: \ker(T) es un subconjunto de vectores de V e \Ima(T) es un subconjunto de vectores de W. Veamos un ejemplo que nos ayudará a repasar varios de los conceptos clave de esta entrada.

Problema. Consideremos la transformación T:M_2(\mathbb{R})\to M_{2,3}(\mathbb{R}) dada por

    \[T\begin{pmatrix}a & b \\ c & d\end{pmatrix}=\begin{pmatrix}a & b \\ c & d \end{pmatrix} \begin{pmatrix}1 & 1 & 1\\1 & 1 & 1\end{pmatrix}.\]

Muestra que T es una transformación lineal y determina \ker(T) e \Ima(T).

Intenta resolver este problema por tu cuenta antes de seguir.

Solución. Sean A y B matrices de 2\times 2 con entradas reales y r un real. Nombremos C=\begin{pmatrix}1 & 1 & 1\\1 & 1 & 1\end{pmatrix}. Por propiedades de producto de matrices, tenemos que

    \begin{align*}T(rA+B)&=(rA+B)C \\ &=r(AC)+BC\\ &=rT(A)+T(B),\end{align*}

así que por la proposición de verificación abreviada, tenemos que T es una transformación lineal.

Ahora, tomemos una matriz A=\begin{pmatrix}a & b \\c & d \end{pmatrix} y notemos al hacer la multiplicación de manera explícita, obtenemos que T(A) es la matriz

    \[\begin{pmatrix}a+b & a+b & a+b\\c+d & c+d & c+d \end{pmatrix}.\]

Determinemos quién es \Ima(T). Para que una matriz M:=\begin{pmatrix}e & f & g\\h & i & j \end{pmatrix} esté en la imagen de T, se tiene que cumplir que e=f=g y que h=i=j.

Y viceversa, si e=f=g y h=i=j, entonces M está en la imagen de T pues, por ejemplo

    \[T\begin{pmatrix}e & 0\\h & 0 \end{pmatrix}=\begin{pmatrix}e & e & e\\h & h & h\end{pmatrix}=M.\]

Esto muestra que

    \[\Ima (T) = \left\{\begin{pmatrix}e & e & e\\h & h & h \end{pmatrix}: e,h \in \mathbb{R}\right\}.\]

Ahora determinemos quién es \ker(T). Para que A esté en el kernel de T, necesitamos que todas las entradas de T(A) sean 0. Para esto es suficiente y necesario que a+b=0 y que c+d=0, o dicho de otra forma, que A sea de la forma A=\begin{pmatrix}a & -a \\c & -c \end{pmatrix}. Así, concluimos que

    \[\ker(T)=\left\{\begin{pmatrix}a & -a \\c & -c \end{pmatrix}: a,c \in \mathbb{R}\right\}.\]

\square

Con esto ya terminamos lo que pide el problema. Sin embargo, hagamos una observación clave. En el problema anterior, \ker(T) e \Ima(T) no solamente son subconjuntos de M_2(\mathbb{R}) y de M_{2,3}(\mathbb{R}) respectivamente, sino que además son subespacios. Esto no es casualidad.

Los kernels e imágenes de transformaciones lineales son subespacios

Teorema. Sean V y W espacios vectoriales sobre un mismo campo. Si T:V\to W es una transformación lineal, entonces \ker(T) es un subespacio de V e \Ima(T) es un subespacio de W.

Demostración. Demostraremos primero que \ker(T) es un subespacio de V. Para ello basta con tomar v_1,v_2 en \ker(T) y c en el campo F y mostrar que cv_1+v_2 también está en \ker(T), es decir, que también sucede que T(cv_1+v_2)=0. Esto se debe a la siguiente cadena de igualdades, que justificamos abajo

    \begin{align*}T(cv_1+v_2)&=T(cv_1)+T(v_2)\\&=cT(v_1)+T(v_2)\\&=c\cdot 0 + 0 \\&= 0.\end{align*}

La primera igualdad se debe a que T abre sumas. La segunda a que T saca escalares. La tercera a que v_1 y v_2 están en el kernel de T y por lo tanto sabemos que T(v_1)=T(v_2)=0. La última es simplemente hacer la operación. Con esto mostramos que \ker(T) es un subespacio de V.

Ahora, veremos que \Ima(T) es un subespacio de W. Tomemos w_1 y w_2 en \Ima(T), y un escalar c en el campo F. De nuevo, basta mostrar que cw_1+w_2 está en \Ima(T). Como w_1 y w_2 están en la imagen de T, esto quiere decir que existen vectores v_1 y v_2 en V tales que T(v_1)=w_1 y T(v_2)=w_2. Notemos que entonces:

    \begin{align*}cw_1+w_2&=cT(v_1)+T(v_2)\\&=T(cv_1)+T(v_2)\\&=T(cv_1+v_2).\end{align*}

La segunda y tercera igualdad vienen de que T saca escalares y abre sumas respectivamente. Esta cadena de igualdades muestra que podemos poner a cw_1+w_2 como imagen de alguien en V bajo T, es decir, que cw_1+w_2 pertenece a \Ima(T). Esto es lo que queríamos mostrar.

\square

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Verifica que las transformaciones lineales que se pusieron como ejemplo en efecto abren sumas y sacan escalares.
  • Asegúrate de entender los detalles de la prueba de la proposición de la verificación abreviada. Úsala para mostrar que la función que manda al vector (a,b,c) a la matriz

        \[\begin{pmatrix} a & b & c \\ c & a & b \\ b & c & a \end{pmatrix}\]

    es una transformación lineal de \mathbb{R}^3 a M_3(\mathbb{R}).
  • Muestra la proposición de que inversos aditivos van a inversos aditivos.
  • Determina el kernel y la imagen de las transformaciones lineales T:V\to W que se dieron como ejemplo.
  • Para cada kernel e imagen que encuentres, convéncete de que son subespacios. Determina si tienen dimensión finita y, en ese caso, determina la dimensión. Para estos casos, ¿cómo están relacionados \dim(\Ima(T)),\dim(\ker(T)),\dim(V)?

Más adelante…

En esta entrada definimos los conceptos de transformación lineal, de imagen y de kernel. También vimos que la imagen y kernel de transformaciones lineales son subespacios. Más adelante veremos que \ker(T) e \Ima(T) están de hecho relacionados más profundamente.

Por ahora, nota que en el ejemplo antes del teorema tenemos que \begin{pmatrix}1 & 1 & 1\\0 & 0 & 0 \end{pmatrix} y \begin{pmatrix}0 & 0 & 0\\1 & 1 & 1 \end{pmatrix} forman una base de \Ima(T) pues son linealmente independientes y todo elemento en la imagen es combinación lineal de estas matrices. Además, nota que de manera similar \begin{pmatrix}1 & -1 \\0 & 0 \end{pmatrix} y \begin{pmatrix}0 & 0 \\1 & -1 \end{pmatrix} forman una base de \ker(T).

Esto nos dice que \dim(\Ima(T))=2 y que \dim(\ker(T))=2. Si sumamos ambos, nos da la dimensión de M_2(\mathbb{R}). ¿Será casualidad?

Entradas relacionadas