Archivo de la etiqueta: suma de vectores

Geometría Analítica I: El espacio vectorial R²

Introducción

En la entrada anterior llegamos a una equivalencia entre un punto en el plano euclidiano y parejas de números (x,y), donde x, y \in \mathbb{R}. Podemos imaginarnos entonces el conjunto de todas las parejas ordenadas de números reales como \mathbb{R} \times \mathbb{R} = \mathbb{R}^2, donde \times hace referencia al producto cartesiano (en general para conjuntos A y B, A \times B := \{ (a,b) : a \in A, b \in B \}).

Con esto en mente, es posible imaginaros a los postulados de Euclides ya no como afirmaciones incuestionables, sino como consecuencias de una geometría construida a partir de las parejas de números reales. Ahora nuestra base será la teoría de conjuntos, los números reales y las parejas ordenadas. Usaremos los axiomas y propiedades que tienen para construir nuestros objetos.

Para entender mejor cómo se trabajará en el espacio formado por todas las parejas (x,y) de reales, comencemos esta entrada hablando de los números reales.

Los números reales

Como advertencia, esta sección tiene muchos símbolos. Es normal. Muy muy a grandes rasgos, lo que queremos recordar aquí es que los reales se pueden sumar, restar, multiplicar y dividir (excepto divisiones entre cero). Y que todas estas operaciones tienen propiedades bonitas.

A partir de este punto, pensaremos en los reales como algo que sabemos con seguridad puede ser construido, y tomaremos como ciertos todos los axiomas que éstos cumplen. Los axiomas se pueden resumir en la siguiente frase, que desglosaremos una vez enunciada:

«\mathbb{R} es un campo ordenado y completo»

Que \mathbb{R} sea un campo hace referencia a que como conjunto, tiene las operaciones de suma (+) y producto (\dot) definidas tales que:

  • \mathbb{R} con la suma, es un grupo conmutativo
    • La suma es asociativa, es decir: \forall a,b,c \in \mathbb{R}, se tiene que (a+b)+c=a+(b+c) (\forall se lee para todo).
    • Existe 0 \in \mathbb{R} tal que \forall a \in \mathbb{R}, a+0=a=0+a
    • Existe b \in \mathbb{R} tal que a+b=0=b+a. (b=-a)
    • Es conmutativa, es decir, \forall a,b \in \mathbb{R}, se tiene que a+b=b+a.
  • \mathbb{R} \setminus \{0\} (los reales sin el elemento cero) con el producto, es un grupo conmutativo; de manera análoga a la suma tenemos:
    • El producto es asociativo: \forall a,b,c \in \mathbb{R}, se tiene que (ab)c=a(bc) (nota que estamos omitiendo el símbolo de multiplicación).
    • Existe 1 \in \mathbb{R} tal que \forall a \in \mathbb{R}, a\cdot1=a=1\cdot a
    • Existe b \in \mathbb{R} tal que ab=1=ba. (b=\frac{1}{a})
    • Es conmutativo, es decir, \forall a,b \in \mathbb{R}, se tiene que ab=ba.
  • La suma y el producto se distribuyen: \forall a,b,c \in \mathbb{R}, se tiene que a(b+c)=ab+ac

Que sea ordenado nos indica que tenemos una relación que es un orden total y es compatible con la suma y el producto. \forall a,b \in \mathbb{R}:

  • Se cumple exactamente una de las siguientes relaciones: a<b, b<a, a=b.
  • Si a \leq b y b \leq c, entonces a \leq c.
  • Si a \leq b, entonces a+c \leq b+c
  • Si a,b \geq 0 , entonces ab \geq 0

Por último, que sea completo es una noción formal en la cual no nos enfocaremos mucho, pero que a grandes rasgos quiere decir que en los números reales «no hay hoyos», lo cual es muy importante para cuando se quiere usar este sistema numérico para hacer cálculo diferencial e integral.

Por lo que vimos en la entrada anterior, podemos representar cualquier punto en el espacio euclidiano con una pareja de números reales. Ya que hemos dado un pequeño repaso formal de la estructura de \mathbb{R} (todo esto lo cumple cada entrada de un punto (a,b)), demos el siguiente paso y exploremos el espacio vectorial \mathbb{R}^2.

Espacio vectorial \mathbb{R}^2

Comencemos definiendo formalmente un concepto que exploramos en la entrada anterior: el vector.

Definición. Un vector v con dos entradas, es una pareja ordenada de números reales v=(x,y).

Ejemplos. Algunos vectores en \mathbb{R}^2 son:

  • (1,4)
  • (-3,2)
  • (\pi,1)
  • (2.3,-e)

Utiliza el siguiente interactivo de GeoGebra: mueve el punto C y explora cómo el vector cambia con esta acción.

Definición. El conjunto de todos los vectores con dos elementos (ambos reales) es \mathbb{R}^2. En símbolos tenemos que:

\mathbb{R}^2=\{(x,y): x,y \in \mathbb{R} \}

Si realizaste la tarea moral anterior, te habrás dado cuenta que podemos encontrar ciertas regiones geométricas al imponer condiciones sobre las entradas de un vector. En la tarea se hace referencia a áreas muy determinadas conocidas como cuadrantes, pero no son las únicas regiones existentes. Hagamos un ejercicio de esto.

Problema. Ubica dentro del plano de dos dimensiones las siguientes regiones geométricas definidas al imponer ciertas restricciones en las entradas de un vector:

  1. \{ (x,y) \in \mathbb{R}^2 : x \leq 0, y \geq 1 \}
  2. \{ (x,y) \in \mathbb{R}^2 : x \geq \pi , y \leq \pi \}
  3. \{ (x,y) \in \mathbb{R}^2 : x \geq y \}

Solución. Para encontrar estas áreas basta con ubicar la región en la que se vale cada condición por separado. La intersección de las regiones será la región que buscamos. Esto se vale para los dos primeros incisos.

Utiliza el siguiente interactivo de GeoGebra en el que ya están las condiciones para visualizar la primera región geométrica para localizar la región del segundo inciso.

¿Qué pasa con el inciso 3? Puede parecer más complicado porque ahora las coordenadas están conectadas en una sola restricción. Antes de introducir la condición en GeoGebra, imagina cuál es la región en la que la condición se cumple.

Ahora, utilicemos el siguiente interactivo para usar lo que ya sabemos y determinar intuitivamente cuál es el área que determina la condición x \geq y. Pensemos en el caso específico x = 1, y puede ser a lo más 1 (y \leq 1); al restringir nuestra x podemos obtener dos condiciones a partir de las cuales ya sabemos cómo encontrar la región en las que se cumplen. Si ves el interactivo, notarás que la intersección de las regiones es únicamente la recta definida por x=1 pero no toda, sino que sólo a partir de cuando y=1 hacia abajo. ¿qué pasa si mueves los deslizadores para cambiar los valores de x y y ? Se obtienen segmentos de recta correspondientes a un valor de x fijo que comienzan cuando y es menor o igual a ese valor.

Resulta que estos segmentos de recta se obtienen para cualquier valor de x. ¿qué pasa ahora cuando unes todas estas líneas? En este punto es importante recordar que en \mathbb{R} hay un real entre cada dos reales. Entonces, se puede construir el segmento de recta del que hemos hablado. Por lo que la únión de todas estas rectas define un área, ¿ya imaginas cuál es? Verifícalo al escribir la condición y \leq x en el interactivo anterior.

\square

La suma en \mathbb{R}^2

Regresando a la teoría, el siguiente paso lógico después de definir ciertos objetos (en este caso vectores), es averiguar cómo operan. Definamos entonces la suma y el producto escalar de vectores haciendo uso del conocimiento que ya tenemos acerca de las operaciones en los reales.

Definición. Sean v_1, v_2 \in \mathbb{R}^2 dados por v_1=(x_1,y_1) y v_1=(y_1,y_2). Su suma está dada por el vector

v_1+v_2 := (x_1+x_2,y_1+y_2)

Esto es, que la suma de vectoes se hace entrada a entrada y esta bien definida pues al final lo que estamos sumando son números reales.

Ejemplos.

  • (-3,4) + (2,2)=(-3+2,4+2)=(-1,6)
  • (7,4) + (2,1)=(7+2,4+1)=(9,5)
  • (-3.-7) + (1,2)=(-3+1,-7+2)=(-2,-5)

En el siguiente interactivo podrás ver el primer ejemplo de manera gráfica en el plano, donde los vectores de colores son los que se suman y el vector negro es el resultante.

Además de poder obtener el vector suma de manera algebraica hay otra manera más de hacerlo: En el mismo interactivo hay una copia de cada vector de color, escoge uno de los dos vectores de la suma y transpórtalo por completo y paralelo a sí mismo para que su punto de inicio no sea el origen, si no el punto donde termina el otro vector. Por ejemplo, deja el vector azul en su lugar y transporta al verde para que su punto de partida sea la flecha del vector azul. Si lo hiciste correctamente, notarás que ahora ese vector transportado termina en donde el vector resultante de la suma (negro) termina. Resulta que si quieres sumar dos vectores, puedes avanzar desde el origen hasta las coordenadas de uno de ellos y ahora »tomando» como origen ese punto al que llegaste, avanzar las coordenadas del otro vector. Al final llegarás al punto del vector resultante de la suma. Este método es conocido como el método del paralelogramo.

El producto escalar en \mathbb{R}^2

Otra operación importante en \mathbb{R}^2 es el producto escalar, que intuitivamente combina a un real y a un vector y «reescala» al vector por el factor dado por el número real.

Definición. Para r un número real y v_1 \in \mathbb{R}^2 dado por v_1=(x,y), el producto escalar rv está dado por:

rv:=(rx,ry)

Ejemplos.

  • 4(7,3.5)=(28,14)
  • 2(5,3)=(10,6)
  • 2.3(6,3)=(13.8,6.9)

Utiliza el siguiente interactivo moviendo el deslizador del valor a que multiplica al vector (5,3) para interiorizar lo que implica multiplicar un vector por un escalar. Si lo notas, lo único que hace es reescalarlo, y si el escalar es negativo, entonces le cambia el sentido, pero no la dirección.

Una última cosa que es muy importante mencionar es que hasta ahora no hemos dicho cómo multiplicar dos (o más vectores). Sólo tenemos un producto que toma un escalar (un real) y lo multiplica con un vector, cuyo resultado acaba siendo un vector.

Tarea moral

  • Sean v=(8,9), w=(3,-2), u=(-5-4). Calcula y dibuja las siguientes operaciones de vectores:
    • 5v+3u
    • u-3w
    • 2.5v+9w-u
  • Demuestra en \mathbb{R} que si -1 es el inverso aditivo de 1, entonces -a es el inverso aditivo de a.
  • Por los axiomas, sabemos que la conmutatividad se vale para la suma de reales, es decir, que si a y b son reales, entonces a+b=b+a. Pero en esta entrada definimos una nueva suma: la de vectores. De entrada, no sabemos qué propiedades cumple. A partir de las definiciones que dimos, y de los axiomas de los reales, demuestra que también se tiene u+v=v+u para u y v vectores en \mathbb{R}^2.
  • Determina, si es posible, las regiones siguientes geométricas. Si dicha región es vacía, argumenta por qué.
    • \{ (x,y) \in \mathbb{R}^2 : x \leq y, y \geq x \}
    • \{ (x,y) \in \mathbb{R}^2 : x \leq y, y > x \}
    • \{ (x,y) \in \mathbb{R}^2 : x \leq 3, y > \pi \}
  • En el interactivo de producto escalar siempre sucede que la línea que pasa por el extremo del vector verde y el extremo del vector rojo siempre pasa por el origen. ¿Por qué sucede esto?

Más adelante…

En esta entrada dimos un breve repaso acerca de los números reales que nos sirvió para entender el espacio \mathbb{R}^2 y las operaciones dentro de este. El desarrollo aquí hecho servirá como herramienta para construir la representación algebraica de una recta.

Álgebra Lineal I: Introducción al curso, vectores y matrices

Introducción

Esta es la primer entrada correspondiente a las notas del curso Álgebra Lineal I. En esta serie de entradas, cubriremos todo el temario correspondiente al plan de estudios de la materia en la Facultad de Ciencias de la UNAM. Las notas están basadas fuertemente en el libro Essential Lineal Algebra with Applications de Titu Andreescu.

El curso se trata, muy a grandes rasgos, de definir espacios vectoriales y estudiar muchas de sus propiedades. Un espacio vectorial con el que tal vez estés familiarizado es \mathbb{R}^n, donde sus elementos son vectores con n entradas. En él se pueden hacer sumas entrada a entrada, por ejemplo, si n=3 una suma sería

    \begin{align*}(5,-1,2)+(1,4,9)=(6,3,11).\end{align*}

También se puede multiplicar un vector por un número real, haciéndolo entrada a entrada, por ejemplo,

    \begin{align*}3(1,5,-2,6)=(3,15,-6,18).\end{align*}

El álgebra lineal estudia espacios vectoriales más generales que simplemente \mathbb{R}^n. Como veremos más adelante, hay muchos objetos matemáticos en los que se puede definir una suma y un producto escalar. Algunos ejemplos son los polinomios, ciertas familias de funciones y sucesiones. La ventaja de estudiar estos espacios desde el punto de vista del álgebra lineal es que todas las propiedades que probemos «en general», se valdran para todos y cada uno de estos ejemplos.

Lo que haremos en la primer unidad del curso es entender muy a profundidad a F^n, una generalización de \mathbb{R}^n en la que usamos un campo arbitrario F. También, entenderemos a las matrices en M_{m,n}(F), que son arreglos rectangulares con entradas en F. La unidad culmina con estudiar sistemas de ecuaciones lineales y el método de reducción Gaussiana.

Más adelante veremos que estudiar estos conceptos primero es muy buena idea pues los espacios vectoriales más generales tienen muchas de las propiedades de F^n, y podemos entender a ciertas transformaciones entre ellos al entender a M_{m,n}(F).

Breve comentario sobre campos

En este curso no nos enfocaremos en estudiar a profundidad las propiedades que tienen los campos como estructuras algebraicas. De manera pragmática, pensaremos que un campo F consiste de elementos que se pueden sumar y multiplicar bajo propiedades bonitas:

  • La suma y el producto son asociativas, conmutativas, tienen neutro (que llamaremos 0 y 1 respectivamente y tienen inversos (i.e. se vale «restar» y «dividir»)
  • La suma y producto satisfacen la regla distributiva

De hecho, de manera muy práctica, únicamente usaremos a los campos \mathbb{Q} de racionales, \mathbb{R} de reales, \mathbb{C} de complejos y \mathbb{F}_2, el campo de dos elementos 0 y 1. Este último sólo lo usaremos para observar que hay algunas sutilezas cuando usamos campos con una cantidad finita de elementos.

Para todos estos campos, supondremos que sabes cómo se suman y multiplican elementos. Si necesitas dar un repaso a estos temas, puedes echarle un ojo a las entradas del curso Álgebra Superior II, que también están aquí en el blog.

Nociones iniciales de álgebra lineal: escalares, vectores y matrices

Quizás te has encontrado con vectores y matrices en otros cursos. Por ejemplo, en geometría analítica es usual identificar a un vector (x,y) con un punto en el plano cartesiano, o bien con una «flecha» que va del origen a ese punto. En álgebra lineal nos olvidaremos de esta interpretación por mucho tiempo. Será hasta unidades posterioresque tocaremos el tema de geometría de espacios vectoriales. Por el momento, sólo nos importan los vectores desde el punto de vista algebraico.

Tomemos un campo F. A los elementos de F les llamaremos escalares. Para un entero positivo n, un vector X en F^n consiste de un arreglo de n entradas a_1,a_2,\ldots,a_n que pueden estar dispuestas en un vector fila

    \[X=(a_1, a_2,\ldots, a_n),\]

o bien un vector columna

    \[X=\begin{pmatrix}a_1 \\ a_2 \\ \vdots \\ a_n\end{pmatrix}.\]

Para i=1,\ldots,n, a a_i le llamamos la i-ésima coordenada o i-ésima entrada de X.

Como vectores, puedes pensar que el vector fila y el vector columna correspondientes son el mismo. Abajo veremos en qué sentido tenemos que pensarlos como diferentes. Aunque como vectores sean los mismos, los vectores columna tienen varias ventajas conceptuales en álgebra lineal.

Ejemplo. El vector

    \[X=\left(\frac{1}{2}, -1, \frac{2}{3}, 4\right).\]

tiene cuatro entradas, y todas ellas son números racionales. Por lo tanto, es un vector en \mathbb{Q}^4. Su primer entrada es \frac{1}{2}. Está escrito como vector fila, pero podríamos escribirlo también como vector columna:

    \[\begin{pmatrix} \frac{1}{2} \\ -1 \\ \frac{2}{3} \\ 4 \end{pmatrix}.\]

El vector

    \[Y=\left(\pi, \frac{3}{4}, 5, 6, \sqrt{2}\right)\]

es un vector fila en \mathbb{R}^5, pero no en \mathbb{Q}^5, pues no todas sus entradas son racionales. A Y también lo podemos pensar como un vector en \mathbb{C}.

\square

Una matriz en M_{m,n}(F) es un arreglo rectangular de elementos en F dispuestos en m filas y n columnas como sigue:

    \[A=\begin{pmatrix}a_{11} & a_{12} & a_{13} & \cdots & a_{1n}\\a_{21} & a_{22} & a_{23} & \cdots & a_{2n}\\$\vdots & & \ddots & \vdots \\a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn}\end{pmatrix}.\]

Al escalar a_{ij} le llamamos la entrada (i,j) de A.

Para cada i=1,\ldots,m, definimos a la i-ésima fila de A como el vector fila

    \[L_i=(a_{i1},a_{i2},\ldots,a_{in}),\]

y para cada j=1,2,\ldots,n definimos a la j-ésima columna de A como el vector columna

    \[C_j=\begin{pmatrix} a_{1j} \\ a_{2j} \\ \vdots \\ a_{mj}\end{pmatrix}.\]

Veamos algunas aclaraciones de notación. Cuando m=n, las matrices en M_{m,n}(F) tienen la misma cantidad de filas que de columnas. En este caso simplemente usamos la notación M_{n}(F) para ahorrarnos una letra, y si una matriz está en M_{n}(F), le llamamos una matriz cuadrada. También, ocasiones expresamos a una matriz en forma compacta diciendo cuántas filas y columnas tiene y usando la notación A=[a_{ij}].

Ejemplo. Consideremos la matriz A en M_3(\mathbb{R}) dada por A=[a_{ij}]=[i+2j]. Si queremos poner a A de manera explícita, simplemente usamos la fórmula en cada una de sus entradas:

    \begin{align*}A=\begin{pmatrix}a_{11} & a_{12} & a_{13}\\a_{21} & a_{22} & a_{23}\\a_{31} & a_{32} & a_{33}\\\end{pmatrix}&=\begin{pmatrix}1+2\cdot 1 & 1+2\cdot 2 & 1+2\cdot 3\\2+2\cdot 1 & 2+2\cdot 2 & 2+2\cdot 3\\3+2\cdot 1 & 3+2\cdot 2 & 3+2\cdot 3\\\end{pmatrix}\\&=\begin{pmatrix}3 & 5 & 7\\4 & 6 & 8\\5 & 7 & 9\\\end{pmatrix}\end{align*}

Esta es una matriz cuadrada. Sin embargo, la matriz B en M_{3,2}(\mathbb{R}) con la misma regla B=[b_{ij}]=[i+2j] no es una matriz cuadrada pues es

    \begin{align*}B=\begin{pmatrix}a_{11} & a_{12} \\a_{21} & a_{22} \\a_{31} & a_{32} \\\end{pmatrix}&=\begin{pmatrix}1+2\cdot 1 & 1+2\cdot 2\\2+2\cdot 1 & 2+2\cdot 2\\3+2\cdot 1 & 3+2\cdot 2\\\end{pmatrix}\\&=\begin{pmatrix}3 & 5 \\4 & 6 \\5 & 7 \\\end{pmatrix},\end{align*}

la cual es una matriz con 3 filas y 2 columnas.

\square

Cualquier vector fila en F^n lo podemos pensar como una matriz en M_{1n}(F) y cualquier vector columna en F^n lo podemos pensar como una matriz en M_{n1}(F). En este sentido estos dos vectores sí serían distintos. Usualmente será claro si se necesita o no hacer la distinción.

Para que dos vectores o dos matrices sean iguales, tienen que serlo coordenada a coordenada.

Vectores y matrices especiales

Al vector en F^n con todas sus entradas iguales al cero del campo F le llamamos el vector cero y lo denotamos con 0. El contexto nos ayuda a decidir si estamos hablando del escalar cero (el neutro aditivo del campo F) o del vector cero.

De manera similar, a la matriz en M_{m,n} con todas sus entradas iguales al cero del campo F le llamamos la matriz cero y la denotamos con O_{m,n}. Si m=n, la llamamos simplemente O_n.

Otra matriz especial que nos encontraremos frecuentemente es la matriz identidad. Para cada n, es la matriz I_n en M_n(F) tal que cada entrada de la forma a_{ii} es igual a uno (el neutro multiplicativo de F) y el resto de sus entradas son iguales a 0.

Cuando estamos trabajando en M_n(F), es decir, con matrices cuadradas, hay otras familias de matrices que nos encontraremos frecuentemente. Una matriz A=[a_{ij}] en M_{n}(F):

  • Es diagonal si cuando i\neq j, entonces a_{ij}=0.
  • Es triangular superior si cuando i>j, entonces a_{ij}=0.
  • Y es triangular inferior si cuando i<j entonces a_{ij}=0.

A las entradas de la forma a_{ii} se les conoce como las entradas de la diagonal principal de la matriz. En otras palabras, A es diagonal cuando sus únicas entradas no cero están en la diagonal principal. Es triangular superior cuando sus entradas por debajo de la diagonal principal son iguales a cero. Y de manera similar, es triangular inferior cuando sus entradas por encima de la diagonal principal son iguales a cero.

Ejemplo. La matriz O_{3,2} de M_{3,2}(\mathbb{Q}) es la siguiente

    \[O_{3,2}=\begin{pmatrix}0 & 0 \\ 0& 0 \\ 0 & 0 \\\end{pmatrix}\]

La matriz I_4 de M_{4}(F) es la siguiente

    \[I_4=\begin{pmatrix}1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1\end{pmatrix}.\]

Esta matriz identidad es diagonal, triangular superior y triangular inferior. Una matriz diagonal distinta a la identidad podría ser la siguiente matriz en M_3(\mathbb{Q}):

    \[\begin{pmatrix}1 & 0 & 0 \\ 0 & -\frac{1}{2} & 0 \\ 0 & 0 & \frac{1}{3} \\\end{pmatrix}.\]

Una matriz que es triangular superior, pero que no es diagonal (ni triangular inferior), podría ser la siguiente matriz en M_4(\mathbb{R}):

    \[\begin{pmatrix}1 & \sqrt{2} & 2 & \sqrt{5}\\ 0 & 1 & \sqrt{3} & 0\\ 0& 0 & 1 & \sqrt{2}\\ 0 & 0 & 0 & 1\end{pmatrix}.\]

\square

Operaciones de vectores y matrices

Si tenemos dos matrices A=[a_{ij}] y B=[b_{ij}] en M_{m,n}(F), entonces podemos definir a la matriz suma A+B como la matriz cuyas entradas son [a_{ij}+b_{ij}], es decir, se realiza la suma (del campo F) entrada por entrada.

Ejemplo. Si queremos sumar a las matrices A y B en M_{4}(\mathbb{R}) dadas por

    \[A=\begin{pmatrix}1 & \sqrt{2} & 2 & \sqrt{5}\\ 0 & 1 & \sqrt{3} & 2\\  0& 0 & 1 & \sqrt{2}\\ 0 & 0 & 0 & 1\end{pmatrix}.\]

y

    \[B=\begin{pmatrix}1 & 1 & -1 & -3\\ 0 & 1 & 1 & -2\\ 0& 0 & 1 & 1\\ 0 & 0 & 0 & 1\end{pmatrix},\]

entonces hacemos la suma entrada por entrada para obtener:

    \[A+B=\begin{pmatrix}2 & 1+\sqrt{2} & 1 & -3+\sqrt{5}\\ 0 & 2 & 1+\sqrt{3} & 0\\ 0 & 0 & 2 & 1+\sqrt{2}\\ 0 & 0 & 0 & 2\end{pmatrix}.\]

\square

Es muy importante que las dos matrices tengan la misma cantidad de filas y renglones. Insistiendo: si no coinciden la cantidad de filas o de columnas, entonces las matrices no se pueden sumar.

Si tenemos una matriz A=[a_{ij}] en M_{m,n}(F) y un escalar c en F, podemos definir el producto escalar de A por c como la matriz cA=[ca_{ij}], es decir, aquella que se obtiene al multiplicar cada una de las entradas de A por el escalar c (usando la multiplicación del campo F).

Ejemplo. Al tomar la siguiente matriz en M_{2}(\mathbb{C})

    \[A=\begin{pmatrix} 1 & i \\ -i & 1 \end{pmatrix}\]

y el escalar i en \mathbb{C}, se tiene que

    \[iA=\begin{pmatrix} i\cdot 1 &i\cdot i \\ i\cdot (-i) & i\cdot 1\end{pmatrix} = \begin{pmatrix} i & -1 \\ 1 & i \end{pmatrix}.\]

\square

Dada una matriz A, a la matriz (-1)A le llamamos simplemente -A, y definimos A-B:=A+(-B).

Como todo vector en F^n se puede pensar como una matriz, estas operaciones también se pueden definir para vectores para obtener la suma de vectores y la producto escalar en vectores.

En álgebra lineal frecuentemente hablaremos de escalares, vectores y matrices simultáneamente. Cada que veas una una variable es importante que te preguntes de cuál de estos tipos de objeto es. También, cada que veas una operación (por ejemplo, una suma), es importante preguntarte si es una suma de escalares, vectores o matrices.

Muchas de las buenas propiedades de las operaciones de suma y producto en el campo F también se cumplen para estas definiciones de suma y producto escalar de vectores y matrices.

Teorema. Sean A,B,C matrices en M_{m,n}(F) y \alpha,\beta,\gamma escalares en F. Entonces la suma de matrices:

  • Es asociativa: (A+B)+C = A+(B+C)
  • Es conmutativa: A+B=B+A
  • Tiene neutro: A+O_{m,n}=A=O_{m,n}+A
  • Tiene inversos: A+(-A)=O_{m,n}=(-A)+A

Además,

  • La suma de escalares y el producto escalar se distribuyen: (\alpha+\beta)A=\alpha A + \beta A
  • La suma de matrices y el producto escalar se distribuyen: \alpha(A+B)=\alpha A + \alpha B
  • El producto escalar es homogéneo: \alpha(\beta A) = (\alpha \beta) A
  • El 1 es neutral para el producto escalar: 1A = A

Un teorema análogo se vale al cambiar matrices por vectores. La demostración de este teorema se sigue directamente de las propiedades del campo F. La notación de entradas nos ayuda mucha a escribir una demostración sin tener que escribir demasiadas entradas una por una. Veamos, como ejemplo, la demostración de la primera propiedad.

Demostración. Tomemos matrices A=[a_{ij}], B=[b_{ij}] y C=[c_{ij}] en M_{m,n}(F). Para mostrar que

    \[(A+B)+C=A+(B+C),\]

tenemos que mostrar que la entrada (i,j) del lado izquierdo es igual a la entrada (i,j) del lado derecho para cada i=1,\ldots,m y j=1,\ldots,n.

Por definición de suma, A+B=[a_{ij}]+[b_{ij}]=[a_{ij}+b_{ij}]. Por ello, y de nuevo por definicón de suma,

    \[(A+B)+C=[(a_{ij}+b_{ij})+c_{ij}].\]

De manera similar,

    \[A+(B+C)=[a_{ij}+(b_{ij}+c_{ij})].\]

Pero en F la suma es asociativa, de modo que

    \[(a_{ij}+b_{ij})+c_{ij}=a_{ij}+(b_{ij}+c_{ij}).\]

Con esto hemos demostrado que (A+B)+C y A+(B+C) son iguales entrada a entrada, y por lo tanto son iguales como matrices.

\square

La receta para demostrar el resto de las propiedades es la misma:

  1. Usar la definición de suma o producto por escalares para saber cómo es la entrada (i,j) del lado izquierdo y del lado derecho.
  2. Usar las propiedades del campo F para concluir que las entradas son iguales.
  3. Concluir que las matrices son iguales.

Para practicar las definiciones y esta técnica, la demostración del resto de las propiedades queda como tarea moral. A partir de ahora usaremos todas estas propiedades frecuentemente, así que es importante que las tengas en cuenta.

Base canónica de vectores y matrices

Cuando estamos trabajando en F^n, al vector e_i tal que su i-ésima entrada es 1 y el resto son 0 lo llamamos el i-ésimo vector de la base canónica. Al conjunto de vectores \{e_1,\ldots,e_n\} le llamamos la base canónica de F^n.

De manera similar, cuando estamos trabajando en M_{m,n}(F), para cada i=1,\ldots,m y j=1,\ldots,n, la matriz E_{ij} tal que su entrada (i,j) es 1 y todas las otras entradas son cero se le conoce como la matriz (i,j) de la base canónica. Al conjunto de todas estas matrices E_{ij} le llamamos la base canónica de M_{m,n}(F).

Ejemplo. El vector e_2 de F^3 es (0,1,0). Ten cuidado, pues este es distinto al vector e_2 de F^5, que es (0,1,0,0,0).

La matriz E_{12} de M_{2,3}(\mathbb{R}) es

    \[\begin{pmatrix} 0 &  1 & 0\\ 0 & 0 & 0 \end{pmatrix}.\]

\square

Más adelante veremos el concepto de base en general, cuando hablemos de espacios vectoriales. Por el momento, la intuición para álgebra lineal es que una base es un conjunto que nos ayuda a generar elementos que nos interesan mediante sumas y productos escalares. Los siguientes resultados dan una intuición inicial de este fenómeno.

Teorema. Todo vector X en F^n se puede escribir de manera única de la forma

    \[X=x_1e_1+x_2e_2+\ldots+x_ne_n,\]

en donde x_1,\ldots,x_n son escalares en F y \{e_1,\ldots,e_n\} es la base canónica.

Demostración. Si X es un vector en F^n, entonces es de la forma X=(x_1,x_2,\ldots,x_n). Afirmamos que las coordenadas de X son los x_i buscados.

En efecto, tomemos una i=1,\ldots,n. Como e_i tiene 1 en la i-ésima entrada y 0 en el resto, entonces x_ie_i es el vector con x_i en la i-ésima entrada y 0 en el resto. De esta forma, sumando entrada a entrada, tenemos

    \begin{align*}x_1e_1+x_2e_2+\ldots+x_ne_n&=\begin{pmatrix} x_1 \\ 0 \\ 0 \\ \vdots \\ 0 \end{pmatrix} + \begin{pmatrix} 0 \\ x_2 \\ 0 \\ \vdots \\ 0 \end{pmatrix} + \ldots + \begin{pmatrix} 0\\ 0 \\ 0 \\ \vdots \\ x_n \end{pmatrix}\\&=\begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ \vdots \\ x_n \end{pmatrix}=X.\end{align*}

Esto muestra la existencia.

Para demostrar la unicidad, un argumento análogo muestra que si tenemos otros escalares y_1,\ldots,y_n que cumplan, entonces:

    \[\begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ \vdots \\ x_n \end{pmatrix}=X=y_1e_1+\ldots+y_ne_n=\begin{pmatrix} y_1 \\ y_2 \\ y_3 \\ \vdots \\ y_n \end{pmatrix},\]

de modo que x_i=y_i para todo i=1,\ldots,n.

\square

Tenemos un resultado análogo para matrices.

Teorema. Toda matriz A en M_{m,n}(F) se puede escribir de manera única de la forma

    \[A=\sum_{i=1}^m \sum_{j=1}^n x_{ij} E_{ij},\]

en donde para i=1,\ldots,m y j=1,\ldots,n, se tiene que x_{ij} son escalares en F y E_{ij} son las matrices de la base canónica.

La demostración es muy similar a la del teorema anterior y como práctica queda como tarea moral.

Ejemplo. La matriz

    \[A=\begin{pmatrix} 2 & 0\\ 0 & -1 \\ 3 & 5 \end{pmatrix}\]

en M_{3,2}(\mathbb{C}) se expresa de manera única en términos de la base canónica como

    \[A=2E_{11}-1E_{22}+3E_{31}+5E_{32}.\]

\square

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para entender mucho mejor los conceptos vistos en esta entrada, así como temas posteriores.

  • Explica por qué no puedes sumar la matriz I_5 con la matriz O_4
  • Muestra que la suma de dos matrices diagonales es diagonal. Haz lo mismo para matrices triangulares superiores y para matrices triangulares inferiores.
  • Termina de demostrar el teorema de propiedades de las operaciones de suma y producto escalar.
  • Explica por qué si una matriz es simultáneamente triangular superior y triangular inferior, entonces es diagonal.
  • Expresa a la siguiente matriz como combinación lineal de matrices de la base canónica:

        \[\begin{pmatrix}2 & \frac{1}{2} & 0 & 1\\3 & -3 & 3 & -3\\7 & -8 & -1 & 0\end{pmatrix}.\]

  • Demuestra el teorema de representación de matrices en términos de la base canónica.

Más adelante…

En esta entrada dimos una breve introducción al álgebra lineal. Ya definimos la suma y el producto escalar para vectores y matrices. En la siguiente entrada hablaremos de otro producto que sucede en álgebra lineal: la de una matriz en M_{m,n}(F) por un vector en F^n. Veremos que esta multiplicación nos permite pensar a una matriz A como una función \varphi_A:F^n\to F^m con ciertas propiedades especiales.

Entradas relacionadas

Álgebra Lineal I: Problemas de vectores, matrices y matrices como transformaciones lineales

Introducción

Esta entrada consiste de puros problemas resueltos. Mediante la solución de estos problemas se puede poner en práctica los conceptos vistos anteriormente. En específico, aquí repasamos los conceptos de suma y producto escalar que vimos al inicio, así como la idea de la entrada anterior de relacionar a matrices con transformaciones lineales.

Problemas resueltos

Problema. Escribe de manera explicita la matriz A=[a_{ij}]\in M_{2,3}(\mathbb{R}) tal que

    \begin{align*}a_{ij}=\begin{cases} 1 & \text{si } i+j \text{ es par}\\ 0 & \text{si } i+j\text{ es impar}\end{cases}\end{align*}

Solución. Tomemos como ejemplo a la entrada a_{11}. Como 1+1=2 y 2 es par, entonces la entrada a_{11} será igual a 1. De manera similar, obtenemos que a_{12}=0 pues 1+2=3, que es un número impar. Siguiendo de este modo, obtenemos que

    \begin{align*}A=\begin{pmatrix} 1 & 0 & 1\\0 & 1& 0 \end{pmatrix}.\end{align*}

\square

Problema. Para cada par de matrices (A,B), explica cuáles de las operaciones A+2B y A-B tienen sentido, y cuando tengan sentido, haz el cálculo.

  1.     \begin{align*}A= \begin{pmatrix} 1 & 1& 0\\0& 1 & 1\\1 & 0 & 1 \end{pmatrix} \hspace{5mm} \text{y}\hspace{5mm} B=\begin{pmatrix} 1 &2 &3\\7 & 8 & 9\\4 & 5 & 6\end{pmatrix}.\end{align*}

  2.     \begin{align*} A=\begin{pmatrix} 192450916\\1\\0 \\1\\2\end{pmatrix} \hspace{5mm} \text{y} \hspace{5mm} B= \begin{pmatrix} -1\\ 0 \\ 199\\ 2020\\ 0\\ 3\end{pmatrix}.\end{align*}

  3.     \begin{align*}A= \begin{pmatrix} 1 & 1 & 2\\3 & 5 & 8 \end{pmatrix} \hspace{5mm} \text{y} \hspace{5mm}B= \begin{pmatrix} 1&-1 & 1\\ 2 & 4 & 8 \end{pmatrix}.\end{align*}

Solución:

  1. Dado que ambas matrices tienen el mismo tamaño, podemos calcular ambas operaciones. Tenemos que hacer las operaciones entrada a entrada. Así, la primer entrada de A+2B será 1+2\cdot 1 = 3. Haciendo lo mismo para cada entrada, obtenemos que

        \begin{align*}A+2B= \begin{pmatrix}3 & 5 & 6\\14 & 17 & 19\\9 & 10 & 13\end{pmatrix} \end{align*}


    De manera similar, obtenemos que

        \begin{align*}A-B=\begin{pmatrix}  0 &-1 & -3 \\ -7 & -7 & -8\\ -3 & -5 &-5\end{pmatrix}.\end{align*}

  2. En este caso las operaciones no tienen sentido, pues una matriz tiene 5 renglones y la otra 6.
  3. Observamos que ambas matrices tienen el mismo tamaño, por lo que sí podemos calcular ambas operaciones:

        \begin{align*}A+2B= \begin{pmatrix}3 & -1 & 4\\ 7 & 13 & 24\end{pmatrix} \hspace{5mm} \text{y} \hspace{5mm} A-B=\begin{pmatrix} 0 &2 & 1 \\ 1 & 1 & 0 \end{pmatrix}.\end{align*}

\square

Problema.

  • a) Considera la función f: \mathbb{R}^2\to \mathbb{R}^2 dada por

        \begin{align*}f(x,y)=(x^2,y^2).\end{align*}


    ¿Es f una transformación lineal?
  • b) Responde la misma pregunta reemplazando \mathbb{R} por \mathbb{F}_2.

Solución.

  • a) No, f no es lineal. Vamos a ver un ejemplo en el cual no «abre sumas». Por un lado, tenemos por definición que f(2,0)=(4,0). Por otro lado, tenemos que (2,0)=(1,0)+(1,0) y que f(1,0)+f(1,0)= (2,0). Es decir

        \begin{align*}f( (1,0)+(1,0) ) \neq f(1,0)+f(1,0).\end{align*}

  • b) Si cambiamos el dominio por \mathbb{F}_2 entonces f sí es lineal. Lo podemos verificar:

        \begin{align*}f(x+y,z+w)&= \left((x+y)^2, (z+w)^2\right)\\&= \left( x^2+y^2+2xy, z^2+w^2+2wz\right)\\&=\left(x^2+y^2, z^2+w^2\right)\\&= \left(x^2,z^2\right)+\left(y^2,w^2\right)\\&= f(x,z)+f(y,w).\end{align*}


    En estas igualdades estamos usando que \mathbb{F}_2 es el campo con dos elementos, en donde se cumple que 2=1+1=0, por lo cual 2xy=0=2wz.
    Por otro lado, si \alpha\in \mathbb{F}_2 es un escalar, entonces

        \begin{align*}f(\alpha\cdot(x,y))&= f(\alpha x, \alpha y)\\&= (\alpha^2 x^2, \alpha^2 y^2)\\&= \alpha^2 \cdot (x^2,y^2)\\&= \alpha \cdot f(x,y).\end{align*}


    De nuevo estamos usando las propiedades del campo \mathbb{F}_2 en la última igualdad. Como \mathbb{F}_2 es el campo con 2 elementos, los valores de \alpha, x,y sólo pueden ser 0 o 1. Como 0^2=0 y 1^2=1, tenemos la igualdad. Concluimos que f es lineal.
  • b)’ Otra manera de resolver el inciso b) es observar que en \mathbb{F}_2, x^2=x para todo x (esto lo usamos con \alpha, x, y en la prueba pasada). Luego la función f coincide con la función identidad, y es más fácil verificar que ésta es lineal.

\square

Problema. Da un ejemplo de un mapeo f:\mathbb{R}^2\to \mathbb{R} que no sea lineal, pero que cumpla

    \begin{align*}f(av)= af(v)\end{align*}

para cualesquiera v\in \mathbb{R}^2 y a\in \mathbb{R}.

Solución. Proponemos

    \begin{align*}f(x,y)= \begin{cases} x & \text{si } y=0\\  y & \text{si } y\neq 0\end{cases}.\end{align*}

Verifiquemos que f cumple la compatibilidad con escalares. Primero, si a=0 es claro que

    \begin{align*}f(av) &= f(0,0)\\&= 0\\&= 0 \cdot f(v)\\&= a\cdot f(v).\end{align*}

Entonces si a=0 se cumple la condición. Ahora supongamos que a\neq 0, tenemos dos subcasos que verificar:

  • Si v=(x,y) con y\neq 0, entonces av= (ax,ay) y ay\neq 0 (pues el producto de reales no nulos es no nulo), por lo que

        \begin{align*}f(av)&= f(ax,ay)\\&= ay\\&= a\cdot f(x,y)=a\cdot f(v).\end{align*}

  • Si v=(x,0) entonces av= (ax,0) y así

        \begin{align*}f(av)&= f(ax,0)\\&= ax\\&= a\cdot f(x,0)=a\cdot f(v).\end{align*}

Así verificamos que f cumple con la condición buscada. Para ver que f no es lineal, observamos que

  • f(1,0)=1
  • f(0,1)=1
  • f(1,1)=1

Y así tenemos

    \begin{align*}f(0,1)+f(1,0)&= 2\\&\neq 1\\&= f(1,1)\\&=f((1,0)+(0,1))\end{align*}

Es decir, existen u y v vectores tales que f(u+v)\neq f(u)+f(v), por lo que f no es lineal.

\square

Entradas relacionadas