Archivo del Autor: Leonardo Ignacio Martínez Sandoval

Leonardo Ignacio Martínez Sandoval

Acerca de Leonardo Ignacio Martínez Sandoval

Hola. Soy Leonardo Martínez. Soy Profesor de Tiempo Completo en la Facultad de Ciencias de la UNAM. Hice un doctorado en Matemáticas en la UNAM, un postdoc en Israel y uno en Francia. Además, me gusta colaborar con proyectos de difusión de las matemáticas como la Olimpiada Mexicana de Matemáticas.

Álgebra Lineal II: Problemas de formas bilineales, cuadráticas y teorema de Gauss

Por Leonardo Ignacio Martínez Sandoval

Introducción

En las entradas anteriores nos dedicamos a recordar las definiciones y algunas propiedades de formas bilineales y cuadráticas en $\mathbb{R}^n$ con el fin de enunciar y demostrar el teorema de Gauss. La prueba da un método para representar cualquier forma cuadrática de este modo, pero es mucho más claro cómo se hace este método mediante ejemplos. En esta entrada veremos un par de problemas para seguir repasando formas bilineales y cuadráticas y luego veremos al teorema de Gauss en acción.

Ver que una función es una forma bilineal

Problema. Tomemos $V= \mathbb{R}^n$ y vectores $x,y$ en $V$ de coordenadas $x=(x_1, . . . , x_n)$ y $y =(y_1, . . . , y_n)$. Tomemos reales $a_1,\ldots, a_n$. Definamos a $b:V\times V\to \mathbb{R}$ como sigue:
\begin {align*} b(x,y)=a_1x_1y_1+ . . . + a_nx_ny_n.\end{align*}

Probemos que así definida, $b$ es una forma bilineal.

Solución. Para probar que $b$ es bilineal, probaremos que la función $b(x, \cdot)$ es lineal para cada $x \in \mathbb{R}^n$ fijo.

Sean $p,q \in \mathbb{R}^n$ y $\lambda \in \mathbb{R}$. Tenemos que:
\begin{align*} b(x,\lambda p+q)=\sum_{i=1}^n a_ix_i (\lambda p_i+q_i).\end{align*}

Como todos los miembros de esta operación son números reales, utilicemos las propiedades distributiva y conmutativa. Obtenemos:

\begin{align*} b(x,\lambda p+q)=&\sum_{i=1}^n a_ix_i \lambda p_i + \sum_{i=1}^n a_ix_iq_i\\
&=\lambda \sum_{i=1}^n a_ix_ip_i+ \sum_{i=1}^n a_ix_iq_i\\&=\lambda b(x,p) + b(x,q). \end{align*}

La demostración de que la función $b(\cdot,y)$ también es lineal para cada $y\in \mathbb{R}^n$ fijo es análoga.

$\square$

En particular, si tenemos que $a_1, \ldots, a_n =1$, obtenemos que $b$ es el producto interno canónico de $\mathbb{R}^n$, es decir el producto punto.

Ver que una función no es una forma cuadrática

Problema. Sea $q: \mathbb{R}^2 \rightarrow \mathbb{R}$ dada como sigue

\begin{align*} q(x,y)=x^2+y^2-8x. \end{align*}

¿Es $q$ una forma cuadrática?

Solución. La respuesta es que no. Con el fin de encontrar una contradicción, supongamos que $q$ sí es una forma cuadrática. Entonces su forma polar $b$ debe cumplir:

\begin{align*} b((x,y),(x,y))=x^2+y^2-8x.\end{align*}

Aplicando lo anterior al par $(-x,-y)$ obtendríamos:

\begin{align*} b((-x,-y),(-x,-y))=x^2+y^2+8x.\end{align*}

Por otro lado, sacando escalares en ambas entradas:

\begin{align*} b((-x,-y),(-x,-y))&=(-1)(-1)b((x,y),(x,y))\\&=b((x,y),(x,y)).\end{align*}

Juntando las igualdades, concluimos que

\begin{align*} x^2+y^2-8x=x^2+y^2+8x \end{align*}

por lo que

\begin{align*} 16x=0. \end{align*}

Pero esto no es cierto en general pues falla, por ejemplo, para la pareja $(1,0)$. Este error nació de suponer que $q$ era una forma cuadrática. Por lo tanto $q$ no es forma cuadrática.

$\triangle$

El teorema de Gauss en acción

Para simplificar el lenguaje, si logramos escribir a una forma cuadrática $q$ como nos dice el teorema de Gauss, es decir, de la forma \begin{align*} q(x)= \sum_{i=1}^r \alpha _i (l_i(x))^2,\end{align*} entonces diremos que $q$ es combinación cuadrática de las $l_i$ con coeficientes $\alpha_i$.

Problema. Toma la forma cuadrática $q$ de $\mathbb{R}^3$ definida como sigue:

\begin{align*} q(x,y,z)= 4xy+yz+xz \end{align*}

Escribe a $q$ como combinación cuadrática de formas lineales linealmente independientes.

Solución. Revisando la demostración dada en la entrada anterior, tenemos tres casos:

  • Que la forma cuadrática sea la forma cuadrática cero.
  • Que tenga «términos puros».
  • Que no tenga «términos puros», es decir, que tenga sólo «términos cruzados».

Como en este caso la forma $q$ no es la forma cero, ni aparecen términos $x^2$, $y^2$ o $z^2$, estamos en el tercer caso. La estrategia era tomar dos de las variables y separar los términos que sí las tengan de los que no. Luego, hay que usar las identidades:

\begin{align} AXY+BX+CY=A\left(X+\frac{C}{A}\right) \left(Y+\frac{B}{A}\right)-\frac{BC}{A},\end{align}

\begin{align} DE= \frac{1}{4}(D+E)^2 – \frac{1}{4} (D-E)^2.\end{align}

Tomemos por ejemplo $x$ y $y$. En la forma cuadrática todos los términos tienen $x$ ó $y$, así que podemos usar la identidad $(1)$ para escribir (nota que reordenamos algunos términos para hacer más cómodas las cuentas con las identidades):

\begin{align*}
4xy+zx+zy&= 4 \left(x+\frac{z}{4}\right) \left(y+\frac{z}{4}\right)-\frac{z^2}{4}
\end{align*}

Luego, continuamos mediante la identidad $(2)$:

\begin{align*}
= \left(x+y+\frac{z}{2}\right)^2 – (x-y)^2- \frac{1}{4} z^2.
\end{align*}

Esta expresión ya tiene la forma buscada. Tenemos que $q$ es combinación cuadrática de las formas lineales $x+y+\frac{z}{2}$, $x-y$ y $z$. Verifica que en efecto estas formas lineales son linealmente independientes.

$\triangle$

Cambiando el orden de los pasos

Problema. ¿Qué pasaría si en el ejemplo anterior en vez de hacer el paso inductivo con $x$ y $y$ hacemos el paso inductivo con $y$ y $z$?

Solución. Las cuentas cambian y obtenemos una nueva forma de escribir a $q$. En efecto, aplicando las identidades $(1)$ y $(2)$ pero ahora a $y$ y $z$ obtendríamos:

\begin{align*}
yz+4xy+xz&= (y+x) (z+4x)-4x^2\\
&=\frac{1}{4}(y+z+5x)^2-\frac{1}{4}(y-z-3x)^2-4x^2.
\end{align*}

Esta es otra forma válida de expresar a $q$ como combinación cuadrática de formas lineales linealmente independientes. Lo que nos dice es que la expresión para $q$ no necesariamente es única.

Sin embargo, un poco más adelante veremos que aunque haya muchas formas de expresar a $q$, en todas ellas permanece constante cuántos sumandos positivos y cuántos negativos hay.

$\triangle$

Cuidado con la independencia lineal

Problema. Toma la forma cuadrática $q$ de $\mathbb{R}^3$ definida como sigue:

\begin{align*} q(x,y,z)= (x – y)^2+(y – z)^2+ (z – x)^2 \end{align*}

Escribe a $q$ como combinación cuadrática de formas lineales linealmente independientes.

Solución. Sería fácil asumir que $q$ ya está de la forma deseada, sin embargo, una revisión rápida nos deja ver qué $x – y$, $y-z$ y $z-x$ no son linealmente independientes en $(\mathbb{R}^3)^*$.

Primero desarrollemos todo

\begin{align*} q(x,y,z)= 2x^2+2y^2+2z^2 -2xy-2xz-2yz \end{align*}

Ahora sí hay «términos puros» pues en particular el coeficiente de $x^2$ no es cero.

En este caso hay que pensar a $q$ como polinomio de segundo grado en $x$ para completar un cuadrado:

\begin{align*} 2x^2+&2y^2+2z^2 -2xy-2xz-2yz\\
&= 2 \left( x- \frac{y+z}{2}\right)^2 – \frac{(y+z)^2}{2} + 2y^2 +2z^2-2yz \end{align*}

La demostración asegura que inductivamente los términos sin $x$ (en este caso $ – \frac{(y+z)^2}{2} + 2y^2 +2z^2-2yz$)se pueden escribir como una combinación cuadrática de formas lineales linealmente independientes. Es decir, a ese término ahora podemos aplicar nuevamente el procedimiento hasta llegar a un caso pequeño.

Sin embargo, para nuestra suerte, una pequeña manipulación muestra que
\begin{align*} – \frac{(y+z)^2}{2} + 2y^2 +2z^2-2yz = \frac{3}{2}(y – z)^2.\end{align*}

También, afortunadamente, $y-z$ es linealmente independiente con $x- \frac{y+z}{2}$. De este modo, una posible combinación cuadrática es la siguiente:

\begin{align*} q(x,y,z)= 2 \left( x- \frac{y+z}{2}\right)^2 + \frac{3}{2}(y – z)^2 \end{align*}

$\triangle$

El algoritmo

Con esto visto, podemos describir un algoritmo para encontrar una combinación cuadrática en 4 pasos.

  1. Desarrollar todos los términos $q$ si es necesario.
  2. Revisar qué forma tiene $q$ con respecto a los 3 casos que se vieron en la demostración.
  3. Reproducir el caso elegido de la demostración, dependiendo de la forma de $q$.
  4. Dentro de este paso, puede ser necesario repetir desde el paso 1.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Lineal II: Introducción a forma canónica de Jordan

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta última unidad usaremos las herramientas desarrolladas hasta ahora para enunciar y demostrar uno de los teoremas más hermosos y útiles en álgebra lineal: el teorema de la forma canónica de Jordan. A grandes rasgos, lo que nos dice este teorema es que cualquier matriz prácticamente se puede diagonalizar. En esta primera entrada hablaremos un poco de qué puedes esperar en el transcurso de la unidad, aunque en un orden algo distinto que te ayudará a entender mejor la motivación de presentar la teoría cómo vendrá en las siguientes notas.

Bloques de Jordan

Un bloque de Jordan de tamaño $k$ y eigenvalor $\lambda$ es una matriz en $M_k(F)$ que se obtiene de comenzar con $\lambda I_k$ y agregar encima de la diagonal principal puros unos. Queda algo así:

$$J_{\lambda,k}=\begin{pmatrix} \lambda & 1 & 0 & \ldots & 0 & 0 \\ 0 & \lambda & 1 & \ldots & 0 & 0 \\ 0 & 0 & \lambda & \ldots & 0 & 0 \\ & \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \ldots & \lambda & 1 \\ 0 & 0 & 0 & \ldots & 0 & \lambda \end{pmatrix}.$$

Puedes notar que esto es prácticamente una matriz diagonal, a excepción de la diagonal de unos que queda por encima de la diagonal principal. Esto debería sugerirte que los bloques de Jordan son casi tan amigables como las matrices diagonales. Como veremos en las siguientes entradas, es muy fácil calcularles su traza, determinante, polinomio característico, polinomio mínimo, eigenvalores, eigenvectores, etc.

A partir de los bloques de Jordan podemos formar matrices de bloques de Jordan pegando varios bloques de Jordan en una diagonal para obtener una matriz del siguiente estilo:

\begin{equation}\label{eq:Jordan}\begin{pmatrix} J_{\lambda_1,k_1} & 0 & 0 & \ldots & 0 \\ 0 & J_{\lambda_2,k_2} & 0 & \ldots & 0 \\ 0 & 0 & J_{\lambda_3,k_3} & \ldots & 0 \\ & \vdots & & \ddots & \vdots \\ 0 & 0 & 0 & \ldots & J_{\lambda_d,k_d}\end{pmatrix}.\end{equation}

Aquí pusimos muchos ceros, pero en el fondo cada uno de estos ceros son una matriz de ceros. Por ejemplo, si tenemos los tres bloques de Jordan $J_{3,2}$, $J_{-2,1}$ y $J_{5,3}$ y pegamos estos bloques, obtenemos la siguiente matriz de bloques:

$$\left( \begin{array}{cc|c|ccc} 3 & 1 & 0 & 0 & 0 & 0 \\ 0 & 3 & 0 & 0 & 0 & 0\\ \hline 0 & 0 & -2 & 0 & 0 & 0 \\ \hline 0 & 0 & 0 & 5 & 1 & 0\\ 0 & 0 & 0 & 0 & 5 & 1 \\ 0 & 0 & 0 & 0 & 0 & 5 \end{array}\right).$$

Recuerda que las líneas que dibujamos en una matriz de bloques son simplemente ayuda visual. Estas matrices también son prácticamente diagonales y, como te imaginarás, también es fácil encontrar muchas de sus propiedades.

Teorema de la forma canónica de Jordan

Si recuerdas, una de las motivaciones fuertes para que nos interesara diagonalizar una matriz $A$ es que la matriz diagonal $D$ semejante comparte muchas propiedades con $A$, pero $D$ es mucho más fácil de entender. A veces no podremos encontrar una matriz diagonal semejante a $A$, pero lo que nos dice el teorema de formas canónicas de Jordan es que prácticamente siempre podremos encontrar una matriz de bloques de Jordan semejante a $A$.

Teorema. Sea $A\in M_n(F)$ una matriz tal que su polinomio característico $\chi_A(X)$ se divide sobre $F$. Entonces, $A$ es similar a una matriz de bloques de Jordan, es decir, una matriz como en \refeq{eq:Jordan}.

En realidad, cuando enunciemos el teorema lo haremos de manera más formal, y hasta diremos en qué sentido la forma canónica de Jordan es única.

¿Por qué decimos que entonces prácticamente siempre podemos diagonalizar una matriz? En cursos más avanzados se muestra que sin importar en qué campo $F$ estemos trabajando, siempre podemos extender el campo $F$ lo suficiente como para que cualquier polinomio se divida sobre una extensión $G$ de $F$. En este campo extendido, cualquier matriz en $M_n(F)$ se puede diagonalizar.

Transformaciones y matrices nilpotentes

Para demostrar el teorema de Jordan, primero tendremos que enunciarlo y demostrarlo para una clase muy especial de matrices: las nilpotentes. Ya hemos hablado un poco de estas matrices en ejercicios particulares y algunos problemas de la tarea moral. Pero si se te pasó, una matriz $A$ en $M_n(F)$ es nilpotente cuando se puede encontrar un expontente $m$ tal que $A^m=O_n$. De manera similar, si $T$ es una transformación lineal, diremos que es nilpotente cuando $T^m=Z$ para algún exponente $m$, donde $Z$ es la transformación lineal trivial que manda todo elemento al $0$. Recuerda que aquí el exponente indica cuántas veces se compone $T$ consigo mismo. Como te imaginarás, $T$ será nilpotente si y sólo si alguna de sus formas matriciales lo es.

Las matrices nilpotentes servirán como nuestros cimientos para demostrar el teorema de la forma canónica de Jordán. Es sencillo ver que los bloques de Jordan de la forma $J_{0,k}$ son nilpotentes. También es sencillo ver que cualquier matriz de bloques de Jordan con puros eigenvalores iguales a cero es nilpotente. Nuestra primera versión del teorema de la forma canónica de Jordán nos dará algo así como un «regreso» de esta afirmación. El siguiente teorema es una versión «light» de lo que demostraremos.

Teorema. Sea $A\in M_n(F)$ una matriz nilpotente. Entonces, $A$ es similar a una matriz de bloques de Jordan, todos ellos con eigenvalor $0$.

La demostración será muy bonita, y hará uso de la teoría de dualidad de Álgebra Lineal I. Una vez que demostremos esta versión, la combinaremos con el teorema de Cayley-Hamilton de la Unidad 1 para obtener el teorema general.

Aplicaciones del teorema de Jordan

Si conocemos la forma canónica de Jordan de una matriz, podemos encontrar a partir de ella fácilmente muchas propiedades, como la traza, determinante, etc. Además de estas aplicaciones «de cálculo de propiedades», el teorema de la forma canónica de Jordán nos permitirá decir exactamente cuándo dos matrices son similares. En particular, veremos que cualquier matriz $A$ es similar a su transpuesta.

Tarea moral

En esta ocasión la tarea moral consistirá en un repaso de contenido anterior tanto de Álgebra Lineal I como Álgebra Lineal II, para que cuentes con todas las herramientas necesarias para aprovechar esta última unidad.

  1. Haz un repaso de la teoría de Matrices de bloques, para recordar a qué se refiere esta notación y cómo se pueden hacer operaciones cuando las matrices están escritas por bloques.
  2. Revisa la entrada de Matrices de cambio de base, para recordar por qué dos matrices similares en el fondo representan a la misma transformación lineal, pero en distintas bases.
  3. Repasa la teoría básica de dualidad en espacios vectoriales. Puedes comenzar con la entrada de Introducción a espacio dual. Concretamente, tendrás que recordar por lo menos hasta la teoría de Ortogonalidad y espacio ortogonal.
  4. Recuerda todo lo que podemos decir de las transformaciones triangularizables, revisando la entrada de Triangularizar y descomposición de Schur, y compara los resultados de ahí con lo que esperamos obtener sobre forma canónica de Jordan. ¿Cuál teorema dice algo más fuerte?
  5. Vuelve a leer todo el contenido relacionado con el teorema de Cayley-Hamilton para recordar no sólo qué dice, sino cómo está relacionado con los eigenespacios asociados a una transformación lineal. Puedes empezar con la entrada de Introducción al teorema de Cayley-Hamilton.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior II: Introducción a estructuras algebraicas

Por Leonardo Ignacio Martínez Sandoval

Introducción

Finalmente terminamos de construir a los números naturales, sus operaciones y su orden. El siguiente conjunto que nos interesa construir es $\mathbb{Z}$, el conjunto de los números enteros. Haremos esto en breve. Sin embargo, primero haremos un paréntesis para hablar de estructuras algebraicas.

Quizás hayas escuchado hablar de varias de ellas. En cálculo y geometría analítica se habla de los números reales y se comenta que es muy importante que sea un campo. En geometría moderna se habla de transformaciones geométricas y cómo algunas de ellas forman un grupo. También es común escuchar de los anillos de enteros o de polinomios (que estudiaremos más adelante). Y por supuesto, también están los espacios vectoriales, que están fuertemente conectados con resolver sistemas de ecuaciones lineales y hacer cálculo y geometría en altas dimensiones.

Todos estos conceptos (campos, grupos, anillos, espacios vectoriales, etc.) son ejemplos de estructuras algebraicas. Cada tipo de estructura algebraica es muy especial por sí misma y sus propiedades se estudian por separado en distintas materias, notablemente aquellas relacionadas con el álgebra moderna. La idea de esta entrada es dar una muy breve introducción al tema, para que te vayas acostumbrando al uso del lenguaje. Esto te servirá más adelante en tu formación matemática.

Intuición de estructuras algebraicas

De manera intuitiva, una estructura algebraica consiste de tomar un conjunto, algunas operaciones en ese conjunto, y ciertas propiedades que tienen que cumplir las operaciones. Eso suena mucho a lo que hemos trabajado con $\mathbb{N}$: es un conjunto, con las operaciones de suma y producto. Y ya demostramos que estas operaciones tienen propiedades especiales como la conmutatividad, la distributividad y la existencia de neutros.

En realidad podríamos tomar cualquier conjunto y cualquier operación y eso nos daría una cierta estructura.

Ejemplo. Consideremos el conjunto $\mathbb{N}$ con la operación binaria $\star$ tal que $$a\star b=ab+a+b.$$ Tendríamos entonces que $$3\star 1=3\cdot 1+3+1= 7,$$ y que $$10\star 10=10\cdot 10 + 10 + 10 = 120.$$

Es posible que la operación $\star$ tenga ciertas propiedades especiales, y entonces algunas proposiciones matemáticas interesantes consistirían en enunciar las propiedades de $\star$.

$\triangle$

Aunque tenemos mucha libertad en decidir cuál es el conjunto, cuáles son las operaciones que le ponemos y qué propiedades vamos a pedir, hay algunos ejemplos que se aparecen muy frecuentemente en las matemáticas. Aparecen de manera tan frecuente, que ameritan nombres especiales. Comencemos a formalizar esto.

Operaciones binarias y magmas

Dado un conjunto $S$, una operación binaria toma parejas de elementos de $S$ y los lleva a otro elemento de $S$. En símbolos, es una función $\star: S\times S\to S$. Cuando usamos la notación de función, tendríamos que escribir todo el tiempo $\times(a,b)$ para referirnos a lo que esta operación le hace a cada pareja de elementos $a$ y $b$ en $S$. Sin embargo, esto resulta poco práctico, y es por esta razón que se usa mucho más la notación $a\times b:=\times (a,b)$.

Ejemplo. En $\mathbb{N}$ ya definimos la operación binaria $+$, que toma dos enteros $a$ y $b$ y los manda a $s_a(b)$, donde $s_a:\mathbb{N}\to \mathbb{N}$ es la función que construimos usando el teorema de recursión estableciendo que $s_a(0)=a$ y $s_a(\sigma(n))=\sigma(s_a(n))$.

$\triangle$

Aquí lo único que nos importa es establecer una operación binaria. No nos importa si tiene otras propiedades adicionales.

Definición. Un magma consiste de un conjunto $S$ con una operación binaria $\ast$.

Otros ejemplos de magma son $\mathbb{N}$ con la operación que dimos en la parte de intuición, o bien $\mathbb{N}$ con el producto que ya definimos. También podemos tener magmas en conjuntos que no sea el de los enteros. Por ejemplo, si $P$ es el conjunto de subconjuntos de $\{0,1,2,3,4\}$, y le damos la operación que manda $A$ y $B$ a $A\cup B\cup \{0\}$, entonces también obtenemos un magma.

Conmutatividad

Cuando tenemos un conjunto $S$ y una operación binaria $\star$ en $S$, puede suceder que de lo mismo hacer $a\star b$ que $b\star a$. Esto ya es una propiedad especial que pueden cumplir las operaciones binarias, y tiene un nombre.

Definición. Decimos que una operación binaria $\star$ en un conjunto $S$ es conmutativa si para cualesquiera dos elementos $a$ y $b$ de $S$ se cumple que $a\star b=b\star a$.

Observa que la igualdad debe suceder para cualesquiera dos elementos. Basta con que falle para una pareja para que la operación ya no sea conmutativa.

Ejemplo. Una de las propiedades que demostramos de la operación de suma en $\mathbb{N}$ es que $s_a(b)=s_b(a)$, es decir, que $a+b=b+a$. En otras palabras, la operación binaria $+$ en $\mathbb{N}$ es conmutativa. Así mismo, vimos que el producto era conmutativo, es decir, que $p_a(b)=p_b(a)$, que en términos de la operación binaria $\cdot$ quiere decir que $a\cdot b=b\cdot a$.

$\triangle$

Más adelante veremos que otras funciones de suma y producto también son conmutativas, por ejemplo, las de los enteros, racionales, reales y complejos. Sin embargo, hay algunas operaciones binarias muy importantes en matemáticas que no son conmutativas. Un ejemplo de ello es el producto de matrices. Otro ejemplo es la diferencia de conjuntos.

Ejemplo. Si $P$ es el conjunto de subconjuntos de $\{0,1,2,3,4\}$ y le damos la operación binaria $\setminus$ tal que dados $A$ y $B$ en $P$ los manda a $A\setminus B$, entonces obtenemos un magma. Sin embargo, la operación $\setminus$ no es conmutativa pues, por ejemplo, $$\{1,2,3\}\setminus\{2,3,4\}=\{1\},$$ pero $$\{2,3,4\}\setminus\{1,2,3\}=\{4\}.$$

$\triangle$

En $\mathbb{N}$ no tenemos una operación de resta, como discutiremos en breve. Pero en el conjunto de los enteros sí, y ese sería otro ejemplo de una operación que no es conmutativa.

Asociatividad y semigrupos

Otra de las propiedades importantes que demostramos de la suma y producto de naturales es que son operaciones asociativas. En general, podemos definir la asociatividad para una operación binaria como sigue.

Definición. Sea $\star$ una operación binaria en un conjunto $S$. Decimos que $\star$ es asociativa si $a\star (b\star c)=(a\star b)\star c$ para cualesquiera tres elementos $a,b,c$ de $S$.

Tanto la suma como el producto de naturales dan una operación asociativa pues ya demostramos que si $a,b,c$ son naturales, entonces $a+(b+c)=(a+b)+c$ y $a(bc)=(ab)c$. Esta propiedad también la tendremos para la suma y producto de enteros, racionales, reales, complejos, polinomios, etc.

A partir de la asociatividad podemos definir la primer estructura algebraica que requiere un poco más de propiedades.

Definición. Un semigrupo es un conjunto $S$ con una operación asociativa $\star$.

Si además $\star$ es una operación conmutativa, entonces decimos que es un semigrupo conmutativo. En realidad, en cualquiera de las definiciones que daremos a continuación podemos agregar el adjetivo «conmutativo» y esto querrá decir que además de las propiedades requeridas, también se cumple que la operación es conmutativa.

En los semigrupos (y demás estructuras con asociatividad) tenemos la ventaja de que podemos «olvidarnos de los paréntesis» sin la preocupación de que haya ambigüedad. Por ejemplo, en los naturales la expresión $3+((2+4)+8)$ se puede escribir simplemente como $3+2+4+8$, pues cualquier otra forma de poner paréntesis, como $(3+2)+(4+8)$, debe dar exactamente el mismo resultado por asociatividad.

Ejemplo. Una operación que no es asociativa es la resta en los enteros. Aunque no hemos definido formalmente esta operación, es intuitivamente claro que $3-(2-1)$ no es lo mismo que $(3-2)-1$.

$\triangle$

Unidades y magmas unitales

A veces sucede que algunos elementos de un conjunto «no afectan a nadie» bajo una cierta operación binaria dada. Por ejemplo, en los naturales «sumar cero» no cambia a ningún entero.

Definición. Sea $\star$ una operación binaria en un conjunto $S$. Una unidad o neutro para $\star$ es un elemento $e$ en $S$ para el cual se cumple que para cualquier elemento $a$ de $S$ se tenga $a\star e = a$ y $e\star a = a$.

Observa que es muy importante pedir las dos igualdades de la definición. Si una se cumple, no necesariamente tiene que pasar la otra, pues no necesariamente la operación es conmutativa. Por supuesto, si ya se sabe que la operación es conmutativa, entonces basta con ver una de ellas.

En $\mathbb{Z}$ tenemos las operaciones de suma y producto. Para no confundir a sus neutros, a $0$ le llamamos el neutro aditivo para hacer énfasis que es el neutro de la suma. Y a $1$ le llamamos el neutro multiplicativo para hacer énfasis que es el neutro del producto. Entre las propiedades que probamos, en efecto vimos que $a+0=a=0+a$ y que $a\cdot 1 = a = 1\cdot a$ para cualquier entero $a$.

Definición. Un magma unital es un conjunto $S$ con una operación $\star$ que tiene un neutro.

El conjunto de naturales con la operación $\star$ que dimos en la sección de intuición también es un magma unital. ¿Puedes decir quién es su neutro?

Monoides

Se puede pedir más de una propiedad a una operación binaria y entonces obtenemos estructuras algebraicas más especiales.

Definición. Un monoide es un conjunto $S$ con una operación $\star$ que es asociativa y que tiene un neutro.

En otras palabras, un monoide es un magma unital con operación asociativa. O bien, un semigrupo cuya operación tiene unidad. Por supuesto, si la operación además es conmutativa entonces decimos que es un monoide conmutativo.

Ejemplo. Por todo lo que hemos visto en esta entrada, tenemos que $\mathbb{N}$ con la suma es un monoide conmutativo. Así mismo, $\mathbb{N}$ con el producto es un monoide conmutativo.

$\triangle$

Semianillos

La última idea importante para discutir en esta entrada es que una estructura algebraica puede tener más de una operación binaria, y además de pedir propiedades para cada operación, también se pueden pedir propiedades que satisfagan ambas operaciones en igualdades que las involucran a las dos.

Definición. Un seminanillo es un conjunto $S$ con dos operaciones binarias $\square$ y $\star$ que satisfacen las siguientes propiedades:

  • $\square$ es un monoide conmutativo
  • $\star$ es un monoide
  • Se cumple distributividad, es decir, que para cualesquiera tres elementos $a,b,c$ de $S$ se tiene $a\star(b\square c) = (a\star b)\square(a\star c)$ y $(a\square b)\star c = (a\star c)\square(b\star c)$.
  • El neutro $e$ de $\square$ aniquila a los elementos bajo $\star$, es decir, para cualquier elemento $a$ de $S$ se tiene que $a\star 0=0$ y $0\star a = 0$.

Un semianillo conmutativo es un semianillo en donde la operación $\star$ también es conmutativa. Las propiedades que hemos de los números naturales nos permiten enunciar el siguiente resultado.

Teorema. El conjunto $\mathbb{N}$ con las operaciones binarias de suma y producto es un semianillo conmutativo.

Más adelante…

Este sólo fue un pequeño paréntesis para comenzar a hablar de operaciones binarias y de estructuras algebraicas. Ahora regresaremos a seguir construyendo de manera formal los sistemas numéricos con los que se trabaja usualmente: los enteros, los racionales, los reales y los complejos.

Un poco más adelante haremos otro paréntesis de estructuras algebraicas, en el que hablaremos de otras propiedades más que puede tener una operación binaria. Una muy importante es la existencia de inversos para la operación binaria. Esto llevará a las definiciones de otras estructuras algebraicas como los grupos, los anillos, los semigrupos con inversos, los quasigrupos y los campos.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra el neutro de la operación $\star$ dada en la sección de intuición. Verifica que en efecto es un neutro.
  2. Demuestra que el conjunto de los naturales pares $\{0,2,4,6,\ldots\}$ sí tiene un neutro para la operación de suma, pero no para la operación de producto.
  3. Considera el conjunto $P(S)$ de subconjuntos de un conjunto $S$. Considera las operaciones binarias de unión e intersección de elementos de $P(S)$. Muestra que $P(S)$ con estas operaciones es un semianillo conmutativo.
  4. Da un ejemplo de un magma que no sea un magma unital. Da un ejemplo de un magma unital que no sea un monoide.
  5. Da o busca un ejemplo de un semianillo que no sea un semianillo conmutativo.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Inversas de matrices de 2×2 con reducción gaussiana

Por Leonardo Ignacio Martínez Sandoval

Introducción

Es posible que sepas que una matriz $$A=\begin{pmatrix}
a & b\\
c & d
\end{pmatrix}$$de $2\times 2$ es invertible si y sólo si $ad-bc=0$, y que en ese caso la inversa está dada por $$B=\frac{1}{ad-bc}\begin{pmatrix}
d & -b\\
-c & a
\end{pmatrix}.$$ De hecho, una vez que se propone a $B$ como esta matriz, es sencillo hacer la multiplicación de matrices y verificar que en efecto tanto $AB$ como $BA$ son la matriz identidad de $2\times 2$.

Sin embargo, la idea de esta entrada es deducir que $ad-bc$ tiene que ser distinto de $0$ para que $A$ sea invertible y que, en ese caso, la inversa tiene que ser de la forma que dijimos. En esta deducción no usaremos nunca la definición ni propiedades de determinantes.

El procedimiento

Lo que haremos es aplicar el procedimiento de reducción gaussiana para encontrar inversas, es decir, le haremos reducción gaussiana a la matriz $A’=\begin{pmatrix}
a & b & 1 & 0\\
c & d & 0 & 1
\end{pmatrix}$ obtenida de «pegar» a la matriz $A$ una matriz identidad a su derecha. Es un resultado conocido que si $A$ es invertible, entonces al terminar la reducción gaussiana de $A’$ la matriz de $2\times 2$ que queda a la izquierda será la identidad y la que quede a la derecha será la inversa de $A$.

Empecemos con una matriz $A=\begin{pmatrix}
a & b\\
c & d
\end{pmatrix}$ de $2\times 2$ cualquiera. Si ambos $a$ y $c$ son iguales a $0$, entonces la primer columna de $BA$ es $0$ para toda $B$, y por lo tanto $A$ no puede tener inversa. Así, una primera condición para que $A$ tenga inversa es que $a$ o $c$ sean distintos de cero. Si $a$ fuera $0$, el primer paso de reducción gaussiana sería intercambiar las filas, así que podemos suponer sin pérdida de generalidad que $a$ no es $0$. De este modo, el primer paso de reducción gaussiana es multiplicar la primer fila por $1/a$ para que el pivote sea $1$: $$\begin{pmatrix}
1 & \frac{b}{a}& \frac{1}{a} & 0\\
c & d & 0 & 1
\end{pmatrix}$$

El siguiente paso es hacer al resto de las entradas en la columna de ese primer pivote iguales a $0$. Para eso basta restar a la segunda fila $c$ veces la primera:

$$\begin{pmatrix}
1 & \frac{b}{a}& \frac{1}{a} & 0\\
0 & d – \frac{bc}{a} & -\frac{c}{a} & 1
\end{pmatrix}=\begin{pmatrix}
1 & \frac{b}{a}& \frac{1}{a} & 0\\
0 & \frac{ad-bc}{a} & -\frac{c}{a} & 1
\end{pmatrix}.$$

Si $ad-bc=0$, entonces el pivote de la segunda fila ya no quedaría en la segunda columna, y la forma escalonada reducida no tendría a la identidad a la izquierda. Así que una segunda condición para que $A$ sea invertible es que $ad-bc$ no sea cero. Notemos que si $ad-bc$ no es cero, entonces tampoco $a$ y $c$ son simultaneamente $0$, así que nuestra condición anterior ya está capturada con pedir que $ad-bc$ no sea cero.

Sabiendo que $ad-bc$ no es cero, el siguiente paso en la reducción gaussiana es multiplicar la segunda fila por $a/(ad-bc)$ para hacer el pivote igual a $1$:

$$\begin{pmatrix}
1 & \frac{b}{a}& \frac{1}{a} & 0\\
0 & 1 & -\frac{c}{ad-bc} & \frac{a}{ad-bc}
\end{pmatrix}.$$

Finalmente, para que el pivote de la segunda columna sea la única entrada no cero, tenemos que restar a la primera fila la segunda multiplicada por $-b/a$:

$$\begin{pmatrix}
1 & 0 & \frac{1}{a}+\frac{bc}{a(ad-bc)} & -\frac{b}{ad-bc}\\
0 & 1 & -\frac{c}{ad-bc} & \frac{a}{ad-bc}
\end{pmatrix}=\begin{pmatrix}
1 & 0 & \frac{d}{ad-bc} & -\frac{b}{ad-bc}\\
0 & 1 & -\frac{c}{ad-bc} & \frac{a}{ad-bc}
\end{pmatrix}.$$

Así, basta pedir $ad-bc$ para que la reducción gaussiana deje a la identidad en la matriz de $2\times 2$ de la izquierda y, al terminar el procedimiento, tenemos a la derecha a la inversa de $A$ que es la matriz:

$$\begin{pmatrix}
\frac{d}{ad-bc} & -\frac{b}{ad-bc}\\
-\frac{c}{ad-bc} & \frac{a}{ad-bc}
\end{pmatrix}=\frac{1}{ad-bc}\begin{pmatrix}
d & -b\\
-c & a
\end{pmatrix}.$$

Esto es a lo que queríamos llegar. Por supuesto, el camino fue largo y hay formas de llegar al mismo resultado de manera más corta, pero usando más teoría.

¿Ahora qué?

Si te gustó esta entrada, puedes compartirla o revisar otras relacionadas con matemáticas a nivel universitario:

Geometría Analítica I: Introducción al curso

Por Leonardo Ignacio Martínez Sandoval

Introducción

Bienvenido al curso de Geometría Analítica I. A través de esta serie de entradas cubriremos el temario oficial del programa de la materia tal y como se requiere en la Facultad de Ciencias de la UNAM. Esto incluye desarrollar no sólo habilidades para ejecutar procedimientos («hacer cuentitas»), sino también aquellas que nos permitan deducir los resultados que obtendremos a través de razonamientos lógicos («demostrar»).

Pre-requisitos del curso

En la mayoría de las entradas seguiremos un flujo matemático, en el cual escribiremos definiciones, proposiciones, ejemplos, teoremas y otro tipo de enunciados matemáticos. Siempre que digamos que algo sucede, es importante argumentar o justificar por qué es esto, es decir, que demos una demostración. Las demostraciones nos ayudarán a justificar que ciertos procedimientos (para encontrar distancias, ángulos, etc.) son válidos.

Para entender un poco más al respecto, te recomendamos leer las siguientes dos entradas, o incluso llevar a la par un curso de Álgebra Superior I:

Además de estos pre-requisitos de pensamiento lógico, también es importante que recuerdes algunos de los conceptos fundamentales de geometría (punto, línea, segmento, triángulo, distancia, etc.). Si bien todo lo construiremos «desde cero», el recordar estos conceptos te ayudará mucho en la intuición de por qué ciertas cosas las definimos como lo haremos, y por qué ciertos enunciados que planteamos «deben ser ciertos».

Finalmente, también supondremos que sabes manejar a buen nivel las operaciones y propiedades en $\mathbb{R}$, los números reales. Por ejemplo, que la suma es conmutativa ($a+b=b+a$), que se distribuye con el producto ($a(b+c)=ab+ac$), etc. Si bien en otros cursos se definen a los reales con toda formalidad, para este curso sólo será importante que sepas hacer estas operaciones.

La idea fundamental

La geometría se trata de figuras, de ver, de medir. El álgebra se trata de sumar, de operar, de comparar. La idea clave que subyace a la geometría analítica, como la veremos en este curso, es la siguiente:

La geometría y el álgebra son complementarias e inseparables, ninguna con más importancia sobre la otra. Podemos entender al álgebra a partir de la geometría, y viceversa.

Un ejemplo muy sencillo que se ve desde la educación básica es que la suma de reales se corresponde con «pegar segmentos». Si en la recta real tenemos un segmento de longitud $a$ y le pegamos un segmento de longitud $b$, entonces el segmento que se obtiene tiene longitud $a+b$. Si bien es obvio, cuando estemos estableciendo los fundamentos tendremos que preguntarnos, ¿por qué pasa? ¿qué es pegar segmentos?

Nuestro objetivo será entender a profundidad muchas de estas equivalencias.

Interactivos

En este curso procuraremos incluir interactivos para que explores las ideas que vayamos introduciendo. Si bien un interactivo no reemplaza a una demostración, lo cierto es que sí ayuda muchísimo a ver más casos en los cuales una proposición o teorema se cumple. Nuestros interactivos están hechos en GeoGebra y necesitarás tener activado JavaScript en tu navegador.

En el siguiente interactivo puedes mover los puntos $A$, $B$ y $C$. Observa como la suma de dos segmentos siempre es igual al tercero. ¿Qué pasa si $B$ «se pasa de $C$»? ¿Cuál segmento es la suma de los otros dos?

Te recomendamos fuertemente que dediques por lo menos un rato a jugar con los interactivos: intenta ver qué se puede mover, qué no, qué cosas piensas que suceden siempre y para cuales crees que haya ejemplos que fallen.

Más adelante…

En esta entrada platicamos de cómo son las notas del curso en general. Platicamos de pre-requisitos y de la idea fundamental que subyace al curso. A partir de la siguiente entrada comenzaremos con el tratamiento teórico de la materia. Hablaremos de dos visiones de geometría: la sintética y la analítica. Veremos un primer resultado que nos dice que, en realidad, ambas están muy relacionadas entre sí.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Escribe en una hoja de papel o en un documento digital qué significan para ti los siguientes términos: punto, línea, círculo, plano, semiplano, elipse, intersección, alineado, longitud, ángulo, dirección, vector. ¿En cuáles de estas palabras tuviste que usar las otras? ¿En cuáles no? Más adelante formalizaremos cada una de estas.
  2. Explora el inicio del siguiente libro digital: Euclides de Byrne.
  3. Si aprendes a manejar GeoGebra por tu cuenta, podrás hacer interactivos tú mismo. Si te interesa esto, revisa el siguiente curso de GeoGebra.
  4. ¿Cómo le harías para a cada punto del plano asociarle una pareja de números reales? ¿Cómo le harías para a cada pareja de números reales asociarle un punto en el plano?
  5. Si la suma de números corresponde a pegar segmentos, ¿a qué corresponde la multiplicación de números?

Entradas relacionadas