Archivo de la etiqueta: álgebra superior

Álgebra Superior I: Introducción a vectores y matrices con entradas reales

Por Eduardo García Caballero

Introducción

Los vectores y las matrices son algunos de los objetos matemáticos que nos encontraremos con mayor frecuencia durante nuestra formación matemática. Esto se debe a que nos permiten abordar con sencillez varios problemas de distintas áreas de las matemáticas, como lo son la geometría analítica y la teoría de gráficas. Además, nos ayudan a modelar con gran precisión fenómenos de otras disciplinas, como de la mecánica clásica, gráficos por computadora, circuitos eléctricos, robótica, entre otras.

A pesar de que el estudio a profundidad de los vectores y matrices lo realizaremos en los cursos de Álgebra Lineal I y Álgebra Lineal II, esto no es un impedimento para que nos familiaricemos con varios de los conceptos, técnicas y algoritmos que nos permitirán sacar provecho a esta maravillosa área de las matemáticas.

¿Qué son los vectores?

Dependiendo del área que estudiemos, nos podríamos encontrar con distintas definiciones de vectores. Por ejemplo, en la mecánica clásica se visualiza a los vectores como flechas en el plano o en el espacio, ancladas en un «origen» o en cualquier otro punto del plano. En ciencias de la computación, entenderemos que un vector consiste en un arreglo en el que todas sus entradas son datos del mismo tipo. Como veremos más adelante, las distintas formas de visualizar los vectores son equivalentes.

En este curso trabajaremos con un tipo específico de vectores: los vectores cuyas entradas son números reales. ¿Números reales? Sí. Aquí el temario de la asignatura de un brinco un poco grande. Hasta ahora, hemos intentado construir las matemáticas desde sus fundamentos: lógica, conjuntos, funciones, números naturales, etc. Sin embargo, ahora trabajaremos con el conjunto $\mathbb{R}$ de números reales.

Ya platicamos de que el conjunto de naturales $\mathbb{N}$ se puede pensar desde un sistema axiomático y que de hecho podemos «construir» a los naturales a partir de nociones de teoría de conjuntos. En el curso de Álgebra Superior 2 se platica de cómo construir al conjunto $\mathbb{Z}$ de enteros a partir de $\mathbb{N}$, al conjunto $\mathbb{Q}$ de racionales a partir de $\mathbb{Z}$ y finalmente de cómo construir a $\mathbb{R}$ desde $\mathbb{Q}$. Pero por ahora supondremos la existencia de $\mathbb{R}$ y que cumple todos los axiomas que se tratan por ejemplo en un curso de Cálculo Diferencial e Integral I.

Vectores con entradas reales

Un vector con entradas reales lo podemos entender como una lista ordenada de uno o más números (también conocida como tupla) en la que todos sus valores son números reales. Aquí «lista ordenada» lo pensamos no en el sentido de que sus entradas «van creciendo o decreciendo en orden», sino en el sentido «ordenado» como de parejas ordenadas de la segunda unidad de estas notas. Es decir, no nos importan no sólo los números usados, sino también en qué lugar quedaron.

Un ejemplo que seguramente ya has visto en tus clases de geometría analítica son los vectores en el plano o en el espacio. Recordemos que el vector $(5, \pi)$ determina una única posición en el plano, mientras que $\left(8, \sqrt{2}, \tfrac{4}{3}\right)$ determina una única posición en el espacio. Como ambas tuplas están formadas únicamente por números reales, podemos decir que son vectores con entradas reales. A cada uno de los números que aparecen en la lista le llamaremos entrada, y nos podemos referir a la posición de la entrada para decir cuál es su valor; por ejemplo, la primera entrada de $(5, \pi)$ es $5$, mientras que la tercera entrada de $\left(8, \sqrt{2}, \tfrac{4}{3}\right)$ es $\tfrac{4}{3}$.

Como recordarás, decimos que estos vectores se encuentran en $\mathbb{R}^2$ y $\mathbb{R}^3$, respectivamente. Analizando los ejemplos, te darás cuenta de que el número que acompaña a $\mathbb{R}$ se refiere a la cantidad de números reales que están enlistados en cada vector. Entonces, probablemente te preguntarás qué pasa con listas de más números. Aunque quizá sean más difíciles de visualizar (¡aunque no imposibles!), también existen vectores con cuatro, cinco o incluso más entradas. Esto nos lleva a la siguiente definición.

Definición. Para un número entero positivo $n$, un vector con $n$ entradas reales es una lista ordenada de $n$ elementos, el cual escribiremos $(x_1,x_2,\ldots,x_n)$. El conjunto $\mathbb{R}^n$ consiste de todos los vectores con $n$ entradas reales.

Así, podemos ver que tenemos que $(1,-3.5,e,1)$ es un vector en $\mathbb{R}^4$, mientras que $(1,1,2,3,5,7,13)$ es un vector en $\mathbb{R}^7$. En notación de conjuntos, $(1,-3.5,e,1)\in\mathbb{R}^4$ y $(1,1,2,3,5,7,13)\in\mathbb{R}^7$.

Una forma de empezar a ver cómo los vectores se relacionan entre ellos es preguntándonos cuándo estos son iguales. La primera condición que seguramente se nos vendrá a la mente es que los dos vectores deben tener la misma longitud; de este modo, podemos inmediatamente descartar que $(5, \pi)$ y $(8, \sqrt{2}, \tfrac{4}{3})$ sean iguales.

Otra condición que seguramente consideraremos es que todas sus entradas deben ser iguales. Así, podemos también descartar que $(5, \pi)$ y $(4, 8)$ sean iguales. Sin embargo, ¿son $(5,\pi)$ y $(\pi, 5)$ iguales? Como recordarás, los vectores son listas ordenadas, por lo que no sólo es importante que tengan las mismas entradas, sino que también aparezcan en el mismo orden. Así, podemos también descartar que $(5,\pi)$ y $(\pi, 5)$ sean iguales: basta ver con que la primera entrada del $(5,\pi)$ es $5$, mientras que la primera entrada de $(\pi,5)$ es $\pi$, y claramente $5\ne\pi$. Así mismo, $(1,5,8,1,3)$ es distinto de $(1,5,8,1,4)$ pues aunque compartan muchos elementos en varias de sus posiciones, en el primer vector la última entrada es $3$ y el el segundo la última entrada es $4$.

Definición. Diremos que dos vectores $(x_1,\ldots,x_n)$ y $(y_1,\ldots,y_n)$ de $\mathbb{R}^n$ son iguales si para toda $i=1,\ldots,n$ se tiene que $x_i=y_i$

Por otra parte, antes dijimos que los vectores tienen varias formas de ser representados. Como ejemplo de esto, podemos ver que el vector $(1,-3.5,e,1)$ puede ser representado como

\[
\begin{pmatrix}
1 \\
-3.5 \\
e \\
1
\end{pmatrix}
\qquad
\text{y}
\qquad
\begin{pmatrix}
1 & -3.5 & e & 1
\end{pmatrix}.
\]

Al formato de la izquierda se le conoce como vector vertical o vector columna, mientras que al formato de la derecha se le conoce como vector horizontal o vector fila. Dependiendo del contexto, en ocasiones nos encontraremos con estas representaciones en vez de la que mostramos inicialmente, aunque es importante recordar que siguen siendo vectores con entradas reales, pues son listas ordenadas de números reales.

Matrices con entradas reales

Otro objeto matemático en el que también se enlistan varios números reales se conoce como matriz, con la diferencia de que esta lista tiene forma de arreglo rectangular.

Definición. Una matriz con entradas reales es un arreglo rectangular en donde en cada una de sus posiciones se coloca un número real.

Por ejemplo, las siguientes son matrices con entradas reales:

\[
\begin{pmatrix}
0 & 8 & -4.5 \\
2 & 9 & 0 \\
1 & \pi & 5
\end{pmatrix},
\qquad
\begin{pmatrix}
0 & -3 & 9 & 4.25 \\
100 & 0.1 & -2 & \sqrt{2}
\end{pmatrix}.
\]
Como podrás ver, para poder identificar a una entrada de una matriz debemos de hacer referencia a dos propiedades: el número de fila y el número de columna en el que se encuentra. Las filas se cuentan de arriba hacia abajo, y las columnas de izquierda a derecha. Así, vemos que la entrada que se encuentra en la fila 3 y columna 2 de la primera matriz es $\pi$. A cada entrada le asignamos una coordenada $(i,j)$, donde $i$ es el número de fila y $j$ es el número de columna. Así, $\pi$ se encuentra en la posición $(3,2)$ de la primera matriz.

Por convención, cuando mencionamos el tamaño de una matriz, primero se especifica el número de filas y posteriormente el número de columnas. Así, la primera matriz es de tamaño $3\times 3$, mientras que la segunda es de tamaño $2 \times 4$. Ya que elegimos el tamaño de una matriz, podemos considerar a todas las matrices de ese tamaño.

Definición. El conjunto $M_{m,n}(\mathbb{R})$ consiste de todas las matrices de $m$ filas, $n$ columnas y en donde cada entrada es un número real.

En el caso de que la cantidad de filas y de columnas de la matriz sean el mismo, diremos que se trata de una matriz cuadrada. De nuestros ejemplos anteriores, la primera sí es una matriz cuadrada, pero la segunda no. Para simplificar un poco la notación, introducimos lo siguiente.

Definición. El conjunto $M_n(\mathbb{R})$ consiste de todas las matrices de $n$ filas, $n$ columnas y en donde cada entrada es un número real.

Es decir, simplemente $M_n(\mathbb{R})=M_{n,n}(\mathbb{R})$.

Al igual que pasa con los vectores, podemos comparar dos matrices para saber si estas son iguales. Como te podrás imaginar, hay algunas condiciones que dos matrices deben cumplir para ser iguales: en primera, ambas deben de tener el mismo tamaño; es decir, sus números de filas deben de ser iguales y sus números de columnas deben de ser iguales. Por lo tanto, vemos que las matrices mostradas anteriormente son diferentes. Además, sus correspondientes entradas deben de ser iguales. Podemos escribir esto en una definición como sigue.

Definición. Sean $A$ y $B$ matrices en $M_{m,n}(\mathbb{R})$. Diremos que estas matrices son iguales si para cada $i\in \{1,\ldots,m\}$ y cada $j\in \{1,\ldots,n\}$ se cumple que la entrada $(i,j)$ de $A$ es la misma que la entrada $(i,j)$ de $B$.

¿Puedes decir por qué las siguientes matrices son diferentes?
\[
\begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix}
\ne
\begin{pmatrix}
1 & 4 & 7 \\
2 & 5 & 8 \\
3 & 6 & 9
\end{pmatrix}.
\]

Notación y algunos vectores y matrices especiales

En matemáticas, es usual que denotemos los vectores con letras minúsculas (siendo las más comunes la $u$, $v$ y $w$) aunque muchas veces te podrás encontrar con notaciones especiales que los hacen más fáciles de distinguir, por ejemplo, $\overrightarrow{a}$ o $\mathbf{a}$. Nosotros no haremos esta distinción y usaremos simplemente letras minúsculas. Por ejemplo podríamos tomar al vector $u=(1,2,3)$ de $\mathbb{R}^3$.

Por su parte, las matrices las solemos representar con letras mayúsculas (generalmente las primeras del abecedario: $A$, $B$, $C$). Si la entrada que se encuentra en la fila $i$ y colmuna $j$ de la matriz se le denota como con la correspondiente letra minúscula y con subíndices la posición de su entrada: $a_{ij}$. Así, tendríamos que en
\[
A=
\begin{pmatrix}
0 & 8 & -4.5 \\
2 & 9 & 0 \\
1 & \pi & 5
\end{pmatrix}
\]
la entrada $a_{13} = -4.5$ y la entrada $a_{31} = 1$. ¿Cuál es la entrada $a_{23}$?

Además, existen algunos vectores y matrices con entradas reales que nos encontraremos con bastante frecuencia, y por esta razón reciben nombres especiales:

  • El vector en el que todas sus entradas son el número cero se conoce como vector cero o vector nulo. Por ejemplo, el vector nulo en $\mathbb{R}^2$ es $ (0,0)$ mientras que el nulo en $\mathbb{R}^3$ es $(0,0,0)$. Generalmente, denotamos este vector como $0$ (o, en ocasiones, como $\overrightarrow{0}$ o $\mathbf{0}$) .Es importante observar que se usa el mismo símbolo para representar a los vectores nulos con números distintos de entradas (de modo que podremos encontrar que $0=(0,0)$, en el caso de $\mathbb{R}^2$, o que $0=(0,0,0)$, en el caso de $\mathbb{R}^3$). Esto es algo que debemos tener en cuenta, aunque no suele representar mayores complicaciones, pues el contexto nos dirá 1) Si el símbolo $0$ se usa para el real cero o el vector cero y 2) Con cuántas entradas estamos trabajando.
  • La matriz en el que todas sus entradas son cero se conoce como matriz cero o matriz nula. Ejemplos de matrices nulas son
    \[
    \begin{pmatrix}
    0 & 0 & 0 & 0 \\
    0 & 0 & 0 & 0 \\
    0 & 0 & 0 & 0
    \end{pmatrix}
    \qquad
    \text{y}
    \qquad
    \begin{pmatrix}
    0 & 0 \\
    0 & 0
    \end{pmatrix}.
    \]
    Estas matrices se suelen denotar con el símbolo $\mathcal{O}$, aunque en el caso de las matrices sí es común especificar las dimensiones de la matriz, de modo que la primera matriz escrita en este inciso se denota como $\mathcal{O}_{3\times 4}$ mientras que una matriz cuadrada, como la segunda de este inciso, se denota como $\mathcal{O}_2$.
  • El vector en $\mathbb{R}^n$ cuya $i$-ésima entrada es $1$ y el resto de sus entradas es $0$ se conoce como vector canónico, y se denota $\mathrm{e}_i$. Por ejemplo, el vector canónico $\mathrm{e}_3$ en $\mathbb{R}^4$ es $(0,0,1,0)$.
  • Además, al conjunto de todos los posibles vectores canónicos en $\mathbb{R}^n$ se conoce como la base canónica de $\mathbb{R}^n$; así, la base canónica de $\mathbb{R}^4$ es
    \[
    \{(1,0,0,0), \ (0,1,0,0), \ (0,0,1,0), (0,0,0,1)\} = \{\mathrm{e}_1, \mathrm{e}_2, \mathrm{e}_3, \mathrm{e}_4\}.
    \]
  • Llamamos diagonal de una matriz cuadrada a las componentes cuyos número de fila y número de columna coinciden. Además, diremos que una matriz es una matriz diagonal si es una matriz cuadrada en la que todas sus entradas que no están en la diagonal (es decir, que su número de fila es distinto a su número de columna) son cero. Ejemplos de matrices diagonales son
    \[
    \begin{pmatrix}
    5 & 0 & 0 \\
    0 & 8 & 0 \\
    0 & 0 & \pi
    \end{pmatrix}
    \qquad
    \text{y}
    \qquad
    \begin{pmatrix}
    6 & 0 & 0 & 0 \\
    0 & 7 & 0 & 0 \\
    0 & 0 & 0 & 0 \\
    0 & 0 & 0 & 9
    \end{pmatrix}
    \]
    (Observemos que aquellas entradas que se encuentran sobre su diagonal también pueden ser cero, aquí no tenemos ninguna restricción).
  • La matriz diagonal en la que todas sus entradas sobre la diagonal son 1 se conoce como matriz identidad. Ejemplos de matrices identidad son
    \[
    \begin{pmatrix}
    1 & 0 & 0\\
    0 & 1 & 0 \\
    0 & 0 & 1
    \end{pmatrix}
    \qquad
    \text{y} \\
    \qquad
    \begin{pmatrix}
    1
    \end{pmatrix}.
    \]
    A esta matriz la denotamos por $\mathcal{I}$ y especificamos su tamaño como subíndice. Así, las matrices anteriores son ${I}_3$ e $\mathcal{I}_1$.

Más adelante…

En esta entrada vimos las definiciones de vectores y matrices con entradas reales que usaremos para trabajar en este curso. También revisamos cuándo dos vectores (o matrices) son iguales. Además, vimos algunos ejemplos de vectores y matrices que nos encontraremos con bastante frecuencia en las matemáticas.

En las siguientes entradas veremos que también se pueden hacer operaciones entre vectores y matrices, aunque necesitaremos que se cumplan algunas condiciones especiales.

Tarea moral

  1. Basándonos en la definiciones, verifica las siguientes igualdades:
    • El vector $(4-4,1,3)$ es igual al vector $(0,2-1,2+1)$.
    • La matriz $A=\begin{pmatrix} 1 & 2 \\ 2 & 4\end{pmatrix}$ es igual a la matriz $B$ de $2\times 2$ cuyas entradas están dadas por $b_{ij}=i\cdot j$.
  2. Encuentra todos los posibles vectores que hay en $\mathbb{R}^3$ cuyas entradas sean únicamente los números $1$ y $2$. ¿Cuántos deben de ser?
  3. Seguramente algunos los nombres de los vectores y matrices especiales te recuerdan a algún tipo de operación. ¿Qué operaciones crees que podamos hacer con los vectores y/o matrices, y qué comportamiento tendrían aquellos que reciben un nombre especial?
  4. ¿Por qué podemos decir que una matriz nula cuadrada cumple con ser una matriz diagonal?
  5. Escribe todos los elementos de la base canónica de $\mathbb{R}^6$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior II: Números primos y sus propiedades

Por Ana Ofelia Negrete Fernández

Introducción

En esta entrada hablaremos de los protagonistas de entre los números enteros: los números primos. Es difícil poder enunciar en palabras sencillas la importancia que tienen este tipo de números, así que haremos un recorrido que incluye lo siguiente. Comenzaremos dando la definición de qué es un número primo, y haremos algunas aclaraciones conceptuales. Luego, enunciaremos propiedades de divisibilidad que cumplen los números primos y que son muy únicas a ellos. Esto nos ayudará a entender un poco de las razones por las cuales son especiales.

Finalmente, dejaremos preparado el terreno para poder hablar de dos resultados fundamentales sobre los números primos en la próxima entrada: el teorema fundamental de la aritmética y la infinidad del conjunto de números primos. El primer resultado nos permitirá pensar a los números primos como los átomos de los números enteros, ya que a partir de multiplicarlos se obtendrá cualquier entero, sea éste primo o compuesto.

Definición de números primos

La definición con la que trabajaremos es la siguiente.

Definición. Un entero número entero $p$ es primo si y sólo si es positivo y tiene exactamente cuatro divisores: $1, \enspace -1, \enspace z \enspace \text{y } -z \text{.}$

De la definición hay algunos números que inmediatamente debemos descartar por no ser números primos. Por ejemplo, el $1$ no es un número primo pues tiene como divisores únicamente al $-1$ y al $1$, que son dos divisores, y no exactamente cuatro, como pide la definición. Del mismo modo, $-1$ tampoco es número primo pues tiene sólo dos divisores también y, para rematar, es negativo, lo cual no se vale.

Del mismo modo, concluimos que el $0$ no es número primo. Su problema es que tiene demasiados divisores. Cualquier número entero divide al $0$, así que tiene mucho más que cuatro divisores. Veamos nuestro primer ejemplo de un número que sí es primo.

Proposición. El entero $2$ es primo.

Demostración. Lo primero por notar es que $2$ es positivo. Supongamos que $x \in \mathbb{Z}$ divide a $2$. Por cómo se comparan en tamaños un número con un divisor, obtenemos que $|d|\leq 2$. Esto nos deja $5$ posibilidades para $d$: $-2,-1,0,1,2$. El $0$ nunca es divisor y se puede ver que cada uno de los otros cuatro números sí lo son. Así, el $2$ tiene exactamente cuatro divisores, que son $1$, $2$, $-1$ y $-2$. Concluimos entonces que $2$ es un número primo.

$\square$

Si bien el $-2$ también tiene exactamente esos mismos $4$ divisores, a $-2$ no le llamamos número primo porque es negativo. Recuerda que por definición sólo los números positivos pueden ser primos.

En la duda, si no sabemos si un número es primo, siempre podemos regresar a la definición.

Proposición. El entero $57$ no es primo.

Demostración. Notamos que $1$, $3$, $19$ y $57$ son todos ellos divisores de $57$, así como sus negativos. Por ello, el número $57$ tiene ocho divisores, y por lo tanto no es primo.

$\square$

Otras formas de pensar a los números primos

La definición de primos que dimos está en términos de la cantidad de divisores en total que se deben tener. Sin embargo, hay por lo menos otras dos formas de escribir esto mismo.

Proposición. Son equivalentes las siguientes tres afirmaciones para un número entero $p$:

  • El número $p$ es primo de acuerdo a nuestra definición de tener exactamente $4$ divisores.
  • El número $p$ es positivo y tiene exactamente $2$ divisores positivos.
  • El número $p$ es positivo y en cualquier forma de escribir $p=ab$ con $a$ y $b$ enteros positivos, sucede forzosamente que $a=1$ ó $b=1$.

Demostración. Los primeros dos puntos son equivalentes entre sí pues si $d$ es un divisor de $p$, entonces $-d$ también. Así, por cada divisor positivo hay uno negativo y viceversa. De hecho, los dos divisores positivos son, explícitamente, $1$ y $p$.

Si $p$ es primo con respecto a esta segunda definición, entonces el tercer inciso es claro, pues escribir $p=ab$ justo nos dice que $a|p$, de donde $a=1$ ó $a=p$, pues son sus únicos dos posibles divisores. Si $a=1$, tenemos lo que queremos. Y si $a=p$, entonces para que se de $p=ab$, debemos tener $b=1$, como queremos.

Finalmente, a partir del tercer inciso también se puede demostrar el segundo. Supongamos que $p$ cumple con el tercer inciso y supongamos que $d$ es divisor. ESto nos permite escribir $p=dr$ con $r$ algún entero. Por el tercer inciso, debemos tener $d=1$, o bien $r=1$, y entonces $d=p$, tal como nos pide el segundo inciso.

$\square$

Quizás no se ve tanto la ventaja entre distinguir entre las primeras dos versiones de la proposición anterior. De hecho, se parecen mucho. Sin embargo, sí vale la pena pensar en la tercera como algo diferente: nos dice que hay sólamente dos maneras de escribir a un primo como producto de números positivos. Esto nos ayuda, por ejemplo, a darnos cuenta rápidamente que un número no es primo aunque no tengamos todos sus divisores.

Ejemplo. El número $105$ no es primo pues se puede escribir como $5\cdot 21$. En esta expresión ninguno de los dos números es igual a $1$. Así, concluimos que $105$ no es primo.

$\square$

Propiedades de divisibilidad de los números primos

En el caso de los números primos, los máximos comunes divisores son asunto de todo o nada. Esto está escrito más formalmente en la siguiente definición.

Proposición. Sea $p$ un número primo y $a$ un entero. Si $p$ divide a $a$, tenemos $(a,p)=p$. Y si no, tenemos $(a,p)=1$.

Demostración. Sabemos que $(a,p)|p$ y que $(a,p)$ no es negativo. Así, $(a,p)$ debe ser uno de los dos divisores de $p$: $1$ ó $p$. Si $p$ divide a $a$, entonces $(a,p)=p$ pues $p$ es divisor común tanto de $p$ como de $a$. Pero si $p$ no divide a $a$, entonces a $(a,p)$ no le queda más que ser igual a $1$.

$\square$

La proposición anterior nos lleva a un lema de divisibilidad que nos resultará útil cuando enunciemos y probemos el teorema fundamental de la aritmética.

Proposición. Sea $p$ un número primo y $a,b$ números enteros. Si $p|ab$, entonces $p|a$ ó $p|b$.

Demostración. Si $p|a$, entonces ya terminamos. Si no, por la proposición anterior tenemos que $(p,a)=1$. Pero entonces por una propiedad anterior de divisibilidad con primos relativos obtenemos que $p|b$, como queríamos.

$\square$

Para la proposición anterior resultó crucial que $p$ fuera un número primo. Por ejemplo, tenemos que $9|180=15\cdot 12$, pero no es cierto ni que $9|15$, ni que $9|12$.

Más adelante…

En la siguiente entrada veremos dos teoremas importantes relacionados con los números primos: el teorema fundamental de la aritmética y el teorema de que existe una infinidad de primos.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Encuentra todos los números primos de $1$ a $20$.
  2. Sea $n$ un número entero que no sea un número primo, ni el negativo de un número primo. Demuestra $n$ que se puede expresar de la forma $ab$ con $a$ y $b$ enteros (positivos o negativos) de por lo menos ocho formas distintas.
  3. Sea $p>2$ un número tal que ninguno de los números $2,\ldots,\left\lfloor \sqrt{p}\right \rfloor$ lo divide. Muestra que $p$ es un número primo.
  4. Sea $n$ un número entero y $p$ un primo. Muestra que si $p|n^2$, entonces $p|n$. De hecho, muestra que en general, para un entero $k\geq 1$ se cumple que $p|n^k$ si y sólo si $p|n$.
  5. Sea $p$ un número primo. ¿Cuántos divisores tiene el número $p^{10}$? ¿Cuántos son positivos y cuántos negativos?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior II: Divisibilidad en los enteros

Por Leonardo Ignacio Martínez Sandoval

Introducción

En la entrada anterior hablamos del algoritmo de la división. Dados dos números enteros $a$ y $b$, con $b\neq 0$, nos permite poner de manera única a $a$ de la forma $a=qb+r$, en donde $q$ y $r$ son enteros, y además $0\leq r < |b|$. En otras palabras, nos permite poner a un número como «copias de otro», más un residuo «chiquito». En esta entrada hablaremos de la divisibilidad en los enteros.

La divisibilidad se da cuando pasa una situación especial en el algoritmo de la división: cuando el residuo obtenido es igual a cero. Es decir, cuando podemos escribir $a=qb$. Cuando esto sucede, diremos que $b$ divide a $a$, o bien que $a$ es múltiplo de $b$. En esta entrada daremos una definición formal que contemple este caso y estudiaremos varias de sus propiedades.

Definición de divisibilidad

La noción fundamental que estudiaremos en esta entrada es la de divisibilidad. La definición crucial es la siguiente.

Definición. Sean $m$ y $n$ enteros. Diremos que $m$ divide a $n$ si existe un entero $k$ tal que $n=km$. En notación, escribiremos $m|n$. También diremos que $n$ es un múltiplo de $m$, o bien que $n$ es divisible entre $m$.

Ejemplo. El número $35$ es divisible entre $5$ pues podemos encontrar un entero $k$ tal que $35=k\cdot 5$. Concretamente, podemos escribir $35=7\cdot 5$. Así mismo, este número también es divisible entre $-7$ pues podemos encontrar un entero $k$ tal que $35=k\cdot (-7)$, en concreto, podemos escribir $35=(-5)(-7)$.

Por otro lado, el $35$ no es múltiplo de $8$. ¿Cómo sabemos esto? Al hacer el algoritmo de la división obtenemos que $35=4\cdot 8 + 3$. Como esta es la única forma de escribir a $35$ como un múltiplo de $8$ más un residuo entre $0$ y $7$, entonces es imposible escribirlo como un múltiplo de $8$ más residuo $0$. En otras palabras, no es múltiplo de $8$.

$\triangle$

Propiedades básicas de divisibilidad

La siguiente proposición habla de algunas de las propiedades básicas de la divisibilidad. Las enunciaremos y daremos sus demostraciones para poner en práctica nuestra definición de divisibilidad.

Proposición. La noción de divisibilidad cumple las siguientes propiedades.

  • Los enteros $1$ y $-1$ dividen a cualquier otro entero.
  • El entero $0$ es divisible por cualquier entero.
  • Es reflexiva, es decir para cualquier entero $n$ se tiene que $n|n$.
  • Es transitiva, es decir si $l,m,n$ son enteros tales que $l|m$ y $m|n$, entonces $l|n$.

Demostración. A continuación demostramos la demostración, inciso por inciso.

  • Recordemos que si $n$ es un entero, entonces $n=n\cdot 1$. Esto nos dice que $1$ divide a $n$. Además, por las propiedades de las operaciones en los números enteros tenemos lo siguiente:
    \begin{align*}
    n&=n\cdot 1\\
    &=n\cdot ((-1)\cdot (-1))\\
    &=(n\cdot (-1))\cdot (-1)\\
    &=(-n)\cdot (-1).
    \end{align*}
    Aquí estamos usando que $(-1)(-1)=1$, la asociatividad del producto en los números enteros y que $(-1)n=-n$. En resumen, obtenemos que $n=(-n)(-1)$, lo cual nos dice que $-1|n$.
  • Aquí notamos que para cualquier entero $n$ tenemos que $0=0\cdot n$. Así, $n|0$.
  • Anteriormente usamos que $n=n\cdot 1$ para concluir $1|n$. Así mismo, al usar $n=1\cdot n$ obtenemos que $n|n$.
  • Veamos la transitividad. Supongamos que $l,m,n$ son enteros tales que $l|m$ y $m|n$. Por definición de divisibilidad podemos encontrar enteros $q$ y $r$ tales que $m=ql$ y $n=rm$. Substituyendo el valor de $m$ de la primera igualdad en la segunda y usando asociatividad obtenemos que: $$n=rm=r(ql)=(rq)l.$$ Esto precisamente nos dice que $l|n$.

$\square$

Divisibilidad y operaciones en los enteros

La divisibilidad se comporta bien con las operaciones en los números enteros. En la siguiente proposición encontramos algunas de las propiedades que vuelven esto un poco más preciso.

Proposición. La noción de divisibilidad cumple las siguientes propiedades.

  • Para enteros $l,m,n$, si $l|m$ y $l|n$, entonces $l|m+n$.
  • Para enteros $l,m,n$, si $l|m$, entonces $l|mn$.
  • Para enteros $l$, $a$, $b$, $c$, $d$ se cumple que si $l|m$ y $l|n$, entonces $l|am+bn$.

Demostración. Daremos la demostración inciso por inciso:

  • Como $l|m$ y $l|n$, por definición existen enteros $r$ y $s$ tales que $m=rl$ y $n=sl$. Al hacer la suma y usar la distributividad del producto sobre la suma obtenemos que $$m+n=rl+sl=(r+s)l.$$ Esto por definición está diciendo que $l$ divide a $m+n$.
  • Aquí podemos utilizar una propiedad anterior. Tenemos que $mn=nm$, por lo cual $mn$ es divisible entre $m$. Es decir, tenemos $l|m$ y $m|mn$. Así, por la transitividad de la divisibilidad, que ya probamos anteriormente, tenemos que $l|mn$.
  • Este inciso es consecuencia de los dos anteriores y, de hecho, ya no tenemos que usar la definición. Por el segundo inciso, como $l|m$, entonces $l|am$. Así mismo, como $l|n$, entonces $l|bn$. Finalmente, por el primer inciso, como $l|am$ y $l|bn$, entonces $l|am+bn$.

$\square$

Observa que si ponemos $a=1$ y $b=-1$ en la última propiedad obtenemos el siguiente corolario: si $l|m$ y $l|n$, entonces $l|m-n$.

Divisibilidad y orden en los enteros

Hay una tercera clase de propiedades que cumple la noción de divisibilidad: aquellas relacionadas con el orden en los enteros. Veamos esto.

Proposición. La noción de divisibilidad cumple las siguientes propiedades.

  • Si $m$ y $n$ son enteros distintos de cero tales que $m|n$, entonces $|m|\leq |n|$.
  • Si $m$ y $n$ son enteros positivos tales que $m|n$, entonces $m\leq n$.
  • Si $m$ y $n$ son enteros tales que $m|n$ y $n|m$, entonces $|m|=|n|$.

Demostración. Demostraremos la primera afirmación a detalle, pues a partir de ella salen las otras dos de manera prácticamente inmediata.

Tomemos dos enteros $m$ y $n$ tales que $m|n$. Por definición de divisibilidad, tenemos que existe un entero $k$ tal que $n=km$. Al tomar valor absoluto de esta expresión, obtenemos que $|n|=|km|$. Por propiedades del valor absoluto, tenemos que $|km|=|k||m|$. Como $n$ es distinto de cero, entonces $k$ también es distinto de cero, así que $|k|\geq 1$. De esta manera, tenemos la siguiente cadena de igualdades y desigualdades: $$|n|=|km|=|k||m|\geq 1\cdot |m| = |m|.$$

Esto es lo que queríamos demostrar.

Para el segundo inciso, como $m$ y $n$ son positivos, entonces entran en el caso del primer inciso. Además, por ser positivos tenemos $|m|=m$ y $|n|=n$. De este modo, por el primer inciso tenemos $m\leq n$.

En el tercer inciso primero tenemos que descartar algunos casos. Si $m=0$, entonces la divisibilidad $0|n$ nos dice que $n=k\cdot 0$ para alguna $k$ entera, pero entonces $n=0$ también, y entonces se cumple $|m|=0=|n|$. El caso $n=0$ es análogo. Ya descartados estos casos, podemos suponer que $m$ y $n$ son distintos de cero. Por el primer inciso tendríamos entonces $|m|\leq |n|$ y $|m|\geq |n|$. Así, $|m|=|n|$, como queríamos.

$\square$

Un ejemplo que usa varias propiedades de divisibilidad

¿Por qué es bueno recordar y saber cuándo usar propiedades de la divisibilidad? Porque nos permite simplificar ciertos problemas y resolverlos más fácilmente. Veamos un ejemplo.

Problema. Encuentra todos los divisores del número $12$.

Solución. Supongamos que $d$ es un divisor de $12$. Tenemos entonces que $|d|\leq |12|=12$, así, $d$ es un número entre $-12$ y $12$. Fuera de este rango no pueden existir divisores de $12$.

Por reflexividad tenemos que $12|12$. Por la propiedad de $1$ y $-1$ tenemos que $1|12$ y $-1|12$. Es fácil ver $12=2\cdot 6$ y $12=3\cdot 4$, así que $2$, $3$, $4$ y $6$ son todos ellos divisores de $12$. Los negativos de estos números también serán divisores entonces pues, por ejemplo, como $12=3\cdot 4$, también tenemos $12=(-3)(-4)$.

De este modo, hasta ahora hemos visto que $-12,-6,-4,-3,-2,-1,1,2,3,4,6,12$ son todos ellos divisores de $12$.

El $5$ claramente no es, pues al hacer el algoritmo de la división obtenemos $12=2\cdot 5 +2$, con residuo $2$. Entonces el $-5$ tampoco puede ser divisor.

Podríamos hacer lo mismo con $7,8,9,10,11$. Pero una forma fácil de ver que ninguno de ellos va a funcionar es que si intentáramos escribir $12=7k$, por ejemplo, se tiene que $k$ no puede ser $1$ (pues $12\neq 7$) y si ponemos $k\geq 2$ entonces el producto es al menos $14$, que ya se pasa de $12$. Así, ni estos números, ni $-7,-8,-9,-10,-11$ son divisores de $12$.

$\triangle$

Más adelante…

La noción de divisibilidad da pie a varios otros conceptos en la teoría de números enteros. Dentro de algunas entradas hablaremos de dos conceptos importantes: el de máximo común divisor y mínimo común múltiplo en los enteros. Sin embargo, antes de hacer esto tomaremos una pequeña desviación para hablar de un concepto un poco abstracto pero bastante útil: los ideales.

Tarea moral

  1. Encuentra todos los divisores del número $24$ (tanto los positivos, como los negativos) y verifica que en efecto cumplen con la definición dada en esta entrada.
  2. Encuentra contraejemplos para las siguientes afirmaciones:
    1. Si $l$, $m$ y $n$ son enteros tales que $l|m$ y $n|m$, entonces $l+n|m$.
    2. Si $l,m,n$ son enteros tales que $l|mn$, entonces o bien $l|m$ o bien $l|n$.
  3. Demuestra las siguientes dos propiedades de la noción de divisibilidad:
    1. Si $m$ y $n$ son enteros positivos tales que $m|n$ y $n|m$, entonces $m=n$.
    2. Si $m$ es divisor de $n$ con $n=km$, entonces $k$ también es divisor de $n$.
  4. Sean $m$ y $n$ enteros. Demuestra que $m$ divide a $n$ si y sólo si $m^2$ divide a $n^2$.
  5. Sea $n$ un entero positivo, $m$ un entero, $a_1,\ldots,a_n$ enteros y $b_1,\ldots,b_n$ enteros. Demuestra que si $m|b_i$ para todo $i=1,\ldots,n$, entonces $m| \sum_{i=1}^n a_ib_i$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Superior I: Composición de funciones

Por Guillermo Oswaldo Cota Martínez

Introducción

Siguiendo la conversación de las funciones, esta vez hablaremos de la composición de funciones. Este es el concepto que nos permitirá combinar más de una función para crear nuevas funciones siempre que ciertas condiciones se cumplan.

Composiciones en relaciones

Anteriormente ya hemos mencionado que sobre tres conjuntos $X,Y,Z$ se puede definir una relación composición entre dos relaciones $R$ de $x$ en $Y$ y $T$ de $Y$ en $Z$. De manera que la relación $T \circ R$ es aquella que está compuesta de elementos de la forma $(x,z) \in X \times Z$ siempre y cuando exista alguna $y$ de manera que $(x,y) \in R$ y $(y,z) in T$. Así, la relación composición está formada de elementos que pueden ir de $X$ a $Y$ mediante la relación $R$ y de ahí pueden llegar a $Z$ mediante la relación $T$. Veremos a continuación cómo podemos traducir esto a las funciones.

Composiciones en funciones

La composición de funciones será una composición de relaciones, no cambiará la definición, pues las funciones siguen siendo relaciones y hemos establecido toda una base sobre lo que son las relaciones para llegar a hablar de las funciones de forma gradual.

Piensa en el siguiente ejemplo. Supongamos tenemos una máquina $f$ que transforma las horas en minutos y otra máquina $g$ que transforma los minutos en segundos. Cuando a la máquina $f$ le pasamos de entrada «$1$ hora», nos regresará «$60$ minutos». Mientras que cuando le pasamos la entrada «$1$ minuto» a la máquina $g$ esta nos devuelve «60 segundos». Ahora nos preguntamos ¿Hay una forma de convertir las horas en segundos? O dicho de otra forma, ¿Cómo podemos construir una máquina $h$ que convierta las horas en los segundos? Nota que no tenemos directamente la máquina que nos toma las horas y las convierte en segundos, pero sí tenemos una máquina que convierte las horas en minutos y después los minutos en segundos.

Supongamos que tenemos la entrada «1 hora» entonces con la máquina $f$ podemos saber que una hora equivale a $60$ minutos. Enseguida podemos usar la máquina $G$ para saber que que los $60$ minutos equivalen a $3600$ segundos, de manera que esa es la duración de una hora. A esta máquina $h$ le llamamos la composición de $f$ con $g$.

Pensemos a estas máquinas como funciones, si consideramos $H$ como al conjunto de número de horas a considerar ($H=\{1 hr, 2 hrs, 3 hrs, \dots\}$) a $M$ como el conjunto de los minutos ($M =\{1 min, 2 mins, 3 mins, \dots\}$) y a $S$ como el conjunto de los segundos a considerar ($S=\{1 seg, 2 segs, 3 segs, \dots\}$) entonces $f:H \rightarrow M$ y $g: M \rightarrow S$ son funciones que convierten una unidad de tiempo en otra. La función $h : H \rightarrow S$ buscada es justamente la composición de las funciones $g \circ f: H \rightarrow S$.

Nota que si queremos convertir un número de horas $n \in H$ a segundos entonces bastará con notar que $n$ horas son $f(n)$ minutos, y estos a su vez son $g(f(n))$ segundos. Veamos el primer ejemplo. Nota que $f(1 hr)=60 mins$. Entonces $g(f(1hr))=g(60min)=3600segs$. Por lo cual la función que convierte las horas a segundos es componer $f$ con $g$.

Composición de funciones

Gráficamente lo que significa la composición de funciones es la siguiente imagen:

||||

Aquí podemos visualizar la función $g \circ f$ que es la función que va de $X$ a $Z$. En ella, vemos cómo es que la función $f$ va de X a Y, siendo que el dominio de $f$ queda dentro de $Y$, pues por definición, si la función $f$ va de $X$ a $Y$, entonces para cada elemento $x \in X$ sucede que existe $y \in Y$ tal que $f(x)=y$, significando que siempre $Im(f) \subset Y$ , y en nuestro caso en particular, $Y= Dom(g)$, siendo $g$ una función que va de $X$ a $Z$. Quizá lo que no es inmediato es la siguiente contención: $Im(g \circ f) \subset Im(g) \subset Z$.

Proposición. Si $f:X \rightarrow Y $ y $g: Y \rightarrow Z$ entonces $Im(g \circ f) \subset Im(g) \subset Z$

Demostración. Para esta demostración, consideremos $w \in Im(g \circ f) $ y veamos que $w \in Im(g)$. Para ello, notemos que por definición de la composición de funciones, si $w \in. Im(g \circ f)$ entonces existe $x \in X$ tal que $g \circ f(x) = w$. Es decir, $g(f(x))=w$ a su vez, como $f(x) \in Dom(g)$ entonces existe $y$ tal que $f(x)=y$ y $g(y)=w$. Ahora notemos que $y \in Dom(g)$ entonces $g(y) \in Im(g)$, es decir, $w=g(y) \in Dom(g)$. Por otro lado, por definición de función, la imagen de $g$ está contenida en $Z$. De esta manera, se tiene la contención buscada.

$\square$

Vamos a hacer algunas observaciones de esta composición de funciones.

  1. Para componer funciones, la imagen de una función debe estar contenida en el dominio de la otra. Esto significa que si queremos componer $f$ con $g$, debemos saber que todo elemento convertido por $f$ puede ser pasado a $g$. Dicho de otra manera, si queremos convertir horas a segundos, la máquina $f$ convierte las horas a minutos, y la $g$ minutos a segundos, entonces siempre tiene que pasar que $f$ devuelva minutos para poder componerse con $g$, pues acepta nada más minutos como entrada, si $f$ convirtiera horas a días, $g$ lo rechazaría, pues un día no está expresado en términos de minutos.
  2. La composición de funciones es asociativa, es decir, $(g\circ f) \circ h = g \circ (f \circ h)$.

Demostración. Consideremos $f : X \rightarrow Y$, $g : Y \rightarrow Z$ y $h : W \rightarrow X$. Para demostrar que la función es asociativa, deberíamos demostrar que apra algún $x$ arbitrario en el dominio de la composición $(W)$, se cumple que

$$ (g\circ f) \circ h(x) = g \circ (f \circ h)(x) $$

Para ello, llamemos $f \circ h = F$, $g \circ f = G$,$h(x)=y$ y $f(y)=z$. Ahora, nota por un lado que $$ g \ circ (f \circ h)(x) = g \circ F(x) = g(F(x)) = g(z)$$

Por otro lado, $(g \circ f) \circ h(x) = G \circ h(x) = G(y) = g \circ f(y) = g(z)$

Llegando a los mismos resultados, lo que debe significar que las funciones son iguales para $x$, pudiéndose generalizar para cada elemento del dominio de la composición.

$\square$

Más adelante…

Habiendo visto la composición de funciones, estamos listos para dar el siguiente paso y encontrar una clase muy particular de funciones: funciones invertibles, que serán aquellas funciones que podemos «deshacer».

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Demuestra que si $f$ es suprayectiva, entonces $Im(g \circ f) = Im(g)$.
  2. Sea $f: \mathbb{R} \ rightarrow \mathbb{R}$ dada por $f(x)=\frac{3x+1}{2}$:
    1. Encuentra $g: \mathbb{R} \ rightarrow \mathbb{R}$ tal que $g \circ f (x)= x$
    2. Demuestra que $g \circ f = f \circ g$
  3. Da condiciones suficientes y necesarias para que $g \circ f$ sea biyectiva.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Álgebra Superior I: Inferencias matemáticas

Por Guillermo Oswaldo Cota Martínez

Introducción

Antes de entrar de lleno a lo que será una parte importante en tu carrera en las matemáticas, vamos a establecer algunas definiciones que nos permiten aterrizar un poco la idea de usar una serie de proposiciones para ‘demostrar’ otras cosas. En esta entrada veremos algo llamado inferencias matemáticas.

La implicación para deducir verdades

Pensemos un momento en las siguientes dos expresiones:

$$P \qquad P\Rightarrow Q,.$$

¿Qué sucedería si acordamos o sabemos por cualquier razón, que $P$ es verdadera y que $P\Rightarrow Q$ es verdadera? Entonces, debe pasar forzosamente que $Q$ debe ser verdadera. En efecto, esto podemos verificarlo en una tabla de verdad:

$P$$Q$$P\Rightarrow Q$
$0$$0$$1$ 
$0$$1$$1$ 
$1$$0$$0$ 
$1$$1$$1$ 

El único renglón en donde $P$ es $1$ y $P\Rightarrow Q$ es $1$ es el cuarto renglón, en el cual en efecto $Q$ es $1$. De la veracidad de $P$ y $P\Rightarrow Q$ se obtiene la veracidad de $Q$. Esto es muy importante, pues nos dice que de $P$ y de $P\Rightarrow Q$ se puede deducir $Q$.

Pensemos ahora en la siguiente fórmula proposicional:

$$(P \land (P \Rightarrow Q)) \Rightarrow Q $$

Por lo que entendemos del $\Rightarrow$ de la derecha, estamos diciendo algo similar a lo que pusimos arriba: «$P$ y $P\Rightarrow Q$ implican $Q$». Abajo haremos una conexión más explícita.

Por el momento, puedes tomar el siguiente ejemplo. Imagina que sabes que las siguientes dos cosas son ciertas simultáneamente:

  • Si $n$ es un entero impar, entonces $n+1$ es un entero par.
  • $n$ es un entero impar.

¿Qué podrías concluir a partir de la veracidad de estas dos oraciones? Que $n+1$ es un entero par. Más concretamente, imagina por un momento que no sabes si 8 es impar o par, pero que sí sabemos la veracidad de la primera oración de arriba y que $7$ es impar. Esta información es suficiente para saber que 8 es par, ¿No lo crees?

Inferencias matemáticas: premisas y conclusiones

Lo que hicimos en el ejemplo de la sección anterior fue tomar dos proposiciones $P\Rightarrow Q$ y $Q$ y que acordamos/sabemos que simultánteamente eran verdaderas. A partir de las veracidades de ellas, logramos concluir la veracidad de otra proposición $P$. Nuestro argumento de que «la veracidad de las premisas hizo que la conclusión fuera verdadera» fue a través de la tabla de verdad. Decimos que usamos una inferencia matemática o una regla de inferencia.

Más formalmente, una regla de inferencia está conformada por unas premisas $P_1, P_2,\ldots, P_n$, que son usualmente fórmulas proposicionales en ciertas variables proposicionales que estamos usando; y una conclusión $Q$ que también es una fórmula proposicional. La regla de inferencia es entonces la fórmula proposicional

$$( P_1 \land P_2 \land \dots \land P_n) \Rightarrow Q.$$

La forma en que escribiremos las reglas de inferencia es la siguiente:

$$ \begin{array}{rl}& P_1\\&P_2\\ & \vdots \\ &P_n\\ \hline \therefore & Q\end{array}$$

El símbolo $\therefore$ se lee «por lo tanto».

Hasta aquí hemos definido qué es una regla de inferencia. Pero hay reglas de inferencia válidas y otras que no lo son. Es decir, hay algunas inferencias matemáticas que son válidas: a partir de la veracidad de las premisas se puede obtener la veracidad de la conclusión (como en el ejemplo que discutimos en la sección anterior). Y hay otras que no, que son inválidas. Es decir, son inferencias matemáticas en las que aunque las premisas sean verdaderas, no podemos concluir nada de la veracidad de la conclusión. ¿Cómo saber cuáles reglas de inferencia son válidas y cuáles no?

Volvamos de nuevo a nuestro ejemplo. Las premisas en este caso son $P$ y $P \Rightarrow Q$ y la conclusión es $Q$. Ahora veamos la tabla de verdad de la regla de inferencia $(P \land (P \Rightarrow Q)) \Rightarrow Q $:

$P$$Q$$P \Rightarrow Q$$P \land (P \Rightarrow Q)$$(P \land (P \Rightarrow Q)) \Rightarrow Q $
$0$$0$ 0 0
$0$$1$ 0 0 1
$1$$0$ 1 0 1
$1$$1$ 1 1

¿Notas algo peculiar? ¡Pues resulta que la regla de inferencia que dijimos es una tatuología!

En el caso en donde una regla de inferencia sea una tautología, diremos que es una regla de inferencia válida .

Los ingredientes de la validez

Ahora que tenemos las partes de las inferencias matemáticas, veamos un poco su comportamiento para ver cuándo en efecto es verdadera. Esto a la vez nos ayudará a entender la noción de «de la veracidad de las premisas sale la veracidad de la conclusión».

Supongamos que tenemos una regla de inferencia

$$ (P_1 \land P_2 \land \dots \land P_n) \Rightarrow Q $$

y queremos ver si es válida, pero no queremos hacer todos los renglones de la tabla de verdad. Podemos ahorrarnos mucho trabajo como sigue.

En el lado izquierdo tenemos la conjunción $P_1 \land P_2 \land \dots \land P_n$. Si alguna de las premisas fuera falsa, esta conjunción sería falsa. Pero entonces la implicación $\text{Lado izquierdo}\Rightarrow Q$ sería verdadera (recuerda que en las implicaciones si el lado izquierdo es falso, la implicación es verdadera). Así, todos los renglones de la tabla de verdad donde alguna premisa sea falsa, tendremos gratuitamente que la regla de inferencia es verdadera.

Nos quedan los casos en los que todas las premisas son verdaderas. En ellos, tenemos que ver que la conclusión $Q$ también es verdadera. Así, para ver que la regla de inferencia es válida, basta ver que «en aquellos casos que las premisas son verdaderas, la conclusión también lo es».

Y al revés también se vale. Imagina que sabes que la regla de inferencia es válida y que sabes la veracidad de todas las premisas. Entonces, la conjunción $P_1 \land P_2 \land \dots \land P_n$ es verdadera y, así, forzosamente $Q$ es verdadera. En resumen:

«Si una regla de inferencia es válida (es una tautología), y sus premisas son verdaderas, entonces la conclusión es verdadera. Y viceversa, una regla de inferencia es válida cuando hemos visto que en todas las situaciones que las premisas son verdaderas, la conclusión también».

Algunos ejemplos sencillos de inferencias matemáticas válidas

A continuación vamos a ver algunos ejemplos de algunas inferencias matemáticas válidas.

La regla de inferencia válida más simple que se nos puede ocurrir es la siguiente:

$$ \begin{array}{rl}& P\\ \hline \therefore & P \end{array}$$

En donde básicamente estamos diciendo que si tenemos la premisa $P$ entonces va a pasar $P$, lo cual es muy fácil de verificar incluso platicado. Para ver que esta inferencia es válida, necesitamos que $P\Rightarrow P$ sea una tautología. Si $P$ es verdadero, la implicación es verdadera. Si $P$ es falso, la implicación (al tener su antecedente falso), es verdadera.

Veamos otro ejemplo. Considera que tenemos como premisas a $P$ y $Q$ y como conclusión a $P\land Q$. En este caso tendríamos la regla de inferencia:

$$ \begin{array}{rl} & P\\ & Q\\ \hline \therefore & P \land Q \end{array}$$

Esto claramente es válido, pues la proposición $(P \land Q) \Rightarrow (P \land Q)$ siempre es cierta.

Nota que para que una regla de inferencia no sea válida, se tenga que tener ‘un caso’ en que las premisas sean ciertas y la conclusión no. Por ejemplo, considera la siguiente regla de inferencia que nos diría algo así como que «de cualquier cosa $P$ podemos deducir cualquier cosa $Q$»:

$$ \begin{array}{rl} & P \\ \hline \therefore & Q \end{array}$$

Esta regla de inferencia no es válida (¡qué bueno!). La razón es que la implicación $P\Rightarrow Q$ no es una tautología. Para ver esto, notemos que si $P$ es verdadero y $Q$ es falso, entonces $P\Rightarrow Q$ es falso.

Un ejemplo más complicado de inferencia válida

Ahora hagamos un ejemplo más elaborado, en el que aprovecharemos lo que platicamos sobre «pensar que las premisas son verdaderas». Imaginemos que queremos pensar que la siguiente inferencia es válida:

$$ \begin{array}{rl} & P \Rightarrow Q \\ & Q \Rightarrow R \\ & Q\Rightarrow S \\ &(R\land S) \Rightarrow T \\ & P \\ \hline \therefore & T.\end{array}$$

Si alguna premisa fuera falsa, entonces el antecedente de la conjunción de las premisas es falso, y así la implicación de la inferencia sería verdadera: en los casos en los que alguna premisa es falsa, entonces no hay nada que hacer. Así, pensemos, ¿qué pasa si todas las premisas son verdaderas?

Como $P$ es verdadera y $P\Rightarrow Q$ es verdadera, entonces $Q$ es verdadera. Pero ahora, sabiendo que $Q$ es verdadera y $Q\Rightarrow R$ es verdadera, entonces $R$ es verdadera. De manera similar, $S$ es verdadera.

Como tenemos que $R$ y $S$ son verdaderas, entonces $R\land S$ es verdadera. Y como también $(R\land S) \Rightarrow T$ es verdadera, entonces $T$ es verdadera. ¡Hemos logrado el objetivo! A partir de la veracidad de las premisas llegamos a la veracidad de $T$. ¡Yay! Entonces al suponer que todas nuestras premisas fueron verdaderas, y aplicando un poco de «lógica» llegamos a que nuestra conclusión es verdadera.

Un poco de esto se va a tratar la matemática que sigue. A partir de ahora vamos a empezar a usar esta forma de pensar, estamos rascando la fibra de la matemática y con ello empieza el viaje hacia un bosque lleno de distintas áreas, desde el álgebra y el cálculo, pasando por la geometría y la probabilidad. Todas ellas llevan la capa de la matemática porque partirán de un tronco común que nosotros estamos sentando en estas entradas. Dentro de poco verás cómo todo esto se relaciona al quehacer matemático.

Más adelante…

Acabamos de establecer uno de los cimientos sobre el cuál se sustenta el pensamiento deductivo: realizar inferencias matemáticas. Es como pensaremos de ahora en adelante. No te preocupes si aún no puedes expresar bien la lógica detrás de las reglas de inferencia o sus trucos. Esto apenas comienza, pues en las siguientes entradas relacionaremos lo visto ahora con los bloques que construirán a la matemática: las demostraciones. Y por ahí conocerás un cuento que te introducirá a esta idea.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Prueba que $P \Rightarrow P$ es una regla de inferencia válida.
  2. Verifica que las siguientes reglas de inferencia son válidas con tablas de verdad:
  • $$ \begin{array}{rl} & \neg P \Rightarrow \neg Q \\ & \neg P \\ \hline \therefore & \neg Q \end{array}$$
  • $$ \begin{array}{rl} & P \lor Q \\ & \neg P \\ \hline \therefore & Q \end{array}$$

Ahora haz lo mismo pero da un razonamiento «deductivo» (supón que todas las premisas y explica por qué la conclusión es cierta) de porqué es válida la siguiente regla de inferencia:

  • $$ \begin{array}{rl} & P \Rightarrow Q \\ & Q \Rightarrow R \\ \hline \therefore & P \Rightarrow R \end{array}$$
  1. Revisa la Tabla de reglas de inferencia en la página de Wikipedia para conocer más reglas de inferencia válidas. Muestra que en efecto son reglas de inferencia válidas haciendo las tablas que verifiquen la tautología requerida.
  2. Cuando estamos viendo si una regla de inferencia es válida, podemos «ir agregando cosas verdaderas que vayamos deduciendo a las premisas» y usarlas a su vez para seguir deduciendo nuevas cosas. El objetivo de este ejercicio es que demuestres esto. Muestra que si $P_1 \land P_2 \land \ldots \land P_n \Rightarrow Q$ es una inferencia válida y $P_1 \land P_2 \land \ldots \land P_n \land Q \Rightarrow R$ es una inferencia válida, entonces $P_1 \land P_2 \land \ldots \land P_n \Rightarrow R$ es una inferencia válida. En otras palabras, ¡prueba que la siguiente inferencia es válida!
    $$ \begin{array}{rl} & P_1 \land P_2 \land \ldots \land P_n \Rightarrow Q\\ & P_1 \land P_2 \land \ldots \land P_n \land Q \Rightarrow R \\ \hline \therefore & P_1 \land P_2 \land \ldots \land P_n \Rightarrow R. \end{array}$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»