Archivo de la etiqueta: hiperplanos

Seminario de Resolución de Problemas: Geometría discreta

Por Leonardo Ignacio Martínez Sandoval

Introducción

Como última entradaen esta parte de geometría, hablaremos de algunos temas de geometría discreta. Esta área de las matemáticas se dedica a estudiar propiedades combinatorias de familias de objetos geométricos. Estos objetos pueden ser puntos, rectas, rectángulos, convexos, politopos, etc. Las relaciones que nos interesan son que formen un tipo de acomodo especial, que se intersecten, que podamos contar ciertas configuraciones, etc.

Sólo hablaremos superficialmente de un área que es profunda y bastante interesante. Un libro genial que cubre varios temas de geometría discreta de manera sistemática es Lectures on Discrete Geometry de Jiří Matoušek.

Convexos y el teorema de Helly

Un convexo de Rd es un conjunto tal que cualquier segmento recto definido por dos de sus puntos queda totalmente contenido en el conjunto. Por ejemplo, los convexos de R son los intervalos, mientras que en el plano hay muchos más ejemplos, como lo muestra la figura.

Ejemplos de conjuntos convexos y no convexos
Ejemplos de conjuntos convexos y no convexos

Si tenemos un conjunto X de Rd, su envolvente convexa es el conjunto convexo más pequeño (por contención), que contiene a X. Cuando X es un conjunto de puntos, tenemos algo como lo de la figura. Si todos los puntos de X están sobre la frontera de su envolvente convexa, y no hay tres alineados, decimos que X son puntos en posición convexa.

Envolvente convexa de un conjunto de puntos
Envolvente convexa de un conjunto de puntos. El conjunto X no está en posición convexa.

Los conjuntos convexos son especiales en muchos sentidos. Uno de ellos es que la intersección de una familia de convexos se puede detectar «localmente».

Problema. A una plática de matemáticas de una hora asistieron una cantidad finita de matemáticos. La plática estaba tan aburrida, que cada matemático se durmió en cierto intervalo de tiempo de esa hora, pero sólo una vez. A la hora del café, los matemáticos platicaron entre sí, y si se dieron cuenta de que para cualesquiera dos de ellos, I y J, hubo un momento en el que I y J estuvieron dormidos simultáneamente. Muestra que hubo un momento de la plática en la que todos los matemáticos estuvieron dormidos.

Sugerencia pre-solución. Hay muchas soluciones. Una es mediante un argumento de maximalidad.

Solución. En términos matemáticos, queremos ver que si tenemos una cantidad finita de intervalos acotados y cerrados en la recta real que se intersectan de dos en dos, entonces todos ellos se intersectan.

Tomemos el intervalo I cuyo extremo derecho sea mínimo. Llamemos x a este extremo derecho. Afirmamos que cualquier otro intervalo tiene a x. Sea J cualquiera de estos intervalos, con extremo izquierdo y y extremo derecho z.

Imagen auxiliar para intersección de intervalos
Imaten auxiliar para intersección de intervalos

Por la minimalidad de x, tenemos que xz. Si y>x, entonces J no intersecta a I y se contradice la hipótesis. Entonces, para que J pueda intersectar a I, necesitamos que yx. Pero entonces x queda entre los extremos del intervalo J y por lo tanto x está en J. Esto termina la prueba.

◻

En dimensiones más altas, tenemos el siguiente resultado.

Teorema (Helly). Sea F una familia finita de al menos d+1 conjuntos convexos compactos en Rd. Si cada subfamilia de F de d+1 convexos tiene intersección no vacía, entonces F tiene intersección no vacía.

El teorema de Helly es una de las piedras angulares de la geometría discreta. Una cantidad de enorme de investigación ha resultado de considerar variantes del teorema con hipótesis más débiles o más fuertes.

Politopos y la fórmula de Euler

Otra área muy rica de la geometría discreta es la teoría de politopos. Un politopo es la generalización a altas dimensiones de un polígono, o de un poliedro. Hay dos formas de definir politopos. Una es tomar puntos en Rd y considerar su envolvente convexa. Esto es un V-politopo. Para la otra necesitamos algunas definiciones adicionales.

Un subespacio afín de Rd es la traslación de un subespacio lineal, y su dimensión es la dimensión del subespacio lineal trasladado. Por ejemplo, cualquier punto de Rd es un subespacio afín de dimensión 0 pues es la traslación del subespacio trivial {0}. Las rectas en Rd, incluso aquellas que no pasan por el 0, son subespacios afines de dimensión 0. A los subespacios afines de dimensión n1 les llamamos hiperplanos. Así, las líneas son los hiperplanos de R2, los planos los hiperplanos de R3, etc.

Si P es un hiperplano de Rd, un semiespacio definido por P es todo lo que queda en uno de los lados de P. Si es abierto, no incluye a P, y si es cerrado, sí incluye a P. Un hiperplano siempre define dos semiespacios abiertos, y dos cerrados.

Hay otra forma de pensar a los politopos: tomamos una cantidad finita de semiespacios cerrados y los intersectamos. Si esa intersección está acotada, entonces a lo que obtenemos le llamamos un H-politopo. Piensa, por ejemplo, en los hiperplanos que determinan las caras de un cubo, y en los semiespacios «hacia adentro».

Un resultado clásico es que todo H-politopo es un V-politopo, así que podemos usar la descripción que nos convenga de acuerdo al problema que estemos resolviendo.

Un hiperplano H es hiperplano soporte de un politopo P si el politopo se queda totalmente contenido en alguno de los semiespacios definidos por H. Una cara de P es la intersección de P con alguno de sus hiperplanos soporte. Resulta que las caras de politopos son politopos. Para que todo funcione bien, debemos considerar al vacío como un politopo.

La dimensión de un politopo es la menor dimensión de un subespacio afín que lo contiene. Por definición, la dimensión del vacío es 1. Si una cara de un politopo es k, entonces la llamamos una k-cara. Los valores de k sólo pueden ir de 0 a d. A las 0-caras les llamamos los vértices de P. A las 1-caras les llamamos las aristas.

Para cada k de 0 a n, usamos fk para denotar la cantidad de k caras del politopo, y a (f0,f1,f2,,fd) le llamamos el f-vector del politopo. Estamos listos para enunciar un resultado crucial en la teoría de politopos.

Teorema (fórmula de Euler). Sea P un politopo de dimensión d en Rd. Entonces

f0f1+f2+(1)dfd=1.

Observa que fd siempre es 1 pues la única d cara de un politopo P de dimensión d es P mismo.

En R2 esta fórmula no es tan útil, pues simplemente nos dice que si un polígono tiene V vértices y A aristas, entonces VA=0, es decir, que tiene la misma cantidad de vértices y aristas, lo cual es inmediato.

En R3 la fórmula nos dice que si un poliedros tiene V vértices, A aristas y F caras, entonces VA+F=2. Este fórmula se puede usar en varios problemas matemáticos de poliedros.

Problema. Muestra que el tetraedro, el cubo, el octaedro, el dodecaedro y el icosaedro son los únicos poliedros en R3 tales que a cada vértice una misma cantidad a de caras, y cada cara consiste de la misma cantidad b de vértices.

Sugerencia pre-solución. Usa notación adecuada, poniendo la cantidad de vértices, aristas y caras en términos de a y b. Usa la fórmula de Euler. Luego, da un argumento de desigualdades.

Solución. A cada vértice llegan por lo menos 3 caras, y cada cara tiene por lo menos 3 vértices. Así, a3 y b3.

Si hay A aristas, entonces tanto 2A como bF cuentan la cantidad de parejas (e,c) donde e es una arista y c una cara que lo tiene. Esto se debe a que cada arista está exactamente en dos caras, y a que como cada cara tiene b vértices, entonces tiene b aristas. Por lo tanto, 2A=bF, de donde A=bF2.

De manera similar, si hay V vértices y F caras, entonces tanto aV como bF cuentan la cantidad de parejas (v,c), donde v es un vértice y c es una cara que lo tiene. De esta forma, aV=bF, de lo cual V=bFa.

Por la fórmula de Euler, tenemos entonces que bFabF2+F=2. Esta igualdad implica, en particular, que al determinar los valores de a y b, se determinan F y entonces V y A.

Si multiplicamos por 2bF de ambos lados, y sumamos 1 de ambos lados, tenemos que (1)2a+2b=4bF+1>1.

Como a3, entonces 2a23. De este modo,
2b>12a123=13.

Esto muestra que b<6, de modo que b5. Por simetría, a5. Podemos entonces simplemente estudiar los casos a=2,3,4 y b=2,3,4.

Si a=5, entonces la desigualdad (1) se cumple sólo si b=3. Si a=4, la desigualdad (1) se cumple sólo si b=3. Finalmente, si a=3, la desigualdad se cumple para b=3,4,5. De este modo, las únicas parejas de (a,b) que sirven son:

  • (3,3), que nos da el tetraedro.
  • (3,4), que nos da el cubo.
  • (4,3), que nos da el octaedro.
  • (3,5), que nos da el dodecaedro.
  • (5,3), que nos da el icosaedro.

◻

La fórmula de Euler es sólo una de las relaciones lineales que satisfacen las entradas del f-vector de un politopo. Otros dos resultados interesantes del área son:

  • Las relaciones de Dehn-Sommerville, que dan otras relaciones lineales que satisfacen las entradas del f-vector.
  • El teorema de la cota superior que para d, n y k fijas acota el número de k-caras que puede tener un politopo de dimensión d con n-vértices.

Un libro canónico para aprender de politopos de manera sistemática es el Lectures on Polytopes de Günter M. Ziegler.

Conjuntos de puntos y teoremas extremales

La última área de la que hablaremos serán los problemas extremales en geometría discreta. Nos enfocaremos únicamente en problemas sobre conjuntos de puntos, pero se podrían hacer preguntas análogas para otras familias de objetos geométricos. De manera informal, pero intuitiva, un problema extremal de geometría consiste en mostrar que si un número es suficientemente grande, entonces empiezan a pasar cosas interesantes con ciertos objetos geométricos.

Uno de los resultados clásicos es el teorema de Erdős-Szekeres. A grandes rasgos, lo que dice es que si tenemos muchos puntos en posición general en el plano (no hay tres colineales), entonces siempre es posible encontrar un subconjunto grande de ellos que está en posición convexa.

Teorema (Erdős-Szekeres). Sea n un entero positivo. Entonces, existe un entero f(n) tal que si se tiene un conjunto S con f(n) o más puntos en el plano en posición general, entonces hay un subconjunto de tamaño n de S que consiste de puntos en posición convexa.

Típicamente, es bastante difícil encontrar los valores exactos de las funciones involucradas en problemas extremales de geometría discreta. El tipo de resultados de interés para la investigación matemática es encontrar las mejores «cotas asintóticas», que digan, más o menos, cómo se comporta la función que se está estudiando. En el caso del teorema de Erdős-Szekeres, las mejores cotas se enuncian así:

1+2n2f(n)2n+o(n).

La notación h(n)=o(g(n)) quiere decir que h(n)g(n)0 cuando n.

Aunque sea difícil determinar los valores exactos de f(n) para toda n, hay algunos valores pequeños que sí se pueden determinar.

Problema. Demuestra que f(4)=5, es decir:

  • Que hay conjuntos de 4 puntos en posición general en el plano que no tienen subconjuntos de tamaño 4 en posición convexa.
  • Que cualquier subconjunto de 5 puntos en posición general en el plano tiene un subconjunto de 4 puntos en posición convexa.

Sugerencia pre-solución. Encontrar el ejemplo para el primer punto es fácil, simplemente explora el problema haciendo varias figuras. Divide el problema en casos de acuerdo a la cantidad de puntos que forman la envolvente convexa. Para uno de los casos, usa el principio de las casillas.

Solución. El siguiente ejemplo son 4 puntos que no están en posición convexa, y que por lo tanto no tienen subconjuntos de tamaño 4 en posición convexa.

Cuatro puntos que no están en posición convexa
Cuatro puntos que no están en posición convexa

Mostraremos ahora que 5 puntos en posición general en el plano siempre tienen un subconjunto de tamaño 4 en posición convexa. Procedemos por casos de acuerdo a la cantidad de puntos que están en la frontera de la envolvente convexa. Si son 4 ó 5, entonces inmediatamente entre ellos hay 4 en posición convexa.

Si son 3, entonces llamemos A, B, C a esos puntos y D y E a los otros dos, que quedan dentro de ABC. La recta DE divide al plano en dos semiplanos. Por principio de las casillas, hay dos puntos de entre A, B y C que yacen en el mismo semiplano, digamos A y B.

Caso con tres puntos en la envolvente convexa
Caso con tres puntos en la envolvente convexa

Como la recta DE no corta al segmento AB (por estar D y E en el mismo semiplano), y la recta AB no corta al segmento DE (por ser AB un lado de la envolvente convexa), entonces los puntos A, B, D, E están en posición convexa.

◻

Finalmente, presentamos un par de resultados más. También son problemas extremales, pero en vez de hablar de envolventes convexas, hablan acerca de distancias.

Si lo piensas un poco, es imposible colocar 4 puntos distintos en el plano de modo que todas las parejas estén a distancia uno. Si tienes n puntos en el plano, entonces ellos definen (n2)=n(n1)2n22 parejas de puntos. ¿Cuántos de ellos pueden estar a distancia 1? Estudiar esta cantidad es un problema que fue propuesto por Paul Erdős. Si u(n) denota este máximo, las mejores cotas que hay para el problema son n1+d/loglognf(n)O(n4/3).

Aquí d es una constante que sirve para toda n. La notación h(n)O(g(n)) se refiere a que existe una constante c tal que h(n)cg(n) para n suficientemente grande.

Por supuesto, la distancia 1 no tiene nada de especial. En realidad, ninguna distancia puede repetirse demasiado. Ya que ninguna distancia aparece muchas veces, la intuición (por principio de las casillas), nos debe decir que entonces para un conjunto de puntos, sus parejas deben definir muchas distancias diferentes. Llamemos d(n) a la cantidad de distancias diferentes que define un conjunto de n puntos en el plano. Erdős también preguntó, ¿cómo se comporta este número?. Las mejores cotas son Ω(nlog)d(n)O(nlogn).

La notación h(n)Ω(g(n)) se refiere a que existe una constante c tal que h(n)cg(n) para n suficientemente grande.

El problema de las distancias unitarias y el problema de las distancias diferentes han estimulado mucha de la investigación en geometría discreta. Las demostraciones de sus cotas, han introducido al área varias técnicas de teoría de números, del método probabilista y de geometría algebraica.

Un libro con mucho material de problemas extremales y otros temas es Combinatorial Geometry and its Algorithmic Applications de Janos Pach y Micha Sharir.

Más problemas

En resumen, en los siguientes libros hay bastante material para aprender los temas de esta entrada:

Álgebra Lineal I: Problemas de ortogonalidad, ecuaciones e hiperplanos

Por Ayax Calderón

Introducción

En esta entrada ejercitaremos los conceptos introducidos recientemente. Abordamos los temas de espacio ortogonal e hiperplanos. Para ello, resolveremos problemas de ortogonalidad relacionados con encontrar una base para el espacio ortogonal y de escribir subespacios en términos de ecuaciones e intersecciones de hiperplanos.

Problemas resueltos de espacio ortogonal

Problema 1. Sea S={x3+x,x2+x,x3+x2+1}R3[x].
Describe S dando una base de este espacio.

Solución. Una forma lineal l sobre R3[x] es de la forma

l(a0+a1x+a2x2+a3x3)=aa0+ba1+ca2+da3

para algunos a,b,c,dR, pues basta decidir quiénes son a=l(1), b=l(x), c=l(x2) y d=l(x3).

La condición lS es equivalente a

l(x3+x)=l(x2+x)=l(x3+x2+1)=0.

Esto es
l(x3+x)=b+d=0l(x2+x)=b+c=0l(x3+x2+1)=a+cd=0.

La matriz asociada al sistema es

A=(010101101011)

y su forma escalonada reducida es

Ared=(100001010011).

Así, d es variable libre y a=0b=dc=d.

De aquí, el conjunto de soluciones del sistema es
{(0,u,u,u):uR}.

Las correspondientes formas lineales son lu(a0+a1x+a2x2+a3x3)=u(a1+a2+a3).

Este es un subespacio de dimensión 1, así que para determinar una base para S, basta con elegir una de estas formas lineales con u0, por ejemplo, para u=1 tenemos
l1(ao+a1x+a2x2+a3x3)=a1+a2+a3.

Problema 2. Sea V un espacio vectorial sobre un campo F, sea V su espacio dual y tomemos subconjuntos S,S1,S2V tales que S1S2. Prueba lo siguiente.

  1. S2S1.
  2. S(S).

Solución.

  1. Sea lS2. Por definición l(s)=0 para toda sS2.
    Luego, si sS1, entonces sS2 y así l(s)=0. Por consiguiente lS1. Concluimos S2S1.
  2. Sea sS. Para cualquier lS se cumple que l(s)=0 y así s(S)

◻

Observación. El problema anterior también es cierto si suponemos que S,S1,S2V tales que S1S2 y la prueba es idéntica a la anterior.

Observación. Por muy tentador que sea pensar que la igualdad se da en el inciso 2 del problema anterior, esto es totalmente falso: (S) es un subespacio de V (o de V), mientras que no hay razón para que S lo sea, pues este es solamente un subconjunto arbitrario de V (o V). Como vimos en una entrada anterior, la igualdad se da si S es un subespacio de V (o de V) cuando V es un subespacio de dimensión finita.

Problemas resueltos de ecuaciones lineales y de hiperplanos

Veamos ahora problemas de ortogonalidad relacionados con encontrar expresiones para un subespacio en términos de ecuaciones lineales y de hiperplanos.

Problema 1. Sea W el subespacio de R4 generado por los vectores

v1=(1,1,0,1)
v2=(1,2,2,1).

Encuentra ecuaciones lineales en R4 cuyo conjunto solución sea W.

Solución. Necesitamos encontrar una base para W.
Recordemos que W consiste de todas las formas lineales

l(x,y,z,t)=ax+by+cz+dt

tales que l(v1)=l(v2)=0, es decir
a+b+d=0a+2b+2c+d=0.

La matriz asociada al sistema anterior es

A=(11011221)

y por medio de reducción gaussiana llegamos a que su forma reducida escalonada es

Ared=(10210120).

De aquí, c y d son variables libres y a y b son variables pivote determinadas por
a=2cdb=2c.

Por lo tanto,
l(x,y,z,t)=(2cd)x2cy+cz+dt=c(2x2y+z)+d(x+t).

Así, deducimos que una base para W está dada por

l1(x,y,z,t)=2x2y+z y l2(x,y,z,t)=x+t

y por consiguiente W={vR4:l1(v)=l2(v)=0}, de donde l1(v)=0,l2(v)=0 son ecuaciones cuyo conjunto solución es W.

Problema 2. Considera el espacio vectorial V=R3[x]. Escribe el subespacio vectorial generado por p(x)=12x2 y q(x)=x+x2x3 como la intersección de dos hiperplanos linealmente independientes en V.

Solución. Sea B={1,x,x2,x3}={e1,e2,e3,e4} la base canónica de V.

Entonces

p(x)=e12e3q(x)=e2+e3e4.

Escribir W=span(p(x),q(x)) como intersección de dos hiperplanos es equivalente a encontrar dos ecuaciones que definan a W, digamos l1(v)=l2(v)=0 pues entonces W=H1H2, donde H1=ker(l1) y H2=ker(l2).

Así que sólo necesitamos encontrar una base l1,l2 de W.

Recordemos que una forma lineal en R3[x] es de la forma l1(x1e1+x2e2+x3e3+x4e4)=ax1+bx2+cx3+dx4

para algunos a,b,c,dR.

Esta forma lineal l pertenece a W si y sólo si l(p(x))=l(q(x))=0, o bien

a2c=0b+cd=0.

Podemos fijar c y d libremente y despejar a y b como sigue:

a=2cb=c+d.

Por consiguiente

l(x1e1+x2e2+x3e3+x4e4)=2cx1+(c+d)x2+cx3+dx4=c2x1x2+x3)+d(x2+x4).

Así deducimos que una base l1,l2 de W está dada por

l1(x1e1+x2e2+x3e3+x4e4)=2x1x2+x3l2(x1e1+x2e2+x3e3+x4e4)=x2+x4.

y así W=H1H2, donde

H1=ker(l1)={a+bx+cx2+dx3V:2ab+c=0}H2=ker(l2)={a+bx+cx2+dx3V:b+d=0}.


Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Álgebra Lineal I: Ortogonalidad, hiperplanos y ecuaciones lineales

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores hablamos de formas lineales, del espacio dual y de ortogonalidad. Con la teoría que hemos desarrollado en esas entradas, podemos cosechar uno de los hechos más importantes para espacios vectoriales de dimensión finita n: todos los subespacios se pueden obtener a partir de intersectar hiperplanos, es decir, subespacios de dimensión n1. El objetivo de esta entrada es dar las definiciones necesarias para enunciar y demostrar este resultado formalmente.

Hiperplanos

Antes de demostrar el resultado mencionado en la introducción, tomaremos un poco de intuición geométrica de R3.

En R3 tenemos sólo un subespacio de dimensión 0, que es {(0,0,0)}, un punto. Para obtener un subespacio de dimensión 1, tenemos que tomar un vector v0 y considerar todos los vectores rv con r en R. Esto corresponde geométricamente a una línea por el origen, con la misma dirección que v. En otras palabras, los subespacios de dimensión 1 son líneas por el origen.

¿Quiénes son los subespacios de dimensión 2? Debemos tomar dos vectores linealmente independientes u y v y considerar todas las combinaciones lineales au+bv de ellos. Es más o menos fácil convencerse de que obtendremos al plano que pasa por u, v y el (0,0,0). Es decir, los subespacios de dimensión 2 de R3 son planos por el origen.

Esto motiva la siguiente definición.

Definición 1. Sea V un espacio vectorial de dimensión finita n. Un hiperplano de V es un subespacio de dimensión n1.

Ejemplo. El subespacio U=R5[x] de V=R6[x] es un hiperplano. Esto es ya que U es de dimesión 6 y V es de dimensión 7. Sin embargo, aunque U también es un subespacio de W=R7[x], no se cumple que U sea hiperplano de W pues W es de dimensión 8 y 681.

Las matrices simétricas de M2(R) forman un subespacio S de dimensión 3 de M2(R), pues son de la forma (abbc). De esta forma, S es un hiperplano de M2(R). Sin embargo, el conjunto de matrices simétricas de Mn(R) no es un hiperplano ni para n=1, ni para n3.

Los hiperplanos nos pueden ayudar a obtener subespacios. De hecho, veremos que en el caso de dimensión finita nos ayudan a obtener a todos los subespacios. Para continuar construyendo la intuición, notemos que en R3 los hiperplanos son simplemente los planos por el origen y que:

  • Podemos obtener a cualquier plano por el origen como intersección de planos por el origen: simplemente lo tomamos a él mismo.
  • Podemos obtener a cualquier línea por el origen como la intersección de dos planos distintos por el origen que la contengan. Por ejemplo, el eje z es la intersección de los planos xz y yz. En otras palabras: todo subespacio de dimensión 1 de R3 se puede obtener como la intersección de dos hiperplanos de R3.
  • A {0} lo podemos expresar como la intersección de los planos xy, yz y xz, osea, al único espacio de dimensión cero lo podemos expresar como intersección de 3 hiperplanos.

Ya obtenida la intuición, lo que veremos a continuación es que el resultado anterior en realidad es un fenómeno que sucede en cualquier espacio vectorial de dimensión finita. Así, nos enfocaremos en entender las definiciones del siguiente teorema, y demostrarlo.

Teorema. Sea V un espacio vectorial de dimensión finita n.

  • Todo subespacio W de V de dimensión m es la intersección de nm hiperplanos de V linealmente independientes.
  • Toda intersección de nm hiperplanos de V linealmente independientes es un subespacio vectorial de dimensión m.

Los hiperplanos son subespacio y la definición de independencia lineal que tenemos es para vectores. Pero el teorema anterior habla de «hiperplanos linealmente independientes». ¿A qué se refiere esto? Como veremos más adelante, a cada hiperplano se le puede asignar de manera natural un elemento del espacio dual de V.

Recordatorio de espacio ortogonal

En la entrada anterior mostramos el siguiente resultado:

Teorema (teorema de dualidad). Sea V un espacio vectorial de dimensión finita sobre F y W un subespacio de V (o de V). Entonces dimW+dimW=dimV.

Además, obtuvimos como corolario lo siguiente:

Corolario. Si V es un espacio vectorial de dimensión finita sobre un campo F y W un subespacio de V (o de V), entonces (W)=W.

Usaremos estos resultados para dar una definición alternativa de hiperplanos, para entender a los subespacios de dimensión n1 y para mostrar el teorema principal de esta entrada.

Subespacios de dimensión n1 y definición alternativa de hiperplanos

Tomemos un espacio vectorial V de dimensión finita n. Un caso especial, pero muy importante, del teorema de dualidad es cuando W es un subespacio de V de dimensión 1, es decir, cuando W está generado por una forma lineal l0. En este caso, W es un subespacio de V y por el teorema de dualidad, es de dimensión n1.

De manera inversa, si W es un subespacio de V de dimensión n1, por el teorema de dualidad tenemos que W es de dimensión 1, así que hay una forma lineal l0 que lo genera. Por el corolario, W=(W), que en otras palabras quiere decir que W={vV:l(v)=0}. En resumen:

Proposición. Un subespacio W de un espacio de dimensión finita d tiene dimensión d1 si y sólo si es el kernel de una forma lineal l0 de V.

Ejemplo 1. Considera la forma lineal ev0 en el espacio vectorial V=Cn[x] de polinomios con coeficientes complejos y grado a lo más n. Los polinomios p tales que ev0(p)=0 son exactamente aquellos cuyo término libre es 0. Este es un subespacio vectorial de V de dimensión n=dimV1, pues una base para él son los polinomios x,x2,,xn.

Problema. Considera el espacio vectorial V=M2,3(R). Considera W el subconjunto de matrices cuya suma de entradas en la primer columna es igual a la suma de entradas de la segunda columna. Muestra que W es un subespacio de dimensión 5 y escríbelo como el kernel de una forma lineal.

Solución. Mostrar que W es un subespacio de V es sencillo y se queda como tarea moral. Se tiene que W no puede ser igual a todo V pues, por ejemplo, la matriz (100000) no está en W, así que dimW5.

Las matrices (110000), (111000), (110001), (100010), (010100) son linealmente independientes y están en W, así que dimW5, y junto con el párrafo anterior concluimos que dimW=5.

Finalmente, tomemos la forma lineal l(abcdef)=a+dbe. Tenemos que una matriz está en el kernel de l si y sólo si a+dbe=0, si y sólo si a+d=b+e, es decir, si y sólo si las entradas de la primer columna tienen la misma suma que las de la segunda. Así, W=kerl.

◻

La proposición anterior nos permite dar una definición alternativa de hiperplano y hablar de hiperplanos linealmente independientes.

Definición 2. Sea V un espacio vectorial. Un hiperplano es el kernel de una forma lineal l0 en V. Una familia de hiperplanos es linealmente independiente si sus formas lineales correspondientes son linealmente independientes en V.

Observa además que la definición anterior también sirve para espacios vectoriales de dimensión infinita, pues nunca hace referencia a la dimensión que debe tener un hiperplano.

Ejemplo 2. El conjunto de funciones continuas f en el intervalo [0,1] tales que 01f(x)dx=0 son un subespacio W de C[0,1]. Este subespacio es un hiperplano pues es el kernel de la forma lineal I tal que I(f)=01f(x)dx.

◻

No mencionaremos más de espacios de dimensión infinita en esta entrada.

Escribiendo subespacios como intersección de hiperplanos

Ya podemos entender el teorema principal de esta entrada y demostrarlo. Lo enunciamos nuevamente por conveniencia.

Teorema 2. Sea V un espacio vectorial de dimensión finita n.

  • Todo subespacio W de V de dimensión m es la intersección de nm hiperplanos de V linealmente independientes.
  • Toda intersección de nm hiperplanos de V linealmente independientes es un subespacio vectorial de dimensión m.

Demostración. Tomemos un espacio vectorial V de dimensión finita n y un subespacio W de dimensión m. Por el teorema de dualidad, la dimensión de dimW es nm. Tomemos una base B={l1,l2,,lnm} de W. Por el corolario al teorema de dualidad, podemos expresar a W como W=(W)={vV:l1(v)==lnm(v)=0}.

Si definimos Li={vV:li(v)=0}, por la proposición de la sección anterior tenemos que cada Li es un hiperplano de V. Además, W=L1Lnm. Como los li son linealmente independientes, con esto logramos expresar a W como intersección de nm hiperplanos linealmente independientes.

Probemos ahora la segunda parte de la proposición. Tomemos el conjunto S={l1,,lnm} de formas linealmente independientes que definen a los hiperplanos. Un vector v está en la intersección de todos estos hiperplanos si y sólo si l1(v)==lnm(v)=0, si y sólo si está en S=span(S). Es decir, la intersección de los hiperplanos es precisamente el subespacio span(S). Como S es linealmente independiente, tenemos que span(S) es de dimensión nm, de modo que por el teorema de dualidad, dimspan(S)=n(nm)=m. Esto muestra lo que queremos.

◻

Algunos problemas prácticos

Si tenemos un espacio V de dimensión finita n, un subespacio W de dimensión finita m y queremos encontrar de manera práctica la expresión de W como intersección de hiperplanos de V, podemos hacer el siguiente procedimiento:

  • Determinamos una base l1,,lnm para W (la cual consiste de formas lineales de V). Esto lo podemos hacer con los pasos que mencionamos en la entrada anterior.
  • Definimos Li={vV:li(v)=0}.
  • Tendremos que W es la intersección de los Li.

Una última observación es que cada Li está definido por una ecuación lineal. Esto nos permite poner a cualquier subespacio como el conjunto solución a un sistema lineal. Esto lo cual podemos ver de forma práctica de la siguiente manera:

  • Tomamos una base e1,,en de V.
  • Tomemos un vector v=a1e1++anen que queremos determinar si está en W. Para ello, debe estar en cada Li.
  • Cada Li está definido mediante la ecuación li(v)=0 de modo que si v está en Li sus coordenadas a1,,an en la base e1,,en deben satisfacer la ecuación lineal li(e1)a1++li(en)an=0.
  • De esta forma, los vectores v en W son aquellos cuyas coordenadas en la base e1,,en satisfacen el sistema de ecuaciones obtenido de las ecuaciones lineales para cada i del punto anterior.

Veremos algunos ejemplos de estos procedimientos en la siguiente entrada.

La receta anterior nos permite concluir la siguiente variante del teorema de esta entrada, escrito en términos de ecuaciones lineales.

Teorema. Sea V un espacio vectorial de dimensión finita n y B una base de V.

  • Un subespacio W de dimensión m se puede definir mediante un sistema de ecuaciones lineales independientes que deben satisfacer las coordenadas de los vectores de W escritos en la base B.
  • Aquellos vectores cuyas coordenadas en la base B satisfacen un sistema de ecuaciones lineales independientes homogéneo, forman un subespacio de V de dimensión nm.

La moraleja de esta entrada es que podemos pensar que los sistemas de ecuaciones, las intersecciones de hiperplanos y los subespacios de un espacio vectorial de dimensión finita son «prácticamente lo mismo».

Más adelante…

A lo largo de esta entrada enunciamos las definiciones necesarias para llegar al teorema que mencionamos al inicio: para un espacio vectorial de dimension finita n, todos los subespacios se pueden obtener a partir de intersectar hiperplanos, es decir, subespacios de dimensión n1.

En la siguiente entrada utilizaremos este resultado para resolver algunos ejercicios y veremos en acción este importante teorema.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Considera el plano P en R3 que pasa por el origen y por los vectores (1,1,1), (0,2,0). Encuentra reales a,b,c tales que P={(x,y,z):ax+by+cz=0}.
  • En todos los ejemplos en los que se menciona que algo es subespacio, verifica que en efecto lo sea. En los que se menciona que un conjunto es base, también verifica esto.
  • Encuentra una base para el espacio de polinomios p en Mn(C) tales que ev(1)(p)=0.
  • Sea W el subconjunto de matrices de V:=Mn(R) tal que la sumas de las entradas de todas las filas son iguales. Muestra que W es un subespacio de V. Determina la dimensión de W y exprésalo como intersección de hiperplanos linealmente independientes.
  • ¿Qué sucede cuando intersectas hiperplanos que no corresponden a formas linealmente independientes? Más concretamente, supongamos que tienes formas lineales l1,,lm de Fn. Toma B={e1,,en} la base canónica de Fn. Considera la matriz A=[li(ej)]. ¿Qué puedes decir de la dimensión de la intersección de los hiperplanos correspondientes a los li en términos del rango de la matriz A?

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»