Hasta ahora, hemos hablado de funciones integrables en un intervalo cerrado, en términos de ciertas sumas superiores e inferiores. Vimos en la entrada de Propiedades de la integral que si una función es monótona o continua, entonces su integral siempre está definida. Ahora veremos qué sucede con las funciones que tienen discontinuidades. En esta entrada trataremos a las funciones que finitas discontinuidades. En la siguiente hablaremos de funciones con una infinidad de discontinuidades.
Breve repaso de integrabilidad
Recordemos que para determinar si una función acotada es integrable en cierto intervalo , debemos calcular ciertas sumas superiores e inferiores con respecto a una partición. Esto es tomar algunos puntos en , con y . Escribimos
y decimos que genera los siguientes intervalos a los que llamamos celdas
A le llamamos la -ésima celda de , cuya longitud es . Si es el ínfimo de los valores de en la -ésima celda y es su supremo, entonces podemos definir respectivamente la suma inferior y superior como
La función es integrable cuando el ínfimo de las sumas superiores (tomado sobre todas las particiones) coindice con el supremos de las sumas inferiores. Vimos que esto es equivalente a pedir que para todo haya una partición en la que la suma superior y la inferior difieran menos que (a lo que llamamos el criterio de Riemann). Probamos varias otras propiedades de esta definición, pero una que será muy importante para esta entrada es la siguiente.
Proposición. Sea una función acotada. Sea cualquier valor entre . Si la integral
existe, entonces las dos integrales
también existen. Y viceversa, si estas dos integrales existen, entonces la primera también.
Cuando las tres integrales existen, se cumple además la siguiente igualdad:
Usaremos esta proposición en las siguientes secciones, pero necesitamos una versión un poco más versátil.
Proposición. Sea una función acotada y un entero positivo. Sea una partición de . Si la integral existe, entonces todas las integrales para existen. Y viceversa, si estas integrales existen, entonces la primera también. Cuando todas estas integrales existen, entonces
La demostración de esta proposición no es difícil, pues se sigue de la proposición anterior y de una prueba inductiva. Por ello, la encontrarás como parte de los ejercicios.
Funciones escalonadas
Hablaremos de la integrabilidad de funciones escalonadas, para lo cual necesitaremos la siguiente definición.
Definición. Una función es escalonada en el intervalo , si existe una partición del intervalo , tal que es constante en cada subintervalo abierto de . Es decir, para cada existe un número real tal que:
A las funciones escalonadas también se les conoce como funciones constantes a trozos.
Ejemplo. En algunos sistemas postales se deben poner estampillas en una carta para poderse enviar. La cantidad de estampillas que hay que poner está determinada por el peso de la carta. Supongamos que una estampilla cuesta pesos y que hay que poner una estampilla por cada (o fracción) que pese la carta, hasta un máximo de .
Si el peso de la carta en gramos está en el intervalo , entonces tienes que pagar pesos. Si está en el intervalo , pagarás 10 pesos y así sucesivamente hasta que llegue a 100 gramos. Gráficamente, el costo de envío tendría el siguiente comportamiento (puedes dar clic en la imagen para verla a mayor escala).
Observa que en efecto parece ser que hay «escalones». Esta función es escalonada pues al dar la partición , tenemos que la función es constante en cada intervalo abierto definido por la partición.
Si quisiéramos calcular la integral de esta función, ¿qué podríamos hacer? Podemos utilizar la proposición de separar la integral en intervalos que enunciamos arriba, usando la misma partición . Como la función es constante en cada intervalo dado, entonces su integral existe. Así, la integral en todo el intervalo existirá y será la suma de las integrales en cada intervalo. Tendrás que encontrar el valor exacto como uno de los ejercicios.
Integral para funciones escalonadas
Las funciones escalonadas en un cierto intervalo siempre son integrables, como lo afirma el siguiente resultado.
Teorema. Sea una función. Si es escalonada en un intervalo , entonces es integrable en . Además, si la partición que muestra que es escalonada es , y para en el intervalo (para ) se cumple que , entonces se tiene que
El teorema nos dice entonces que el valor de la integral es la suma de los productos del valor (constante), por la longitud del -ésimo intervalo. Esto tiene mucho sentido geométrico: cada uno de estos productos es el área de un rectángulo correspondiente a un «escalón». El teorema nos dice que el área buscada es la suma de las áreas de estos escalones.
Demostración. La demostración es consecuencia de la proposición para partir integrales en intervalos. Notemos que como es constante en cada intervalo (para ), entonces es integrable en dicho intervalo. En efecto, fijemos una y tomemos una partición de . En en este intervalo cualquier suma superior (o inferior) se hace tomando como supremo (o ínfimo) al valor constante , de modo que:
Así, el ínfimo de las particiones superiores y el supremo de las inferiores es , por lo que la integral existe en cada intervalo y es igual a . Usando la proposición que enunciamos en la sección de recordatorio sobre partir la integral por intervalos, obtenemos
como queríamos.
Funciones continuas a trozos
Las funciones escalonadas son muy sencillas, pero las ideas que hemos discutido respaldan una cierta intuición de que para la integrabilidad «si la función se comporta bien en cada uno de una cantidad finita de intervalos, entonces se comporta bien en todo el intervalo». Esa idea se repite a continuación.
Definición. Sea . Diremos que es continua a trozos en el intervalo si existe una partición de tal que es continua en cada intervalo para .
Pareciera que estamos pidiendo continuidad en todo el intervalo . Sin embargo, hay algunas excepciones. Por la manera en la que está escrita la definición, la función no necesariamente es continua en los puntos .
Proposición. Sea una función acotada. Si es continua a trozos en el intervalo , entonces es integrable en .
Demostración. Nos gustaría usar la proposición de separación de la integral por intervalos. Para ello, tomemos la partición de tal que es continua en cada intervalo para . Si fuera continua en cada intervalo cerrado , podríamos usar un resultado anterior para ver que es integrable en cada uno de estos intervalos, pero aquí tenemos una hipótesis un poco más débil, pues la continuidad es sólo en el abierto.
De cualquier manera, se puede ver que es integrable en cada intervalo cerrado . Para ello, fijemos y tomemos . Como es acotada, tiene supremo e ínfimo en . Si , entonces es constante y no hay nada que hacer. Así, supongamos y tomemos una tal que , y tal que . La segunda condición nos dice que es no vacío. Como es continua en este intervalo cerrado, es integrable ahí. Por el criterio de Riemann, hay una partición de dicho intervalo tal que
Si a esta partición agregamos los puntos y , entonces obtenemos una partición la cual su primera y última celda tienen longitud y cumple
Así, hemos encontrado una partición de donde las sumas superior e inferior difieren en menos de . Por el criterio de Riemann, es integrable en ese intervalo, para cada . Concluimos la demostración usando nuevamente la proposición de separación de la integral en intervalos.
Ejemplo. La siguiente función
es integrable en el intervalo . Tendrás que calcular su integral en los ejercicios.
Definición. Una función es monótona a trozos en el intervalo si existe una partición de tal que es monótona en cada intervalo para .
Podemos pensar cómo sería la gráfica de una función así. Tendría que estar formada por un número finito de trozos monótonos. Un ejemplo de ello son las funciones escalonadas (son por ejemplo, no crecientes a trozos). Un ejemplo un poco más interesante sería el de la siguiente figura.
Monótona por trozos
Como te imaginarás, las funciones monótonas a trozos también son integrables.
Proposición. Sea una función acotada. Si es monótona a trozos en el intervalo , entonces es integrable en .
Una vez más, la demostración usa la proposición de separación de la integral por intervalos. Pero nuevamente nos enfrentamos con una dificultad. Lo que hemos demostrado anteriormente es que si una función es monónona en un intervalo , entonces es integrable en dicho intervalo. ¿Pero si sólo tenemos monotonía en ? Para atender esta dificultad, se tiene que hacer una adaptación similar a lo que hicimos en la demostración para funciones continuas a trozos. Los detalles quedan como parte de la tarea moral.
Más adelante…
En esta entrada analizamos funciones con una cantidad finita de discontinuidades. También hablamos de las funciones monótonas a trozos, que podrían tener una infinidad de discontinuidades, pero también ser integrables. En la siguiente entrada veremos qué hacer con la integrabilidad cuando tenemos una cantidad infinita de discontinuidades.
Tarea moral
Calcula el valor de la integral de la función escalonada del servicio postal, con la partición dada.
Integra la siguiente función:
Integra la siguiente función. Puedes usar fórmulas de integración que conozcas de cursos preuniversitarios, sin embargo, toma en cuenta que tu respuesta será un poco informal hasta que mostremos de dónde salen dichas fórmulas.
Demuestra por inducción la proposición de separación de la integral en intervalos que quedó pendiente en la sección de «Breve repaso de integrabilidad». Asegúrate de demostrar la ida y la vuelta.
Sean y funciones acotadas.
Muestra que si y son funciones escalonadas en un intervalo , entonces y también son funciones escalonadas en . Sugerencia. Usa como partición un refinamiento común a las particiones y que muestran que y son escalonadas, respectivamente.
Muestra que si y son funciones continuas por trozos en un intervalo , entonces y también son funciones continuas por trozos en .
Si y son funciones monótonas por trozos en un intervalo , ¿será que y también lo son? ¿Bajo qué condiciones de la monotonía sí sucede esto?
Da un ejemplo de una función que sea monótona por trozos, pero que no sea continua por trozos.
Demuestra la proposición de que las funciones monónotas a trozos son integrables.
En la entrada anterior se dio el paso de generalizar la integral. Ya no solo considerarla como un valor, si no como una función.
Al momento de precisar esta generalización, pudimos encontrar el paralelismo que existe con la integral definida, lo podemos ver de la siguiente forma.
Como lo mencionamos anteriormente, la diferencia reside en el intervalo de integración, como se observa arriba sería el límite superior.
Pero, sin perdida de generalidad, se puede considerar el límite inferior o ambos, ya que el hecho de que sea indefinida es que no tiene un inicio o fin especifico, si no que estos dependen de una variable.
Entonces, el resultado de la integral no es un número real, ahora es una función que depende de la variable , en este caso.
Considere un intervalo de integración , y un punto dentro de este intervalo.
Entonces, la integral se puede separar de la siguiente forma.
En este caso, se genera una integral definida y una integral indefinida.
Ejemplo:
Sea la siguiente función.
Se pueden tener diferentes casos al momento de pedir la integral de la función, ya que se puede partir el intervalo dependiendo del valor de .
a) Si
Entonces, la integral de se plantea como sigue.
Ya que es la parte donde la función tiene el dominio que se quiere integrar.
b) Si
Entonces la integral se ve de la siguiente manera.
Y tenemos el mismo argumento que en el caso anterior.
c) Si
En este caso la corre en todo el intervalo y está condicionado que tiene que ser mayor que 3, entonces la integral se ve de la siguiente manera.
Y este caso, como se mencionó en la propiedad de la Aditividad, genera una integral definida y una integral indefinida.
d) Si
Este caso solo condiciona a que el valor de tiene que estar dentro del dominio de la función, por lo que la integral queda de la siguiente manera.
Y que se podrá dar solución en el momento en que se defina el valor de .
II. Suma
Sea una función tal que:
Donde y también son funciones. Entonces, para calcular la integral de , tenemos la siguiente propiedad.
Entonces, la integral de una suma, es la suma de las integrales.
III. Producto por una constante
Sea una función tal que , donde es cualquier real y una función. Entonces,
Las constantes que se encuentran multiplicando a una función pueden entrar y salir de la integral.
IV. Linealidad
Sean y dos funciones y sean y dos números reales. Entonces:
Esta propiedad contiene a las dos anteriores (suma y producto), lo que la hace sumamente útil y provoca que se mencione en múltiples ocasiones.
Más adelante…
Ya que tenemos estás propiedades, podemos simplificar el proceso para desarrollar la integral y poder descomponerla en integrales más simples ó, en caso contrario, podemos aplicarlas para poder simplificarlas (reducirlas) o encontrar una sustitución adecuada para que se pueda integrar con mayor facilidad.
En la siguiente sección, tendremos un recordatorio de derivadas. Esto es necesario ya que existe una relación importante entre la derivada y la integral. Es posible que para este momento de tu formación, haz escuchado que la integral es el proceso contrario a o la inversa de la derivación.
Entonces, para poder explicar esta relación entre ambos procesos, es necesario recordar como funciona la derivada, que significa y como se calcula.
Tarea moral
Utiliza la propiedad de linealidad.
Aplique las reglas correspondientes para expandir la forma de la integral, para los diferentes casos. i) Integral indefinida para cualquier entre 5 y 9. ii) Integral indefinida para cualquier entre 0 y 5. ii) Integral indefinida para cualquier entre 3 y 8, pasando por el 5.
Aplique las reglas correspondientes para dejar en una sola integral la siguiente integral.
En la primera unidad del curso, hemos definido la integral mediante las sumas de Riemann considerando los distintos comportamiento que estas pueden tener.
Vimos que hacer en los casos sencillos donde se tienen funciones bien portadas como las continuas, acotadas, monótonas, etc. Pero también se vieron casos más interesantes, por ejemplo, como cuando son continuas en subintervalos, y estos podían ser finitos o infinitos, como las funciones escalonadas o la función de Dirichlet.
En estos ejemplos se mostraba la integrabilidad o la no integrabilidad de la función. Pero a pesar de que los ejemplos podían ser contrastantes entre sí, todos compartían una característica y era que se encontraban definidos dentro de un intervalo cerrado.
Esto era, que la función se encontraba dentro de un segmento del eje de las abscisas el cual tenía un inicio y un fin bien determinado.
En esta nueva unidad se tendrá una generalización de este proceso. Ya no se considerarán intervalos con un inicio y fin, ahora trabajaremos la integral en un intervalo que el inicio o el fin (o ambos) dependerán de una variable, por lo que será un intervalo no definido.
A este nuevo fenómeno de generar la integral en un intervalo no definido se le conocerá como integral indefinida.
Integral Indefinida
En la unidad anterior se determinó que el valor de la integral depende del intervalo de integración o de los límites de integración donde teníamos la siguiente representación .
Y se decía que el límite inferior era el punto y el límite superior era el punto y entre esos dos puntos se tenía la curva de la función y la integral era el área contenida bajo esa curva.
Ahora, consideremos el límite inferior como un número fijo , que no es un número particular, es decir, que puede ser cualquiera. Y el límite superior será una variable denotada con . Teniendo la siguiente notación.
Así que la función se denomina como la integral indefinida de la función .
De forma que la función , es una función que depende de .
Esto cambia la percepción de la integral ya que, anteriormente, solo se concebía la integral como un número (que era el área bajo la curva). Pero ahora la integral ya no solo es un escalar, a partir de este momento, podemos mostrar que la integral también es una función que puede depender de una variable independiente.
De manera análoga, se puede hacer que el límite inferior sea variable y, por lo tanto, que ambos límites puedan variables o dependan de otra función.
De una forma geométrica, se puede ver de la siguiente manera.
Así que la integral indefinida está dada por el área sombreada en rojo, que se encuentra delimitada por la curva en azul dentro del intervalo .
Entonces, hasta que no se determine un valor para , el valor de la integral irá cambiando.
Se debe recordar que el signo del área se determina por el cuadrante en el que se encuentra, como se vio en la Unidad 1.
Observación: Cualquier integral definida es un caso particular de una integral indefinida .
En el momento en que se define el valor de y de , recuperamos un intervalo definido y tenemos una integral definida.
Las reglas básicas para la integral que se vieron, tienen su generalización con integrales indefinidas, por ejemplo, la suma:
De esta forma queda una integral definida en términos de integrales indefinidas.
Así, se puede expresar cualquier integral indefinida con límite inferior en términos de :
En donde es una constante, así que, sin pérdida de generalidad, se puede concluir que cualquier integral definida difiere de la integral indefinida por una constante.
Donde a se le conoce como la constante de integración.
Continuidad de la integral indefinida
En la unidad anterior, al momento de trabajar con funciones continuas nos era sencillo generar las sumas de Riemann ya que se encontraba la función dentro del intervalo bien definida en todo momento. No presentaba saltos extraños o, como era continua, no presentaba discontinuidades en ningún tramo del intervalo o de cualquier partición de este.
En este caso, hemos dicho que la integral indefinida también es una función. Entonces, es importante conocer cuales son las características de esta nueva función.
En este caso, vamos a mostrar que la integral de una función continua, también es continua, entonces:
Sea función continua en el intervalo y sea un punto dentro del intervalo, i.e. . Se define la integral indefinida como:
Teorema: La integral indefinida de una función continua, es asimismo, continua.
Demostración:
Sea dos valores dentro del intervalo donde la función es continua.
Durante la demostración se recordó el teorema del valor medio, mostrando la siguiente ecuación:
Observación: Si es una función positiva en todo el intervalo , se obtiene que es una función creciente.
Más adelante…
Teniendo definidas las integrales indefinidas, podremos revisar las propiedades que estas integrales tienen y teoremas que son de alta importancia, tanto en cálculo como en las demás asignaturas.
Este paso de trabajar con integrales indefinidas nos da una mayor libertad al momento de trabajar con funciones. Anteriormente, al trabajar con integrales definidas, teníamos plena conciencia de que punto a que punto se necesitaba integrar, lo que, al momento de evaluar o de integral solo encontramos un número; pero ahora que trabajamos con integrales indefinidas.
Y como estamos ampliando la definición de la integral, es necesario mostrar las propiedades que esta extensión genera ya que, si consideramos estas propiedades se nos podrá facilitar el manejo de de esta transformación de funciones.
Estas propiedades las veremos en la siguiente entrada.
Tarea moral
Escribe las siguientes integrales definidas como integrales indefinidas.
Sea una función continua y se cumple que . Demuestra que es idénticamente 0.
En la entrada anterior introdujimos el concepto de determinante de matrices cuadradas. Dimos la definición para matrices de . Aunque no dimos la definición en general (pues corresponde a un curso de Álgebra Lineal I), dijimos cómo se pueden calcular los determinantes de manera recursiva. Pero, ¿hay otras herramientas para hacer el cálculo de determinantes más sencillo?
En esta entrada hablaremos de más propiedades de los determinantes. Comenzaremos viendo que si en una matriz tenemos dos filas o columnas iguales, el determinante se hace igual a cero. Luego, veremos que los determinantes son lineales (por renglón o columna), que están muy contectados con las operaciones elementales y platicaremos de algunos determinantes especiales.
Linealidad por filas o columnas
El determinante «abre sumas y saca escalares», pero hay que ser muy cuidadosos, pues no lo hace para toda una matriz, sino sólo renglón a renglón, o columna a columna. Enunciemos esto en las siguientes proposiciones.
Proposición. El determinante saca escalares renglón por renglón o columna por columna. Por ejemplo, pensemos en sacar escalares por renglón. Si es un número real y tenemos una matriz de la forma entonces
No podemos dar la demostración muy formalmente, pues necesitamos de más herramientas. Pero puedes convencerte de que esta proposición es cierta pensando en lo que sucede cuando se calcula el determinante recursivamente en la fila . En la matriz de la izquierda, usamos los coeficientes para acompañar a los determinantes de las matrices de que van saliendo. Pero entonces en cada término aparece y se puede factorizar. Lo que queda es veces el desarrollo recursivo de la matriz sin las ’s en el renglón .
Ejemplo. Calculemos el determinante de la matriz . En la primera columna hay un , así que nos conviene usar esta columna para encontrar el determinante. Aplicando la regla recursiva, obtenemos que:
¿Qué sucedería si quisiéramos ahora el determinante de la matriz ? Podríamos hacer algo similar para desarrollar en la primera fila. Pero esta matriz está muy relacionada con la primera. La segunda columna de es veces la segunda columna de . Por la propiedad que dijimos arriba, tendríamos entonces que
Ejemplo. Hay que tener mucho cuidado, pues el determinante no saca escalares con el producto escalar de matrices. Observa que si , entonces . Sin embargo,
En vez de salir dos veces el determinante, salió cuatro veces el determinante. Esto tiene sentido de acuerdo a la propiedad anterior: sale un factor pues la primera fila es el doble, y sale otro factor porque la segunda fila también es el doble.
Proposición. El determinante abre sumas renglón por renglón, o columa por columna. Por ejemplo, veamos el caso para columnas. Si tenemos una matriz de la forma entonces este determinante es igual a
Una vez más, no podemos dar una demostración muy formal a estas alturas. Pero como en el caso de sacar escalares, también podemos argumentar un poco informalmente qué sucede. Si realizamos el cálculo de determinantes en la columna , entonces cada término de la forma acompaña a un determinante de una matriz de que ya no incluye a esa columna. Por ley distributiva, cada sumando es entonces (acompañado por un o un ). Agrupando en un lado los sumandos con ’s y por otro los sumandos con ’s obtenemos la identidad deseada.
Ejemplo. Las matrices y tienen determinantes y respectivamente (verifícalo). De acuerdo a la propiedad anterior, el determinante de la matriz
debería ser . Y sí, en efecto .
Hay que tener mucho cuidado, pues en esta propiedad de la suma las dos matrices tienen que ser iguales en casi todas las filas (o columnas), excepto en una. En esa fila (o columna) es donde se da la suma. En general, no sucede que .
Ejemplo. Puedes verificar que las matrices y tienen ambas determinante . Sin embargo, su suma es la matriz de puros ceros, que tiene determinante . Así,
El determinante y operaciones elementales
El siguiente resultado nos dice qué sucede al determinante de una matriz cuando le aplicamos operaciones elementales.
Teorema. Sea una matriz cuadrada.
Si es una matriz que se obtiene de al reescalar un renglón con el escalar , entonces .
Si es una matriz que se obtiene de al intercambiar dos renglones, entonces .
Si es una matriz que se obtiene de al hacer una transvección, entonces .
No nos enfocaremos mucho en demostrar estas propiedades, pues se demuestran con más generalidad en el curso de Álgebra Lineal I. Sin embargo, a partir de ellas podemos encontrar un método de cálculo de determinantes haciendo reducción gaussiana.
Teorema. Sea una matriz cuadrada. Supongamos que para llevar a su forma escalonada reducida se aplicaron algunas transvecciones, intercambios de renglones y reescalamientos por escalares no cero (en el orden apropiado). Entonces En particular:
Si no es la identidad, entonces y entonces .
Si es la identidad, entonces y entonces
Veamos un ejemplo.
Ejemplo. Calculemos el determinante de la matriz usando reducción gaussiana. Multiplicamos la primera fila por y la sumamos tres veces a la última (transvección no cambia el determinante):
Multiplicamos por la segunda fila y la intercambiamos con la tercera (va ).
Restamos dos veces la segunda fila a la tercera (transvección no cambia el determinante)
y multiplicamos la tercera fila por :
Hacemos transvecciones para hacer cero las entradas arriba de la diagonal principal (transvecciones no cambian el determinante):
Ya llegamos a la identidad. Los reescalamientos fueron por , y y usamos en total intercambio. Así,
Es recomendable que calcules el determinante del ejemplo anterior con la regla recursiva de expansión por menores para que verifiques que da lo mismo.
Algunos determinantes especiales
A continuación enunciamos otras propiedades que cumplen los determinantes. Todas estas puedes demostrarlas suponiendo propiedades que ya hemos enunciado.
Proposición. Para cualquier entero positivo se cumple que la matriz identidad tiene como determinante .
Este resultado es un caso particular de una proposición más general.
Proposición. El determinante de una matriz diagonal es igual al producto de los elementos de su diagonal; es decir,
Para probar esta proposición, puedes usar la regla recursiva para hacer la expansión por la última fila (o columna) y usar inducción.
Proposición..
Este resultado también sale inductivamente. Como los determinantes se pueden expandir por renglones o columnas, entonces puedes hacer una expansión en alguna fila de y será equivalente a hacer la expansión por columnas en .
Proposición. Si es una matriz invertible, entonces .
Para demostrar este resultado, se puede usar la proposición del determinante de la identidad, y lo que vimos la entrada pasada sobre que .
Los argumentos que hemos dado son un poco informales, pero quedará en los ejercicios de esta entrada que pienses en cómo justificarlos con más formalidad.
Ejemplos interesantes de cálculo de determinantes
Las propiedades anteriores nos permiten hacer el cálculo de determinantes de varias maneras (no sólo expansión por menores). A continuación presentamos dos ejemplos que usan varias de las técnicas discutidas arriba.
Ejemplo. Calculemos el siguiente determinante:
Como aplicar transvecciones no cambia el determinante, podemos restar la primera fila a la segunda, y luego cinco veces la primera fila a la tercera y el determinante no cambia. Así, este determinante es el mismo que
Multiplicar la segunda fila por cambia el determinante en . Y luego multiplicar la tercera por lo vuelve a cambiar en . Entonces haciendo ambas operaciones el determinante no cambia y obtenemos que el determinante es igual a
En esta matriz podemos expandir por la primera columna en donde hay dos ceros. Por ello, el determinante es
Ejemplo. Calculemos el siguiente determinante:
Hacer transvecciones no cambia el determinante, entonces podemos sumar todas las filas a la última sin alterar el determinante. Como , obtenemos:
Ahora, la última fila tiene un factor que podemos factorizar:
Ahora, podemos restar la primera columna a todas las demás, sin cambiar el determinante:
Luego, podemos sumar la segunda fila a la tercera sin cambiar el determinante:
Expandiendo por la última fila:
Expandiendo nuevamente por la última fila:
El determinante de que queda ya sale directo de la fórmula como . Así, el determinante buscado es .
Más adelante…
Los determinantes son una propiedad fundamental de las matrices. En estas entradas apenas comenzamos a platicar un poco de ellos. Por un lado, son muy importantes algebraicamente pues ayudan a decidir cuándo una matriz es invertible. Se pueden utilizar para resolver sistemas de ecuaciones lineales en incógnitas con algo conocido como la regla de Cramer. Por otro lado, los determinantes también tienen una interpretación geométrica que es sumamente importante en geometría analítica y en cálculo integral de varias variables. En cursos posteriores en tu formación matemática te los seguirás encontrando.
Tarea moral
Calcula el siguiente determinante: Intenta hacerlo de varias formas, aprovechando todas las herramientas que hemos discutido en esta entrada.
También se pueden obtener determinantes en matrices en donde hay variables en vez de escalares. Encuentra el determinante de la matriz
Encuentra todas las matrices de que existen tales que
Demuestra todas las propiedades de la sección de «Algunos determinantes especiales». Ahí mismo hay sugerencias de cómo puedes proceder.
En las unidades anteriores hemos desarrollado varias herramientas de la teoría de diferenciabilidad que nos permiten estudiar tanto a los campos escalares, como a los campos vectoriales. Hemos platicado un poco de las aplicaciones que esta teoría puede tener. En esta última unidad, profundizamos un poco más en cómo dichas herramientas nos permitirán hacer un análisis geométrico y cuantitativo de las funciones. Es decir, a partir de ciertas propiedades analíticas, hallaremos algunas cualidades de su comportamiento geométrico. En esta entrada estudiaremos una pregunta muy natural: ¿cuándo una función diferenciable alcanza su máximo o su mínimo? Para ello, necesitaremos definir qué quiere decir que algo sea un punto crítico de una función. Esto incluirá a los puntos más altos, los más bajos, local y globalmente y ciertos «puntos de quiebre» que llamamos puntos silla.
Introducción al estudio de los puntos críticos
Si tenemos un campo escalar , en muchas aplicaciones nos interesa poder decir cuándo alcanza sus valores máximos o mínimos. Y a veces eso sólo nos importa en una vecindad pequeña. La siguiente definición hace ciertas precisiones.
Definición. Sea un campo escalar, y .
Decimos que tiene un máximo absoluto (o máximo global) en si para todo . A le llamamos el máximo absoluto (o máximo global) de en .
Decimos que tiene un máximo relativo (o máximo local) en si existe una bola abierta tal que para todo .
Decimos que tiene un mínimo absoluto (o mínimo global) en si para todo . A le llamamos el mínimo absoluto (o mínimo global) de en .
Decimos que tiene un mínimo relativo (o mínimo local) en si existe una bola abierta tal que para todo .
En cualquiera de las situaciones anteriores, decimos que tiene un valor extremo (ya sea relativo o absoluto) en . Notemos que todo extremo absoluto en será extremo relativo al tomar una bola que se quede contenida en . Y de manera similar, todo extremo relativo se vuelve un extremo absoluto para la función restringida a la bola que da la definición.
Usualmente, cuando no sabemos nada de una función , puede ser muy difícil, si no imposible estudiar sus valores extremos. Sin embargo, la intuición que tenemos a partir de las funciones de una variable real es que deberíamos poder decir algo cuando la función que tenemos tiene cierta regularidad, por ejemplo, cuando es diferenciable. Por ejemplo, para funciones diferenciables quizás recuerdes que si tiene un valor extremo en , entonces .
El siguiente teorema es el análogo en altas dimensiones de este resultado.
Teorema. Sea un campo escalar. Supongamos que tiene un valor extremo en un punto interior de , y que es diferenciable en . Entonces el gradiente de se anula en , es decir,
Demostración. Demostraremos el resultado para cuando hay un máximo relativo en . El resto de los casos quedan como tarea moral. De la suposición, obtenemos que existe un tal que para todo . Escribamos .
Para cada tenemos:
Además, ya que es diferenciable en también se cumple
Dado que alcanza máximo en tenemos que . Para el límite por la izquierda tenemos , por lo tanto, en este caso
Para el límite por la derecha tenemos , por lo cual
Pero la igualdad entre ambos límites dos dice entonces que
Por lo cual cada derivada parcial del campo vectorial es cero, y así el gradiente también lo es.
Parece ser que es muy importante saber si para un campo vectorial su gradiente se anula, o no, en un punto. Por ello, introducimos dos nuevas definiciones.
Definición. Sea un campo escalar diferenciable en un punto en . Diremos que tiene un punto estacionario en si .
Definición. Sea un campo escalar y tomemos en . Diremos que tiene un punto crítico en si o bien no es diferenciable en , o bien tiene un punto estacionario en .
Si tiene un valor extremo en y no es diferenciable en , entonces tiene un punto crítico en . Si sí es diferenciable en y es un punto interior del dominio, por el teorema de arriba su gradiente se anula, así que tiene un punto estacionario y por lo tanto también un punto crítico en . La otra opción es que sea diferenciable en , pero que no sea un punto interior del dominio.
Observación. Los valores extremos de se dan en los puntos críticos de , o en puntos del dominio que no sean puntos interiores.
Esto nos da una receta para buscar valores extremos para un campo escalar. Los puntos candidatos a dar valores extremos son:
Todos los puntos del dominio que no sean interiores.
Aquellos puntos donde la función no sea diferenciable.
Los puntos la función es diferenciable y el gradiente se anule.
Ya teniendo a estos candidatos, hay que tener cuidado, pues desafortunadamente no todos ellos serán puntos extremos. En la teoría que desarrollaremos a continuación, profundizaremos en el entendimiento de los puntos estacionarios y de los distintos comportamientos que las funciones de varias variables pueden tener.
Intuición geométrica
Para entender mejor qué quiere decir que el gradiente de un campo escalar se anuele, pensemos qué pasa en términos geomértricos en un caso particular, que podamos dibujar. Tomemos un campo escalar . La gráfica de la función es la superficie en que se obtiene al variar los valores de en la expresión .
Otra manera de pensar a esta gráfica es como un conjunto de nivel. Si definimos , entonces la gráfica es precisamente el conjunto de nivel para en el valor , pues precisamente si y sólo si .
Si alcanza un extremo en , entonces por lo cual . Así, el gradiente es paralelo al eje y por lo tanto es un vector normal a la superficie . Esto lo podemos reinterpretar como que el plano tangente a la superficie citada en el punto es horizontal.
Puntos silla
Cuando la función es diferenciable y el gradiente se anula, en realida tenemos pocas situaciones que pueden ocurrir. Sin embargo, falta hablar de una de ellas. Vamos a introducirla mediante un ejemplo.
Ejemplo. Consideremos . En este caso
Si , entonces las parciales se anulan, así que el gradiente también. Por ello, es un punto estacionario (y por lo tanto también crítico). Pero veremos a continuación que no es máximo relativo ni mínimo relativo.
Tomemos abitrario y . El punto pues es igual a . Análogamente, tenemos que el punto . Sin embargo , por lo que no es un mínimo local, también , por lo que tampoco es máximo local. En la Figura 1 tenemos un bosquejo de esta gráfica.
Figura 1
Los puntos como los de este ejemplo tienen un nombre especial que definimos a continuación.
Definición. Sea un campo escalar y un punto estacionario de . Diremos que es un punto silla si para todo existen tales que y .
Determinar la naturaleza de un punto estacionario
Cuando tenemos un punto estacionario de una función , tenemos diferenciabilidad de en . Si tenemos que la función es de clase en ese punto, entonces tenemos todavía más. La intuición nos dice que probablemente podamos decir mucho mejor cómo se comporta cerca de y con un poco de suerte entender si tiene algún valor extremo o punto silla ahí, y bajo qué circunstancias.
En efecto, podemos enunciar resultados de este estilo. Por la fórmula de Taylor tenemos que
en donde el error se va a cero conforme . Recuerda que aquí es la matriz hessiana de en . Como , se tiene que .
Para un punto estacionario se cumple que , así que de lo anterior tenemos
De manera heurística, dado que , estamos invitados a pensar que el signo de es el mismo que el la expresión . Pero como hemos platicado anteriormente, esto es una forma cuadrática en la variable , y podemos saber si es siempre positiva, siempre negativa o una mezcla de ambas, estudiando a la matriz hessiana .
Esta matriz es simétrica y de entradas reales, así que por el teorema espectral es diagonalizable mediante una matriz ortogonal . Tenemos entonces que es una matriz diagonal . Sabemos también que las entradas de la diagonal de son los eigenvalores de contados con la multiplicidad que aparecen en el polinomio característico.
Teorema. Sea una matriz simétrica en . Consideremos la forma bilineal . Se cumple:
para todo si y sólo si todos los eigenvalores de son positivos.
para todo si y sólo si todos los eigenvalores de son negativos.
Demostración. Veamos la demostración del inciso 1.
Por la discusión anterior, existe una matriz ortogonal tal que es diagonal, con entradas que son los eigenvalores de . Así, en alguna base ortonormal tenemos donde es el vector en la base . Si todos los eigenvalores son positivos, claramente , para todo .
Si para todo podemos elegir como el vector de la base . Para esta elección de tenemos , de modo que para toda , .
El inciso es análogo y deja como tarea moral su demostración.
A las formas cuadráticas que cumplen el primer inciso ya las habíamos llamado positivas definidas. A las que cumplen el segundo inciso las llamaremos negativas definidas.
Combinando las ideas anteriores, podemos formalmente enunciar el teorema que nos habla de cómo son los puntos estacionarios en términos de los eigenvalores de la matriz hessiana.
Teorema. Consideremos un campo escalar de clase en un cierto punto interior . Supongamos que es un punto estacionario.
Si todos los eigenvalores de son positivos, tiene un mínimo relativo en .
Si todos los eigenvalores de son negativos, tiene un máximo relativo en .
Si tiene por lo menos un eigenvalor positivo, y por lo menos un eigenvalor negativo, tiene punto silla en .
Antes de continuar, verifica que los tres puntos anteriores no cubren todos los casos posibles para los eigenvalores. ¿Qué casos nos faltan?
Demostración: Definamos la forma bilineal y usemos el teorema de Taylor para escribir
con
En primer lugar haremos el caso para los eigenvalores positivos. Sean los eigenvalores de . Sea . Si , para cada tenemos . Además, los números son los eigenvalores de la matriz , la cual es simétrica porque lo es. De acuerdo con nuestro teorema anterior la forma cuadrática es definida positiva, y por lo tanto
Esto funciona para todo . Tomando obtenemos para todo . Por el límite de tenemos que existe tal que para . En este caso se cumple
Luego por la ecuación tenemos
Esto muestra que tiene un mínimo relativo en para la vecindad .
Para probar la parte se usa exactamente el mismo proceder sólo que hay que considerar la función , lo cual quedará hacer como tarea moral.
Revisemos pues la parte del punto silla, la parte . Consideremos y dos eigenvalores de tales que y . Pongamos . Notemos que para todo se tiene que y son números de signos opuestos y además eigenvalores de la matriz . Tomando vectores en dirección de los eigenvectores y correspondientes a y notamos que toma valores positivos y negativos en toda vecindad de . Finalmente escojamos de tal manera que cuando . Usando las mismas desigualdades del la parte , vemos que para en la dirección de la diferencia es negativa y para en la dirección de es positiva. Así, tiene un punto silla en .
Hay algunas situaciones en las que el teorema anterior no puede ser usado. Por ejemplo, cuando los eigenvalores de son todos iguales a cero. En dicho caso, el teorema no funciona y no nos dice nada de si tenemos máximo, mínimo o punto silla, y de hecho cualquiera de esas cosas puede pasar.
Ejemplos de análisis de puntos críticos
Ejemplo. Tomemos el campo escalar y veamos cómo identificar y clasificar sus puntos estacionarios. Lo primero por hacer es encontrar el gradiente, que está dado por El gradiente se anula cuando y , lo cual pasa si y sólo si y . Esto dice que sólo hay un punto estacionario. Para determinar su naturaleza, encontraremos la matriz hessiana en este punto, así como los eigenvalores que tiene. La matriz hessiana es
Notemos que la matriz hessiana ya está diagonalizada y es la misma para todo . En particular, en sus valores propios son y , que son positivos. Así, la matriz hessiana es positiva definida y por lo tanto tenemos un mínimo local en el punto . Esto lo confirma visualmente la gráfica de la Figura 2.
Figura 2
Ejemplo. Veamos cómo identificar y clasificar los puntos estacionarios del campo escalar Localicemos primero los puntos estacionarios. Para ello calculemos el gradiente . Esto nos dice que los puntos estacionarios cumplen el sistema de ecuaciones
Puedes verificar que las únicas soluciones están dadas son los puntos y (Sugerencia. Multiplica la segunda ecuación por y suma ambas). La matriz hessiana es la siguiente:
En la matriz hessiana es . Para encontar sus eigenvalores calculamos el polinomio característico
Las raíces del polinomio característico (y por lo tanto los eigenvalores) son y . Ya que tenemos valores propios de signos distintos tenemos un punto silla en .
Para la cuenta correspondiente de polinomio característico es
Tras manipulaciones algebraicas, las raíces son , . Como ambas son positivas, en tenemos un mínimo.
Puedes confirmar visualmente todo lo que encontramos en la gráfica de esta función, la cual está en la Figura 3.
Figura 3
A continuación se muestra otro problema que se puede resolver con lo que hemos platicado. Imaginemos que queremos aproximar a la función mediante una función lineal . ¿Cuál es la mejor forma de elegir para que las funciones queden «cerquita» en el intervalo ? Esa cercanía se puede medir de muchas formas, pero una es pidiendo que una integral se haga chiquita.
Ejemplo. Determinemos qué valores de las constantes minimizan la siguiente integral
Trabajemos sobre la integral.
Es decir, tenemos
Ahora definamos ; basándonos en la forma general de la ecuación cuadrática de dos variables podemos comprobar rápidamente que nos dibuja una elipse en cada una de sus curvas de nivel. Continuando con nuestra misión, tenemos que . Al resolver el sistema
hay una única solución y . Puedes verificar que la matriz hessiana es la siguiente en todo punto.
Para determinar si tenemos un mínimo, calculamos el polinomio característico como sigue
Esta expresión se anula para y . Ambos son números positivos, por lo que en el único punto estacionario de tenemos un mínimo. Así el punto en el cual la integral se minimiza es . Concluimos que la mejor función lineal que aproxima a la función en el intervalo con la distancia inducida por la integral dada es la función .
En la Figura 3 puedes ver un fragmento de la gráfica de la función que nos interesa.
Figura 3. Gráfica de la función .
Mas adelante…
La siguiente será nuestra última entrada del curso y nos permitirá resolver problemas de optimización en los que las variables que nos dan tengan ciertas restricciones. Esto debe recordarnos al teorema de la función implícita. En efecto, para demostrar los resultados de la siguiente entrada se necesitará este importante teorema, así que es recomendable que lo repases y recuerdes cómo se usa.
Tarea moral
Identifica y clasifica los puntos estacionarios de los siguientes campos escalares:
.
Determina si hay constantes tales que el valor de la integral sea mínima para . Esto en cierto sentido nos dice «cuál es la mejor aproximación lineal para ».
Este problema habla de lo que se conoce como el método de los mínimos cuadrados. Consideremos puntos en , todos distintos. En general es imposible hallar una recta que pase por todos y cada uno de estos puntos; es decir, hallar una función tal que para cada . Sin embargo, sí es posible encontrar una función lineal que minimice el error cuadrático total que está dado por Determina los valores de y para que esto ocurra. Sugerencia. Trabaja con el campo escalar recuerda que los puntos son constantes.
Completa la demostración de que si una matriz tiene puros eigenvalores negativos, entonces es negativa definida.
En el teorema de clasificación de puntos estacionarios, muestra que en efecto si la matriz hessiana es negativa definida, entonces el punto estacionario es un punto en donde la función tiene máximo local.