Archivo de la categoría: Álgebra

Ecuaciones cúbicas (2)

Consideremos una ecuación cúbica reducida

x^3+px+q = 0,

donde p y q son diferentes de cero. En la entrada anterior hemos visto cómo podemos resolverla mediante una serie de cambios de variable y usando números complejos. Vamos a resumir todo ese trabajo en una expresión manejable. Consideramos los valores complejos

\alpha = \sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}},

\beta = \sqrt[3]{-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}

Las soluciones se obtienen entonces mediante x = \alpha+\beta. Veamos una aplicación con el ejemplo de la entrada anterior (donde hemos cambiado la variable y por x para ajustarnos a la terminología empleada ahora):

x^3- \frac{1}{3}x -\frac{25}{27} =0.

Entonces p= -1/3 y q = -25/27, quedando

\alpha = \sqrt[3]{-\frac{-25/27}{2}+\sqrt{\frac{(-25/27)^2}{4}+\frac{(-1/3)^3}{27}}} = \sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}},

\beta = \sqrt[3]{-\frac{-25/27}{2}-\sqrt{\frac{(-25/27)^2}{4}+\frac{(-1/3)^3}{27}}} =\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}}.

Añadiendo las raíces cúbicas de la unidad obtenemos los resultados buscados

x_1 = \sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}},

x_2 =(-\frac{1}{2}+i \frac{\sqrt{3}}{2}) [\sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}}]+(-\frac{1}{2}-i \frac{\sqrt{3}}{2})[\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}}],

x_2 =(-\frac{1}{2}-i \frac{\sqrt{3}}{2}) [\sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}}]+(-\frac{1}{2}+i \frac{\sqrt{3}}{2})[\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}}],

Estos son los valores exactos pero podemos dar valores aproximados sin más que operar y redondear.

Anuncios

Ecuaciones cúbicas (1)

En una entrada anterior del Consultorio Matemático se nos presentaba una ecuación polinómica de tercer grado con coeficientes reales. Ha llegado el momento de explicar el método más usado para su resolución por radicales.
Consideramos ecuaciones de la forma

Ax^3 +Bx^2+Cx+D = 0,

donde A, B, C y D son números reales y A \neq 0. Diremos que la ecuación está normalizada si A=1 y que está en forma reducida si está normalizada y B=0. Esto es, tiene la forma

x^3+cx+d = 0.

Toda ecuación cúbica normalizada puede llevarse a la forma reducida mediante el cambio de variable

x = y-\frac{B}{3}.

Por ejemplo, la ecuación cúbica normalizada x^3-2x^2+x-1=0 se transforma mediante el cambio x = y+\frac{2}{3} en

(y+2/3)^3-2(y+2/3)^2+(y+2/3)-1=0

que desarrollada convenientemente nos lleva a la forma reducida

y^3-\frac{1}{3}y - \frac{25}{27} = 0.

Una vez se halla en forma reducida pasamos a aplicar el cambio y = z-\frac{c}{3z}. En nuestro caso, y = z- \frac{-1/3}{3z} = z+\frac{1}{9z}, quedando

(z+\frac{1}{9z})^3-\frac{1}{3}(z+\frac{1}{9z}) - \frac{25}{27} =0,

que simplificada nos lleva a

z^3+\frac{1}{9^3 z^3}-\frac{25}{27}=0.

Esta ecuación puede hacerse bicuadrada fácilmente al multiplicar ambos miembros por z^3. Es decir,

z^6-\frac{25}{27}z^3+\frac{1}{9^3}=0.

Para resolver la ecuación bicuadrada hacemos z^3 = t y tenemos

t^2-\frac{25}{27} t+\frac{1}{9^3}=0,

cuyas soluciones son
t = \frac{25}{54} +\frac{\sqrt{621}}{54}, t= \frac{25}{54} -\frac{\sqrt{621}}{54}.
Ahora tenemos que “deshacer” los cambios. En primer lugar,

z =\sqrt[3]{t} = \epsilon \sqrt[3]{t},

siendo \epsilon la notación para las tres raíces cúbicas de la unidad en el cuerpo de los complejos. Era inevitable usar números complejos pero he intentado minimizar su “impacto”. Me limitaré a explicar cómo son las tres raíces de la unidad. En primer lugar, escribimos

1 = 1+0i = e^{0i}= 1 ( \cos 0 + i \sin 0).

Sus raíces son

1^{1/3} = \{ 1^{1/3} (\cos \frac{(0+2 k \pi)}{3}+ i \sin \frac{(0+2 k \pi)}{3}), k = 0,1,2 \}.

Es decir,

\epsilon = \{1, -\frac{1}{2}+i \frac{\sqrt{3}}{2}, -\frac{1}{2}-i \frac{\sqrt{3}}{2} \}.

Convenimos en que

\epsilon_1 = 1, \epsilon_2 =-\frac{1}{2}+i \frac{\sqrt{3}}{2}, \epsilon_3 =-\frac{1}{2}-i \frac{\sqrt{3}}{2}.

En consecuencia, tendremos

z =  \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}, z= \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}} .

y = z+\frac{1}{9z} =  \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+ \frac{1}{9 \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}} , y= z+\frac{1}{9z} = \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}} + \frac{1}{9 \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}.

Simplificamos las fracciones multiplicando por sus conjugados. En particular,

\frac{1}{9 \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}} = \frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{9 \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}(\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}})} =\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{ \epsilon} .

Sustituyendo de nuevo vemos que

y = \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{ \epsilon}

y = \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}}{ \epsilon} .

Ahora deberíamos poner los tres valores de \epsilon para obtener seis soluciones. Sin embargo, teniendo en cuenta que \epsilon_2 \epsilon_3 =1 vemos que \epsilon_2 = \frac{1}{\epsilon_3}, de donde

y_1 =  \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}

y_2 =  \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}} .

y_3 = \epsilon_2\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{ \epsilon_3}

y_4 = \epsilon_2 \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}}{ \epsilon_3} .

y_5 = \epsilon_3 \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{\epsilon_2}

y_6 = \epsilon_3 \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}}{ \epsilon_2} .

Se aprecia pues que y_1=y_2, y_3=y_4 e y_5=y_6, quedando tres soluciones. La primera de ellas es la única real y vale

y =\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}.

Las otras dos son complejas y su cálculo es un poco más laborioso. Una vez obtenidas, debemos hacer el cambio final x = y+\frac{2}{3}.
Como el lector puede apreciar, este sistema de obtención de soluciones se presenta largo y complicado. Podemos simplificarlo un poco utilizando una fórmula. Pero esto lo veremos en la próxima entrada.

Formas cuadráticas (4 y final)

Daremos un ejemplo de forma bilineal simétrica:

Consideremos E=\mathbb{R}^{2} y sea la forma bilineal simétrica definida sobre \mathbb{R}^{2} mediante f((x_{1}, x_{2}), (y_{1}, y_{2}))= x_{1} y_{1} + 2 x_{2} y_{2}. Su matriz respecto a la base canónica es

matriz4

Por tanto, la expresión matricial queda

matriz5

La forma cuadrática asociada q es q(x_{1},x_{2})= x_{1}^{2} +2 x_{2}^{2}, que expresada en forma matricial es

matriz6

Como hemos visto en el ejemplo anterior, las formas cuadráticas tienen expresiones analíticas en la base canónica que resultan ser polinomios homogéneos de grado n (en el ejemplo, es de grado 2). El resultado recíproco es también cierto como pasamos a probar.

Teorema 1. Todo polinomio homogéneo de grado 2 en n variables x_{1}, x_{2}, \cdots, x_{n} y coeficientes reales puede considerarse como la expresión analítica de una forma cuadrática definida en el espacio vectorial real \mathbb{R}^{n}.

Demostración. Sea p(x_{1}, x_{2}, \cdots, x_{n}) = \sum_{ij=1, i< j}^{n} \lambda_{ij} x_{i}x_{j} un polinomio homogéneo de grado 2 con coeficientes \lambda_{ij} reales. Definimos la matriz cuadrada A=(a_{ij}) de orden n mediante

matriz7

Esta matriz es simétrica (por su misma construcción) y la aplicación q: \mathbb{R}^{n} \rightarrow \mathbb{R}, definida por

matriz8

es una forma cuadrática expresada en forma matricial respecto de la base canónica. Esto termina nuestra demostración.

Las formas cuadráticas ofrecen resultados numéricos, por ello es interesante hallar el signo de tales resultados.

Definición 1. Una forma cuadrática q: E \rightarrow K se dice definida positiva si q(u) \geq 0 para todo u \in E y $q(u)=0$ si y sólo si u=0.
Definición 2. Una forma cuadrática q: E \rightarrow K se dice definida negativa si q(u) \leq 0 para todo u \in E y q(u)=0 si y sólo si u=0.
Definición 3. Una forma cuadrática q: E \rightarrow K se dice semidefinida positiva si q(u) \geq 0 para todo u \in E y existe al menos un u \neq 0 tal que q(u)=0.

Formas cuadráticas (3)

Seguimos con algunos resultados más.

Teorema 1. Sea E un espacio vectorial de dimensión finita, n, sobre un cuerpo K y sea B=(u_{1}, u_{2}, \cdots, u_{n}) una base de E. Toda forma bilineal f: E \times E \rightarrow K es simétrica si y sólo si, su matriz A respecto a la base B es simétrica.

Demostración. Supongamos que f: E \times E \rightarrow K es simétrica. En tal caso la matriz A= (f(u_{j}, u_{i})) verifica A^{T} = (f(u_{j}, u_{i}))^{T} = (f(u_{i}, u_{j}) )= (f(u_{j},u_{i}))= A y resulta una matriz simétrica. Análogamente, si la matriz A= (f(u_{j}, u_{i})) es simétrica, entonces

f(u,v) = u_{B} A (v_{B})^{T} = (u_{B} A (v_{B})^{T})^{T} = v_{B} A^{T} (u_{B})^{T} = v_{B} A (u_{B})^{T} = f(v,u)

lo que prueba que la forma bilineal es simétrica. Aquí termina nuestra demostración.

A continuación vamos a determinar cómo afecta el cambio de base a la expresión matricial de una forma bilineal.

Teorema 2. Sea E un espacio vectorial de dimensión finita, n, sobre un cuerpo K y sean B=(u_{1}, u_{2}, \cdots, u_{n}) y B'=(v_{1}, v_{2}, \cdots, v_{n}) bases de E. Sea también una forma bilineal f: E \times E \rightarrow K con matriz A respecto a la base B. Si P es la matriz de paso de B a B', entonces la matriz de f respecto a la base B' es P A P^{T}

Demostración. Como P es la matriz de paso de latex $B$ a B' tenemos que u_{B'}P = u_{B}, para todo u \in E, por lo que podemos escribir

f(u,v)=  u_{B} A (v_{B})^{T} =  u_{B'} P  A (v_{B'}P )^{T} = u_{B'} P  A  P^{T} (v_{B'} )^{T}

Esto significa que la matriz P  A  P^{T} es la correspondiente a la forma bilineal en la base B'. Esto termina nuestra demostración.

Recordemos que dos matrices cuadradas de la misma dimensión A y B se dicen congruentes si existe una matriz P, tal que B = P A P^{T}. Así pues, todas las matrices correspondientes a una misma forma bilineal en distintas bases son congruentes entre sí.

Vamos a definir ya lo que entendemos por forma cuadrática.

Definición 1. Sea f: E \times E \rightarrow K una forma bilineal simétrica. La aplicación q: E \rightarrow K, dada por q(u)=f(u,u) se denomina forma cuadrática asociada a f.

En el caso de trabajar en espacios vectoriales de dimensión finita, resulta sencillo obtener la expresión matricial de una forma cuadrática a partir de la expresión matricial de la forma bilineal a la que está asociada. Así si f(u,v) = u_{B} A (v_{B})^{T}, tenemos que q(u) = u_{B} A (u_{B})^{T}, siendo A una matriz simétrica.

Formas cuadráticas (2)

Vamos a ver ahora la expresión de una forma bilineal definida sobre espacios vectoriales de dimensiones finitas.

Teorema 1. Sean E y F dos K-espacios vectoriales de dimensiones m y n, respectivamente, y sean B=(u_{1}, u_{2}, \cdots, u_{m}) una base de E y B'= (v_{1}, v_{2}, \cdots, v_{n}) una base de F. Entonces, dada una forma bilineal f: E \times F \rightarrow K existe una y sólo una matriz A=(a_{ji}) de dimensiones mn tal que
matriz1

Demostración. Expresando los vectores x \in E e y \in F mediante las bases respectivas B y B' y aplicando la condición de bilinealidad, tenemos

matriz2

Llamando f(u_{j}, v_{i} ) = a_{ji}, para (j,i) \in \{1, 2, \cdots, m \} \times \{1,2, \cdots, n \} tenemos

matriz3

Si A=(a_{ji}) es la matriz mn formada por los valores a_{ji} =f(u_{j},v_{i}), se tiene que por construcción es única y cumple las condiciones del teorema. Esto termina nuestra demostración.

Utilizando los resultados del teorema anterior, podemos expresar matricialmente las formas bilineales sobre espacios vectoriales de dimensiones finitas. En efecto, si E y F son espacios vectoriales de dimensiones m y n, respectivamente, sobre un mismo cuerpo K y B=(u_{1}, \cdots u_{m}) es una base de E y B'=(v_{1}, \cdots, v_{n}) una base de F, toda forma bilineal f: E \times F \rightarrow K se puede expresar mediante

f(u,v) = u_{B} A (v_{B'})^{T}.

donde u_{B} es el vector fila formado por las coordenadas de u en la base B, v_{B'}, el vector fila formado por las coordenadas de v en la base B' y A es la matriz de f en las bases B y B', de dimensiones mn y componentes f(u_{j},v_{i}). En el caso de que E=F y \dim(E)=n, es usual escoger una misma base B y, entonces la matriz A = (f(u_{j},u_{i})) es cuadrada de orden n.

Formas cuadráticas (1)

Consideremos tres espacios vectoriales E, F y G, todos sobre el mismo cuerpo conmutativo K. Una aplicación

f: E \times F \rightarrow G

se dice que es bilineal si para cada x \in E y cada y \in F, las restricciones

f_{x} : F \rightarrow G ,\quad f_{x}(y) =f(x,y),

f_{y} : E \rightarrow G,\quad f_{y}(x) =f(x,y),

son aplicaciones lineales. Esto es equivalente a afirmar que para cada \alpha, \beta pertenecientes al cuerpo K y para cada x, x' \in E y cada y, y' \in F, se tiene que

f(\alpha x + \beta x', y ) = \alpha f(x,y)+ \beta f(x',y),

f(x,\alpha y+ \beta y') = \alpha f(x,y)+ \beta f(x,y').

Consideremos los espacios vectoriales E=F=\mathbb{R}^{2} y G=\mathbb{R}^{3}, todos sobre el cuerpo de los números reales. La aplicación f:\mathbb{R}^{2} \times \mathbb{R}^{2} \rightarrow \mathbb{R}^{3}, definida por

f((x,y), (u,v)) = (0, 0, 0)

es bilineal. En efecto, si restringimos f a un valor (x_{0},y_{0}) fijo, la aplicación resultante f(u,v) = (0, 0, 0) es lineal y lo mismo ocurre si restringimos f a un valor (u_{0}, v_{0}) fijo. Esta aplicación bilineal se llamará degenerada o trivial.

Definición 1. Sean E y F dos espacios vectoriales sobre un mismo cuerpo K y consideremos el espacio vectorial usual formado por el cuerpo K sobre sí mismo. Toda aplicación bilineal f: E \times F \rightarrow K se llamará forma bilineal.

Observemos que en las formas bilineales las imágenes son siempre valores del cuerpo K.
La aplicación

f:\mathbb{R}^{2} \times \mathbb{R}^{2} \rightarrow \mathbb{R}

dada por

f((x,y),(u,v)) = xu+yv

es una forma bilineal. En efecto, sea (x_{0}, y_{0}) fijo, la restricción a dicho valor resulta la aplicación

f_{(x_{0},y_{0})}(u,v) = x_{0}u+y_{0}v

la cual es lineal y el lector puede comprobar que también lo es la restricción a cualquier (u_{0}, v_{0}). Obsérvese que esta forma bilineal no es más que el producto escalar.

Definición 2. Una forma bilineal f: E \times E \rightarrow K se dice simétrica si f(x,y)=f(y,x) para todos (x,y) \in E \times E.
Definición 3. Una forma bilineal f: E \times E \rightarrow K se dice antisimétrica o alternada si f(x,x)=0 para todos x \in E.

Obsérvese que en la definición de formas simétricas y antisimétricas hemos considerado sólo formas bilineales donde los espacios vectoriales que forman el dominio son el mismo. El siguiente resultado nos proporciona una condición equivalente para el carácter alterno de una forma bilineal.

Teorema 1. Una forma bilineal f: E \times E \rightarrow K es alternada si y sólo si f(x,y) = -f(y,x)

Demostración. Supongamos que f es alternada, entonces tomando x,y \in E, tenemos que f(x+y, x+y) = 0, de donde

0=f(x+y,x+y) = f(x,x+y)+f(y,x+y) =

f(x,x)+f(x,y)+f(y,x)+f(y,y) =

0+f(x,y)+f(y,x)+0 = f(x,y)+f(y,x).

Lo que nos lleva a concluir que f(x,y) = -f(y,x). Recíprocamente, si f(x,y) = -f(y,x) para todo x,y \in E, entonces haciendo x=y, sería f(x,x) = -f(x,x), de donde f(x,x)=0. Esto termina nuestra demostración.

Curso EVT. Lectura 28. Topología (3)

Consideremos dos espacios topológicos (E,T) y (F,S). Vamos a definir una topología sobre el conjunto producto E \times F utilizando como base la colección \mathcal{G} de los conjuntos U \times V, donde U es un abierto de E y V es un abierto de F. En efecto, recordemos que las condiciones para que una colección de subconjuntos de un conjunto dado sea una base de una topología son: (1) Para cada elemento del conjunto existe un elemento de la base que lo contiene. (2) Para cada elemento de la intersección de dos conjuntos de la colección existe un tercer elemento de la misma colección que lo contiene y está contenido en dicha intersección. La primera condición es inmediata pues el conjunto E \times F es un elemento de \mathcal{G} y (x,y) \in E \times F. Para la condición (2) recordamos que

(A \times B) \cap (C \times D) = (A \times C) \cap (B \times D).

De esta manera, si U_1 \times V_1 y U_2 \times V_2 son elementos de \mathcal{G}, entonces (U_1 \times V_1) \times (U_2 \times V_2) = (U_1 \cap U_2) \times (V_1 \cap V_2) es también un elemento de \mathcal{G} pues la intersección finita de abiertos es un abierto.

Podemos aprovechar las bases existentes de una topología en cada conjunto para definir de una manera equivalente la topología producto. De esta manera, si \mathcal{B} es una base de la topología de E y \mathcal{B}' es una base de la topología de F, la clase \mathcal{B} \times \mathcal{B}' es una base para la topología producto. La demostración es sencilla pues si (x,y) es un elemento de un abierto A de la topología producto, hallaremos U, abierto de E y V, abierto de F, tales que (x,y) \in U \times V \subset A y para dichos U,V existen B \in \mathcal{B} y B' \in \mathcal{B}', de forma que (x,y) \in B \times B' \subset U \times V \subset A. Esto prueba que todo abierto de la topología producto es unión de conjuntos de la forma B \times B'.

Una definición importante es la de conjunto cerrado. Un subconjunto C de un espacio topológico (X, \mathcal{T}) es cerrado si su complementario X-C es un abierto de \mathcal{T}.

Utilizando las propiedades ya dadas para los conjuntos abiertos podemos demostrar el siguiente teorema.

Teorema 1. Sea (X, \mathcal{T}) un espacio topológico y sea \mathcal{C} la colección de todos los cerrados definidos por la topología \mathcal{T}. Entonces, se tiene que
(a) El vacío y el propio X pertenecen a \mathcal{C}.
(b).La intersección arbitraria de elementos de \mathcal{C} pertenece a \mathcal{C}.
(c). Si C y C' son cerrados, entonces C \cup C' es cerrado.

Prueba. Como \emptyset es abierto, tenemos que X- \emptyset = X es cerrado. Análogamente, X es abierto, por lo que X-X = \emptyset es cerrado. Esto prueba (a). Sea (C_{i})_{i \in I} una familia arbitraria de cerrados. La familia (X-C_{i})_{i \in I} está formada por abiertos y, en consecuencia, de la igualdad

X -\cap_{i \in I} C_{i} = \cup_{i \in I} (X-C_{i})

se sigue que \cap_{i \in I} C_{i} es cerrado. Esto prueba (b). Finalmente, sean C y C' dos cerrados. Entonces X-C y X-C' son abiertos, por lo que (X-C) \cup (X-C') = X- (C \cap C') es un abierto. Esto significa que C \cap C' es cerrado.