domingo, 21 de septiembre de 2008

Estoy trabajando en el desarrollo de CP para la investigación de la litología. Como naturalmente la litología es un tema que no manejo, estoy buscando información para hacerlo más comprensible.
Esperad!

D.

sábado, 20 de septiembre de 2008

Sobre Análisis Multivariante

Palabras clave:
Reducción, estructura de varianza-covarianza, Componentes Principales (CP), interpretación algebraica, interpretación geométrica,
variabilidad máxima, Álgebra Lineal, interpretación de CP.

Para introducirlos en el tema, el análisis multivariado tiene por objetivo entregar herramientas para realizar un análisis simultáneo de un conjunto de variables. La idea es simplificar el manejo de "grandes" bases de datos, esto quiere decir por ejemplo, matrices de n x p donde se reflejan p características (variables) tomadas a n induviduos.
Una de las técnicas básica para resolver el problema del manejo de variables es Componentes Principales (CP). La idea es la siguiente:

Consideremos la matriz de n x p descrita anteriormente y supongamos que "se nos complica la vida" trabajar con p variables (p es muy grande). Nos gustaría entonces poder reducir la cantidad de variables sin perder información sobre la variabilidad de los datos. Un análisis de CP trata de explicar la estructura de varianza-covarianza a través de combinaciones lineales de las variables originales. Sus objetivos generales son
  1. Reducción de datos
  2. Interpretación
Aunque son necesarias p componentes para reproducir la variabilidad total, a menudo mucha de esta variabilidad puede ser captada por un número k (k<p) de componentes principales. La idea es que las k componentes principales reemplacen a las p variables iniciales (así se reduce el conjunto de datos).
Algebraicamente, las CP son combinaciones lineales de las p variables aleatorias X1,...Xp . Geométricamente, estas combinaciones lineales representan la elección de un nuevo sistema de coordenadas obtenido rotando el sistema original con X1,...Xp como los ejes coordenados. Los nuevos ejes representan las direcciones con variabilidad máxima y proporcionan una descripción más simple y parsimoniosa de la estructura de covarianza.
Como veremos más adelante, las CP dependen solamente de la matriz de covarianza (o correlaciones) de
X1,...Xp y su desarrollo no requiere supuestos de normalidad. Aunque por otra parte, CP derivadas de poblaciones normales (multivariadas) tienen interpretaciones muy útiles en términos de elipsoides de densidad contante. Pero no nos desviemos de nuestro camino.

Construcción de CP

(1)Sea X'=[X1,X2,...Xp] vector aleatorio con matriz de covarianza S que a su vez tiene valores propios a1>=a2>=...>=ap>=0 (i.e. matriz S es semidefinida positiva). Considere las combinaciones lineales:

Y1 = l1'X = l11X1+l21X2+...+lp1Xp
Y2 = l1'X = l12X1+l22X2+...+lp2Xp
. .
. .
. .
Yp = l1'X = l1pX1+l2pX2+...+lppXp

Con ayuda del álgebra lineal tenemos que

Var(Yi)=li'Sli i=1,2,...,p
Cov(Yi,Yk)=li'Slk i,k=1,2,...,p

Las componentes principales son aquellas combinaciones lineales incorrelacionadas Y1,...,Yp cuya varianza es máxima. Pero existen muchos li's tales que li'Sli es máxima (basta multiplicar por una constante). Para eliminar esa indeterminación, es conveniente restringir los coeficientes li a aquellos de largo unitario. Así, la obtención de la primera CP se reduce a

maximizar
l1'Sl1 =Var(Y1) sujeto a (s.a.) l1'l1=1.

Como tenemos un problema de optimización con restricciones, recurrimos al lagrangiano. Haciendo el cáculo pertinente llegamos a la siguiente ecuación:
(S-bI)l1=0
que por teorema de Roché sabemos que tiene solución ssi det(S-bI)=0. (notar que I es la matriz identidad y b el multiplicador de Lagrange). Lo anterior no es más que el método de determinación de valores y vectores propios. Por tanto, existen valores a1>=a2>=...>=ap>=0 denominados valores característicos (propios) que tienen vectores e1,e2,...,ep asociados, denominados vectores característicos (propios) que satisfacen la condición ei'ei=1, ei'ej=0.
Es inmediato que la segunda CP se obtiene de maximizar
l2'Sl2 s.a. l1'l1=1 y l1'l2=0 (esta última condición es para que las componentes sean incorrelacionadas).
Así la i-ésima CP viene dada por

Yi = ei'X = e1iX1+e2iX2+...+epiXp

A partir de esto se obtienen diferentes relaciones entre medidas de variabilidad y valores característicos de la matriz S, las que no abordaremos. (Para más información consultar "Applied Multivariate Statistical Analysis" de Richard Johnson & Dean Wichern).

Nos hemos familiarizado entonces con la construcción de las CP y la idea de reducir datos. Veamos ahora el problema de la interpretación de CP. Recurriremos a un ejemplo simple calculado mediante el programa
R.
Ejecutando la siguiente secuencia:

S=matrix(c(1,-2,0,-2,5,0,0,0,2),ncol=3,nrow=3,byrow=T)
eigen(S)
Obtenemos los valores y vectores propios para las variables aleatorias X1,X2,X3 cuya matriz de covarianzas es S definida como

1 -2 0
-2 5 0
0 0 2
Por tanto, las componentes principales son

Y1=0.383X1-0.924X2
Y2=X3
Y3=0.924X1+0.383X2

La primera componente se puede interpretar como un contraste entre las variables X1 y X2. Intenta capturar las diferencias entre ellas.
Era esperable que la segunda componente fuese X3, pues si nos fijamos en la matriz S, X3 tiene correlación nula con X1 y X2, luego cumple con la noción de componente principal.
La tercera componente le entrega más "peso" a la primera variable. Naturalmente, la idea es quedarse con a lo más las dos primeras componente principales, de lo contrario, tendríamos 3 componentes, igual al número de variables que queríamos reducir.

Finalizando, me permito comentar que la idea de este post no es aburrirlos con procedimientos técnicos. Todo tiene un fin friamente calculado mis estimados lectores. Atentos a lo que viene.

(1): el apóstrofe se refiere al vector traspuesto


D.

miércoles, 22 de agosto de 2007

¿Quién robó los pasteles? (3)

Tercer Cuento.

-Bueno, aquí tienes la harina- dijo el Rey alegremente-, ya puedes hacer los pasteles.
-¿hacer los pasteles sin pimienta?- preguntó la Reina.
-¿Pimienta?- dijo el rey con incredulidad- ¿Quieres decir que pones pimienta en los pasteles?
-No mucha- respondió la Reina.
- Y supongo que la han robado- dijo el Rey.
-¡Pues claro!- dijo la Reina- busca la pimienta, y cuando hayas descubierto quien la robó, déjale sin…
-Vamos, vamos- dijo el Rey.
Desde luego la pimienta debía buscarse. Pero, como todos sabéis, las personas que roban la pimienta nunca dicen la verdad.
El principal sospechoso era la cocinera de la duquesa. En el juicio sólo hizo una declaración: “¡Yo sé quien se robó la pimienta!”.
Dando por sentado que las personas que roban la pimienta siempre mienten, ¿Es la cocinera culpable o inocente?

D.

viernes, 17 de agosto de 2007

¿Quién robó los pasteles? (2)

Segundo Cuento

-Ahora que ya hemos recuperado la mermelada-dijo el Rey- ya puedes hacer los pasteles.
-¿Cómo voy a hacer los pasteles sin harina?-preguntó la Reina.
-¿Quieres decir que nos han robado la harina?-gritó el Rey.
-¡Si!-dijo la Reina. ¡Coge al bellaco y déjale sin cabeza!
-Bueno, bueno-dijo el Rey-no nos precipitemos.
-Pero la harina había de ser buscada. Naturalmente la encontraron en casa de la Liebre de Marzo, el Sombrerero Loco y el Lirón, y por consiguiente fueron de inmediato detenidos y juzgados.
En el juicio la Liebre de Marzo declaró que la había robado el Sombrerero. El Sombrerero y el Lirón también declararon, pero por alguna razón sus declaraciones no fueron recogidas y no puedo decir cuáles fueron. Pero, como al fin salió a la luz, sólo uno de los tres había robado la harina, y fue el único que dijo la verdad.
¿Quién robó la harina?

D.

lunes, 13 de agosto de 2007

¿Quién robó los pasteles? (1)

A continuación una serie de tres cuentos que podrían considerarse una introducción al mundo de la lógica matemática. De hecho así me los presentó a mí una persona muy interesante.

Primer Cuento.

-¿Por qué no me haces unos pastelitos?-preguntó el Rey de corazones a la Reina de corazones un fresco día de verano.
-¿Qué sentido tiene hacer pasteles sin mermelada?-dijo la Reina furiosa-¡La mermelada es lo mejor!
-Pues pon mermelada-dijo el Rey.
-¡No puedo!-gritó la Reina - ¡Me la han robado!
-¡Pero bueno!-dijo el Rey-¡Esto es bastante grave! ¿Quién la ha robado?
-¿Cómo quieres que sepa quién la ha robado? Si lo supiera la habría recuperado hace mucho, ¡y con ella la cabeza del sinvergüenza!
El Rey hizo que sus soldados emprendieran la búsqueda de la mermelada desaparecida, y fue encontrada en la casa de la Liebre de Marzo, el Sombrerero Loco y el Lirón. Los tres fueron inmediatamente detenidos y juzgados.
-¡Vamos a ver!-exclamó el Rey en el juicio-¡Quiero llegar al fondo de todo esto! ¡No me gusta que la gente entre en mi cocina y me robe la mermelada!
-¿Por qué no?- Preguntó uno de los conejillos de Indias.
-¡Suprimid a ese conejillo!- gritó la Reina. El conejillo de Indias fue suprimido al instante. (Los que han leído Alicia en el País de las Maravillas recordarán el significado de la palabra suprimir: los oficiales de la corte meten al conejillo en una bolsa de lona, la cierran y se sientan encima).
-Y ahora-dijo el Rey cuando se hubo pasado la conmoción ante la supresión del conejillo de Indias- ¡Quiero llegar al fondo de todo esto!
-Eso ya lo habéis dicho- apuntó un segundo conejillo de Indias. (Este segundo conejillo fu igualmente suprimido al instante).
--¿Por casualidad robaste tú la mermelada?-preguntó el Rey a la Liebre de Marzo.
-¡Yo no robé la mermelada!- declaró la Liebre de Marzo. (En ese momento todos los conejillos de Indias que quedaban la aclamaron, siendo suprimidos de inmediato).
-¿Y tú?-rugió el Rey al Sombrerero, que temblaba como una hoja-¿Por casualidad eres tú el culpable? El sombrerero fue incapaz de articular una sola palabra; sólo respiraba entrecortadamente y daba sorbitos al té.
-Si no tiene nada que decir, eso demuestra su culpabilidad-dijo la Reina- ¡Así que a dejarle sin cabeza inmediatamente!
-¡no, no!-suplicó el Sombrerero-¡Uno de nosotros la robó, pero no fui yo!
-¡Tomad nota de eso!-dijo el Rey al jurado-¡Esta prueba puede resultar de suma importancia!
-Y ¿Qué pasa contigo?-prosiguió el Rey con el Lirón- ¿Qué tienes que decir tú a todo esto? ¿Han dicho la Liebre de Marzo y el sombrerero la verdad?
-Al menos uno sí- replicó el Lirón, quien se quedó dormido para el resto del juicio.
Como reveló la subsiguiente investigación, la Liebre de Marzo y el Lirón no decían ambos la verdad.
¿Quién robó la mermelada?

D.

Fingers and Holes in a Shaken Cornstarch Solution

http://www.youtube.com/watch?v=t5hcTnntkVM&mode=related&search=

Este video es un dato de mi novio.
Mecánica de fluidos me ha dejado pasmada...

D.

sábado, 11 de agosto de 2007

Russsell

Creo necesario (pero no suficiente =p) empezar con Russell. Conocida como la paradoja del barbero, representa el problema de la existencia...desde cualquier punto de vista, algo no tan sencillo.
Consideremos el conjunto R definido por la propiedad "un objeto pertenece al conjunto R si y solo si no pertenece a si mismo". En simbolos R={x: x no pertenece a x}
La pregunta entonces es ¿pertenece R a R? .

Si la respuesta es afirmativa, entonces R verica la propiedad que define a R, o sea, R no pertenece a R. Si la respuesta es negativa, entonces, por definición, R pertenece a R. En cualquier caso obtenemos la contradicción:

R pertenece a R si y solo si R no pertenece a R
(Este es el problema de creer que dada una propiedad, existe el conjunto de los objetos que cumplen tal propiedad).

Contextualicemos la idea de Russell en la siguiente situación (Paradoja del barbero)

En una barbería hay un cartel que dice lo siguiente:
"Yo afeito a quienes no se afeitan a sí mismos, y solamente a éstos".

La pregunta es: ¿quién afeita al barbero?
Si el barbero se afeita él mismo, entonces forma parte de las personas que se afeitan a sí mismas, por lo que no podría afeitarse a sí mismo.
Si no se afeita a sí mismo, entonces formaría parte de las personas que no se afeitan a sí mismas, por lo que debería afeitarse él mismo.
Como se ve, el barbero no puede cumplir con lo que puso en el cartel.


Fuentes:
Teoria axiomatica de conjuntos, R. Lewin.

Dato anecdotico:
Russell era un terrible seductor.
Se cuenta que en una oportunidad fue invitado a quedarse en la casa de un amigo y al segundo día de su estadía ya estaba tratando de seducir a la hija de su anfitrión quien tenía 15 años.