Guia 3

TP8

Re: TP8

de VERA MATIAS ALEJANDRO -
Número de respuestas: 0
Es un ejercicio que intenta resolver un problema de clasificación supervisada p(y|x) (clasificar instrumentos), modelando la marginal de los datos p(x) a partir de un algoritmo no supervisado. Por clase, entonces, nos referimos al instrumento (serían 5 clases posibles).

La idea es hacer un modelo de mezcla de gaussianas para cada instrumento (5 ems de 6 gaussianas cada uno). Una vez que finalizas el entrenamiento, ya no te importa a que gaussiana pertenece (la mezcla es algo interno del modelo, de afuera no te importa). De esta manera, terminas teniendo 5 algoritmos entrenados (uno para cada instrumento) y 5 conjuntos de testeo. A vos lo que te importa de cada em es la marginal de x (la variable mezcla), lo único que la vamos a llamar p(x|j) para saber a cuál de las 5 nos referimos.

La verosimilitud se define como la densidad de probabilidad evaluada en un dataset. Entonces "evaluar que tan verosimil es que las muestras de la clase i-ésima correspondan al modelo j-esimo", sería calcular

$$\prod_{k=1}^n p(x_k|j)$$

pero con las x1,...,xn correspondiente al dataset i-ésimo. Por ejemplo, que tan verosimil son muestras de la guitarra para el modelo del saxo. Cuidado: score te da "per-sample average log-likelihood", vos querés el logaritmo del producto (pensar como adaptarlo a tus necesidades). Con esto harías el primer bullet.

En el segundo item te dice: vamos a agregarle la parte supervisada (quiero predecir a que instrumento pertenece). Es decir, modelamos p(x|j) con (varios) em, pero ahora vamos a suponer que P(j) (es decir, la probabilidad de que una señal sea del instrumento j-ésimo) es proporcional a la cantidad de muestras que tenía de ese instrumento. En este contexto, la probabilidad a posteriori P(j|D_i) es la probabilidad que las muestras del instrumento i-ésimo sean generadas con el instrumento j-esimo. Por ejemplo, asumiendo conocidas las muestras del saxo, calcular la probabilidad de que vengan de una guitarra.

El tercer item es similar al segundo, pero evaluando para cada frame de ffts (en lugar de todo el dataset junto). Sería hacerlo muestra por muestra.

Si algo no se entiende volvé a preguntar.
Éxitos!