TA136: TP8

Buenas tardes,

resolviendo el tp me surgieron un par de dudas respecto de la parte de testeo

En el primer punto tengo dudas de a que se refiere con clase y modelo, y quería saber si el planteo que hice es correcto. El planteo es:

Clasificar (6 clases) cada una de las muestras de testeo de cada instrumento con su respectivo GaussianMixture (es decir, guitar_test con gm_guitar, clarinet_test con gm_clarinet, etc)
Una vez clasificadas, junte las muestras de los distintos instrumentos por clase (Me quedaron 6 conjuntos, cada uno con las muestras de los instrumentos correspondientes a la clase k)
Una vez todas separadas por clase, les calcule la log-verosimilitud a cada uno en cada una de las GuassianMixture con el método score

Respecto del segundo, me genera dudas el "j" porque en teoría tenemos 5 algoritmos (uno para cada instrumento) pero cada algoritmo define 6 gaussianas p(x|j) (6 clases). Por otro lado, para calcular las P(j), estaría bien hacer la clasificación como hice en el planteo anterior, es decir, cada instrumento con su respectivo GM y luego calcular las proporciones?

Espero haber sido claro con las consultas. Desde ya Muchas Gracias

Saludos

Marco

Re: TP8

de VERA MATIAS ALEJANDRO - martes, 20 de mayo de 2025, 15:32

Es un ejercicio que intenta resolver un problema de clasificación supervisada p(y|x) (clasificar instrumentos), modelando la marginal de los datos p(x) a partir de un algoritmo no supervisado. Por clase, entonces, nos referimos al instrumento (serían 5 clases posibles).

La idea es hacer un modelo de mezcla de gaussianas para cada instrumento (5 ems de 6 gaussianas cada uno). Una vez que finalizas el entrenamiento, ya no te importa a que gaussiana pertenece (la mezcla es algo interno del modelo, de afuera no te importa). De esta manera, terminas teniendo 5 algoritmos entrenados (uno para cada instrumento) y 5 conjuntos de testeo. A vos lo que te importa de cada em es la marginal de x (la variable mezcla), lo único que la vamos a llamar p(x|j) para saber a cuál de las 5 nos referimos.

La verosimilitud se define como la densidad de probabilidad evaluada en un dataset. Entonces "evaluar que tan verosimil es que las muestras de la clase i-ésima correspondan al modelo j-esimo", sería calcular

$$\prod_{k=1}^n p(x_k|j)$$

pero con las x1,...,xn correspondiente al dataset i-ésimo. Por ejemplo, que tan verosimil son muestras de la guitarra para el modelo del saxo. Cuidado: score te da "per-sample average log-likelihood", vos querés el logaritmo del producto (pensar como adaptarlo a tus necesidades). Con esto harías el primer bullet.

En el segundo item te dice: vamos a agregarle la parte supervisada (quiero predecir a que instrumento pertenece). Es decir, modelamos p(x|j) con (varios) em, pero ahora vamos a suponer que P(j) (es decir, la probabilidad de que una señal sea del instrumento j-ésimo) es proporcional a la cantidad de muestras que tenía de ese instrumento. En este contexto, la probabilidad a posteriori P(j|D_i) es la probabilidad que las muestras del instrumento i-ésimo sean generadas con el instrumento j-esimo. Por ejemplo, asumiendo conocidas las muestras del saxo, calcular la probabilidad de que vengan de una guitarra.

El tercer item es similar al segundo, pero evaluando para cada frame de ffts (en lugar de todo el dataset junto). Sería hacerlo muestra por muestra.

Si algo no se entiende volvé a preguntar.
Éxitos!

TA136 - Taller de Procesamiento de Señales

Guia 3

TP8

TP8

Re: TP8