Hola Facundo,
Vos tenés varias grabaciones de cada instrumento. A cada una de ellas le puedo calcular la fft ventaneada. El proceso de ventaneo consiste en agarrar un pedacito de señal, calcularle el espectro, agarrar otro pedacito (típicamente con solapamiento) calcularle el espectro, etc. Es decir que por cada señal tengo muchos "frames" de fft. ¿Qué es una muestra en este contexto? Bueno, para la parte de learning vamos a considerar cada frame como muestra. Es decir, que puedo juntar todos los frames de "clarinete" (de train) y juntarlos (ya deja de ser importante cuáles eran de la señal 0, cuales de la señal 1, etc, sino que ahora cada frame es una muestra). Y como todos los frames tienen la misma dimensión, no es necesario hacer ningún tipo de padding.
Éxitos!
Vos tenés varias grabaciones de cada instrumento. A cada una de ellas le puedo calcular la fft ventaneada. El proceso de ventaneo consiste en agarrar un pedacito de señal, calcularle el espectro, agarrar otro pedacito (típicamente con solapamiento) calcularle el espectro, etc. Es decir que por cada señal tengo muchos "frames" de fft. ¿Qué es una muestra en este contexto? Bueno, para la parte de learning vamos a considerar cada frame como muestra. Es decir, que puedo juntar todos los frames de "clarinete" (de train) y juntarlos (ya deja de ser importante cuáles eran de la señal 0, cuales de la señal 1, etc, sino que ahora cada frame es una muestra). Y como todos los frames tienen la misma dimensión, no es necesario hacer ningún tipo de padding.
Éxitos!