Guia 2

TP3 - iteraciones para el modelo final

TP3 - iteraciones para el modelo final

de GUSELLA AGUSTIN -
Número de respuestas: 1

Buenas, se nos comento de probar con muchas iteraciones al entrenar el modelo con regularización luego de probar que funciona correctamente y gráficar todas las curvas ROC. 

Dado que demora mucho mas tiempo si le doy un numero alto de iteraciones, ¿hay forma de guardar los parametros de entrenamiento de un modelo anterior? asi poder enviarselos en conjunto al resto del notebook para que puedan visualizar las curvas ROC sin tener que correr las dos versiones del modelo de entrenamiento final (uno con pocas iteraciones y otro con muchas).

Ademas de las curvas ROC, se que podria ser interesante analizarlo, pero no hace falta hallar el umbral optimo para decidir donde consigo la mejor relación entre mayor cantidad de "verdaderos-positivos"   y baja de "falsos-positivos" y con eso cambiar el predictor al momento de decidir entre perro y gato para mejorar el accuracy ¿No?

En respuesta a GUSELLA AGUSTIN

Re: TP3 - iteraciones para el modelo final

de VERA MATIAS ALEJANDRO -
Hola Agustín,
Perdón por la tardanza, pero creo que vale la pena contestar el mensaje aún hoy.

Si, claro, podés guardar los parámetros del modelo entrenado (numpy tiene función para guardar en un archivo). Pero si es por nuestra corrección, no te preocupes (la idea es hacer uno o dos intentos regularizando, nada tan terrible).

En lo que decís de la ROC, hay dos tipo de análisis que se pueden hacer.
* Uno es pensar que la ROC está evaluando el aprendizaje del clasificador independientemente del umbral (para comparar clasificadores compararía las curvas visualmente); no me importa un umbral específico, yo quiero hacer un análisis de la performance del aprendizaje efectuado durante el entrenamiento.
* La otra es elegir, efectivamente, un punto de la ROC. El tema de elegir un punto es como comparar verdaderos-positivos con falsos-positivos; esta elección dependerá mucho del contexto donde será utilizado el clasificador. Una elección generalista sería elegir el umbrar para el cuál los dos tipos de errores son iguales (Equal Error Rate). Encontrar este punto es muy sencillo una vez que tenés graficada la ROC.

Éxitos!