Buenas noches, quería consultar algunas dudas que me surgieron haciendo el tp2.
- De la parte de preprocesamiento, no me queda claro porque no utilizamos las features categóricas (ya en formato one hot encoding) a la hora de armar el mapa polinómico. No estaríamos dejando afuera a los productos cruzados con las features numéricas?
- Respecto de la columna de unos. En mi caso, al generar el mapa polinómico, no la agregue para poder hacer la normalización sin tener el problema de varianza nula. La consulta es si debo agregarla al mapa antes de llamar al método de regresión lineal de sklearn o si se agrega solo. Leyendo la documentación de LinearRegression() vi un parámetro de configuración que se llama "fit_intercept" que por default esta en True y creo que tiene que ver con el termino independiente pero quiero estar seguro que sea así.
- Por ultimo, en la etapa de validación, entiendo que la normalización hay que hacerla con los parámetros de media y varianza de las muestras de entrenamiento, pero el onehotencoding y el mapa polinómico debería volver a "fitearlos" y transformarlos con los datos de validación no?
Desde ya muchas gracias
Buen fin de semana