Guia 2

TPS6 - RandomForest

Re: TPS6 - RandomForest

de VERA MATIAS ALEJANDRO -
Número de respuestas: 0
Hola Marco, voy a intentar contestarte (algunas de las preguntas no las termino de entender)

* La duda viene por el lado de las features, en el método esa selección aleatoria se hace en cada nodo -> No sé bien a que te referís, cada nodo usa un solo feature. La idea es que para cada árbol elijas al azar sqrt(d_x) (redondeado) fueatures posibles y selecciones el mejor árbol para ese conjunto de features.

* Estaría bien utilizar tree.DecisionTreeClassifier y configurarla para que esa selección de las features la haga la clase directamente (con max_features = "sqrt") o deberiamos implementarlo nosotros mismos. -> En principio te digo que no, porque al hacer eso te quedarían todos los árboles iguales si no estoy equivocado (habría que ver la implementación). La idea es que vos por tu parte elijas al azar, para cada árbol, las muestras y los features que lo van a entrenar.

* Respecto de la segunda opción, el problema que surge es que podría directamente entrenar el arbol con una menor cantidad de features pero no estaría respetando el método ya que no se estaría haciendo en cada nodo si no solo al principio. -> Claro, la idea es que obligues a los árboles a ser diferentes; si siempre tenés los mismos features posibles, siempre elegiría el mismo árbol. Obviamente está la parte del boostrap (si los datos son distintos los árboles también lo serán), pero la selección de features también tiene que fomentar el armado de diferentes árboles.

Espero que te sean útiles las respuestas. Éxitos!