Como salvar un modelo para continuar entrenándolo


#1

Necesitaría saber cómo poder entrenar un modelo, es decir, tengo hoy un set de datos con el cual entreno a mi modelo, por ej basado en regresión lineal o random forest, y luego en algún otro momento, o día, quisiera poder seguir entrenando mi modelo con un set de datos nuevos… cosa de poder actualizar el modelo, y que aprenda de nuevos resultados.

Entonces, como hago por un lado para guardar el modelo y por el otro, como hago para continuar entrenando el mismo modelo?

Tendrás algún código de ejemplo que puedas compartir?


#2

h2o tiene esta funcionalidad, pero solo para algunos algoritmos y con ciertas restricciones.

Aquí puedes encontrar más información al respecto.

http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/checkpoint.html


#3

Me parece que hay un error conceptual, si el modelo pierde performance por cambio en valores de los datos, ejemplo datos que son afectados por inflación, quizás lo que te conviene es escalar los datos:

X′=X−Xmin/Xmax−Xmin

Para evitar con los datos numéricos, para evitar el tener que reentrenar por algo que te afecte de ese tipo.

Si igualmente los datos varían mucho, quizás hay algo que no está pudiendo generalizar bien el modelo.