less than 1 minute read

Auto ML

- Machine Learning 모델 학습에서 가장 중요한 것은 올바른 Data의 확보 그리고 Hyperparameter Tunning 일 것이다. Auto-ML은 이 Hyperparameter Tunning을 자동으로 해주는 방법이다.

PyCaret - AutoML 패키지

PyCaret 패키지 설치

!pip install pycaret

classification 함수 import

from pycaret.classification import *
# from pycaret.regression import * 

Train Data 세팅

clf = setup(data = train, target = 'target')

모델 학습 및 비교

# sort : metric 기준
# n_select : metric 상위 X개 모델 선택
best_5_model = compare_models(sort = 'AUC', n_select = 5)

모델 앙상블

# estimator_list : compare_models 함수의 return 값
# fold : fold
# method : voting 방법 (soft|hard)
blended = blend_models(estimator_list = best_5_model, fold = 5, method = 'soft')

예측

pred = predict_model(blended)

전체 데이터에 대한 재학습

final_model = finalize_model(blended)

Test Set에 대한 예측

predictions = predict_model(final_model, data = test)