Auto ML
- Machine Learning 모델 학습에서 가장 중요한 것은 올바른 Data의 확보 그리고 Hyperparameter Tunning 일 것이다. Auto-ML은 이 Hyperparameter Tunning을 자동으로 해주는 방법이다.
PyCaret - AutoML 패키지
PyCaret 패키지 설치
classification 함수 import
from pycaret.classification import *
# from pycaret.regression import *
Train Data 세팅
clf = setup(data = train, target = 'target')
모델 학습 및 비교
# sort : metric 기준
# n_select : metric 상위 X개 모델 선택
best_5_model = compare_models(sort = 'AUC', n_select = 5)
모델 앙상블
# estimator_list : compare_models 함수의 return 값
# fold : fold
# method : voting 방법 (soft|hard)
blended = blend_models(estimator_list = best_5_model, fold = 5, method = 'soft')
예측
pred = predict_model(blended)
전체 데이터에 대한 재학습
final_model = finalize_model(blended)
Test Set에 대한 예측
predictions = predict_model(final_model, data = test)