기계학습 작업 흐름 (workflow)

 

1. 자료준비

: 수집과 전처리(셔플링, 피쳐스케일링)

 

자료의 종류

훈련자료

검증자료 : 훈련 후 더욱 정밀한 모델을 만들기 위해 사용한다.

평가자료

 

1) 셔플링

자료를 골고루 섞어주는 작업이다.

 

2) 피쳐스케일링

모든 속성들이 동일한 스케일을 갖도록 한다.

정규화와 표준화가 있다.

정규화(min-max scaling)

모든 값들이 0~1사이의 값을 갖도록 조정한다.

 

정규화

자료의 평균값이 0, 표준편차가 1이 되도록 조정한다.

특이점에 대해 영향을 크게 받지 않는 장점이 있다.

 

2. 학습

: 모델 훈련과 완성

기계학습으로 가중치를 계산해 모델을 예측한다.

 

3.검증

: 하이퍼 파라미터 조정

검증 자표를 통해 모델의 다양한 파라미터들을 조정하면서 모델을 완성해 나간다.

 

 

4.평가

: 최종 실전 배치 여부 결정

 

5.실전배치

 

 

 

+ Recent posts