앙상블모델 2

Gradient Boosting Regressor

앙상블(ensemble) 여러 머신러닝 모델을 연결하여 더 강력한 모델을 만드는 기법 분류와 회귀 문제의 다양한 데이터셋에서 효과적인 앙상블 모델 예시 랜덤 포레스트(random forest) 그래디언트 부스팅(gradient boosting) 부스팅(Boosting) Boosting은 약한 학습기(Weak Learner)를 여러 개 결합하여 강한 학습기(Strong Learner)를 만드는 방법이다. 약한 학습기란, 예측 성능이 랜덤 추측 수준이거나 그 이하인 모델을 말하며, 결정 트리가 대표적인 예이다. 그래디언트 부스팅(Gradient Boosting) 고객의 구매 이력 데이터를 통하여 다음 구매를 예측한다고 가정해보자. 이를 예측하기 위해 어떤 방법을 사용할 수 있을까? 그래디언트 부스팅은 Boo..

머신러닝이 뭐여 8탄 (feat. 의사결정나무, 앙상블, 랜덤포레스트)

Intro 의사결정나무 의사결정나무의 개념 지니계수 의사결정나무의 실습 앙상블과 랜덤포레스트 앙상블 모델 랜덤포레스트 랜덤포레스트 실습 의사결정나무 의사결정나무의 개념 의사결정나무(DecisionTree)는 지도학습의 일종으로 데이터에 있는 패턴을 찾아내고 조건을 통해 데이터를 분할하며 예측하는 모델 조건을 통해 데이터를 분리하여 데이터를 나눌 수 있는 기준이 확립되면 새로운 데이터가 들어왔을 때도 조건을 활용해 데이터를 예측할 수 ▶ PetalWidth가 0.8보다 작거나 같지 않으면서, ▶ PetalWidth가 1.75보다 작거나 같지 않으면서, ▶ PetalLegnth가 4.85보다 작거나 같지 않은 데이터 ▶ 조건이 충족된 데이터에 virginica가 많다면 모델은 앞으로 해당 조건을 가진 데이터..