머신러닝 트리 모델은 의사 결정 트리(Decision Tree)를 기반으로 한 모델로, 데이터를 분석하여 특정 특징(feature, 데이터의 컬럼 요소)을 기준으로 데이터를 분할하여 예측 모델을 생성합니다. 이 모델은 입력된 데이터를 기반으로 트리 구조를 형성하고, 이를 통해 분류(Classification)나 회귀(Regression) 문제를 해결합니다.
의사 결정 트리 (Decision Tree) : 분할 기준 정하는 법
- 트리의 각 노드에서 최적의 특징과 분할 기준을 선택합니다. 이 기준은 주어진 데이터의 특성에 따라 정보 이득(Information Gain)이 최대화되는 방향으로 결정됩니다.(information gain 은 중요한 개념이므로 다음 그레서 좀 더 자세히 설명드리겠습니다.)
의사 결정 트리 (Decision Tree) : 트리, 가지, 노드란?
트리는 데이터의 분할이 이루어질 때마다 새로운 노드가 생성되며, 이는 해당 특징의 값에 따라 가지(branch)로 표현됩니다.
리프 노드 (Leaf Node): 더 이상 분할할 수 없는 노드로, 여기서 최종적인 예측값이나 분류 결과가 결정됩니다.
그러면 어떤 데이터가 트리 모델로 적합한가?
범주형 데이터 (categorical) 나 수치형 데이터 (numerical) 모두에 적용 가능합니다.
데이터의 특징이 서로 다른 클래스/카테고리로 잘 구분될 때 유용합니다.
해석이 쉽고 설명이 가능한 모델이 필요할 때 좋습니다.
데이터를 보고 판단하는것이 가장 맞는방법..!! 의견이 필요한 경우 댓글 고고!
'인공지능 > 머신러닝' 카테고리의 다른 글
[머신러닝] 공분산과 왜 중요하지? joint probability distribution 케빈머피 머신러닝 (58) | 2024.01.22 |
---|---|
[머신러닝] Categorical distribution 범주형 다항분포 캐빈머피 (53) | 2024.01.21 |
[머신러닝] LSTM - GRU 란? (23) | 2023.12.15 |