본문 바로가기

인공지능/머신러닝

[머신러닝] 의사 결정 트리(Decision Tree) 모델이란?

머신러닝 트리 모델은 의사 결정 트리(Decision Tree)를 기반으로 한 모델로, 데이터를 분석하여 특정 특징(feature, 데이터의 컬럼 요소)을 기준으로 데이터를 분할하여 예측 모델을 생성합니다. 이 모델은 입력된 데이터를 기반으로 트리 구조를 형성하고, 이를 통해 분류(Classification)나 회귀(Regression) 문제를 해결합니다.

의사 결정 트리 (Decision Tree) : 분할 기준 정하는 법

- 트리의 각 노드에서 최적의 특징과 분할 기준을 선택합니다. 이 기준은 주어진 데이터의 특성에 따라 정보 이득(Information Gain)이 최대화되는 방향으로 결정됩니다.(information gain 은 중요한 개념이므로 다음 그레서 좀 더 자세히 설명드리겠습니다.)

의사 결정 트리 (Decision Tree) : 트리, 가지, 노드란?

트리는 데이터의 분할이 이루어질 때마다 새로운 노드가 생성되며, 이는 해당 특징의 값에 따라 가지(branch)로 표현됩니다.
리프 노드 (Leaf Node): 더 이상 분할할 수 없는 노드로, 여기서 최종적인 예측값이나 분류 결과가 결정됩니다.

그러면 어떤 데이터가 트리 모델로 적합한가?


범주형 데이터 (categorical) 나 수치형 데이터 (numerical) 모두에 적용 가능합니다.
데이터의 특징이 서로 다른 클래스/카테고리로 잘 구분될 때 유용합니다.
해석이 쉽고 설명이 가능한 모델이 필요할 때 좋습니다.

 

데이터를 보고 판단하는것이 가장 맞는방법..!! 의견이 필요한 경우 댓글 고고!