Árvores de Regressão versus Árvores
de Classificação
Diferenças primárias
As árvores de regressão são usadas
quando a variável dependente é
contínua. As árvores de classificação
são usadas quando a variável
dependente é categórica.
Nas árvore de regressão, o valor obtido pelos
nós de término nos dados de treinamento é o
valor médio das suas observações. No caso da
árvore de classificação, o valor (classe) obtido
pelo nó de término nos dados de treinamento
é a moda das suas observações.
Semelhanças
Ambas as árvores dividem o espaço
preditor (variáveis independentes) em
regiões distintas e não sobrepostas.
Ambas as árvores seguem uma abordagem “top-down” e
“gananciosa” conhecida como divisão binária recursiva
(“recursive binary splitting”)
Em ambos os casos, o processo de
divisão resulta em árvores
totalmente crescidas até que os
critérios de parada sejam atingidos.