Model Selection - Decision Trees

Definition: Classifiers or regressors that are highly interpretable.
Challenges: Prone to overfitting.
Objective: Minimize impurity measures (Gini Impurity, Entropy) or reduce variance.
Targets: Can handle labels (classification) or continuous values (regression).

Import Libraries:
- numpy, pandas, sklearn datasets, traintestsplit, StandardScaler, Decision Tree Classifier, accuracyscore, classificationreport, confusion_matrix, matplotlib.
Load Data:
- Example dataset: load_digits().
Setup Data:
- Split data into features (X) and target (y).
Train-Test Split:
- 80% for training, 20% for testing.
Initialize & Train Model:
- Create model object clf_dt with specified parameters and fit it to training data.
Make Predictions:
- Use clf_dt.predict on test data to get predictions.
Evaluate Performance:
- Measure accuracy using accuracy_score and output results.
- Example accuracy: 0.8472.

Decision Trees can be effective for classification tasks but require careful management to mitigate overfitting.