Siccome abbiamo sviluppato l'albero fintantoché la sua accuratezza ha raggiunto il 100%, questo albero indentifica ogni istanza di training perfettamente con la città in cui si trova.

Questo insieme di dati è chiamato training data perche è stato usato per addestrare il modello.

Confronto con la realtà

Ovviamente, quello che importa di più è che l'albero sia in grado di performare su istanze che non ha mai incontrato.

Per testare le performance dell'albero sui nuovi dati, abbiamo bisogno di applicarlo su dati che non ha mai incontrato in precedenza. Questo set di dati che non ha usato in precedenza è chiamato test data.

Idealmente, l'albero dovrebbe performare similmente sia sui dati su cui è stato addestrato che sui dati che non ha incontrato in precedenza.

Questo è tutt'altro che ideale.