Soru: Bir makine öğrenmesi modeli, bir veri kümesini eğitim ve test verisi olarak ikiye ayırır. Bunun neden gerekli olduğunu açıklayınız.
Çözüm: Modelin performansını değerlendirmek ve aşırı uyumu (overfitting) önlemek için gereklidir. Eğitim verisi, modelin öğrenmesi için kullanılır. Test verisi ise modelin görmediği veriler üzerindeki genelleme yeteneğini ölçmek için ayrılır. Örneğin, 1000 veri noktası varsa, %80'i (800) eğitim, %20'si (200) test için kullanılabilir. Model eğitim verisinde çok iyi performans gösterip test verisinde kötüyse, bu aşırı uyuma işaret edebilir.