Makine öğrenmesinde (machine learning) 'overfitting' (aşırı uyum) ne demektir?
A) Modelin eğitim verisine çok iyi uyum sağlaması, ancak yeni verilere genelleme yapamamasıMerhaba sevgili öğrenciler!
Makine öğrenmesindeki 'overfitting' (aşırı uyum) kavramını adım adım ve anlaşılır bir şekilde inceleyelim:
Bir makine öğrenmesi modeli, belirli bir görevi yerine getirmek için (örneğin, bir resimdeki kediyi tanımak, bir evin fiyatını tahmin etmek gibi) verilerden öğrenir. Bu öğrenme süreci, modele "eğitim verisi" adı verilen bir veri kümesi sunularak gerçekleşir.
Modelin asıl amacı, sadece eğitim verilerini ezberlemek değil, bu verilerden genel kurallar ve desenler öğrenerek, daha önce hiç görmediği "yeni verilere" (test verileri) de doğru tahminler yapabilmektir. Buna genelleme yeteneği diyoruz.
Overfitting, modelin eğitim verilerine o kadar iyi uyum sağlaması, o kadar detaylı bir şekilde ezberlemesi anlamına gelir ki, bu verilerdeki gürültüyü (anlamsız veya rastgele bilgileri) ve küçük sapmaları bile öğrenir. Model, eğitim verisindeki her bir noktayı adeta "nokta atışı" yapar hale gelir.
Eğitim verilerini ezberleyen bir model, yeni ve daha önce hiç görmediği verilere geldiğinde şaşırır. Çünkü yeni veriler, eğitim verilerindeki o spesifik gürültü ve sapmaları içermeyebilir. Model, ezberlediği bu detaylar yüzünden yeni verilerdeki gerçek desenleri tanıyamaz ve kötü tahminler yapar.
Diyelim ki bir öğrenci, sınavda çıkacak soruların cevaplarını ezberledi. Sınavda tam da ezberlediği sorular gelirse çok başarılı olur. Ama eğer sınavda biraz farklı, yorum gerektiren veya hiç görmediği sorular gelirse, sadece ezberlediği için bu soruları çözemez. Çünkü konuyu gerçekten anlamamış, sadece belirli cevapları ezberlemiştir. Makine öğrenmesindeki overfitting de tam olarak böyledir: Model, eğitim verisini ezberler, konuyu (genel desenleri) anlamaz.
Overfitting olan bir model, eğitim verileri üzerinde mükemmel performans gösterirken (çünkü onları ezberlemiştir), gerçek dünyadaki yeni veriler üzerinde çok kötü performans gösterir. Bu da modelin kullanışsız olduğu anlamına gelir.
Şimdi seçeneklere baktığımızda:
Cevap A seçeneğidir.