Makine öğrenmesi (Machine Learning) Test 1

Soru 08 / 10

🎓 Makine öğrenmesi (Machine Learning) Test 1 - Ders Notu

Bu ders notu, "Makine öğrenmesi Test 1" sınavında karşılaşabileceğiniz temel kavramları, öğrenme türlerini ve model değerlendirme prensiplerini sade bir dille özetlemektedir. Amacımız, makine öğrenmesinin mantığını ve işleyişini kolayca anlamanızı sağlamaktır.

📌 Makine Öğrenmesi Nedir?

Makine öğrenmesi (ML), bilgisayarların açıkça programlanmadan, yani her adımı tek tek kodlanmadan, veriden öğrenerek görevleri yerine getirmesini sağlayan bir yapay zeka (AI) dalıdır. Bilgisayarlar, tıpkı insanlar gibi deneyim (veri) kazanarak daha iyi hale gelir.

  • Tanım: Bilgisayarların veriden desenleri ve ilişkileri öğrenerek tahminler yapması veya kararlar vermesidir.
  • Amaç: Karmaşık görevleri otomatikleştirmek, gelecekteki olayları tahmin etmek ve verideki gizli bilgileri ortaya çıkarmaktır.
  • Günlük Hayattan Örnek: E-posta gelen kutunuzdaki spam filtreleri, online alışveriş sitelerinin size ürün önermesi veya akıllı telefonunuzdaki yüz tanıma özelliği birer makine öğrenmesi uygulamasıdır.

📌 Temel Makine Öğrenmesi Kavramları

Makine öğrenmesi dünyasında sıkça karşılaşacağınız bazı temel terimleri bilmek, konuları daha iyi anlamanıza yardımcı olacaktır.

  • Veri (Data): Makine öğrenmesi modellerinin üzerinde çalıştığı ham bilgidir. Sayılar, metinler, görüntüler veya sesler olabilir.
  • Özellik (Feature): Verinin bir özelliğidir. Örneğin, bir evin fiyatını tahmin ederken evin büyüklüğü, oda sayısı, konumu gibi bilgiler birer özelliktir.
  • Etiket (Label) / Hedef (Target): Tahmin etmeye çalıştığımız sonuçtur. Denetimli öğrenmede her veri noktası için bilinen doğru cevaptır. Örneğin, bir resmin kedi mi köpek mi olduğunu belirlerken "kedi" veya "köpek" etikettir.
  • Model: Veriden öğrenen ve yeni veriler üzerinde tahminler yapmak için kullanılan matematiksel yapıdır. Bir tür "öğrenilmiş kural setidir".
  • Eğitim (Training): Modelin verilen veri setini (eğitim verisi) kullanarak desenleri öğrenme sürecidir. Bu süreçte model, özellikler ve etiketler arasındaki ilişkileri anlamaya çalışır.
  • Tahmin (Prediction): Eğitilmiş bir modelin, daha önce görmediği yeni veriler üzerinde bir çıktı veya sonuç üretmesidir.

💡 İpucu: Makine öğrenmesi, tıpkı bir öğrencinin ders çalışması gibidir. Veri ders kitapları, özellikler konunun detayları, etiketler doğru cevaplar, model ise öğrencinin öğrendiği bilgilerdir.

📌 Makine Öğrenmesi Türleri

Makine öğrenmesi problemleri genellikle verinin yapısına ve öğrenme hedefine göre üç ana kategoriye ayrılır.

Denetimli Öğrenme (Supervised Learning) 📊

Bu tür öğrenmede, model hem girdi verilerini (özellikler) hem de bu verilere karşılık gelen doğru çıktıları (etiketler) içeren bir eğitim veri setiyle eğitilir. Amaç, girdiler ile çıktılar arasındaki ilişkiyi öğrenmektir.

  • Tanım: Etiketli verilerle çalışırız. Bilgisayara hem soruyu hem de doğru cevabı veririz.
  • Örnek: Bir e-postanın spam olup olmadığını belirlemek (evet/hayır), bir hisse senedinin gelecekteki fiyatını tahmin etmek.
  • Alt Türleri:
    • Regresyon (Regression): Sürekli bir sayısal değer tahmin etme problemidir. Örneğin, bir evin fiyatını, hava sıcaklığını veya bir kişinin boyunu tahmin etmek.
    • Sınıflandırma (Classification): Verileri belirli kategorilere veya sınıflara ayırma problemidir. Örneğin, bir e-postanın spam mı normal mi olduğunu, bir resimde kedi mi köpek mi olduğunu belirlemek.

⚠️ Dikkat: Denetimli öğrenme için her zaman etiketlenmiş verilere ihtiyacınız vardır. Etiketleme süreci zaman alıcı ve maliyetli olabilir.

Denetimsiz Öğrenme (Unsupervised Learning) 🔍

Denetimsiz öğrenmede, model sadece girdi verileriyle (özellikler) eğitilir ve herhangi bir etiket veya doğru çıktı sağlanmaz. Amaç, verinin içindeki gizli desenleri, yapıları veya ilişkileri keşfetmektir.

  • Tanım: Etiketsiz verilerle çalışırız. Bilgisayarın kendi başına verideki yapıları bulmasını bekleriz.
  • Örnek: Müşterileri benzer satın alma davranışlarına göre gruplamak, bir belge koleksiyonundaki ana konuları bulmak.
  • Alt Türleri:
    • Kümeleme (Clustering): Benzer veri noktalarını gruplara (kümelere) ayırma işlemidir. Örneğin, bir pazarlama kampanyası için müşteri segmentasyonu yapmak.
    • Boyut Azaltma (Dimensionality Reduction): Veri setindeki özellik sayısını azaltarak, önemli bilgileri koruyarak veriyi daha basit bir şekilde temsil etme işlemidir. Bu, görselleştirmeyi ve diğer algoritmaların performansını artırabilir.

Pekiştirmeli Öğrenme (Reinforcement Learning) 🤖

Bu tür öğrenmede, bir "ajan" (agent) belirli bir ortamda (environment) eylemler yapar ve bu eylemlerin sonucunda ödül veya ceza alır. Ajanın amacı, zamanla en yüksek toplam ödülü alacak şekilde en iyi eylem stratejisini öğrenmektir.

  • Tanım: Bir ajanın deneme-yanılma yoluyla, ödül ve ceza sistemleriyle öğrenmesidir.
  • Örnek: Bir robotun labirentten çıkmayı öğrenmesi, bir yapay zekanın satranç veya Go gibi oyunları oynamayı öğrenmesi.

📌 Model Değerlendirme ve Problemler

Bir makine öğrenmesi modelini eğittikten sonra, ne kadar iyi performans gösterdiğini değerlendirmek çok önemlidir. Ayrıca, sık karşılaşılan bazı problemlere dikkat etmek gerekir.

  • Eğitim ve Test Verisi Bölünmesi (Train/Test Split): Modelin gerçek dünyadaki performansı hakkında doğru bir fikir edinmek için, veri setini genellikle ikiye ayırırız:
    • Eğitim Verisi (Training Data): Modelin öğrenmek için kullandığı kısımdır.
    • Test Verisi (Test Data): Modelin eğitimden sonra ne kadar iyi genelleme yapabildiğini (yani yeni verilerde ne kadar iyi çalıştığını) ölçmek için kullanılan, modelin daha önce görmediği kısımdır.
  • Aşırı Öğrenme (Overfitting): Modelin eğitim verisindeki "gürültüyü" veya rastgele desenleri ezberlemesi durumudur. Bu durumda model eğitim verisinde çok iyi performans gösterirken, yeni (test) verilerde kötü performans sergiler.
  • Eksik Öğrenme (Underfitting): Modelin eğitim verisindeki temel desenleri bile öğrenemeyecek kadar basit olması durumudur. Hem eğitim hem de test verisinde kötü performans gösterir.
  • Doğruluk (Accuracy): Sınıflandırma problemlerinde en basit değerlendirme metriklerinden biridir. Modelin yaptığı doğru tahminlerin toplam tahminlere oranıdır. Örneğin, 100 tahminin 90'ı doğruysa doğruluk %90'dır.

💡 İpucu: Aşırı öğrenme, bir öğrencinin sadece ders kitabını ezberleyip konuyu anlamamasına benzer. Eksik öğrenme ise öğrencinin konuyu hiç anlamaması gibidir. Amacımız, genelleme yapabilen dengeli bir model oluşturmaktır.

↩️ Testi Çözmeye Devam Et
✨ Konuları Gir, Yapay Zeka Saniyeler İçinde Sınavını Üretsin!
1 2 3 4 5 6 7 8 9 10
Geri Dön