Kategorik ve Nicel Veri Test 2

Soru 08 / 10

🎓 Kategorik ve Nicel Veri Test 2 - Ders Notu

Merhaba sevgili öğrenciler! Bu ders notu, "Kategorik ve Nicel Veri Test 2" kapsamında karşılaşacağınız temel istatistiksel kavramları, veri türlerini, özetleme ve görselleştirme yöntemlerini basit ve anlaşılır bir dille özetlemektedir.

📌 Veri Türlerini Anlamak

İstatistiksel analizde ilk adım, elinizdeki verinin türünü doğru belirlemektir. Veri türü, hangi analiz yöntemlerini kullanabileceğinizi doğrudan etkiler.

  • Kategorik (Nitel) Veri: Gözlemleri gruplara veya kategorilere ayıran verilerdir. Sayısal bir anlam taşımazlar, ancak sayılabilirler.
  • Örnekler:
    • Cinsiyet (Erkek, Kadın)
    • Medeni Durum (Evli, Bekar, Boşanmış)
    • Göz Rengi (Mavi, Kahverengi, Yeşil)
    • Eğitim Seviyesi (İlkokul, Lise, Üniversite)
  • Nicel (Sayısal) Veri: Sayısal değerler alan ve matematiksel işlemlerle anlam ifade eden verilerdir. Ölçülebilir veya sayılabilirler.
  • Örnekler:
    • Yaş (25, 30, 45)
    • Boy Uzunluğu (1.75 cm, 1.82 cm)
    • Gelir (5000 TL, 10000 TL)
    • Sınav Notu (75, 88, 92)

💡 İpucu: Bir verinin sayısal olup olmaması, onun nicel olup olmadığını belirlemez. Örneğin, telefon numaraları sayılardan oluşur ama matematiksel bir anlamı yoktur; bu yüzden kategoriktir.

📌 Kategorik Verilerin Özeti ve Görselleştirilmesi

Kategorik verileri özetlemek ve görselleştirmek için genellikle frekanslar ve oranlar kullanılır.

  • Frekans (Sıklık): Bir kategoride kaç gözlem olduğunu gösteren sayıdır.
  • Oransal Frekans (Yüzde): Bir kategorideki gözlem sayısının toplam gözlem sayısına oranıdır (genellikle yüzde olarak ifade edilir).
  • Mod: Kategorik verilerde en sık görülen kategoridir.
  • Çubuk Grafiği (Bar Chart): Her kategorinin frekansını veya oransal frekansını bir çubukla gösterir. Çubuklar arasında boşluklar bulunur.
  • Pasta Grafiği (Pie Chart): Her kategorinin toplam içindeki payını bir daire dilimiyle gösterir. Dilimlerin toplamı %100'e eşittir.

⚠️ Dikkat: Kategorik veriler için ortalama veya medyan gibi merkezi eğilim ölçüleri hesaplanmaz.

📌 Nicel Verilerin Özeti: Merkezi Eğilim Ölçüleri

Nicel verilerin "merkezini" veya tipik değerini gösteren ölçülerdir.

  • Aritmetik Ortalama (Mean): Tüm değerlerin toplamının, veri sayısına bölünmesiyle bulunur. En yaygın merkezi eğilim ölçüsüdür.
    Formül: $ \bar{x} = \frac{\sum x_i}{n} $ (Burada $ \sum x_i $ tüm değerlerin toplamı, $ n $ ise veri sayısıdır.)
  • Medyan (Median): Veriler küçükten büyüğe sıralandığında tam ortada kalan değerdir. Veri sayısı tek ise ortadaki değer, çift ise ortadaki iki değerin ortalamasıdır. Aykırı değerlerden (outlier) daha az etkilenir.
  • Mod (Mode): Bir veri setinde en sık tekrar eden değerdir. Bir veri setinin birden fazla modu olabilir veya hiç modu olmayabilir.

💡 İpucu: Aykırı değerler (çok büyük veya çok küçük değerler) ortalamayı önemli ölçüde etkilerken, medyanı daha az etkiler. Bu nedenle, aykırı değerlerin olduğu durumlarda medyan daha iyi bir merkezi eğilim göstergesi olabilir.

📌 Nicel Verilerin Özeti: Yayılım Ölçüleri

Nicel verilerin ne kadar "dağınık" veya "birbirinden farklı" olduğunu gösteren ölçülerdir.

  • Açıklık (Range): En büyük değer ile en küçük değer arasındaki farktır. Veri setinin genel yayılımı hakkında hızlı bir fikir verir.
  • Çeyrekler Açıklığı (Interquartile Range - IQR): Veri setini dört eşit parçaya bölen çeyrekler (Q1, Q2, Q3) arasındaki farktır. $ IQR = Q3 - Q1 $. Aykırı değerlere karşı ortalamadan daha dirençlidir.
  • Varyans (Variance): Her bir veri noktasının ortalamadan ne kadar uzaklaştığının karelerinin ortalamasıdır. Yayılımın matematiksel bir ölçüsüdür.
  • Standart Sapma (Standard Deviation): Varyansın kareköküdür. Verilerin ortalamadan ortalama olarak ne kadar saptığını gösterir. Birimi orijinal veri birimiyle aynı olduğu için yorumlaması daha kolaydır.
    Formül (Örneklem için): $ s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}} $

⚠️ Dikkat: Standart sapma ne kadar büyükse, veriler ortalamadan o kadar uzakta, yani o kadar dağınıktır. Küçük standart sapma ise verilerin ortalama etrafında toplandığını gösterir.

📌 Nicel Verilerin Görselleştirilmesi

Nicel verileri görselleştirmek, dağılımın şeklini, merkezi ve yayılımını anlamamıza yardımcı olur.

  • Histogram: Nicel verilerin dağılımını gösteren bir grafiktir. Veriler belirli aralıklara (sınıflara) ayrılır ve her aralıktaki gözlem sayısı (frekans) bir çubukla temsil edilir. Çubuklar bitişiktir.
  • Kutu Grafiği (Box Plot): Bir veri setinin medyanını, çeyreklerini (Q1, Q3) ve aykırı değerlerini (varsa) gösteren kompakt bir grafiktir. Veri dağılımının şekli hakkında hızlı bir özet sunar.
  • Serpilme Grafiği (Scatter Plot): İki nicel değişken arasındaki ilişkiyi görselleştirmek için kullanılır. Her bir gözlem, iki değişkenin değerlerine göre bir nokta olarak grafiğe yerleştirilir.

💡 İpucu: Bir histogram verinin simetrik mi, sağa çarpık mı yoksa sola çarpık mı olduğunu anlamanıza yardımcı olur. Kutu grafiği ise aykırı değerleri kolayca tespit etmenizi sağlar.

↩️ Testi Çözmeye Devam Et
✨ Konuları Gir, Yapay Zeka Saniyeler İçinde Sınavını Üretsin!
1 2 3 4 5 6 7 8 9 10
Geri Dön