Test istatistikleri Test 1

Soru 05 / 10

🎓 Test istatistikleri Test 1 - Ders Notu

Bu ders notu, "Test istatistikleri Test 1" sınavında karşılaşabileceğiniz temel istatistik kavramlarını, veri türlerini, merkezi eğilim ve değişkenlik ölçülerini sade bir dille özetlemektedir. Başarılar dileriz!

📌 Temel İstatistik Kavramları

İstatistik, verileri toplama, düzenleme, özetleme, analiz etme ve yorumlama bilimidir. Bu bölümde, istatistiğin temel yapı taşlarını öğreneceğiz.

  • Popülasyon (Anakütle): Hakkında bilgi edinmek istediğimiz, tüm bireylerin veya nesnelerin oluşturduğu büyük küme. Örneğin, Türkiye'deki tüm üniversite öğrencileri.
  • Örneklem: Popülasyondan seçilen, onu temsil eden daha küçük bir alt küme. Örneğin, Türkiye'deki 500 üniversite öğrencisi.
  • Parametre: Popülasyonun bir özelliği. Genellikle $\mu$ (ortalama) veya $\sigma$ (standart sapma) gibi Yunan harfleriyle gösterilir.
  • İstatistik: Örneklemin bir özelliği. Genellikle $\bar{x}$ (ortalama) veya $s$ (standart sapma) gibi Latin harfleriyle gösterilir.
  • Değişken: Bireylerden bireylere farklılık gösteren özellik veya nitelik. Örneğin, yaş, cinsiyet, gelir.

💡 İpucu: Popülasyon ve örneklem arasındaki farkı iyi anlamak, istatistiksel çıkarım için çok önemlidir. Örneklemden elde ettiğimiz istatistikleri kullanarak popülasyon hakkında çıkarımlar yaparız.

📝 Veri Türleri ve Ölçekler

Verileri doğru analiz edebilmek için onların türünü bilmek gerekir. Veriler genellikle nitel (kategorik) ve nicel (sayısal) olarak ikiye ayrılır.

  • Nitel (Kategorik) Veriler: Özellikleri veya kategorileri tanımlar. Sayısal olarak ifade edilemezler, ancak sayılarla kodlanabilirler. Örneğin: cinsiyet (erkek/kadın), saç rengi (siyah, kahverengi), medeni durum.
  • Nicel (Sayısal) Veriler: Sayısal değerlerle ifade edilir. Ölçülebilir veya sayılabilir. Örneğin: yaş, boy, not, öğrenci sayısı.
  • Kesikli Veriler: Sayılabilir, belirli tamsayı değerleri alır ve bu değerler arasında boşluklar vardır. Örneğin: bir sınıftaki öğrenci sayısı (20, 21, 22), atılan gol sayısı (0, 1, 2).
  • Sürekli Veriler: Belli bir aralıktaki herhangi bir değeri alabilir (küsuratlı olabilir). Ölçümle elde edilir. Örneğin: boy (1.75 m), ağırlık (72.3 kg), sıcaklık (25.5°C).

⚠️ Dikkat: Veri türünü bilmek, hangi istatistiksel yöntemi kullanacağınıza ve hangi grafiği seçeceğinize karar vermenizde size yol gösterir.

📊 Merkezi Eğilim Ölçüleri

Bir veri setinin "merkezini" veya "tipik" değerini gösteren ölçülerdir. En yaygın olanları aritmetik ortalama, medyan ve moddur.

  • Aritmetik Ortalama ($\bar{x}$ veya $\mu$): Tüm değerlerin toplamının veri sayısına bölümüdür. En sık kullanılan merkezi eğilim ölçüsüdür. Formülü: $\bar{x} = \frac{\sum x_i}{n}$.
  • Medyan: Veriler küçükten büyüğe (veya büyükten küçüğe) sıralandığında tam ortada yer alan değerdir. Veri sayısı tek ise ortadaki değer, çift ise ortadaki iki değerin ortalamasıdır. Aşırı uç değerlerden (aykırı değerler) daha az etkilenir.
  • Mod: Veri setinde en sık tekrar eden değerdir. Bir veri setinin birden fazla modu olabilir (bimodal, multimodal) veya hiç modu olmayabilir.

💡 İpucu: Veri setinde aşırı uç değerler (örn: bir grup maaş verisinde çok yüksek bir CEO maaşı) varsa, medyan ortalamadan daha iyi bir merkezi eğilim ölçüsü olabilir çünkü ortalama bu uç değerlerden çok etkilenir.

📈 Değişkenlik Ölçüleri

Verilerin birbirinden ne kadar farklılaştığını veya yayıldığını gösteren ölçülerdir. Merkezi eğilim ölçüleriyle birlikte veri setini daha iyi anlamamızı sağlarlar.

  • Ranj (Aralık): Veri setindeki en büyük değer ile en küçük değer arasındaki farktır. Formülü: $Ranj = Maksimum Değer - Minimum Değer$. Veri setindeki uç değerlerden çok etkilenir.
  • Varyans ($\sigma^2$ veya $s^2$): Verilerin ortalamadan ne kadar saptığının kareli ortalamasıdır. Verilerin ortalamaya göre ne kadar yayıldığını gösterir. Formülü (örneklem için): $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$.
  • Standart Sapma ($\sigma$ veya $s$): Varyansın kareköküdür. Verilerin ortalamadan ortalama ne kadar uzaklaştığını gösterir ve veriyle aynı birimde olduğu için daha kolay yorumlanır. Formülü (örneklem için): $s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}}$.
  • Çeyreklikler (Kartiller): Veri setini küçükten büyüğe sıraladığımızda dört eşit parçaya bölen değerlerdir. $Q_1$ (birinci çeyreklik), $Q_2$ (medyan) ve $Q_3$ (üçüncü çeyreklik).
  • Çeyrekler Arası Açıklık (IQR): Üçüncü çeyreklik ile birinci çeyreklik arasındaki farktır ($IQR = Q_3 - Q_1$). Aykırı değerlerden etkilenmeyen bir değişkenlik ölçüsüdür.

⚠️ Dikkat: Standart sapma, varyanstan daha yaygın kullanılır çünkü veri birimiyle aynıdır ve daha kolay yorumlanır. Örneğin, "ortalama 50, standart sapma 10" demek, verilerin ortalamadan ortalama 10 birim saptığını gösterir.

📊 Frekans Dağılımları ve Görselleştirme

Verileri düzenlemek ve özetlemek için frekans dağılımları oluşturur ve çeşitli grafiklerle görselleştiririz. Bu, verilerin yapısını daha kolay anlamamızı sağlar.

  • Frekans Dağılımı: Her bir değerin veya değer aralığının (sınıfın) kaç kez tekrar ettiğini gösteren tablo.
  • Bağıl Frekans: Bir değerin veya sınıfın toplam gözlem sayısına oranı. Genellikle yüzde olarak ifade edilir.
  • Histogram: Nicel (sayısal) sürekli verilerin frekans dağılımını gösteren çubuk grafik. Çubuklar bitişiktir ve her çubuk bir sınıf aralığını temsil eder.
  • Çubuk Grafik: Nitel (kategorik) veya kesikli nicel verilerin frekansını gösteren grafik. Çubuklar arasında boşluklar bulunur.
  • Pasta Grafik: Kategorik verilerin bağıl frekanslarını dairesel dilimler halinde gösterir. Her dilim bir kategoriye aittir ve tüm dilimlerin toplamı %100'dür.
  • Çizgi Grafik: Genellikle zaman içindeki değişimi veya iki nicel değişken arasındaki ilişkiyi göstermek için kullanılır.

💡 İpucu: Histogram ve çubuk grafik arasındaki temel fark, histogramın sürekli veriler için (bitişik çubuklar), çubuk grafiğin ise kesikli veya kategorik veriler için (ayrık çubuklar) kullanılmasıdır.

↩️ Testi Çözmeye Devam Et
✨ Konuları Gir, Yapay Zeka Saniyeler İçinde Sınavını Üretsin!
1 2 3 4 5 6 7 8 9 10
Ana Konuya Dön:
Geri Dön