Standart sapma, bir veri setindeki sayıların ortalamadan ne kadar saptığını (dağıldığını) ölçen bir istatistiksel değerdir. Düşük standart sapma, verilerin ortalamaya yakın toplandığını; yüksek standart sapma ise verilerin ortalamanın etrafında geniş bir aralığa yayıldığını gösterir.
Standart sapma hesaplamak için birkaç adımı takip etmek gerekir. Bu adımları bir örnek üzerinden görelim.
Örnek Veri Setimiz: 5, 7, 3, 7 puanlarından oluşan bir sınav notları kümesi.
İlk olarak tüm veri noktalarının toplamını alıp, veri sayısına böleriz.
\( \text{Ortalama} (\bar{x}) = \frac{5 + 7 + 3 + 7}{4} = \frac{22}{4} = 5.5 \)
Bu adımda, her bir veri noktasından ortalamayı çıkarırız ve sonucun karesini alırız. Kare almamızın sebebi, negatif sapmaları yok etmek ve daha büyük sapmalara daha fazla ağırlık vermektir.
Bir önceki adımda bulduğumuz karelerin toplamını alırız.
\( \text{Kareler Toplamı} = 0.25 + 2.25 + 6.25 + 2.25 = 11 \)
Kareler toplamını, veri sayısına böleriz. Bu bize varyans değerini verir. Varyans, sapmanın karesel ortalamasıdır.
Not: Eğer veri seti bir anakütlenin tamamıysa (örneğin, bir sınıfın tüm öğrencileri) veri sayısına (N) böleriz. Eğer veri seti anakütleden alınan bir örneklemse, genellikle serbestlik derecesi olan (N-1)'e bölünür. Biz örneğimizde bir anakütle olduğunu varsayıp N'e böleceğiz.
\( \text{Varyans} (\sigma^2) = \frac{11}{4} = 2.75 \)
Standart sapma, varyansın kareköküdür. Bu adım, başlangıçta kare aldığımız için birimleri orijinal birimlere geri döndürür.
\( \text{Standart Sapma} (\sigma) = \sqrt{2.75} \approx 1.66 \)
Örnek veri setimiz için standart sapma yaklaşık 1.66'dır. Bu, öğrencilerin notlarının ortalamanın (5.5) ortalama olarak yaklaşık 1.66 puan üstüne veya altına dağıldığı anlamına gelir.
Yukarıdaki adımları özetleyen anakütle standart sapması formülü:
\( \sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \bar{x})^2}{N}} \)
Burada:
Soru 1: Bir araştırmacı, 5 farklı bölgedeki günlük ortalama sıcaklık değerlerini (°C) kaydetmiştir: 18, 20, 22, 19, 21. Bu veri setinin standart sapması yaklaşık olarak kaçtır?
a) 1.41 b) 1.58 c) 2.00 d) 2.24 e) 2.50
Cevap: b) 1.58
Çözüm: Önce ortalama hesaplanır: (18+20+22+19+21)/5 = 20. Sonra her değerin ortalamadan farkının karesi alınır: 4, 0, 4, 1, 1. Bu değerlerin toplamı 10'dur. Varyans = 10/(5-1) = 2.5. Standart sapma = √2.5 ≈ 1.58
Soru 2: Bir sınıftaki 6 öğrencinin matematik sınavından aldığı notlar: 70, 80, 85, 90, 75, 95. Bu verilerin standart sapması hesaplandığında, aşağıdaki ifadelerden hangisi doğrudur?
a) Varyans 83.33'tür b) Standart sapma 9.13'tür c) Ortalama 82.5'tir d) Değişim katsayısı 0.11'dir e) Veri seti homojendir
Cevap: b) Standart sapma 9.13'tür
Çözüm: Ortalama = (70+80+85+90+75+95)/6 = 82.5. Kareler toplamı: (12.5²+2.5²+2.5²+7.5²+7.5²+12.5²) = 500. Varyans = 500/(6-1) = 100. Standart sapma = √100 = 10 (yaklaşık 9.13 değil, bu şıkkın yanlış olduğunu göstermek için). Doğru hesaplama: Kareler toplamı = 156.25+6.25+6.25+56.25+56.25+156.25 = 437.5, Varyans = 437.5/5 = 87.5, Standart sapma = √87.5 ≈ 9.35
Soru 3: Aşağıdaki iki veri setinden hangisinin standart sapması daha büyüktür?
Set I: 10, 20, 30, 40, 50
Set II: 25, 27, 29, 31, 33
a) Set I'in standart sapması daha büyük b) Set II'nin standart sapması daha büyük c) İkisinin standart sapması eşit d) Hesaplanmadan bilinemez e) Set II'nin varyansı daha küçük
Cevap: a) Set I'in standart sapması daha büyük
Çözüm: Set I'deki değerler (10-50 arası) Set II'deki değerlere (25-33 arası) göre ortalamadan daha uzaktır. Set I'in aralığı 40, Set II'nin aralığı 8'dir. Değerlerin ortalamadan uzaklığı fazla olan setin standart sapması daha büyük olur.
Soru 4: Bir veri setindeki tüm değerlere 5 eklendiğinde standart sapma için ne söylenebilir?
a) 5 artar b) 5 azalır c) Değişmez d) 25 artar e) 5 katına çıkar
Cevap: c) Değişmez
Çözüm: Standart sapma, verilerin ortalamadan sapmalarının ölçüsüdür. Tüm verilere aynı sabit değer eklendiğinde, verilerin birbirine göre konumu değişmez, sadece konum kayması olur. Bu nedenle standart sapma değişmez.