Standart sapma, bir veri setindeki sayıların ortalamadan ne kadar saptığını ölçen bir istatistiktir. Yani, verilerin ne kadar yayıldığını veya dağıldığını gösterir. Düşük standart sapma, verilerin ortalamanın etrafında toplandığını (tutarlılık); yüksek standart sapma ise verilerin geniş bir aralığa yayıldığını (değişkenlik) ifade eder.
Standart sapmayı yorumlarken şu üç temel duruma odaklanırız:
Örnek: Bir sınıftaki öğrencilerin sınav notları 78, 80, 82, 79, 81 olsun. Bu notların ortalaması 80'dir ve standart sapması küçük çıkacaktır. Bu, öğrencilerin performanslarının birbirine yakın ve tutarlı olduğunu gösterir.
Örnek: Başka bir sınıftaki notlar 40, 90, 55, 95, 60 olsun. Bu notların ortalaması yine 68 civarında olabilir, ancak standart sapması büyük çıkacaktır. Bu, öğrenciler arasında çok büyük bir başarı farkı olduğunu gösterir.
Verileriniz yaklaşık olarak bir "çan eğrisi" (normal dağılım) şeklindeyse, standart sapma çok daha anlamlı hale gelir. Normal bir dağılımda:
Bu kurala 68-95-99.7 Kuralı veya Empirik Kural denir.
Bir kahve zincirinde, bir bardak latte'nin mililitre cinsinden servis edilen miktarları ölçülmüş ve aşağıdaki veriler elde edilmiştir:
Bu durumu yorumlarken şunu söyleyebiliriz: Kahvelerin büyük çoğunluğu 345 ml ile 355 ml arasındadır. Bu, küçük bir standart sapma olduğunu ve işlemin kontrol altında, tutarlı olduğunu gösterir. Eğer standart sapma 25 ml olsaydı, kahve boyutlarında büyük farklar olduğu (325 ml - 375 ml arası), dolayısıyla tutarsız bir servis süreci olduğu sonucuna varırdık.
Standart sapma, sadece bir sayı değil, verinin hikayesini anlamamızı sağlayan güçlü bir yorum aracıdır.