Bir veri setinde diğer değerlerden belirgin şekilde farklı olan, genel dağılıma uymayan aşırı yüksek veya düşük değerlere aykırı değer denir. Aykırı değerler, ölçüm hatalarından, veri giriş yanlışlıklarından veya gerçekten nadir görülen durumlardan kaynaklanabilir.
En yaygın yöntemlerden biri çeyrekler arası aralık (IQR) kullanmaktır:
Veri seti: 12, 14, 15, 16, 17, 18, 19, 20, 22, 24, 45
Not: Aykırı değerler her zaman hata değildir! Bazen önemli bilgiler taşıyabilir.
Soru 1: Bir veri setinde aykırı değer belirlerken hangi yöntem daha sık kullanılır?
a) Aritmetik ortalama ± standart sapma
b) Medyan ± 1,5 x IQR
c) Mod ± varyans
d) Geometrik ortalama ± çeyrekler açıklığı
e) Harmonik ortalama ± mutlak sapma
Cevap: b) Medyan ± 1,5 x IQR. Çözüm: Aykırı değer tespitinde kutu grafiği yöntemi kullanılır ve IQR (çeyrekler açıklığı) ile medyan merkez alınır.
Soru 2: Aşağıdaki veri setinde hangi değer aykırıdır? [12, 15, 18, 19, 20, 21, 22, 45]
a) 12
b) 15
c) 20
d) 22
e) 45
Cevap: e) 45. Çözüm: Q1=16.5, Q3=21.5, IQR=5 olduğundan üst sınır 21.5 + 7.5 = 29'dur. 45 > 29 olduğu için aykırı değerdir.
Soru 3: Bir araştırmacı, veri setindeki aykırı değeri silerse hangi istatistik en çok etkilenir?
a) Medyan
b) Mod
c) Aritmetik ortalama
d) Standart sapma
e) Varyans
Cevap: c) Aritmetik ortalama. Çözüm: Aykırı değerler ortalama üzerinde büyük sapmaya neden olurken, medyan ve mod daha dayanıklıdır.
Soru 4: \( Q_1 = 30 \), \( Q_3 = 50 \) olan bir veri setinde hangi değer kesinlikle aykırı değer değildir?
a) 15
b) 75
c) 35
d) 5
e) 85
Cevap: c) 35. Çözüm: Alt sınır 30 - 30 = 0, üst sınır 50 + 30 = 80'tir. 35 bu aralıkta olduğu için aykırı değer olamaz.