Bir veri setinde diğer değerlerden belirgin şekilde farklı olan, genel eğilimden uzak duran değerlere aykırı değer denir. Aykırı değerler, ölçüm hatalarından, veri giriş yanlışlıklarından veya gerçekten nadir görülen durumlardan kaynaklanabilir.
Aykırı değerleri tespit etmek için farklı yöntemler kullanılır. En yaygın yöntemlerden biri çeyrekler açıklığı (IQR) yöntemidir:
Veri seti: 12, 14, 15, 16, 17, 2, 18, 19, 20, 22, 24, 45
Soru 1: Bir veri setinde aykırı değer belirlerken aşağıdaki yöntemlerden hangisi kullanılabilir?
a) Medyan ve çeyrekler açıklığı kullanarak hesaplama
b) Verilerin aritmetik ortalamasını alarak kontrol etme
c) Mod değerini baz alarak karşılaştırma
d) Standart sapmayı hesaplayıp 2 katı kadar uzaklıkta olanları belirleme
e) En yüksek ve en düşük değerlerin farkını alarak bulma
Cevap: a) Medyan ve çeyrekler açıklığı kullanarak hesaplama
Çözüm: Aykırı değer belirlemede en güvenilir yöntemlerden biri, medyan ve çeyrekler açıklığı (IQR) kullanarak Q1 - 1,5×IQR ve Q3 + 1,5×IQR sınırlarının dışındaki değerleri tespit etmektir.
Soru 2: Bir sınıfın matematik sınav notları şu şekildedir: 45, 52, 60, 62, 65, 68, 70, 72, 75, 90. Bu veri setinde aykırı değer var mıdır? (Q1 = 60, Q3 = 72, IQR = 12)
a) 45 aykırı değerdir
b) 90 aykırı değerdir
c) Hem 45 hem 90 aykırı değerdir
d) Aykırı değer yoktur
e) Sadece 52 aykırı değerdir
Cevap: b) 90 aykırı değerdir
Çözüm: Q3 + 1,5×IQR = 72 + 18 = 90'dır. 90 bu sınıra eşit olduğundan teknik olarak aykırı değer sayılmaz, ancak pratikte sınırda kabul edilebilir. Q1 - 1,5×IQR = 60 - 18 = 42'dir ve 45 bu sınırın üzerindedir.
Soru 3: Aşağıdaki grafiklerden hangisi aykırı değerleri görselleştirmek için en uygundur?
a) Çizgi grafiği
b) Kutu grafiği (box plot)
c) Pasta grafiği
d) Histogram
e) Çubuk grafik
Cevap: b) Kutu grafiği (box plot)
Çözüm: Kutu grafikleri, çeyrekler açıklığı ve aykırı değerleri doğrudan göstermek üzere tasarlanmıştır. Uçlardaki noktalar aykırı değerleri temsil eder.