Kutu grafiği, bir veri setinin dağılımını görselleştirmek için kullanılan istatistiksel bir araçtır. Verilerin merkezi eğilimini, yayılımını ve aykırı değerlerini anlamaya yardımcı olur.
1. Veriler küçükten büyüğe sıralanır.
2. Q1, Q2 (medyan) ve Q3 hesaplanır.
3. Çeyrekler Arası Aralık (IQR): \( IQR = Q3 - Q1 \) formülüyle bulunur.
4. Kutu, Q1 ile Q3 arasına çizilir ve medyan (Q2) içinde bir çizgiyle belirtilir.
5. "Bıyıklar" (whiskers), genellikle \( Q1 - 1.5 \times IQR \) ve \( Q3 + 1.5 \times IQR \) sınırlarına kadar uzatılır.
6. Bu sınırların dışındaki değerler aykırı değer olarak işaretlenir.
Bir sınav notları kutu grafiğinde:
Not: Kutu grafikleri, özellikle karşılaştırmalı analizlerde (örneğin farklı sınıfların notları) kullanışlıdır.
Soru 1: Bir okuldaki 20 öğrencinin matematik sınavından aldığı puanların kutu grafiği çizildiğinde, minimum değer 30, birinci çeyrek (Q1) 50, medyan (Q2) 65, üçüncü çeyrek (Q3) 80 ve maksimum değer 95 olarak belirlenmiştir. Buna göre aşağıdaki ifadelerden hangisi yanlıştır?
a) Öğrencilerin %25'i 50 puanın altında not almıştır.
b) Puanların dağılımı sağa çarpıktır (pozitif çarpıklık).
c) 65 puan ve üzeri alan öğrenci sayısı 10'dur.
d) Çeyrekler arası açıklık (IQR) 30'dur.
e) 80 puanın üzerinde not alan öğrencilerin sayısı 5'tir.
Cevap: b) Puanların dağılımı sağa çarpıktır (pozitif çarpıklık).
Çözüm: Q2 (65) kutu içinde sola yakın olduğundan ve Q3-Q2 (15) > Q2-Q1 (15) olmadığından çarpıklık yoktur. Diğer seçeneklerdeki bilgiler kutu grafiği tanımına uygundur.
Soru 2: Aşağıdaki veri seti bir firmanın 7 günlük satış miktarlarını (bin TL) göstermektedir: {12, 15, 18, 22, 22, 25, 28}. Bu veri seti için oluşturulan kutu grafiğinde aykırı değer olup olmadığını bulmak isteyen bir öğrenci hangi adımı yanlış hesaplarsa hatalı sonuca ulaşır?
a) Q1 = 15 ve Q3 = 25 bulma
b) IQR = Q3 - Q1 = 10 hesaplama
c) Alt sınır = Q1 - 1,5×IQR = 0 bulma
d) Üst sınır = Q3 + 1,5×IQR = 40 bulma
e) 12 değerini alt sınırla karşılaştırma
Cevap: e) 12 değerini alt sınırla karşılaştırma
Çözüm: Aykırı değer kontrolü için üst/alt sınırlar doğru hesaplanmıştır (0 ve 40). Ancak 12, alt sınırın (0) üzerinde olduğundan aykırı değer değildir. Hata, aykırı değer varmış gibi yorumlanmasıdır.