Kutu grafiği (ya da kutu-çizgi grafiği), bir sayısal veri grubunun dağılımını ve merkezi eğilim ölçülerini görselleştirmek için kullanılan bir grafik türüdür. Bu grafik, beş sayı özeti adı verilen değerleri gösterir.
Bir veri setini analiz etmek için kullandığımız beş önemli değerdir:
Bir sınıfın matematik sınav notları: 45, 50, 62, 75, 78, 80, 82, 85, 88, 90, 95
Bu beş değer kullanılarak kutu grafiği çizilir.
Soru 1: Bir sınıftaki 20 öğrencinin matematik sınavından aldığı puanların kutu grafiği çizildiğinde, minimum değer 30, maksimum değer 95, alt çeyrek (Q1) 50, üst çeyrek (Q3) 80 ve medyan (Q2) 65 olarak bulunmuştur. Buna göre, aşağıdaki yorumlardan hangisi bu grafiğe göre kesinlikle doğrudur?
a) Öğrencilerin tamamı 50 puanın üzerinde not almıştır.
b) Öğrencilerin %25'i 80 ile 95 puan aralığındadır.
c) Notların dağılımı sağa çarpıktır.
d) Sınıf ortalaması 65'tir.
e) 30 ile 50 puan arasında not alan öğrenci sayısı, 80 ile 95 puan arasında not alan öğrenci sayısına eşittir.
Cevap: b) Öğrencilerin %25'i 80 ile 95 puan aralığındadır.
Çözüm: Kutu grafiğinde üst çeyrek (Q3) 80 ve maksimum değer 95'tir. Bu, en yüksek %25'lik dilimin 80 ile 95 puan arasında olduğunu gösterir. Diğer seçenekler grafikten kesin olarak çıkarılamaz.
Soru 2: Bir veri setinin kutu grafiğinde kutu uzunluğu (çeyrekler açıklığı) 20, alt uç (minimum) 10 ve üst uç (maksimum) 70'tir. Aşağıdaki sayılardan hangisi bu veri seti için bir aykırı değer olamaz?
a) 5
b) 75
c) -5
d) 65
e) 100
Cevap: d) 65
Çözüm: Aykırı değerler genellikle Q1 - 1,5*(Q3-Q1) ve Q3 + 1,5*(Q3-Q1) sınırlarının dışındaki değerlerdir. Kutu uzunluğu (Q3-Q1)=20'dir. Üst sınır Q3 + 30'dur. Q3'ü bulmadan kesin bir şey söylenemez ancak Q3 en fazla 70 olabileceğinden, üst sınır en fazla 70+30=100 olur. 65, 100'den küçük olduğu için aykırı değer olamaz. Diğer seçenekler bu sınırların dışında kalma ihtimali yüksek olan değerlerdir.
Soru 3: Aşağıda iki farklı fabrikada (X ve Y) çalışan işçilerin günlük üretim sayılarının kutu grafikleri verilmiştir. X fabrikasının kutusu Y fabrikasının kutusundan daha geniş, ancak her iki grafiğin de minimum ve maksimum değerleri aynıdır. Buna göre aşağıdaki ifadelerden hangisi doğrudur?
a) İki fabrikadaki ortalama üretim sayıları eşittir.
b) X fabrikasındaki üretim sayılarının dağılımı daha geniştir.
c) Y fabrikasında daha fazla işçi çalışmaktadır.
d) İki fabrikadaki medyan üretim sayıları eşittir.
e) X fabrikasında üretim sayısı daha yüksektir.
Cevap: b) X fabrikasındaki üretim sayılarının dağılımı daha geniştir.
Çözüm: Kutu genişliği (çeyrekler açıklığı), ortadaki %50'lik verinin dağılımını gösterir. X'in kutusunun daha geniş olması, bu fabrikadaki verilerin merkezi %50'sinin dağılımının daha geniş, yani daha değişken olduğunu gösterir. Uç değerler aynı olduğu için tüm dağılım