Veri analizi, topladığımız bilgileri düzenleyip özetledikten sonra, bu bilgilerden anlamlı sonuçlar çıkarmaktır. İstatistik, bu sonuçları yorumlamamız için bize araçlar sağlar. Şimdi bu yorumlama sürecini örneklerle inceleyelim.
Bir sınıftaki 10 öğrencinin matematik sınavından aldığı notlar şöyle olsun:
Bu veri seti için merkezi eğilim ölçülerini hesaplayalım:
Yorum: Sınıfın not ortalaması 90'dır ve bu, genel olarak başarının yüksek olduğunu gösterir. Medyan da 90 olduğu için verilerin dağılımının ortalamaya göre simetrik olduğu söylenebilir. Mod değerlerinin 90 ve 100 olması, öğrencilerin büyük bir kısmının ya bu notları aldığını ya da sınavın bu puan aralıklarında yoğunlaştığını gösterir.
İki farklı sınıfta aynı sınav uygulansın. Sınıfların aldığı notların Açıklık ve Standart Sapma değerleri aşağıdaki gibi olsun:
Yorum: 9-B sınıfının hem açıklık hem de standart sapma değeri 9-A sınıfına göre daha yüksektir. Bu, 9-B sınıfındaki not dağılımının daha geniş bir aralığa yayıldığını gösterir. Yani, 9-B sınıfında çok yüksek not alan öğrenciler olduğu gibi, çok düşük not alan öğrenciler de vardır. 9-A sınıfındaki notlar ise ortalamanın etrafında daha toplu, birbirine yakın değerlerden oluşmaktadır. Bu durum, 9-A sınıfında öğrenme seviyelerinin birbirine daha yakın olduğunu düşündürür.
Aşağıda bir okuldaki öğrencilerin sevdiği meyveleri gösteren bir çubuk grafiği olduğunu düşünelim.