🎓 Grup genişliği nedir (Histogram) Test 1 - Ders Notu
Bu ders notu, "Grup genişliği nedir (Histogram) Test 1" sınavında karşılaşabileceğin temel istatistik kavramları ve histogram oluşturma prensiplerini kapsamaktadır. Özellikle veri gruplama ve grup genişliğinin histogram üzerindeki etkileri üzerinde duracağız.
📌 Histogram Nedir?
Histogram, sürekli verilerin dağılımını görselleştirmek için kullanılan bir grafik türüdür. Verilerin belirli aralıklara (gruplara veya "bin"lere) bölünerek, her aralıktaki veri sayısının (frekansın) çubuklarla gösterilmesiyle oluşturulur.
- Amacı: Bir veri setinin şeklini, merkezini, yayılımını ve olası aykırı değerlerini hızlıca anlamamızı sağlar.
- Çubuk Grafiğinden Farkı: Çubuk grafikler kategorik verileri gösterirken, histogramlar sürekli verileri gruplayarak gösterir ve çubukları arasında boşluk olmaz (eğer gruplar arası boşluk yoksa).
- Eksenler: Yatay eksen (x-ekseni) veri aralıklarını, dikey eksen (y-ekseni) ise bu aralıklara düşen veri sayısını (frekansını) gösterir.
💡 İpucu: Bir histograma baktığında, verilerin nerede yoğunlaştığını, ne kadar yayıldığını ve hangi değerlerin daha sık görüldüğünü kolayca anlayabilirsin.
📌 Grup Genişliği (Bin Width) Nedir?
Grup genişliği, bir histogram oluşturulurken verilerin bölündüğü her bir aralığın (grubun) uzunluğudur. Diğer bir deyişle, her bir çubuğun yatay eksendeki kapsamıdır.
- Önemi: Grup genişliğinin seçimi, histogramın görünümünü ve dolayısıyla veri dağılımına ilişkin yorumları doğrudan etkiler.
- Hesaplanması: Genellikle, veri aralığı (maksimum değer - minimum değer) belirlenen grup sayısına bölünerek hesaplanır. Formülü şöyledir: $h = \frac{\text{Maksimum Değer} - \text{Minimum Değer}}{\text{Grup Sayısı}}$
⚠️ Dikkat: Grup genişliği sabit olmalıdır. Yani, tüm çubukların yataydaki uzunluğu aynı olmalıdır.
📌 Grup Genişliğinin Histogram Üzerindeki Etkileri
Doğru grup genişliğini seçmek, veri setindeki gerçek desenleri ve yapıları ortaya çıkarmak için çok önemlidir.
- Çok Küçük Grup Genişliği:
- Çok fazla çubuk oluşur.
- Histogram "gürültülü" veya "dağınık" görünür.
- Veri setindeki ana eğilimleri ve şekilleri gizleyebilir, gereksiz detaylara odaklanılmasına neden olabilir.
- Çok Büyük Grup Genişliği:
- Çok az çubuk oluşur.
- Histogram, veri hakkında çok az bilgi verir.
- Önemli detaylar, tepe noktaları veya boşluklar gizlenebilir, veri dağılımının gerçek şekli anlaşılamaz.
- İdeal Grup Genişliği:
- Veri setindeki temel dağılım şeklini, tepe noktalarını ve olası aykırı değerleri net bir şekilde gösterir.
- Hem çok fazla detaydan kaçınır hem de önemli bilgileri kaybetmez.
📝 Örnek: Bir sınıfın sınav notlarını düşün. Eğer grup genişliğini 1 puan yaparsan, her not için ayrı bir çubuk görürsün ve genel başarı dağılımını anlamak zorlaşır. Eğer grup genişliğini 50 puan yaparsan (0-50, 51-100), sadece iki çubuk görürsün ve bu da notların nasıl dağıldığına dair çok az bilgi verir. Belki 10 puanlık bir grup genişliği (0-10, 11-20, ...) ideal olabilir.
📌 Grup Sayısını veya Genişliğini Belirleme Yöntemleri
Grup genişliğini veya grup sayısını belirlemek için farklı kurallar ve yaklaşımlar vardır. En yaygın kullanılanlardan biri Sturges Kuralı'dır.
- Sturges Kuralı:
- Veri setindeki gözlem sayısına ($n$) bağlı olarak ideal grup sayısını ($k$) tahmin etmeye yarar.
- Formülü: $k = 1 + 3.322 \log_{10}(n)$
- Bulunan $k$ değeri genellikle en yakın tam sayıya yuvarlanır.
- Grup sayısı ($k$) bulunduktan sonra, grup genişliği ($h$) şu şekilde hesaplanır: $h = \frac{\text{Maksimum Değer} - \text{Minimum Değer}}{k}$
- Görsel İnceleme / Deneme Yanılma:
- Farklı grup genişlikleriyle histogramlar oluşturup, verinin yapısını en iyi göstereni seçmek de pratik bir yaklaşımdır.
- Bu yöntem, özellikle belirli bir kuralın iyi sonuç vermediği durumlarda faydalı olabilir.
💡 İpucu: Sturges Kuralı, özellikle orta büyüklükteki veri setleri için iyi bir başlangıç noktasıdır. Ancak her zaman en uygun sonucu vermeyebilir, bu yüzden esnek olmak önemlidir.