İstatistikte, kategorik değişkenler sayısal olmayan, sınırlı sayıda gruba veya kategoriye ayrılabilen değişkenlerdir. Örneğin, "göz rengi", "mezun olunan lise türü" veya "sevdiği müzik tarzı" birer kategorik değişkendir.
İki kategorik değişkenin ilişkisini incelerken, bu iki değişkenin birbirinden bağımsız mı olduğunu yoksa aralarında bir bağlantı (ilişki) olup olmadığını anlamaya çalışırız.
İki kategorik değişken arasındaki ilişkiyi incelemenin en etkili yolu çapraz tablo (kontenjans tablosu) oluşturmaktır. Bu tablo, değişkenlerin kategorilerinin kesişimlerindeki frekansları (sayıları) gösterir.
Örnek: Bir sınıftaki 30 öğrencinin "Cinsiyet" (Kız/Erkek) ve "Matematik Dersindeki Başarı Durumu" (Başarılı/Başarısız) değişkenlerini inceleyelim.
Matematik Başarısı | |||
---|---|---|---|
Cinsiyet / Başarı | Başarılı | Başarısız | Toplam |
Kız | 10 | 5 | 15 |
Erkek | 8 | 7 | 15 |
Toplam | 18 | 12 | 30 |
Bu tabloyu yorumlayalım:
Buradan, kız öğrencilerin erkek öğrencilere göre matematikte daha başarılı olduğuna dair bir ilişki olabileceği yönünde bir çıkarım yapılabilir. Kesin bir yargı için daha ileri istatistiksel testler gerekir, ancak çapraz tablo bize ilişkinin varlığı hakkında güçlü bir fikir verir.
Bir istatistiksel problem oluştururken cevaplamak istediğimiz bir soruya ihtiyacımız vardır. İki kategorik değişkenle çalışırken sorularımız genellikle "Acaba... ilişkisi var mı?" şeklinde olur.
Problem Oluşturma Adımları: