Kategorik değişkenler, verileri belirli kategorilere veya gruplara ayıran değişkenlerdir. Örneğin: cinsiyet (kadın/erkek), renk (kırmızı/mavi/yeşil), medeni durum (evli/bekar/boşanmış) gibi. 📊
Kategorik değişkenler arasındaki ilişkileri anlamak, çeşitli alanlarda (sağlık, sosyal bilimler, pazarlama vb.) önemli kararlar almamıza yardımcı olur. 🎯
Ki-kare testi, iki kategorik değişken arasında anlamlı bir ilişki olup olmadığını belirlemek için kullanılan bir istatistiksel testtir. 🧪
Her hücre için beklenen değer, satır toplamı * sütun toplamı / toplam örneklem sayısı formülü ile hesaplanır.
Ki-kare istatistik değeri aşağıdaki formülle hesaplanır:
$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$
Burada $O_i$ gözlemlenen değeri ve $E_i$ beklenen değeri temsil eder.
Serbestlik derecesi (sd), (satır sayısı - 1) * (sütun sayısı - 1) formülü ile hesaplanır.
Hesaplanan ki-kare istatistik değeri ve serbestlik derecesi kullanılarak bir p-değeri bulunur. Eğer p-değeri anlamlılık düzeyinden (genellikle 0.05) küçükse, sıfır hipotezi reddedilir ve iki değişken arasında anlamlı bir ilişki olduğu sonucuna varılır. ✅
Bir araştırmacı, öğrencilerin cinsiyeti ile matematik başarısı arasında bir ilişki olup olmadığını incelemek istiyor. Veriler aşağıdaki gibi:
| Başarılı | Başarısız | |
|---|---|---|
| Erkek | 60 | 40 |
| Kız | 50 | 50 |
Bu verilerle ki-kare testi yaparak, cinsiyet ile matematik başarısı arasında anlamlı bir ilişki olup olmadığını belirleyin. 🤓