Kategorik değişkenler, belirli kategorilere veya gruplara ayrılabilen verilerdir. Örneğin, cinsiyet (kadın/erkek), medeni durum (evli/bekar/boşanmış) veya bir ürünün rengi (kırmızı/mavi/yeşil) kategorik değişkenlerdir. İki kategorik değişken arasındaki ilişkiyi incelemek, bu değişkenlerin birbirleriyle nasıl bağlantılı olduğunu anlamamıza yardımcı olur. Bu ilişkiyi anlamak için çeşitli yöntemler ve görselleştirmeler kullanabiliriz.
Ki-kare testi, iki kategorik değişken arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirlemek için kullanılan yaygın bir yöntemdir. Bu test, gözlemlenen frekansları beklenen frekanslarla karşılaştırır. Eğer gözlemlenen ve beklenen frekanslar arasında büyük bir fark varsa, değişkenler arasında bir ilişki olduğu sonucuna varılır.
Kontenjans tablosu, iki kategorik değişken arasındaki ilişkiyi özetlemek için kullanılan bir tablodur. Bu tablo, her bir değişkenin farklı kategorilerinin kombinasyonlarının frekanslarını gösterir. Kontenjans tablosu, değişkenler arasındaki ilişkiyi görsel olarak incelemek ve desenleri belirlemek için kullanışlıdır.
Örneğin, aşağıdaki gibi bir kontenjans tablosu oluşturabiliriz:
| Sigara İçen | Sigara İçmeyen | |
|---|---|---|
| Akciğer Kanseri | 50 | 10 |
| Akciğer Kanseri Yok | 50 | 90 |
Bu tablo, sigara içme durumu ve akciğer kanseri arasındaki ilişkiyi göstermektedir.
İki kategorik değişken arasındaki ilişkiyi görselleştirmek için çeşitli grafikler kullanılabilir:
Bir pazarlama ekibi, bir ürünün reklamını farklı sosyal medya platformlarında (Facebook, Instagram, Twitter) yayınlamaktadır. Ekip, hangi platformun daha etkili olduğunu belirlemek için, her platformdan gelen müşteri geri bildirimlerini (olumlu, olumsuz, nötr) analiz etmek istemektedir.
Bu senaryoda, iki kategorik değişkenimiz vardır: sosyal medya platformu ve müşteri geri bildirimi. Ekip, ki-kare testi ve kontenjans tablosu kullanarak, hangi platformun daha olumlu geri bildirimler aldığını belirleyebilir. Ayrıca, yığılmış sütun grafiği veya mozaik grafiği kullanarak, platformlar arasındaki farklılıkları görsel olarak inceleyebilir.
Sonuç olarak, iki kategorik değişken arasındaki ilişkiyi anlamak, veri analizinde önemli bir adımdır. Ki-kare testi, kontenjans tablosu ve çeşitli görselleştirmeler kullanarak, değişkenler arasındaki ilişkileri ortaya çıkarabilir ve anlamlı sonuçlar elde edebiliriz.