Bir hastanede yapılan araştırmada, hastaların sigara kullanım durumu (içen, içmeyen, bırakmış) ile akciğer hastalığı tanısı (var, yok) arasındaki ilişki inceleniyor. Ki-kare bağımsızlık testi için beklenen frekanslar hesaplanırken hangi formül kullanılır?
A) (Satır toplamı - Sütun toplamı) / Genel toplamKi-kare bağımsızlık testi, iki kategorik değişken arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirlemek için kullanılan önemli bir yöntemdir. Bu testin temel adımlarından biri, değişkenlerin bağımsız olduğu varsayımı altında her bir hücrede beklenen frekansları hesaplamaktır.
Beklenen Frekans Nedir? Beklenen frekans, incelenen iki değişken (örneğin, sigara kullanım durumu ve akciğer hastalığı tanısı) arasında hiçbir ilişki olmasaydı, yani tamamen bağımsız olsalardı, bir çapraz tablonun her bir hücresinde kaç gözlem (hasta) olmasını bekleyeceğimizi gösteren teorik bir değerdir.
Bağımsızlık ve Olasılık İlişkisi: İki olayın (örneğin, A olayı ve B olayı) birbirinden bağımsız olması durumunda, bu iki olayın birlikte gerçekleşme olasılığı, her bir olayın ayrı ayrı gerçekleşme olasılıklarının çarpımına eşittir. Matematiksel olarak bu durum $P(A \text{ ve } B) = P(A) \times P(B)$ şeklinde ifade edilir.
Beklenen Frekans Formülünün Türetilmesi: Bu olasılık ilkesini bir çapraz tabloya uygulayarak beklenen frekans formülünü elde ederiz:
Bir hücrenin beklenen frekansını bulmak için, o hücrenin bulunduğu satırın toplamı ile o hücrenin bulunduğu sütunun toplamını kullanırız. Öncelikle, bir satırda olma olasılığı ($P(\text{Satır})$) ve bir sütunda olma olasılığı ($P(\text{Sütun})$) aşağıdaki gibi hesaplanır:
$P(\text{Satır}) = \frac{\text{Satır Toplamı}}{\text{Genel Toplam}}$
$P(\text{Sütun}) = \frac{\text{Sütun Toplamı}}{\text{Genel Toplam}}$
Eğer değişkenler bağımsız olsaydı, belirli bir hücrede (örneğin, 'sigara içen' ve 'akciğer hastalığı var' kombinasyonu) beklenen gözlem sayısı, genel toplamın bu iki olasılığın çarpımıyla bulunurdu:
$E_{ij} = \text{Genel Toplam} \times P(\text{Satır } i) \times P(\text{Sütun } j)$
Bu ifadeyi olasılık formülleriyle yerine koyarsak:
$E_{ij} = \text{Genel Toplam} \times \frac{\text{Satır Toplamı}}{\text{Genel Toplam}} \times \frac{\text{Sütun Toplamı}}{\text{Genel Toplam}}$
Bu denklemi sadeleştirdiğimizde, beklenen frekans ($E_{ij}$) için kullanılan formül ortaya çıkar:
$E_{ij} = \frac{(\text{Satır Toplamı}) \times (\text{Sütun Toplamı})}{\text{Genel Toplam}}$
Bu formül, her bir hücre için, o hücrenin bulunduğu satırın toplamı ile sütunun toplamını çarparak ve elde edilen değeri tüm tablonun genel toplamına bölerek beklenen frekansı verir. Bu değer, bağımsızlık varsayımı altında her bir hücrede kaç gözlem beklememiz gerektiğini gösterir.
Bu açıklamalar ışığında, beklenen frekansları hesaplamak için kullanılan doğru formülün B seçeneğinde verildiği gibi olduğunu görebiliriz.
Cevap B seçeneğidir.