Bir veri setindeki tüm değerlere aynı sabit sayı eklenirse, aşağıdaki istatistik ölçülerinden hangisi değişmez?
A) OrtalamaBir veri setindeki tüm değerlere aynı sabit bir sayı eklemek, veri setinin konumunu değiştirir ancak yayılımını (dağılımını) etkilemez. Bu durumu istatistiksel ölçüler üzerinde adım adım inceleyelim:
Ortalama, bir veri setindeki tüm değerlerin toplamının veri sayısına bölünmesiyle bulunur. Eğer her bir veri değerine $c$ gibi sabit bir sayı eklersek, yeni ortalama da eski ortalamaya $c$ eklenmiş hali olacaktır.
Örneğin, orijinal veri setimiz $x_1, x_2, ..., x_n$ olsun ve ortalaması $\bar{x} = \frac{\sum x_i}{n}$ olsun. Her bir değere $c$ eklediğimizde yeni veri setimiz $x_1+c, x_2+c, ..., x_n+c$ olur. Yeni ortalama $\bar{x}' = \frac{\sum (x_i+c)}{n} = \frac{\sum x_i + nc}{n} = \frac{\sum x_i}{n} + c = \bar{x} + c$ olur. Görüldüğü gibi, ortalama değişir.
Medyan, bir veri seti küçükten büyüğe sıralandığında tam ortada yer alan değerdir. Eğer veri setindeki tüm değerlere sabit bir sayı eklersek, değerlerin sıralaması değişmez ancak her bir değerin kendisi $c$ kadar artar. Dolayısıyla, ortadaki değer (medyan) da $c$ kadar artar.
Örneğin, $\{1, 3, 5\}$ veri setinin medyanı $3$'tür. Her değere $10$ eklersek $\{11, 13, 15\}$ olur ve yeni medyan $13$ olur. Medyan değişir.
Varyans, veri değerlerinin ortalamadan ne kadar saptığını (uzaklaştığını) gösteren bir yayılım ölçüsüdür. Varyansın hesaplanmasında her bir değerin ortalamadan farkının kareleri alınır. Eğer her bir veri değerine $c$ gibi sabit bir sayı eklersek, ortalama da $c$ kadar artar.
Orijinal bir değer $x_i$ ve ortalama $\bar{x}$ için sapma $(x_i - \bar{x})$'dir. Yeni değer $x_i' = x_i+c$ ve yeni ortalama $\bar{x}' = \bar{x}+c$ olacaktır. Yeni sapma $(x_i' - \bar{x}') = (x_i+c) - (\bar{x}+c) = x_i - \bar{x}$ olur. Görüldüğü gibi, her bir değerin kendi ortalamasından sapması değişmez. Bu nedenle, sapmaların karelerinin toplamı ve dolayısıyla varyans da değişmez.
Varyans formülü (popülasyon için): $\sigma^2 = \frac{\sum (x_i - \bar{x})^2}{N}$. Sabit bir sayı eklenmesi bu farkları değiştirmediği için varyans değişmez.
Ranj, bir veri setindeki en büyük değer ile en küçük değer arasındaki farktır. Eğer veri setindeki tüm değerlere sabit bir sayı $c$ eklersek, en büyük değer $x_{max}+c$ ve en küçük değer $x_{min}+c$ olur. Yeni ranj $(x_{max}+c) - (x_{min}+c) = x_{max} - x_{min}$ olur. Bu da orijinal ranja eşittir. Dolayısıyla, ranj da değişmez.
Yukarıdaki açıklamalardan da anlaşılacağı üzere, bir veri setindeki tüm değerlere aynı sabit sayı eklendiğinde Ortalama ve Medyan değişirken, Varyans ve Ranj değişmez. Ancak soruda tek bir doğru cevap beklendiği ve Varyans (B) yayılım ölçülerinin en temel ve sık kullanılanlarından biri olduğu için genellikle bu tür sorularda Varyans hedeflenir.
Cevap B seçeneğidir.