📊 Regresyon Analizi Nedir?
Regresyon analizi, iki veya daha fazla değişken arasındaki ilişkiyi inceleyen bir yöntemdir. Özellikle TYT gibi sınavlarda karşımıza çıkan basit regresyon problemlerinde, bir bağımlı değişkenin (sonuç) bir bağımsız değişken (neden) tarafından nasıl etkilendiğini anlamaya çalışırız.
🎯 Neden Regresyon Analizi Öğrenmeliyiz?
- 📌 Tahmin Yapmak: Gelecekteki değerleri tahmin etmemize yardımcı olur. Örneğin, bir ürünün reklam harcamaları arttıkça satışlarının nasıl değişeceğini tahmin edebiliriz.
- 📌 İlişkileri Anlamak: Değişkenler arasındaki ilişkilerin gücünü ve yönünü belirlememizi sağlar. Bu, olaylar arasındaki neden-sonuç ilişkilerini anlamamıza yardımcı olur.
- 📌 Karar Vermek: Elde ettiğimiz sonuçlar, daha iyi kararlar almamıza yardımcı olur. Örneğin, hangi reklam stratejisine yatırım yapmamız gerektiği konusunda bize yol gösterebilir.
📈 Basit Doğrusal Regresyon Formülü
Basit doğrusal regresyon, en temel regresyon modelidir. Tek bir bağımsız değişken ile bir bağımlı değişken arasındaki doğrusal ilişkiyi inceler. Formülü şu şekildedir:
$y = ax + b$
Burada:
- 📌 y: Bağımlı değişken (tahmin etmek istediğimiz değer).
- 📌 x: Bağımsız değişken (tahmin için kullandığımız değer).
- 📌 a: Eğim (bağımsız değişkenin bağımlı değişken üzerindeki etkisini gösterir).
- 📌 b: Sabit terim (bağımsız değişken sıfır olduğunda bağımlı değişkenin değeri).
🧮 Eğim (a) Nasıl Hesaplanır?
Eğimi (a) hesaplamak için aşağıdaki formülü kullanırız:
$a = \frac{n(\sum xy) - (\sum x)(\sum y)}{n(\sum x^2) - (\sum x)^2}$
Burada:
- 📌 n: Veri noktası sayısı.
- 📌 $\sum xy$: x ve y değerlerinin çarpımlarının toplamı.
- 📌 $\sum x$: x değerlerinin toplamı.
- 📌 $\sum y$: y değerlerinin toplamı.
- 📌 $\sum x^2$: x değerlerinin karelerinin toplamı.
➕ Sabit Terim (b) Nasıl Hesaplanır?
Sabit terimi (b) hesaplamak için aşağıdaki formülü kullanırız:
$b = \bar{y} - a\bar{x}$
Burada:
- 📌 $\bar{y}$: y değerlerinin ortalaması.
- 📌 $\bar{x}$: x değerlerinin ortalaması.
- 📌 a: Eğim (yukarıda hesapladığımız değer).
📝 Örnek Soru Çözümü
Diyelim ki, bir öğrencinin ders çalışma süresi (x) ile sınav notu (y) arasındaki ilişkiyi incelemek istiyoruz. Elimizde aşağıdaki gibi bir veri seti olsun:
| Ders Çalışma Süresi (x) | Sınav Notu (y) |
|---|---|
| 2 | 50 |
| 4 | 60 |
| 6 | 70 |
| 8 | 80 |
| 10 | 90 |
1.
Adım: Gerekli toplamları hesaplayalım:
- 📌 $\sum x = 2 + 4 + 6 + 8 + 10 = 30$
- 📌 $\sum y = 50 + 60 + 70 + 80 + 90 = 350$
- 📌 $\sum xy = (2*50) + (4*60) + (6*70) + (8*80) + (10*90) = 2200$
- 📌 $\sum x^2 = 2^2 + 4^2 + 6^2 + 8^2 + 10^2 = 220$
2.
Adım: Eğim (a) hesaplayalım:
- 📌 $a = \frac{5(2200) - (30)(350)}{5(220) - (30)^2} = \frac{11000 - 10500}{1100 - 900} = \frac{500}{200} = 2.5$
3.
Adım: Sabit terimi (b) hesaplayalım:
- 📌 $\bar{x} = \frac{30}{5} = 6$
- 📌 $\bar{y} = \frac{350}{5} = 70$
- 📌 $b = 70 - 2.5 * 6 = 70 - 15 = 55$
4.
Adım: Regresyon denklemini yazalım:
Bu denkleme göre, öğrenci 1 saat daha fazla ders çalışırsa sınav notu ortalama 2.5 puan artacaktır.
🧩 Regresyon Analizinin Püf Noktaları
- 📌 Veri Seti: Regresyon analizi yapmadan önce veri setinin doğruluğundan emin olun.
- 📌 Doğrusallık: Basit doğrusal regresyon sadece doğrusal ilişkiler için uygundur. İlişki doğrusal değilse, farklı regresyon modelleri kullanmanız gerekebilir.
- 📌 Yorumlama: Elde ettiğiniz sonuçları dikkatli bir şekilde yorumlayın. Korelasyon, nedensellik anlamına gelmez!