veri analizi ipuçları Test 1

Soru 03 / 10

🎓 veri analizi ipuçları Test 1 - Ders Notu

Bu ders notu, "veri analizi ipuçları Test 1" sınavında karşılaşabileceğin temel veri analizi kavramlarını ve yöntemlerini sade bir dille özetlemektedir. Veri türlerinden temel istatistiksel ölçümlere ve görselleştirmeye kadar her şeyi kapsar.

📌 Veri Türleri: Veriyi Tanımak

Veri analizi yapmadan önce, elindeki verinin ne tür bir veri olduğunu anlamak çok önemlidir. Çünkü kullanacağın analiz yöntemleri buna göre değişir.

  • Nitel (Kategorik) Veriler: Sayılarla ifade edilemeyen, kategorilere ayrılan verilerdir.
    • Nominal Veri: Kategoriler arasında doğal bir sıralama yoktur. Örnek: Cinsiyet (Erkek/Kadın), Medeni Durum (Evli/Bekar).
    • Sıralı (Ordinal) Veri: Kategoriler arasında bir sıralama veya hiyerarşi vardır, ancak aralarındaki farklar ölçülemez. Örnek: Eğitim Seviyesi (İlkokul/Ortaokul/Lise/Üniversite), Memnuniyet Düzeyi (Çok Kötü/Kötü/Orta/İyi/Çok İyi).
  • Nicel (Sayısal) Veriler: Sayılarla ifade edilebilen, ölçülebilen verilerdir.
    • Aralıklı (Interval) Veri: Sayısal değerler arasında eşit aralıklar vardır, ancak gerçek bir sıfır noktası yoktur (sıfır, yokluk anlamına gelmez). Örnek: Sıcaklık (Celsius veya Fahrenheit), IQ puanları.
    • Oranlı (Ratio) Veri: Sayısal değerler arasında eşit aralıklar vardır ve gerçek bir sıfır noktası bulunur (sıfır, yokluk anlamına gelir). Oranlar anlamlıdır. Örnek: Boy, Kilo, Yaş, Gelir.

💡 İpucu: Bir veri türünü doğru belirlemek, hangi grafik ve istatistiksel testi kullanman gerektiği konusunda sana yol gösterecektir.

📌 Merkezi Eğilim Ölçüleri: Verinin Ortasını Bulmak

Bu ölçüler, bir veri setinin "tipik" veya "merkezi" değerini anlamamıza yardımcı olur.

  • Ortalama (Aritmetik Ortalama - Mean): Tüm değerlerin toplamının, değer sayısına bölünmesiyle bulunur. En sık kullanılan merkezi eğilim ölçüsüdür.

    $ \bar{x} = \frac{\sum x_i}{n} $

    Örnek: (2, 3, 7, 8) ortalaması $ (2+3+7+8)/4 = 5 $
  • Medyan (Median): Veri setindeki değerler küçükten büyüğe sıralandığında tam ortada yer alan değerdir. Uç değerlerden (aykırı değerler) daha az etkilenir.

    Örnek: (2, 3, 7, 8, 10) medyanı 7'dir. (2, 3, 7, 8) medyanı $ (3+7)/2 = 5 $ 'tir.

  • Mod (Mode): Veri setinde en sık tekrar eden değerdir. Bir veri setinde birden fazla mod olabilir veya hiç mod olmayabilir.

    Örnek: (2, 3, 3, 5, 7) modu 3'tür. (2, 2, 3, 3, 5) modları 2 ve 3'tür.

⚠️ Dikkat: Aykırı değerler (çok büyük veya çok küçük değerler) ortalamayı önemli ölçüde etkileyebilir. Böyle durumlarda medyan daha güvenilir bir merkezi eğilim ölçüsü olabilir.

📌 Yayılım Ölçüleri: Verinin Dağılımını Anlamak

Bu ölçüler, veri setindeki değerlerin birbirine ne kadar yakın veya uzak olduğunu, yani verinin ne kadar "dağınık" olduğunu gösterir.

  • Açıklık (Range): Veri setindeki en büyük değer ile en küçük değer arasındaki farktır. Verinin ne kadar geniş bir aralığa yayıldığını gösterir.

    Örnek: (2, 5, 8, 12) açıklığı $ 12 - 2 = 10 $ 'dur.

  • Varyans (Variance): Her bir değerin ortalamadan ne kadar saptığının karelerinin ortalamasıdır. Dağılımın miktarını sayısal olarak ifade eder. Birimi, orijinal verinin biriminin karesidir.

    Örnek: Bir öğrencinin sınav notlarının varyansı, notlarının ortalamadan ne kadar farklılık gösterdiğini belirtir.

  • Standart Sapma (Standard Deviation): Varyansın kareköküdür. Veri değerlerinin ortalamadan ne kadar uzaklaştığını, orijinal veri birimiyle ifade eder. Düşük standart sapma, verilerin ortalamaya yakın olduğunu; yüksek standart sapma ise verilerin daha dağınık olduğunu gösterir.

    $ \sigma = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}} $ (örneklem için)

    Örnek: İki sınıfın ortalama notları aynı olsa bile, standart sapması düşük olan sınıfın öğrencilerinin notları birbirine daha yakındır (daha homojen).

💡 İpucu: Merkezi eğilim ölçüleri (ortalama, medyan, mod) ile yayılım ölçülerini (standart sapma, varyans) birlikte değerlendirmek, veri setini çok daha iyi anlamanı sağlar.

📌 Veri Görselleştirme Temelleri: Veriyi Görselleştirmek

Veri görselleştirme, karmaşık veri setlerini grafikler ve çizelgeler aracılığıyla daha anlaşılır hale getirme sanatıdır. Doğru grafik seçimi çok önemlidir.

  • Çubuk Grafiği (Bar Chart): Kategorik verilerin frekanslarını veya farklı kategorilerdeki değerleri karşılaştırmak için kullanılır.

    Örnek: Farklı şehirlerdeki öğrenci sayıları.

  • Pasta Grafiği (Pie Chart): Bir bütünün parçalarını (oranları) göstermek için kullanılır. Genellikle az sayıda kategori olduğunda etkilidir.

    Örnek: Bir şirketin farklı ürün gruplarının toplam satışlardaki payı.

  • Histogram: Sürekli sayısal verilerin dağılımını göstermek için kullanılır. Veri aralıkları (binler) halinde gruplanır ve her aralıktaki veri sayısı çubuklarla gösterilir.

    Örnek: Bir sınıftaki öğrencilerin sınav notlarının dağılımı (0-10, 11-20, vb.).

  • Serpilme Diyagramı (Scatter Plot): İki sayısal değişken arasındaki ilişkiyi veya korelasyonu görmek için kullanılır. Noktalar halinde çizilir.

    Örnek: Bir kişinin çalışma saatleri ile aldığı not arasındaki ilişki.

⚠️ Dikkat: Yanlış grafik seçimi, verinin yanlış yorumlanmasına yol açabilir. Örneğin, sürekli veriyi çubuk grafiğiyle göstermek yanıltıcı olabilir.

📌 Korelasyon ve Nedensellik: İlişkiyi Anlamak

Bu iki kavram genellikle karıştırılsa da, veri analizinde aralarındaki farkı bilmek kritik öneme sahiptir.

  • Korelasyon (Correlation): İki veya daha fazla değişkenin birlikte hareket etme eğilimidir. Yani bir değişken değiştiğinde, diğer değişkenin de benzer şekilde değişip değişmediğini gösterir. Korelasyon pozitif (birlikte artar/azalır) veya negatif (biri artarken diğeri azalır) olabilir.

    Örnek: Hava sıcaklığı arttıkça dondurma satışlarının artması pozitif korelasyondur.

  • Nedensellik (Causation): Bir değişkenin doğrudan diğer bir değişkenin değişmesine yol açması durumudur (sebep-sonuç ilişkisi).

    Örnek: Bir bitkiye düzenli olarak su vermek, bitkinin büyümesine neden olur.

⚠️ Dikkat: "Korelasyon, nedensellik anlamına gelmez!" Bu, veri analizinin altın kurallarından biridir. İki şeyin birlikte değişmesi, birinin diğerine sebep olduğu anlamına gelmez. Örneğin, yaz aylarında dondurma satışları ve boğulma vakaları artar. Bunlar korelasyonludur ama dondurma yemek boğulmaya neden olmaz; her ikisi de sıcak hava gibi üçüncü bir faktörden etkilenir.

↩️ Testi Çözmeye Devam Et
✨ Konuları Gir, Yapay Zeka Saniyeler İçinde Sınavını Üretsin!
1 2 3 4 5 6 7 8 9 10
Ana Konuya Dön:
Geri Dön