top of page

Normal Dağılım: İstatistiksel Analizlerin Temel Taşı ve Sosyal Bilimlerdeki Önemi

Normal Dağılım Nedir?


Normal dağılım, istatistikte en önemli sürekli olasılık dağılımlarından biridir ve "Gauss dağılımı" olarak da bilinir. Bu dağılım, ortalama (μ) ve standart sapma (σ) olmak üzere iki parametre ile tanımlanır ve karakteristik çan şeklindeki simetrik yapısıyla tanınır (Field, 2018). Normal dağılım testi, verilerin bu ideal dağılım şeklini ne kadar yakından takip ettiğini değerlendirmek için kullanılır ve normallik testi olarak da adlandırılır.

Şekil 1: Normal Dağılım Özellikleri
Şekil 1: Normal Dağılım Özellikleri

Normal Dağılımın Temel Özellikleri


  • Simetrik yapı: Dağılım, ortalama etrafında mükemmel simetrik şekilde dağılır

  • Tek modlu: Sadece bir tepe noktası (mod) bulunur ve bu nokta ortalama ile çakışır

  • Ortalama = Medyan = Mod: Bu üç merkezi eğilim ölçüsü aynı değere sahiptir

  • Asimptotik kuyruklar: Dağılımın kuyrukları hiçbir zaman x eksenine değmez

  • 68-95-99.7 kuralı: Verilerin %68'i μ±σ, %95'i μ±2σ, %99.7'si μ±3σ aralığında yer alır


Normal Dağılım Ne İşe Yarar?


Normal dağılım, istatistiksel analizlerde kritik bir role sahiptir. Birçok parametrik test, verilerin normal dağıldığı varsayımına dayanır. Bu varsayım, t-testleri, ANOVA, regresyon analizi gibi yaygın kullanılan testlerin geçerliliği için gereklidir (Tabachnick & Fidell, 2019). Normal dağılım kontrolü, analiz öncesi yapılması gereken temel adımlardan biridir.

Merkezi Limit Teoremi gereği, örneklem büyüklüğü arttıkça örneklem ortalamaları normal dağılıma yaklaşır. Bu özellik, büyük örneklemlerle çalışırken normal dağılım varsayımının esnek şekilde uygulanabilmesini sağlar.


Normal Dağılım Olmadığında Ne Olur?


Normal dağılmayan veriler kullanıldığında, parametrik testlerin sonuçları yanıltıcı olabilir. Bu durumda:

  • Tip I hata oranı (yanlış pozitif) artabilir

  • Test gücü (power) azalabilir

  • Güven aralıkları yanlış hesaplanabilir

  • Regresyon katsayıları sapmalı tahmin edilebilir

    Bu nedenle normallik varsayımı, istatistiksel analizlerin güvenilirliği için hayati önem taşır.


Normal Dağılım Nasıl Tespit Edilir?


Normal dağılım testi için çeşitli yöntemler kullanılabilir:


Grafik Yöntemler:


  • Histogram: Verilerin dağılım şeklini görsel olarak değerlendirme

  • Q-Q Plot: Teorik normal dağılım ile gözlenen değerlerin karşılaştırılması

  • Box Plot: Aykırı değerlerin ve dağılımın simetrisinin incelenmesi


İstatistiksel Testler:


  • Shapiro-Wilk Testi: Küçük örneklemler (n<50) için en güçlü test

  • Kolmogorov-Smirnov Testi: Büyük örneklemler için kullanılır

  • Anderson-Darling Testi: Dağılımın kuyruk bölgelerine daha duyarlı


Betimsel İstatistikler:


  • Çarpıklık (Skewness): Dağılımın simetrisini ölçer

  • Basıklık (Kurtosis): Dağılımın sivrilik derecesini gösterir


Hipotez Testi Seçiminde Normal Dağılımın Önemi


Normal dağılım kontrolü, doğru hipotez testinin seçilmesi için kritik öneme sahiptir. Veriler normal dağıldığında parametrik testler (t-test, ANOVA, Pearson korelasyonu) kullanılırken, normal dağılmadığında non-parametrik alternatifler (Mann-Whitney U, Kruskal-Wallis, Spearman korelasyonu) tercih edilir (Pallant, 2020).


Normal Dağılıma Yaklaştırma Dönüşümleri


Normal dağılmayan verileri normal dağılıma yaklaştırmak için çeşitli veri dönüşümleri uygulanabilir:


Pozitif Çarpıklık (Sağa Çarpık) İçin:


  • Logaritmik Dönüşüm: log(x) - Orta düzeyde çarpıklık için etkili

  • Karekök Dönüşüm: √x - Hafif çarpıklık için uygun

  • Ters Dönüşüm: 1/x - Şiddetli çarpıklık için kullanılır


Negatif Çarpıklık (Sola Çarpık) İçin:


  • Kare Dönüşümü: x² - Hafif negatif çarpıklık için

  • Küp Dönüşümü: x³ - Orta düzeyde negatif çarpıklık için


Yüksek Basıklık İçin:


  • Box-Cox Dönüşümü: Optimal λ parametresi bularak en uygun dönüşümü belirler

  • Yeo-Johnson Dönüşümü: Negatif değerler içeren veriler için Box-Cox'un alternatifi


Sosyal Bilimlerde Normal Dağılım: İdeal ve Gerçeklik


Sosyal bilimler araştırmalarında, normal dağılım genellikle ulaşılmak istenen bir ideal olarak görülür, ancak gerçekte bu ideal her zaman karşılanmaz. İnsan davranışları, tutumlar ve sosyal fenomenler doğası gereği mükemmel normal dağılım göstermeyebilir (Micceri, 1989).

Normallik testlerinde veriler sıklıkla normal dışı dağılım gösterir, özellikle büyük örneklemlerde küçük sapmalar bile istatistiksel olarak anlamlı çıkabilir. Bu durumda, çarpıklık ve basıklık değerlerinin belirli sınırlar içinde kalması önemlidir:

Çarpıklık değeri: ±2 aralığında kabul edilebilir (George & Mallery, 2019)

Basıklık değeri: ±7 aralığında tolere edilebilir

Daha katı kriterler için ±1.5 (çarpıklık) ve ±3 (basıklık) sınırları kullanılabilir

Bu durumda veriler "normale yakın dağılım" gösterdiği kabul edilir ve parametrik testler kullanılabilir.


Büyük Örneklemlerde Normal Dağılım


Merkezi Limit Teoremi gereği, örneklem büyüklüğü 30'u aştığında (özellikle n>100), normal dağılım varsayımından küçük sapmalar tolere edilebilir. Bu durum, sosyal bilim araştırmalarında normallik varsayımının esnek şekilde uygulanmasına olanak tanır (Field, 2018).

Normal dağılım, istatistiksel analizlerin temel varsayımlarından biri olmakla birlikte, sosyal bilimlerde mükemmel normal dağılım beklentisi gerçekçi değildir. Araştırmacıların, normal dağılım testlerini yorumlarken örneklem büyüklüğünü, çarpıklık-basıklık değerlerini ve araştırmanın amacını dikkate almaları önemlidir.

Normallik varsayımının ihlal edildiği durumlarda, veri dönüşümleri veya non-parametrik alternatifler kullanılarak güvenilir sonuçlar elde edilebilir. En önemli nokta, normal dağılım kontrolünün analiz öncesi rutin olarak yapılması ve sonuçların bağlam içinde yorumlanmasıdır.


Kaynakça

Field, A. (2018). Discovering statistics using IBM SPSS statistics (5th ed.). SAGE Publications.

George, D., & Mallery, P. (2019). IBM SPSS statistics 26 step by step: A simple guide and reference (16th ed.). Routledge.

Micceri, T. (1989). The unicorn, the normal curve, and other improbable creatures. Psychological Bulletin, 105(1), 156-166.

Pallant, J. (2020). SPSS survival manual: A step by step guide to data analysis using IBM SPSS (7th ed.). McGraw-Hill Education.

Tabachnick, B. G., & Fidell, L. S. (2019). Using multivariate statistics (7th ed.). Pearson.

 

 


Comments


© 2011 Tez Analiz Merkezi

  • Instagram
  • Facebook
bottom of page