Merkezi Dağılım Ölçüleri Nelerdir?

Merkezi Dağılım Ölçüleri Nelerdir?

Veriler arasındaki uzaklık-yakınlık ilişkisini anlamlandırmada önemli bilgiler sunan merkezi dağılım ölçülerini inceliyoruz.
Çağla Öztürk Zan16 Eyl 2022

İstatistikte amacımız belirsizlikle ilgilenmektir. Yani bazı basit ölçümler yaparak bilinmeyen nicelikleri tahminlemeye ve veri hakkında genel bir bilgi edinmeye çalışırız. Bunun için değişimle ilgilenir ve mevcut değişimler karşısında elde edilen verilerden sonuçlar çıkarmaya çalışırız. Tam bu noktada daha önceki yazılarımızda yer verdiğimiz merkezi eğilim ölçüleri'nin, birimlerin ne ölçüde farklı değerlere sahip olduğunu gösterememesi nedeniyle dağılım ölçülerine ihtiyaç duymaktayız. Burada bahsi geçen “ne ölçüde farklı değerlere sahip olduğu” ifadesi veri setindeki değerlerin birbirinden ne kadar uzak veya yakın olduğunu gösteren dağılım ifadesine denk gelmektedir. 

Aynı ortalamaya sahip olmasına rağmen değişimi farklı olan aşağıdaki 3 farklı frekans dağılışı buna en açıklayıcı örneklerden biridir. Bu 3 değişkenin ortalaması 100 olmasına rağmen sahip oldukları değişim aralıkları birbirinden farklıdır. Örneğin sadece merkezi eğilim ölçülerinden biri olan aritmetik ortalamayı baz alarak değerlendirmiş olsaydık; üç farklı frekans dağılışını birbirinden ayıran farklılığı yakalayamayacaktık. Ancak merkezi dağılım ölçülerini de hesaba katarak değerlendirdiğimizde, bu 3 örneğin ortalaması her ne kadar aynı olsa da farklı değişim aralıklarına sahip olduğunu görebilmekteyiz. Bu da veri setindeki nicelikleri eksiksiz değerlendirip, veriyi doğru anlayıp, veri hakkında olabildiğince fazla bilgi edinmiş olmamıza olanak tanıyacaktır. 

 

Frekans dağılışı

 

Literatürde çoğunlukla merkezi dağılım ölçüleri adı altında incelense de merkezi değişim ölçüleri ve yayılım ölçüleri başlığı altında da incelenebilmektedir. 

Bir araştırmacının sıklıkla kullanacağı merkezi dağılım ölçüleri:

  1. Değişim aralığı (range)
  2. Varyans (variance)
  3. Standart sapma (standard deviation)
  4. Değişim katsayısı (coefficient of variation)
  5. Çeyreklikler (quartiles)

 

Değişim aralığı (Range)

Değişimi belirlememizi sağlayan en basit ölçüdür. Bir veri setinde yer alan en büyük gözlem değeri ile en küçük gözlem değeri arasındaki fark olarak tanımlanır. Kısaca DA ifadesi ile gösterilir. İngilizcede karşılığı range olması sebebiyle R ile de ifade edilebilir. En basit haliyle:

DA = En büyük değer - En küçük değer

veya literatürdeki karşılığıyla:

R = Xmax-Xmin

 şeklinde hesaplanabilmektedir.

 

Varyans (Variance)

Bir veri setindeki her bir gözlemin aritmetik ortalamadan sapmalarının, kareler toplamının gözlem sayısına bölünmesi ile elde edilen veri dağılımını gösteren bir ölçüttür. Burada amaç gözlem değerlerinin aritmetik ortalamadan ne ölçüde farklı olduğunu ortaya koymaktır. Kitle ve örneklem varyansı olmak üzere 2 şekilde incelenir. 

Kitle varyansı

 

 

Örneklem varyansı


 

Standart sapma (standard deviation)

Standart sapma varyansın pozitif karekök değerine eşittir, yani verilerin ortalamadan sapmalarının kareler ortalamasının kareköküdür.

Kitle standart sapması

Örneklem  standart sapması

 

Değişim katsayısı (Coefficient of variation)

İki kitleden birinin diğerine göre daha homojen olup olmadığını söyleyebilmek için kitle varyansı yeterli olmamaktadır. Bu şekilde bir kıyaslama yapabilmek için iki varyansın da aynı ölçekte olması gerekmektedir.  Bir değişkenin uzunluk birimini diğer değişkenin ise ağırlık birimini temsil etmesi halinde ölçümlerin karşılaştırılması yapılamaz. Bu gibi durumlarda standart sapmanın ortalamaya bölümü olarak hesaplanan değişkenlik ölçüsü, değişim katsayısı kullanılır.

Aritmetik ortalamaya göre bir değişimi belirten bu ölçüt her zaman bir yüzde ( % ) ifade etmekte olup, ölçekten arındırılmıştır. İki veya daha fazla grubu karşılaştırmak için kullanılmaktadır. DK (ya da ingilizce literatüre göre CV) olarak gösterilmektedir.

 

Kitle için değişim katsayısı:

 

Örneklem için değişim katsayısı:

 

Çeyreklikler (Kartiller)

Çeyreklikler, bir veri dağılımını düzenli aralıklarla ve eşit miktarda kümelere bölen noktalardır.  Veri setinde aşırı uç değerler bulunduğunda veya ortalama yerine ortanca kullanıldığı durumda değişim aralığı yerine çeyreklikler kullanılmaktadır. Aynı zamanda kartiller olarak da ifade edilmektedir. 

Genelde 4 eşit parçaya bölen 3 çeyrek noktası oluşturulur.  Bu çeyreklikler veri setinin dağılımının merkezini, yayılışını ve şeklini göstermektedir. 1. çeyreklik ilk parçayı yani toplam veri setinin ilk %25’lik dilimini, 2. çeyreklik ortancayı yani ilk %50’yi, 3. çeyreklik ise ilk %75’lik dilimi gösterir. 

 

 

Bu yazımızda bir veri setine ilk bakışta, veri setindeki değerlerin birbirinden ne kadar uzak veya birbirine ne kadar yakın olduğu gibi, veri hakkında oldukça önemli bilgiler sunan merkezi dağılım ölçülerini inceledik. Merkezi dağılım ölçülerine ek olarak, veri setini daha iyi tanımak için incelenmesi elzem olan değişkenlerde ölçek türleri ve merkezi eğilim ölçüleri hakkında detaylı bilgiye sahip olmak için ilgili yazılarımızı okuyabilir, veri bilimini kariyer yolculuğunuz olarak gerçekleştirmek isterseniz Miuul’un sunmuş olduğu Data Scientist’i inceleyebilirsiniz. 


 

Kaynaklar

  • Larsen, R. J., & Marx, M. L. (2005). An introduction to mathematical statistics. Prentice Hall.
  • Hogg, R. V., & Craig, A. T. (1995). Introduction to mathematical statistics.(5th edition). Englewood Hills, New Jersey.
  • Hastie, T., Tibshirani, R., Friedman, J. H., & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction (Vol. 2, pp. 1-758). New York: springer.
  • McClave, J. T., Sincich, T., & Sincich, T. T. (2013). A first course in statistics. New York, NY: Pearson.
  • İkiz, F., Püskülcü, H., & Eren, Ş. (2000). İstatistiğe giriş. Barış Yayınları Fakülteler Kitabevi.
  • Akdeniz, F. (2012). Olasılık ve İstatistik, 17. Baskı, Nobel Kitabevi, Adana.
  • Veri Bilimcisi, Veri Dağılım Ölçüleri
  • Başol G. (2013). Merkezi Eğilim ve Dağılım Ölçüleri Ders Notları
  • Şen S., Değişkenlik Ölçüleri
İlginizi Çekebilir
Miuul topluluğunun bir parçası ol!

Abone ol butonuna tıklayarak Miuul'dan pazarlama ve haber içerikleri almayı onaylıyorum.