İstatistik Dersleri: Ders 53
Veri analizi yaparken sadece verilerin yayılımını ya da ortalamalarını incelemek yeterli değildir. Özellikle, dağılımın şekli hakkında bilgi edinmek, verilerin toplandığı merkez çevresinde nasıl bir yapı oluşturduğunu anlamak açısından oldukça önemlidir. İşte burada, basıklık katsayısı (kurtosis) devreye girer.
Basıklık katsayısı, verilerin ortalama çevresinde nasıl kümelendiğini ve dağılımın yüksekliğini ölçer. Çarpıklık gibi, basıklık katsayısı da dağılımın simetrik yapısı hakkında bilgi verir; ancak çarpıklıktan farklı olarak, bu ölçü verilerin uç değerlerdeki yoğunluğunu, yani "eğrinin yüksekliğini" anlamaya yardımcı olur.
Basık bir dağılım, çan eğrisinin ortasındaki tepenin normal dağılıma göre daha düz olduğunu, yani daha az yoğun verilerin bulunduğunu ifade eder. Diğer yandan, sivri bir dağılım ise verilerin ortalama çevresinde daha yoğun olduğunu gösterir.
Basıklık Katsayısı Nedir ve Nasıl Hesaplanır?
Basıklık katsayısı; çarpıklık katsayısına benzer biçimde bir veri setinde yer alan aritmetik ortalama, ortanca (medyan) ve modun veri seti içerisindeki konumlarına göre hesaplanan bir ölçüdür. Ancak, çarpıklıkta verilerin uzanış yönü yani normal dağılım eğrisinin hangi yöne daha çok uzandığı bulunurken; basıklıkta verilerin ortalama ve ortanca etrafındaki kümelenme miktarı yani normal dağılım eğrisinin yüksekliği bulunmaktadır.
Çarpıklık katsayısına benzer bir biçimde; basıklık katsayısı da hesaplama, özellikler ve örneklerin incelenmesi sonucunda kolayca anlaşılabilecektir. Buna göre, burada öncelikle basıklık katsayısının nasıl hesaplandığından başlanacaktır.
Basıklık katsayısının hesaplanması için,
(I) verilerin aritmetik ortalamadan sapma değerlerini
(II) standart sapmanın dördüncü kuvvetlerini (çarpıklık katsayısı için üçüncü kuvvetler kullanılıyordu!)
içeren bir formül kullanılmaktadır:
Bu formülde; her bir verinin aritmetik ortalamadan sapma değerleri toplanmakta ve bu toplam; eleman sayısı ile standart sapmanın dördüncü kuvvetinin (bu defa, çarpıklıkta olduğu gibi üçüncü kuvvet değil, dördüncü kuvvet kullanılıyor) çarpım sonucuna bölünmektedir.
Ayrıca, elde edilen sonuçtan “3” çıkarılmaktadır. Bunun nedeni, normal kabul edilen basıklık değeri sonucunun 3 çıkması ve bunun sıfıra eşitlenmek istenmesidir. Yani, normal basıklık katsayısı sıfıra eşit olacaktır. Bu açıklamayı şu şekilde formülleştirmek mümkündür (formül, ana kütle ve örneklem için aynıdır; burada ana kütleye ait semboller kullanılmıştır):
Basıklık katsayısının bulunması ile ilgili bir örnek verilecek olursa,
Örneğin; 1, 2, 3, 4, 5 değerlerinden oluşan bir veri setinin basıklık katsayısını bulmak için,
1- Veriler aşağıdaki gibi bir tablo haline getirilmelidir:
X | µ | x - µ | (x - µ)2 | (x - µ)3 | (x - µ)4 |
1 | 3 | -2 | 4 | -8 | 16 |
2 | 3 | -1 | 1 | -1 | 1 |
3 | 3 | 0 | 0 | 0 | 0 |
4 | 3 | 1 | 1 | 1 | 1 |
5 | 3 | 2 | 4 | 8 | 16 |
|
|
| = 10 | = 0 | = 34 |
2- Yukarıdaki tablonun hazırlanması ve sapmaların kareleri ve dördüncü kuvvetlerinin toplamının bulunmasından sonra yapılması gereken ise formül yardımıyla hesaplamaların yapılmasıdır.
Yukarıdaki tabloda farkların dördüncü kuvvetlerinin toplamını 34 olarak bulmuştuk.
Sonraki adımda standart sapma bulunmalı ve bunun dördüncü kuvveti alınmalıdır. Standart sapma=1,41’dir. 1,41’in dördüncü kuvveti 4’tür.
N=5'tir.
Böylece, formülde eksik bir değer kalmamıştır.
Buna göre; basıklık katsayısı [ 34 / (5 x 4) ] - 3'ten -1,30’dur.
Bu sonuç ne anlama gelmektedir?
Basıklık katsayısının “-1,30” çıkması, verilerin dağılımını gösteren çan eğrisinin normal yani kusursuz bir çan eğrisinden daha basık bir şekle sahip olduğu anlamına gelmektedir. Yani, çan eğrisinin orta kısmındaki tepe normalden daha alçaktır. Hangi sonucun nasıl yorumlandığı ile ilgili detaylı bilgiler sonraki bölümde verilmiştir.
Şimdi birkaç örnek daha yapalım:
Örnek 1:
0, 1, 3, 4, 5 değerlerinden oluşan bir veri setinin basıklık katsayısı ve durumu nedir?
Çözüm:
Veriler aşağıdaki gibi bir tablo haline getirilebilecektir:
X | µ | x - µ | (x - µ)2 | (x - µ)3 | (x - µ)4 |
0 | 2,60 | -2,60 | 6,76 | -17,58 | 45,70 |
1 | 2,60 | -1,60 | 2,56 | -4,10 | 6,55 |
3 | 2,60 | 0,40 | 0,16 | 0,06 | 0,03 |
4 | 2,60 | 1,40 | 1,96 | 2,74 | 3,84 |
5 | 2,60 | 2,40 | 5,76 | 13,82 | 33,18 |
|
|
| = 17,20 | = -5,04 | = 89,30 |
Yukarıdaki tablonun hazırlanmasından sonra yapılması gereken ise formül yardımıyla hesaplamaların yapılmasıdır.
Yukarıdaki tabloda farkların dördüncü kuvvetlerinin toplamını 89,30 olarak bulmuştuk.
Sonraki adımda standart sapma bulunmalı ve bunun dördüncü kuvveti alınmalıdır. Standart sapma=1,85’tir. 1,85’in dördüncü kuvveti 11,83’tür.
N=5'tir.
Böylece, formülde eksik bir değer kalmamıştır.
Buna göre; basıklık katsayısı [ 89,30 / (5 x 11,83) ] - 3'ten 1,49’dur.
Veriler normalden daha sivri yani sivribasıktır (leptokurtik).
Örnek 2:
1, 2, 3, 4, 9 değerlerinden oluşan bir veri setinin basıklık katsayısı ve durumu nedir?
Çözüm:
Veriler aşağıdaki gibi bir tablo haline getirilebilecektir:
X | µ | x - µ | (x - µ)2 | (x - µ)3 | (x - µ)4 |
1 | 3,80 | -2,80 | 7,84 | -21,95 | 61,47 |
2 | 3,80 | -1,80 | 3,24 | -5,83 | 10,50 |
3 | 3,80 | -0,80 | 0,64 | -0,51 | 0,41 |
4 | 3,80 | 0,20 | 0,04 | 0,01 | 0,00 |
9 | 3,80 | 5,20 | 27,04 | 140,61 | 731,16 |
|
|
| = 38,80 | = 112,32 | = 803,54 |
Yukarıdaki tablonun hazırlanmasından sonra yapılması gereken ise formül yardımıyla hesaplamaların yapılmasıdır.
Yukarıdaki tabloda farkların dördüncü kuvvetlerinin toplamını 803,54 olarak bulmuştuk.
Sonraki adımda standart sapma bulunmalı ve bunun dördüncü kuvveti alınmalıdır. Standart sapma=2,79’dur. 2,79'un dördüncü kuvveti 60,22’dir.
N=5'tir.
Böylece, formülde eksik bir değer kalmamıştır.
Buna göre; basıklık katsayısı [ 803,54 / (5 x 60,22) ] - 3'ten -0,33’tür.
Veriler normalden basık yani yassıbasıktır (platikurtik). Ancak bu basıklık çok azdır.
Örnek 3:
2, 2, 2, 2, 7 değerlerinden oluşan bir veri setinin basıklık katsayısı ve durumu nedir?
Çözüm:
Veriler aşağıdaki gibi bir tablo haline getirilebilecektir:
X | µ | x - µ | (x - µ)2 | (x - µ)3 | (x - µ)4 |
2 | 3,00 | -1,00 | 1,00 | -1,00 | 1,00 |
2 | 3,00 | -1,00 | 1,00 | -1,00 | 1,00 |
2 | 3,00 | -1,00 | 1,00 | -1,00 | 1,00 |
2 | 3,00 | -1,00 | 1,00 | -1,00 | 1,00 |
7 | 3,00 | 4,00 | 16,00 | 64,00 | 256,00 |
|
|
| = 20 | = 60 | = 260 |
Yukarıdaki tablonun hazırlanmasından sonra yapılması gereken ise formül yardımıyla hesaplamaların yapılmasıdır.
Yukarıdaki tabloda farkların dördüncü kuvvetlerinin toplamını 260 olarak bulmuştuk.
Sonraki adımda standart sapma bulunmalı ve bunun dördüncü kuvveti alınmalıdır. Standart sapma=2’dir. 2'nin dördüncü kuvveti 16’dır.
N=5'tir.
Böylece, formülde eksik bir değer kalmamıştır.
Buna göre; basıklık katsayısı [ 260 / (5 x 16) ] - 3'ten 0,25’tir.
Veriler normalden daha sivri yani sivribasıktır (leptokurtik). Ancak bu sivrilik çok azdır.
Bir sonraki dersimizde basıklığın özellikleri ile devam edeceğiz.
Not: Bu yazı, doçent bir hocamız tarafından kaleme alınmıştır. Ticari olarak yayınlanamaz. (c) Her hakkı saklıdır.