İstatistik Dersleri: Ders 38
İstatistiksel analizde merkezi eğilim ölçüleri, bir veri setini anlamada büyük önem taşır. Aritmetik ortalama, sıklıkla kullanılan bir ölçü olmasına rağmen, her zaman en iyi temsilci olmayabilir. Özellikle aşırı uç değerler içeren veri setlerinde, ortanca (medyan) daha güvenilir bir ölçüm sağlar. Bu yazımızda, medyan kavramını detaylı bir şekilde ele alacağız ve hangi durumlarda kullanılmasının daha uygun olduğunu açıklayacağız: Medyan Nedir ve Nasıl Hesaplanır?
Medyan (Ortanca) Nedir?
Medyan, bir veri setinde ortada yer alan değeri bulmamıza yardımcı olan bir merkezi eğilim ölçüsüdür. Aritmetik ortalamadan farklı olarak, ortanca hesaplanırken veriler toplanıp bir sayıya bölünmez. Bunun yerine, veri seti küçükten büyüğe (veya büyükten küçüğe) doğru sıralanır ve tam ortada yer alan değer medyan olarak belirlenir. Bu nedenle, medyan verilerin tam ortasını yansıttığı için özellikle aşırı uç değerlerin bulunduğu veri setlerinde daha güvenilir bir temsil sunar.
Medyan Nasıl Hesaplanır?
Veri Seti Küçükse: Formülsüz Hesaplama
Veri sayısı az olduğunda, medyanı hesaplamak oldukça basittir. İki farklı durum söz konusudur:
Tek sayıdaki veri seti: Eğer veri setindeki sayı adedi tekse, sıralanmış verilerin tam ortasında bulunan değer medyandır.
Örnek: 2, 3, 5, 6, 7, 8, 15
Bu veri setinde ortadaki sayı 6'dır, dolayısıyla medyan 6'dır.
Çift sayıdaki veri seti: Eğer veri setindeki sayı adedi çiftse, medyaniki ortadaki sayının aritmetik ortalamasıdır.
Örnek: 2, 4, 6, 6, 8, 25, 30, 40
Bu veri setinde ortada kalan iki sayı 6 ve 8'dir, dolayısıyla medyan 7 olacaktır. (6 + 8) / 2 = 7
Büyük Veri Setleri İçin: Formül Kullanımı
Veri seti büyüdüğünde, ortancayı hesaplamak zor olabilir. Bu durumda aşağıdaki formüller yardımıyla medyan daha kolay tespit edilebilir.
N x 0,50 Formülü: N, veri sayısını ifade eder. Bu formül, medyan pozisyonunu hesaplamak için kullanılır.
(I) Sonuç tam sayı çıkmazsa, sonuçtan büyük en yakın tam sayı alınmalı ve küçükten büyüğe doğru sıralanmış veri seti içerisinde bu sırada yer alan veri seçilmelidir. Medyan, seçilen bu sayıdır.
(II) Sonuç tam sayı çıkarsa, bu sayı ile bir fazlası alınmalı ve küçükten büyüğe doğru sıralanmış veri seti içerisinde bu sıralarda yer alan verilerin aritmetik ortalaması hesaplanmalıdır. Medyan, bu sayıların aritmetik ortalamasıdır.
Örnek: 2, 3, 5, 6, 7, 8, 15
Bu veri setinde 7 değer bulunmaktadır.
N x 0,50 formülü kullanıldığında, 7 x 0,50 = 3,5 elde edilir. Sonuç tam sayı olmadığından, sıralanmış veri setinde 4. sıradaki değeri alırız. Bu durumda, 4. sıradaki sayı 6 olduğundan medyan 6'dır.
(N+1) / 2 Formülü: Alternatif olarak, (N+1)/2 formülü de kullanılabilir. Bu formül ile elde edilen sayı, medyan pozisyonu verir.
Örnek: 2, 4, 6, 6, 8, 25, 30, 40
Bu veri setinde veri sayısı 8'dir.
(N+1) / 2 formülü kullanıldığında, (8+1)/2 = 4,5 çıkar. 4. ve 5. sıradaki sayılar 6 ve 8 olduğundan, medyan bu iki sayının aritmetik ortalamasıdır: 7.
Medyanın Kullanım Alanları
Ortanca, genellikle aşırı uç değerlerin bulunduğu veri setlerinde tercih edilen bir merkezi eğilim ölçüsüdür. Örneğin, gelir dağılımı veya yaş analizlerinde ortanca sıkça kullanılır. Bir veri setinde aşırı büyük veya küçük değerler varsa, aritmetik ortalama bu değerlerden etkilenirken, ortanca bu etkilere karşı daha dayanıklıdır. Nüfus çalışmalarında da medyan yaş sıklıkla kullanılır; bir toplumdaki insanların yarısı ortanca yaştan büyük, diğer yarısı ise küçük olur.
Medyan mı, Aritmetik Ortalama mı?
Aritmetik ortalama, tüm verilerin toplamını veri sayısına bölerek hesaplanır ve çoğu zaman veri setini iyi bir şekilde temsil eder. Ancak veri setinde aşırı uç değerler varsa, ortalama yanıltıcı olabilir. İşte bu noktada medyan daha güvenilir bir ölçü sağlar. Örneğin, bir grup insanın gelirini ele alalım. Eğer grup içerisindeki birkaç kişi çok yüksek gelir elde ediyorsa, aritmetik ortalama, grubun genel gelir seviyesini yanlış yansıtabilir. Oysa medyan, daha doğru bir temsil sunar.
Sonuç
Medyan, özellikle aşırı uç değerlerin bulunduğu veri setlerinde aritmetik ortalamaya kıyasla daha güvenilir sonuçlar verir. Basit ve etkili bir hesaplama yöntemiyle, medyan bir veri setinin tam ortasında bulunan değeri yansıtır. Veri analizinde hangi merkezi eğilim ölçüsünü kullanmanız gerektiği konusunda veri setinizin yapısına dikkat etmeniz, doğru sonuçlara ulaşmanızı sağlar.
Bir sonraki yazımızda, medyan hesaplamaları yapacağız. İstatistik dünyasında kendinizi geliştirmeye devam etmek için bizi takip etmeye devam edin!
Not: Bu yazı, doçent bir hocamız tarafından kaleme alınmıştır. Ticari olarak yayınlanamaz. (c) Her hakkı saklıdır.