top of page
Hiyerarşik regresyon nasıl yapılır?
01:01

YOUTUBE KANALIMIZA GÖZ ATTINIZ MI? ARADIĞINIZ BİLGİ KANALIMIZDA OLABİLİR. TIKLAYINIZ.

Sağkalım (Yaşam, Survival) Analizi, Kaplan-Meier Yöntemi ve Cox Regresyon Analizi

Güncelleme tarihi: 28 Eyl

Bu yazımızda daha çok sağlık alanında kullanılan ancak sağlık alanındaki kadar yaygın olmasa da işletme, sosyoloji, mühendislik ve eğitim gibi farklı alanlarda da başvurulan bir analizi ele alacağız. Analizin, çerçeve olarak genel adı sağkalım analizi. Aynı zamanda yaşam analizi veya İngilizce adı ile survival analizi olarak da adlandırılıyor.


Survival, hayatta kalma, yaşamı sürdürme anlamına geliyor ancak bu analizi sadece insanların hayatta kalması üzerinde kullanılan bir analiz olarak düşünmemelisiniz. Belirli bir zaman süreci içerisinde gerçekleşen herhangi bir olayın olduğu her alanda veya konuda bu analizi kullanabilirsiniz. Bir işçinin fabrikada çalışma süresi, bir makinenin çalışma ömrü, bir şirketin iflas etmeden faaliyette bulunma süresi, belli özelliklere sahip çiftlerin evlilik süreleri, sizlerin bu videoyu dinleme süreniz gibi çok farklı alanlarda veya konularda da bu analizi kullanabiliriz. Çünkü bunların her biri yine sağkalım kavramının içerisinde yer almaktadır.


Sağkalım analizi nedir?

Sağkalım analizi; başlangıcı ve bitişi belli olan bir süre içerisinde, araştırmaya konu olan herhangi bir olayın veya durumun gerçekleşip gerçekleşmediğini, gerçekleşiyorsa ne zaman gerçekleştiğini, isteniyorsa çeşitli faktörlerin etkisi ile birlikte inceleyerek o olay veya durum hakkında çeşitli sonuçlara ve tahminlere ulaşmamızı sağlayan bir analizdir.

Bu tanımlamayı biraz açacak olursak; öncelikle bu analizde herhangi bir olay veya durumu inceliyoruz. Bu olay sağlık alanında ölüm, enfeksiyon kapma veya hastalığın nüks etmesi gibi olaylar olabilir. Ayrıca farklı alanlarda; evlenme veya boşanma, makinelerin bozulması, işten ayrılma, iş kazası veya şirketin başarısız olması gibi farklı olaylar da olabilir. Önemli olan belirli bir zaman içerisinde gerçekleşen herhangi bir olay veya durumun olması, bir anlamda olaya bağlı bir ömür olmasıdır. Bu olay veya durumun gerçekleşip gerçekleşmediğini, gerçekleşiyorsa ne zaman gerçekleştiğini, eğer istiyorsak ayrıca farklı faktörlerin etkisi ile birlikte inceleyerek o olay veya durum hakkında çeşitli sonuçlara ve tahminlere ulaşmaya çalışıyoruz.


İkinci olarak bu analizde incelenen olayın başlangıcı ve bitişinin, araştırmaya dahil edilen her bir birim için, örneğin her bir hasta için, belli olması gerekmektedir. Bundan dolayı araştırmayı her bir hasta için, kesin olarak belirleyeceğimiz bir başlangıç noktasından başlatıyoruz. Örneğin başlangıç noktası her bir hasta için kanser teşhisinin konulması olabilir. Ameliyat tarihi olabilir. Her bir makinenin çalışmaya başladığı tarih olabilir. Her bir işçi için, işe başlama tarihi veya şirket için, şirketin faaliyete başladığı tarih olabilir. Yalnız her bir birimin incelenen olay veya durumla ilgili sürelerinin aynı anda başlaması gerekmemektedir. Birimlere ait süreler; kriter aynı olmak şartıyla, farklı zamanlarda da başlayabilir.


Örnek verecek olursak; sigara bağımlılığı üzerinde çalışıyoruz. 5 hastamız var. Bağımlılıktan kurtulmaları için bir tedavi uyguluyoruz. Ve tedavinin sonuçlarını araştırıyoruz. Burada analizin başlangıç noktası olarak tedaviye başlama tarihini belirleyebiliriz. Yalnız bu tedavinin tüm hastalarda aynı gün başlaması gerekmemektedir. 2 hastanın tedavisi bugün başlayabilir. 1 hasta 2 ay sonra başlayabilir. Geriye kalan hastalar farklı tarihlerde başlayabilir. Önemli olan her bir hastanın başlangıç tarihinin aynı kriter olan tedavi başlangıcı olması ve bunun kesin olarak kaydedilmesidir. Çünkü süre, her bir hasta için ayrı ayrı hesaplanacaktır. Bunun için aslında grafik burada görülen hale dönüştürülecektir.


Üçüncü olarak, incelenen olayın gerçekleştiği tarihin de bilinmesi gerekmektedir. Yani süreyi sonlandıran, bir anlamda başarısızlık olayının tarihinin de bilinmesi gerekmektedir. Çünkü her bir hasta, birey, makine, şirket veya farklı inceleme birimi için başlangıç tarihinden itibaren geçen süre; gün, hafta, ay veya yıl gibi sürekli değişken özelliği gösteren birimler ile hesaplanmaktadır ve bu süreye sağkalım süresi adı verilmektedir. Sağkalım analizi de bu süreye bağlı olarak yapılmaktadır. Dolayısıyla, başlangıç noktasının kesin olması gibi, olayın veya durumun gerçekleştiği tarihin de mutlaka bilinmesi gerekmektedir.


Sağkalım süresi nedir?

Örneğin 5 sigara bağımlısına tedavi uyguladığımızı söylemiştik. Bu hastaların tedavi başlangıçlarının farklı tarihler olabileceğini de belirtmiştik ve sağkalım süresi, her bir hasta için ayrı hesaplanacaktır demiştik. İşte bunun yapılabilmesi için bu hastaların eğer tekrar sigaraya başlarlarsa bu tarihlerin net olarak kaydedilmesi gerekmektedir. Böylece her bir hasta için sigarayı bırakma süresini hesaplayabiliyoruz. Bu süreye biz bu analiz terminolojisi içerisinde sağkalım süresi adını veriyoruz.


Bu analize özel bir kavram: Sansür

Yalnız takip ettiğimiz her hastada sağkalım süresini net olarak hesaplayamayabiliriz. Çünkü, örneğin 1 hastanın, takibe başlanmasından 1 ay sonra farklı bir ile taşınmalarından dolayı takibini kaybetmiş olabiliriz. Bu hastanın mevcut durumunu bilmiyoruz. Dolayısıyla sağkalım sürelerini net olarak belirtemiyoruz. Çünkü bunlarda, incelenen olay ile gerçekleşen bir süre sonlanması bulunmamaktadır. Farklı bir örnek verecek olursak, örneğin kanser hastaları üzerinde yürüttüğünüz bir araştırmada, bir hasta, izlem süresi içerisinde, incelediğiniz olay olan kanser nedeni ile değil trafik kazası sonucunda da ölebilir. Burada da, incelenen olay ile gerçekleşen bir süre sonlanması bulunmamaktadır.


Ayrıca, yine sigara örneğimize dönecek olursak, bizim araştırmayı yürüttüğümüz tarihte 10 hastadan 1’i sigaraya halen başlamamış olabilir, dolayısıyla bu hastalarda araştırdığımız olay gerçekleşmemiştir. Burada hasta henüz sigaraya tekrar başlamamış ancak bu, bundan sonra başlamayacağı anlamına da gelmemektedir. Dolayısıyla bu hastada da olayın sonucunu net olarak bilmiyoruz. Burada da, incelenen olay ile gerçekleşen bir süre sonlanması bulunmamaktadır.

İşte bu durumlarda, yaşam süresi tam olarak bilinmeyen bu hastalara, işçilere veya makinelere ait sağkalım süresine sansürlü sağkalım süresi, bu veriye ise sansürlü veri adı verilmektedir.

Ayrıca bu vakalar yani veriler sağdan sansürlü, soldan sansürlü ve aralık sansürlü olarak da sınıflandırılmaktadır. Sağkalım analizi adını verdiğimiz bu analize biz bu sansürlü veriler nedeniyle ihtiyaç duyuyoruz. Normalde sansür dediğimiz bu bilinmeyen sağkalım süreleri olmasa çok rahat bir şekilde t-testi, ANOVA, regresyon gibi farklı testleri kullanabiliriz. Ancak net olmayan bir durum söz konusu olduğu için bunları dikkate alan bir analize başvuruyoruz.


Sağkalım analizi kapsamındaki yöntem ve analizler

Sağkalım analizi aslında bir yöntemler topluluğu özelliği göstermektedir. Yani tek bir analizden oluşmamaktadır. Analiz kapsamında farklı bilim insanları tarafından çeşitli yöntemler veya analizler geliştirilmiştir. Bunlar arasında öne çıkanlar ise yaşam tabloları, Kaplan-Meier Yöntemi ve Cox Regresyon Analizi’dir. Buradan itibaren bunlar arasında en pratik ve kullanışlıları olan Kaplan-Meier Yöntemi ve Cox Regresyon Analizi üzerinde duracağız.


Kaplan Meier Yöntemi nedir? Nasıl kullanılır?

Cox Regresyon Analizi nedir? Nasıl yapılır?

Yukarıdaki videomuzda izleyebilirsiniz.


Kaynaklar:

Kaplan, E. L., Meier, P. (1958). Non-parametric estimation from incomplete observations. Journal of the American Statistical Association, 53, 457–481.

Cox, D. R. (1972). Regression models and life tables. Journal of the Royal Statistical Society, B34, 187-220.

bottom of page