Makine Öğrenmesi ve Sağkalım Analizi
Makine öğrenmesi, son yıllarda birçok alanda devrim niteliğinde ilerlemeler sağlayan ve verilerden öğrenerek tahmin yapma veya karar alma yeteneği sunan bir yapay zeka dalıdır. Tıp, endüstri, finans ve sosyoloji gibi çok çeşitli alanlarda uygulama bulan makine öğrenmesi, karmaşık problemleri çözmede ve büyük veri setlerinden anlamlı çıkarımlar elde etmede etkin bir rol oynamaktadır. Sağkalım analizi, makine öğrenmesi ile birleştirildiğinde, sansürlü veri gibi geleneksel istatistik yöntemlerle başa çıkılması zor olan durumlar için etkili çözümler sunmaktadır.
Sağkalım Analizi Nedir?
Sağkalım analizi, bir olayın gerçekleşmesine kadar geçen süreyi tahmin etmek için kullanılan bir istatistiksel yaklaşımdır. Genellikle tıp alanında hastalığın ilerleme süresi, tedavi etkinliği veya bir cihazın ömrü gibi konularda kullanılır. Bunun yanında, sosyoloji, çevre bilimleri ve ekonomi gibi alanlarda da yaygın olarak uygulanır. Geleneksel sağkalım analizi istatistiksel yöntemlere dayanırken, son yıllarda makine öğrenmesi algoritmalarının bu alana entegrasyonu, analizlerdeki güvenirliği ve tahmin performansını arttırmıştır.
Makine Öğrenmesi ile Sağkalım Analizi
Makine öğrenmesi, sağkalım analizi için çok sayıda yöntem ve model sunar. Bu yöntemler, sansürlü veri ve büyük boyutlu veri setleriyle başa çıkabilme kapasiteleri sayesinde dikkat çekmektedir. Sağkalım analizi için yaygın olarak kullanılan makine öğrenmesi yöntemlerinden bazıları şunlardır:
1. Rassal Sağkalım Ormanı (Random Survival Forest – RSF)
RSF, rassal orman yönteminin sağkalım analizi için uyarlanışmış bir versiyonudur. Bu yöntem, büyük veri setlerinde sansürlü verilere dayalı olarak tahmin yapabilir. RSF, kümülatif tehlike fonksiyonlarını topluluk tahmini yoluyla hesaplar ve tehlike fonksiyonlarını orantısal kısıtlamalardan bağımsız hale getirir.
2. Ekstra Sağkalım Ağaçları (Extra Survival Trees – EST)
EST, ağaç temelli algoritmalarda çeşitliliği arttırmak için rastgele bölünme noktaları kullanır. Bu yöntem, tüm veri seti üzerinde çalışarak daha az önyargılı ve daha hızlı modeller oluşturur. EST, genellikle Kaplan-Meier tahmincisiyle sağkalım fonksiyonlarını tahmin eder.
3. Gradyanla Güçlendirilmiş Modeller (Gradient Boosted Models – GBM)
GBM, zayıf öğrenicileri iteratif olarak birleştirerek güçlü bir model oluşturur. Sağkalım analizinde olay sürelerini ve sansürlü veriyi dikkate alarak çok yönlü tahminler sunar. GBM, gradyan azaltma yöntemiyle model hatalarını azaltır ve özellikle karmaşık veri setlerinde başarılıdır.
Kullanım Alanları
Makine öğrenmesi tabanlı sağkalım analizi, çok çeşitli alanlarda kullanılmaktadır:
- Tıp: Hastalık ilerleme süreleri, tedavi etkinliği ve hasta sağkalım tahminleri.
- Endüstri: Mekanik parçaların ömrü ve arıza tahminleri.
- Ekonomi: İşsizlik süreleri ve finansal risk tahminleri.
- Sosyoloji: Sosyal davranış kalıplarının analiz edilmesi.
Kaynak: MAKİNE ÖĞRENİMİ YÖNTEMLERİ İLE SAĞKALIM ANALİZİ, Dokuz Eylül Üniversitesi Fen Bilimleri Enstitüsü Yüksek Lisans Tezi, İstatistik, Anabilim Dalı Veri Bilimi Programı, Akın Çağatay ÇALIŞKAN, Eylül, 2024 İZMİR