Yazan : Şadi Evren ŞEKER
Bu yazının amacı, özellikle sağlık alanında yapılan veri madenciliği çalışmalarında sıkça geçen hassasiyet (sensitivity) ve hasiyet (sepecificity) kavramlarını açıklamaktır. Öncelikle tip 1 ve tip 2 hata değerlerini hatırlatmak için aşağıdaki şekilde bir teşhis neticesini inceleyelim.
|
Müsbet |
Menfi |
Doğru |
TP (DMü) |
TN (DMe) |
Yanlış |
FP (YMü) |
FN (YMe) |
Örneğimizde bir hastalık için konulan teşhislerin doğru çıkma ihtimalini inceliyor olursak tabloyu aşağıdaki şekilde yeniden yazmak mümkün olabilir:
|
Sağlıklı Teşhisi |
Hasta Teşhisi |
Doğru |
TP (DMü) |
TN (DMe) |
Yanlış |
FP (YMü) |
FN (YMe) |
True Positive (Doğru Müsbet) = Hasta teşhisi konulup gerçekten hasta olanlar (doğru teşhis)
True Negative (Doğru Menfi) = Hasta teşhisi konulup hata yapılan ve asılnda sağlıklı olanlar
False Positive (Yanlış Müspet) = Sağlıklı teşhisi konulup gerçekten sağlıklı olanlar
False Negative (Yanlış Menfi) = Sağlıklı teşhisi konulup hata yapılan ve aslında hasta olanlar
Şimdi yukarıdaki hatırlatmadan sonra yazının konusu olan hassasiyetin (sensitivity) formülünü verebiliriz.
Diğer bir deyişle asılnda hassasiyet koşullu olasılık olarak düşünülebilir ve gerçekten hasta olunması durumunda ne kadar oranla hastalığı doğru teşhis ettiğimizi ölçtüğümüzdür.
Hasiyet (specificity) ise hassasiyetin (sensitivity) tam tersi olarak hastanın iyi olması halinde aslında ne kadar oranla hastayı sağlıklı olarak teşhis ettiğimizdir.
olarak formüllendirilebilir.
Yukarıdaki bu iki değeri bir örnek üzerinden açıklamaya çalışalım. Diyelim ki, bir hastalık teşhisi sırasında 50 sağlıklı ve 50 hasta denek üzerinde yapılan çalışmalarda, 50 sağlıklı kişinin 45’ini gerçekten sağlıklı ve 5’ini hasta olarak teşhis ediyoruz. Benzer şekilde 50 hasta deneğin ise 40’ını gerçekten hasta ve 10’unu ise yanlışlıkla sağlıklı olarak teşhis ediyor olalım. Bu durumda tabloyu aşağıdaki şekilde doldurabiliriz:
|
Sağlıklı Teşhisi |
Hasta Teşhisi |
Doğru |
45 |
40 |
Yanlış |
10 |
5 |
Sonuç olarak 100 denekten 55’ine sağlıklı teşhisi konulmuş ve 45’ine hasta teşhisi konulmuştur. Bunlardan 45 sağlıklı teşhisi doğru teşhis olup 10 sağlıklı teşhisi hatalıdır. Benzer şekilde 40 hasta teşhisi doğru teşhis olup 5 teşhiste hata yapılmıştır.
Yukarıdaki tabloyu doldurduktan sonra hassasiyet ve hasiyet değerlerini hesaplayalım:
olarak bulunur.
Bu iki değer aslında teşhisin başarısını ölçmek için yeterlidir çünkü %90 oranında sağlıklı denek teşhisinde başarılı ve %80 oranında hasta teşhisinde başarılı olduğumuzu gösterir.
Merhaba, 2. tablo açıklamalarının yanlış olduğunu düşünmekteyim. Şöyle ki :
Sağlık Teşhisi = Pozitif, Hasta Teşhisi = Negatif olarak tanımlamışsınız tablo başlangıcında.
Daha sonra aşağıdaki tanımlamaları vermişssiniz:
True Positive (Doğru Müsbet) = Hasta teşhisi konulup gerçekten hasta olanlar (doğru teşhis)
True Negative (Doğru Menfi) = Hasta teşhisi konulup hata yapılan ve asılnda sağlıklı olanlar
False Positive (Yanlış Müspet) = Sağlıklı teşhisi konulup gerçekten sağlıklı olanlar
False Negative (Yanlış Menfi) = Sağlıklı teşhisi konulup hata yapılan ve aslında hasta olanlar
Bana göre tanımlamalar aşağıdaki şekilde olmalıdır.
TP: Sağlıklı teşhisi konup gerçekten sağlıklı olan
TN: Hasta teşhisi konup gerçekten hasta olan
FP: Sağlıklı teşhisi konup gerçekte hasta olan
FN: Hasta teşhisi konup gerçektes ağlıklı olan
Saygılarımla, iyi çalışmalar