Yazan : Şadi Evren ŞEKER

Bu yazının amacı, özellikle sağlık alanında yapılan veri madenciliği çalışmalarında sıkça geçen hassasiyet (sensitivity) ve hasiyet (sepecificity) kavramlarını açıklamaktır. Öncelikle tip 1 ve tip 2 hata değerlerini hatırlatmak için aşağıdaki şekilde bir teşhis neticesini inceleyelim.

Müsbet

Menfi

Doğru

TP (DMü)

TN (DMe)

Yanlış

FP (YMü)

FN (YMe)

Örneğimizde bir hastalık için konulan teşhislerin doğru çıkma ihtimalini inceliyor olursak tabloyu aşağıdaki şekilde yeniden yazmak mümkün olabilir:

Sağlıklı Teşhisi

Hasta Teşhisi

Doğru

TP (DMü)

TN (DMe)

Yanlış

FP (YMü)

FN (YMe)

True Positive (Doğru Müsbet) = Hasta teşhisi konulup gerçekten hasta olanlar (doğru teşhis)

True Negative (Doğru Menfi) = Hasta teşhisi konulup hata yapılan ve asılnda sağlıklı olanlar

False Positive (Yanlış Müspet) = Sağlıklı teşhisi konulup gerçekten sağlıklı olanlar

False Negative (Yanlış Menfi) = Sağlıklı teşhisi konulup hata yapılan ve aslında hasta olanlar

Şimdi yukarıdaki hatırlatmadan sonra yazının konusu olan hassasiyetin (sensitivity) formülünü verebiliriz.

Diğer bir deyişle asılnda hassasiyet koşullu olasılık olarak düşünülebilir ve gerçekten hasta olunması durumunda ne kadar oranla hastalığı doğru teşhis ettiğimizi ölçtüğümüzdür.

Hasiyet (specificity) ise hassasiyetin (sensitivity) tam tersi olarak hastanın iyi olması halinde aslında ne kadar oranla hastayı sağlıklı olarak teşhis ettiğimizdir.

olarak formüllendirilebilir.

Yukarıdaki bu iki değeri bir örnek üzerinden açıklamaya çalışalım. Diyelim ki, bir hastalık teşhisi sırasında 50 sağlıklı ve 50 hasta denek üzerinde yapılan çalışmalarda, 50 sağlıklı kişinin 45’ini gerçekten sağlıklı ve 5’ini hasta olarak teşhis ediyoruz. Benzer şekilde 50 hasta deneğin ise 40’ını gerçekten hasta ve 10’unu ise yanlışlıkla sağlıklı olarak teşhis ediyor olalım. Bu durumda tabloyu aşağıdaki şekilde doldurabiliriz:

Sağlıklı Teşhisi

Hasta Teşhisi

Doğru

45

40

Yanlış

10

5

Sonuç olarak 100 denekten 55’ine sağlıklı teşhisi konulmuş ve 45’ine hasta teşhisi konulmuştur. Bunlardan 45 sağlıklı teşhisi doğru teşhis olup 10 sağlıklı teşhisi hatalıdır. Benzer şekilde 40 hasta teşhisi doğru teşhis olup 5 teşhiste hata yapılmıştır.

Yukarıdaki tabloyu doldurduktan sonra hassasiyet ve hasiyet değerlerini hesaplayalım:

olarak bulunur.

Bu iki değer aslında teşhisin başarısını ölçmek için yeterlidir çünkü %90 oranında sağlıklı denek teşhisinde başarılı ve %80 oranında hasta teşhisinde başarılı olduğumuzu gösterir.


Yorumlar

  1. Burak Aydogan

    Merhaba, 2. tablo açıklamalarının yanlış olduğunu düşünmekteyim. Şöyle ki :
    Sağlık Teşhisi = Pozitif, Hasta Teşhisi = Negatif olarak tanımlamışsınız tablo başlangıcında.

    Daha sonra aşağıdaki tanımlamaları vermişssiniz:
    True Positive (Doğru Müsbet) = Hasta teşhisi konulup gerçekten hasta olanlar (doğru teşhis)
    True Negative (Doğru Menfi) = Hasta teşhisi konulup hata yapılan ve asılnda sağlıklı olanlar
    False Positive (Yanlış Müspet) = Sağlıklı teşhisi konulup gerçekten sağlıklı olanlar
    False Negative (Yanlış Menfi) = Sağlıklı teşhisi konulup hata yapılan ve aslında hasta olanlar

    Bana göre tanımlamalar aşağıdaki şekilde olmalıdır.
    TP: Sağlıklı teşhisi konup gerçekten sağlıklı olan
    TN: Hasta teşhisi konup gerçekten hasta olan
    FP: Sağlıklı teşhisi konup gerçekte hasta olan
    FN: Hasta teşhisi konup gerçektes ağlıklı olan

    Saygılarımla, iyi çalışmalar

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir