Yazan : Şadi Evren ŞEKER
Bu yazının amacı, özellikle istatistik konusunda geçen tip 1 ve tip 2 hataları (type 1 and type 2 errors) açıklamaktır. Konu aslında, bir tahmin ve gerçekleşen durum arasında yaşanmaktadır ve istatistikte bulunan null hypothesis (yokluk hipotezi) üzerine kuruludur.
Yazının istatistik ile ilgili kısmına geçmeden önce biraz felsefe bilgimizi tazeleyerek yokluk hipotezinden bahsetmek istiyorum.
Basitçe olmayana ergi (proof by contradiction, burhan-ı mütenakis) yapısında bir ispat yöntemidir. İspatlanmak istenen istatistiksel olgu bir hipotez olarak ortaya atılır ve buna alternatif hipotez (alterantive hypothesis) ismi verilir. Ardından bu alternatif hipotezin tam tersini gösteren ve yokluğu ispat edilmesi amaçlanan yokluk hipotezi (null hypothesis) konulur.
Bu durumu bir örnek üzerinden açıklayalım. Örneğin veri tabanı teorisinde sıkça verilen ve üretilebilir veri konusunda geçen iki alanı ele alalım. Diyelim ki bir kişinin yaşı ve doğum günü arasında ilişki olduğunu, bu iki değerin birbirine bağlı olduğunu iddia ediyoruz. Bu bizim alternatif hipotezimiz olmuş oluyor.
Bu durumda ilişki olmadığını göstermek de yokluk hipotezimiz olur.
Bu iki hipotezi aşağıdaki şekilde de gösterebiliriz:
Alternatif Hipotez:
Burada ifade edilen değer, doğum günleri ile yaş arasında doğrusal bir bağlantı olduğudur (linear, affine). Şimdi yokluk hipotezimizi yazalım (null hypothesis)
Yani iki artış arasında bir bağlantı olmaması.
Ardından yapılan çok sayıdaki deneme ile görüyorsunuz ki yaş arttıkça doğum günü kutlamalarının sayısı artıyor veya doğum günü kutlamalarının sayısı arttıkça yaş ilerliyor.
Ardından diyebiliriz ki yokluk hipotezi yoktur (nullify)
Şayet yokluk hipotezinin yok olduğunu gösterebilirsek (istatistiksel olarak) o zaman alternatif hipotezimizin doğru olduğunu söyleyebiliriz. Yani doğum günü kutlaması ve yaş arasında pozitif bağlantı vardır denilebilir.
Bu konu aslında felsefede pek çok konuyu beraberinde getirmektedir. Örneğin Karl Popper’ın iddialarından birisi gerçekte alternatif ve yokulk hipotezlerinin birbirinin tersi olmasının gösterilemesi zor olduğudur.
Ancak biz konumuzla ilgili olan bu kısmı ile iktifa edeceğiz. Şimdi gelelim tip 1 ve tip 2 hata miktarlarına.
Öncelikle rastgele bir süreçten bahsediyoruz demektir (random process) ve bu süreçte beklenen ve gerçekleşen olaylar bulunuyor demektir. Aslında tam olarak yokluk hipotezimizin yok olduğunu ispatlamaya çalıştığımızı düşünelim:
Beklenen (Expected) | |||
Gerçekleşen (Measured) | Müsbet | Menfi | |
Doğru | TP (DMü) | TN (DMe) | |
Yanlış | FP (YMü) | FN (YMe) |
Beklentimiz müspet (pozitif) veya menfi (negatif) yönde olabilir. Beklentimize bağlı olarak gerçekleşen olay (veya ölçümlerimiz) de doğru veya yanlış olabilir.
Bu durumu bir örnek üzerinden açıklayalım. Örneğin bir e-posta koruma sistemi yazıyoruz ve sistemdeki izinsiz gönderileri (spam mail) tespit etmek istiyoruz. Yazılımımız bu gönderileri tespit edip engelleyecek. Yazılımı hazırlayıp bir süre test ettikten sonra aşağıdaki gibi bir tablo hazırlanabilir.
İstenmeyen Tahmini | |||
Gerçekten İstenmeyen | İstenmeyen | İstenen | |
Doğru | TP (DMü) | TN (DMe) | |
Yanlış | FP (YMü) | FN (YMe) |
Buna göre örneğin bizim istenmeyen posta olarak sınıflandırdığımız ve gerçekte istenen postalar TP (True Positive), bizim istenen olarak sınıflandırdığımız ancak gerçekte istenmeyen olanlar TN (True Negative), bizim istenen diye sınıflandırdığımız ancak gerçekte istenmeyen olanlar FP (False Positive) ve son olarak bizim istenen diye sınıflandırdığımız ancak gerçekte istenmeyen olanlar da FN (False Negative) olarka isimlendirilebilir.
Bunlardan FN (False Negative) Tip 2 hata oraın (Type 2 error rate) ve FP (False Positive) ise Tip 1 hata (Type 1 error rate) olarak isimlendirilir.
Burada hata var hocam,
ilk olarak aşağıdaki ifade var :
bizim istenmeyen posta olarak sınıflandırdığımız ve gerçekte istenen postalar TP (True Positive), bizim istenen olarak sınıflandırdığımız ancak gerçekte istenmeyen olanlar TN (True Negative). Burada iki durum da değişmiş istenmeyen-gerçekte istenen ve istenen-gerçekte istenmeyen ama ikisi de True denmiş.
İkinci olarak aşğıdaki ifade :
bizim istenen diye sınıflandırdığımız ancak gerçekte istenmeyen olanlar FP (False Positive) ve son olarak bizim istenen diye sınıflandırdığımız ancak gerçekte istenmeyen olanlar da FN (False Negative)
Burada FP ve FN için aynı tanımlamaları vermişsiniz, kafa karıştırıcı bir örnek olmuş maalesef.