Yazan :Şadi Evren ŞEKER

Bu yazının amacı, istatistik ve veri madenciliği gibi konularda sıkça geçen ihtimaliyet (likelihood) kavramını açıklamaktır. Bu kavram basitçe, belirli bir zamana kadar yapılan gözlemlerin kullanılması ile, bu zamandan sonraki durumun tahmin edilmesi anlamındadır. Genellikle, geçmiş ve gelecek arasında bağlantı bir fonksiyon cinsinden bulunur ve buna ihtimaliyet fonksiyonu (likelihood function) ismi verilir.

Örneğin bir yoldaki trafik yoğunluğunu bir ay süreyle gözlemler ve sonra ertesi günkü yoğunluğu bize vermesi için bir fonksiyon çıkarırsak buna ihtimaliyet fonksiyonu (likelihood function) denilebilir.

Örnek:

Örneğin bir üretim bandındaki ürünleri inceleyerek kötü üretilmiş ürünleri tespit ediyor olalım. Örnek olarak aldığımız 10 ürünün 5’inin kötü üretim olduğunu kabul edelim. Bu durumda bundan sonraki ürünlerin kötü üretilme oranı sorulursa %50 ihtimalle kötü üretileceğini söyleyebiliriz.

Şimdi bu durumu formüllendirelim:

Yukarıdaki formülümüzde, n adet ürün için K değeri seçtiğimiz malların kötü olması oranını ifade ediyor olsun. Buna göre n farklı elemanın içerisinden K kötü elemanın seçilmesi n’in K’lı kombinasyonu C(n,K) olacağı için denklemin ilk kısmı bu formülden oluşmaktadır. Devamında ise gerçekte olan bozuk malların arasından seçilen K ürünün bozuk olması durumunu, 1-pi değeri ise bozuk olmaması durumunun doğru bulunmasını göstermektedir. Bu durumda yukarıdaki olasılık fonksiyonu, tam olarak hatalı üretim tahminini yansıtmaktadır.

Elbette buradaki problem, gerçekte hatalı malları ve gerçekteki toplam ürünü biliyor olmamız, ve ancak bunları bildikten sonra seçtiğimiz ürünlerin hataıl olması durumuna göre hesap yapıyor olmasıdır.

Azami İhtimaliyet Fonksiyonu (Maximal Likelihood Function)

İhtimaliyet hesabının dayandığı bir nokta da azami durumu bulmaktır. Literatürde Maximal Likelihood Estimation (azami ihtimaliyet tahmini) olarak da geçmektedir ve bazı kaynaklarda kısaca MLE olarak görülebilir.

MLE yöntemi, kısaca bir tahmin yaparken, öncelikle tahmin ortamındaki (population) ortalama değer ve varyansı (mean and variance) hesaplayarak bu değerlere göre bir istatistiksel model önerir. Bu önerilen modele göre de sistemin istenildiği gibi sorgulanmasına izin verir.

Örneğin bir çağrı merkezine gelen çağrıların yoğunluğunu tahmin etmek istiyoruz. Diyelim ki gün içerisinde on ayrı zamanda beşer dakikalık ölçüm yaparak ölçtüğümüz sürede kaç çağrı geldiğini hesapladık. Bu ölçümler sonucunda ortalama çağrı (zamandan bağımsız olarak) ve çağrıların varynası (variance veya st andart sapması (standard devaition)) hesaplandı. Bu hesaplar sonucunda, daha önceden biliyor olduğumuz dağılımlar ile karşılaştırıyoruz. Buna göre dağılımın poisson dağılımı olduğunu buluyouruz. Bu dağılıma göre ölçüm yaptığımız zamanların dışında kalan zamanlarda da çağrıların nasıl bir yoğunlukta olacağını tahmin etmemiz artık mümkündür çünkü dağılım modeli bize bir eğri şeklinde çeşitli zamanlardaki durumu gösteren bir model sunar.

Elbette hemen akla gelebilecek bir durum, MLE yaklaşımının her zaman işe yaramayacağıdır. Bunun sebebi bazı örneklemelerin herhangi bir dağılımda karşılığının olmaması bazılarının ise bir dağılımla karşılanamayacak kadar kararsız olmasıdır. Bu tip durumlarda MLE benzeri daha karmaşık modellemeler kullanılabilmektedir ve bazı kaynaklar bu modelleri de MLE içerisine sokmaktadır ancak genel anlamıyla bu tip durumlarda tahmin yapılamaz (no maximal likelihood estimator) demek yerinde olur.

MLE’nin hesaplanmasında genel bir formül kullanılması mümkündür. Herhangi bir XXX dağılım için (iid, independent and identically distributed), kümenin öncelikle bağımsız yoğunluk fonksiyonu bulunmalıdır (joint density function). Bu değer aslında verilen bir theta değeri için koşullu olasılık formülüyle aşağıdaki şekilde hesaplanabilir:

Burada x1’den xn’e kadar olan ölçümler koşullu olarak verilmiştir. Aslında işlem tersinden de düşünülebilir ve verilen bir theta değeri için x1’den xn’e kadar olan gözlemler yerine, x1’den xn’e kadar olan gözlemler sabit tutulmak şartıyla acaba thetanın değeri nedir diye sorgulanabilir.

Bu sorgunun cevabı da zaten ihtimaliyet fonksiyonu olur ve aşağıdaki şekilde yazılır:

Burada kullanılan L fonksiyonuna kısaca ihtimaliyet fonksiyonu (ingilizcedeki Likelihood kelimesinin baş harfi) ismi verilir ve bir önceki aşamada yazılan formülle birebir aynıdır (tek farkı çarpmanın kapalı şekilde yazılmasıdır).

Hazır buraya kadar formülümüzü getirmişken, sık kullanılan bir terim olan log-likelihood terimini de açıklayalım. Bu terim basitçe yukarıdaki ifadenin logaritmasının alınmış halidir:

Ayırca, şayet yukarıdaki terimi n gözlem için yaptığımızı hatırlar ve terimi n’e bölerek ortalama almak istersek (ki artık toplam sembolüne geçtiğimiz için bunu yapabiliriz aksi halde n’inci dereceden kökünü almamız gerekecekti):

Ortalama ihtimaliyet değerini yukarıdaki şekilde özel bir gösterimle ifade etmemiz artık mümkündür. Burada kullanılan özel l sembolü, aslında sistemin ihtimaliyeti yerine sadece bir örneğin ihtimaliyeti üzerinde durmaktadır. Yani aslında ortalama değer alındığında artık tek bir gözlemden bahsedilmesi mümkündür.

Şimdi buraya kadar anlattıklarımızın azami ihtimaliyet tahmini (MLE) ile ilgisi olmakla beraber tam olarak MLE kavramını açıklamamaka. Adı üzerinde azami ihtimaliyet değerine bakmak istiyoruz. O halde amacımız yukarıda bulduğumuz bu özel l değerinin (tek bir gözlem) en yüksek olduğu durumu bulmaktır. Yani şayet ihtimaliyet azami değerine ulaşırsa biz de hedefimize ulaşmış oluruz.

Yukarıdkai son ifademizde kullanılan ve üzerinde artık şapka bulunan theta değeri, bütün modelin en yüksek benzetime sahip olmasını hedeflemektedir. Burada amaç, bütün theta değerleri için sistemin azami ihtimaliyetini (benzetimini) veren durumu bulmaktır, ki bu da eşitliğin sağ tarafında ifade edilmiştir.

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir