Yazan: Şadi Evren ŞEKER
Bu yazının amacı, karar ağaçlarını (decision tree) anlatmaktır. Genelde bir karar varmak için çeşitli adımlardan oluşan sistemlerde bu adımların olasılıksal değerlerini bir çizge (şekil, graph) üzerinde ağaç (tree) kullanarak göstermek için kullanılırlar.
Örneğin piyasada bize avantaj sağlayacak bir fikrimiz olduğunu düşünüyoruz ve bu fikri uygulayıp uygulamamak konusunda kararsızız. Diyelim ki fikrimizin başarı oranını %70 olarak görüyoruz. Ayrıca fikrimizi herhangi bir yatırımcıya satarak 10bin lira gelir elde edeceğimizi tahmin ediyoruz. Ayrıca fikrimizi piyasada uygulamak için 30bin lira sermayeye ihtiyacımız olsun ve başarılı olması halinde 100bin lira gelir elde etme ihtimalimiz olsun. Bu senaryoda nasıl bir karar vermemiz gerekir?
Aşağıda, bu durumu modelleyen bir karar ağacı verilmiştir.
Yukarıdaki şekilde görüldüğü üzere iki karar vermemiz söz konusu, fikrimizi ya bir firmaya satacağız ya da uygulayacağız. Ayrıca uygularsak yine iki ihtimal bulunuyor, fikrimiz ya başarılı olur ya da olmaz. Yukarıdaki bu ağaca ihtimallerin yerleştirildiği durum aşağıda gösterilmiştir:
Ayrıca fikrimizin tutması durumundaki kazancımızı ve başarısızlık durumundaki kaybımızı da ağaca ekleyebiliriz.
Son olarak ağaçta bulunan durumları ilk karar anına kadar taşımamız mümkün. Örneğin %70 ihtimalle fikrin tutması halinde 100,000 lira kazancımız olması durumu, aslında piyasaya uygulama fikrinin:
100,000 x %70 + 0 x %30
olarak formüllendirilebilecek bir gelir olduğunu gösterir. Ayrıca bu fikrin uygulanmasının 30,000 lira maliyeti olduğunu düşünürsek formülü aşağıdaki şekilde tamamlayabiliriz:
100,000 x %70 + 0 x %30 – 30,000
Sonuç olarak fikri uygulamanın bize tahmini kazancı 40,000 olarak hesaplanır. Dolayısıyla başlangıç adımındaki karar anında, fikri uygularsak riskler hesaplandıktan sonra 40,000 lira gelir elde ederken fikrimizi sattığımızda 10,000 lira gelir elde etmiş olacağız. Bu açıdan fikri uygulamaya geçirmek daha mantıklı görülmektedir.
Ayrıca firmanın fikri uygulama durumundaki gelirini de hesaplayabiliriz:
Ağacın son durumundaki ihtimaller hesaplandığında, firmanın da fikrimizi satın alması halinde 40,000 lira gelir elde edeceğini hesaplayabiliriz. Ayrıca firma fikrimizi satın aldığı için ilave olarak 10,000 lira ödeyeceğine göre firmanın bu fikri satın alıp uygulaması durumunda tahmini olarak 30,000 lira kar elde etmesi beklenir.
hiyerarşik veritabanları ile ilgili bir yazı yayınlamanızı rica ederim. örneğin ibm ims bankalarda halen yaygın olarak kullanılmakta ancak konuyka ilgili pek türkçe kaynak bulunmuyor. teşekkürler.
Hocam Merhabalar,
Microsoft Decision Trees algoritmasında kesikli ve sürekli değişkenlerin olduğu bir veri setinde karar ağacı oluştururken sürekli değişkenlerde dallandırmada nasıl bir mantık var. Regresyon mu kullanılmaktadır?
Teşekkürler
Syg.
Discretization kullanır. Yani veriyi önce discrete hale getirir. Bununla ilgili çok sayıda yazı var ancak ben de bir ara nasıl çalıştığını sitede yayınlamaya çalışırım.
Başarılar
Merhaba Hocam C4.5 da sayı değerlerine belirlenen eşik değerlerini genel olarak nasıl belirliyoruz.