Yazan : Şadi Evren ŞEKER
Bu yazının amacı, fizik ve istatistik konularında sıkça geçen ve çoğu bilgisayar bilimleri konusuna temel teşkil eden Markof Rastgele Alanlarını (Markov Random Field) anlatmaktır.
Esas itibariyle markof rastgele alanları, markof ağının (markov network), bir yönsüz şekil üzerine (undirected graph) uygulanmış halidir.
Markof rastgele alanları, bu anlamda bayes ağlarına (bayesian network) benzetilebilir. Bayes ağlarında, bulunan şekiller (graph) yapısal olarak yönlüdür. Markof rastgele ağları ise yönsüz şekillerden oluşmaktadır. Bununla birlikte, bayes ağlarında gösterilemeyen bazı özellikler markof rastgele ağlarında gösterilebilir. Örneğin markof rastgele ağları dairesel (cyclic) olabilmektedir. Ancak bayes ağları ağaç yapısında olup yönlü ve dairesel olmayan (directed acyclig grapch) özelliği göstermektedir.
Buna karşılık bayes ağları yönlü olmalarından dolayı tümden gelim (reduction) veya tüme varım (induction) gibi yönler belirtebilir. Ancak markof rastgele ağlarında bu imkan yoktur.
Olasılık dağılımının artı olması durumu da özel olarak Gibbs rast gele ağı (gibbs random field) olarak isimlendirilir. Bu anlamda Gibbs rastgele ağları, markof rastgele ağlarının özel bir halidir.
Yapay zeka (artificial intelligence) çalışmaları açısından markof rastgele ağları çeşitli düşük ve orta seviye işleri ifadede kullanılabilir. Örneğin bir problemin parçalara ayrılması, problemin olasılıksal olarak modellenmesi, arama ağaçlarının oluşturulması gibi durumlarda kullanılabilir.
İstatistiksel Tanımı:
İstatistiksel olarak alanın tanımı aşağıdaki şekilde yapılabilir:
G= (D,K) olarak tanımlı bir graf için bir rastgele olay A = ( A D) D ∈ K
olarak tanımlı olsun. (Buradaki D, düğüm(vertex), K, kenar(edge) olarak tanımlanmış olsun).
Yukarıdaki tanıma ilave olarak aşağıdaki markof özelliklerinin bulunması gerekir:
Çifte Markof Özelliği (Pairwise Markov Property): Herhangi iki komşu olmayan olay, koşullu bağımsızlık (conditionally independent) göstermelidir.
Yerel Markof Özelliği (Local Markov Property) : Bir olay, komşularının tamamyla koşullu bağımsız (conditionally independent) olmalıdır.
Genel Markof Özelliği (Global Markov Property) : Olaylardan oluşan iki alt küme için birbiri ile koşullu bağımsız (conditionally independent) olma zorunluluğu vardır.
Örnek:
Yukarıda açıklananları bir örnek markof rastgele alanı tanımlayarak açıklayalım:
Örnğein yukarıdaki şekilde bir alan verilmiş olsun. Bu alanın özellikleri aşağıdaki şekilde yazılabilir:
Görüldüğü üzere markof rastgele alanı, yönsüz olarak tanımlanmıştır ve ilişki içerisinde bulunan düğümler (node) arasındaki olasılık tanımları yukarıdaki olasılık fonksiyonunda ifade edilmiştir. Yukarıdaki bu basit alanı biraz daha ilerletelim ve farklı bir örnek üzerinden konuyu anlatalım:
Yukarıdaki şekilde, örnek bir alan gösterilmiştir. Bu alanda, birden fazla eleman bir hipergraf (hypergraph, ileri şekil) olarak bağlanmıştır. Buna göre üç bağlantı kümesi aşağıdaki şekilde listelenebilir:
K1 = {A,D,C}
K2 = {B,C}
K3 = {B}
Yukarıdaki kümeler için tanımlı olan markof alanının olasılık özelliği aşağıdaki şekilde yazılabilir:
Görüldüğü üzere üç farklı ilişki kümesi için üç farklı fonksiyon tanımı ve her fonksiyon tanımı için ilgili düğümlerin parametre geçirilmesi yeterlidir.
İkili Markof Rastgele Alanları (Pairwise Markov Random Fields)
Markof rastgele alanlarının özel bir hali olan bu alanlarda, sadece ikili ilişkilere veya tekli ilişkilere izin verilir. Buna göre iki grupta öğe bulunduran alanların olasılık fonksiyonlarını aşağıdaki şekilde modellemek mümkündür.
Yukaırdaki gösterimde, g fonksiyonu tekli elemanları, f fonksiyonu ise ikili elemanları ifade etmektedir. Buna göre bütün elemanların (ikili veya tekli) çarpımı, olasılık fonksiyonunu oluşturmaktadır. Burada dikkat edilmesi gereken ilişkisi bulunan elemanların fonksiyon değerlerinin çarıpldığıdır.
Ayrıca dikkat edilmesi gereken bir özellik, markof rastgele alanlarının yönsüz olduğudur. Diğer bir deyişle şayet ikili ilişki (pairwise) bulunuyorsa, bu durumda aşağıdaki eşitlik geçerli olur:
Yani fonksiyonun taınm sırası önemli değildir. Bu özellik aşağıdaki şekilde de yazılaiblir.
Yani fonksiyonlardaki sıranın bir önemi yoktur.