Yazan : Şadi Evren ŞEKER

Başta istatistik olmak üzere, aralarında bilgisayar bilimlerinin de bulunduğu pek çok alanda kullanılan bir mesafe ölçüm sistemidir. Diğer ölçüm sistemlerinden en belirgin farkı, mesafe ayırımını elipsel bir düzlem üzerinde yapmasıdır. Basit bir elipsi ele alırsak:

Elipsin x eksenindeki genişliği, y eksenindeki boyuna göre daha kısadır. Bu durumda elips üzerinde dağılmış olan noktaların da aralarındaki mesafe göreceli olarak daha farklı değerlendirilmelidir.

Örneğin yukarıdaki şekilde verilen a ve b uzaklıkları arasındaki öklit mesafesi (euclidean distance) aynı olmasına karşılık mahalanobis mesafesi farklı olmaktadır. Bunun sebebi elipsin boyu ve eni arasındaki boyut farkıdır.

Buradaki en ve boy farkını iki stokastik sürecin kovaryansı (covariance) olarak düşünmek de mümkündür. Örneğin bir şirketteki çalışanların maaşları ve yaşları iki boyutlu uzayda gösterilmek istensin. Bu durumda yaşlar arasındaki mesafe ile (örneğin 5 yaş fark olması durumu) maaşlar arasındaki fark (örneğin 500 lira fark olması durumu) aynı cinsten değildir. Örnekte görüldüğü üzere, maaşlar çok daha yüksek değerlerle mesafe belirtmektedir.

Mahalanobis, bu mesafe farkını çok değişkenli bir vektör için, aşağıdaki şekilde tanımlar:

şeklinde verilen n adet değişkenden oluşan bir vektörün ortalama değerleri (mean) için gösterimi kullanılıyor olsun. Ayrıca kovaryans matrisi olakara (covariance matrix) S gösterimi kullanılıyor olsun. Bu durumda mahalanobis mesafesi aşağıdaki şekilde hesaplanır:

Buna göre mahalanobis mesafesi, değer vektörü ile ortalamaların farkının, kovaryans matrisinin tersi ve yine değer vektörü ile ortalamaların farkının tersyüzünün (transpose) çarpımlarının karekökü olarak hesaplanır. Bu durum ise aşağıdaki formül ile özetlenebilir:

Yukarıdaki formülü iki örnek için hesaplayacak olursak (örneğin yukarıdaki elips çiziminde bulunan iki değeri düşünelim):

Ayrıca kovaryans matrisinin köşegen matrisi olması halinde(diagonal matrix), formül aşağıdaki şekilde sadeleştirilebilir:

 

Ayrıca mahalanobis mesafesinin, diğer mesafeler ile benzerliğinin anlaşılması açısından, aşağıdaki şekil açıklayıcı olacaktır:

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir