Yazan : Şadi Evren ŞEKER
Öbek ağaçları (dendrogram) latince iki kelimenin birleşimidir. Dendron kelimesi, ağaç anlamına, gramma kelimesi ise çizim anlamına gelmektedir. Çeşitli bilgisayar bilimleri uygulamalarında kullanılırlar. Örneğin hesaplamalı biyoloji (computational biology) konusunda genler arasındaki ilişkileri modellemek için veya veri madenciliği (data mining) konusunda veri grupları arasındaki bilgileri modellemek için kullanılırlar.
Konuyu basit bir örnek üzerinden açıklayalım. Örneğin aşağıda verilen 5 veri grubunun aralarındaki mesafenin öklit mesafesi (euclidean distance) olarak hesaplandığını kabul edelim.
Buna göre A ile B birbirne en yakın, C ile D birbirine en yakın ve E ise hepsine en uzak noktada yerleştirilmiştir. Yukarıdaki bu veri gruplarının öbek ağacını (dendrogram) çizersek aşağıdaki gibi bir şekil elde edilebilir:
Yukarıda görüldüğü üzere birbirine yakın olan gruplar önce öbeklenmiş ve en uzaktaki grup en son öbeklemiştir. Öbekleme işlemi bütün grupları kapsayacak şekilde yakınlığına göre ilişkilendirerek gitmektedir. Bu ilişkiler ikili ilişkiler (binar relation) olarak düşünülmelidir. Yani her yeni öbek, kendinden önceki en fazla iki öbeğin birleşimi olarak düşünülebilir.
Yukarıdaki şekilde aşağıdan yukarıya doğru çizilen ağaç, bazı kaynaklarda tam ters istikamette çizilmiş gösterilmektedir. Bazı kaynaklarda ise aynı ağaç, bağlantı yönleri ters çevrilerek, ikili ağaç (binary tree) şeklinde gösterilmektedir. Bütün gösterimlerdeki amaç, birbirine yakın olan grupları ağaçta daha yakın komşular olarak göstermektir.
Yukarıdaki şekli ayrıca ilişki mesafesi olarak okumak da mümkündür. Örneğin A grubu ile E grubu arasında bir ilişki kurulabilmesi için A grubu önce 2 farklı gruplamaya tabi tutulmalıdır.