Yazan : Şadi Evren ŞEKER
Literatürde İngilizce olarak co-training veya co-learning olarak geçen kavramdır. Türkçede eş-eğitim veya eş-öğrenim şeklinde karşılık bulmak mümkündür. Kavram aslı itibariyle bir makine öğrenmesi (machine learning) algoritmasını ifade eder ve genel olarak metin madenciliği (text mining) ve daha özel olarak da arama motorları(search engine) için yaygın kullanımı bulunmaktadır.
Algoritma
Algoritma, yarı gözetimli (semi-supervised) öğrenme tekniğini kullanır ve çalışması için iki adet veri kümesine ihtiyaç duyar. Bu iki veri kümesinin ortak örneklerden elde edilmiş olması ve farklı özellik çıkarım (feature extraction) yöntemleri ile elde edilmiş olması genelde en sık kullanılan durumdur. Diğer bir deyişle bu iki küme birbirine koşullu bağlıdır (conditionally dependent). Buradaki kritik nokta, her iki kümenin de istenilen sonuca ulaşmak için yeterli veri kümeleri olmasıdır. Yani bir veri kümesinin ikiye bölünmesi veya birbirine tamamen bağlı iki küme gibi durumlarda eş-eğitimden bahsetmek hata olur.
Eş-eğitim algoritması, öncelikle her iki küme için ayrı ayrı makine öğrenmesi algoritmalarını çalıştırır. Ardından her iki kümeden öğrenilen bilgilerin eşlenmesi aşaması başlar.
Bu durum aşağıdaki şekilde görselleştirilebilir:
Yukarıda da gösterildiği üzere veri kümeleri üzerinde bağımsız çalışan makine öğrenme algoritmalarının en üst seviyede birleştirilmesi söz konusudur. Bu sayede başarı oranının arttırılması hedeflenir.
Kullanımı
Eş-eğitim genel olarak metin madenciliği ve arama motorlarının tasarımında kullanılmaktadır. Örneğin bir web sitesinin içeriğini öğrenmek istiyor olalım. Bu web sayfasındaki metin içeriği bir veri kümesi ve web sayfasına yönlendirme yapan diğer sayfalardaki bağlantı metinleri (hyper-links) ise ikinci veri kümesi olarak kullanılabilir. Bu durumda iki ayrı veri kümesi üzerinde çalışan makine öğrenme algoritmaları (ki bu örnekte daha özel olarak metin madenciliği algoritmalarından bahsedebiliriz) belirli sonuçlar elde ettikten sonra bu sonuçlar ortak bir makine öğrenme algoritması ile eşleştirilir.
Eş-Eğitim Çeşitleri
Eş-eğitim için değişik yöntemler kullanılabilir. Bunlardan 3 tanesi aşağıda verilmiştir.
- Goldman ve Zhou yöntemi: Bu yöntemde, bütün özellik kümeleri iki farklı makine öğrenme algoritmasına verilir ve sonuçları karşılaştırılır.
- Zhou ve Li yöntemi: Bu yöntemde 3 farklı makine öğrenme algoritması kullanılır. Şayet bu algoritmalardan 2 tanesi bir çözümde anlaşırsa, bu durum etiketlenerek 3. algoritmaya öğretilir.
- Jafar Tanha ve arkadaşları yöntemi: Uyuşmazlık temelli eş öğrenmedir. Şayet 2 makine öğrenmesi yöntemi bir sonuçta uzlaşamazsa, 3. yöntem devreye girerek sonucu belirler.