Yazan: Şadi Evren ŞEKER

Veri akış madenciliği (data stream mining) veri madenciliğinin, özel bir uygulaması olarak düşünülebilir. Bu yöntem basitçe akan bir verinin (streaming data) üzerinde çalışmakta ve bu veriden bir sonuç çıkararak bu veriyi işlemektedir. Örneğin sürekli yeni verilerin geldiği bir ortamda verinin sınıflandırılması (classification) bir akış madenciliği problemi olabilir.

Akış madenciliğini diğer veri madenciliği yöntemlerinden ayıran en önemli özelliği ise, sınıfların sabit olmamasıdır. Örneğin verinin sürekli aktığı bir çağrı merkezini düşünelim. Gün içerisinde sürekli olarak yeni telefon aramaları bu çağrı merkezine geliyor olsun. Çağrı merkezi yöneticisi, müşterilere daha iyi hizmet verebilmek için arayan kişileri sınıflandırmak istiyor olsun. Sınıflandırma işlemi başlangıçta belirli sayıda sınıf kabulüyle gelen çağrıları sınıflandırabilir ancak zaman içerisinde ulaşan yeni çağrılardan yeni bir sınıf türetilmesi gerektiğini bulmak, akışın işlenmesi ve bu akışın yeni ihtiyaçlarının ortaya çıkarılması ile olabilir. İşte tam bu noktada akış madenciliği devreye girer.

Ayrıca gelen yeni verilere ve yeni türetilen sınıflara göre, eski verilerin sürekli işlem altında tutulması ve bu sayede geçmişte sınıflanıdrılan verilerin yeniden sınıflandırılması, akış madenciliğinin güncel konularındandır (içerik kayması , concept drift).

Hatta daha önceden öğrenilen sınıfların içeriğinin kayması (concept shift / concept drift) veya genişlemesi veya daralması söz konusu olabilir.

Akış madenciliğinde, genelde kullanılan verinin az bir kısmı etiketlenmiş olduğundan üzerinde yarı gözetimli (semi supervised) yöntemler de denenmektedir. Bütün bunlara paralel olarak f aal öğrenme (active learning) yöntemleri kullanılarak kullanıcı etkileşiminden de faydalanılabilir.

Yukarıdaki şekilde, probleme zamansal mantık (temporal logic) eklenmiş hali gösterilmektedir. Buna göre etiketleme (labelling) işlemi için ayrı bir zaman (Tl) ve süreç, sınıflandırma işlemi için ayrı bir zaman ve süreç (Tc) geçmektedir.

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir