Sınıflandırma (Classification)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar bilimleri ve iş zekası (business intelligence) gibi disiplinlerin ortak çalışma alanlarından olan veri madenciliği (data mining) konusunda kullanılan metotlardan birisi olan sınıflandırma (classification) kavramını açıklamaktır. Sınıflandırma kavramı, basitçe bir veri kümesi…
K Fold Cross Validation (K Katlamalı Çarpraz Doğrulama)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde k-fold cross validation (k katlamalı çarpraz doğrulama) yöntemi olarak geçen yöntemi anlatmaktır. Veri madenciliği çalışmalarında, uygulanan yöntemin başarınının sınanması için, veri kümesini eğitim ve test kümeleri olarak ayırılmaktadır. Bu ayırma işlemi…
Weka Knowledge Flow
Weka Knowledge Flow Yazan : Şadi Evren ŞEKER Bu yazının amacı, veri madenciliği çalışmalarında sıkça kullanılan araçlardan birisi olan WEKA yazılımının “knowledge flow environment” ekranını basit bir örnek üzerinden anlatmaktır. Knowledge flow ekranının amacı, Weka içerisinde bulunan çok sayıdaki kütüphaneye…
Naive Bayes ile Metin Sınıflandırılması
Yazan : Şadi Evren ŞEKER Bu yazının amacı, naif bayes sınıflandırıcısının (naive bayes) metinler üzerinde nasıl kullanıldığını açıklamaktır. Oldukça basit ve etkili bir metin madenciliği yöntemi olan naif bayes sınıflandırıcısını anlamak için bir örnek kullanalım. Örneğin iki metin aşağıdaki şekilde…
Naif Bayes Sınıflandırıcısı (Naive Bayes)
Naif Bayes Sınıflandırıcısı (Naive Bayes) Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde naif Bayes (Naive Bayes) olarak bilinen algoritmanın, sınıflandırma (classification) için kullanılma şeklini açıklamaktır. Herhangi bir sınıflandırma probleminde olduğu gibi, amacımız birden fazla özelliği taşıyan bir yöney…
Entailment (İcap)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle mantık konusunda sıkça geçen icab (entailment) konusunu açıklamaktır. Türkçeye mantıksal gerektirme, olarak da çevrilebilecek olan icab konusu mantıksal iki kaziyenin (önerme, predicate) arasında kurulan ikili bir işlemdir (operator). Basitçe bir kaziyenin…
Linear Regression (Doğrusal İlkelleme)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, doğrusal ilkelleme yöntemini (linear regression) açıklamaktır. Basitçe bir veri kümesinin iki boyutlu bir uzayda dağılıdığını düşünelim. Veri kümemizdeki değerlerin iki boyutlu uzayda, yukarıdaki şekilde gösterildiğini kabul edelim. Şimdi doğrusal ilkelleme ile amaçlanan…
Imputation (Töhmet)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar bilimlerinde özellikle veri madenciliği (data mining) konularında eksik verilerle karşılaşılması halinde bir çözüm olarak bu eksik verilerin töhmet edilmesi (yerine uygun verilerin üretilmesi, imputation) yöntemini açıklamaktır. Töhmet, sözlükte olmayan birşeyin yüklenmesi…
Sensitivity Specificity (Hassasisyet ve Hasiyet)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle sağlık alanında yapılan veri madenciliği çalışmalarında sıkça geçen hassasiyet (sensitivity) ve hasiyet (sepecificity) kavramlarını açıklamaktır. Öncelikle tip 1 ve tip 2 hata değerlerini hatırlatmak için aşağıdaki şekilde bir teşhis neticesini inceleyelim….
Olasılık ölçüm fonksiyonu (Probability measurement function)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, olasılık ölçüm fonksiyonunu (probability measure function) açıklamaktır. Basitçe bir kümedeki elemanların sayma kümesine indirgenmesi aslında sayılabilirliğin (cardinality, countability) bir özelliğidir. Bu kümenin toplam eleman sayısına bölünmesi ise olasılık ölçüm fonksiyonunu verir. Örneğin…












