Weka Knowledge Flow
Weka Knowledge Flow Yazan : Şadi Evren ŞEKER Bu yazının amacı, veri madenciliği çalışmalarında sıkça kullanılan araçlardan birisi olan WEKA yazılımının “knowledge flow environment” ekranını basit bir örnek üzerinden anlatmaktır. Knowledge flow ekranının amacı, Weka içerisinde bulunan çok sayıdaki kütüphaneye…
Naive Bayes ile Metin Sınıflandırılması
Yazan : Şadi Evren ŞEKER Bu yazının amacı, naif bayes sınıflandırıcısının (naive bayes) metinler üzerinde nasıl kullanıldığını açıklamaktır. Oldukça basit ve etkili bir metin madenciliği yöntemi olan naif bayes sınıflandırıcısını anlamak için bir örnek kullanalım. Örneğin iki metin aşağıdaki şekilde…
Naif Bayes Sınıflandırıcısı (Naive Bayes)
Naif Bayes Sınıflandırıcısı (Naive Bayes) Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde naif Bayes (Naive Bayes) olarak bilinen algoritmanın, sınıflandırma (classification) için kullanılma şeklini açıklamaktır. Herhangi bir sınıflandırma probleminde olduğu gibi, amacımız birden fazla özelliği taşıyan bir yöney…
Entailment (İcap)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle mantık konusunda sıkça geçen icab (entailment) konusunu açıklamaktır. Türkçeye mantıksal gerektirme, olarak da çevrilebilecek olan icab konusu mantıksal iki kaziyenin (önerme, predicate) arasında kurulan ikili bir işlemdir (operator). Basitçe bir kaziyenin…
Linear Regression (Doğrusal İlkelleme)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, doğrusal ilkelleme yöntemini (linear regression) açıklamaktır. Basitçe bir veri kümesinin iki boyutlu bir uzayda dağılıdığını düşünelim. Veri kümemizdeki değerlerin iki boyutlu uzayda, yukarıdaki şekilde gösterildiğini kabul edelim. Şimdi doğrusal ilkelleme ile amaçlanan…
Imputation (Töhmet)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar bilimlerinde özellikle veri madenciliği (data mining) konularında eksik verilerle karşılaşılması halinde bir çözüm olarak bu eksik verilerin töhmet edilmesi (yerine uygun verilerin üretilmesi, imputation) yöntemini açıklamaktır. Töhmet, sözlükte olmayan birşeyin yüklenmesi…
Sensitivity Specificity (Hassasisyet ve Hasiyet)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle sağlık alanında yapılan veri madenciliği çalışmalarında sıkça geçen hassasiyet (sensitivity) ve hasiyet (sepecificity) kavramlarını açıklamaktır. Öncelikle tip 1 ve tip 2 hata değerlerini hatırlatmak için aşağıdaki şekilde bir teşhis neticesini inceleyelim….
Olasılık ölçüm fonksiyonu (Probability measurement function)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, olasılık ölçüm fonksiyonunu (probability measure function) açıklamaktır. Basitçe bir kümedeki elemanların sayma kümesine indirgenmesi aslında sayılabilirliğin (cardinality, countability) bir özelliğidir. Bu kümenin toplam eleman sayısına bölünmesi ise olasılık ölçüm fonksiyonunu verir. Örneğin…
Digraph ve Trigraphs
Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar programlama dillerinde kullanılan digraph ve trigraph kavramlarını açıklamaktır. Basitçe bir programlama dilinde çeşitli sebeplerden dolayı bazı karakterlerin yazılması mümkün olmadığında digraph veya trigraph ismi verilen ve arka arkaya gelen 2 veya…
Expected Value (Beklenen değer)
Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle istatistik ve olasılık konularında sıkça geçen beklenen değer (expected value) kavramını açıklamaktır. Basitçe bir fonksiyonun (veya olayın) beklenen değeri aşağıdaki şekilde yazılabilir: Buradaki E gösterimi ingilizcedeki Expectation kavramının baş harfidir ve…












