Genetik Programlama (Genetic Programming)

Yazan : Şadi Evren ŞEKER Genetik programlama, yapay zeka çalışmaları altında kabul edilebilecek ve doğal süreçlerin ve mutasyon gibi genetik fonksiyonların bilgisayar problemlerine uygulanması ile sonuç elde etmeyi hedefleyen yaklaşımın adıdır. Belirli bir hedef fonksiyonun sonuca ulaşması için bilgisayar programlarının nasıl çalışması gerektiğini bulmayı hedefleyen makine öğrenmesi (machine learning) yaklaşımıdır denilebilir. Genetik algoritmaların (genetic algorithms) […]

Devam

Jensen Shannon Mesafesi (Jensen-Shannon Divergence)

Yazan : Şadi Evren ŞEKER iki olasılık dağılımı arasındaki mesafeyi ölçmek için kullanılan yöntemlerden birisidir. Literatürde “bilgi çapı” (information radius , kısaca iRad ) veya ortalamaya olan toplam uzaklık (total divergence to average) olarak da geçmektedir. Tanımı itibariyle Kullback Leibler Uzaklığının (kullback-leibler divergence) simetrik hali olarak düşünülebilir. Yani kullback leibler mesafesinde iki olasılık dağılımı olan […]

Devam

Kullback Leibler Uzaklığı (kullback-leibler divergence)

Yazan : Şadi Evren ŞEKER Olasılık teorisi ve bilgi teorisinde (information theory) geçen ve iki olasılık dağılımı arasındaki ilişkiyi (uzaklığı) formüllendiren yöntemin ismidir. Tanımı itibariyle, bilgi kazanımı (information gain) veya entropi kavramlarına yakındır ancak formüllendirmesi uzaklık (mesafe) değerinden sonuç döndürür. Literatürde mesafe anlamına gelen İngilizce “distance” kelimesinin ilk harfi olan D ile gösterilir ve DKL […]

Devam

Turing Testi

Yazan : Şadi Evren ŞEKER Bu yazının amacı, yapay zeka (artificial intelligence) konusunun temellerini oluşturan bir test kavramından bahsetmektir. Allen Turing tarafından ortaya atılan bir teste göre, bir bilgisayarın, bir insan gibi davranabilmesinin tanımını yapılmıştır. Yani, yapay zeka çalışmalarının hedeflerinden birisi, bir gün insan gibi çalışan bir bilgisayar yapmak olarak görülürse, bu durumda bir bilgisayarın, […]

Devam

Sınıflandırma (Classification)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar bilimleri ve iş zekası (business intelligence) gibi disiplinlerin ortak çalışma alanlarından olan veri madenciliği (data mining) konusunda kullanılan metotlardan birisi olan sınıflandırma (classification) kavramını açıklamaktır. Sınıflandırma kavramı, basitçe bir veri kümesi (data set) üzerinde tanımlı olan çeşitli sınıflar arasında veriyi dağıtmaktır. Sınıflandırma algoritmaları, verilen eğitim kümesinden […]

Devam

K Fold Cross Validation (K Katlamalı Çarpraz Doğrulama)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde k-fold cross validation (k katlamalı çarpraz doğrulama) yöntemi olarak geçen yöntemi anlatmaktır. Veri madenciliği çalışmalarında, uygulanan yöntemin başarınının sınanması için, veri kümesini eğitim ve test kümeleri olarak ayırılmaktadır. Bu ayırma işlemi çeşitli şekillerde yapılabilir. Örneğin veri kümesinin %66’lık bir kısımını eğitim %33’lük bir kısmını ise test […]

Devam

Naive Bayes ile Metin Sınıflandırılması

Yazan : Şadi Evren ŞEKER Bu yazının amacı, naif bayes sınıflandırıcısının (naive bayes) metinler üzerinde nasıl kullanıldığını açıklamaktır. Oldukça basit ve etkili bir metin madenciliği yöntemi olan naif bayes sınıflandırıcısını anlamak için bir örnek kullanalım. Örneğin iki metin aşağıdaki şekilde verilmiş olsun: metin 1 : java bazı bilgisayar mühendisliği bölümlerinde eğitimi verilen bir programlama dilidir. […]

Devam

Naif Bayes Sınıflandırıcısı (Naive Bayes)

Naif Bayes Sınıflandırıcısı (Naive Bayes) Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde naif Bayes (Naive Bayes) olarak bilinen algoritmanın, sınıflandırma (classification) için kullanılma şeklini açıklamaktır. Herhangi bir sınıflandırma probleminde olduğu gibi, amacımız birden fazla özelliği taşıyan bir yöney (vektör) kullanarak verilen bilgilerden bir eğitim oluşturmak ve bu eğitim neticesinde gelen yeni verileri doğru […]

Devam

C4.5 Ağacı (C4.5 Tree)

C4.5 Ağacı (C4.5 Tree) Yazan : Şadi Evren ŞEKER Bu yazının amacı, karar ağaçlarına (decision tree) bir örnek olaran C4.5 ağacını açıklamaktır. C4.5 ağacı, ID3 ağacının geliştirilmiş bir hali olarak düşünülebilir ve daha önce bu konuda yayınlanan ID3 ağacı başlıklı yazıyı okumanızda yarar vardır. Bu yazıda iki ağacı karşılaştırarak konu anlatılacaktır. C4.5 ağacının ID3 ağacından […]

Devam

Graph ve RDF Veritabanları

Yazan : İsmet BAHADIR Özet Bu doküman Graph ve RDF veritabanları hakkında genel bilgi sunmaktadır. Doküman 4 kısımda hazırlanmıştır. İlk kısımda Graph veritabanları ve tanımları açıklanmış, ikinci kısımda RDF veri tabanları açıklanmış, üçüncü kısımda Graph veritabanlarına örnekler verilmiş ve kısa açıklamalar ile resmi web siteleri sunulmuş ve son bölümde de RDF veritabanlarına örnekler verilmiş ve […]

Devam