Son Yazılar

MIS (Yönetim Bilişim Sistemleri)

Pareto Prensibi

Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde Pareto Diyagramı  olarak geçen yaklaşımı açıklamaktır. Bu yaklaşım şu hipotez üzerine kuruludur : ‘’olayların öyle bir %20’i vardır ki, sonucun %80’ini etkiler ve öyle bir %80’i vardır ki sonucun %20’sini etkiler’’….

Jensen Shannon Mesafesi (Jensen-Shannon Divergence)

Yazan : Şadi Evren ŞEKER iki olasılık dağılımı arasındaki mesafeyi ölçmek için kullanılan yöntemlerden birisidir. Literatürde “bilgi çapı” (information radius , kısaca iRad ) veya ortalamaya olan toplam uzaklık (total divergence to average) olarak da geçmektedir. Tanımı itibariyle Kullback Leibler…

Kullback Leibler Uzaklığı (kullback-leibler divergence)

Yazan : Şadi Evren ŞEKER Olasılık teorisi ve bilgi teorisinde (information theory) geçen ve iki olasılık dağılımı arasındaki ilişkiyi (uzaklığı) formüllendiren yöntemin ismidir. Tanımı itibariyle, bilgi kazanımı (information gain) veya entropi kavramlarına yakındır ancak formüllendirmesi uzaklık (mesafe) değerinden sonuç döndürür….

Tversky Indeksi (Tversky Index)

Yazan : Şadi Evren ŞEKER Tversky indeksi, verilen iki küme arasındaki benzerliği gösteren bir indeks değeridir. Hesaplanması sırasında, küme fonksiyonlarından faydalanır. Örnek olarak X ve Y isminde, iki kümemiz olduğunu kabul edersek indeks değeri aşağıdaki şekilde hesaplanacaktır: [latex]S(X, Y) =…

Tanimoto Benzerlik Fonksiyonu (Tanimoto Similarity)

Yazan : Şadi Evren ŞEKER Tanimoto benzerlik fonksiyonu, 1960 yılında iki bitki resmi arasındaki benzerliğin bulunması amacıyla yapılan çalışmalar sırasında çıkmıştır. Resimlerin bitmap olarak tutulduğu bir ortamda, yani resimlerin 1 veya 0 olabilen bitler ile tutulduğu bir ortamda iki resim…

Jaccard Indeksi (Jaccard Index)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, metinler arasındaki ilişkinin ölçülmesi amacıyla geliştirilen ölçülerde (metrics) birisi olan Jaccard indeksini açıklamaktır (jaccard index). Indeks basitçe iki metin üzerinden özellik çıkarımı (feature extraction) yapıldıktan sonra ortak olan özelliklerin sayısının, iki metindeki…

Metin Madenciliği (Text Mining) Veri Bilimi & Yapay Zeka

Sorenson-Dice Katsayisi (Dice Sorensen Coefficient)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, dizgiler (String) arasındaki mesafenin ölçülmesi için kullanılan dizgi metriklerinden (string metrics) Sorensen-Dice katsayısını (Sorensen-dice coefficient) anlatmaktır. Öncelikle bir özellik çıkarımı yöntemi ile iki metin üzerinden özellikler çıkarılır ve ardından aşağıdaki formüle göre…

Veri Madenciliği (Data Mining)

WEKA ile eğitim modelinin kaydedilmesi

Yazan : Şadi Evren ŞEKER Bu yazının amacı, bir makine öğrenmesi (machine learning) ve veri madenciliği (data mining) aracı olan ve iş zekası (business intelligence) gibi farklı alanlarda kullanımı olan WEKA aracının üzerinde yapılan eğitim modellerinin nasıl kaydedilip, farklı test…

Veri Yapıları

Strand Sort (İplik Sıralaması)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, literatürde iplik sıralaması (strand sort) olarak geçen sıralama algoritmasını (sorting algorithm) açıklamaktır. Sıralama algoritması bağlı listeler (linked list) üzerinde etkili olan bir algoritmadır ve iki sıralı listenin birleştirilerek yine sıralı bir liste…

Yapay Zeka (Artificial Intelligence)

Turing Testi

Yazan : Şadi Evren ŞEKER Bu yazının amacı, yapay zeka (artificial intelligence) konusunun temellerini oluşturan bir test kavramından bahsetmektir. Allen Turing tarafından ortaya atılan bir teste göre, bir bilgisayarın, bir insan gibi davranabilmesinin tanımını yapılmıştır. Yani, yapay zeka çalışmalarının hedeflerinden…