Yıl: 2012

Doğal Dil İşleme (NLP)

Term Document Matrix (Kavram Metin Masfufu)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle metin madenciliği veya bazı istatistiksel doğal dil işleme (statistical natural language processing, NLP) çalışmalarında geçen kavram-metin masfufunu (term-document matrix) açıklamaktır. Basitçe seyrek bir matris üzerinde terim sayıları tutulmaktadır. İki boyutlu bir…

Doğal Dil İşleme (NLP)

Vektör Uzay Modeli (Vector Space Model)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar bilimlerinde özellikle istatistiksel doğal dil işleme (Statistical Natural Language Processing, NLP) ve metin madenciliği (text mining) , bilgi getirimi (information retrivial) gibi konularda geçen vektör uzayı modelini (vector space model) açıklamaktır….

Web Teknolojileri

HITS ve HUBS algoritmaları

Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle arama motorlarında, veri madenciliğinde ve metin madenciliği gibi konularda sıkça kullanılan HITS ve HUBS algoritmalarını açıklamaktır. HITS algoritması, Hyperlink Included Text Search kelimelerinin baş harflerinden oluşmaktaır ve Türkçeye bağlantı dahil metin…

Yapay Zeka (Artificial Intelligence)

C4.5 Ağacı (C4.5 Tree)

C4.5 Ağacı (C4.5 Tree) Yazan : Şadi Evren ŞEKER Bu yazının amacı, karar ağaçlarına (decision tree) bir örnek olaran C4.5 ağacını açıklamaktır. C4.5 ağacı, ID3 ağacının geliştirilmiş bir hali olarak düşünülebilir ve daha önce bu konuda yayınlanan ID3 ağacı başlıklı…

Bilgisayar Matematiği

Information Gain (Bilgi Kazanımı)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle veri madenciliği konularında sıkça kullanılan bilgi kazanımı (information gain) konusunu açıklamaktır. Bilgi kazanımı basitçe Shannon’un bilgi teorisinden (Shannon’s information theory) gelmekte olup temeli termodinamik konularına kadar dayanmaktadır. Bu yazıda basitçe bilgisayar…

Bilgisayar Grafiği (Computer Graphics) Veri Tabanı (Database)

Graph Veritabanı Karşılaştırmaları

Yazan: İsmet BAHADIR Özet Bu doküman AllegroGraph, Virtuoso, 4store, Bigdata, Mulgara, Oracle ve OWLIM veritabanlarının karşılaştırılmasını içermektedir. Doküman 3 kısımda hazırlanmıştır. İlk kısımda belirtilen veritabanları hakkında genel bilgi verilmiş, ikinci kısımda da karşılaştırma matrisi sunulmuş ve son kısımda da veritabanlarının…

Donanım (Hardware)

Kosinüs Benzerliği (Cosine Similarity)

Kosinüs Benzerliği (Cosine Similarity) Yazan : Şadi Evren ŞEKER Bu yazının amacı, bilgisayar bilimlerinin de bir alt çalışma alanı olan, metin madenciliği konularında (text mining) sıkça geçen kosinüs benzerliği (cosine similarity) konusunu açıklamaktır. Basitçe iki farklı doküman (text) arasındaki benzerliği,…