SimHash (Benzerlik Özeti)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle metin işlemenin yoğun olduğu, arama motoru gibi uygulamalarda dosyaların veya web sitelerinin birbirine olan benzerliğini bulmak için kullanılan bir algoritmadır. Algoritmaya alternatif olarak klasik hash fonksiyonları kullanılabilir. Yani, örneğin iki sayfasnın ayrı ayrı hash değerleri alınıp bu değerleri karşılaştırmak mümkündür. Ancak simhash algoritması, bu yönteme göre daha […]

Devam

Doğrusal Karım (Linear Hashing)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, doğrusal karım ve doğrusal karım tablosu (linear hash table) konularını anlatmaktır. Bilgisayar bilimlerinde veri depolamak veya veriye hızlı ulaşmak için kullanılan yöntemlerdir. Doğrusal karım yönteminde temel olarak özetleme fonksiyonları kullanılır (karım fonksiyonu, hash function). Bu fonksiyonlar sıralıdır ve sayısı, özetleme fonksiyonunun seviyesini belirtir. (h1, h2, h3, … […]

Devam

2-3-4 Ağaçları (2 3 4 trees)

Yazan : Şadi Evren ŞEKER 2-3-4 ağacı, B-ağaçlarının (B-Trees) özel bir halidir. Bu ağacın özelliği, düğüm boyutunun (node size) 3 ile sınırlı olmasıdır. Ağaç ayrıca sürekli olarak dengeli bir ağaç garantisi verir (balanced tree). 2-3-4 ağaçları, kırmızı siyah ağaçlarının (red-black trees) , eş şekillisi (isomorphic) olarak da düşünülebilir. 2-3-4 ağacının ismi, ağaçtaki düğümlerin değişik durumlarda […]

Devam

CCI (Computed Chaining Insertion, Hesaplamalı Zincir Eklemesi)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir özetleme fonksiyonu (hashing function) sonucunda, çalışma olması durumunda (collision), dizi üzerinde farklı bir adrese çakışan sayı konulur veya aranır. Bu farklı sayı için ikinci bir özetleme fonksiyonu kullanılır. Buraya kadar olan tanım, […]

Devam

RAID (Redundant Array of Independent Disks)

Yazan :Şadi Evren ŞEKER Bilgisayar bilimlerinde, depolama yönetimi (storage management) için kullanılan yöntem standardıdır. Kaynaklarda redudant array of independent disks ( fazladan bağımsız disk dizisi ) şeklinde geçtiği gibi , redundant array of inexpensive disks ( ucuz disklerin fazlalık dizisi) olarak da geçmektedir. Kısaca bu standart çeşitli seviyelerde verinin fazladan bir kopyasının tutulması ile birlikte […]

Devam

Doğrusal Bölüm (Linear Quotient)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir çakışma durumu olduğunda, eklenecek olan anahtarı kaç sıra sonraya yerleştireceğimizi bulan ikinci bir özetleme fonksiyonu kullanılır. Kullanılan ikinci özetleme fonksiyonu ise sayının bölümüdür: H1 : K mod n H2 : K / […]

Devam

LICH (Last Insertion Coalesced Hashing)

Yazan : Şadi Evren ŞEKER Türkçeye, son ekleme birleştirme özetlemesi olarak çevrilebilir. Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir özetleme alanını iki parçaya ayıran bu algoritmada amaç çakışma sonucu oluşan alanlar ile doğru adreste indekslenen verilerin ayrılmasıdır. Kabaca aşağıdaki şekil gibi düşünebiliriz: Yukarıdaki şekilde […]

Devam

EISCH (Early Insertion Standart Coalesced Hashing)

Yazan : Şadi Evren ŞEKER Türkçeye, erken ekleme standart birleştirme özetlemesi olarak çevrilebilir. Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir özetleme fonksiyonu (hashing function) sonucunda, çalışma olması durumunda (collision), dizinin sonundan başa doğru boş bulunan ilk yere yerleştirmeyi söyler. Bu durumu bir örnek üzerinden […]

Devam

Çift Özetleme (Double Hashing)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde kullanılan özetleme fonksiyonları, genellikle büyük bir verinin daha küçük bir hale getirilmesine yarar. Bu anlamda özetleme fonksiyonları veri doğrulama (data verification) , veri bütünlüğü (data integrity), veri güvenliği (security) ve şifreleme (encryption) gibi pek çok alanda kullanılırlar. Özetleme fonksiyonlarının bir problemi, büyük bir veriyi özetledikten sonra, çakışma olması […]

Devam

İkinci Dereceden Sondalama (Quadratic Probing)

Yazan : Şadi Evren ŞEKER Özellikle özetleme fonksiyonlarının (hashing functions) bilgileri sınıflandırması sırasında kullanılan formülün ikinci dereceden olması durumudur. Özetleme fonksiyonlarında, sık kullanılan doğrusal sondalama (linear probing) yönteminin tersine, bir bilgiyi tasnif ederken, ardışık olarak veriler üzerinde hareket etmez, bunun yerine her defasında baktığı uzaklığı ikinci dereceden bir denklem ile arttırır. Konuyu anlamaya öncelikle doğrusal […]

Devam