Yazan : Şadi Evren ŞEKER
Veri işilemede (veri güvenliği veya veri tabanı gibi teorilerde) bir verinin içinde bulunduğu dilin (language) derecesinden bahsedilebilir. Burada derece (rate) ile kastedilen verinin değişim oranınını bulmaktır. Basitçe verinin entropisinin (dağınımının, entropy) verinin uzunluğuna bölümü ile elde edilir
r = H(M) / N
Yukarıdaki formülde r, dilin derecesini, H(M) derecesini sorguladığımız dili oluşturan verinin entropisini (burada M veriyi veya mesajı temsil etmekte) ve N ise verinin uzunluğunu göstermektedir.
Bu yazı şadi evren şeker tarafından yazılmış ve bilgisayarkavramlari.com sitesinde yayınlanmıştır. Bu içeriğin kopyalanması veya farklı bir sitede yayınlanması hırsızlıktır ve telif hakları yasası gereği suçtur.
Örneğin dilimizde sadece cinsiyet bilgilerini tutmak için bir dil inşa edersek. Dilimizde sadece “kadın” ve “erkek” kelimeleri olacaktır. Buradaki kelimelerin boyu 5’tir ( yani formüldeki N).
Entropi yazısından hatırlanacağı üzere verimizin entropisi ise 1’dir. Bu değer log2 2 = 1 olarak hesaplanabilir. Diğer bir deyişle 2 farklı bilgiyi tek bir bit ile tutabilriz. 21 = 2 farklı bilgi tutar.
Dolayısıyla bu hayali dilin derecesi :
r = 1 / 5 = 0.20
olarak bulunacaktır.