Yazan : Şadi Evren ŞEKER
Malumat çıkarımı aslında bilişsel bilimin (cognitive science) çalışma alanlarından olmakla beraber insanlığın çok eskiden beri kendi adına yaptığı bir eylemin ismidir. Basitçe insanoğlunun gözlemleyerek, okuyarak, dinleyerek, düşünerek veya benzeri eylemlerle dış veya iç dünyasından bir malumat elde etme işlemidir.
Bilgisayar bilimleri açısından bu eylemin önemi, bu eylemin bilgisayarlar tarafından yapılmasının hedeflenmesidir. Örneğin makine öğrenmesi (machine learning) veya soru cevaplama (question answering) gibi yapay zeka çalışmalarının temelinde malumat çıkarımı (knowledge retrieval) bulunmaktadır.
Mesela bir metinden sorulan sorulara cevap veren bir bilgisayar programı olması tasarlanıyor. Programın bu durumda metni işleyerek bir malumat çıkarması ve bu malumata ilişkin soruları doğru cevaplaması beklenir.
Malumat çıkarımının diğer konularla karışmaması açısından daha alt seviyedeki çıkarımlara (retrieval) örnekler verelim:
Örneğin veri çıkarımı (data retrieval) işlemi için veri tabanları (database management systems) birer örnek olabilir.
Benzer şekilde bilgi çıkarımı (information retrieval) işlemi için de internet arama motorları (web search engines) örnek olabilir.
Ancak her iki seviyeli çıkarım işleminde de kaynakların anlatmak istedikleri anlama erişmek için çok sayıda işlem yapmak gerekir. Malumat çıkarımı işlemi bu adımı atlayarak istenen öze daha kolay ulaşmayı ve doğru şekilde gösterilmesini ( malumat gösterimi (knowledge representaion) ) hedeflemektedir.
Aşağıda “Yiyu Yao, Yi Zeng, Ning Zhong, Xiangji Huang” tarafından yazılan Knowledge Retrieval (KR) başlıklı yazıdan alınma karşılaştırmalı bir tablo görülmektedir.
Data Retrieval (Veri Çıkarımı) |
Information Retrieval (Bilgi Çıkarımı) |
Knowledge Retrieval (Malumat Çıkarımı) |
|
Match
(eşleme) |
Boolean match
(Boole Eşlemesi) |
partial match, best match
(kısmi eşleme, tam eşleme) |
partial match, best match
(kısmi eşleme, tam eşleme) |
Inference
(İstidlal) |
deductive inference
(Tümdengelim) |
inductive inference
(Tümevarım) |
deductive inference, inductive inference, associative reasoning, analogical reasoning |
Model | deterministic model
(belirli model) |
statistical and probabilistic model
(istatistiksel model) |
semantic model, inference model
(Anlambilimsel model, istidlalen model) |
Query
(Sorgulama) |
artificial language
(Yapay zeka) |
natural language
(Doğal dil) |
knowledge structure, natural language
(Malumat yapısı, doğal dil) |
Organization | table, index
(Tablo, indis) |
table, index
(Tablo, indis) |
knowledge unit, knowledge structure
(malumat ünitesi, malumat yapısı) |
Representation
(Gösterim) |
number, rule
(Sayılar, kurallar) |
natural language, markup language
(Doğal dil, işaretleme dili) |
concept graph, predicate logic (Haber Mantığı), production rule, frame, semantic network (Çerçeve anlambilismsel ağ), ontology (Varlıkbilim) |
Storage | Database | document collections | knowledge base (Malumat Tabanı) |
Retrieved Results
(Çılarılmış Sonuçlar) |
data set
(veri kümesi) |
sections or documents | a set of knowledge unit |
Yukarıdaki tabloda farklı problem konuları için iç başlık yani Veri, Bilgi ve Malumat çıkarımları gösterilmiştir.