Yazan: Şadi Evren ŞEKER

Dil biliminde ve günümüz doğal dil işleme çalışmalarında külliyat (corpus) kelimesi ile kastedilen, çok sayıdaki metnin düzenli ve yapısal olarak bir arada bulunması durumudur.

Külliyatlar, muhteviyatına göre tek dilli (tek bir dilden metinler içeren) veya çok dilli (birden fazla dilden metinler içeren) olarak sınıflandırılabilir.

Külliyatların, doğal dil işlemede kullanılmasının sağladığı bir avantaj da kelimelerin sınıflandırılması sırasında her kelime için yardımcı önermelerin (lemma) çıkarılmasıdır.  Buna göre aynı yazılışa sahip (eş sesli) farklı anlamda kelimeler bulunması durumlarında bu kelimelerin anlam çözümlemelerinde kullanılabilecek bilgiler külliyata göre değişiklik göstermekle birlikte, mevcut külliyat bu anlamın tespitinde yardımcı rol oynayabilir. Bu konuda Kelime-İfade Belirsizliği (word-sense ambiguity) konusuna bakabilirsiniz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir