Yazan : Şadi Evren ŞEKER

Bilgisayar mühendisliğinin bir alt kolu olan yapay zeka çalışmalarında amaçlardan birisi de insan gibi davranan veya insanı anlayarak yorum yapabilen yazılımlar elde etmektir. Bu amaçla makine insan sınırının (man machine boundary) üzerinde çeşitli çalışmalar yapılmıştır. Bu çalışmaların önemli bir kısmı da insanın kendini ifade yöntemi olan ve diğer insanlarla iletişim kurmasına yarayan dilbilim üzerindedir.

Dilbilim çalışmaları ve bilişim (cognition, cognitive) konusunda yapılan çalışmalar, yani insanın bilgmesi ve bildiğini kullanması ile ilgili yapılan çalışmaların bilgisayarlar üzerine uyarlanması doğal dil işleme (natural language processin) alanının çalışma konusudur.

Bu alanda çeşitli yaklaşımlar bulunmaktadır. Bu yaklaşımlardan birisi de bu yazının konusu olan istatistiksel dilbilim yaklaşımıdır. Bu yaklaşıma göre bilgisayarların doğal dildeki bilgileri anlamasını istatistik bilimine dayandırmak düşünülmüştür.

Öncelikle dilin ve dildeki öğelerin bilişsel (cognitive) yaklaşımını incelemeye çalışalım. Örneğin bir otoyolun kenarında durduğunuzu ve ortalama 50km hızla geçen arabaların arasından karşıya geçmek istediğinizi düşünelim. Böyle bir yolda geçmiş tecrübeleriniz ve o anlık gözlemlerinizle yola kontrolsüz bir şekilde atlarsanız ezilip zarar göreceğiniz (bir arabanın çarpacağı) neredeyse kesindir.

Tam bu anda yanınıza birisi gelip size karşıya geçmek için düğmeye basabileceğinizi ve bu düğme sayesinde arabalara kırmızı ışık yanarak arabaları durdurabileceğinizi söylüyor olsun. Bu bilgi benzer şekilde trafik ışıklarının üzerinde yazılı da olabilir. Normalde belki de böyle bir bilgiyi elde etmeseniz deneyerek bulmanız veya kullanmanız mümkün olmayabilir ancak bu bilgi size bir dil aracılığıyla ulaşabiliyor ve siz başka birisinin size ilettiği bu bilgiyi öğrenerek kullanabiliyorsunuz.

İşte mevcut gözlemlerle veya geçmiş tecrübelerle öğrenilemeyen ancak dil vasıtasıyla (yazılı veya sözlü) iletilen bilgi, bilgisyar dünyasındaki doğal dil işleme çalışmalarının ve bilişsel bilimin (cognitive science) temelini oluşturur. Tam bu noktada artık bu bilginin istatistik ile ilişkisini tanımlayabiliriz.

Örneğin doğal dilden bir kelime ele alalım ve anlamını nasıl anladığımızı veya bilgisayarın nasıl anlayabileceğini tartışalım. Kelimemiz “uzun” olsun. Görüldüğü üzere uzun kelimesi belirli bir geçmiş bilgiyi gerektirir. Her insanın uzun kelimesi ile düşündüğü farklı bir tecrübesi veya kafasında canlanan bir sembol olabilir. Ancak uzun kelimesini tanımlayın desek genelde herkes “NORMALDEN uzun (mesafe boy veya uzunluk birimi olarak fazla) olan” şeklinde bir tanım yapabilir. Bu tanımda dikkat edilecek nokta normal kelimesidir. Demek ki herkesin kafasında bir de normal kavramı var ve hepimizin bildiği üzere bu normal kavramı istatistiksel bir birikimdir ve muhtemelen herkes kendi geçmişindeki normal ile ölçer. Örneğin “uzun boylu insan” tamlamasındaki uzun için insanlar geçmiş insan boylarına göre bir normal kavramı elde edip bununla karşılaştırabilirler.

Benzer bir örnek de güncel konularda olabilir. Örneğin bu yazının yazıldığı gün itibariyle millyet gazetesinin web sitesindeki başlıklardan birisi “Musevi yandaşları tahranda büyük bir gösteri düzenliyor” şeklindeydi. Haberin detayı belki siz bu yazıyı okurken anlaşılmayacak kadar geçmişte kalmış olabilir ancak gündem itibariyle iranda seçimler yeni yapıldı ve Ahmedinejad seçimleri kazandır. Rakibi olan Musevi’nin taraftarları ise İranda çeşitli yerlerde gösteri yapıyor ve seçimi protesto ediyor.

Şimdi gündemi bilmeyen bir gözle bu başlığı analiz edelim. Burada bilinemsi gereken isimler:

  • Musevi
  • tahran
  • gösteri

Bu isimlerin dışında betimleyici (tamlayan) görevinde ve yüklem görevinde çeşitli ilave kelimeler de var. Peki bir bilgisayar sizce yukarıdaki isimler için ne düşünür.

Musevi: Hz. Musa’nın isminde türeyen kutsal kitabı Tevrat olan ve Yahudi ırkının inancı olarak gelen dini inanış yada Mir Hüseyin Musevi ismindeki son seçimlerde reformcu kanadın temsilcisi İranlı.

Tahran : Farsçada sıcak yer anlamına gelen kelime yada 1943 senesinde churchill, stalin ve roosevelt’in, müttefiklerin batı avrupa’ya çıkarma yapmasına karar verdikleri konferansın adı yada İran’ın başkenti.

Gösteri: Bu kelimeyi tek başına düşündüğümüzde çok çeşitli anlamlarda yerde ve zamanlarda düşünebiliriz.

Peki biz insan olarak yukarıdaki bu isimleri nasıl anlıyoruz. Elbette yukarıdaki bu isimler için belki de bütün bu bilgileri biliyoruz ancak okuduğumuz zaman gündemi de biliyorsak tek bir anlam veriyor ve diğer bütün ihtimalleri eliyoruz.

Bunun sebebi aslında bu isimleri ele aldığımızda bütün bu ihtimalleri eşit düşünüyor ancak bağlantılı isimlerle ve gündemle birlikte kelimenin bazı isimlerini azaltıyor olmamızdır. Dolayısıyla aslında bu cümlenin anlamını analiz ederken istatistiksel olarak kelimenin güncel kullanımına göre bir anlam yüklüyoruz. Hatta bu durum bazı kelimelerde o kadar çok olmaktadır ki zaman içinde kelimenin anlamı kaymakta ve aynı kelime farklı zamanlarda farklı anlamlara gelmektedir. Bunun sebebi kelimeyi kullanan kişilerin kelimeye yüklediği anlamın değişmesidir.

Aslında her kelimenin sözlüklerdeki anlamı o kelimeyi kullanan kişi sayısına göre belirleniyor demek yanlış olmaz. Dolayısıyla çok uç bir bakış açısına göre bütün dilbilim ve bütün anlam bilim istatistikten ibarettir bile denilebilir.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir