109K516-TÜBİTAK-SOBAG
    TÜRKİYE TÜRKÇESİ SÖZVARLIĞINDA FİİLLERİN DERLEM DENETİMİ VE DERLEM  TABANLI SÖZLÜĞÜ
AMAÇ
Dil araştırmaları, bilişim teknolojilerinin gelişimi sonucu, diğer tüm bilim dallarında olduğu gibi, bambaşka bir yönde ilerlemektedir. Doğal Dil İşleme (DDİ) çalışmaları, bugün, bir mühendislik alanına dönüşmüş bulunmaktadır. Her ne kadar Türkiyede bu amaçla yürütülen çalışmalar son on yılda hız kazansa da, ‘bilgisayar destekli dil/dilbilim çalışmaları’ olarak da adlandırılan bu alanda, oldukça güvenilir ve hızlı erişilebilir dilsel bir ortamda, özellikle sözlükbilim ve sözdizim çalışmalarında, dilin kullanım özelliklerini belirlemek, ana dili ve yabancı dil öğretimine yönelik sıklığı yüksek yapıları ve kullanımlarını ortaya çıkarmak vb. amaçlarla derlem oluşturmak ve bunu işlemek başlıca çalışma konuları olarak karşımıza çıkmaktadır.
Projenin amacı bir derlemden TTSV’de yer alan MBİF’yi yazımsallık, sözcükbirimsel ve anlamsal olarak sıklık, madde başı açıklamalar, tanıklar, sözcük türü etiketleri açısından gerçek zamanlı olarak denetlemek, derlem tabanlı olarak TTSV’de MBİF’yi tüm yönleriyle yeniden oluşturmak ve bu veriler doğrultusunda “Türkiye Türkçesinde Fiilerin Derlem Tabanlı Sözlüğü”nü sanal ortamda yayımlamaktır.
Yukarıdaki ölçütler açısından daha önce 12 milyon söz içeren ve Cumhuriyet Dönemi Türk Yazın Dili’ni temsil eden bir derlemden [ÖZKAN, Bülent (2007), TÜRKÇE DERLEM-1 [TD-1] sözvarlığında A maddesinde zarf olarak tanımlı sözlükbirimler üzerine yürüttüğümüz bir çalışmanın çıktılarına bakarsak yukarıdaki derlem denetimi ile ilgili amaçlılığımız daha da iyi anlaşılacaktır:
DERLEM  DENETİMİ ÜZERİNE ÖRNEK UYGULAMA 
    [ÖZKAN, Bülent (2008), “Güncel Türkçe Sözlük'te 'Zarf' Olarak Tanımlı Sözlük Birimlerin  Derlem-Denetimi Üzerine Bir Değerlendirme” VI. Uluslararası Türk Dili  Kurultayı, 20-26 Kasım 2008, ANKARA.]’dan alınmıştır.
Güncel Türkçe Sözlük’ten (GTS) derlenen ve A maddesinde yer alan zarfların sayısı 231’dir (derleme tarihi: 05.09.2007). Bu zarflardan A maddesinin derlem denetimi sonuçlarına göz attığımızda, Cumhuriyet Dönemi Türk Yazın Dili’ne ait derlemimizde [ÖZKAN, Bülent (2007), TÜRKÇE DERLEM-1 [TD-1] 231 zarftan 73’ünün kullanım örneğine rastlanılmadığı görülür. Bu durumun olası nedenleri arasında, söz konusu sözlükbirimlerin arkaik yapıda olmaları ve kullanımdan düşmeleri, özel alanlara ait olmaları, argo ve halk dilinden sözlükbirimler olmaları sıralanabilir. Öte yandan, 14 zarf tanımlı sözlükbirim zarf olma özelliğinden uzak olduğu görülür. Bu sözlükbirimler dizgelerde bağlama-kuvvetlendirme-soru işleviyle daha çok edat özelliği göstermektedir. Daha açık bir ifadeyle sözcük türü etiketlemeleri yanlıştır.
Böyle bir derlem denetiminden sözlükbirimlerin kullanımda ikili yazımlarını bir yana bırakırsak ortaya çıkan bazı görünümler ise şu şekildedir:
Madde İçi  Tanımlıklarının Kullanım Sıklığına Göre Düzenlenmesi Gerekenler: 
  Bazı madde içi  tanımlıkların kullanım sıklığına göre ⌠…⌡ yeniden düzenlemesi  gerekmektedir. Aşağıda örneği verilen tanımlıkların sıklıkları temel  alındığında derlem-denetimi sonucu tanımlıkların öncelenmesi ve/ya sonralanması  gerekir. 
  alabildiğine:  1. Sınırsız,  uçsuz bucaksız bir biçimde. ⌠18⌡ 2. Olanca hızı ile. ⌠12⌡ 3. Aşırı  derecede, gereğinden çok. ⌠71⌡            
  sıralama :  [3-1-2]
  amansızca:  1. Öldürücü bir durumda, acımasız olarak. ⌠2⌡ 2. Hoşgörüsüz olarak.⌠6⌡ sıralama : [2-1]
  arkadaşça:  1. Arkadaş olarak. ⌠2⌡ 2. İçtenlikle, dostça. ⌠5⌡ sıralama : [2-1] vb.
Madde İçi  Tanımlıklarına Yeni Açıklamalar Eklenmesi Gerekenler: 
  Bazı madde içi  tanımlıklarda derlem-denetimi sonucunda tanımlıklarının daha kapsayıcı ve  açıklayıcı olmasını sağlayacak açıklamalar {…} yapmak gerekmektedir.
açık:  14. Doğru  olarak, açıkça, {anlaşılır biçimde.} “Kısa ve açık anlatalım,  ‘Kadınlaşınca hoşlaşırlar.’” (AB-BBYŞ).
    anında: Çabucak, {zamanında.} “Anında konser başlardı.” (İO-LBA).
    adamakıllı: Gereğinden  çok, iyice, {oldukça.} “Çok artar. Paşam, adamakıllı artar.”  (KT-YS)., “Çok yorgunum, bu hastalık beni adam akıllı sarstı.”  (CKM)., “Galiba gençler adamakıllı canınızı sıkmış.”  (NFK-ST).
Madde İçi  Tanımlıklarına Yeni Tanımlıklar Eklenmesi Gerekenler: 
  Öte yandan  derlem-denetimi sonucunda bazı zarf tanımlı sözlükbirimler için yeni  tanımlıklar ║…║ gerekmektedir. Burada dikkat çeken durum yeni  tanımlıkların var olan tanımlıklardan daha sık kullanılmasıdır.
  anadan doğma: 2. Doğuştan. ⌠1⌡║Çıplak bir vaziyette, olduğu gibi. ║ ⌠7⌡ “Bir de odaya girdim ki, iki tane zebellah gibi herifin arasında, anadan doğma soyunmuş, oynayıp durur...” (EB-BG)., “Anadan  doğma uzanıyordum çayırların üstüne.” (EB-BG)., “Dayan ömrümün  törpüsü, dayan da dağlar anadan doğma görsün şoför Ahmet'i, dayan  arslan...” (NH-KMD). vb.
Madde İçi Tanımlıkları  Birleştirilmesi Gerekenler: 
  Bazı madde içi  tanımlıkların derlem tabanlı olarak yeniden düzenlenmesinde ayrım yapılmasına  gerek olmadığı görülür. Bu tanımlıkların aynı tanımlık içerisinde {……} verilmesi  sözlükbirimin tanımlık değerinde de bir değişim yaratmamaktadır. 
  
  acı  acı: {1. Üzüntülü biçimde, dokunaklı olarak. 3. Üzüntü içinde.}
  ayrı  ayrı: {2. Her biri ayrı olarak. 3. Her biri için.} 
Derlem-Denetiminde  Diğer Görünümler ise:
    Kullanımdan Düşenler: 
  Birtakım zarf tanımlı  sözlükbirimlerin derlemde kullanımının olmadığı görülmüştür. Bunlar: aç  biilaç, adedî, adilane, ahir, ahiren, akilane, aklen, alelıtlak, alelumum,  alessabah, amabile, amirane, anasıl, anha minha, anide, anif, arifane (II),  ariyeten, aslen, aşikâre, aybeay, azimkârane gibi genelde arkaik  sözlükbirimlerdir (bk. Tablo 1).
  Öte yandan bir kısmının  bugün Türkçeleşmiş karşılıkları kullanılmaktadır. 
  Edat Özelliği  Gösterenler (Bağdaşık Yapılar) Yanlış Etiketlemeler: 
  Birtakım zarfların ise  sözcük türü tanımlıkları kullanımlarıyla örtüşmemektedir. Örneğin, acaba,  acep, açıkçası, âdeta, adına, aksine, anlaşılan, aracılığıyla, asıl, atfen,  aynı zamanda, ayrıyeten, ayriyeten, azade vb. zarflar daha çok  bağlama-kuvvetlendirme-soru işleviyle söz diziminde yer almaktadır. Zarfların  bilinen tanımlık özellikleri bu sözlükbirimler için geçerli değildir (bk. Tablo 1).
  Özel Alanlarla İlgili  ve/ya Alıntı Olanlar: 
  Genel dilde kullanımı  olmayan herhangi bir bilim dalına ait ya da özel bir alanla ilgili ve zarf  tanımlı sözlükbirimler de genelde derlemde rastlanmayan sözlükbirimlerdir. Bu  sözlükbirimlerin genel özellikleri alıntı sözlükbirimler olmalarıdır. Bunlar: antagonist,  antrparantez, appassionato, allegretto, allegro, andante, andantino, animato,  alakart, affettuoso, agitato, accelerando, asaleten, anal, argolu, argosuz gibi müzik, edebiyat, felsefe, siyaset vb. alanlarda kullanılan  sözlükbirimlerdir (bk. Tablo 1). 
  Argo ve Halk Dilinden  Alınanlar: 
  Birtakım zarf tanımlı  sözlükbirimler ise argoda ve halk dilinde kullanılan sözlükbirimlerdir. 
  Bu sözlükbirimler: acep, afra tafra, ahmakça, alarga, alaz alaz, alık salık, anaca, ansız, apazlama,  apul apul, ara yerde, aralıkta, ardın ardın, aşırı taşırı, avanakça, ayık,  ayrıksız, azca vb.’dir (bk. Tablo  1). 
  Kullanım Örneğine  Rastlanmayanlar ya da Sözcük Türü Bulanıklığı Olanlar: 
  Birtakım sözlükbirimler  ise sözcük türü olarak zarf olmaktan çok isim ve sıfat ağırlıklı bir kullanıma  sahiptir. Diğer yandan derlemin niteliği de bu tip sözlükbirimlere  rastlamamamızda etken olabilmektedir. Bu nedenle derlem iyi örneklenmiş, dili  temsil gücü olan bir derlem olmalıdır.
  Derlem-denetiminde bu  kullanımları da belirlemek ve sözlükleştirmek gerekmektedir. GTS’de bu tip  kullanıma sahip olan sözlükbirimler ise, acı tatlı, adam adama, adam  yokluğunda, adamcasına, adetçe, adı üstünde, adımbaşı, ahlaksızca, akşam saati,  akşamlı sabahlı, akşamlık, akşamlık sabahlık, alkolsüz, araba araba, art elden,  artistçe, aşağılı yukarılı, aylık, ayrıcasız’ dır (bk. Tablo 1).
Tablo  1 Güncel Türkçe Sözlük’te ‘Zarf’ Olarak Tanımlı Sözlükbirimlerin  Derlem-denetimi Sonuçları. 
     
 
  Benzer görünümler  fiiller için de geçerlidir. Projenin amaçlarını yukarıdaki uygulama  çerçevesinde TTSV’de fiil olarak tanımlı yaklaşık 6.400 madde başı ve madde içi  sözlükbirimi temsil gücü yüksek ve gerçek zamanlı bir derlemden tüm yönleriyle  denetlenmesi ve derlenmesi ile elde edilen sonuçların yayımlanmasına bağlı  olarak şu şekilde sıralayabiliriz:
  1. MBİF’yi temsil gücü (representativeness) yüksek bir derlemden (corpus) sıklık temelli olarak belirlemek. 
  2. TTSV’de MBİF’yi yazımsal özellikleri açısından tam olarak belirlemek. 
  3. MBİF’nin madde başı açıklamalarda yer alan eksikliklerini gidermek. 
  4. MBİF’de var olan sözlük tanıklarının yetersizliklerini gidermek. 
  5. Sözcük türü olarak MBİF’yi tam olarak etiketlemek. 
  6. Özel amaçlı sözlük çalışmaları için (dil  öğretimi, eşdizimlilik, eş ve yakın anlamlılık, karşıt anlamlılık vb.)  gerçek zamanlı sözlükbirimsel malzemeyi bu anlamda derlemek.
  7. Morfolojik olarak MBİF’yi gerçek zamanlı olarak derlemek. 
  8. Tüm bu süreçlerin sonunda ortaya çıkan sözlükbilimsel malzemeyi devam  çalışmalarında diğer araştırmacıların kullanımına sanal ortamda sunarak “Türkiye Türkçesinde Fiillerin Derlem  Tabanlı Sözlüğü”nü ortaya koymak ve sözlükbilim çalışmalarına bu anlamda  katkıda bulunmak.


