TÜRKİYE TÜRKÇESİNDE FİİLLERİN DERLEM TABANLI SÖZLÜĞÜ

English

109K516-TÜBİTAK-SOBAG
TÜRKİYE TÜRKÇESİ SÖZVARLIĞINDA FİİLLERİN DERLEM DENETİMİ VE DERLEM TABANLI SÖZLÜĞÜ

AMAÇ

Dil araştırmaları, bilişim teknolojilerinin gelişimi sonucu, diğer tüm bilim dallarında olduğu gibi, bambaşka bir yönde ilerlemektedir. Doğal Dil İşleme (DDİ) çalışmaları, bugün, bir mühendislik alanına dönüşmüş bulunmaktadır. Her ne kadar Türkiyede bu amaçla yürütülen çalışmalar son on yılda hız kazansa da, ‘bilgisayar destekli dil/dilbilim çalışmaları’ olarak da adlandırılan bu alanda, oldukça güvenilir ve hızlı erişilebilir dilsel bir ortamda, özellikle sözlükbilim ve sözdizim çalışmalarında, dilin kullanım özelliklerini belirlemek, ana dili ve yabancı dil öğretimine yönelik sıklığı yüksek yapıları ve kullanımlarını ortaya çıkarmak vb. amaçlarla derlem oluşturmak ve bunu işlemek başlıca çalışma konuları olarak karşımıza çıkmaktadır.

Projenin amacı bir derlemden TTSV’de yer alan MBİF’yi yazımsallık, sözcükbirimsel ve anlamsal olarak sıklık, madde başı açıklamalar, tanıklar, sözcük türü etiketleri açısından gerçek zamanlı olarak denetlemek, derlem tabanlı olarak TTSV’de MBİF’yi tüm yönleriyle yeniden oluşturmak ve bu veriler doğrultusunda “Türkiye Türkçesinde Fiilerin Derlem Tabanlı Sözlüğü”nü sanal ortamda yayımlamaktır.

Yukarıdaki ölçütler açısından daha önce 12 milyon söz içeren ve Cumhuriyet Dönemi Türk Yazın Dili’ni temsil eden bir derlemden [ÖZKAN, Bülent (2007), TÜRKÇE DERLEM-1 [TD-1] sözvarlığında A maddesinde zarf olarak tanımlı sözlükbirimler üzerine yürüttüğümüz bir çalışmanın çıktılarına bakarsak yukarıdaki derlem denetimi ile ilgili amaçlılığımız daha da iyi anlaşılacaktır:

 

DERLEM DENETİMİ ÜZERİNE ÖRNEK UYGULAMA
[ÖZKAN, Bülent (2008), “Güncel Türkçe Sözlük'te 'Zarf' Olarak Tanımlı Sözlük Birimlerin Derlem-Denetimi Üzerine Bir Değerlendirme” VI. Uluslararası Türk Dili Kurultayı, 20-26 Kasım 2008, ANKARA.]’dan alınmıştır.

Güncel Türkçe Sözlük’ten (GTS) derlenen ve A maddesinde yer alan zarfların sayısı 231’dir (derleme tarihi: 05.09.2007). Bu zarflardan A maddesinin derlem denetimi sonuçlarına göz attığımızda, Cumhuriyet Dönemi Türk Yazın Dili’ne ait derlemimizde [ÖZKAN, Bülent (2007), TÜRKÇE DERLEM-1 [TD-1] 231 zarftan 73’ünün kullanım örneğine rastlanılmadığı görülür. Bu durumun olası nedenleri arasında, söz konusu sözlükbirimlerin arkaik yapıda olmaları ve kullanımdan düşmeleri, özel alanlara ait olmaları, argo ve halk dilinden sözlükbirimler olmaları sıralanabilir. Öte yandan, 14 zarf tanımlı sözlükbirim zarf olma özelliğinden uzak olduğu görülür. Bu sözlükbirimler dizgelerde bağlama-kuvvetlendirme-soru işleviyle daha çok edat özelliği göstermektedir. Daha açık bir ifadeyle sözcük türü etiketlemeleri yanlıştır.

Böyle bir derlem denetiminden sözlükbirimlerin kullanımda ikili yazımlarını bir yana bırakırsak ortaya çıkan bazı görünümler ise şu şekildedir:

Madde İçi Tanımlıklarının Kullanım Sıklığına Göre Düzenlenmesi Gerekenler:
Bazı madde içi tanımlıkların kullanım sıklığına göre ⌠…⌡ yeniden düzenlemesi gerekmektedir. Aşağıda örneği verilen tanımlıkların sıklıkları temel alındığında derlem-denetimi sonucu tanımlıkların öncelenmesi ve/ya sonralanması gerekir.
alabildiğine: 1. Sınırsız, uçsuz bucaksız bir biçimde. ⌠18⌡ 2. Olanca hızı ile. ⌠12⌡ 3. Aşırı derecede, gereğinden çok. ⌠71⌡           
sıralama : [3-1-2]
amansızca: 1. Öldürücü bir durumda, acımasız olarak. ⌠2⌡ 2. Hoşgörüsüz olarak.⌠6⌡ sıralama : [2-1]
arkadaşça: 1. Arkadaş olarak. ⌠2⌡ 2. İçtenlikle, dostça. ⌠5⌡ sıralama : [2-1] vb.

Madde İçi Tanımlıklarına Yeni Açıklamalar Eklenmesi Gerekenler:
Bazı madde içi tanımlıklarda derlem-denetimi sonucunda tanımlıklarının daha kapsayıcı ve açıklayıcı olmasını sağlayacak açıklamalar {…} yapmak gerekmektedir.

açık: 14. Doğru olarak, açıkça, {anlaşılır biçimde.} “Kısa ve açık anlatalım, ‘Kadınlaşınca hoşlaşırlar.’” (AB-BBYŞ).
anında: Çabucak, {zamanında.} Anında konser başlardı.” (İO-LBA).
adamakıllı: Gereğinden çok, iyice, {oldukça.} “Çok artar. Paşam, adamakıllı artar.” (KT-YS)., “Çok yorgunum, bu hastalık beni adam akıllı sarstı.” (CKM)., “Galiba gençler adamakıllı canınızı sıkmış.” (NFK-ST).

Madde İçi Tanımlıklarına Yeni Tanımlıklar Eklenmesi Gerekenler:
Öte yandan derlem-denetimi sonucunda bazı zarf tanımlı sözlükbirimler için yeni tanımlıklar ║…║ gerekmektedir. Burada dikkat çeken durum yeni tanımlıkların var olan tanımlıklardan daha sık kullanılmasıdır.
anadan doğma: 2. Doğuştan. ⌠1⌡Çıplak bir vaziyette, olduğu gibi. ⌠7⌡ “Bir de odaya girdim ki, iki tane zebellah gibi herifin arasında, anadan doğma soyunmuş, oynayıp durur...” (EB-BG)., “Anadan doğma uzanıyordum çayırların üstüne.” (EB-BG)., “Dayan ömrümün törpüsü, dayan da dağlar anadan doğma görsün şoför Ahmet'i, dayan arslan...” (NH-KMD). vb.

Madde İçi Tanımlıkları Birleştirilmesi Gerekenler:
Bazı madde içi tanımlıkların derlem tabanlı olarak yeniden düzenlenmesinde ayrım yapılmasına gerek olmadığı görülür. Bu tanımlıkların aynı tanımlık içerisinde {……} verilmesi sözlükbirimin tanımlık değerinde de bir değişim yaratmamaktadır.
acı acı: {1. Üzüntülü biçimde, dokunaklı olarak. 3. Üzüntü içinde.}
ayrı ayrı: {2. Her biri ayrı olarak. 3. Her biri için.}

Derlem-Denetiminde Diğer Görünümler ise:
Kullanımdan Düşenler:
Birtakım zarf tanımlı sözlükbirimlerin derlemde kullanımının olmadığı görülmüştür. Bunlar: aç biilaç, adedî, adilane, ahir, ahiren, akilane, aklen, alelıtlak, alelumum, alessabah, amabile, amirane, anasıl, anha minha, anide, anif, arifane (II), ariyeten, aslen, aşikâre, aybeay, azimkârane gibi genelde arkaik sözlükbirimlerdir (bk. Tablo 1).
Öte yandan bir kısmının bugün Türkçeleşmiş karşılıkları kullanılmaktadır.
Edat Özelliği Gösterenler (Bağdaşık Yapılar) Yanlış Etiketlemeler:
Birtakım zarfların ise sözcük türü tanımlıkları kullanımlarıyla örtüşmemektedir. Örneğin, acaba, acep, açıkçası, âdeta, adına, aksine, anlaşılan, aracılığıyla, asıl, atfen, aynı zamanda, ayrıyeten, ayriyeten, azade vb. zarflar daha çok bağlama-kuvvetlendirme-soru işleviyle söz diziminde yer almaktadır. Zarfların bilinen tanımlık özellikleri bu sözlükbirimler için geçerli değildir (bk. Tablo 1).
Özel Alanlarla İlgili ve/ya Alıntı Olanlar:
Genel dilde kullanımı olmayan herhangi bir bilim dalına ait ya da özel bir alanla ilgili ve zarf tanımlı sözlükbirimler de genelde derlemde rastlanmayan sözlükbirimlerdir. Bu sözlükbirimlerin genel özellikleri alıntı sözlükbirimler olmalarıdır. Bunlar: antagonist, antrparantez, appassionato, allegretto, allegro, andante, andantino, animato, alakart, affettuoso, agitato, accelerando, asaleten, anal, argolu, argosuz gibi müzik, edebiyat, felsefe, siyaset vb. alanlarda kullanılan sözlükbirimlerdir (bk. Tablo 1).
Argo ve Halk Dilinden Alınanlar:
Birtakım zarf tanımlı sözlükbirimler ise argoda ve halk dilinde kullanılan sözlükbirimlerdir.
Bu sözlükbirimler: acep, afra tafra, ahmakça, alarga, alaz alaz, alık salık, anaca, ansız, apazlama, apul apul, ara yerde, aralıkta, ardın ardın, aşırı taşırı, avanakça, ayık, ayrıksız, azca vb.’dir (bk. Tablo 1).
Kullanım Örneğine Rastlanmayanlar ya da Sözcük Türü Bulanıklığı Olanlar:
Birtakım sözlükbirimler ise sözcük türü olarak zarf olmaktan çok isim ve sıfat ağırlıklı bir kullanıma sahiptir. Diğer yandan derlemin niteliği de bu tip sözlükbirimlere rastlamamamızda etken olabilmektedir. Bu nedenle derlem iyi örneklenmiş, dili temsil gücü olan bir derlem olmalıdır.
Derlem-denetiminde bu kullanımları da belirlemek ve sözlükleştirmek gerekmektedir. GTS’de bu tip kullanıma sahip olan sözlükbirimler ise, acı tatlı, adam adama, adam yokluğunda, adamcasına, adetçe, adı üstünde, adımbaşı, ahlaksızca, akşam saati, akşamlı sabahlı, akşamlık, akşamlık sabahlık, alkolsüz, araba araba, art elden, artistçe, aşağılı yukarılı, aylık, ayrıcasız’ dır (bk. Tablo 1).

Tablo 1 Güncel Türkçe Sözlük’te ‘Zarf’ Olarak Tanımlı Sözlükbirimlerin Derlem-denetimi Sonuçları.

Benzer görünümler fiiller için de geçerlidir. Projenin amaçlarını yukarıdaki uygulama çerçevesinde TTSV’de fiil olarak tanımlı yaklaşık 6.400 madde başı ve madde içi sözlükbirimi temsil gücü yüksek ve gerçek zamanlı bir derlemden tüm yönleriyle denetlenmesi ve derlenmesi ile elde edilen sonuçların yayımlanmasına bağlı olarak şu şekilde sıralayabiliriz:
1. MBİF’yi temsil gücü (representativeness) yüksek bir derlemden (corpus) sıklık temelli olarak belirlemek.
2. TTSV’de MBİF’yi yazımsal özellikleri açısından tam olarak belirlemek.
3. MBİF’nin madde başı açıklamalarda yer alan eksikliklerini gidermek.
4. MBİF’de var olan sözlük tanıklarının yetersizliklerini gidermek.
5. Sözcük türü olarak MBİF’yi tam olarak etiketlemek.
6. Özel amaçlı sözlük çalışmaları için (dil öğretimi, eşdizimlilik, eş ve yakın anlamlılık, karşıt anlamlılık vb.) gerçek zamanlı sözlükbirimsel malzemeyi bu anlamda derlemek.
7. Morfolojik olarak MBİF’yi gerçek zamanlı olarak derlemek.
8. Tüm bu süreçlerin sonunda ortaya çıkan sözlükbilimsel malzemeyi devam çalışmalarında diğer araştırmacıların kullanımına sanal ortamda sunarak “Türkiye Türkçesinde Fiillerin Derlem Tabanlı Sözlüğü”nü ortaya koymak ve sözlükbilim çalışmalarına bu anlamda katkıda bulunmak.