TÜRKİYE TÜRKÇESİNDE FİİLLERİN DERLEM TABANLI SÖZLÜĞÜ

English

109K516-TÜBİTAK-SOBAG
TÜRKİYE TÜRKÇESİ SÖZVARLIĞINDA FİİLLERİN DERLEM DENETİMİ VE DERLEM TABANLI SÖZLÜĞÜ

ÖZET

Bugün sözlükbilim (lexicology) uygulamaları gelişen bilişim teknolojilerine koşut olarak daha fazla sözcükbirimi daha hızlı ve güvenilir bir biçimde işleyecek yetkinliğe ulaşmıştır. Bunda sözlükbilimin söz konusu sözcükbirimleri ayrıntılandırmada derlem dilbilimin (corpus linguistics) ilke ve yöntemlerinden yararlanıyor olması önemli bir etkendir. Öyle ki, bugün sözlükbilim ve derlem dilbilim birbiriyle iç içe geçmiş iki ayrı dilbilim dalı durumundadır.

Sözlükbilimin ilke ve yöntemleri açısından Türkiye Türkçesinin Söz Varlığını (TTSV) barındıran sözlükler (bugüne kadar yayınlanmış olan) değerlendirildiğinde bu sözlüklerin; sözlükbirimlerin yazımsallığı, madde başı ve içi açıklamalarda eksikliklerin varlığı, sözlükbirim tanıklarının yetersizliği ve birçok sözlükbirimin sözlükte tanıksız yer alması, sözcük türlerinin etiketlenmesindeki eksiklikler, sözlük malzemesinin gerçek zamanlı olmaması vb. nedenlerle ‘genel amaçlı, ansiklopedik’ sözlükler oldukları görülür.

Bu durumun nedeni Türkçe için henüz nitelikli, kapsamlı ve standartlara uygun bir derlemin oluşturulamamış olmasıdır. Doğal olarak, sözlük çalışmalarımız da derlem tabanlı (corpus based) olmaktan uzaktır. Bu açıdan sözlükbilim çalışmalarımızın derlem tabanlı uygulamaların sonuçlarını esas alan, sözlükbirimlerin ve anlamsal sıklıklarının göz önüne alındığı, gerçek zamanlı, kullanıcı temelli anlayıştan uzak bir çerçevede olduğu gözlemlenmektedir.

Bu çalışmanın amacı, bugüne kadar sözlüklerde derlenen Madde Başı ve İçi Fiilleri (MBİF) nitelikli, kapsamlı ve standartlara uygun olarak hazırlanmış bir derlemden yazımsallıkları, madde başı açıklamaları, tanıkları, sözcük türü olarak etiketleri açısından gerçek zamanlı olarak denetlemek ve sözlük girdilerimizi bu derlemden elde edilen veriler ışığında yeniden düzenlemektir.

Bu projeyle ulaşılması beklenen sonuçlar şöyle sıralanabilir:

1. MBİF’yi temsil gücü (representativeness) yüksek bir derlemden (corpus) sıklık temelli olarak belirlemek.
2. TTSV’de MBİF’yi yazımsal özellikleri açısından tam olarak belirlemek.
3. MBF’nin madde içi açıklamalarında yer alan eksiklikleri gidermek.
4. MBİF’de var olan sözlük tanıklarının yetersizliklerini gidermek.
5. Sözcük türü olarak MBİF’yi tam olarak etiketlemek.
6. Özel amaçlı sözlük çalışmaları için (dil öğretimi, eşdizimlilik, eş ve yakın anlamlılık, karşıt anlamlılık vb.) gerçek zamanlı sözlükbirimsel malzemeyi bu anlamda derlemek.
7. Morfolojik olarak MBİF’yi gerçek zamanlı olarak derlemek.
8. Tüm bu süreçlerin sonunda ortaya çıkan sözlükbilimsel malzemeyi devam çalışmalarında diğer araştırmacıların kullanımına sanal ortamda sunarak “Türkiye Türkçesinde Fiillerin Derlem Tabanlı Sözlüğü”nü ortaya koymak ve sözlükbilim çalışmalarına bu anlamda katkıda bulunmak.

Proje, temelde derlemin oluşturulması, TTSV’de tanımlı yaklaşık 6.400 MBİF’nin oluşturulan derlemden tüm yönleriyle derlenmesi, elde edilen sonuçların yayımlanması ve çalışmanın sonuçlanması olmak üzere üç aşamadan oluşmaktadır.

Birinci aşamada, Türkiye Türkçenin yazın diline ait çeşitli türlerde metin parçaları [5846 numaralı Fikir ve Sanat Eserleri Kanunu’nun Madde 35 (1-4 Fıkralar), Madde 36, Madde 37.’de belirtilen hükümler çerçevesinde] (http://www.mevzuat.adalet.gov.tr/html/957.html) ile internet ortamından seçtiğimiz toplam 30 milyon ‘söz’lük konu duyarlı bir derlem, amacımıza uygun olarak proje için geliştirilecek yazılımlar aracılığıyla sayısallaştırılacak, bir veri tabanı uygulamasıyla sözlükbirimsel olarak derlenebilir hâle getirilecektir. İkinci aşamada, TTSV’de fiiller söz konusu derlemden denetlenerek derlenecektir. Üçüncü aşama ise elde edilen sonuçlar “Türkiye Türkçesinde Fillerin Derlem Tabanlı Sözlüğü” olarak sanal ortamda yayımlanacaktır.