TÜRKÇE’NİN VERİ TABANI HAZIRLANIYOR

Merhaba. Genel ağ adresi www.tudd.org.tr olan bir projenin ayrıntılarını, MEÜ Fen-Edebiyat Fakültesi İngiliz Dili ve Edebiyatı Bölüm Başkanı Prof. Dr. Mustafa Aksan’ın anlatımıyla sizlere aktarmak istiyorum.

Mersin Üniversitesinde (MEÜ) TÜBİTAK desteğiyle hazırlanan ’’Türkçe Ulusal Derlemi’’ (Derlem : yapılandırılmış metinler bütünüdür)projesiyle 1990-2008 yıllarında kullanılan ve 50 milyon sözcüğü kapsayacak Türkçenin ne zaman, nasıl kullanıldığını gösteren örneklem hazırlanıyor.

MEÜ Fen-Edebiyat Fakültesi İngiliz Dili ve Edebiyatı Bölüm Başkanı Prof. Dr. Mustafa Aksan, aralarında şu an kullanımı tükenen dillerin de bulunduğu dünya genelindeki 180 dilin derleminin bulunduğunu ancak çok köklü bir geçmişe sahip olan Türkçede bu konuda eksiklik hissedildiğini söyledi.

Orta Doğu Teknik Üniversitesi’nce (ODTÜ) geçmiş yıllarda hazırlanan, 2 milyon sözcüğü kapsayan derlem çalışmasının bulunduğunu ancak bunun da kullanılan teknik sistem ve sözcük sayısının yetersiz olması nedeniyle ihtiyaca cevap veremediğini ifade eden Aksan, ’’Bu eksiklikten hareketle derleme çalışmasına başlamak istedik ve TÜBİTAK’tan destek talep ettik. Geçen yılın ekim ayında başlattığımız çalışmada ise önemli aşama kaydettik’’ dedi.

Çalışmaların öğretim görevlileri, araştırma görevlileri ve öğrencilerin de bulunduğu 100 kişilik ekip tarafından yoğun olarak sürdürüldüğünü belirten Aksan, ’’Yaptığımız çalışma, 1990 yılından bugüne Türkçenin kullanıldığı tüm yerlerde farklı metin türlerinde nasıl ele alındığını gösterecek. Aslında çalışmamız bir anlamda Türkçenin veri tabanı olacak. 2011 yılında tamamlanması planlanan çalışma, çok değişik amaçlarla kullanılabilecek metinler bütünüdür’’ diye konuştu.

Çalışma sayesinde Türkçenin kim tarafından, ne zaman ve nasıl kullanıldığına dair istatistiksel bilgiye ulaşılabileceğini vurgulayan Aksan, şunları söyledi:

’’Çalışmayla herhangi bir sözcüğün 1990 yılında nasıl kullanıldığıyla günümüzdeki kullanımı karşılaştırılabilecek. Öte yandan, mesela sevgi sözcüğünün kadın veya erkek yazarlar arasında nasıl bir anlam farkıyla kullanıldığını gözler önüne sereceğiz. Ayrıca çalışma, hangi sözcüğün bilimsel, basın ve edebi metinler başta olmak üzere hangi metin türünde daha sık kullanıldığını da gözler önüne serecek.’’

’1.500 KİTAP, 9 GAZETE İNCELENECEK’’

Eskiden sıkça tercih edilen ancak günümüzde kullanılırlığını yitiren sözcüklerle dilimizde artık daha sık kullanılan sözcüklerin tespitini de kolaylaştıracak proje kapsamında 1.500 kitap ile 9 ulusal gazetedeki haberlerin inceleneceğine dikkati çeken Aksan, şunları kaydetti:

’’Günümüzde kullandığımız sözlüklerde zaman zaman aynı anlama gelen ancak farklı yerlerde gözümüze çarpan kelimelerle karşılaşabiliyoruz. Mesela daralmak ve darlaşmak. Şu an herhangi bir metin hazırlarken hangi sözcüğü kullanmamızın doğru olacağına karar vermek güç olabiliyor. Ancak çalışmamızın ardından hazırlanabilecek bir sözlükle daralmak sözcüğünün nerede, ne sıklıkla kullanıldığını görüp buna göre metinlerde kullanabileceğiz. Yani çalışmamız bir anlamda, hazırlanmak istenen yeni sözlüğe de bilimsel veri niteliği taşıyacak.’’

Kurulduktan sonra herkesçe kullanılabilir niteliğe sahip olacak sistemin araştırmacılara önemli bir kaynak ve zaman tasarrufu sağlayacağına işaret eden Aksan, şöyle konuştu:

’’Elektronik arşiv oluşturma, internet ve yazılım güvenliği sağlama gibi toplumsal faydalarının yanı sıra bilimsel araştırmalar için temel veri tabanı olacak. Toplum bilimleri ve bilişim bilimlerinin yanı sıra uygulamalı alanlar için hem bilimsel araştırma hem de ürün geliştirme sürelerini kısaltan ve etkilerini artıran bir kaynak olacak. Herhangi bir metin hazırlayan vatandaş veya araştırmacı hangi sözcüğün hangi metin türünde daha çok kullanıldığını öğrenebilecek, metin çözümlemesi sırasında sözcüklerin kullanım örneklerine bakarak yazarın bakış açısına veya metnin yansıttığı görüşe dair bilgi edinebilecek.’’

’’DİĞER DERLEMLERDEN FARKLI OLACAK’’

İlk 6 aylık dönemi tamamlanan çalışmada 15 milyon sözcüğün bilgisayara taşındığını ifade eden Prof. Dr. Aksan, 2011 yılında tamamlanacak projenin hedeflerini tutturarak ilerlediğini bildirdi.

Çalışmalarının diğer dillerde kullanılan derlemlerden farklı olacağına işaret eden Aksan, ’’Diğer birçok derlem, ücretli olarak genellikle bilim insanları tarafından kullanılabiliyor. Ancak bizimki internet üzerinden ücretsiz olarak kullanıcı dostu bir arayüzle kullanılabilecek. Yani dilimizi araştıran bilim insanı sistemi kullanırken sokaktaki vatandaş da dilimizin ayrıntılarına ulaşabilecek’’ dedi.

Prof. Dr. Aksan, söz konusu projeyi tamamladıktan sonra ikinci etabını da başlatacaklarını vurgulayarak, ikinci etabında da 1980-1990 yıllarının ele alınacağı araştırmayla Türkçenin güncelliğinin saptanacağını kaydetti.

Aksan, sözcüklerin bilgisayar ortamına taşınması sırasında gazete örnekleri başta olmak üzere arşiv sıkıntısı çektiklerini, kişisel veya kamusal arşivi olanlardan destek beklediklerini sözlerine ekledi.

Türkçe’ye gönül vermiş birisi olarak ben kendilerine teşekkür ediyorum. Umarım çalışmalarının devamı gelir ve gerekli ilgi ve desteği bulurlar. Saygılarımla.

Bu yazı toplam 962 defa okunmuştur