Ara ara çeşitli universitelerden Zemberek kullanımına ilişkin sorular yöneltiliyor. Anladığımız kadarı ile özellikle linsans ve bazen yüksek lisans tezlerinde ve araştırmalarda Zemberek kullanılıyor. Bu gerçekten güzel bir şey. Bunun için Google Scholar'da bir araştırma yapınca epey bir makale bağlantısı ile karşılaştık. Bunlardan bir kısmı şu şekilde (Bağlantılar genellikle pdf):
Turkalator, A Suite of Tools for Augmenting English-to-Turkish Statistical Machine Translation
Author Identification for Turkish Texts
Aşağıdaki makale ilginç. TDK'nin destek olmaması nedeni ile TDK web sitesinden bilgileri nasıl çektikleri anlatılıyor.
Semantic categorization of Turkish language elements
A New Feature Extraction Method for Text Classification
Turkish Document Classification Using Shorter Roots
Turkish keyphrase extraction using KEA
Advanced Information Extraction with n-gram based LSI
Bu makalelerin büyük kısmında kütüphane kök bulucu (stemmer) olarak kullanılmış. Bir kısmında işe yapısal çözümleyici sonuçlarından yararlanılmış. Yöneltilen sorulardan birisi de makalelerde Zemberek'i referans olarak kullanmak için bir yayının olup olmadığı yönünde. Bundan bir kaç sene önce yazdığımız bir makale kabul edilmediğinden sadece proje sayfasının referans verilmesi yeterli olacaktır.
Yukarıdaki makalelerden başka özellikle lisans bitirme projelerinde Zemberek'in kullanıldığını tahmin ediyorum. Eğer bağlantı gönderenler olursa memnun oluruz.