Amaç: Derlem (T-BDLD) Türkçe Bağlama Duyarlı Lematizasyon Derlemi ile GTS sözlük karşılaştırmasının güncel özetlerini bilimsel rapor biçiminde sunmak.
İki ana rapor:
- Yeni Sözcükler Raporu: Derlemde geçen ancak GTS'te madde başı olmayan aday sözcüklerin sayısal ve kategorisel dağılımı (söz türü, tek/çok sözcüklü yapı, alan, sıklık, anlamlılık ve bağlamlaşma).
- Yeni Anlam Keşifleri Raporu: GTS'te madde başı olan ama derlemde yeni bağlamlarda görünen sözcükler ile GTS'te hiç olmayan yeni terim adayları; kategori, güven düzeyi, karar türü ve kanıt geçişi bazlı analizler.
🆕 Alan/Kategori Dağılımı + Alanlara Göre Sözcükler (Yeni Sözcükler raporunda)
Yeni sözcüklerin alan etiketleri, derlem bağlamları ve alan/metin türü dağılımı sinyalleri birlikte değerlendirilerek hazırlanır. Alanlar, sözcüğün sözlükteki ontolojik sınıfını değil, derlemde baskınlaştığı kullanım çevresini gösterir.
- Bar grafiği: Her alanın birincil etiket sayısını gösterir. Bir bara tıklayın → o alandaki tüm sözcükler aşağıdaki tabloda açılır.
- Açılır liste: Alanı doğrudan seçin (her alan adının yanında sözcük sayısı görünür).
- Arama kutusu: Seçili alandaki sözcükler arasında metin arar.
- Sıralama: Sıklık (azalan/artan), Alfabetik, Güven düzeyi (azalan).
- Tablo kolonları: sözcük, söz türü, derlem sıklığı, güven (renkli rozet), anlamlılık, bağlamlaşma indeksi, ikincil alan etiketleri.
- Sayfalama: 50'şer kayıt; büyük alanlarda sayfalar arası gezinilebilir.
Güven rozetleri:
≥ 0.90 yüksek
≥ 0.70 orta
< 0.70 düşük
İkincil etiketler: bir sözcüğün birden çok alana ait olabileceği durumlarda gösterilir (örn. aile sosyolojisi → birincil: Aile ve Toplumsal Yaşam, ikincil: Sosyoloji ve Psikoloji).
📊 Diğer ana grafikler
- Söz Türü Dağılımı: ad / fiil / sıfat / zarf vb. doughnut grafiği.
- Alanlara Göre Sözcükler: alan seçimine göre sözcük listesi, sıklık, güven, anlamlılık ve bağlamlaşma bilgisi.
- Bulguların Yorumu: oranlar, baskın söz türleri, alan yoğunlaşması ve bağlamlaşma düzeyine göre otomatik açıklama metni.
- 🤖 Otomatik İçgörüler: Canlı veride eşikler aşıldığında tetiklenen kural-tabanlı yorum cümleleri (editör müdahalesi yok; veri değişince içgörü de değişir).
⟳ Raporlar güncel analiz çıktılarından beslenir. Sistem performans için cache kullanabilir; analiz tamamlandığında cache yenilenir ve sayfa yeni sonuçları gösterir.