Hootsuite, Sprout Social, Brandwatch — üçü de Türkçe yorumları önce İngilizce'ye çevirip analiz eder. Bu pipeline'da %15-30 anlam kaybı oluşur. Bu kayıp en çok üç yerde ortaya çıkar: ironi, argo ve lehçe.
Örnek: 'Helal olsun valla, çok beklemiştim siparişi. Süper işiniz.'
GPT-4 + İngilizce sentiment model: %91 olumlu (false positive). Bizim TR-NLP modeli: %87 olumsuz (true negative, ironi tespit edildi).
Model mimarisi (özet)
- Base: Türkçe BERT (220M parametre, 30B token TR corpus)
- Domain adaptation: 8M yorumluk Türkiye e-ticaret + sosyal medya dataset'i
- İroni başlık özel: 120K manuel etiketli sarkastik yorum
- Final fine-tune: müşteri özelinde marka diline kalibrasyon
Neden bu kadar önemli?
Türkiye'de tüketici öfkesi sıklıkla ironiyle ifade ediliyor. 'Süper iş' ifadesi karşımıza olumlu sentiment olarak değil, çoğunlukla şikayet olarak çıkıyor. Yabancı modeller bunu kaçırır; biz yakalarız. Müşterilerimizin %62 kriz önleme oranı bu mimari farktan geliyor.


