Sıfırdan Eğitilmiş 258M Parametre Türkçe LLM: Marul V7

Posted by Marul_AI@reddit | LocalLLaMA | View on Reddit | 3 comments

Selam,

Bir süredir üzerinde çalıştığım bir projeyi paylaşmak istiyorum. Sıfırdan geliştirdiğim bir Türkçe dil modeli var: Marul V7

Model tamamen bağımsız şekilde eğitildi. Yaklaşık 258M parametreye sahip ve eğitim sürecinde hazır LLaMA benzeri mimariler kullanılmadı. Kendi tokenizer yapısını ve kendi model mimarisini geliştirdim. Pretrain aşamasında tamamen Türkçe ve temiz bir dataset kullanıldı, ardından instruction tuning yapıldı.

Şu an model:

Çok büyük bir model değil ve haliyle GPT seviyesinde bir şey beklemek doğru olmaz, ancak Türkçe odaklı sıfırdan bir LLM geliştirme açısından bir başlangıç noktası olduğunu düşünüyorum.

Model şu an web üzerinden erişilebilir durumda: marulai.com.tr
Ayrıca Android uygulaması olarak da Play Store’da “Marul AI” adıyla yayınlandı (link: marulai.com.tr/app.html ).

İlgilenen olursa geri bildirimlere açığım. Özellikle modelin zayıf olduğu yerleri görmek benim için daha önemli şu an.