hate_speech_dz باللهجة الجزائرية — تصنيف النصوص
هذا النموذج مبني على hate_speech_dz
وتمت إعادة تدريبه على بيانات باللهجة الجزائرية لاكتشاف وتصنيف خطاب الكراهية ضمن مجال تصنيف النصوص.
🧠 تفاصيل التدريب
- النموذج الأساسي: alger-ia/dziribert
- عدد الحقبات (epochs): 65
- اللغة: اللهجة الجزائرية
- طريقة التوازن: RandomOverSampler
- خسارة التدريب: CrossEntropyLoss
📊 نتائج التقييم
| المقياس | القيمة |
|---|---|
| Accuracy | 0.8859 |
| Precision | 0.9547 |
| Recall | 0.8104 |
| F1-Score | 0.8766 |
| ROC-AUC | 0.9231 |
💬 مثال الاستخدام
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
model_name = "safiati/hate_speech_dz_balanced_full"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
text = "راك غالط بزاف"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
outputs = model(**inputs).logits
pred = torch.argmax(outputs, dim=1).item()
print("كراهية" if pred == 1 else "كلام عادي")
- Downloads last month
- 1
Model tree for safiati/hate_speech_dz
Base model
alger-ia/dziribert