hate_speech_dz باللهجة الجزائرية — تصنيف النصوص

هذا النموذج مبني على hate_speech_dz
وتمت إعادة تدريبه على بيانات باللهجة الجزائرية لاكتشاف وتصنيف خطاب الكراهية ضمن مجال تصنيف النصوص.


🧠 تفاصيل التدريب

  • النموذج الأساسي: alger-ia/dziribert
  • عدد الحقبات (epochs): 65
  • اللغة: اللهجة الجزائرية
  • طريقة التوازن: RandomOverSampler
  • خسارة التدريب: CrossEntropyLoss

📊 نتائج التقييم

المقياس القيمة
Accuracy 0.8859
Precision 0.9547
Recall 0.8104
F1-Score 0.8766
ROC-AUC 0.9231

💬 مثال الاستخدام

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "safiati/hate_speech_dz_balanced_full"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

text = "راك غالط بزاف"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
outputs = model(**inputs).logits
pred = torch.argmax(outputs, dim=1).item()

print("كراهية" if pred == 1 else "كلام عادي")
Downloads last month
1
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for safiati/hate_speech_dz

Base model

alger-ia/dziribert
Finetuned
(4)
this model

Space using safiati/hate_speech_dz 1