12 11

yyx

RuggingHace

AI & ML interests

None yet

Recent Activity

upvoted an article 16 days ago

Custom Kernels for All from Codex and Claude

liked a model 16 days ago

MiniMaxAI/MiniMax-M2.5

upvoted an article 26 days ago

Training Design for Text-to-Image Models: Lessons from Ablations

View all activity

Organizations

None yet

liked a model 16 days ago

MiniMaxAI/MiniMax-M2.5

Text Generation • 229B • Updated 14 days ago • 324k • • 1.06k

liked a model 2 months ago

MiniMaxAI/MiniMax-M2.1

Text Generation • 229B • Updated 17 days ago • 76.1k • • 1.26k

liked a Space 4 months ago

Scaling FineWeb to 1000+ languages: Step 1: finding signal in 100s of evaluation tasks

📝

Evaluate multilingual models using FineTasks

liked a model 4 months ago

bigscience/bloom

Text Generation • 176B • Updated Jul 28, 2023 • 4.5k • 4.99k

liked 2 Spaces 4 months ago

FineWeb: decanting the web for the finest text data at scale

🍷

1.3k

Generate a curated web‑text dataset for LLM training

The Smol Training Playbook

📚

3.02k

The secrets to building world-class LLMs

liked a model 4 months ago

MiniMaxAI/MiniMax-M2

Text Generation • 229B • Updated Dec 23, 2025 • 413k • • 1.49k

liked a model 7 months ago

RedHatAI/quantization

Updated Jul 27, 2025 • 6

liked a Space 11 months ago

The Ultra-Scale Playbook

🌌

3.72k

The ultimate guide to training LLM on large GPU Clusters

liked a model 12 months ago

deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

Text Generation • 33B • Updated Feb 24, 2025 • 835k • • 1.53k

liked a model about 2 years ago

meta-llama/Llama-2-70b

Text Generation • Updated Apr 17, 2024 • 8 • 538

yyx