1 8 65

Vadim Smolyakov

vsmolyakov

https://vsmolyakov.github.io/

AI & ML interests

Machine Learning Engineer @ Microsoft

Recent Activity

upvoted a paper 2 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

liked a model 2 months ago

moonshotai/Kimi-K2-Thinking

liked a model 2 months ago

MiniMaxAI/MiniMax-M2

View all activity

Organizations

None yet

upvoted a paper 2 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 11 days ago • 194

liked 2 models 2 months ago

moonshotai/Kimi-K2-Thinking

Text Generation • Updated Nov 8, 2025 • 216k • • 1.62k

MiniMaxAI/MiniMax-M2

Text Generation • 229B • Updated 27 days ago • 135k • • 1.45k

liked a model 3 months ago

zeroentropy/zerank-1

Text Ranking • 4B • Updated Nov 19, 2025 • 2.56k • 73

liked a model 4 months ago

zai-org/GLM-4.5

Text Generation • 358B • Updated Aug 11, 2025 • 19.6k • • 1.39k

liked a dataset 4 months ago

openai/gdpval

Viewer • Updated Sep 25, 2025 • 220 • 22.6k • 448

liked 2 models 5 months ago

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 3.07M • • 4.35k

gghfez/Mistral-Small-3.2-24B-Instruct-hf-AWQ

Text Generation • 24B • Updated Jun 25, 2025 • 246 • 4

liked 2 datasets 6 months ago

Salesforce/CRMArenaPro

Viewer • Updated Jul 9, 2025 • 8.61k • 409 • 15

Salesforce/CRMArena

Viewer • Updated Jun 18, 2025 • 1.19k • 247 • 8

upvoted an article 8 months ago

Article

The Large Language Model Course

Jan 16, 2025

•

217

liked 3 models 9 months ago

liked a dataset 9 months ago

allenai/reward-bench

Viewer • Updated Sep 9, 2024 • 8.11k • 5.32k • 104

liked 4 models 10 months ago

weqweasdas/RM-Mistral-7B

Text Classification • 7B • Updated Mar 31, 2024 • 2.39k • 24

RLHFlow/ArmoRM-Llama3-8B-v0.1

Text Classification • 8B • Updated Sep 23, 2024 • 9.68k • 184

mistralai/Mistral-Small-3.1-24B-Instruct-2503

24B • Updated 28 days ago • 75.6k • 1.34k

Qwen/QwQ-32B

Text Generation • 33B • Updated Mar 11, 2025 • 96k • • 2.88k

liked a Space 11 months ago

The Ultra-Scale Playbook

🌌

3.65k

The ultimate guide to training LLM on large GPU Clusters