Vadim Smolyakov's picture

Vadim Smolyakov

vsmolyakov

·

https://vsmolyakov.github.io/

AI & ML interests

Machine Learning Engineer @ Microsoft

Recent Activity

upvoted a paper 1 day ago

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

upvoted a paper 2 days ago

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

liked a dataset 4 days ago

Agent-Ark/Toucan-1.5M

View all activity

Organizations

None yet

upvoted a paper 1 day ago

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Paper • 2601.08763 • Published 11 days ago • 140

upvoted a paper 2 days ago

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published 13 days ago • 206

upvoted a paper 4 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 16 days ago • 204

upvoted an article 8 months ago

Article

The Large Language Model Course

Jan 16, 2025

•

218

upvoted an article over 1 year ago

Article

SemScore: Evaluating LLMs with Semantic Similarity

Mar 9, 2024

•

15

upvoted a collection almost 2 years ago

Clinical Language Models

Some of my favorite clinical language models • 25 items • Updated Dec 1, 2023 • 16