In a Training Loop 🔄

3 21 17

weiliu

thinkwee

https://thinkwee.top/about/

AI & ML interests

LLM reasoning, agents

Recent Activity

updated a Space about 7 hours ago

thinkwee/DDR_Bench

upvoted a paper about 16 hours ago

Hunt Instead of Wait: Evaluating Deep Data Research on Large Language Models

submitted a paper about 16 hours ago

Hunt Instead of Wait: Evaluating Deep Data Research on Large Language Models

View all activity

Organizations

None yet

updated a Space about 7 hours ago

DDR Bench

🚀

Deep Data Research Benchmark

upvoted a paper about 16 hours ago

Hunt Instead of Wait: Evaluating Deep Data Research on Large Language Models

Paper • 2602.02039 • Published 2 days ago • 4

submitted a paper to Daily Papers about 16 hours ago

Hunt Instead of Wait: Evaluating Deep Data Research on Large Language Models

Paper • 2602.02039 • Published 2 days ago • 4

updated a collection about 19 hours ago

DDRBench

Collection

Deep Data Research Benchmark • 5 items • Updated about 19 hours ago

liked a Space about 19 hours ago

DDR Bench

🚀

Deep Data Research Benchmark

updated a dataset about 21 hours ago

thinkwee/DDRBench_10K

Viewer • Updated about 21 hours ago • 3.16M • 35

published a dataset about 21 hours ago

thinkwee/DDRBench_10K

Viewer • Updated about 21 hours ago • 3.16M • 35

updated a collection about 22 hours ago

DDRBench

Collection

Deep Data Research Benchmark • 5 items • Updated about 19 hours ago

published a Space about 22 hours ago

DDR Bench

🚀

Deep Data Research Benchmark

published a dataset 1 day ago

thinkwee/DDRBench_10K_trajectory

Viewer • Updated about 21 hours ago • 50.9k • 21

updated a dataset 1 day ago

thinkwee/DDRBench_10K_trajectory

Viewer • Updated about 21 hours ago • 50.9k • 21

updated a collection 1 day ago

DDRBench

Collection

Deep Data Research Benchmark • 5 items • Updated about 19 hours ago

upvoted a paper 2 days ago

Chain Of Thought Compression: A Theoritical Analysis

Paper • 2601.21576 • Published 6 days ago • 13

liked a Space 8 days ago

BibGuard

🛡

Check and improve your academic bibliography and LaTeX documents

updated a Space 11 days ago

BibGuard

🛡

Check and improve your academic bibliography and LaTeX documents

published a Space 13 days ago

BibGuard

🛡

Check and improve your academic bibliography and LaTeX documents

upvoted a paper 15 days ago

Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs

Paper • 2601.11061 • Published 19 days ago • 7

upvoted a paper 23 days ago

An Empirical Study on Preference Tuning Generalization and Diversity Under Domain Shift

Paper • 2601.05882 • Published 26 days ago • 20

weiliu

AI & ML interests

Recent Activity

Organizations

thinkwee's activity

DDR Bench

DDR Bench

DDR Bench

BibGuard

BibGuard

BibGuard