14 24 6

Gaotang Li

gaotang

https://gaotangli.github.io/

GaotangLi

AI & ML interests

None yet

Recent Activity

updated a dataset 13 days ago

gaotang/knowledge_memorization_openbookqa

published a dataset 13 days ago

gaotang/knowledge_memorization_openbookqa

updated a dataset 13 days ago

gaotang/mix_magpie_evol_instruct_140k

View all activity

Organizations

None yet

updated a dataset 13 days ago

gaotang/knowledge_memorization_openbookqa

Updated 13 days ago • 36

published a dataset 13 days ago

gaotang/knowledge_memorization_openbookqa

Updated 13 days ago • 36

updated a dataset 13 days ago

gaotang/mix_magpie_evol_instruct_140k

Viewer • Updated 13 days ago • 140k • 38

published a dataset 13 days ago

gaotang/mix_magpie_evol_instruct_140k

Viewer • Updated 13 days ago • 140k • 38

updated a collection 13 days ago

Beyond-Log-Likelihood

Collection

6 items • Updated 13 days ago • 2

updated a dataset 13 days ago

gaotang/coder_sft

Viewer • Updated 13 days ago • 75.5k • 45

published a dataset 13 days ago

gaotang/coder_sft

Viewer • Updated 13 days ago • 75.5k • 45

updated a dataset 13 days ago

gaotang/low_resource_language

Updated 13 days ago • 36

published a dataset 13 days ago

gaotang/low_resource_language

Updated 13 days ago • 36

commented a paper 18 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published about 1 month ago • 78 •

upvoted a paper 22 days ago

Code as Agent Harness

Paper • 2605.18747 • Published 24 days ago • 215

authored a paper 27 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published about 1 month ago • 78

upvoted a paper 28 days ago

Useful Memories Become Faulty When Continuously Updated by LLMs

Paper • 2605.12978 • Published 29 days ago • 18

upvoted 2 papers 29 days ago

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Paper • 2605.05242 • Published May 3 • 123

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published about 1 month ago • 78

submitted a paper to Daily Papers 29 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published about 1 month ago • 78

upvoted 2 papers about 1 month ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published Apr 30 • 218

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published Apr 28 • 277

liked a dataset about 2 months ago

YennNing/MC-Search

Viewer • Updated Feb 22 • 3.33k • 818 • 28

Gaotang Li

AI & ML interests

Recent Activity

Organizations

gaotang's activity