16 16 24

Peng Shangpin

psp-dada

https://github.com/pspdada

AI & ML interests

Multimodal Large Language Models, Preference Optimization Algorithm, Reinforcement Learning

Recent Activity

updated a dataset 6 days ago

psp-dada/ChartArena

upvoted a paper 8 days ago

Safe, or Simply Incapable? Rethinking Safety Evaluation for Phone-Use Agents

upvoted a paper 8 days ago

Chronicles-OCR: A Cross-Temporal Perception Benchmark for the Evolutionary Trajectory of Chinese Characters

View all activity

Organizations

None yet

Collections 2

Papers 8

models 16

datasets 3

psp-dada/ChartArena

Viewer • Updated 6 days ago • 2.38k • 1.49k

psp-dada/Uni-DPO

Preview • Updated Feb 22 • 95 • 1

psp-dada/SENTINEL

Updated Feb 11 • 108 • 2

Peng Shangpin

AI & ML interests

Recent Activity

Organizations

Collections 2

Uni-DPO: A Unified Paradigm for Dynamic Preference Optimization of LLMs

psp-dada/Uni-DPO

psp-dada/Qwen2.5-7B-Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-GPT-4o

Mitigating Object Hallucinations via Sentence-Level Early Intervention

psp-dada/SENTINEL

psp-dada/LLaVA-v1.5-7B-SENTINEL

psp-dada/LLaVA-v1.5-13B-SENTINEL

Uni-DPO: A Unified Paradigm for Dynamic Preference Optimization of LLMs

psp-dada/Uni-DPO

psp-dada/Qwen2.5-7B-Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-GPT-4o

Mitigating Object Hallucinations via Sentence-Level Early Intervention

psp-dada/SENTINEL

psp-dada/LLaVA-v1.5-7B-SENTINEL

psp-dada/LLaVA-v1.5-13B-SENTINEL

Papers 8

models 16

psp-dada/Qwen2.5-Math-7B-Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO-v2-GPT-4

psp-dada/Gemma2-9B-IT-Uni-DPO

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO-v2-Qwen

psp-dada/Llama-3-8B-Base-SFT-Uni-DPO

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-ArmoRM

psp-dada/Llama-3-8B-Instruct-Uni-DPO-v2-GPT-4o

psp-dada/Qwen2.5-7B-Uni-DPO

psp-dada/Qwen2.5-VL-7B-Instruct-SENTINEL

datasets 3

psp-dada/ChartArena

psp-dada/Uni-DPO

psp-dada/SENTINEL

Peng Shangpin

AI & ML interests

Recent Activity

Organizations

Collections 2

Papers 8

models 16 Sort: Recently updated

datasets 3 Sort: Recently updated

models 16

datasets 3