Zhongpai Gao's picture

204 14

Zhongpai Gao

gaozhongpai

·

Gaozhongpai

AI & ML interests

3D computer vision

Recent Activity

upvoted a paper 5 days ago

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

upvoted a paper 7 days ago

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

upvoted a paper 11 days ago

DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

View all activity

Organizations

upvoted a paper 5 days ago

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

Paper • 2512.04677 • Published 6 days ago • 162

upvoted a paper 7 days ago

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

Paper • 2512.02556 • Published 8 days ago • 193

upvoted 3 papers 11 days ago

DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

Paper • 2511.19365 • Published 16 days ago • 63

SAM 3: Segment Anything with Concepts

Paper • 2511.16719 • Published 20 days ago • 109

ROOT: Robust Orthogonalized Optimizer for Neural Network Training

Paper • 2511.20626 • Published 15 days ago • 169

upvoted 2 papers 19 days ago

MHR: Momentum Human Rig

Paper • 2511.15586 • Published 21 days ago • 13

SAM2S: Segment Anything in Surgical Videos via Semantic Long-term Tracking

Paper • 2511.16618 • Published 20 days ago • 7

upvoted a paper 23 days ago

Depth Anything 3: Recovering the Visual Space from Any Views

Paper • 2511.10647 • Published 27 days ago • 93

upvoted a paper about 1 month ago

Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning

Paper • 2510.23473 • Published Oct 27 • 84

upvoted a paper about 2 months ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Paper • 2510.18927 • Published Oct 21 • 83

upvoted 6 papers 3 months ago

Durian: Dual Reference-guided Portrait Animation with Attribute Transfer

Paper • 2509.04434 • Published Sep 4 • 10

FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait

Paper • 2412.01064 • Published Dec 2, 2024 • 47

TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis

Paper • 2508.13618 • Published Aug 19 • 17

Multi-View 3D Point Tracking

Paper • 2508.21060 • Published Aug 28 • 23

Gaze into the Heart: A Multi-View Video Dataset for rPPG and Health Biomarkers Estimation

Paper • 2508.17924 • Published Aug 25 • 14

MIDAS: Multimodal Interactive Digital-human Synthesis via Real-time Autoregressive Video Generation

Paper • 2508.19320 • Published Aug 26 • 29

upvoted 4 papers 4 months ago

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

Paper • 2508.13154 • Published Aug 18 • 62

FantasyTalking2: Timestep-Layer Adaptive Preference Optimization for Audio-Driven Portrait Animation

Paper • 2508.11255 • Published Aug 15 • 11

DisTime: Distribution-based Time Representation for Video Large Language Models

Paper • 2505.24329 • Published May 30 • 1

DeepVideo-R1: Video Reinforcement Fine-Tuning via Difficulty-aware Regressive GRPO

Paper • 2506.07464 • Published Jun 9 • 14