VISIONx @ NYU

university

https://www.sainingxie.com/

AI & ML interests

None defined yet.

Recent Activity

bytetriper updated a model about 13 hours ago

nyu-visionx/siglip2_decoder

bytetriper new activity about 13 hours ago

nyu-visionx/scale-rae-data:Add dataset card and metadata

bytetriper new activity about 13 hours ago

nyu-visionx/siglip2_decoder:Add model card and metadata

View all activity

Papers

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding

View all Papers

nyu-visionx 's Papers 4

Submitted by

BoYang Zheng

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

nyu-visionx

Submitted by

Ellis Brown

SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding

nyu-visionx

Submitted by

Jihan Yang

Benchmark Designers Should "Train on the Test Set" to Expose Exploitable Non-Visual Shortcuts

nyu-visionx

2

Submitted by

Peter Tong

Diffusion Transformers with Representation Autoencoders

nyu-visionx