02. Prompt engineering - a dram023 Collection

dram023 's Collections

09. Investigación

07. IA agentica

03. AI imagenes

02. Prompt engineering

02. Prompt engineering

updated about 11 hours ago

Verifiable Rewards Beyond Math and Code: Lightweight Corpus-Grounded Process Supervision for Factual Question Answering

Paper • 2605.29648 • Published 14 days ago • 10
Why Larger Models Learn More: Effects of Capacity, Interference, and Rare-Task Retention

Paper • 2605.29548 • Published 14 days ago • 11
Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation

Paper • 2605.29861 • Published 14 days ago • 16
COLLEAGUE.SKILL: Automated AI Skill Generation via Expert Knowledge Distillation

Paper • 2605.31264 • Published 13 days ago • 111
dMoE: dLLMs with Learnable Block Experts

Paper • 2605.30876 • Published 13 days ago • 36
On the Geometry of On-Policy Distillation

Paper • 2606.07082 • Published 6 days ago • 62
SWE-Explore: Benchmarking How Coding Agents Explore Repositories

Paper • 2606.07297 • Published 6 days ago • 105
Whisper Hallucination Detection and Mitigation via Hidden Representation Steering and Sparse AutoEncoders

Paper • 2606.07473 • Published 6 days ago • 12
DuMate-DeepResearch: An Auditable Multi-Agent System with Recursive Search and Rubric-Grounded Reasoning

Paper • 2606.07299 • Published 6 days ago • 6
Why Muon Outperforms Adam: A Curvature Perspective

Paper • 2606.04662 • Published 8 days ago • 8
Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

Paper • 2606.09365 • Published 2 days ago • 2