Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

184

Full-text search

Active filters: modelopt

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 7 days ago • 57.1k • 38

lukealonso/MiniMax-M2.5-NVFP4

130B • Updated 8 days ago • 39.9k • 34

lukealonso/MiniMax-M2.5-REAP-139B-A10B-NVFP4

80B • Updated 1 day ago • 9.37k • 16

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated 21 days ago • 57.6k • 53

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated 16 days ago • 76.8k • 49

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 16 days ago • 35.4k • 29

lukealonso/GLM-5-NVFP4

425B • Updated 8 days ago • 17k • 9

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 20.6k • 8

vincentzed-hf/Qwen3.5-397B-A17B-NVFP4

Image-Text-to-Text • Updated 8 days ago • 20.2k • 10

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 22.9k • 9

nvidia/Kimi-K2-Thinking-NVFP4

Text Generation • Updated 15 days ago • 124k • 28

nvidia/Qwen3-235B-A22B-Thinking-2507-NVFP4

Text Generation • Updated 26 days ago • 753 • 5

tiiuae/Falcon-H1R-7B-FP8

Text Generation • 8B • Updated 14 days ago • 157 • 5

vincentzed-hf/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 9 days ago • 6.33k • 7

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 13.3k • 21

NVFP4/Qwen3-30B-A3B-Instruct-2507-FP4

Text Generation • 16B • Updated Aug 1, 2025 • 1.22k • 12

nvidia/Llama-3.1-8B-Instruct-NVFP4

5B • Updated Sep 15, 2025 • 108k • 7

nvidia/Qwen3-14B-FP8

Text Generation • 15B • Updated Sep 9, 2025 • 3.4k • 4

shanjiaz/gpt-oss-120b-nvfp4-modelopt

59B • Updated Sep 24, 2025 • 9.15k • 3

nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1-FP4-QAD

Image-Text-to-Text • Updated Oct 9, 2025 • 412 • 13

nvidia/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 120B • Updated 26 days ago • 2.73k • 3

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated 20 days ago • 569 • 2

Cirrascale/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 13 days ago • 693 • 2

txn545/Qwen3.5-35B-A3B-NVFP4

Text Generation • Updated about 9 hours ago • 95 • 1

txn545/Qwen3.5-122B-A10B-NVFP4

Text Generation • 64B • Updated about 9 hours ago • 1.35k • 1

nvidia/Llama-4-Maverick-17B-128E-Instruct-FP8

402B • Updated Jul 29, 2025 • 598 • 12

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated Dec 12, 2025 • 39k • 11

ishan24/test_modelopt_quant

Updated Apr 25, 2025 • 6

nvidia/Llama-4-Maverick-17B-128E-Eagle3

Updated Sep 3, 2025 • 6 • 9

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 57.4k • 23