Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,243

Full-text search

Active filters: nvidia

Cirrascale/Kimi-K2.5-NVFP4

Text Generation • Updated 7 days ago • 8

Cirrascale/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated 7 days ago • 8

Tinker-Stack/Nemotron-3-Nano-30B-A3B-IQ4_XS-GGUF

Text Generation • 32B • Updated 5 days ago • 779

mconcat/Trinity-Large-TrueBase-NVFP4

202B • Updated 4 days ago • 8

ganatrask/NOVA

Robotics • 3B • Updated 4 days ago • 37

Cirrascale/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 4 days ago • 6

mradermacher/Llama3-ChatQA-2-70B-i1-GGUF

71B • Updated 3 days ago • 16.8k

splats/Llama-3.3-Nemotron-70B-Select-mlx-8Bit

Text Generation • 71B • Updated 2 days ago • 32

splats/Llama-3_3-Nemotron-Super-49B-v1_5-mlx-8Bit

Text Generation • 50B • Updated 2 days ago • 58

splats/Llama-3.3-Nemotron-70B-Select-mlx-6Bit

Text Generation • 71B • Updated 2 days ago • 41

maxkulish/parakeet-tdt-0.6b-v3

Automatic Speech Recognition • Updated 1 day ago

urufura/NVIDIA-Nemotron-Nano-9B-v2-Japanese

Text Generation • 9B • Updated about 17 hours ago

mradermacher/NVIDIA-Nemotron-Nano-9B-v2-Japanese-GGUF

9B • Updated about 3 hours ago