DevQuasar

500 models • 3 total models in database

Sort by:

speakleash.Bielik-11B-v2.6-Instruct-GGUF

--- base_model: - speakleash/Bielik-11B-v2.6-Instruct pipeline_tag: text-generation ---

NaNK

—

227,869

moonshotai.Kimi-K2-Thinking-GGUF

Original INT4 model has been dequantized with my own custom script: DQint4-to-bf16dequant (inspired by the deepseek V3 dequant script) Zero Short Hexa-ball test, generated code by the Q3 quant produced:

—

2,050

moonshotai.Kimi-K2.5-GGUF

NaNK

—

1,872

Qwen.Qwen3-Coder-480B-A35B-Instruct-GGUF

NaNK

—

1,697

google.gemma-3-12b-pt-GGUF

NaNK

—

1,557

Qwen.Qwen3-VL-235B-A22B-Thinking-GGUF

Quantized version of: Qwen/Qwen3-VL-235B-A22B-Thinking

NaNK

—

1,379

inclusionAI.Ring-flash-2.0-GGUF

NaNK

—

1,356

DavidAU.L3.1-Dark-Reasoning-LewdPlay-evo-Hermes-R1-Uncensored-8B-GGUF

NaNK

—

1,198

dphn.Dolphin-Mistral-24B-Venice-Edition-GGUF

Quantized version of: dphn/Dolphin-Mistral-24B-Venice-Edition

NaNK

—

1,152

nanonets.Nanonets-OCR2-3B-GGUF

NaNK

—

1,122

Qwen.Qwen3-VL-235B-A22B-Instruct-GGUF

NaNK

—

1,064

zai-org.GLM-4.5-Air-GGUF

—

957

openai.gpt-oss-20b-GGUF

NaNK

—

949

CohereLabs.command-a-translate-08-2025-GGUF

Tested with DevQuasar/wikitext-2-raw-v1-preprocessed-1k Quantized version of: CohereLabs/command-a-translate-08-2025

NaNK

—

902

google.gemma-3-27b-pt-GGUF

NaNK

—

889

deepseek-ai.DeepSeek-V3.2-GGUF

NaNK

—

849

deepcogito.cogito-671b-v2.1-GGUF

NaNK

—

849

mlfoundations-dev.oh-dcft-v3.1-claude-3-5-haiku-20241022-GGUF

Quantized version of: mlfoundations-dev/oh-dcft-v3.1-claude-3-5-haiku-20241022

NaNK

—

804

NousResearch.Hermes-4-405B-GGUF

NaNK

—

802

facebook.MobileLLM-R1-950M-GGUF

—

802

nvidia.Llama-3_1-Nemotron-Ultra-253B-v1-GGUF

NaNK

base_model:nvidia/Llama-3_1-Nemotron-Ultra-253B-v1

772

Qwen.Qwen3.5-35B-A3B-GGUF

NaNK

—

763

google.gemma-3-4b-pt-GGUF

NaNK

—

758

tencent.Hunyuan-MT-7B-GGUF

NaNK

—

739

google.gemma-3-1b-pt-GGUF

NaNK

—

699

zai-org.GLM-5-GGUF

NaNK

—

673

deepseek-ai.DeepSeek-V3.1-GGUF

NaNK

—

654

xai-org.grok-2-GGUF

NaNK

—

630

PokeeAI.pokee_research_7b-GGUF

NaNK

—

595

LLM360.K2-Think-GGUF

—

586

nvidia.OpenCodeReasoning-Nemotron-7B-GGUF

Quantized version of: nvidia/OpenCodeReasoning-Nemotron-7B

NaNK

—

574

Kwaipilot.KAT-Dev-GGUF

—

555

swiss-ai.Apertus-8B-Instruct-2509-GGUF

Quantized version of: swiss-ai/Apertus-8B-Instruct-2509

NaNK

—

549

huihui-ai.DeepSeek-R1-Distill-Qwen-7B-abliterated-GGUF

NaNK

—

536

huihui-ai.QwQ-32B-abliterated-GGUF

NaNK

—

535

cognitivecomputations.Dolphin3.0-Llama3.1-8B-GGUF

Quantized version of: cognitivecomputations/Dolphin3.0-Llama3.1-8B

NaNK

base_model:cognitivecomputations/Dolphin3.0-Llama3.1-8B

528

Qwen.Qwen3-1.7B-GGUF

NaNK

—

510

huihui-ai.Huihui-Hunyuan-MT-7B-abliterated-GGUF

Quantized version of: huihui-ai/Huihui-Hunyuan-MT-7B-abliterated

NaNK

—

508

Qwen.Qwen3-Coder-30B-A3B-Instruct-GGUF

Quantized version of: Qwen/Qwen3-Coder-30B-A3B-Instruct

NaNK

—

500

Gryphe.MythoMax-L2-13b-GGUF

NaNK

—

499

inference-net.Schematron-3B-GGUF

NaNK

—

499

LiquidAI.LFM2-700M-GGUF

—

495

huihui-ai.granite-vision-3.2-2b-abliterated-GGUF

NaNK

—

486

Qwen.Qwen3-235B-A22B-GGUF

NaNK

—

479

QuixiAI.WizardLM-13B-Uncensored-GGUF

Quantized version of: QuixiAI/WizardLM-13B-Uncensored

NaNK

—

478

chutesai.Qwen3-235B-A22B-Instruct-2507-1M-GGUF

Quantized version of: chutesai/Qwen3-235B-A22B-Instruct-2507-1M

NaNK

—

474

internlm.OREAL-DeepSeek-R1-Distill-Qwen-7B-GGUF

NaNK

—

470

nvidia.NVIDIA-Nemotron-Nano-12B-v2-GGUF

NaNK

—

456

Qwen.Qwen3-Reranker-8B-GGUF

NaNK

—

450

mistralai.Ministral-3-3B-Instruct-2512-GGUF

NaNK

—

443

Salesforce.Llama-xLAM-2-8b-fc-r-GGUF

NaNK

base_model:Salesforce/Llama-xLAM-2-8b-fc-r

439

huihui-ai.Huihui-Hunyuan-MT-Chimera-7B-abliterated-GGUF

NaNK

—

435

openai.gpt-oss-120b-GGUF

NaNK

—

426

CohereLabs.command-a-reasoning-08-2025-GGUF

NaNK

—

411

huihui-ai.DeepSeek-R1-Distill-Qwen-14B-abliterated-v2-GGUF

NaNK

—

400

XiaomiMiMo.MiMo-V2-Flash-GGUF

—

395

inclusionAI.Ring-mini-sparse-2.0-exp-GGUF

Quantized version of: inclusionAI/Ring-mini-sparse-2.0-exp

—

395

deepseek-ai.DeepSeek-V3.2-Speciale-Channel-INT8

license:mit

388

Intelligent-Internet.II-Medical-8B-1706-GGUF

Quantized version of: Intelligent-Internet/II-Medical-8B-1706

NaNK

—

382

huihui-ai.DeepSeek-R1-Distill-Qwen-32B-abliterated-GGUF

NaNK

—

374

huihui-ai.Huihui-Qwen3-4B-Instruct-2507-abliterated-GGUF

NaNK

—

374

nvidia.Llama-3_3-Nemotron-Super-49B-v1_5-GGUF

NaNK

base_model:nvidia/Llama-3_3-Nemotron-Super-49B-v1_5

372

ibm-granite.granite-4.0-350m-GGUF

—

371

google.gemma-3-4b-it-qat-int4-unquantized-GGUF

NaNK

—

370

google.gemma-3-27b-it-qat-q4_0-unquantized-GGUF

NaNK

—

368

nvidia.OpenReasoning-Nemotron-7B-GGUF

Quantized version of: nvidia/OpenReasoning-Nemotron-7B

NaNK

—

367

Qwen.Qwen2.5-VL-7B-Instruct-GGUF

NaNK

—

365

ai21labs.AI21-Jamba-Large-1.6-GGUF

NaNK

—

363

HuggingFaceTB.finemath-ablation-infiwebmath-GGUF

Quantized version of: HuggingFaceTB/finemath-ablation-infiwebmath

—

361

mistralai.Mistral-7B-Instruct-v0.1-GGUF

NaNK

—

353

ibm-granite.granite-4.0-h-1b-GGUF

NaNK

—

353

Qwen.Qwen3-30B-A3B-GGUF

NaNK

—

350

moonshotai.Kimi-K2-Instruct-0905-GGUF

Quantized version of: moonshotai/Kimi-K2-Instruct-0905

NaNK

—

349

zai-org.GLM-4.1V-9B-Base-GGUF

NaNK

—

345

arcee-ai.Trinity-Large-Preview-GGUF

—

342

ibm-granite.granite-4.0-h-tiny-GGUF

Quantized version of: ibm-granite/granite-4.0-h-tiny

—

341

katanemo.Arch-Agent-7B-GGUF

NaNK

—

339

DavidAU.Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF

Quantized version of: DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B

NaNK

base_model:DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B

337

Qwen.Qwen2.5-VL-32B-Instruct-GGUF

You have to use the backend from HimariO's branch. Big thanks to add Qwen2.5VL support! Additional discussions

NaNK

—

335

ByteDance-Seed.academic-ds-9B-GGUF

Quantized version of: ByteDance-Seed/academic-ds-9B

NaNK

—

335

Qwen.Qwen2.5-14B-Instruct-1M-GGUF

NaNK

—

335

prithivMLmods.Viper-Coder-Hybrid-v1.2-GGUF

NaNK

—

335

google.gemma-3-27b-it-GGUF

NaNK

—

335

inclusionAI.Ling-lite-1.5-2506-GGUF

Quantized version of: inclusionAI/Ling-lite-1.5-2506

NaNK

—

334

zai-org.GLM-4.5-GGUF

NaNK

—

332

LGAI-EXAONE.EXAONE-4.0-32B-GGUF

NaNK

—

330

HuggingFaceTB.SmolLM2-1.7B-Instruct-GGUF

NaNK

—

327

HuggingFaceTB.SmolLM3-3B-GGUF

NaNK

—

327

huihui-ai.Qwen3-30B-A3B-abliterated-GGUF

NaNK

—

320

deepseek-ai.DeepSeek-R1-Distill-Qwen-32B-GGUF

NaNK

—

318

ai21labs.AI21-Jamba-Mini-1.7-GGUF

NaNK

—

316

open-thoughts.OpenThinker-32B-GGUF

Quantized version of: open-thoughts/OpenThinker-32B

NaNK

—

311

Sao10K.L3-8B-Stheno-v3.2-GGUF

NaNK

—

310

openai.gpt-oss-safeguard-20b-GGUF

NaNK

—

310

ibm-granite.granite-4.0-1b-GGUF

NaNK

—

308

CohereLabs.c4ai-command-r-plus-GGUF

—

304

deepseek-ai.DeepSeek-V3.1-Terminus-GGUF

Quantized version of: deepseek-ai/DeepSeek-V3.1-Terminus

—

303

microsoft.UserLM-8b-GGUF

NaNK

—

302

ibm-granite.granite-4.0-h-350m-GGUF

Quantized version of: ibm-granite/granite-4.0-h-350m

—

300

mlabonne.gemma-3-1b-it-abliterated-v2-GGUF

Quantized version of: mlabonne/gemma-3-1b-it-abliterated-v2

NaNK

—

296

Qwen.Qwen3-Reranker-4B-GGUF

NaNK

—

290

inclusionAI.Ring-mini-2.0-GGUF

NaNK

—

290

Qwen.Qwen2-VL-7B-Instruct-GGUF

NaNK

—

279

nicoboss.Qwen-3-32B-Medical-Reasoning-GGUF

Quantized version of: nicoboss/Qwen-3-32B-Medical-Reasoning

NaNK

—

279

ai21labs.AI21-Jamba-Mini-1.6-GGUF

NaNK

—

279

internlm.internlm2_5-7b-chat-GGUF

NaNK

—

276

LiquidAI.LFM2-8B-A1B-GGUF

NaNK

—

275

google.gemma-3-12b-it-GGUF

NaNK

—

274

Locutusque.StockQwen-2.5-7B-GGUF

NaNK

—

273

deepseek-ai.DeepSeek-R1-Distill-Qwen-1.5B-GGUF

NaNK

—

269

deepseek-ai.DeepSeek-R1-Distill-Llama-8B-GGUF

NaNK

base_model:deepseek-ai/DeepSeek-R1-Distill-Llama-8B

266

NousResearch.DeepHermes-3-Llama-3-8B-Preview-GGUF

NaNK

base_model:NousResearch/DeepHermes-3-Llama-3-8B-Preview

266

Qwen.Qwen3-Reranker-0.6B-GGUF

NaNK

—

263

huihui-ai.Qwen2.5-72B-Instruct-abliterated-GGUF

NaNK

—

263

ai21labs.AI21-Jamba-Reasoning-3B-GGUF

Quantized version of: ai21labs/AI21-Jamba-Reasoning-3B

NaNK

—

263

ServiceNow-AI.Apriel-1.6-15b-Thinker-GGUF

NaNK

—

262

open-thoughts.OpenThinker2-32B-GGUF

NaNK

—

261

PocketDoc.Dans-PersonalityEngine-V1.3.0-24b-GGUF

NaNK

—

257

tencent.Hunyuan-7B-Instruct-GGUF

NaNK

—

254

llama3.1_8b_chat_brainstorm-v3.1-GGUF

NaNK

license:llama3.1

253

THUDM.GLM-4-9B-0414-GGUF

NaNK

—

249

huihui-ai.Huihui-gpt-oss-20b-BF16-abliterated-GGUF

NaNK

—

249

Qwen.Qwen2.5-Coder-32B-Instruct-GGUF

Quantized version of: Qwen/Qwen2.5-Coder-32B-Instruct

NaNK

—

245

meta-llama.Llama-3.2-1B-GGUF

NaNK

base_model:meta-llama/Llama-3.2-1B

245

inference-net.Schematron-8B-GGUF

NaNK

—

245

Qwen.Qwen2.5-VL-3B-Instruct-GGUF

NaNK

—

240

zerofata.MS3.2-PaintedFantasy-Visage-v2-33B-GGUF

Quantized version of: zerofata/MS3.2-PaintedFantasy-Visage-v2-33B

NaNK

—

239

swiss-ai.Apertus-70B-Instruct-2509-GGUF

Quantized version of: swiss-ai/Apertus-70B-Instruct-2509

NaNK

—

238

cerebras.GLM-4.5-Air-REAP-82B-A12B-GGUF

Quantized version of: cerebras/GLM-4.5-Air-REAP-82B-A12B

NaNK

—

237

deepseek-ai.DeepSeek-R1-0528-GGUF

NaNK

—

231

AXCXEPT.Qwen3-EZO-8B-beta-GGUF

NaNK

—

231

Qwen.Qwen3-VL-8B-Instruct-GGUF

NaNK

—

231

google.gemma-3-1b-it-qat-int4-unquantized-GGUF

NaNK

—

230

vandijklab.C2S-Scale-Gemma-2-27B-GGUF

Quantized version of: vandijklab/C2S-Scale-Gemma-2-27B

NaNK

—

230

microsoft.Phi-4-mini-instruct-GGUF

—

229

prithivMLmods.GN-108036-Qwen-14B-GGUF

NaNK

—

228

facebook.KernelLLM-GGUF

—

228

allenai.Llama-3.1-Tulu-3-8B-GGUF

NaNK

base_model:allenai/Llama-3.1-Tulu-3-8B

225

mistralai.Mistral-Small-24B-Instruct-2501-GGUF

NaNK

—

224

Qwen.Qwen2-Math-1.5B-GGUF

NaNK

—

224

facebook.MobileLLM-R1-360M-GGUF

—

224

Menlo.Lucy-128k-GGUF

—

223

Tesslate.UIGEN-FX-Agentic-32B-GGUF

Quantized version of: Tesslate/UIGEN-FX-Agentic-32B

NaNK

—

223

nvidia.Llama-3.3-Nemotron-70B-Feedback-GGUF

Quantized version of: nvidia/Llama-3.3-Nemotron-70B-Feedback

NaNK

base_model:nvidia/Llama-3.3-Nemotron-70B-Feedback

222

Aurore-Reveil.Koto-Small-7B-IT-GGUF

Quantized version of: Aurore-Reveil/Koto-Small-7B-IT

NaNK

—

222

nvidia.AceMath-7B-Instruct-GGUF

NaNK

—

221

ai21labs.Jamba-v0.1-GGUF

NaNK

—

221

katanemo.Arch-Function-3B-GGUF

NaNK

—

219

HuggingFaceTB.SmolLM3-3B-Base-GGUF

Quantized version of: HuggingFaceTB/SmolLM3-3B-Base

NaNK

—

218

ai21labs.AI21-Jamba-Large-1.7-GGUF

Quantized version of: ai21labs/AI21-Jamba-Large-1.7

NaNK

—

218

deepcogito.cogito-v1-preview-llama-3B-GGUF

NaNK

base_model:deepcogito/cogito-v1-preview-llama-3B

217

LGAI-EXAONE.EXAONE-Deep-2.4B-GGUF

NaNK

—

216

TildeAI.TildeOpen-30b-GGUF

NaNK

—

215

DavidAU.Mistral-MOE-4X7B-Dark-MultiVerse-Uncensored-Enhanced32-24B-GGUF

NaNK

—

214

Tesslate.UIGEN-T3-32B-Preview-GGUF

NaNK

—

209

teknium.Mistral-Trismegistus-7B-GGUF

NaNK

—

207

Qwen.Qwen3-235B-A22B-Thinking-2507-GGUF

Quantized version of: Qwen/Qwen3-235B-A22B-Thinking-2507

NaNK

—

206

fluently.FluentlyQwen3-Coder-4B-0909-GGUF

Quantized version of: fluently/FluentlyQwen3-Coder-4B-0909

NaNK

—

204

mistralai.Mistral-Small-3.1-24B-Base-2503-GGUF

NaNK

—

202

microsoft.NextCoder-32B-GGUF

NaNK

—

202

nvidia.Qwen3-Nemotron-32B-RLBFF-GGUF

Quantized version of: nvidia/Qwen3-Nemotron-32B-RLBFF

NaNK

—

200

meta-llama.Llama-4-Scout-17B-16E-Instruct-GGUF

NaNK

base_model:meta-llama/Llama-4-Scout-17B-16E-Instruct

199

huihui-ai.phi-4-abliterated-GGUF

—

199

Gryphe.Pantheon-RP-Pure-1.6.2-22b-Small-GGUF

NaNK

—

198

huihui-ai.Huihui-SmolLM3-3B-abliterated-GGUF

NaNK

—

198

ruliad.deepthought-8b-llama-v0.01-alpha-GGUF

Quantized version of: ruliad/deepthought-8b-llama-v0.01-alpha

NaNK

base_model:ruliad/deepthought-8b-llama-v0.01-alpha

195

ai21labs.AI21-Jamba-Mini-1.5-GGUF

NaNK

—

194

openai-community.gpt2-xl-GGUF

—

193

cerebras.MiniMax-M2-REAP-172B-A10B-GGUF

NaNK

—

192

nvidia.Llama-3_1-Nemotron-Ultra-253B-CPT-v1-GGUF

Quantized version of: nvidia/Llama-31-Nemotron-Ultra-253B-CPT-v1

NaNK

base_model:nvidia/Llama-3_1-Nemotron-Ultra-253B-CPT-v1

192

Kwaipilot.KAT-V1-40B-GGUF

NaNK

—

192

huihui-ai.Huihui-Qwen3-4B-Thinking-2507-abliterated-GGUF

NaNK

—

191

nvidia.Qwen3-Nemotron-32B-GenRM-Principle-GGUF

Quantized version of: nvidia/Qwen3-Nemotron-32B-GenRM-Principle

NaNK

—

191

Nexusflow.Starling-LM-7B-beta-GGUF

Quantized version of: Nexusflow/Starling-LM-7B-beta

NaNK

—

189

ytu-ce-cosmos.Turkish-Gemma-9b-v0.1-GGUF

NaNK

—

188

PowerInfer.SmallThinker-21BA3B-Instruct-GGUF

Quantized version of: PowerInfer/SmallThinker-21BA3B-Instruct

NaNK

—

188

Tesslate.UIGENT-30B-3A-Preview-GGUF

Quantized version of: Tesslate/UIGENT-30B-3A-Preview

NaNK

—

188

prithivMLmods.Qwen2-VL-OCR-2B-Instruct-GGUF

NaNK

—

187

utter-project.EuroLLM-22B-Instruct-Preview-GGUF

NaNK

—

186

ValiantLabs.gpt-oss-20b-ShiningValiant3-GGUF

NaNK

—

185

DeepMount00.Lexora-Lite-3B-GGUF

NaNK

—

185

HuggingFaceTB.finemath-ablation-infiwebmath-3plus-GGUF

—

185

huihui-ai.Huihui-MoE-23B-A4B-abliterated-GGUF

Quantized version of: huihui-ai/Huihui-MoE-23B-A4B-abliterated

NaNK

—

185

Meta-Llama-3.1-70B-Instruct-GGUF

NaNK

base_model:meta-llama/Llama-3.1-70B-Instruct

183

analytical_reasoning_r16a32_unsloth-Llama-3.2-3B-Instruct-bnb-4bit-GGUF

NaNK

—

182

zai-org.GLM-4.1V-9B-Thinking-GGUF

NaNK

—

181

Alfitaria.Q25-1.5B-VeoLu-GGUF

NaNK

—

181

soob3123.Veritas-12B-GGUF

NaNK

—

180

Aratako.Qwen3-8B-NSFW-JP-GGUF

NaNK

—

179

JetBrains.Mellum-4b-base-GGUF

NaNK

—

179

Qwen.Qwen3-VL-4B-Instruct-GGUF

NaNK

—

179

deepseek-ai.DeepSeek-R1-Distill-Qwen-7B-GGUF

Quantized version of: deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

NaNK

—

178

huihui-ai.Qwen3-4B-abliterated-GGUF

NaNK

—

178

YOYO-AI.Qwen3-30B-A3B-Mixture-2507-GGUF

Quantized version of: YOYO-AI/Qwen3-30B-A3B-Mixture-2507

NaNK

—

178

MarinaraSpaghetti.NemoMix-Unleashed-12B-GGUF

NaNK

—

177

nvidia.Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual-GGUF

Quantized version of: nvidia/Llama-33-Nemotron-Super-49B-GenRM-Multilingual

NaNK

base_model:nvidia/Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual

176

yasserrmd.DentaInstruct-1.2B-GGUF

NaNK

—

176

falcon2-11B-GGUF

NaNK

—

175

meta-llama.Llama-3.3-70B-Instruct-GGUF

NaNK

base_model:meta-llama/Llama-3.3-70B-Instruct

175

nvidia.OpenReasoning-Nemotron-14B-GGUF

Quantized version of: nvidia/OpenReasoning-Nemotron-14B

NaNK

—

174

IIEleven11.Kalypso-GGUF

—

174

mlabonne.gemma-3-12b-it-abliterated-v2-GGUF

Quantized version of: mlabonne/gemma-3-12b-it-abliterated-v2

NaNK

—

173

Qwen.Qwen3-4B-Thinking-2507-GGUF

NaNK

—

173

google.gemma-3-270m-GGUF

—

171

deepseek-ai.DeepSeek-V3-0324-GGUF

NaNK

—

170

Qwen.Qwen3-VL-30B-A3B-Thinking-GGUF

NaNK

—

170

ibm-granite.granite-3.0-8b-instruct-GGUF

NaNK

—

169

Alibaba-NLP.WebDancer-32B-GGUF

NaNK

—

169

Locutusque.deeplm-llama-3.1-8B-stage1-GGUF

Quantized version of: Locutusque/deeplm-llama-3.1-8B-stage1

NaNK

base_model:Locutusque/deeplm-llama-3.1-8B-stage1

169

Qwen.Qwen3-VL-8B-Thinking-GGUF

NaNK

—

169

Qwen.Qwen3-VL-30B-A3B-Instruct-GGUF

NaNK

—

169

mistralai.Mistral-Small-3.2-24B-Instruct-2506-GGUF

NaNK

—

167

ibm-granite.granite-4.0-h-small-GGUF

Quantized version of: ibm-granite/granite-4.0-h-small

—

166

moonshotai.Kimi-Dev-72B-GGUF

NaNK

—

165

goppa-ai.Goppa-LogiLlama-GGUF

base_model:goppa-ai/Goppa-LogiLlama

165

google.gemma-3-12b-it-qat-int4-unquantized-GGUF

NaNK

—

165

mistralai.Devstral-Small-2507-GGUF

Quantized version of: mistralai/Devstral-Small-2507

NaNK

—

165

facebook.MobileLLM-R1-140M-base-GGUF

Quantized version of: facebook/MobileLLM-R1-140M-base

—

165

perplexity-ai.r1-1776-GGUF

NaNK

—

164

a-m-team.AM-Thinking-v1-GGUF

NaNK

—

164

zai-org.SWE-Dev-7B-GGUF

NaNK

—

164

ValiantLabs.Qwen3-1.7B-ShiningValiant3-GGUF

Quantized version of: ValiantLabs/Qwen3-1.7B-ShiningValiant3

NaNK

—

164

huihui-ai.Qwen3-8B-abliterated-GGUF

NaNK

—

163

Tesslate.UIGEN-FX-4B-Preview-GGUF

NaNK

—

163

HuggingFaceTB.finemath-ablation-infiwebmath-4plus-GGUF

—

163

nicoboss.Qwen3-32B-Uncensored-GGUF

Quantized version of: nicoboss/Qwen3-32B-Uncensored

NaNK

—

162

ilsp.Llama-Krikri-8B-Instruct-GGUF

NaNK

base_model:ilsp/Llama-Krikri-8B-Instruct

161

mlabonne.gemma-3-27b-it-abliterated-v2-GGUF

NaNK

—

161

arcee-ai.AFM-4.5B-Base-GGUF

NaNK

—

161

PowerInfer.SmallThinker-3B-Preview-GGUF

NaNK

—

160

Delta-Vector.Austral-24B-Winton-GGUF

Quantized version of: Delta-Vector/Austral-24B-Winton

NaNK

—

160

google.gemma-3-4b-it-GGUF

NaNK

—

159

ibm-granite.granite-guardian-3.1-2b-GGUF

NaNK

—

158

llama3_8b_chat_brainstorm-GGUF

NaNK

license:llama3

157

Qwen.Qwen3-8B-GGUF

LMStudio users! Please update the chat prompt template of the model. Go to My models -> Actions (gear) edit model default parameters -> Prompt -> Prompt template. Update the Jinja template.

NaNK

—

157

aquif-ai.aquif-3.5-7B-GGUF

NaNK

—

156

AI-MO.Kimina-Prover-Preview-Distill-7B-GGUF

NaNK

—

155

prithivMLmods.Galactic-Qwen-14B-Exp2-GGUF

NaNK

—

155

shisa-ai.shisa-v2-llama3.1-405b-GGUF

Quantized version of: shisa-ai/shisa-v2-llama3.1-405b

NaNK

base_model:shisa-ai/shisa-v2-llama3.1-405b

155

ibm-granite.granite-guardian-3.0-8b-GGUF

NaNK

—

154

shuttleai.shuttle-3.5-GGUF

NaNK

—

154

Dream-org.Dream-v0-Instruct-7B-GGUF

NaNK

—

154

LiquidAI.LFM2-350M-GGUF

—

154

JetBrains.Mellum-4b-sft-all-GGUF

NaNK

—

154

nvidia.Llama-3.3-Nemotron-70B-Reward-Principle-GGUF

Quantized version of: nvidia/Llama-3.3-Nemotron-70B-Reward-Principle

NaNK

base_model:nvidia/Llama-3.3-Nemotron-70B-Reward-Principle

154

moonshotai.Kimi-K2-Instruct-GGUF

—

153

argilla.zephyr-7b-spin-iter3-v0-GGUF

NaNK

—

153

prithivMLmods.Raptor-X5-UIGEN-GGUF

—

153

Skywork.MindLink-32B-0801-GGUF

NaNK

—

153

LiquidAI.LFM2-1.2B-RAG-GGUF

NaNK

—

153

Gryphe.Pantheon-RP-1.6.1-12b-Nemo-GGUF

NaNK

—

152

huihui-ai.EXAONE-3.5-32B-Instruct-abliterated-GGUF

NaNK

—

151

Alibaba-Apsara.DASD-4B-Thinking-GGUF

NaNK

—

151

deepseek-ai.DeepSeek-R1-Distill-Qwen-14B-GGUF

NaNK

—

151

Qwen.Qwen3-4B-GGUF

NaNK

—

151

zai-org.SWE-Dev-32B-GGUF

NaNK

—

151

PowerInfer.SmallThinker-4BA0.6B-Instruct-GGUF

Quantized version of: PowerInfer/SmallThinker-4BA0.6B-Instruct

NaNK

—

150

nvidia.Llama-3_3-Nemotron-Super-49B-v1-GGUF

NaNK

base_model:nvidia/Llama-3_3-Nemotron-Super-49B-v1

149

tiiuae.Falcon3-3B-Base-GGUF

NaNK

—

149

Qwen.Qwen3-VL-2B-Thinking-GGUF

NaNK

—

149

arcee-ai.AFM-4.5B-GGUF

NaNK

—

148

aws-prototyping.OmniLong-Qwen2.5-VL-7B-GGUF

NaNK

—

147

bytedance-research.UI-TARS-7B-SFT-GGUF

NaNK

—

144

huihui-ai.DeepSeek-R1-Distill-Llama-70B-abliterated-GGUF

NaNK

base_model:huihui-ai/DeepSeek-R1-Distill-Llama-70B-abliterated

144

Dream-org.Dream-v0-Base-7B-GGUF

NaNK

—

144

nvidia.OpenReasoning-Nemotron-32B-GGUF

Quantized version of: nvidia/OpenReasoning-Nemotron-32B

NaNK

—

143

ibm-granite.granite-3.2-2b-instruct-GGUF

NaNK

—

142

nvidia.OpenMath-Nemotron-32B-GGUF

NaNK

—

142

ibm-granite.granite-4.0-tiny-base-preview-GGUF

Quantized version of: ibm-granite/granite-4.0-tiny-base-preview

—

142

Qwen2.5-0.5B-GGUF

NaNK

—

141

nvidia.AceReason-Nemotron-1.1-7B-GGUF

NaNK

—

140

inclusionAI.Ling-lite-1.5-2507-GGUF

NaNK

—

139

google.medgemma-4b-it-GGUF

NaNK

—

138

inclusionAI.Ling-Coder-lite-GGUF

—

138

mistralai.Magistral-Small-2509-GGUF

Quantized version of: mistralai/Magistral-Small-2509

NaNK

—

138

llama3_8b_chat_brainstorm_plus-GGUF

NaNK

license:llama3

137

sambanovasystems.SambaLingo-Hungarian-Base-GGUF

Quantized version of: sambanovasystems/SambaLingo-Hungarian-Base

—

137

allura-org.Q3-30B-A3B-Designant-GGUF

NaNK

—

137

Qwen.Qwen3-VL-2B-Instruct-GGUF

NaNK

—

137

Qwen.CodeQwen1.5-7B-Chat-GGUF

NaNK

—

135

JetBrains.Mellum-4b-sft-python-GGUF

Quantized version of: JetBrains/Mellum-4b-sft-python

NaNK

—

135

AIDC-AI.Marco-o1-GGUF

NaNK

—

134

google.gemma-3n-E4B-it-GGUF

NaNK

—

134

mistralai.Ministral-8B-Instruct-2410-GGUF

NaNK

—

133

Qwen.Qwen2-VL-2B-GGUF

NaNK

—

133

Qiskit.granite-8b-qiskit-GGUF

NaNK

—

133

tiiuae.Falcon-H1-7B-Instruct-GGUF

NaNK

—

131

HelpingAI.Dhanishtha-2.0-preview-0825-GGUF

NaNK

—

131

Nitral-AI.Irixxed-Magcap-12B-Slerp-GGUF

Quantized version of: Nitral-AI/Irixxed-Magcap-12B-Slerp

NaNK

—

130

Kwaipilot.KAT-Dev-72B-Exp-GGUF

NaNK

—

130

Qwen.Qwen3-VL-4B-Thinking-GGUF

NaNK

—

130

EleutherAI.pythia-14m-GGUF

—

129

driaforall.Dria-Agent-a-3B-GGUF

NaNK

—

128

zai-org.GLM-4.6-GGUF

NaNK

—

128

Intelligent-Internet.II-Medical-8B-GGUF

NaNK

—

128

Doctor-Shotgun.MS3.2-24B-Magnum-Diamond-GGUF

Quantized version of: Doctor-Shotgun/MS3.2-24B-Magnum-Diamond

NaNK

—

128

LGAI-EXAONE.EXAONE-3.0-7.8B-Instruct-GGUF

NaNK

—

127

allura-org.Bigger-Body-12b-GGUF

NaNK

—

127

ArliAI.QwQ-32B-ArliAI-RpR-v3-GGUF

NaNK

—

126

google.medgemma-27b-it-GGUF

NaNK

—

126

CohereForAI.c4ai-command-a-03-2025-GGUF

NaNK

—

125

Tesslate.UIGEN-X-8B-GGUF

NaNK

—

125

katanemo.Arch-Agent-3B-GGUF

NaNK

—

125

bytedance-research.UI-TARS-72B-SFT-GGUF

NaNK

—

124

Llama-3.2-3B-Instruct-GGUF

NaNK

base_model:meta-llama/Llama-3.2-3B-Instruct

124

suayptalha.FastLlama-3.2-1B-Instruct-GGUF

NaNK

base_model:suayptalha/FastLlama-3.2-1B-Instruct

124

moxin-org.moxin-llm-7b-GGUF

NaNK

—

124

abeja.ABEJA-QwQ32b-Reasoning-Japanese-v1.0-GGUF

NaNK

—

124

baidu.ERNIE-4.5-300B-A47B-PT-GGUF

NaNK

—

124

HuggingFaceTB.FineMath-Llama-3B-GGUF

NaNK

base_model:HuggingFaceTB/FineMath-Llama-3B

123

Qwen.Qwen1.5-1.8B-GGUF

NaNK

—

123

ibm-granite.granite-3.1-8b-instruct-GGUF

NaNK

—

122

DevQuasar-R1-Uncensored-Llama-8B-GGUF

NaNK

base_model:DevQuasar/DevQuasar-R1-Uncensored-Llama-8B

122

unsloth.Devstral-Small-2505-GGUF

NaNK

—

122

Salesforce.xLAM-2-32b-fc-r-GGUF

NaNK

—

121

arcee-ai.GLM-4-32B-Base-32K-GGUF

NaNK

—

121

mukaj.Llama-3.1-Hawkish-8B-GGUF

NaNK

base_model:mukaj/Llama-3.1-Hawkish-8B

120

nvidia.AceInstruct-7B-GGUF

NaNK

—

120

facebook.MobileLLM-1.5B-GGUF

NaNK

—

120

LLM360.K2-Chat-GGUF

—

120

DavidAU.Qwen3-30B-A6B-16-Extreme-GGUF

NaNK

—

119

Tesslate.UIGEN-T3-8B-Preview-GGUF

NaNK

—

119

ByteDance-Seed.Seed-OSS-36B-Instruct-GGUF

Quantized version of: ByteDance-Seed/Seed-OSS-36B-Instruct

NaNK

—

119

Qwen.Qwen3-Next-80B-A3B-Thinking-FP8-Dynamic

Quantized version of: Qwen/Qwen3-Next-80B-A3B-Thinking

NaNK

—

119

huihui-ai.granite-3.2-8b-instruct-abliterated-GGUF

NaNK

—

118

JetBrains.CodeLlama-7B-KStack-GGUF

NaNK

base_model:JetBrains/CodeLlama-7B-KStack

118

Sao10K.70B-L3.3-Cirrus-x1-GGUF

NaNK

—

117

mlabonne.gemma-3-4b-it-abliterated-v2-GGUF

Quantized version of: mlabonne/gemma-3-4b-it-abliterated-v2

NaNK

—

117

shisa-ai.shisa-v2-unphi4-14b-GGUF

NaNK

—

117

GSAI-ML.LLaDA-8B-Instruct-GGUF

NaNK

—

117

moonshotai.Kimi-K2-Thinking-BF16

Original INT4 model has been dequantized with my own custom script: DQint4-to-bf16dequant (inspired by the deepseek V3 dequant script)

—

116

yamatazen.EtherealAurora-12B-v2-GGUF

NaNK

—

116

zerofata.MS3.2-PaintedFantasy-v2-24B-GGUF

NaNK

—

116

bigcode.starcoder2-15b-GGUF

NaNK

—

115

facebook.MobileLLM-R1-950M-base-GGUF

Quantized version of: facebook/MobileLLM-R1-950M-base

—

115

Qwen.Qwen3-VL-32B-Thinking-GGUF

NaNK

—

114

allenai.olmOCR-7B-0225-preview-GGUF

NaNK

—

114

nvidia.NVIDIA-Nemotron-Nano-12B-v2-Base-GGUF

Quantized version of: nvidia/NVIDIA-Nemotron-Nano-12B-v2-Base

NaNK

—

113

facebook.MobileLLM-R1-140M-GGUF

—

113

EpistemeAI.ReasoningCore-3B-RE1-V2-GGUF

NaNK

—

112

miromind-ai.Miromind-M1-SFT-7B-GGUF

Quantized version of: miromind-ai/Miromind-M1-SFT-7B

NaNK

—

112

cognitivecomputations.Dolphin-Mistral-24B-Venice-Edition-GGUF

NaNK

—

111

huihui-ai.AceReason-Nemotron-7B-abliterated-GGUF

Quantized version of: huihui-ai/AceReason-Nemotron-7B-abliterated

NaNK

—

111

tencent.Hunyuan-1.8B-Instruct-GGUF

NaNK

—

111

tencent.Hunyuan-4B-Instruct-GGUF

NaNK

—

111

tencent.Hunyuan-A13B-Instruct-GGUF

NaNK

—

110

argilla.distilabeled-Marcoro14-7B-slerp-GGUF

NaNK

—

110

Tongyi-Zhiwen.QwenLong-L1-32B-GGUF

Quantized version of: Tongyi-Zhiwen/QwenLong-L1-32B

NaNK

—

110

sail.Sailor-0.5B-Chat-GGUF

NaNK

—

109

JetBrains.CodeLlama-7B-Kexer-GGUF

NaNK

base_model:JetBrains/CodeLlama-7B-Kexer

109

DavidAU.L3.2-8X4B-MOE-V2-Dark-Champion-Inst-21B-uncen-ablit-GGUF

Quantized version of: DavidAU/L3.2-8X4B-MOE-V2-Dark-Champion-Inst-21B-uncen-ablit

NaNK

—

109

tngtech.DeepSeek-R1T-Chimera-GGUF

—

108

microsoft.NatureLM-8x7B-Inst-GGUF

NaNK

—

108

sarvamai.sarvam-30b-GGUF

NaNK

—

108

HuggingFaceTB.finemath-ablation-3plus-160B-GGUF

NaNK

—

108

sbintuitions.sarashina2.2-3b-instruct-v0.1-GGUF

NaNK

—

108

Delta-Vector.Sol-Reaver-15B-Instruct-GGUF

Quantized version of: Delta-Vector/Sol-Reaver-15B-Instruct

NaNK

—

108

inclusionAI.ASearcher-Web-14B-GGUF

Quantized version of: inclusionAI/ASearcher-Web-14B

NaNK

—

107

TheDrummer.Cydonia-24B-v4.1-GGUF

NaNK

—

107

Meta-Llama-3.1-8B-Instruct-GGUF

NaNK

base_model:meta-llama/Llama-3.1-8B-Instruct

106

Alibaba-NLP.Tongyi-DeepResearch-30B-A3B-GGUF

NaNK

—

106

HuggingFaceTB.finemath-ablation-4plus-160B-GGUF

NaNK

—

106

ModelSpace.GemmaX2-28-2B-Pretrain-GGUF

NaNK

—

106

ibm-granite.granite-3.3-8b-base-GGUF

Quantized version of: ibm-granite/granite-3.3-8b-base

NaNK

—

106

dmis-lab.llama-3.1-medprm-reward-v1.0-GGUF

Quantized version of: dmis-lab/llama-3.1-medprm-reward-v1.0

NaNK

base_model:dmis-lab/llama-3.1-medprm-reward-v1.0

106

ibm-granite.granite-4.0-tiny-preview-GGUF

Quantized version of: ibm-granite/granite-4.0-tiny-preview

—

106

Qwen.Qwen2.5-Math-7B-GGUF

NaNK

—

105

bytedance-research.UI-TARS-7B-DPO-GGUF

NaNK

—

105

mlabonne.Qwen3-30B-A3B-abliterated-GGUF

NaNK

—

104

EVA-UNIT-01.EVA-Qwen2.5-32B-v0.1-GGUF

NaNK

—

104

nvidia.Cosmos-Reason1-7B-GGUF

NaNK

—

103

NousResearch.Hermes-3-Llama-3.1-405B-GGUF

Quantized version of: NousResearch/Hermes-3-Llama-3.1-405B

NaNK

base_model:NousResearch/Hermes-3-Llama-3.1-405B

103

Mistral-7B-Instruct-v0.3-GGUF

NaNK

license:apache-2.0

103

LLM4Binary.llm4decompile-1.3b-v2-GGUF

NaNK

—

103

inclusionAI.AReaL-boba-2-8B-GGUF

NaNK

—

103

cognitivecomputations.Dolphin3.0-R1-Mistral-24B-GGUF

NaNK

—

102

THU-KEG.LongWriter-Zero-32B-GGUF

NaNK

—

102

Qwen.Qwen3-0.6B-Base-GGUF

NaNK

—

102

tencent.Hunyuan-0.5B-Instruct-GGUF

NaNK

—

102

ValiantLabs.Qwen3-14B-Esper3-GGUF

NaNK

—

102

huihui-ai.DeepSeek-V3-0324-Pruned-Coder-411B-GGUF

NaNK

—

101

allenai.OLMo-2-1124-7B-Instruct-GGUF

Quantized version of: allenai/OLMo-2-1124-7B-Instruct

NaNK

—

101

AI-MO.Kimina-Prover-72B-GGUF

NaNK

—

101

Qwen.Qwen1.5-7B-Chat-GGUF

NaNK

—

101

K-intelligence.Midm-2.0-Base-Instruct-GGUF

Quantized version of: K-intelligence/Midm-2.0-Base-Instruct

—

101

baidu.ERNIE-4.5-21B-A3B-Thinking-GGUF

Quantized version of: baidu/ERNIE-4.5-21B-A3B-Thinking

NaNK

—

101

EpistemeAI.DeepThink-Phi4-GGUF

NaNK

—

100

wanlige.li-14b-v0.4-GGUF

NaNK

—

100

LiquidAI.LFM2-1.2B-Extract-GGUF

NaNK

—

100

CohereForAI.c4ai-command-r7b-12-2024-GGUF

NaNK

—

fdtn-ai.Foundation-Sec-8B-Instruct-GGUF

Quantized version of: fdtn-ai/Foundation-Sec-8B-Instruct

NaNK

—

Qwen.Qwen2-VL-72B-GGUF

NaNK

—

OLMoE-1B-7B-0924-Instruct-GGUF

NaNK

—

Qwen.Qwen2.5-VL-72B-Instruct-GGUF

NaNK

—

THU-KEG.TULU3-VerIF-GGUF

—

ValiantLabs.Qwen3-8B-ShiningValiant3-GGUF

Quantized version of: ValiantLabs/Qwen3-8B-ShiningValiant3

NaNK

—

ServiceNow-AI.Apriel-1.5-15b-Thinker-GGUF

Quantized version of: ServiceNow-AI/Apriel-1.5-15b-Thinker

NaNK

—

princeton-nlp.Llama-3-8B-ProLong-512k-Instruct-GGUF

NaNK

base_model:princeton-nlp/Llama-3-8B-ProLong-512k-Instruct

huihui-ai.Huihui-MoE-4.8B-A1.7B-abliterated-GGUF

NaNK

—

openai-community.gpt2-large-GGUF

—

katanemo.Arch-Agent-1.5B-GGUF

NaNK

—

nvidia.Qwen3-Nemotron-8B-BRRM-GGUF

Quantized version of: nvidia/Qwen3-Nemotron-8B-BRRM

NaNK

—

osmosis-ai.Osmosis-Apply-1.7B-GGUF

Quantized version of: osmosis-ai/Osmosis-Apply-1.7B

NaNK

—

Qwen2.5-Math-72B-GGUF

NaNK

—

DeepMount00.Lexora-Medium-7B-GGUF

NaNK

—

huihui-ai.Seed-Coder-8B-Instruct-abliterated-GGUF

Quantized version of: huihui-ai/Seed-Coder-8B-Instruct-abliterated

NaNK

—

nvidia.OpenCodeReasoning-Nemotron-32B-IOI-GGUF

NaNK

—

NovaSky-AI.Sky-T1-mini-GGUF

—

GSAI-ML.LLaDA-1.5-GGUF

NaNK

—

fdtn-ai.Foundation-Sec-8B-GGUF

NaNK

—

Sao10K.14B-Qwen2.5-Kunou-v1-GGUF

NaNK

—

apple.sage-ft-mixtral-8x7b-GGUF

NaNK

—

HuggingFaceTB.finemath-ablation-finemath-3plus-GGUF

—

ibm-granite.granite-vision-3.2-2b-GGUF

NaNK

—

nicoboss.Hermes-3-Llama-3.1-405B-Uncensored-GGUF

NaNK

base_model:nicoboss/Hermes-3-Llama-3.1-405B-Uncensored

ibm-granite.granite-3.0-2b-base-GGUF

NaNK

—

Nitral-AI.Captain-Eris_Violet-GRPO-v0.420-GGUF

NaNK

—

ibm-granite.granite-vision-3.1-2b-preview-GGUF

NaNK

—

THU-KEG.AdaptThink-1.5B-delta0.1-GGUF

NaNK

—

Goekdeniz-Guelmez.Josiefied-Qwen3-4B-Instruct-2507-gabliterated-v1-GGUF

Quantized version of: Goekdeniz-Guelmez/Josiefied-Qwen3-4B-Instruct-2507-gabliterated-v1

NaNK

—

AI-MO.Kimina-Autoformalizer-7B-GGUF

NaNK

—

dphn.Dolphin3.0-Llama3.2-3B-GGUF

NaNK

base_model:dphn/Dolphin3.0-Llama3.2-3B

Delta-Vector.Rei-24B-KTO-GGUF

NaNK

—

baichuan-inc.Baichuan-M2-32B-GGUF

NaNK

—

Steelskull.L3.3-MS-Nevoria-70b-GGUF

Quantized version of: Steelskull/L3.3-MS-Nevoria-70b

NaNK

—

Writer.Palmyra-Med-70B-32K-GGUF

NaNK

—

katanemo.Arch-Router-1.5B-GGUF

NaNK

—

analytical_reasoning_Llama-3.2-1B-GGUF

Quantized version of: analyticalreasoningLlama-3/2-1B

NaNK

—

Qwen.Qwen2.5-7B-Instruct-1M-GGUF

NaNK

—

ibm-granite.granite-3.1-3b-a800m-instruct-GGUF

NaNK

—

Qwen.Qwen3-4B-Base-GGUF

NaNK

—

fedric95.Qwen3-4B-unc-GGUF

NaNK

—

huihui-ai.Qwen3-16B-A3B-abliterated-GGUF

Quantized version of: huihui-ai/Qwen3-16B-A3B-abliterated

NaNK

—

KurmaAI.AQUA-1B-GGUF

NaNK

—

tiiuae.Falcon3-7B-Base-GGUF

NaNK

—

ibm-granite.granite-3.3-8b-instruct-GGUF

NaNK

—

nvidia.NVIDIA-Nemotron-Nano-9B-v2-GGUF

Quantized version of: nvidia/NVIDIA-Nemotron-Nano-9B-v2

NaNK

—

google.gemma-3-1b-it-GGUF

NaNK

—

ibm-granite.granite-3.0-1b-a400m-instruct-GGUF

NaNK

—

huihui-ai.GLM-4-32B-0414-abliterated-GGUF

NaNK

—

nbeerbower.Xiaolong-Qwen3-14B-GGUF

NaNK

—

miromind-ai.MiroMind-M1-RL-7B-GGUF

Quantized version of: miromind-ai/MiroMind-M1-RL-7B

NaNK

—

allenai.OLMo-2-0325-32B-DPO-GGUF

NaNK

—

tngtech.DeepSeek-TNG-R1T2-Chimera-GGUF

—

AI-MO.Kimina-Prover-Preview-Distill-1.5B-GGUF

NaNK

—

arcee-ai.Virtuoso-Large-GGUF

—

ByteDance-Seed.Seed-X-Instruct-7B-GGUF

NaNK

—

llama3_8b_chat_brainstorm-v2.1-GGUF

NaNK

llama

CohereLabs.c4ai-command-r-v01-GGUF

Quantized version of: CohereLabs/c4ai-command-r-v01

NaNK

—

agentica-org.DeepSWE-Preview-GGUF

—

Delta-Vector.Rei-24B-Base-GGUF

NaNK

—

InfiX-ai.InfiR-1B-Instruct-GGUF

NaNK

—

Kortix.FastApply-1.5B-v1.0-GGUF

NaNK

—

SakanaAI.Llama-3-8B-Instruct-OS-Expert-GGUF

NaNK

base_model:SakanaAI/Llama-3-8B-Instruct-OS-Expert

openbmb.BitCPM4-0.5B-GGUF

NaNK

—

Qiskit.granite-3.3-8b-qiskit-GGUF

NaNK

—

deepcogito.cogito-v2-preview-llama-70B-GGUF

NaNK

base_model:deepcogito/cogito-v2-preview-llama-70B

marin-community.marin-32b-base-GGUF

Quantized version of: marin-community/marin-32b-base

NaNK

—

Skywork.Skywork-o1-Open-Llama-3.1-8B-GGUF

Quantized version of: Skywork/Skywork-o1-Open-Llama-3.1-8B

NaNK

base_model:Skywork/Skywork-o1-Open-Llama-3.1-8B

tiiuae.Falcon3-10B-Instruct-GGUF

NaNK

—

kakaocorp.kanana-safeguard-8b-GGUF

Quantized version of: kakaocorp/kanana-safeguard-8b

NaNK

—

princeton-nlp.Llama-3-8B-ProLong-512k-Base-GGUF

NaNK

base_model:princeton-nlp/Llama-3-8B-ProLong-512k-Base

tiiuae.Falcon3-1B-Base-GGUF

NaNK

—

nvidia.AceInstruct-72B-GGUF

NaNK

—

open-r1.OpenR1-Qwen-7B-GGUF

NaNK

—

microsoft.Phi-4-mini-reasoning-GGUF

—

arcee-ai.Arcee-SuperNova-v1-GGUF

NaNK

—

google.gemma-3n-E2B-it-GGUF

NaNK

—

baidu.ERNIE-4.5-0.3B-PT-GGUF

NaNK

—

huihui-ai.Llama-3.3-70B-Instruct-abliterated-finetuned-GGUF

NaNK

base_model:huihui-ai/Llama-3.3-70B-Instruct-abliterated-finetuned

CohereForAI.c4ai-command-r-08-2024-GGUF

Quantized version of: CohereForAI/c4ai-command-r-08-2024

NaNK

—

Qwen.Qwen2.5-14B-Instruct-GGUF

NaNK

—

Infermatic.R1-vortextic-70B-L3.3-v1-GGUF

Quantized version of: Infermatic/R1-vortextic-70B-L3.3-v1

NaNK

—

ValiantLabs.Qwen3-4B-ShiningValiant3-GGUF

NaNK

—

aquif-ai.aquif-3.5-3B-GGUF

NaNK

—

AmanPriyanshu.gpt-oss-6.0b-specialized-all-pruned-moe-only-7-experts-GGUF

NaNK

—

ModelSpace.GemmaX2-28-2B-v0.1-GGUF

NaNK

—

S4nfs.Neeto-1.0-8b-GGUF

NaNK

—

mistralai.Mistral-Large-3-675B-Instruct-2512-GGUF

NaNK

—

utter-project.EuroLLM-1.7B-Instruct-GGUF

NaNK

—

Qwen.Qwen1.5-0.5B-GGUF

NaNK

—

Delta-Vector.Austral-24B-Base-GGUF

Quantized version of: Delta-Vector/Austral-24B-Base

NaNK

—

K-intelligence.Midm-2.0-Mini-Instruct-GGUF

—

huihui-ai.Llama-3.1-Nemotron-Nano-8B-v1-abliterated-GGUF

NaNK

base_model:huihui-ai/Llama-3.1-Nemotron-Nano-8B-v1-abliterated

huihui-ai.Huihui-MoE-23B-A4B-GGUF

NaNK

—

OLMo-7B-0724-Instruct-hf-GGUF

NaNK

—

VAGOsolutions.SauerkrautLM-v2-14b-SFT-GGUF

NaNK

—

DavidAU.L3.1-Dark-Reasoning-Unholy-Hermes-R1-Uncensored-8B-GGUF

Quantized version of: DavidAU/L3.1-Dark-Reasoning-Unholy-Hermes-R1-Uncensored-8B

NaNK

—

Skywork.Skywork-SWE-32B-GGUF

NaNK

—

inclusionAI.ASearcher-Local-7B-GGUF

Quantized version of: inclusionAI/ASearcher-Local-7B

NaNK

—

ByteDance-Seed.cudaLLM-8B-GGUF

NaNK

—

DevQuasar

speakleash.Bielik-11B-v2.6-Instruct-GGUF

Qwen.Qwen3-Next-80B-A3B-Instruct-FP8-Dynamic

Qwen.Qwen3-30B-A3B-Instruct-2507-W4A16-GPTQ

inclusionAI.Ring-1T-GGUF

MiniMaxAI.MiniMax-M2-GGUF

MiniMaxAI.MiniMax-M2.5-GGUF

cerebras.MiniMax-M2-REAP-162B-A10B-GGUF

cerebras.MiniMax-M2-REAP-139B-A10B-GGUF

inclusionAI.Ling-1T-GGUF

ai-sage.GigaChat3-702B-A36B-preview-bf16-GGUF

moonshotai.Kimi-K2-Thinking-GGUF

moonshotai.Kimi-K2.5-GGUF

Qwen.Qwen3-Coder-480B-A35B-Instruct-GGUF

google.gemma-3-12b-pt-GGUF

Qwen.Qwen3-VL-235B-A22B-Thinking-GGUF

inclusionAI.Ring-flash-2.0-GGUF

DavidAU.L3.1-Dark-Reasoning-LewdPlay-evo-Hermes-R1-Uncensored-8B-GGUF

dphn.Dolphin-Mistral-24B-Venice-Edition-GGUF

nanonets.Nanonets-OCR2-3B-GGUF

Qwen.Qwen3-VL-235B-A22B-Instruct-GGUF

zai-org.GLM-4.5-Air-GGUF

openai.gpt-oss-20b-GGUF

CohereLabs.command-a-translate-08-2025-GGUF

google.gemma-3-27b-pt-GGUF

deepseek-ai.DeepSeek-V3.2-GGUF

deepcogito.cogito-671b-v2.1-GGUF

mlfoundations-dev.oh-dcft-v3.1-claude-3-5-haiku-20241022-GGUF

NousResearch.Hermes-4-405B-GGUF

facebook.MobileLLM-R1-950M-GGUF

nvidia.Llama-3_1-Nemotron-Ultra-253B-v1-GGUF

Qwen.Qwen3.5-35B-A3B-GGUF

google.gemma-3-4b-pt-GGUF

tencent.Hunyuan-MT-7B-GGUF

google.gemma-3-1b-pt-GGUF

zai-org.GLM-5-GGUF

deepseek-ai.DeepSeek-V3.1-GGUF

xai-org.grok-2-GGUF

PokeeAI.pokee_research_7b-GGUF

LLM360.K2-Think-GGUF

nvidia.OpenCodeReasoning-Nemotron-7B-GGUF

Kwaipilot.KAT-Dev-GGUF

swiss-ai.Apertus-8B-Instruct-2509-GGUF

huihui-ai.DeepSeek-R1-Distill-Qwen-7B-abliterated-GGUF

huihui-ai.QwQ-32B-abliterated-GGUF

cognitivecomputations.Dolphin3.0-Llama3.1-8B-GGUF

Qwen.Qwen3-1.7B-GGUF

huihui-ai.Huihui-Hunyuan-MT-7B-abliterated-GGUF

Qwen.Qwen3-Coder-30B-A3B-Instruct-GGUF

Gryphe.MythoMax-L2-13b-GGUF

inference-net.Schematron-3B-GGUF

LiquidAI.LFM2-700M-GGUF

huihui-ai.granite-vision-3.2-2b-abliterated-GGUF

Qwen.Qwen3-235B-A22B-GGUF

QuixiAI.WizardLM-13B-Uncensored-GGUF

chutesai.Qwen3-235B-A22B-Instruct-2507-1M-GGUF

internlm.OREAL-DeepSeek-R1-Distill-Qwen-7B-GGUF

nvidia.NVIDIA-Nemotron-Nano-12B-v2-GGUF

Qwen.Qwen3-Reranker-8B-GGUF

mistralai.Ministral-3-3B-Instruct-2512-GGUF

Salesforce.Llama-xLAM-2-8b-fc-r-GGUF

huihui-ai.Huihui-Hunyuan-MT-Chimera-7B-abliterated-GGUF

openai.gpt-oss-120b-GGUF

CohereLabs.command-a-reasoning-08-2025-GGUF

huihui-ai.DeepSeek-R1-Distill-Qwen-14B-abliterated-v2-GGUF

XiaomiMiMo.MiMo-V2-Flash-GGUF

inclusionAI.Ring-mini-sparse-2.0-exp-GGUF

deepseek-ai.DeepSeek-V3.2-Speciale-Channel-INT8

Intelligent-Internet.II-Medical-8B-1706-GGUF

huihui-ai.DeepSeek-R1-Distill-Qwen-32B-abliterated-GGUF

huihui-ai.Huihui-Qwen3-4B-Instruct-2507-abliterated-GGUF

nvidia.Llama-3_3-Nemotron-Super-49B-v1_5-GGUF

ibm-granite.granite-4.0-350m-GGUF

google.gemma-3-4b-it-qat-int4-unquantized-GGUF

google.gemma-3-27b-it-qat-q4_0-unquantized-GGUF

nvidia.OpenReasoning-Nemotron-7B-GGUF

Qwen.Qwen2.5-VL-7B-Instruct-GGUF

ai21labs.AI21-Jamba-Large-1.6-GGUF

HuggingFaceTB.finemath-ablation-infiwebmath-GGUF

mistralai.Mistral-7B-Instruct-v0.1-GGUF