Vikhrmodels

93 models • 1 total models in database

Sort by:

it-5.2-fp16-cp

Долили сильно больше данных в sft, теперь стабильнее работает json и multiturn, слегка подточили параметры претрена модели Added a lot more data to sft, now json and multiturn work more stable on long context and hard prompts

llama

17,680

Borealis

license:apache-2.0

8,158

Vistral-24B-Instruct-GGUF

Vistral - это наша новая флагманская унимодальная LLM (Large Language Model) представляющая из себя улучшенную версию mistralai/Mistral-Small-3.2-24B-Instruct-2506 командой VikhrModels, адаптированную преимущественно для русского и английского языков. Удалён визуальный энкодер, убрана мультимодальность. Сохранена стандартная архитектура "MistralForCausalLM" без изменений в базовой структуре модели. Весь использованный код для обучения доступен в нашем репозитории effectivellmalignment на GitHub, а основные датасеты доступны в нашем профиле на HF.

Vikhrmodels

it-5.2-fp16-cp

Borealis

Vistral-24B-Instruct-GGUF

QVikhr-3-8B-Instruction

Vikhr-Gemma-2B-instruct-GGUF

Vistral-24B-Instruct

Vikhr-Qwen-2.5-1.5B-Instruct

QVikhr-3-8B-Instruction-GGUF

Vikhr-Llama-3.2-1B-instruct-GGUF

QVikhr-3-4B-Instruction-GGUF

Vikhr-YandexGPT-5-Lite-8B-it

it-5.2-fp16-cp-GGUF

Borealis-5b-it

Vikhr Llama3.1 8B Instruct R 21 09 24

QVikhr-3-1.7B-Instruction-noreasoning-GGUF

it-5.4-fp16-orpo-v2-GGUF

Vikhr-Gemma-2B-instruct

it-5.3-fp16-32k-GGUF

Vikhr-7B-instruct_0.4-GGUF

Vikhr-Llama-3.2-1B-Instruct

Vikhr-YandexGPT-5-Lite-8B-it_GGUF

QVikhr-3-1.7B-Instruction-noreasoning

Vikhr-Qwen-2.5-1.5B-Instruct-GGUF

Vikhr-Qwen-2.5-0.5B-instruct-GGUF

QVikhr-3-4B-Instruction

Qwen2.5-7B-Instruct-Tool-Planning-v0.1

QVikhr-2.5-1.5B-Instruct-r_GGUF

QVikhr-2.5-1.5B-Instruct-SMPO

Vikhr-7B-instruct_0.4

Vikhr-Qwen-2.5-0.5b-Instruct

it-5.3-fp16-GGUF

Vikhr-Llama-3.2-1B-Instruct-abliterated

QVikhr-2.5-1.5B-Instruct-SMPO_GGUF

QVikhr-2.5-1.5B-Instruct-r

Vikhr-7B-instruct_0.2

Vikhr-7b-0.1

Vikhr-Qwen-2.5-1.5B-Instruct-MLX_8bit

kolibri-vikhr-mistral-0427

Vistral-24B-Instruct-MLX_4bit

Vikhr-7B-instruct_0.3

Vistral-24B-Instruct-MLX_8bit

Mini-cpm-vikhr

salt-116k

QVikhr-2.5-1.5B-Instruct-r_MLX-8bit

QVikhr-3-1.7B-Instruction-noreasoning-MLX_8bit

QVikhr-3-8B-Instruction-MLX_8bit

salt-qwen2.5-0.5b-asr-tts

Vikhr-YandexGPT-5-Lite-8B-it_MLX-8bit

it-5.4-fp16-orpo-v2

QVikhr-3-4B-Instruction-MLX_4bit_DWQ

Vikhr-YandexGPT-5-Lite-8B-it_MLX-4bit

QVikhr-3-8B-Instruction-MLX_4bit

Qwen3-0.6B-TTS

salt-asr_wav-uni_1_tts_wav-uni_1-12k

it-5.4-fp16-orpo-v2-Q4_K_M-GGUF

QVikhr-3-4B-Instruction-MLX_8bit

Borealis-ASR-4B-50k

Salt2.5-DataMix-1.48

Vikhr-Qwen-2.5-1.5B-Instruct-MLX_4bit

salt-qwen2.5-0.5b-tts

nemo-awq-q4

Vikhr-2-VL-2b-Instruct-experimental

QVikhr-2.5-1.5B-Instruct-SMPO_MLX-4bit

QVikhr-2.5-1.5B-Instruct-SMPO_MLX-8bit

salt-asr_speech_1_wav_1_tts_speech_3_text-10k

Vikhr-7B-instruct_0.2-AQLM

saltm

QVikhr-3-4B-Instruction-MLX_4bit

QVikhr-3-1.7B-Instruction-noreasoning-MLX_4bit

Qwen3-0.6B-experimental

Salt2.5-DataMix

VikhrT5-240m

VikhrT5-3b

Vikhr-7b-0.2

salt-75tps-asr

Qwen2.5-0.5-TTS

ss5

it-5.3-fp16-32k

Vikhr-tiny-0.1