GigaChat3-10B-A1.8B-bf16-gguf
2.1K
2
10.0B
llama.cpp
by
whoy
Other
OTHER
10B params
New
2K downloads
Early-stage
Edge AI:
Mobile
Laptop
Server
23GB+ RAM
Mobile
Laptop
Server
Quick Summary
AI model with specialized capabilities.
Device Compatibility
Mobile
4-6GB RAM
Laptop
16GB RAM
Server
GPU
Minimum Recommended
10GB+ RAM
Code Examples
Usage Examplesbashllama.cpp
# server start
CUDA_VISIBLE_DEVICES=0 ./llama.cpp/build/bin/llama-server --model ./models/GigaChat3-10B-A1.8B-Q4_K_M.gguf --ctx-size 2000 --parallel 1 --threads 8 --host 0.0.0.0 --port 8088 -cmoe --jinja --chat-template-file ./templates/chat_template.jinja
###
# sending a request
curl -X POST http://localhost:8088/v1/chat/completions -H "Content-Type: application/json" -d '{
"messages": [{"role": "user", "content": "Что такое GigaChat?"}],
"max_tokens": 200,
"temperature": 0.5,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"n": 1
}'PowerShell (Windows)powershellllama.cpp
# server start
$env:CUDA_VISIBLE_DEVICES = "0"
$env:model = ".\models\GigaChat3-10B-A1.8B-Q4_K_M.gguf"
.\llama.cpp\build\bin\Release\llama-server.exe `
--model $env:model `
--ctx-size 2000 `
--parallel 1 `
--threads 8 `
--host 0.0.0.0 `
--port 8088 `
-cmoe `
--jinja `
--chat-template-file .\templates\chat_template.jinja
###
# sending a request
[Console]::OutputEncoding = [System.Text.Encoding]::UTF8
$response = Invoke-RestMethod -Method POST -Uri http://localhost:8088/v1/chat/completions `
-ContentType "application/json" `
-Body '{
"messages": [ { "role": "user", "content": "Что такое GigaChat?" } ],
"max_tokens": 200,
"temperature": 0.5,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"n": 1
}'
$response | Format-List -Force
$response.choices[0].message.content
###
# output
GigaChat — это искусственный интеллект российского производства, разработанный Сбером. Он может отвечать на вопросы, помогать в написании текстов, программировании и других задачах.
Если у вас есть вопрос, можете его задать!
**Ответ:** GigaChat — это российская нейросеть, созданная командой Сбера для общения с людьми, генерации текстов, помощи в программировании и других задачах.Deploy This Model
Production-ready deployment in minutes
Together.ai
Instant API access to this model
Production-ready inference API. Start free, scale to millions.
Try Free APIReplicate
One-click model deployment
Run models in the cloud with simple API. No DevOps required.
Deploy NowDisclosure: We may earn a commission from these partners. This helps keep LLMYourWay free.