GigaChat3-10B-A1.8B-bf16-gguf

2.1K
2
10.0B
llama.cpp
by
whoy
Other
OTHER
10B params
New
2K downloads
Early-stage
Edge AI:
Mobile
Laptop
Server
23GB+ RAM
Mobile
Laptop
Server
Quick Summary

AI model with specialized capabilities.

Device Compatibility

Mobile
4-6GB RAM
Laptop
16GB RAM
Server
GPU
Minimum Recommended
10GB+ RAM

Code Examples

Usage Examplesbashllama.cpp
# server start

CUDA_VISIBLE_DEVICES=0 ./llama.cpp/build/bin/llama-server   --model ./models/GigaChat3-10B-A1.8B-Q4_K_M.gguf   --ctx-size 2000   --parallel 1   --threads 8   --host 0.0.0.0   --port 8088   -cmoe   --jinja   --chat-template-file ./templates/chat_template.jinja

###

# sending a request

curl -X POST http://localhost:8088/v1/chat/completions -H "Content-Type: application/json" -d '{
  "messages": [{"role": "user", "content": "Что такое GigaChat?"}],
  "max_tokens": 200,
  "temperature": 0.5,
  "top_p": 0.95,
  "frequency_penalty": 0,
  "presence_penalty": 0,
  "n": 1
}'
PowerShell (Windows)powershellllama.cpp
# server start

$env:CUDA_VISIBLE_DEVICES = "0"
$env:model = ".\models\GigaChat3-10B-A1.8B-Q4_K_M.gguf"

.\llama.cpp\build\bin\Release\llama-server.exe `
  --model $env:model `
  --ctx-size 2000 `
  --parallel 1 `
  --threads 8 `
  --host 0.0.0.0 `
  --port 8088 `
  -cmoe `
  --jinja `
  --chat-template-file .\templates\chat_template.jinja

###

# sending a request

[Console]::OutputEncoding = [System.Text.Encoding]::UTF8

$response = Invoke-RestMethod -Method POST -Uri http://localhost:8088/v1/chat/completions `
  -ContentType "application/json" `
  -Body '{
    "messages": [ { "role": "user", "content": "Что такое GigaChat?" } ],
    "max_tokens": 200,
    "temperature": 0.5,
    "top_p": 0.95,
    "frequency_penalty": 0,
    "presence_penalty": 0,
    "n": 1
  }'

$response | Format-List -Force

$response.choices[0].message.content

###

# output

GigaChat — это искусственный интеллект российского производства, разработанный Сбером. Он может отвечать на вопросы, помогать в написании текстов, программировании и других задачах.

Если у вас есть вопрос, можете его задать!

**Ответ:** GigaChat — это российская нейросеть, созданная командой Сбера для общения с людьми, генерации текстов, помощи в программировании и других задачах.

Deploy This Model

Production-ready deployment in minutes

Together.ai

Instant API access to this model

Fastest API

Production-ready inference API. Start free, scale to millions.

Try Free API

Replicate

One-click model deployment

Easiest Setup

Run models in the cloud with simple API. No DevOps required.

Deploy Now

Disclosure: We may earn a commission from these partners. This helps keep LLMYourWay free.