hotchpotch

36 models • 2 total models in database

Sort by:

japanese-reranker-xsmall-v2

| モデル名 | レイヤー数 | 隠れ層サイズ | スコア(avg) | 速度(GPU) | | --- | --- | --- | --- | --- | | hotchpotch/japanese-reranker-tiny-v2 | 3 | 256 | 0.8138 | 2.1s | | hotchpotch/japanese-reranker-xsmall-v2 | 10 | 256 | 0.8699 | 6.5s | | hotchpotch/japanese-reranker-small-v2 | 13 | 384 | 0.8856 | 15.2s | | hotchpotch/japanese-reranker-base-v2 | 19 | 512 | 0.8930 | 32.5s | | hotchpotch/japanese-reranker-cross-encoder-xsmall-v1 | 6 | 384 | 0.8131 | 20.5s | | hotchpotch/japanese-reranker-cross-encoder-small-v1 | 12 | 384 | 0.8254 | 40.3s | | hotchpotch/japanese-reranker-cross-encoder-base-v1 | 12 | 768 | 0.8484 | 96.8s | | hotchpotch/japanese-reranker-cross-encoder-large-v1 | 24 | 1024 | 0.8661 | 312.2s | | hotchpotch/japanese-bge-reranker-v2-m3-v1 | 24 | 1024 | 0.8584 | 310.6s | - とても小さく速く実用的な日本語リランカー japanese-reranker-tiny,xsmall v2 を公開 - 日本語最高性能のRerankerをリリース / そもそも Reranker とは? - 日本語 Reranker 作成のテクニカルレポート GPU が Flash Attention 2 をサポートしている場合、flash-attn ライブラリを入れることで、高速な推論が可能です。 CPU 環境や arm 環境などで、より高速に動かしたい場合は onnx や量子化モデルを利用できます。 japanese-reranker-tiny-v2、japanese-reranker-xsmall-v2、japanese-reranker-small-v2、japanese-reranker-base-v2は、以下の特徴を持つ小型リランカーモデルです： 1. CPUやAppleシリコン環境でも実用的な速度で動作 2. 高価なGPUリソースなしでもRAGシステムの精度向上が可能 3. エッジデバイスでの展開や低レイテンシが要求される本番環境で活用可能 4. ModernBertベースのruri-v3-pt-30m（tiny/xsmall）、ruri-v3-pt-70m（small）、ruri-v3-pt-130m（base）を利用 | モデル名 | avg | JQaRA | JaCWIR | MIRACL | JSQuAD | |---------|-----|-------|--------|--------|--------| | japanese-reranker-tiny-v2 | 0.8138 | 0.6455 | 0.9287 | 0.7201 | 0.9608 | | japanese-reranker-xsmall-v2 | 0.8699 | 0.7403 | 0.9409 | 0.8206 | 0.9776 | | japanese-reranker-small-v2 | 0.8856 | 0.7633 | 0.9586 | 0.8385 | 0.9821 | | japanese-reranker-base-v2 | 0.8930 | 0.7845 | 0.9603 | 0.8425 | 0.9845 | | japanese-reranker-cross-encoder-xsmall-v1 | 0.8131 | 0.6136 | 0.9376 | 0.7411 | 0.9602 | | japanese-reranker-cross-encoder-small-v1 | 0.8254 | 0.6247 | 0.9390 | 0.7776 | 0.9604 | | japanese-reranker-cross-encoder-base-v1 | 0.8484 | 0.6711 | 0.9337 | 0.8180 | 0.9708 | | japanese-reranker-cross-encoder-large-v1 | 0.8661 | 0.7099 | 0.9364 | 0.8406 | 0.9773 | | japanese-bge-reranker-v2-m3-v1 | 0.8584 | 0.6918 | 0.9372 | 0.8423 | 0.9624 | | bge-reranker-v2-m3 | 0.8512 | 0.6730 | 0.9343 | 0.8374 | 0.9599 | | ruri-v3-reranker-310m | 0.9171 | 0.8688 | 0.9506 | 0.8670 | 0.9820 | 以下は約15万ペアをリランキングした際の推論速度結果（トークナイズ時間を除く純粋なモデル推論時間）です。MPS(Appleシリコン)とCPU測定にはM4 Max、GPUにはRTX5090を使用しています。GPU処理では flash-attention2 を使用しています。 | モデル名 | レイヤー数 | 隠れ層サイズ | 速度(GPU) | 速度(MPS) | 速度(CPU) | |---------|------------|-------------|-----------|-----------|-----------| | japanese-reranker-tiny-v2 | 3 | 256 | 2.1s | 82s | 702s | | japanese-reranker-xsmall-v2 | 10 | 256 | 6.5s | 303s | 2300s | | japanese-reranker-small-v2 | 13 | 384 | 15.2s | | | | japanese-reranker-base-v2 | 19 | 512 | 32.5s | | | | japanese-reranker-cross-encoder-xsmall-v1 | 6 | 384 | 20.5s | | | | japanese-reranker-cross-encoder-small-v1 | 12 | 384 | 40.3s | | | | japanese-reranker-cross-encoder-base-v1 | 12 | 768 | 96.8s | | | | japanese-reranker-cross-encoder-large-v1 | 24 | 1024 | 312.2s | | | | japanese-bge-reranker-v2-m3-v1 | 24 | 1024 | 310.6s | | | | bge-reranker-v2-m3 | 24 | 1024 | 310.7s | | | | ruri-v3-reranker-310m | 25 | 768 | 81.4s | | |

hotchpotch

japanese-reranker-xsmall-v2

japanese-reranker-cross-encoder-small-v1

japanese-bge-reranker-v2-m3-v1

japanese-splade-v2

japanese-reranker-cross-encoder-large-v1

japanese-reranker-cross-encoder-xsmall-v1

japanese-reranker-tiny-v2

japanese-reranker-base-v2

open-provence-reranker-xsmall-v1

japanese-reranker-cross-encoder-base-v1

mMiniLMv2-L6-H384

japanese-reranker-small-v2

open-provence-reranker-v1

open-provence-reranker-v1-gte-modernbert-base

open-provence-reranker-large-v1

query-crafter-japanese-Qwen3-1.7B

query-context-pruner-multilingual-Qwen3-4B

japanese-splade-base-v1

query-crafter-japanese-Qwen3-4B

vespa-onnx-intfloat-multilingual-e5-large

vespa-onnx-intfloat-multilingual-e5-small

query-context-pruner-multilingual-Qwen3-1.7B

bert-base-japanese-v3-retromae

ruri-pt-base-retromae

youri-7b-sft-qa-context-jaqket-gptq

vespa-onnx-BAAI-bge-m3-only-dense

mMiniLMv2-L12-H384

luke-japanese-base-lite-xlm-roberta

japanese-splade-base-v1_5

youri-7b-sft-qa-context-jaqket-awq

fineweb-2-edu-japanese-classifier

Static Embedding Japanese

open-calm-7b_lora_open2ch

xlm-roberta-japanese-tokenizer

japanese-splade-base-v1-dummy-fast-tokenizer-for-tei

fineweb-2-japanese-text-cleaner