dtmoyaji released this
13 hours ago
初回リリース。sonoisa/sentence-bert-base-ja-mean-tokens-v2 を ONNX にエクスポートし、INT8 静的量子化したモデルをビルド・配布するためのパイプラインを提供します。
export_onnx.py … Hugging Face のモデルを ONNX (FP32) にエクスポート。トークナイザー・config は配布用に target/ に保存。quantize.py … キャリブレーション用文(build/sentences.txt)で静的量子化し、target/model_quantized.onnx を出力。target/ に配布するものだけが出力される(model_quantized.onnx とトークナイザー・config)。中間ファイルは build/。setup_venv.bat(仮想環境作成)、run_quantize.bat(エクスポート〜量子化の一括実行)。Windows で set PYTHONUTF8=1 を設定して Unicode エラーを防止。scripts/run_inference.py で target/ の動作確認。test/ に pytest 用のテストを同梱。.gitattributes で LF 統一。requirements にバージョン上限を指定して再現ビルドをしやすくした。setup_venv.bat で環境構築(または pip install -r requirements.txt)run_quantize.bat でエクスポートと量子化を一括実行target/ 一式を ZIP などで渡す