TelosDB / embedding_model /
@楽曲作りまくりおじさん 楽曲作りまくりおじさん authored 2 days ago
..
README.md Release v0.3.2: Community/Pro 2エディション、Pro 埋め込みモデル同梱、リソース解決修正、リリースノート・仕様書整理 2 days ago
README.md

Pro 版埋め込みモデル (sonoisa)

このフォルダに次のファイルをコピーして配置してください。

  • model_quantized.onnx … 量子化済み sentence-bert-base-ja-mean-tokens-v2 モデル
  • vocab.txt … BERT 用語彙ファイル

  • 開発時: プロジェクトルートの embedding_model/ を参照します(npm run dev:pro)。

  • 配布ビルド時: Pro ビルド前に上記2ファイルを置いておくと、インストーラに同梱されます。利用者は別途ダウンロード不要で、Pro 版をインストールするだけでモデル付きで利用できます。未配置のまま npm run build:pro すると ensure-embedding-model.mjs が失敗します。
  • モデルがロードできない場合: まず tract でロードを試み、失敗時は ONNX Runtime (ort) に自動フォールバックします。量子化 ONNX で tract の Cast ノードが失敗する場合も、ort で推論可能です。明示的に tract の最適化だけスキップしたいときは環境変数 TELOS_EMBEDDING_NO_OPTIMIZE=1 を指定してください。

取得元(量子化済み): sentence-bert-base-ja-mean-tokens-v2-int8
元モデル: sonoisa/sentence-bert-base-ja-mean-tokens-v2 (CC BY-SA 4.0)