Newer
Older
TelosDB / docs / plans / lda / lda_05_considerations.md

LDA 計画: 05 注意事項・未決定

計画トップ


注意事項・未決定

  • トピック数 K: 規定は 128 次元。ユーザーが設定で K を変更した場合は、再学習(retrain)で LDA モデルと items_lda を新しい K で再構成する。K の許容範囲(例: 16〜512)は実装時に決める。
  • 学習コスト: LDA は反復計算(Gibbs や VB)のため、文書数が多いと LSA より重い。バックグラウンド実行・進捗表示が必要。03 UI 改造の再構成ボタン押下時や起動時の LDA 学習で、SSE 等で状態を通知する。
  • 切り替え時の再学習: LSA → LDA に切り替えたときは LDA を学習し、LDA → LSA に切り替えたときは LSA を再学習する。両方のインデックスを事前に持っておくか、選択時のみ必要側を学習するかは実装で決める。
  • Pro 版: LSA・LDA は Community 専用とする。Pro では埋め込みモデルのみでベクトル化し、LSA/LDA のビルド・実行パスは含めない。設定 UI でも LSA/LDA の項目は Pro 版では表示しない。