Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

インデキシング(Indexing)

このセクションでは、Laurus がデータを内部的にどのように格納・整理するかについて説明します。インデキシングレイヤーを理解することで、適切なフィールドタイプの選択やパフォーマンスチューニングに役立ちます。

トピック

Lexical インデキシング

転置インデックス(Inverted Index)を使用したテキスト、数値、地理フィールドのインデキシング方法について説明します。

  • 転置インデックスの構造(Term Dictionary、Posting Lists)
  • 数値範囲クエリのための BKD ツリー
  • セグメントファイルとそのフォーマット
  • BM25 スコアリング

Vector インデキシング

近似最近傍探索(Approximate Nearest Neighbor Search)のためのベクトルフィールドのインデキシング方法について説明します。

  • インデックスタイプ: Flat、HNSW、IVF
  • パラメータチューニング(m、ef_construction、n_clusters、n_probe)
  • 距離メトリクス(Cosine、Euclidean、DotProduct)
  • 量子化(Quantization): SQ8、PQ