メインコンテンツへスキップ
EXBANK
用語集一覧へ
— Glossary

コサイン類似度

読み: コサインるいじど
短い定義

コサイン類似度は、2 つのベクトルの角度を比較する類似度指標です。0〜1 の範囲で、1 に近いほど似ています。Embedding ベースの検索・推薦で標準的に使われます。

詳細解説

コサイン類似度は cos(θ) = (A · B) / (|A| × |B|) で計算され、ベクトルの大きさを無視して方向のみで類似度を測ります。テキスト Embedding の検索ではこれが事実上のスタンダード。ユークリッド距離やマンハッタン距離より、Embedding ベクトルの性質に合っています。Pinecone / Qdrant 等の Vector DB ではデフォルトメトリクスとして採用されています。

実装例 / 使い方

  • 01RAG で 'クエリ Embedding と文書 Embedding のコサイン類似度' で検索
  • 02ユーザー A と B の興味類似度を計算
  • 03FAQ 回答候補の自動マッチング
IMPLEMENT

コサイン類似度を、実際に活用する

用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。

営業時間 平日10-18時 / 通常24時間以内に返信