用語集一覧へ
— Glossary
コサイン類似度
読み: コサインるいじど
短い定義
コサイン類似度は、2 つのベクトルの角度を比較する類似度指標です。0〜1 の範囲で、1 に近いほど似ています。Embedding ベースの検索・推薦で標準的に使われます。
詳細解説
コサイン類似度は cos(θ) = (A · B) / (|A| × |B|) で計算され、ベクトルの大きさを無視して方向のみで類似度を測ります。テキスト Embedding の検索ではこれが事実上のスタンダード。ユークリッド距離やマンハッタン距離より、Embedding ベクトルの性質に合っています。Pinecone / Qdrant 等の Vector DB ではデフォルトメトリクスとして採用されています。
実装例 / 使い方
- 01RAG で 'クエリ Embedding と文書 Embedding のコサイン類似度' で検索
- 02ユーザー A と B の興味類似度を計算
- 03FAQ 回答候補の自動マッチング
— IMPLEMENT
コサイン類似度を、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
