用語集一覧へ
— Glossary
Embedding
読み: エンベディング
短い定義
Embedding (エンベディング) は、テキストや画像を数値ベクトルに変換する技術です。意味的に近いものはベクトル空間でも近くなり、類似検索・クラスタリング・RAG の基盤として使われます。
詳細解説
Embedding は単語・文・画像などを 768 次元〜3072 次元のベクトルに変換し、コサイン類似度などで近さを比較できる形にします。OpenAI text-embedding-3-large、Cohere Embed、Voyage AI、ローカル動作の SBERT 等が代表的。RAG の検索フェーズ、推薦システム、感情分析などに不可欠です。Vector DB と組み合わせて大量検索を実現します。
実装例 / 使い方
- 01OpenAI text-embedding-3-large で 3072 次元ベクトル化
- 02Pinecone / Qdrant に保存して類似検索
- 03RAG で「質問 → 関連文書」検索の核
参考・出典
関連する用語
Vector DB
Vector DB (ベクター DB) は、Embedding ベクトルに最適化された検索データベースです。Pinecone・Qdrant・Weaviate・C...
詳細
RAG
Retrieval-Augmented GenerationRAG (Retrieval-Augmented Generation) とは、LLM の回答生成時に外部知識ベース(社内ドキュメント、商品DB、マニュアル等)...
詳細
コサイン類似度
コサイン類似度は、2 つのベクトルの角度を比較する類似度指標です。0〜1 の範囲で、1 に近いほど似ています。Embedding ベースの検索・推薦で標準的に使...
詳細
— IMPLEMENT
Embeddingを、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
