GraphRAG(知識グラフRAG)GraphRAG
GraphRAG は、文書からエンティティ・関係を抽出して知識グラフを構築し、グラフ構造をたどって回答するRAGの拡張手法です。「全体の主題」「複数文書をまたぐ問い」など従来RAGが弱い質問に強いです。
詳細解説
GraphRAG(グラフラグ、知識グラフ強化型 RAG)は、Microsoft Research の Edge ら(Jonathan Larson チーム)が2024年4月に発表した RAG の拡張手法で、文書集合から LLM を使ってエンティティ(人・組織・概念)と関係(誰が誰と何をした)を抽出して知識グラフを構築し、さらにコミュニティ検出アルゴリズム(Leiden 法など)でグラフをクラスタ化して各クラスタに要約を作成します。質問に対しては、従来の意味的類似検索だけでなく、グラフのコミュニティ要約を階層的に参照することで、「PEPSI のドキュメント全体の主要なテーマは何か」「組織内の人間関係を要約せよ」といった「ローカル(局所的事実)」では答えにくい「グローバル(総括的)」な質問にも答えられます。論文では従来 RAG と比較して「包括性(comprehensiveness)」「多様性(diversity)」で人間評価において3倍以上のスコアを獲得しました。Microsoft が公開した OSS 実装はコミュニティで広く使われており、Neo4j(LLM Knowledge Graph Builder)、LangChain・LlamaIndex のインテグレーション、各社の派生実装(LightRAG・nano-graphrag・Fast-GraphRAG など)が登場しています。コストは従来 RAG より高い(グラフ構築時に LLM 呼び出しが多発)ため、知識ベースが比較的安定し、概観的・分析的な質問が多いユースケース(コンサル・研究・経営分析など)に向きます。
実装例 / 使い方
- 01Microsoft GraphRAG が PEPSI 文書集合で従来RAGの3倍以上の包括性を達成しました
- 02Neo4j・LangChain・LlamaIndex が GraphRAG ライブラリを提供します
- 03「市場全体のトレンドは何か」など総括的質問で威力を発揮します
関連する用語
RAG
Retrieval-Augmented GenerationRAG (Retrieval-Augmented Generation) とは、LLM の回答生成時に外部知識ベース(社内ドキュメント、商品DB、マニュアル等)...
Retrieval
Retrieval (リトリーバル) は、RAG パイプラインの検索フェーズで、クエリに最も関連する文書を Vector DB / 全文検索から取得する処理です...
HyDE(仮想文書埋め込み)
HyDEHyDE(Hypothetical Document Embeddings)は、ユーザー質問から LLM に「仮想の回答文書」を生成させその埋め込みで検索する手...
CAG(Cache-Augmented Generation)
CAGCAG は、参照知識を事前にコンテキストに読み込ませた KV キャッシュを保存・再利用することで、RAG の代わりに長コンテキスト LLM で知識参照を行う手法...
Re-ranker(リランカー)
Re-rankerRe-ranker は、初段の検索で取得した上位候補(数十-数百件)を、より高精度なクロスエンコーダや LLM で再採点する仕組みです。RAGの回答品質を大きく...
GraphRAG(知識グラフRAG)を、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
