用語集一覧へ
— Glossary
Fine-tuning
読み: ファインチューニング
短い定義
Fine-tuning (ファインチューニング) は、事前学習済み LLM に独自データセットを追加学習させて挙動を調整する手法です。プロンプトでは制御できない深い特化が可能になります。
詳細解説
Fine-tuning は OpenAI / Anthropic / Google が提供する有料機能で、自社のデータ (入出力ペア数百〜数万件) を渡すと特化モデルが返ってきます。同じタスクを毎回プロンプトで指示する手間を省き、応答速度・コスト・精度すべてで優位に。ただし汎用性は落ちるため、用途を絞った運用向け。LoRA / PEFT などの軽量手法で個人 PC でも実行可能になりつつあります。
実装例 / 使い方
- 01OpenAI GPT-3.5 Turbo を fine-tune して社内 FAQ ボット
- 02Llama 3 を LoRA で日本語 fine-tune
- 03Anthropic Claude は現状 fine-tuning 提供なし (RAG / Few-shot 推奨)
関連する用語
LoRA
Low-Rank AdaptationLoRA (Low-Rank Adaptation) は、LLM の全パラメータを更新せず、小さな低ランク行列のみを学習する効率的な fine-tuning 手...
詳細
PEFT
Parameter-Efficient Fine-TuningPEFT (Parameter-Efficient Fine-Tuning) は、LLM の全パラメータを更新せずに少数のパラメータだけ学習する手法群の総称です...
詳細
RLHF
Reinforcement Learning from Human FeedbackRLHF (Reinforcement Learning from Human Feedback) は、人間の好みを報酬信号として LLM を強化学習で調整する...
詳細
— IMPLEMENT
Fine-tuningを、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
