メインコンテンツへスキップ
EXBANK
Draft / 編集レビュー前この用語はAI補助で初稿生成中です。事実確認・編集監修が完了するまで検索エンジンには公開されません。誤りを見つけたらこちらから連絡してください。
用語集一覧へ
— Glossary

Positional Encoding(位置符号化)PE

読み: ポジショナルエンコーディング
TL;DR — 短い定義

Positional Encoding は、Transformer の入力埋め込みに位置情報を付与する仕組みです。Self-Attention 自体は順序を持たないため、絶対位置・相対位置を別途符号化して足し込むか乗算する必要があります。

詳細解説

Positional Encoding(位置符号化、ポジショナルエンコーディング)は、Self-Attention が順序情報を本質的に持たないという欠点を補うために、トークン埋め込みに位置情報を付与する仕組みです。Vaswani らの原論文では、次元 i に対して周期 10000^(2i/d_model) の sin/cos 関数値を加算する正弦波エンコーディング(sinusoidal PE)が用いられ、外挿性と相対距離の表現性を両立しました。BERT・GPT-2 は学習可能な絶対位置埋め込み(learned absolute PE)を採用し、シンプルですが学習時の最大長を超える系列に弱いという課題があります。これに対し相対位置エンコーディング(T5 の relative attention bias、Transformer-XL など)は2トークン間の相対距離のみを符号化し、長さ外挿性に優れます。近年の主要 LLM では Query・Key を回転行列で変換する RoPE(Rotary Position Embedding、Llama/Mistral/GPT-NeoX で採用)と、アテンションスコアに位置依存バイアスを加える ALiBi(MPT/BLOOM で採用)が二大勢力で、いずれも長コンテキスト拡張(YaRN・NTK-aware scaling など)との相性が良いとされています。

実装例 / 使い方

  • 01原論文では sin/cos 関数による正弦波エンコーディングを使用しました
  • 02BERT は学習可能な絶対位置埋め込みを採用しています
  • 03Llama・Mistral・GPT-NeoX は RoPE(回転位置埋め込み)を採用しています
IMPLEMENT

Positional Encoding(位置符号化)を、実際に活用する

用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。

営業時間 平日10-18時 / 通常24時間以内に返信