5 月 5 日、深夜 1 時。X のバイラル投稿リサーチを始めて 6 時間目に、私たちは仮説を捨てました。事前に「保存率を上げるには自己認識トリガー 5 要素中 3 つ以上を含める必要がある」と立てた型が、実データの Top50 で 0 件しかヒットしない ことが分かったからです。

代わりに浮かび上がったのは、フォロワー 1,000 人台のアカウントが 5,000 いいねを超え、平均 fav/フォロワー比 232 倍 という異次元の数字を出している事実と、その投稿に共通する 5 つの黄金型でした。本記事では、抽出条件・実データ・型・自分たちの仮説が外れた検証までを並べます。

結論 — 5 つの黄金型

最初に結論だけ並べます。フォロワー 1,000〜3,000 のアカウントから取得した実バズ投稿 14 本を、スコア (fav + RT×3 + 保存×4) で並べたものです。

代表事例エンゲ
反復セリフ型@mchannokiroku 母「泊まれば?」×4fav 208,720 / フォロワー 648
物語+セリフ落ち型@yuta_tsukaoka 30 歳でスイカ割りfav 111,293 / フォロワー 608
知識リスト型@dekai3 鶏肉:怪我 / 豚肉:疲れ / 牛肉:不調保存率 21.6%
「誰も教えてくれない」型@HHAGI8 ネオジムマグネット爆散fav 54,806 / フォロワー 1,437
短文+具体的固有名詞@takay_ Microsoft 「大麻」fav 118,545 / 41 字

通常のインフルエンサーが叩き出すエンゲは fav/フォロワー比で 1〜10 倍ですが、上記の無名アカウントは 平均 232 倍。「投稿の中身そのものが釣り上げた」と判断できる純度の高さです。

抽出条件 — なぜ「フォロワー 1,000 以下」なのか

X のバズ研究で大半のメディアが取り上げるのは、フォロワー 10 万以上のアカウントの大バズです。それを真似ても、こちらにフォロワーが居ない限り再現できません。

私たちが知りたかったのは「フォロワー数の影響を排除した、内容そのものの力」でした。そこで以下の条件で抽出しました。

条件
フォロワー数1,000 以下 (純粋条件) / 3,000 以下 (拡張条件)
いいね5,000 以上
言語日本語 (lang:ja)
投稿種別RT/引用RT 除外 (-filter:retweets) — オリジナル投稿のみ
検索ピリオド直近 (X の min_faves 検索仕様で取得)
取得シード20 クエリ (純粋系・30 代女性・仕事悩み・心と体・恋愛・気づき)

母数の苦労

  • 全 unique tweet: 764 本 (20 クエリで取得)
  • フォロワー 1,000 以下 × いいね 5,000 以上 × 日本語: 3 本のみ ⚠ 厳しすぎ
  • フォロワー 3,000 以下 × いいね 5,000 以上 × 日本語: 14 本 ← 本記事のメイン分析
  • フォロワー 2,000 以下 × いいね 10,000 以上 × 日本語: 11 本

最初の純粋条件 3 本は数が少なすぎたので、フォロワー上限を 3,000 に緩めて分析対象を広げました。次回はクエリを min_faves:3000 で取り直して母数を増やす予定です。

💡 KEY TAKEAWAYS
「再現性のある型」を抽出するには、結果のサンプルから「再現に関係しない変数 (フォロワー数)」を排除した条件で取りに行く必要があります。これは普通の SNS 分析ツールではできません。X 検索演算子 min_faves:5000 lang:ja -filter:retweets を直接叩けるスクレイピング環境が必須でした。

社内 SNS 運用に「データで型を取りに行く」体力ありますか?
細マッチョ企業診断 / 3 分 8 問
診断する

実データ — 統計サマリ (パターン B: フォロワー≤3,000 × fav≥5,000 × 14 本)

指標平均中央値最大
いいね108,90197,625208,720
RT10,7789,34017,750
保存6,5605,27118,066
フォロワー1,4931,4512,704
文字数99106149
fav/フォロワー比73 倍

文字数の 36% が 100〜139 字 に集中。短文 (50〜99 字) も 29% あり、「短文でも内容次第でバズる」ことが分かります。

文字数分布と fav/フォロワー比 232 倍の異次元
文字数分布と fav/フォロワー比 232 倍の異次元

5 つの黄金型 — 構造解析

黄金型 1: 反復セリフ型 — fav 208,720 のチャンピオン

@mchannokiroku (フォロワー 648) の投稿:

母「今夜すき焼きだから泊まれば?」
母「春巻揚げるから今日も泊まれば?」
母「煮込みハンバーグ作るから泊まれば?」
母「お寿司にするから泊まれば?」

1泊の予定だったけど、私の引き止め方をよく理解してる母にまんまとやられて実家4泊したわ。

構造: 同じ型のセリフを 4 回繰り返し、最後にオチで反転。120 字。fav/フォロワー比 322 倍

応用テンプレ:
``text
A「○○」
A「○○○○」
A「○○○○○○」
A「○○○○」

(オチ・ツッコミ・解説)
`

黄金型 2: 物語+セリフ落ち型

@yuta_tsukaoka (フォロワー 608) の投稿:

私も同じ疑問があり、しかし大人同士が昼間に時間を作って会うのは難しかったので、夜の公園でスイカ割りをしたことがある。「割れた〜?」と目隠しを外したら友達は遠くにいて、目の前に警官が2人いた。私は30歳だった。

構造: 個人体験 → セリフ → 想定外オチ → 「私は 30 歳だった」で年齢オチ。104 字。

黄金型 3: 知識リスト型 — 保存率の絶対王者

@dekai3 (フォロワー 1,572) の投稿:

最近分かってきたことは
鶏肉:怪我を癒す肉
豚肉:疲れを癒す肉
牛肉:不調を癒す肉
って感じなので、筋トレするなら鶏肉だし、普段からバフをかけたいなら牛肉になる

fav 83,957 / 保存 18,066 / 80 字 / 保存率 21.6%。リスト型は保存される強さが圧倒的です。

応用テンプレ:
`text
最近分かってきたのは

A:B
C:D
E:F

って感じなので、(実用的指針)
`

黄金型 4: 「誰も教えてくれない」型

@HHAGI8 の投稿:

学校の先生も、会社の上司も、誰も教えちゃくれなかった…
10枚重ねのセリアのネオジムマグネットに11枚目を吸着させると火花を散らして爆散するなんて...

構造: 教育・上司・親の不在を提示 → 意外な事実で落とす。100 字。

黄金型 5: 短文+具体的固有名詞

@takay_ (フォロワー 633) の投稿:

Microsoftのこの機能やめてほしい
うちの会社とか略されて「大麻」とかがいる

41 字でこの伸び。具体的なツール名 (Microsoft) と違和感の組み合わせで 11 万 fav。

5 つの黄金型と fav/フォロワー比
5 つの黄金型と fav/フォロワー比

私たちの仮説が実データで 0 件だった話

このリサーチで一番痛かった発見を共有します。

仮説: 自己認識トリガー 5 要素中 3 つ以上で保存される

事前に Web 記事を 4 本読んで、「あ、これ私のことかも?」と手を止めさせる投稿には共通する 5 要素があると仮説しました。

  1. 2 人称 / 一般化 (「あなた」「私だけ?」)
  2. 時刻の具体性 (「夜中の 2 時」)
  3. 身体感覚 (「気づいたら泣いてた」)
  4. 行動の細部 (「LINE を開きっぱなしで眠った」)
  5. 言語化できなかったことの言語化

3 つ以上含む投稿は保存率が高い と仮説しました。

検証結果: Top50 で 3 つ以上含む投稿は 0 件

実データを取って解析したら、Top50 のうち 3 要素以上含む投稿は 0 件。1 要素含むのが 24%、2 要素含むのが 4%、残りの 72% は要素 0 でした。

仮説、外れです。

代わりに見えた共通項はもっとシンプルなものでした。

実データ抽出パターンTop100 出現率
命名型 (「○○」で現象に名前を付ける)23%
30 代年齢型 (「私が 30 歳過ぎて」など)12%
気づき型3%
個人体験型2%

「30 代と書く」「現象に名前を付ける」── この 2 つだけで Top100 の 35% が説明できます。私の仮説より遥かにシンプルでした。

💡 KEY TAKEAWAYS
仮説を立てるのは無駄ではありません。ただし 実データで検証する前に実装に進むのは禁物 です。私たちの仮説は綺麗でしたが、データと照合すると 0 件でした。リサーチで一番痛い瞬間は、自分の仮説が外れた瞬間。そして一番得るものが多いのも同じ瞬間です。

渋沢慧での応用 — 5 型を Card 11〜15 に反映

このリサーチを実運用する側の事例として、X アカウント @kei_soulmate のキャンペーンに 5 型を反映しました。

反映 Card投稿例
反復セリフ型Card C11クライアント「数秘 1 で…」を 4 回繰り返す形式
物語+セリフ落ち型Card C12「ある日、30 代の女性が来た」鑑定物語型
知識リスト型Card C13数秘 1〜9 の指針を 1 行ずつ羅列 (保存特化)
「誰も教えてくれない」型Card C14「親も学校も会社も誰も教えてくれなかった」
短文+具体型Card C1547 字の短文勝負

12 キャンペーン全体の運用設計は別途まとめました (関連記事 — AI 叱責駆動開発 を参照)。

改善したい点

書いている時点で「もう少し丁寧にやれた」と感じている部分です。

1. 母数を 30 本に広げる

現状フォロワー≤1,000 の純粋条件は 3 本のみ。min_faves:3000 で再収集すれば 30 本程度になる見込みです。次の収集サイクルで実施予定。

2. 直撃のシード追加

現状の検索シードは「30 代仕事迷い」など一般的なものが中心です。「自分のことが嫌い」「人生 リセット」など、もっとペルソナ寄りのシードを追加するとヒット母数が増えるはずです。

3. リプ欄取得のリトライ

twikit のスキーマ変更で tweet.replies 経由のリプ取得が失敗しました。代替で本文から頻出語を抽出しましたが、本来はリプ欄こそ「ペルソナの一次言語」が眠る場所です。次回は search_tweet("conversation_id:NNN", "Latest")` 経由で取り直す計画です。

次のアクション

EXBANK では、こうした データで SNS 運用の解像度を上げる支援 も行っています。「ウチも勘ではなく実投稿のデータで設計したい」と感じた方は、まず 細マッチョ企業診断 で 3 分セルフチェックしてみてください。SNS 運用の業務体力 (検証サイクルが回るか、データを取りに行く前提があるか) が 5 軸で可視化されます。

具体的なバズ抽出の仕組みを社内に組み込みたい場合は、お問い合わせフォームでご連絡ください。スクレイピング環境構築から型カード化まで、伴走支援が可能です。