5 月 5 日、深夜 1 時。X のバイラル投稿リサーチを始めて 6 時間目に、私たちは仮説を捨てました。事前に「保存率を上げるには自己認識トリガー 5 要素中 3 つ以上を含める必要がある」と立てた型が、実データの Top50 で 0 件しかヒットしない ことが分かったからです。
代わりに浮かび上がったのは、フォロワー 1,000 人台のアカウントが 5,000 いいねを超え、平均 fav/フォロワー比 232 倍 という異次元の数字を出している事実と、その投稿に共通する 5 つの黄金型でした。本記事では、抽出条件・実データ・型・自分たちの仮説が外れた検証までを並べます。
結論 — 5 つの黄金型
最初に結論だけ並べます。フォロワー 1,000〜3,000 のアカウントから取得した実バズ投稿 14 本を、スコア (fav + RT×3 + 保存×4) で並べたものです。
| 型 | 代表事例 | エンゲ |
|---|---|---|
| 反復セリフ型 | @mchannokiroku 母「泊まれば?」×4 | fav 208,720 / フォロワー 648 |
| 物語+セリフ落ち型 | @yuta_tsukaoka 30 歳でスイカ割り | fav 111,293 / フォロワー 608 |
| 知識リスト型 | @dekai3 鶏肉:怪我 / 豚肉:疲れ / 牛肉:不調 | 保存率 21.6% |
| 「誰も教えてくれない」型 | @HHAGI8 ネオジムマグネット爆散 | fav 54,806 / フォロワー 1,437 |
| 短文+具体的固有名詞 | @takay_ Microsoft 「大麻」 | fav 118,545 / 41 字 |
通常のインフルエンサーが叩き出すエンゲは fav/フォロワー比で 1〜10 倍ですが、上記の無名アカウントは 平均 232 倍。「投稿の中身そのものが釣り上げた」と判断できる純度の高さです。
抽出条件 — なぜ「フォロワー 1,000 以下」なのか
X のバズ研究で大半のメディアが取り上げるのは、フォロワー 10 万以上のアカウントの大バズです。それを真似ても、こちらにフォロワーが居ない限り再現できません。
私たちが知りたかったのは「フォロワー数の影響を排除した、内容そのものの力」でした。そこで以下の条件で抽出しました。
| 条件 | 値 |
|---|---|
| フォロワー数 | 1,000 以下 (純粋条件) / 3,000 以下 (拡張条件) |
| いいね | 5,000 以上 |
| 言語 | 日本語 (lang:ja) |
| 投稿種別 | RT/引用RT 除外 (-filter:retweets) — オリジナル投稿のみ |
| 検索ピリオド | 直近 (X の min_faves 検索仕様で取得) |
| 取得シード | 20 クエリ (純粋系・30 代女性・仕事悩み・心と体・恋愛・気づき) |
母数の苦労
- 全 unique tweet: 764 本 (20 クエリで取得)
- フォロワー 1,000 以下 × いいね 5,000 以上 × 日本語: 3 本のみ ⚠ 厳しすぎ
- フォロワー 3,000 以下 × いいね 5,000 以上 × 日本語: 14 本 ← 本記事のメイン分析
- フォロワー 2,000 以下 × いいね 10,000 以上 × 日本語: 11 本
最初の純粋条件 3 本は数が少なすぎたので、フォロワー上限を 3,000 に緩めて分析対象を広げました。次回はクエリを min_faves:3000 で取り直して母数を増やす予定です。
💡 KEY TAKEAWAYS
「再現性のある型」を抽出するには、結果のサンプルから「再現に関係しない変数 (フォロワー数)」を排除した条件で取りに行く必要があります。これは普通の SNS 分析ツールではできません。X 検索演算子min_faves:5000 lang:ja -filter:retweetsを直接叩けるスクレイピング環境が必須でした。
実データ — 統計サマリ (パターン B: フォロワー≤3,000 × fav≥5,000 × 14 本)
| 指標 | 平均 | 中央値 | 最大 |
|---|---|---|---|
| いいね | 108,901 | 97,625 | 208,720 |
| RT | 10,778 | 9,340 | 17,750 |
| 保存 | 6,560 | 5,271 | 18,066 |
| フォロワー | 1,493 | 1,451 | 2,704 |
| 文字数 | 99 | 106 | 149 |
| fav/フォロワー比 | 73 倍 | — | — |
文字数の 36% が 100〜139 字 に集中。短文 (50〜99 字) も 29% あり、「短文でも内容次第でバズる」ことが分かります。

5 つの黄金型 — 構造解析
黄金型 1: 反復セリフ型 — fav 208,720 のチャンピオン
@mchannokiroku (フォロワー 648) の投稿:
母「今夜すき焼きだから泊まれば?」
母「春巻揚げるから今日も泊まれば?」
母「煮込みハンバーグ作るから泊まれば?」
母「お寿司にするから泊まれば?」
1泊の予定だったけど、私の引き止め方をよく理解してる母にまんまとやられて実家4泊したわ。
構造: 同じ型のセリフを 4 回繰り返し、最後にオチで反転。120 字。fav/フォロワー比 322 倍。
応用テンプレ:
``text
A「○○」
A「○○○○」
A「○○○○○○」
A「○○○○」
(オチ・ツッコミ・解説)
`
黄金型 2: 物語+セリフ落ち型
@yuta_tsukaoka (フォロワー 608) の投稿:
私も同じ疑問があり、しかし大人同士が昼間に時間を作って会うのは難しかったので、夜の公園でスイカ割りをしたことがある。「割れた〜?」と目隠しを外したら友達は遠くにいて、目の前に警官が2人いた。私は30歳だった。
構造: 個人体験 → セリフ → 想定外オチ → 「私は 30 歳だった」で年齢オチ。104 字。
黄金型 3: 知識リスト型 — 保存率の絶対王者
@dekai3 (フォロワー 1,572) の投稿:
最近分かってきたことは
鶏肉:怪我を癒す肉
豚肉:疲れを癒す肉
牛肉:不調を癒す肉
って感じなので、筋トレするなら鶏肉だし、普段からバフをかけたいなら牛肉になる
fav 83,957 / 保存 18,066 / 80 字 / 保存率 21.6%。リスト型は保存される強さが圧倒的です。
応用テンプレ:
`text
最近分かってきたのは
A:B
C:D
E:F
って感じなので、(実用的指針)
`
黄金型 4: 「誰も教えてくれない」型
@HHAGI8 の投稿:
学校の先生も、会社の上司も、誰も教えちゃくれなかった…
10枚重ねのセリアのネオジムマグネットに11枚目を吸着させると火花を散らして爆散するなんて...
構造: 教育・上司・親の不在を提示 → 意外な事実で落とす。100 字。
黄金型 5: 短文+具体的固有名詞
@takay_ (フォロワー 633) の投稿:
Microsoftのこの機能やめてほしい
うちの会社とか略されて「大麻」とかがいる
41 字でこの伸び。具体的なツール名 (Microsoft) と違和感の組み合わせで 11 万 fav。

私たちの仮説が実データで 0 件だった話
このリサーチで一番痛かった発見を共有します。
仮説: 自己認識トリガー 5 要素中 3 つ以上で保存される
事前に Web 記事を 4 本読んで、「あ、これ私のことかも?」と手を止めさせる投稿には共通する 5 要素があると仮説しました。
- 2 人称 / 一般化 (「あなた」「私だけ?」)
- 時刻の具体性 (「夜中の 2 時」)
- 身体感覚 (「気づいたら泣いてた」)
- 行動の細部 (「LINE を開きっぱなしで眠った」)
- 言語化できなかったことの言語化
3 つ以上含む投稿は保存率が高い と仮説しました。
検証結果: Top50 で 3 つ以上含む投稿は 0 件
実データを取って解析したら、Top50 のうち 3 要素以上含む投稿は 0 件。1 要素含むのが 24%、2 要素含むのが 4%、残りの 72% は要素 0 でした。
仮説、外れです。
代わりに見えた共通項はもっとシンプルなものでした。
| 実データ抽出パターン | Top100 出現率 |
|---|---|
| 命名型 (「○○」で現象に名前を付ける) | 23% |
| 30 代年齢型 (「私が 30 歳過ぎて」など) | 12% |
| 気づき型 | 3% |
| 個人体験型 | 2% |
「30 代と書く」「現象に名前を付ける」── この 2 つだけで Top100 の 35% が説明できます。私の仮説より遥かにシンプルでした。
💡 KEY TAKEAWAYS
仮説を立てるのは無駄ではありません。ただし 実データで検証する前に実装に進むのは禁物 です。私たちの仮説は綺麗でしたが、データと照合すると 0 件でした。リサーチで一番痛い瞬間は、自分の仮説が外れた瞬間。そして一番得るものが多いのも同じ瞬間です。
渋沢慧での応用 — 5 型を Card 11〜15 に反映
このリサーチを実運用する側の事例として、X アカウント @kei_soulmate のキャンペーンに 5 型を反映しました。
| 型 | 反映 Card | 投稿例 |
|---|---|---|
| 反復セリフ型 | Card C11 | クライアント「数秘 1 で…」を 4 回繰り返す形式 |
| 物語+セリフ落ち型 | Card C12 | 「ある日、30 代の女性が来た」鑑定物語型 |
| 知識リスト型 | Card C13 | 数秘 1〜9 の指針を 1 行ずつ羅列 (保存特化) |
| 「誰も教えてくれない」型 | Card C14 | 「親も学校も会社も誰も教えてくれなかった」 |
| 短文+具体型 | Card C15 | 47 字の短文勝負 |
12 キャンペーン全体の運用設計は別途まとめました (関連記事 — AI 叱責駆動開発 を参照)。
改善したい点
書いている時点で「もう少し丁寧にやれた」と感じている部分です。
1. 母数を 30 本に広げる
現状フォロワー≤1,000 の純粋条件は 3 本のみ。min_faves:3000 で再収集すれば 30 本程度になる見込みです。次の収集サイクルで実施予定。
2. 直撃のシード追加
現状の検索シードは「30 代仕事迷い」など一般的なものが中心です。「自分のことが嫌い」「人生 リセット」など、もっとペルソナ寄りのシードを追加するとヒット母数が増えるはずです。
3. リプ欄取得のリトライ
twikit のスキーマ変更で tweet.replies 経由のリプ取得が失敗しました。代替で本文から頻出語を抽出しましたが、本来はリプ欄こそ「ペルソナの一次言語」が眠る場所です。次回は search_tweet("conversation_id:NNN", "Latest")` 経由で取り直す計画です。
次のアクション
EXBANK では、こうした データで SNS 運用の解像度を上げる支援 も行っています。「ウチも勘ではなく実投稿のデータで設計したい」と感じた方は、まず 細マッチョ企業診断 で 3 分セルフチェックしてみてください。SNS 運用の業務体力 (検証サイクルが回るか、データを取りに行く前提があるか) が 5 軸で可視化されます。
具体的なバズ抽出の仕組みを社内に組み込みたい場合は、お問い合わせフォームでご連絡ください。スクレイピング環境構築から型カード化まで、伴走支援が可能です。
