CasePrep

コンサル思考の教科書

← 一覧に戻る

データ・グラフの正しい読み方

読了目安:7

データを読む力がなぜ重要か

コンサルタントの仕事の多くは「データを読んで示唆を出すこと」です。グラフを渡されて「このデータから何が言えますか?」と問われる場面は面接でも実務でも必ず来ます。ただ数字を読むだけでなく、「だから何が言えるか(So What?)」まで話せることが求められます。

🔭

データは「地図」である

地図が読めない旅人は、目の前の景色しか見えません。データが読めないビジネスパーソンも同じです。データという地図を正しく読めば、「今どこにいて、どこに問題があり、どこに向かうべきか」が見えてきます。地図の読み方を間違えると、ゴールとは逆方向に走ってしまいます。

データリーディングで重要な能力は3つあります。①数字の意味を正確に読む(誤読しない)、②比較の文脈を理解する(何と比べているか)、③示唆を引き出す(数字の先にある「意味」を語る)。この3つを意識するだけで、データの読み方は劇的に変わります。

練習問題

「売上推移グラフ」を渡されました。数字を読むだけの人と、示唆を引き出せる人の違いは何ですか?

考え方のヒント

数字を読むだけの人は「売上が3年間で10%増加しています」と事実を述べます。示唆を引き出せる人は「売上は増加していますが、成長率が鈍化しており(1年目+5%、2年目+3%、3年目+2%)、このトレンドが続くと来年は横ばいになる可能性があります。競合との比較や市場成長率との比較が必要です」と分析します。データから「だから何が言えるか(So What?)」を語る習慣が分析力の核心です。

よく出るグラフの種類と読み方

コンサルケースで登場するグラフは主に4種類です。それぞれ「何を示すのに向いているか」と「読むときの注意点」を押さえましょう。

グラフの種類得意なこと読むときの注意点面接での活用例
棒グラフ(Bar Chart)項目間の大きさの比較Y軸がゼロから始まっているか確認。途中で切れていると差が誇張される商品別売上比較・地域別シェア
折れ線グラフ(Line Chart)時系列の変化・トレンド期間の選び方で印象が変わる。直近のノイズか長期トレンドかを区別する売上推移・市場成長率
円グラフ(Pie Chart)構成比(全体の中の割合)4つ以上の区分では読みにくい。「その他」が大きい場合は要注意市場シェア・コスト構成
散布図(Scatter Plot)2変数の相関・分布のパターン相関と因果を混同しない。外れ値が全体の印象を歪める可能性あり価格vs顧客満足度・規模vs利益率
📊

Y軸の罠に気をつけよう

棒グラフのY軸が100から始まると、実際には数%の差しかないのに「大きな差」に見えます。面接でグラフを渡されたら、必ず軸のスケールを確認しましょう。「Y軸はゼロから始まっていますか?」と聞くだけで、分析力の高さが伝わります。

練習問題

「折れ線グラフ」と「棒グラフ」ではどちらが売上のトレンド分析に向いていますか?また「市場シェア」を表示するには何グラフが最適ですか?

考え方のヒント

売上のトレンド(時系列変化)には折れ線グラフが向いています。時間の流れに沿った増減の傾向とターニングポイントが視覚的に読みやすいためです。市場シェア(全体に占める各社の割合)は円グラフが最適です。ただし4社以上のシェアを円グラフで表すと視認性が下がるため、その場合は積み上げ棒グラフも有効です。グラフの種類が「何を示したいか」と一致しているかを常に確認することが、誤読を防ぐ第一歩です。

「変化率」vs「絶対値」の罠

データを見るとき、「変化率(%)」と「絶対値(金額・件数など)」のどちらに注目するかで、まったく違う結論になることがあります。この2つを混同するのは初心者が最も多く犯す誤りです。

⚠️

具体例:「成長率200%」の罠

新しいアプリが「先月比200%成長!」と報道されました。素晴らしいニュースに見えますが……

  • 先月のユーザー数:100人 → 今月:300人(+200人)
  • 競合アプリのユーザー数:500万人

「200%成長」は正しいですが、絶対値では依然として圧倒的な差があります。変化率だけで判断すると大きな誤りを犯します。

変化率(%)が重要な場面

  • 成長スピードを比較するとき
  • 規模が異なる市場を比べるとき
  • 改善の勢いを評価するとき
例:「A市場は+5%成長、B市場は+15%成長。B市場の方が成長が速い」

絶対値が重要な場面

  • ビジネスインパクトの大きさを見るとき
  • リソース配分を決めるとき
  • 市場の「大きさ」を評価するとき
例:「A市場は+5%だが1,000億円市場、B市場は+15%でも10億円市場」

練習問題

「当社のECサイトの訪問者数が前月比50%増加しました!」と報告されました。これを正確に評価するために確認すべきことは何ですか?

考え方のヒント

変化率だけでなく絶対値を確認する必要があります。「先月が200人で今月300人(+100人)の50%増」なのか、「先月が10万人で今月15万人(+5万人)の50%増」なのかでビジネスインパクトは全く異なります。また「なぜ増えたのか」(広告施策・SEO改善・偶発的なバズか)と「購買転換率は改善したか」(訪問者が増えても購買につながらなければ意味がない)も確認します。変化率の高さに飛びつかず、絶対値と原因を同時に確認する習慣が重要です。

相関と因果の違い

データ分析で最も危険な誤りの1つが「相関を因果と勘違いすること」です。2つのデータが同時に動いていても、それは「一緒に動いている」というだけで「一方が原因で他方が結果」とは限りません。

🍦

アイスクリームと溺死者数の話

データを分析したところ、「アイスクリームの販売数が増えると、溺死者数も増える」という強い正の相関が見つかりました。

→ 「アイスを食べると溺れやすくなる」は正しいか?

もちろん違います。正しい答えは「夏になると気温が上がり、アイスも売れるし、海や川で泳ぐ人も増えて溺死者も増える」です。気温(第3の変数)が両方を動かしているのです。これを疑似相関(Spurious Correlation)と言います。

相関(Correlation)≠ 因果(Causation)

面接でデータを見たとき「AとBは相関している」と言うのは初歩、「AがBの原因と考えられる理由は〇〇です。ただし〇〇という第3の要因の可能性も検討が必要です」と言えるのが上級です。

🔬

因果関係を確認するための問い

  • AとBの間に「論理的なメカニズム」があるか?(なぜAがBを引き起こすのか)
  • AがBより「時間的に先」に起きているか?(原因は結果より先に来る)
  • AとBを同時に動かしている第3の変数(交絡因子)はないか?
  • Aを変えたとき(実験)、Bも変わるか?

練習問題

「広告費を増やした月は売上が増えた」というデータを見せられました。「広告が効いている」と結論できますか?

考え方のヒント

相関はありますが、因果関係は断定できません。広告費を増やした月が「年末商戦や夏のボーナス月と重なっていた」可能性があります(第3の変数:季節性)。因果を確認するには「広告費を増やしていない同時期の類似商圏」と比較する(対照実験)か、「広告接触者と非接触者の購買率を比較する(A/Bテスト)」ことが必要です。「相関がある」と「原因だ」は別物という認識が、データ分析における最重要スキルの一つです。

ベースが違うと比較できない

「A社のシェアは30%、B社のシェアは25%。A社が優位だ」——本当でしょうか?シェアのベース(何の市場か、どこの地域か)が違えば、この比較は無意味です。

📏

シェア vs 売上金額の例

A社:国内市場シェア30%(市場規模500億円 → 売上150億円)

B社:アジア市場シェア25%(市場規模1兆円 → 売上2,500億円)

シェア率だけ見るとA社が優位に見えますが、売上金額ではB社がA社の16倍以上。どちらが「強い」かは目的によって変わります。面接では「何を比較しているか」を常に意識しましょう。

比較の落とし穴具体例正しい対処
ベース(分母)が違うシェアの母数(市場定義)が異なる比較の定義を統一してから比べる
時点が違う決算期が異なる企業の売上比較同じ期間のデータを使う
地域・セグメントが違う全国平均 vs 都市部のみのデータ比較単位を揃えてから分析
通貨・物価が違う為替変動を考慮しない国際比較定数値(実質値)または為替調整後で比較

練習問題

「A社の市場シェアが30%でB社が25%だからA社が優位だ」という分析を見せられました。この比較に問題はありますか?

考え方のヒント

市場定義(ベース)が同じかどうかを確認する必要があります。A社のシェア30%が「国内市場500億円のシェア」なら売上150億円ですが、B社のシェア25%が「アジア全体市場1兆円のシェア」なら売上2,500億円です。シェア率だけで比較すると実態を見誤ります。また「シェア」の定義も「金額ベース」か「数量ベース」かで大きく変わります。比較の際は「何の中のシェアか、何でのシェアか」というベースの定義を統一することが分析の大前提です。

外れ値と平均値の罠

「平均値」は最もよく使われる統計指標ですが、最も誤解を生む指標でもあります。外れ値(極端に大きい・小さい値)があると、平均は実態を大きく歪めます。

平均値(Mean)= 合計値 ÷ データ数
💰

年収の平均の罠

10人のグループの年収(万円):300, 320, 350, 280, 310, 290, 330, 300, 320, 10,000

  • 平均年収:1,280万円(1人の大富豪のせいで跳ね上がる)
  • 中央値(Median):310万円(真ん中の値。実態に近い)
  • 最頻値(Mode):300万円(最も多い値)

「平均年収1,280万円のグループ」と言われても、9人は300万円台。平均だけ見ると実態を誤解します。

平均値を使うべき場面

  • データが正規分布に近いとき
  • 外れ値がほとんどないとき
  • 全体の合計を推計したいとき

中央値・最頻値を使うべき場面

  • 収入・資産など偏りがある分布
  • 外れ値が存在するとき
  • 「典型的な値」を知りたいとき

練習問題

あるECサイトの「平均注文金額が5,000円」というデータを見て、施策を考えようとしています。この数字だけで施策を決定するのはなぜ危険ですか?

考え方のヒント

平均値は外れ値(高額注文)の影響を受けるため、実態を反映していない可能性があります。例えば1万円以上の注文が10%あり残り90%が3,000円以下の場合、「平均5,000円」は多くの顧客の実態(3,000円以下)とかけ離れています。施策を考える際は中央値や注文金額の分布(ヒストグラム)を確認し、「最も多くの顧客がどの価格帯で購入しているか」を把握することが重要です。平均だけで施策を立てると、ターゲットがずれた投資になります。

グラフから示唆を引き出す手順

面接でグラフを渡されたとき、「うーん…」と無言になるのが最悪のパターンです。以下の手順で体系的に読めば、必ず何か言えます。

1

Step 1:グラフの種類と軸を確認する

「何のグラフか(棒・折れ線・円)」「縦軸・横軸は何を示しているか」「単位は何か(円・%・件数)」「Y軸はゼロから始まっているか」を確認します。

2

Step 2:全体のパターンをつかむ

「全体として増えているか減っているか横ばいか」「急激な変化(折れ点)はどこか」「特定のセグメントだけ動きが違うか」を観察します。

3

Step 3:比較軸を見つける

「前年と比べてどうか」「競合と比べてどうか」「業界平均と比べてどうか」「予算(計画)と比べてどうか」を考えます。

4

Step 4:「なぜそうなっているか」を仮説立てる

データの変化の原因を仮説として列挙します。「〇〇が上昇しているのは、△△という要因が考えられます。確認のために□□のデータも見たいです」

5

Step 5:So What(だから何?)を語る

データから導かれる「ビジネス上の示唆」を述べます。「このトレンドが続くと〇〇という問題が起きる」「これはXXという機会を示している」

練習問題

「スーパーの売上推移グラフ(折れ線グラフ)」を渡されました。5ステップで読んでみましょう。

考え方のヒント

Step1:グラフの種類(折れ線)・縦軸(売上金額・億円)・横軸(年度)・Y軸がゼロから始まっているかを確認します。Step2:全体として増加・横ばい・減少どのパターンかを観察し、急激な変化点を探します。Step3:前年比で比較し、コロナ前後などの外部環境との対比を行います。Step4:「なぜ2021年に急増したか」→コロナによる内食需要増加と仮説を立てます。Step5:「このトレンドが続くと2024年以降は売上が縮小する可能性があり、EC対応が急務だ」と示唆を語ります。

面接でデータを渡されたときの読み方

ケース面接でグラフや数表を渡されたとき、最初の30秒の沈黙は許容されます。しかしそれ以上の無言は禁物。以下のアプローチで「考えながら話す」習慣をつけましょう。

🗣️

声に出して読むテンプレート

「まず全体を確認させてください。このグラフは〇〇を示していて、縦軸が〇〇、横軸が〇〇ですね。全体的に見ると〇〇というトレンドが読み取れます。特に気になるのは〇〇の部分で、△△という変化が見えます。この原因として仮説を2つ立てると……」

場面やるべきことやってはいけないこと
グラフを渡された直後グラフの種類・軸・単位を声に出して確認即座に「〇〇だと思います」と言う(誤読リスク)
パターンを読むとき「全体として〇〇、特に〇〇が目立つ」と構造的に述べる目についた数字を羅列するだけ
示唆を語るとき「これはつまり〇〇を意味する可能性があります」と仮説を語る「よく分かりません」と止まる
追加データが欲しいとき「○○のデータがあれば確認したい点があります」と積極的に聞く「データが足りないので判断できません」と言い訳
🎯

面接官が本当に見ていること

データを渡す問題の目的は「正解を出せるか」ではなく「思考プロセスが構造的か」「誤読しないか」「示唆を引き出せるか」を確認することです。完璧な答えより、考える過程を丁寧に見せることが評価されます。

練習問題

面接でデータを渡されたとき、最初の30秒で何をすべきですか?また絶対にやってはいけないことは何ですか?

考え方のヒント

最初の30秒ですべきことは「グラフの種類・軸・単位・スケール」を声に出して確認することです。「このグラフは〇〇年から〇〇年の売上推移で、縦軸が億円、横軸が年度ですね」と確認することで、誤読リスクを下げ、面接官に「丁寧に読んでいる」姿勢を示せます。絶対にやってはいけないのは「即座に結論を言うこと」(誤読リスク大)と「データを全部読んでから考える」という完璧主義的なアプローチ(時間切れになる)です。構造的に読むテンプレートを使いながら考えながら話す姿勢が評価されます。

この知識を使って練習する →