この記事は、相関関係と因果関係の違いについて書いたものだ。
品質管理の仕事では、問題の原因を調べたり、データを分析したりすることがある。相関関係と因果関係の違いを知っておくことが、その役に立つはずだと考えている。
・相関関係とは、一方が増えるともう一方も増える、一方が減るともう一方も減るという関係
・因果関係は、その名前の通り、ある2つの出来事が原因と結果で直接結びついている関係
である。
相関係数とは
相関係数とは、一方が増えるともう一方も増える、一方が減るともう一方も減るという関係だ。
2つの関係した変数があったときに、
「一方の数値が大きくなると、もう一方の数値も大きくなる」
「一方の数値が小さくなると、もう一方の数値も小さくなる」
というように連動して動く関係を正の相関
「一方の数値が大きくなると、もう一方の数値は小さくなる」
「一方の数値が小さくなると、もう一方の数値は大きくなる」
というように逆に動く関係を負の相関
という。
2つの変数とは、たとえば、
・製品の「高さ」と「重量」
・「ある添加物の配合量」と「食品の大きさ」
といったものだ。
生地の中に膨張剤を入れて焼き上げる食品があったら、膨張剤を増やすほど完成した食品のふくらみも大きくなるだろう。このときの「膨張剤の添加量」と「食品の大きさ」の関係性は、正の相関になるはずだ。
因果関係は、原因と結果でつながっている
因果関係とは、その名前の通り、ある2つの出来事が原因と結果で直接結びついている関係である。
・毎日食事の量を1/2に減らした
・体重が減った
この2つには因果関係がある。食事の量を減らし、摂取カロリーが減り、その分体重も減った。原因があり、そのあとに結果が起こっている。「食事の量を減らした→体重が減った」という「原因→結果」の流れ。
原因が先に起きたあとに結果が起こる「原因→結果」の流れが普通なのだが、原因が後から表に見えてくることもある。
相関係数は数字で示しただけのもの
相関関係は、どのくらい関係があるのか数値を用いて示すことができる。その数値を相関係数といい、必ず「-1~0~+1」の値をとる。
1に近いほど強い正の相関があり、-1に近づくほど強い負の相関がある。
2つの変数に関係性があることは相関関係も因果関係も同じではあるが、相関関係があれば因果関係がある、というわけではない。
相関関係イコール因果関係とはならないのである。
因果関係は原因と結果の関係があるのに対して、相関関係は原因と結果で結ばれていなくても成り立つ。
相関係数は純粋に数学的な解釈であり、2つの変数の関係性を数値で把握できるだけだ。2つの変数のひとつが原因で、もうひとつの結果が影響を受けているとは示してはいない。
一方の変数xが増えれば、もう一方のyも増えることを、あくまで数字で示しているだけである。相関関係が顕著に見られる場合でも、yが増加している理由は、x以外のまったく別の変数が原因となって増えているだけかもしれない。
※この別の変数を第3因子という。
相関関係と因果関係を一緒にしないこと
例えば、ある会社で、「TOEICの点数」と「仕事の成果」の関係を分析したところ、この2つに強い正の相関関係があり、高い相関係数の値が出てきたとする
一見、「英語ができる人ほど仕事もできる」ことを表すような数値だ。
しかし、この会社では、社内では英語は使用することのない会社だ。ここで、英語が上手くできることと、その会社での仕事が上手くやれる能力に、因果関係はあるのだろうか?
この会社では英語は使用されなず、直接的に英語の能力が仕事に役立つわけではないので、因果関係はない。
仮に、因果関係あるのだとしたら、英語を勉強してTOEICの得点を上げれば、それだけで仕事が上手くできるようになってしまう(英語をつかってメールするなどの業務があれば、そうなるけれども、英語をつかうことが無い会社である)。
相関関係の裏を読む
この強い正の相関係数は、こういう理由で出てきた。
英語を勉強するようなひとは、英語に限らず他のことも勉強するだろうから様々な知識がある。効率よくインプットもできるだろうし、また、テストもよく受けていれば、問題を的確に処理する力も備わってくるだろう。これらが、「TOEICの得点」と「仕事が上手くできること」の両方に好影響を与えているのだ。
相関係数から2つの出来事の関係性を捉えるときには、その数字だけを見るだけではなく、数字の裏に何があるのかを読まないといけない。
データ分析や統計学が扱うのは、2つの出来事がどのくらい関係しているのか数字を出すところまでだ。相関係数として、数値で表すところまでしかできない。
業界の知識や製品知識、観察力、思考力などを用いて、その数字でしかない相関係数に、意味や解釈を加え、結論を導き出していくのだ。
コメント