ビジネスリサーチラボ

open
読み込み中

コラム

相関係数の統計的有意性:相関係数だけでは不十分

コラム

エンゲージメントサーベイの結果を分析する際、相関分析は有効な手法になり得ます。「仕事の満足度」と「周囲からのサポート」の相関係数が0.7だと聞けば、「強い相関がある」と理解する人も多いのではないでしょうか。しかし実は、この数字だけを見て判断するのは、十分ではありません。

相関係数を正しく解釈するために、その「有意性」を確認する必要があります。有意性とは、観測された相関が統計的に意味のあるものかどうかということです。場合によっては、有意性の確認は見過ごされることがあります。

なぜ有意性の確認が重要なのでしょうか。相関係数だけを見ていては、本当に意味のある関係性を見逃したり、逆に意味のない関係性を過大評価したりする可能性があるからです。有意性を確認することで、より信頼できる分析が可能になり、効果的な人事施策の立案につながります。

本コラムでは、相関係数の有意性について、その背景から計算方法まで、エンゲージメントサーベイの例を用いながら、順を追って解説します。相関係数の「数字の裏側」を知ることで、皆さんのデータを見る視点はいっそう鋭いものになるでしょう。

相関係数とは

初めに、相関係数についておさらいしておきましょう[1]。相関係数は、2つの指標間の関係性の強さと方向を示します。-1から1の間の値をとり、1に近いほど強い正の相関、-1に近いほど強い負の相関、0に近いほど相関が弱いことを意味します。

相関係数は、2つの指標がどの程度一緒に変化するかを表現します。例えば、ある従業員の「仕事の満足度」が高ければ「周囲へのサポート」も高い場合、これらの指標間には正の相関があります。逆に、「仕事のストレス」が高いほど「仕事の満足度」が低い場合、これらの指標間には負の相関があります。

相関係数が1に近いほど、2つの指標は強い正の関係にあります。一方が増加すると、もう一方も同じように増加する傾向が強いことを指します。-1に近いほど、2つの指標は強い負の関係にあります。一方が増加すると、もう一方は減少する傾向が強いことを指します。0に近いほど、2つの指標の間には明確な関係性がないということです。

相関係数の有意性とは

相関係数を算出したら、次に考えるべきは「この相関係数は統計的に意味のあるものなのか」という問いです。これが「有意性」の問題です。

相関係数の有意性とは「母集団の相関係数がゼロである」という帰無仮説を棄却できるかどうかを判断することです。これは少し難しい言い方なので、もう少し詳しく説明します。

私たちが分析しているのは、母集団(例えば、全従業員)のデータではなく、その一部(標本)のデータです。標本から得られた相関係数は、母集団の相関を完全に反映しているわけではありません。これは、標本が母集団の完全な縮図ではないためです。標本には偏りや誤差が含まれる可能性があり、そのため標本から計算された相関係数は、母集団の相関係数とは異なり得ます。

標本の偏りや誤差によって、実際には関係のない2つの指標の間に、見かけ上の相関が生じる可能性もあります。例えば、「朝食で白米を食べる頻度」と「仕事の生産性」という、一見関係のない2つの指標の間に相関が見られたとします。これは、白米を食べることが生産性を上げているのではなく、朝食をしっかり取る習慣のある人が、たまたま白米を好んで食べており、かつ規則正しい生活習慣によって生産性も高くなっているという可能性もあります(架空の例であり、架空の解釈でもあります)。

そこで、「母集団の相関係数がゼロである」という仮説(帰無仮説)を立て、その仮説のもとで、観測されたデータがどの程度起こりにくいかを計算します。もし、観測されたデータが「相関がない」という仮説のもとでは非常に起こりにくいものであれば、その仮説を棄却し、「相関がある」と結論づけることができます。直接「相関がある」ことを証明するのではなく、「相関がない」という可能性を統計的に否定することで、間接的に「相関がある」という結論を導き出します。

t値を用いた有意性検定

相関係数の標本分布(多数回のサンプリングで得られる相関係数の分布)は、特定の条件下でt分布に従うことが知られています。実際の分析では、1回のサンプリングしか行わないのが普通ですが、理論上、同じ母集団から同じサイズの標本を何度も抽出して相関係数を計算すると、その分布がt分布に従うということです。

例えば、1000人の従業員がいる会社で、100人を無作為に選んでサーベイを行うことを考えてみましょう。(実際にはあり得ないのですが)この抽出と相関係数の計算を何千回も繰り返したとします。すると、得られた相関係数の分布は、特定の条件下でt分布に従うことが示されています。この性質を利用して、1回のサンプリングから得られた相関係数の有意性を評価することができます。

具体的には、母集団が二変量正規分布に従っている場合、標本の相関係数を特定の方法で変換したものがt分布に従います。二変量正規分布とは、2つの変数が同時に正規分布に従っている場合の分布です。正規分布は、多くのデータで観察される左右対称の釣鐘型の分布で、平均値を中心に対称的に広がる形をしています。二変量正規分布は、この正規分布を2つの次元に拡張したものです。

t分布は、サンプルサイズが小さい場合でも適用できる分布です。また、サンプルサイズが大きくなるにつれて正規分布に近づくという性質があり、様々な状況で安定した評価が可能になります。

相関係数のt値の計算式は、次の通り、表すことができます。

t=r√(n-2)/√(1-r²)

この式において、rは相関係数、nはサンプルサイズです。式の各部分が何を意味しているのかを掘り下げましょう。

初めに、(n-2)という部分ですが、これはサンプルサイズの影響を表しています。nはサンプルサイズで、これから2を引いているのは、相関係数の計算で2つの自由度(各指標の平均)を使用するためです。自由度とは、誤解を恐れず単純化すれば、データの中で自由に動ける値の数を指します。相関係数の計算では、2つの指標の平均値を固定して使用するため、それに応じて自由度が減少します。

この理屈を理解するうえで重要なのは、「データ分析は、母集団の特徴を推測するものである」ことです。実際に測定できた標本データから、全体を指す母集団の特徴を推測しており、そこでは母集団における平均やデータのばらつき(散布度)、指標間の相関関係など、種々の指標について何かしらの値が存在することを前提としています。

この前提があることで「母集団における平均やデータのばらつき、相関係数といった指標は、すでに定まった値がある(それを推測する分析をしている)」という発想に至ります。つまり、具体的な値は未知ながらも、母集団の平均などの指標はすでに定まった値が存在していることを前提としています。

そのうえで、例えば5人の従業員のデータがあるとしましょう。

各従業員の「仕事の満足度」と「周囲からのサポート」のスコアから相関係数を計算する際、まず各指標の平均値を計算します。5人のデータで母集団の平均に該当する値を推測する際、母集団における平均の値はすでに定まった値が存在している前提があるため、母集団の推測値に向けて4人のデータが集まった時点で、最後の5人目の値は決まってしまいます。

これは、「5人のデータの平均を3としたとき、4人のデータが3,4,4,1点だとしたら、最後のひとりの得点はいくつになるか」といった一次方程式の問題と同じ都合です。この問題状況だと、最後のひとりの得点は全体の平均に応じて値が定まり3点となります。このように「全体における平均がすでに定まっている場合、最後の1名のデータは自動的に決まってしまう」状態になり、自由に値が決められないのです。

このようにして、「母集団における各指標のデータは、平均など種々の指標の値が何らかの値に定まっている」ことで、自由度が定まります。相関分析の場合は2つの変数を用いるわけですから、それぞれで平均を用いる都合上、各変数で自由度が1減ることになるため、2変数を用いた相関係数全体の自由度はサンプルサイズから2を引いた数となるわけです。

話を相関係数の数式に戻して、サンプルサイズが大きくなるほど、(n-2)の値は大きくなります。これは、サンプルサイズが大きいほど、得られた相関係数が信頼できるということを反映しています。サンプルサイズが大きいほど標本誤差が小さくなり、データで示された相関係数が母集団の特性をより反映するようになるためです。

標本誤差とは、標本が母集団を完全に代表していないことによって生じる誤差のことです。例えば、1000人の従業員がいる会社で100人が組織サーベイに回答した場合、この100人の特性が1000人全体の特性と完全に一致することはないでしょう。このずれが標本誤差となります。サンプルサイズが大きくなるほど、この誤差は小さくなる傾向にあります。

次に、(1-r²)という部分は、相関係数の大きさの影響を表しています。rは相関係数で、その二乗を1から引いています。は決定係数とも呼ばれ、一方の指標の変動が他方の指標の変動をどの程度説明できるかを示します。例えば、r=0.5の場合、r²=0.25となり、これは一方の指標の変動の25%が他方の指標によって説明できることを意味します。

(1-r²)の部分は、相関係数の大きさに応じてt値を調整する役割を果たしています。相関係数が0に近い場合、1-r²1に近くなり、その平方根も1に近くなります。一方、相関係数の絶対値が1に近い場合、1-r²0に近くなり、その平方根も0に近くなります。例えば、相関係数が0.9の場合、√(1-0.9²)≈0.436となり、相関係数が0.1の場合の√(1-0.1²)≈0.995よりもかなり小さくなります。強い相関ほど、それが実際に意味のある相関関係、すなわち指標間の関係性を反映している可能性が高いことを表現しているのです。

これらを組み合わせたr√(n-2)/√(1-r²)という式全体で、相関係数の大きさとサンプルサイズの両方を考慮したt値が得られます。この式は、相関係数とサンプルサイズの両方の情報を、1つの指標(t値)に集約する役割を果たしているということです。

これまでの説明から明らかであるように、相関係数が大きいほど、またサンプルサイズが大きいほど、t値は大きくなります。例えば、相関係数が0.5でサンプルサイズが50の場合と、相関係数が0.5でサンプルサイズが500の場合を比較すると、後者の方がt値は大きくなります。これは、同じ強さの相関であっても、より大きなサンプルサイズで観測された場合の方が、標本データで示された相関がより信頼できることを反映しています。

t値が大きいほど、観測された相関係数が統計的に意味のあるものである可能性が高くなります。これは、大きなt値は、観測された相関が単なる標本誤差ではなく、母集団に存在する相関を反映している可能性が高いことを示唆しているからです。

p値の解釈

t値が計算できたら、次はこの値からp値を求めます。p値は、観測されたデータと同じくらい極端な(または、それ以上に極端な)データが、帰無仮説(母集団の相関が0である)が正しいという前提のもとで得られる確率を表します。

より具体的に説明しましょう。p値は「もし母集団に本当に相関がないとしたら、今回観測されたような(またはそれ以上に強い)相関が、ランダムなサンプリングによって得られる確率」を表しています。ここで「ランダムなサンプリング」とは、母集団から無作為に標本を抽出することを意味します。

p値は、その値が小さいほど、観測されたデータが「相関がない」という仮説と強く矛盾することを意味します。言い換えれば、p値が小さいと、観測されたデータは「相関がある」という仮説を支持することになります。

例えば、p値が0.01であれば、これは「相関がない」という仮説が正しいと仮定した場合に、観測されたような(またはそれ以上に極端な)データが得られる確率が1%であることを意味します。要するに、「相関がない」という仮説のもとでは、このようなデータが得られる可能性は非常に低いということです。このような場合、「相関がない」という仮説を棄却し、「相関がある」と結論づけることができます。

p値が有意水準(例えば0.05)より小さければ、その相関係数は統計的に有意であると判断します。なお、ここにおける5%という基準は慣例的なものであり、調査の性質や目的によって異なる基準が用いられることもあります。

t値からp値を求めるプロセスについて簡単に言及しておきましょう。t分布は、自由度(ここではn-2)によって形が決まる確率分布です。計算されたt値が、この分布のどの位置にあるかを確認し、そのt値よりも極端な値が出る確率を計算します。これがp値となります。

実際には、t分布の確率密度関数を用いて、算出されたt値よりも絶対値が大きいt値が得られる確率を計算します。例えば、t値が2.5で自由度が98(サンプルサイズ100の場合)だとすると、統計ソフトウェアなどを使って、この条件下でt値の絶対値が2.5以上になる確率を計算します。この確率がp値です。

なお、p値が小さいからといって、必ずしもその相関が実践的に重要であるとは限りません。統計的有意性と実務的重要性は別物です。例えば、大規模なサンプル(例えば10000人)で0.03という小さな相関係数が得られた場合、p値は非常に小さくなる可能性がありますが[2]、相関係数0.03は実務的にはほとんど意味がないかもしれません。

したがって、p値は相関の統計的有意性を判断する上で重要な指標ですが、それだけで相関の重要性を判断するべきではありません。相関係数の大きさ[3]、サンプルサイズ、そして何よりも実務的な文脈を考慮に入れて、総合的に判断することが重要です。

脚注

[1] 相関係数の詳細は当社コラムを参考にしてください。

[2] 帰無仮説が誤っているときに、それを正しく棄却できる確率を検定力と呼びます。言い換えれば、実際に存在する効果を検出できる能力です。一般的に、サンプルサイズが大きいほど、また効果量が大きいほど、検定力は高くなります。低い検定力は、実際に存在する効果を見逃してしまう可能性(第二種過誤)を高めます。

[3] 観察された効果の大きさを数値化したものを効果量と言いますが、相関分析の場合、r族の効果量と呼ばれ、相関係数自体が効果量の指標となります。


執筆者

伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

#伊達洋駆 #人事データ分析

アーカイブ

社内研修(統計分析・組織サーベイ等)
の相談も受け付けています