2025年3月24日
交互作用項を含む重回帰分析:従業員の声に潜む相互作用を数値で捉える
本コラムでは、「交互作用項」を含む重回帰分析を紹介します。いきなり専門用語が出てきたので驚いた人もいるかもしれません。この分析は、「AがBに影響を与える」といったシンプルな関係性だけでなく、「AがBに与える影響はCの状況によって変化する」といった、より現実的で複雑な関係性を捉えることができます。
例えば、「上司の支援が従業員のエンゲージメントに与える影響は、従業員の仕事の自律性によって異なる」といった仮説を、データに基づいて検証することが可能です。
これによって、「上司の支援を強化すれば常にエンゲージメントが向上する」といった結論ではなく、「仕事の自律性が高い従業員に対しては上司の支援を強化することでエンゲージメントが大きく向上するが、自律性が低い従業員に対しては上司の支援にあまり効果がない」といった、より洗練された結論を導き出すことができます。
重回帰分析のおさらい
重回帰分析とは、ある成果指標に対して、複数の影響指標がどのような影響[1]を与えているかを分析する手法です[2]。人事領域では、例えば従業員のエンゲージメントを成果指標とし、上司の支援度や仕事の自律性、給与満足度などを影響指標として分析することが考えられます。
重回帰分析の式は次のように表すことができます。
Y=β0+β1X1+β2X2+…+βkXk+ε
この式におけるYは成果指標を表します。これは私たちが予測・理解したい指標です。例えば、従業員のエンゲージメントや生産性、離職意向などが該当します。
X1, X2, …, Xkは影響指標を表します。これらは成果指標に影響を与えると考えられる要因です。例えば、上司の支援度、仕事の自律性、給与満足度などが該当します。kは影響指標の数を表しています。
β0は切片と呼ばれ、全ての影響指標が0の時のYの値を表します。β1, β2, …, βkは(偏)回帰係数と呼ばれ、各影響指標が成果指標に与える影響の大きさを表します。これらの係数の解釈は、他の全ての影響指標が一定であると仮定した上でのものです。
そして、εは誤差項と呼ばれ、モデルで説明できない変動を表します。
しかし、このタイプの重回帰分析には限界があります。それは、影響指標間の交互作用を考慮していないという点です。交互作用とは、ある影響指標の効果が他の影響指標の値によって変化する現象を指します。
例えば、上司の支援の効果が、従業員の経験年数によって異なる場合などが考えられます。新入社員にとっては上司の支援が非常に重要かもしれませんが、ベテラン社員にとってはそれほど重要でないかもしれません。
そこで登場するのが、交互作用項を含む重回帰分析です[3]。この手法では、2つ以上の影響指標の掛け合わせを新たな指標として導入します。これによって、ある影響指標の効果が別の影響指標の値によって変化する状況を表現することができます。
交互作用項の導入
それでは、交互作用項を含む重回帰分析の解説に入っていきましょう。基本的な式は次のようになります。
Y=β0+β1X1+β2X2+β3(X1×X2)+ε
この式におけるβ0とεは前述のとおりです。
β1X1とβ2X2は、それぞれX1とX2の主効果を表します。これらは、もう一方の影響指標の影響を考慮しない場合の、各影響指標の単独の効果を示します。例えば、β1が正の値であれば、X2の値に関わらず、X1の増加はYの増加につながることを指します。
ただし、交互作用項を含むモデルでは、主効果の解釈には注意が必要です。実際の効果は交互作用項によって変化する可能性があるからです。交互作用項を含むモデルでは、一方の影響指標の効果が他方の影響指標の値に依存して変化するため、単純に「X1の効果はβ1である」とは言えません。
そして、β3(X1×X2)が交互作用項です。β3が0でない場合、X1のYへの影響はX2の値によって変化し、同時にX2のYへの影響もX1の値によって変化します。一方の影響指標の効果が、他方の影響指標の値に依存して変化するという複雑な関係性を表現しているのです。
架空の組織サーベイの例で考えてみましょう。上司の支援度(X1)と仕事の自律性(X2)がエンゲージメント(Y)に与える影響を分析する場合、次のようなモデルを考えることができます。
エンゲージメント=β0+β1×上司の支援度+β2×仕事の自律性+β3×(上司の支援度×仕事の自律性)+ε
この式の各係数をどう解釈すればよいのでしょうか。β1は、仕事の自律性が平均的な場合の、上司の支援度がエンゲージメントに与える影響を表します。ここで重要なのは、このβ1は、あくまでも仕事の自律性が平均的な場合の効果であるということです[4]。仕事の自律性が平均よりも高い場合や低い場合には、上司の支援度の効果はこの値とは異なる可能性があります。これは、交互作用項の存在によるものです。
β2は、上司の支援度が平均的な場合の、仕事の自律性がエンゲージメントに与える影響を表します。ここでも同様に、このβ2という値は上司の支援度が平均的な場合の効果であり、上司の支援度が平均よりも高い場合や低い場合には、仕事の自律性の効果はこの値とは異なる可能性があります。
β3は、上司の支援度の効果が仕事の自律性によってどのように変化するか(あるいはその逆)を示します。ここが交互作用の核心です。
β3が正の値であれば、仕事の自律性が高いほど上司の支援がエンゲージメントに与える正の影響が強まることを意味します。自律性の高い仕事をしている従業員ほど、上司の支援がエンゲージメントを高める効果が大きいということです。
例えば、β3が0.1であれば、仕事の自律性が1単位増加するごとに、上司の支援のエンゲージメントへの効果が0.1単位ずつ強まることを意味します。これは、上司の支援の効果が仕事の自律性によって増幅されるということを示しています。
逆にβ3が負の値であれば、仕事の自律性が高いほど上司の支援の効果が弱まることを表します。これは、自律性の高い仕事をしている従業員では、上司の支援がエンゲージメントを高める効果が小さいか、場合によってはマイナスの影響を与える可能性があるということです。
例えば、β3が-0.1であれば、仕事の自律性が1単位増加するごとに、上司の支援のエンゲージメントへの効果が0.1単位ずつ弱まることを意味します。これは、上司の支援の効果が仕事の自律性によって減衰されることを指しています。
交互作用項の解釈
交互作用項を含む重回帰分析の結果を正しく解釈することは、人事施策の立案において重要です。ここでは、解釈の手順を見ていきましょう。
初めに、交互作用項の回帰係数(β3)の統計的有意性を評価します。この評価は、帰無仮説「β3=0」(つまり、交互作用効果が存在しない)に対する検定を通じて行われます。一般的に、p値が0.05未満の場合、帰無仮説を棄却し、交互作用効果が統計的に有意であると判断します。
一方、交互作用項が統計的に有意でない場合、つまり帰無仮説を棄却できない場合、データは交互作用効果の存在を支持していないと解釈できます。このような場合、2つの影響指標の効果は互いに独立していると考えられ、交互作用項を含まないモデルの方が適切である可能性があります。
次に、各影響指標の主効果(β1とβ2)を確認します。ただし、交互作用項が有意な場合、これらの主効果の解釈には注意が必要です。既述のとおり、主効果は、もう一方の指標が平均値のときの効果を示すものとなります。
交互作用の方向性は、交互作用項の回帰係数(β3)の符号を確認することで判断できます。正の値であれば、一方の指標の増加に伴い、もう一方の指標の効果が強まります。負の値であれば、効果が弱まります。
交互作用の具体的な影響を理解するためには、「単純傾斜分析」を行うことが有効です。これは、一方の指標を特定の値(例えば、平均値±1標準偏差)に固定したときの、もう一方の指標の効果を計算する方法です。
単純傾斜分析は、交互作用の効果を異なる条件下で具体的に示すことができるため、有用です。例えば、横軸に上司の支援度、縦軸にエンゲージメントをとり、仕事の自律性の高低別に線を引くことで、交互作用の様子を視覚的に捉えることができます。
仕事の自律性が低い場合(平均-1標準偏差)、高い場合(平均+1標準偏差)の2本の線を引きます。これらの線の傾きが、それぞれの自律性レベルにおける上司支援の効果を表します。交互作用が正の場合、自律性が高いほど線の傾きが急になり、交互作用が負の場合は自律性が高いほど線の傾きが緩やかになるでしょう。
注意点と限界
交互作用項を含む重回帰分析は強力ですが、注意点や限界があります。まずは、多重共線性の問題に気をつけなければなりません。多重共線性とは、複数の影響指標の間に強い相関関係がある状態を指し、各影響指標の影響力の推定に大きな誤差(具体的には、過大な標準誤差)が生じる問題が発生してしまいます。
影響指標間に強い相関があるのは、影響指標間の関係が非常に強く、それぞれの影響指標の独立した効果を分離して推定することが難しくなる状況です。例えば、「年齢」と「勤続年数」という2つの影響指標がある場合、これらは通常強い相関関係にあり、多重共線性の問題が生じる可能性が高くなります。
交互作用項を導入することで、影響指標間の相関が高くなり、推定の精度が低下し得ます。回帰係数の標準誤差が大きくなり、係数の推定値が不安定になるかもしれません。標準誤差が大きくなると、回帰係数の信頼区間が広くなり、その結果、回帰係数の推定値の精度が低下します。推定値が不安定になるということは、データのわずかな変化によって回帰係数の値が大きく変動する可能性があります。
例えば、上司の支援度(X1)と仕事の自律性(X2)の交互作用を考える場合、X1×X2という新しい指標を導入しますが、この指標はX1やX2と強い相関を持ち得ます。これによって、各指標の独立した効果を正確に推定することが困難になるのです。
この問題を軽減するために、影響指標の中心化が有効です。中心化とは、各影響指標から平均値を引くことで、新しい指標を作成する方法です。
中心化を行うことで、交互作用項と元の指標との相関を減少させ、多重共線性の問題を軽減することができます。中心化によって各指標の平均が0になり、正の値と負の値が混在するようになります。その結果、交互作用項と元の指標との間の線形関係が弱まり、相関が減少するのです。
交互作用を含むモデルに話を戻して、単純な主効果のみのモデルよりも解釈が複雑になる点も看過できません。特に、3つ以上の指標間の交互作用を考慮する場合は、結果の解釈が難しくなります。
例えば、上司の支援度(X1)、仕事の自律性(X2)、従業員の経験年数(X3)の3つの指標間の交互作用を考慮すると、X1×X2、X1×X3、X2×X3、X1×X2×X3という4つの交互作用項が追加されることになります[5]。これらすべての効果を同時に解釈することは複雑で、実務的な意味を見出せなくなるかもしれません。
したがって、交互作用を含むモデルを構築する際は、明確な根拠に基づいて必要最小限の交互作用項のみを含めるようにしたいところです。
さらに、交互作用項を含むモデルは、多くのパラメータを推定する必要があるため、十分なサンプルサイズが必要です。サンプルサイズが小さすぎると、推定されたパラメータの精度が低下し、結果が不安定になります。
脚注
[1] 本コラムでは説明の分かりやすさを優先し、「影響」という言葉を使用していますが、これは因果関係を示すものではありません。重回帰分析は変数間の相関関係を示すものであり、直接的な因果関係を証明するものではありません。「影響」という表現は、変数間の統計的な関連性を示すために使用しており、より正確には「関連」と表現されるべきものです。
[2] 重回帰分析そのものの詳細については当社コラムをご確認ください。
[3] 交互作用そのものの解説については当社コラムが参考になります。
[4] この解釈は、指標が中心化されている場合に特に当てはまります。中心化とは、各指標から平均値を引く処理のことで、交互作用項を含む重回帰分析において重要な前処理のステップです。中心化によって、主効果の解釈がより直感的になり、本コラムでも後述するように、多重共線性の問題も軽減されます。
[5] X1×X2×X3と3指標の交互作用の解釈は、X1×X2という交互作用をX3が強める・弱める効果を持つという、「交互作用に対する交互作用」となります。つまり、「X1の影響力をX2が変える交互作用の効果は、X3によって違ってくる」状況を表します。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。