2025年4月21日
重回帰分析における統制の意味:複雑な要因の関係を紐解く
組織サーベイの分析結果を読んでいると、「他の要因を『統制』した結果」という表現を目にすることがあります。しかし、「統制」とは何でしょうか。
例えば、会社の中で「この商品の売上が伸びたのは、広告の効果だけではなく、季節的な要因も影響しているかもしれない」と考えることがあると思います。このように、ある結果に対して複数の要因が影響している場合、それぞれの要因が「どれくらい」影響しているのかを知りたくなります。
組織サーベイでも同じです。従業員のエンゲージメントが高いのは、仕事のやりがいが大きいからなのか、職場の人間関係が良好だからなのか。こうした疑問に答えるためには、それぞれの要因の影響を「分離」して考える必要があります。この「分離」を行うために活用される手続きを「統制」と呼びます。
本コラムでは、組織サーベイを例に、統制の意味するところを解説します。この考え方を理解することで、日々の人事施策の効果をより正確に把握できるようになります。職場の課題に対して、より効果的な解決策を見つけることもできるでしょう。
測定値に含まれる重複
組織サーベイでは、様々な項目によって職場環境や従業員の意識を測定します。例えば、次のような項目があったとします。
- 私は自分の仕事に意義を感じている
- 職場の人間関係は良好である
- 私は今の仕事に満足している
これらの項目は、一見すると別々の事柄を測っているように見えます。「仕事の意義」と「人間関係」は、別の概念のように思えます。しかし、実際の測定値、すなわち従業員の回答には、様々な要因が絡み合っています。
例えば、ある従業員が「仕事の意義」について「非常によく当てはまる」と回答したとします。この回答には、純粋に「仕事そのものの意義深さ」だけでなく、「職場の良好な人間関係による充実感」も含まれているかもしれません。人は良好な人間関係の中で仕事をしているときの方が、その仕事により意義を見出しやすいからです。
同様に、「人間関係」への回答にも、純粋な「対人関係の良好さ」だけでなく、「意義ある仕事に一緒に取り組んでいることによる一体感」が含まれているかもしれません。このように、私たちが測定できる「回答値」には、様々な要因が混ざり合っているわけです。
なぜ、このような重複が生じるのでしょうか。それは、職場における人々の意識や行動が、複雑に関連し合っているからです。例えば、チームメンバーと良好な関係を築けている人は、メンバーからの支援や励ましを得やすく、その結果、困難な仕事にも前向きに取り組めるかもしれません。そうすると、仕事により意義を見出せるようになるでしょう。
逆に、意義ある仕事に取り組んでいるチームは、共通の目的意識を持ちやすく、お互いを理解し支援しようとする雰囲気が生まれやすいかもしれません。そうすると、チームの人間関係も自然と良好になっていくでしょう。
実際問題、職場における様々な要因は、お互いに影響を与え合い、補強し合っています。そのため、一つの項目への回答には、他の要因の影響が含まれることになります。
この重複は、「相関」という概念で表現することもできます。相関とは、二つの指標がどの程度一緒に変動するかを意味します。例えば、相関係数が0.5だとすると、二つの指標は中程度の正の線形関係があるということです。一方が高い値を示すとき、もう一方も高い値を示しやすい、という関係です。
組織サーベイで言えば、「仕事の意義」の得点が高い人は、「人間関係」の得点も高い傾向にある、という具合になります。この重複があるために、単純に「仕事の意義」とエンゲージメントの関係を見ただけでは、「仕事の意義」が「純粋に」どれほどエンゲージメントに影響しているのかを理解することが難しくなります。その関係の中には「人間関係」の影響も含まれているからです。
統制について掘り下げる
統制とは、この重複を取り除く操作です。もう少し具体的に説明すると、ある指標(例:仕事の意義)から、他の指標(例:人間関係)との重複部分を差し引き、純粋な部分だけを取り出す作業です。
これは、あたかも「もし人間関係の良し悪しが全員同じだったとしたら、仕事の意義はエンゲージメントにどれくらい影響するだろうか」というシミュレーションをしているようなものです。
この考え方を式で表現してみましょう。
Y=β₁X₁+β₂X₂+ε
この式の中で、Yはエンゲージメントスコアを表します。これは、従業員一人一人について測定された「エンゲージメントの高さ」です。例えば、5段階評価で測定された値としましょう。
X₁は仕事の意義の測定値です。例えば、「私は自分の仕事に意義を感じている」という項目に対する回答値です。同様に、X₂は人間関係の測定値で、例えば、「職場の人間関係は良好である」という項目への回答値です。
β₁とβ₂は、それぞれの要因の影響力を表す係数(「偏回帰係数」と呼びます)です。これらの値が、私たちが知りたい「純粋な」影響力になります。
εは誤差項と呼ばれるもので、仕事の意義と人間関係の2指標を取り上げたこの式で説明できない部分(例えば、その日の体調や気分による変動など)を表します[1]。
この式において、β₁は「X₂(人間関係)の影響を統制した上でのX₁(仕事の意義)の影響力」を表します。換言すれば、「人間関係の良し悪しに関係なく、仕事の意義がエンゲージメントにどれほど影響を与えているか」を意味しています。X₁(仕事の意義)からX₂(人間関係)との重複部分を除いた「純粋な」部分が、Y(エンゲージメント)にどれほど影響を与えているかを表しているということです。
この統制は、実際には次のような手順で行われます[2]。
初めに、X₁(仕事の意義)をX₂(人間関係)に回帰させます。「仕事の意義」の得点を「人間関係」の得点から予測する作業です。「人間関係の良好さ」によって説明できる「仕事の意義」の部分を見つけ出すのです。
例えば、人間関係の得点が1点上がるごとに、仕事の意義の得点が平均して0.4点上がるという関係が見つかったとします。0.4という数値は、「仕事の意義」の得点の中に含まれている「人間関係」の影響の大きさを表しています。このように、二つの変数の間の関係を数値化することで、重複の程度を把握することができます。
続いて、その結果を使って、X₁(仕事の意義の得点)を二つの部分に分解します。一つは「X₂(人間関係)との重複部分」、すなわち「人間関係で説明できる部分」です。もう一つは「X₁独自の部分」、すなわち「人間関係では説明できない部分」です。
先ほどの例でいえば、ある人の「仕事の意義」の得点が4点、「人間関係」の得点が3点だったとします。人間関係の得点が1点上がるごとに仕事の意義の得点が0.4点上がる関係があるとすれば、この人の「仕事の意義」の得点4点のうち、1.2点(= 3×0.4)は「人間関係」で説明できる部分ということになります。残りの2.8点(= 4-1.2)が、「人間関係とは関係のない、仕事の意義」の部分です。
さらに、この「X₁独自の部分」(上の例では2.8点)と、Y(エンゲージメント)との関係を計算します。これによって、「人間関係の影響を取り除いた、仕事の意義」が、エンゲージメントにどれほど影響しているかがわかります。これが、私たちが知りたかった「純粋な」影響力になります。
これらの一連の計算は、実際には行列という道具を使って、一度に効率よく行うことができます。その計算式が次のものになります[3]。
β=(X’X)⁻¹X’Y
この式においてやっていることは先ほど説明した手順と同じです。X’Xという部分は、指標間の関係(重複の度合い)を表す行列です。これは、「指標同士の関係を一覧表にしたもの」と考えていただければと思います。
例えば、この行列の中には、「仕事の意義」と「人間関係」がどれくらい重複しているか、「仕事の意義」と「エンゲージメント」がどれくらい関係しているか、といった情報が含まれています。この行列の逆行列((X’X)⁻¹)を計算することで、それぞれの指標の「純粋な」部分を取り出すことができます。
複雑に絡み合った糸をほぐすような作業です。絡まった糸の中から、一本一本の糸を丁寧に分離していくように、変数間の重複を一つずつ解きほぐしていきます。その結果として、各変数の「純粋な」影響力(β)を取り出すことができます[4]。
実際の計算は、コンピュータが行ってくれます。私たちが理解しておく必要があるのは、この計算が、指標間の重複を解きほぐして、純粋な影響力を取り出す処理だということです。
統制された結果の解釈
統制された結果を解釈する際には、いくつかの注意点があります。
第一に、統制後の係数は「他の条件が同じであれば」という仮定の上での影響力を示していることを理解しなければなりません。例えば、仕事の意義の(標準化されていない)係数が0.3だとしましょう。これは、「人間関係のレベルが同じ二人を比べた場合、仕事の意義の得点が1点高い人は、エンゲージメントの得点が0.3点高い傾向にある」ということを意味します。
「もし魔法で全員の人間関係を同じレベルにそろえることができたら、仕事の意義の違いはエンゲージメントにこれくらいの差をもたらすはずだ」という理論上の計算値です。実際の職場では、人間関係と仕事の意義は絡み合って影響しているため、この係数はあくまでも「純粋な」影響力を示す参考値として捉える必要があります[5]。
第二に、分析に含める指標の選び方には注意が必要です。例えば、「仕事の意義」と「仕事の満足度」は、概念的にかなり重なっています。仕事に意義を感じている人は、たいてい仕事に満足しているでしょう。重なりが大きすぎる指標を同時に分析に含めると、お互いの効果を打ち消してしまい、係数の推定計算がおかしくなる問題が生じます[6]。
言ってみれば、同じような情報を二重に数えているような状態です。指標を選ぶ際は、それぞれの概念が異なるものであるかを、理論的に検討する必要があります。
第三に、統制後の係数の大きさだけで、その要因の重要性を結論づけるのはやめましょう。例えば、「人間関係」の係数が小さかったとしても、それは必ずしも「人間関係は重要でない」ことを意味するわけではありません。
人間関係は他の多くの要因と関連している可能性が高いからです。良好な人間関係は、直接的にはエンゲージメントへの影響が小さく見えても、「仕事の意義を感じやすくする」「新しいスキルの習得を促進する」「仕事の満足度を高める」など、様々な経路を通じて間接的にエンゲージメントを高めているかもしれません。こうした間接的な効果は、単純な統制の結果からは読み取りにくいものです。
第四に、統制できるのは測定した指標の影響だけだということを理解しておきましょう。例えば、従業員の性格特性や、仕事外での生活状況など、サーベイでは測定していない要因の影響は統制できません。
例えば、「責任感が強い」という性格の人は、「仕事に意義を感じやすい」と同時に「エンゲージメントも高くなりやすい」かもしれません。しかし、性格特性を測定していなければ、この影響を統制することはできません。
統制後の結果を解釈する際は、「測定していない要因の影響が残っている可能性がある」ということを意識しておくべきです。統計的な分析は、あくまでも測定可能な範囲内での最善の推測を提供してくれるものです。
脚注
[1] 重回帰分析における「誤差項」とは、分析で用いた影響指標により説明できない部分を表し、観測されない要因や変動の影響が含まれることに注意が必要です。体調や気分の変動はその一例です。
[2] ここでは偏回帰係数の算出過程を「X₁をX₂に回帰させる」というステップに分けて説明しますが、これは厳密な数理的プロセスを直感的に理解しやすくするため2指標のみで説明した簡略化です。実際の重回帰分析では、後述するように、すべての指標を同時に考慮した行列計算により、一度に係数を算出します。この方法では、影響指標間の相関構造全体を考慮しながら、成果指標との関係を最適化します。ここで示す段階的な説明は、指標間の重複を除去するという統制の働きを理解する助けとなりますが、実際の計算過程とはより複雑になる点には注意してください。
[3] この数式については、当社コラム「多重共線性:人事データ分析における落とし穴」で詳しく解説しています。
[4] 「純粋な影響力」という表現は、統計モデル上で他の指標の影響を統制した際の係数を指しています。現実の組織では要因間の相互作用が複雑に絡み合っており、完全に「純粋な」影響を分離することは不可能です。また、観測されていない指標の影響も残っている可能性があります。したがって、この表現は便宜上使用しているものであり、実際の組織における影響関係はより複雑であることにご留意ください。
[5] 「統制」によって得られる結果は、因果関係を必ず示すものではありません。統制は指標間の関連を除去する手法であり、特定の指標が原因となり、他の指標が結果として生まれていることを保証するものではありません。
[6] 「概念的に重なっている」状態は、「多重共線性」と呼ばれる深刻な問題を引き起こす可能性があります。多重共線性とは、説明変数間に強い相関関係が存在する状態を指します。この状態では、偏回帰係数の推定値が不安定になり、標準誤差が大きくなるため、係数の推定精度が低下します。詳しくは、当社コラム「多重共線性:人事データ分析における落とし穴」をご覧ください。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。