ビジネスリサーチラボ

open
読み込み中

コラム

関連の大きさを評価する:r族の効果量

コラム

効果量とは、差や関連の大きさを表す指標です。組織サーベイの分析において、「統計的に有意な差がある」かどうかを判断することは、よく行われます。しかし、この「統計的に有意」という結果だけでは、実際にその差がどの程度大きいのかを判断することが困難です。

例えば、ある企業で部署ごとのエンゲージメントスコアを測定し、部署間で統計的に有意な差が見られたとします。しかし、その差が実質的にどの程度大きいのかは、「統計的に有意」という情報だけではわかりません。

また、サンプルサイズ(回答者数)が大きい場合、わずかな差でも統計的に有意になりやすいという問題もあります。例えば、1000人規模の大規模な組織サーベイでは、部署間のエンゲージメントスコアの差がわずかでも統計的に有意になる可能性があります。しかし、そうした小さな差が、実務的に意味があるかどうかは別問題です。

本コラムでは、効果量の中でも特に「r族」と呼ばれる、関連の大きさを表す指標に焦点を当て、人事担当者の皆さんにその意味と活用イメージを解説していきます。組織サーベイを例に挙げながら説明を進めます。

r族の効果量とは

r族の効果量は、主に2つの指標間の関連の強さを表す指標です[1]。ここでいう「関連」とは、2つの指標がどの程度一緒に変化するか、あるいはある指標の値が変わったときに、もう一方の指標の値がどの程度変化するかを意味します。

例えば、組織サーベイで「仕事満足度」と「組織コミットメント」という2つの指標を測定したとします。仕事満足度が高い従業員は、組織コミットメント(組織に対する愛着や忠誠心)も高いのでしょうか。それとも、これらの指標にはあまり関係がないのでしょうか。r族の効果量を用いると、関係性の強さを数値で表すことができます[2]

数値化によって、直感的には捉えにくい関係性を客観的に評価することが可能になります。例えば、「仕事満足度」と「組織コミットメント」の間に強い関連があることがわかれば、仕事満足度を向上させる施策が組織コミットメントの向上にもつながるかもしれません。逆に、関連が弱ければ、これらは別々に対策を立てる必要があるかもしれません。

r族の効果量は、異なる尺度や単位で測定された指標間の関連を比較できるようにします。例えば、「給与満足度」(5段階評価)と「生産性」(実際の数値)の関連と、「職場満足度」(7段階評価)と「離職意図」(4段階評価)の関連を比較することができます。

本コラムでは、r族の効果量の中でも次の4指標に焦点を当てて解説します。

  • 相関係数r
  • 決定係数R2
  • 相関比η2(イータ二乗)
  • 偏相関比partialη2(偏イータ二乗)

相関係数r

相関係数rは、2つの量的指標間の直線的な関係の強さと方向を示します。「直線的な関係」とは、一方の指標が増加(または減少)するにつれて、もう一方の指標も増加(または減少)する関係を指します。

例えば、組織サーベイで「仕事満足度」と「支持的風土」という2つの指標を5段階で評価してもらったとします。2指標間の相関係数を計算することで、仕事満足度と支持的風土がどの程度関連しているかを数値で表すことができます。

全従業員の回答データをプロットした散布図を想像してみてください。横軸に仕事満足度、縦軸に支持的風土をとります。


仕事満足度が高い人ほど支持的風土も高いと感じているのであれば、散布図の点は右上がりの直線に近い形で分布します。逆に、仕事満足度が高い人ほど支持的風土が低いと感じているのであれば、散布図上の点は右下がりの直線に近い形で分布します。

相関係数rは、このような散布図上の点がどの程度直線に近い形で分布しているかを-1から+1の範囲で表します。相関係数rは次の通り算出します[3]

r=(Σ((x-x)(y-y))/N) / √(Σ(x-x)^2 /N) * √(Σ(y-y)^2/N)

ここにおいて、xyは各指標の値、xyはそれぞれの平均値、そしてNはサンプルサイズを指します。

分子は2つの指標の共分散を表しています。共分散は、2つの指標が平均からどの程度同じように離れているかを示します。各データについて、xの値がその平均からどれだけ離れているか(x-x)と、yの値がその平均からどれだけ離れているか(y-y)を掛け合わせ、それをすべてのデータについて合計してNで割り算しています。

例えば、ある従業員の仕事満足度が平均より1ポイント高く(x-x=1)、同時に支持的風土の評価も平均より0.8ポイント高い(y-y=0.8)とすると、このデータの共分散への寄与は1*0.8=0.8となります。全てのデータについてこの計算を行い、それらの合計値をサンプルサイズで割り算したものが共分散となります。

共分散が正の値であれば、2つの指標は同じ方向に変化する傾向があり、負の値であれば逆方向に変化する傾向があることを意味します。

相関係数の計算式の分母は、各指標の標準偏差を掛け合わせたものです。標準偏差は、データのばらつきの大きさを表します。各データの値と平均値の差を二乗し、全データについてその合計を取り、データ数で割った後に平方根を取ります。

分母の処理により、指標の単位や散らばり具合の違いが調整されます。例えば、仕事満足度を5段階で、支持的風土を7段階で評価した場合でも、適切に比較できるようになります。また、一方の指標のばらつきが大きい場合でも、それによって相関係数が不当に大きくなったり小さくなったりすることを防ぎます。

全体として、この式は2つの指標が同じように変化する程度を-1から+1の範囲で表現しています。+1に近いほど強い正の相関(一方が増加すると他方も増加)、-1に近いほど強い負の相関(一方が増加すると他方は減少)、0に近いほど相関が弱いことを示します。

相関係数の解釈の目安は次の通りです。ただし、これはあくまで目安であり、目的や状況によって解釈は異なる場合があります。

  • |r|2:非常に弱い相関
  • 2≦|r|0.4:弱い相関
  • 4≦|r|0.6:ほどほどの相関
  • 6≦|r|< 0.8:強い相関
  • 8≦|r|:非常に強い相関

決定係数R2

決定係数R2は、成果指標の実測値と回帰分析で出力できる成果指標の予測値の相関係数rを二乗したものです。成果指標のばらつきが、影響指標によってどの程度説明できるかを示します[4]。一つの影響指標(または複数の影響指標)の変化が、成果指標の変化とどの程度関連しているかを表すものです。0から1の間の値を取り、1に近いほど説明力が高いことを意味します。

例えば、従業員の仕事満足度(成果指標)が、職場の支持的風土(影響指標)によってどの程度説明できるかを知りたい場合、決定係数R2を用いることで、支持的風土の違いが仕事満足度の違いをどの程度説明できるかを数値で表現できます。

決定係数R2は、特に回帰分析において重要な役割を果たします。回帰分析とは、1つの指標(成果指標)を他の1つまたは複数の指標(影響指標)から予測しようとする統計手法です。

R2は、成果指標の全変動のうち、回帰モデルによって説明される部分の割合を表します。影響指標(説明指標)の変化が、成果指標(目的指標)の変化をどの程度説明できるかを表しています。R2は、具体的には、次のように計算されます。

R2=(回帰による変動/全変動)

「回帰による変動」とは、回帰モデルによって予測された個々の成果指標の値と実際の成果指標の平均値との差の二乗和を指します。これは、モデルが説明できる変動の大きさを意味しています。例えば、支持的風土のスコアから予測される仕事満足度と、全従業員の平均仕事満足度との差を二乗し、合計したものです。

一方、「全変動」とは、成果指標における個々の観測値と成果指標の平均値との差の二乗和を指します。データ全体のばらつきの大きさを表しています。例えば、各従業員の実際の仕事満足度と、全従業員の平均仕事満足度との差を二乗し、合計したものです。

この比率を取ることで、モデルが説明できる変動が、全体の変動のどれくらいの割合を占めているかがわかります。

例えば、組織サーベイのデータを用いて、従業員の「仕事満足度」(成果指標)を「支持的風土」「自律性」「ワークライフバランス」(影響指標)から予測する重回帰分析を行ったとします。このとき、決定係数R2は、仕事満足度の変動のうち、これら3つの影響指標によって説明できる割合を示します。

仮に、R2=0.35という結果が得られたとすると、「仕事満足度の変動の35%が、支持的風土、自律性、ワークライフバランスという3つの要因によって説明できる」ということを意味します[5]。仕事満足度を向上させるためには、これら3つの要因に焦点を当てた施策が有効である可能性が高いと解釈できます。

決定係数R2の大きさの目安は次の通りです。ただし、これも目安にすぎません。

  • R2.02:非常に弱い説明力
  • .02≦R2.13:弱い説明力
  • .13≦R2.26:中程度の説明力
  • .26≦R2:強い説明力

相関比η2

相関比η2は、質的指標と量的指標の関係を示す指標です[6]。分散分析などで用いられ、グループ間の差異がどの程度大きいかを検討します。

例えば、組織サーベイで「部署」(質的指標)と「仕事満足度」(量的指標)の関係を分析する場合、η2を用いることで、部署の違いが仕事満足度にどの程度関連しているかを数値で表現できます。

η2は全体の変動のうち、グループ間の違いによって説明できる割合を表します。グループ分けによってデータのばらつきがどの程度説明できるかということです。例えば、仕事満足度の違いのうち、どれくらいが部署の違いによって説明できるのか、あるいは部署が異なることで仕事満足度がどの程度変わるのかを、0から1の範囲の数値で表します。

η2の計算式は次の通りです。

η2=グループ間変動/全体の変動

「グループ間変動」は各部署の平均仕事満足度の違いによる変動を指しています。各部署の平均仕事満足度と全体の平均仕事満足度の差を二乗し、それぞれの部署の人数を掛けて合計したものです。これは、部署間の違いがどの程度仕事満足度の違いを生み出しているかを表しています。

例えば、営業部の平均仕事満足度が4.2、人事部が3.8、全体平均が4.0だった場合、営業部の寄与は(4.2-4.0)^2×営業部の人数、人事部の寄与は(3.8-4.0)^2×人事部の人数となり、これらを合計します。値が大きいほど、部署間の仕事満足度の違いが大きいことを意味します。

一方、「全体の変動」は全従業員の仕事満足度のばらつきを示しています。各従業員の仕事満足度と全体の平均仕事満足度の差を二乗し、全て合計したものです。仕事満足度がどの程度ばらついているかを表しています。

例えば、ある従業員の仕事満足度が3.5で全体平均が4.0の場合、この従業員の寄与は(3.5-4.0)^2となります。全従業員についてこの計算を行い、合計します。この値が大きいほど、従業員間の仕事満足度のばらつきが大きいことを意味します。

η2は、「グループ間変動」を「全体の変動」で割ることで計算されます。全体のばらつきのうち、どれくらいの割合がグループ(この場合は部署)の違いによって説明できるかを検討しています。

例えば、η2=0.15という結果が得られた場合、これは「仕事満足度の違いの15%が部署の違いによって説明できる」ということを意味します。仕事満足度の違いのうち15%は、従業員がどの部署に所属しているかによって生じていると解釈できます。残りの85%は、個人の性格、経験、スキルなど、部署以外の要因、さらには誤差などによって説明されると考えられます。

η2の大きさの目安ですが、次の通りです。繰り返しになりますが、これもやはり一つの目安である点には注意が必要です。

  • η2.01:非常に弱い効果
  • .01≦η2.06:弱い効果
  • .06≦η2.14:中程度の効果
  • .14≦η2:強い効果

偏相関比partialη2

偏相関比partialη2は、複数の影響指標がある場合に、他の指標の影響を制御した上で、ある特定の影響指標の効果を評価するために使用されます。ある要因の純粋な効果を検討するための指標と言い換えることができます。

例えば、組織サーベイで「部署」「職位」(質的指標)と「職務満足度」(量的指標)の関係を分析する場合を考えてみましょう。これらの要因は互いに関連している可能性があります(例えば、特定の部署には高い職位の人が多いなど)。このような場合、単純にη2を計算すると、各要因の効果が他の要因の影響を含んでしまいます。

partialη2を用いることで、他の要因の影響を制御した上で、各要因が職務満足度に与える影響を評価することができます。「部署の違いが職務満足度に与える影響」を評価する際に、「職位」の影響を取り除いた効果を検討できるということです。

partialη2の計算式は次のようにまとめられます。

partialη2=効果の平方和/(効果の平方和+誤差平方和)

「効果の平方和」は、着目している要因(例えば、部署)による変動の大きさを表します。これは、その要因によって説明できる変動の量を意味しています。「誤差平方和」は、モデルで説明できない変動の大きさを表します。着目している要因以外の影響や、ランダムな変動を示しています。

分母の「効果の平方和+誤差平方和」は、着目している要因に関連する全ての変動を表します。その要因に関連する全ての変動(説明できる部分と説明できない部分の和)を指します。

この計算式では、分母に全平方和ではなく、効果の平方和と誤差平方和の和を用いています。これによって、他の指標の影響を排除した効果量を算出することができます。着目している要因が、関連する変動のうちどれだけの割合を説明できるかを示しているのです。

例えば、組織サーベイで「部署」「職位」(質的指標)と「職務満足度」(量的指標)の関係を分析する場合、partialη2を用いることで、他の要因の影響を制御した上で、各要因が職務満足度に与える影響を評価することができます。

具体的には、2要因分散分析を行い、各要因(部署、職位)のpartialη2を計算します。この分析の目的は、これらの要因が職務満足度にどの程度関連しているかを明らかにすることです。

分析の結果、次のようなpartialη2が得られたとしましょう。

  • 部署:partialη2=0.15
  • 職位:partialη2=0.04

この結果から、次のような解釈が可能です。

  • 部署の違いが職務満足度に最も大きな影響を与えている
  • 職位の影響は比較的小さい

partialη2η2よりも大きな値を示す傾向があるため、解釈には注意が必要です[7]

r族の効果量の活用イメージ

組織サーベイにおいて、r族の効果量をどのように活用できるでしょうか。いくつかの架空の例を見ていきましょう。

1:仕事満足度と組織コミットメントの関係

1000人規模の組織サーベイを実施しました。この調査では、「仕事満足度」と「組織コミットメント」をそれぞれ1-55段階で評価してもらいました。分析の結果、仕事満足度と組織コミットメントの間の相関係数はr=0.72でした。

  • 正の相関(r>0):仕事満足度が高い従業員ほど、組織コミットメントも高い傾向にある
  • 強い相関(6≦r<0.8):この関連性は強く、無視できない程度の大きさである

2:仕事満足度の要因分析

「仕事満足度」を成果指標とし、「支持的風土」「自律性」「ワークライフバランス」を影響指標とする重回帰分析を行いました。分析の結果、決定係数はR2=0.32でした。

  • 強い説明力(R2≧.26):これら3つの要因が、仕事満足度の変動の32%を説明できることを示している
  • 具体的な意味:仕事満足度の変動の約3分の1が、支持的風土、自律性、ワークライフバランスという3つの要因に関連していると解釈できる
  • 他の要因の存在:残りの68%は、これら以外の要因や誤差などによって説明される

3:部署別のエンゲージメントスコアの違い

部署ごとのエンゲージメントスコアの違いを調査しました。エンゲージメントスコアは0-10の範囲で測定されています。分析の結果、部署とエンゲージメントスコアの間のη20.12でした。

  • 中程度の効果(.06≦η2<.14: 部署の違いがエンゲージメントスコアの違いの12%を説明している
  • 具体的な意味:エンゲージメントスコアの違いのうち、12%が所属部署の違いに関連している。部署によってある程度エンゲージメントに差があることがわかる
  • 他の要因の存在:残りの88%は個人の性格、職務内容、直属の上司のリーダーシップなど、他の要因や誤差などによって説明される

4:職務満足度に影響を与える組織要因の分析

「部署」「職位」がそれぞれ「職務満足度」にどの程度影響を与えているかを分析するために、二要因分散分析を行いました。分析の結果、部署では0.15、職位では0.04partialη2が得られました。

  • 部署の影響:他の要因(職位)の影響を制御しても、部署の違いが職務満足度と関連していることがわかる
  • 職位の影響:部署の影響を除くと、職位単独の関連は比較的小さいことがわかる

脚注

[1] 差の効果量(いわゆるd族の効果量)に関する解説は当社コラム(https://www.business-research-lab.com/230421-2/)をご覧ください。

[2] 効果量の統計的な大きさと実務的な重要性は必ずしも一致しないことがあります。小さな効果量でも、長期的には大きな影響を持つ場合や、コストに対して高い効果がある場合、あるいは累積的な効果が重要な場合があります。逆に、大きな効果量でも、実装コストが高すぎたり、倫理的な問題がある場合は実務的に適用できないこともあります。

[3] 相関係数の意味するところや読み方については当社コラム(https://www.business-research-lab.com/240909-3/)をご参照ください。

[4] 当社の重回帰分析に関するコラム(https://www.business-research-lab.com/240906-3/)において決定係数に関する解説が含まれています。そちらも参考にしていただけると幸いです。

[5] 決定係数R2の解釈には注意が必要です。R2は指標間の関連性を示すものであり、必ずしも因果関係を意味するわけではありません。例えば、「仕事満足度の変動の35%が、支持的風土、自律性、ワークライフバランスによって説明できる」というときにも、厳密には相関関係を示しています。また、複数の影響指標間の相関が強い場合、R2は大きめに計算される性質があります。

[6] 質的変数・量的変数の違いについては、当社コラム(https://www.business-research-lab.com/221228-2/)でくわしく解説しています。名義尺度と順序尺度は質的変数、間隔尺度と比率尺度は量的変数に該当します。

[7] partialη2η2よりも大きな値を示す傾向がある理由は、両者の計算方法の違いにあります。η2は全体の変動に対する効果の割合を示すのに対し、partialη2は効果と誤差の合計に対する効果の割合を示します。partialη2の計算では他の要因による変動が除外されるため、分母が小さくなり、結果として値が大きくなります。


執筆者

伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

#伊達洋駆 #人事データ分析

アーカイブ

社内研修(統計分析・組織サーベイ等)
の相談も受け付けています