2022年12月28日
尺度水準の考え方
従業員の態度や考え方を把握する方法の一つとして、「組織サーベイ」が挙げられます。例えば表1は、従業員の意欲を測定する組織サーベイです。
表1:意欲を測定する組織サーベイの例
組織サーベイで用いられる、選択肢に数値を割り当てたもののことを「尺度(スケール)」と呼びます。特に、人の感覚や意欲、物事の認識の仕方がどの程度であるか、数値を割り当てている尺度を「心理尺度」と呼びます[1]。
尺度を組み合わせて、組織サーベイは構成されています。ただ、尺度にも様々な種類(水準)があり、それぞれの特性を理解したうえで組織サーベイを設計する必要があります。なぜなら、尺度水準によって、使用できる分析手法が異なるからです。
本コラムでは、尺度の4水準を紹介しつつ、組織サーベイを設計する上でのポイントについて解説します。
1.尺度の4水準
(1)名義尺度
名義尺度とは、「選択肢に区別をつけるための尺度」を指します。具体的には図1のようなイメージです。
図 1:名義尺度の例
名義尺度の特徴は2つあります。1つ目は、「数値の大小に意味はない」ことです。例えば、営業部(1)より数値の大きい製造部(2)の方が、何か優れているわけではありません。2つ目は、「尺度の値同士で四則演算ができない」ことです。「対人関係(4)-昇進・昇格(3)=?」などと、計算をしても意味がありません。
(2)順序尺度
順序尺度は、「数値の大小(順序関係)に意味はあるが、数値間の間隔は等しくない尺度」を指します。具体的には図2のようなイメージです。
図 2:順序尺度の例
例えば、営業成績は1位の方が2位よりも優れている、と順序関係があります。ただ、1位と2位の成約件数の差は1件だったのに対し、2位と3位の差は10件である可能性もあります。
心理尺度も、5点の方が4点よりも「当てはまっている(=やる気がある)」ことはわかります。しかし、5点と4点の間のやる気の差と、4点と3点のやる気の差が等しいとは言い切れません。
順序尺度も、「尺度の値同士で四則演算ができない」という特徴があります。あくまでも、数値の順序関係を示しているだけです。
なお、図2の心理尺度のような質問の仕方は、「リッカート法」とも呼ばれます。
(3)間隔尺度
間隔尺度は、「数値の大小に意味があり、選択肢間の間隔は等しいが、絶対的原点を持たない尺度」です。「絶対的原点を持つ」とは、0が何も無いことを示している状態を指します。つまり、間隔尺度では0の値も何らかの意味を持ちますし、マイナスの値も取り得ます。
間隔尺度については、図3のような例が挙げられます。
図 3:間隔尺度の例
例えば、気温における0度のことを「気温が無い」とは表現しません。0度は存在しますし、0度を下回るマイナスの気温(氷点下)もあるわけです。
また、10度の方が5度よりも気温が高いことを示しているほか、1度ごとの差は等しいため、0度と5度の差と、5度と10度の差は、5度という等しい温度差を表しています。
間隔尺度では、尺度の値同士の足し算・引き算のみ可能です。例えば「昨日よりも気温が1度低い」と言ったとき、今日の気温から昨日の気温を引き算していることになります。一方で、「10度は5度の2倍暑い」などのように、かけ算・割り算などはできません。
(4)比率尺度
比率尺度は、「数値の大小に意味があり、数値間の間隔は等しく、絶対的原点を持つ尺度」です。繰り返しになりますが、「絶対的原点を持つ」とは、0が何も無いことを示している状態です。つまり、マイナスの値を取り得ません。
比率尺度の例としては、図4のようなものが挙げられます。
図 4:比率尺度の例
例えば物の長さについて、0cmは「長さが無い(存在しない)」ことを示します。勤続年数も同様に、0年は「働いていない」と言い表すことができます。同じ「年・期間」を表す表現でも、西暦年は間隔尺度であり、勤続年数は比率尺度です。
また、100cmは50cmよりも長いことを示しているほか、選択肢ごとの差は等しいため、0cmと50cmの差と、100cmと50cmの差は、50cmという等しい差を表しています。
比率尺度には四則演算の全てが適用できます。100cmは50cmよりも50cm長いといえますし、100cmは50cmの2倍長いと表現することもできます。
以上、4つの尺度水準の特徴をまとめたものが表2です。補足として、比率尺度に近いほど、尺度の水準が「高い」と表現されます。各水準の解説で「四則演算ができる/できない」などと説明しましたが、尺度水準が高いほど、計算や分析における制限が少なくなります。
表2:4つの尺度水準の特徴
2.心理尺度は順序尺度だが、間隔尺度としても扱われる
特に組織サーベイで重要な観点として、尺度水準における心理尺度の扱われ方について押さえておきます。
1-(2)で解説したとおり、心理尺度は厳密には順序尺度です。順序尺度とは、「数値の大小(順序関係)に意味はあるが、数値間の間隔は等しくない尺度」でした。
例えば、「あなたはやる気を持って働けていますか」という心理尺度は、図5のようなイメージです。「当てはまらない」と「あまり当てはまらない」の間隔と、「あまり当てはまらない」「どちらともいえない」の間隔は、必ず等しいとは言えません。
図 5:心理尺度における選択肢の間隔
ただし、心理尺度を順序尺度として扱うと、不都合なことが起きます。それは、分析における制限がかかることです。
例えば「あなたはやる気を持って働けていますか」について、従業員Aさん・Bさん・Cさん3名の平均値を出したいとします。その場合、Aさん・Bさん・Cさんの回答値を足してから、3で割る必要があります。
しかし、順序尺度は回答値同士での四則演算ができません。よって平均値を算出することができず、結果の全体像を把握できないだけでなく、その他の統計分析も実行できなくなってしまうのです。
そこで心理統計などでは、心理尺度は厳密には順序尺度だが、便宜上、間隔尺度とみなすことになっています。これにより、心理尺度の選択肢間の間隔は等しいことになり、平均値を出したり、高度な統計解析を行ったりすることができます[2]。
なお、心理尺度を間隔尺度とみなすための工夫として、「尺度の選択肢を増やす」場合があります。例えば、「当てはまる・どちらともいえない・当てはまらない」と3つの選択肢(3件法)にするよりも、「当てはまる・やや当てはまる・どちらともいえない・あまり当てはまらない・当てはまらない」と5件法にした方が、選択肢の間隔が等しくなるとされています[3]。
ただし、尺度の選択肢を増やしすぎると、選択肢間の弁別性が損なわれてしまいます。例えば、「やる気を持って仕事していますか」という質問を10件法で測定した場合、2と3、8と9の違いが、回答者にも分からなくなってしまうのです。
ある研究によると、3件法・5件法・7件法のうちであれば、5件法が最適であることが示されています[4]。選択肢に肯定的回答(「当てはまる」「そうだ」など)と否定的回答(「当てはまらない」「ちがう」など)の両方を含む心理尺度の場合、ひとまず5件法にしておくと無難でしょう。
3.尺度水準によって使用できる分析手法が異なる
尺度水準によって使用できる分析手法が異なります。ここからは、組織サーベイや社内データの分析でよくあるシチュエーションを例にとりながら、それぞれの尺度水準に対応する統計手法について解説します。
(1)間隔尺度・比率尺度の場合
ある指標について、グループ間での差異を検証する分析
例えば、営業部と製造部で、エンゲージメントの差異を検証したいとします。分析結果を活用するためには、実際の分析を行う前に、仮説を設定することが重要です。ここでは、「営業部のほうが、製造部よりもエンゲージメントが高い」と仮説を立てたとします。
この仮説を検証するため、表3のような尺度を設計しました。これらの質問項目は心理尺度であり、2.で解説したとおり間隔尺度として扱います。この尺度について、営業部と製造部のメンバーに回答してもらいました
表3:エンゲージメントを測定する尺度の例
2グループ間での差異を検証する分析の一つとして、t検定があります[5]。t検定を用いることで、営業部と製造部における、エンゲージメントの平均値の差が、統計学的に意味のあるものなのか(有意な差か)を検証できます。
例えば、図6のようなデータが得られた上で、t検定で有意な結果が得られたとします。すると、「仮説通り、営業部のほうが、製造部よりもエンゲージメントが高い」と言えるのです。
図 6:2グループ間の平均値差を検証するt検定
なお、営業部・製造部・人事部など、3グループ以上の平均値差を検証したい場合は、t検定ではなく分散分析を使用します[6]。
2つの指標間の関連性を検証する分析
分析手法を紹介する前に、2つの指標間の関連性を示す「相関」について説明します。例えば、xとyという2指標があったとき、xが高いとyも高い、xが低いとyも低い場合は、「xとyは正の相関関係にある」といえます。逆に、xが高いとyが低い、xが低いとyが高い場合は、「xとyは負の相関関係にある」といえます[7]。
相関分析という分析手法を用いることで、2指標間の相関の程度を算出することができます。
例えば、営業部における、エンゲージメントと職務満足度の関連性を検証したいとします。そこで、「エンゲージメントが高い従業員は、職務満足度も高い傾向がある」という仮説を立てました。この仮説を検証するため、表4のような尺度を準備しました。エンゲージメントの質問項目は表3と同じです。
表4:エンゲージメントと職務満足度を測定する尺度の例
エンゲージメント、職務満足度ともに間隔尺度です。間隔尺度・比率尺度で測定された、2つの指標間の相関を分析する手法には、ピアソンの積率相関分析があります。積率相関分析を使用することで、2指標間の相関の程度を表す積率相関係数rが算出されます。rの値は-1~1の間を取り、プラスの値であれば正の相関、マイナスの値であれば負の相関となります。
今回の例では、相関分析の結果、エンゲージメントと職務満足度の相関係数rが0.45だったとしましょう。すると、「エンゲージメントと職務満足度は、中程度の正の相関関係である」。つまり、「仮説通り、エンゲージメントが高いと、職務満足度もある程度高い傾向にある」といえます。
(2)名義尺度・順序尺度の場合
ある指標についてグループ間での差異を検証する分析
名義尺度や順序尺度の場合、t検定や分散分析を使用することができません。代わりに、カイ二乗検定が使用できます[8]。
例えば、営業部と製造部における、働く上で重視する要素の差異を検証したいとします。具体的な仮説は、「営業部のほうが製造部よりも昇進・昇格を重視している」と設定しました。そして、「あなたが働く上で最も重要だと思うのを一つだけ選んでください」という質問を、営業部と製造部のメンバー各50名に回答してもらいました。この質問は名義尺度に該当します。
結果が表5です。カイ二乗検定を用いることで、このような表(クロス集計表)のうち、どのセルの人数が、統計学的に有意に多いか・少ないかが分かります。実際に分析してみると、「昇進・昇格」は営業部と製造部で統計学的に有意な差が見られないことがわかりました。よって、「仮説と異なり、昇進・昇格について、営業部と製造部で差は見られない」と結論づけられます[9]。
表5:部門と重視するもののクロス集計表
2つの指標間の関連性を検証する分析
名義尺度ではなく順序尺度であれば、相関分析を行うことで、2つの指標間の関連性を検証できます。
今回は組織サーベイではなく、社内データの分析例で考えてみます。例えば、「入社してから活躍できるような人材を、採用試験で選出できているのか」に関心がある企業があったとします。それを明らかにする方法の一つとして、自社の採用試験における評価と、入社1年後の人事評価の関連性を検証することになりました。
この企業は、自社の採用に自信があったので、仮説として「採用試験の評価が高かった人は、入社1年後の人事評価も高い傾向にある」と設定しました。分析するデータは表6のようなイメージです。
表6:従業員ごとの、採用試験での評価と入社1年後の人事評価
このデータでは、採用評価・人事評価のどちらも、Sが最も良い評価、Cが最も悪い評価というランク形式です。ただし、S・A・B・Cという文字情報のままだと、数量的な分析ができません。本コラムの冒頭でも挙げたとおり、選択肢に数値を割り当てたものが尺度です。まず、これらのランクを1~4の数値情報に変換します。変換後の数値情報を加えたデータが表7です。
今回は「大きい数値ほど、高い評価を表す」というルールで、Sを4、Aを3、Bを2、Cを1に変換しました。逆にSを1~Cを4としても良いのですが、2つの指標で、変換ルールは統一してください。ルールが異なると、結果を解釈しにくくなります。
表7:変換後のデータを加えた、採用試験での評価と入社1年後の人事評価
変換後のデータを用いて、相関分析を行います。順序尺度に対して使用できるのは、ピアソンの積率相関分析ではなく、スピアマンの順位相関分析です。順位相関分析により、順位相関係数ρ(ロー)を算出されます。ρはrと同様に-1~1の値を取り、プラスの値であれば正の相関、マイナスの値であれば負の相関です。
分析の結果、採用試験での評価と、入社1年後の人事評価の間に、統計的に有意な相関関係がなかったとします。つまり、「仮説とは異なり、採用試験での評価が高かったからといって、入社1年後の人事評価の高いとは限らない」といえるのです。採用に自信のあった企業ですが、採用の中身や、入社後の育成方法を見直したほうが良さそうです。
4.分析を見越した尺度選択を
尺度水準は、データの分析において重要な役割を果たしています。しかも、組織サーベイ実施後に尺度水準を変更することは難しい場合もあります。そのため、「知りたいから、とりあえず測ってみよう」と回収を始めてしまうと、取り返しのつかない事態になる可能性があるのです。
サーベイを実施する前に、「どのような分析をしたいのか」「その分析で明らかにしようとしていることは何なのか」などについて考慮しながら、サーベイの質問項目を作成する必要があります[10]。
例えば、t検定や分散分析を用いて、特定の指標のグループ間比較を行いたい場合は、その指標を間隔・比率尺度で測定されていることが前提となります。
脚注
[1] 心理尺度の詳細については、当社コラム「心理尺度の作り方・考え方:組織サーベイの質問項目作成のポイント」をご覧ください。
[2] 間隔尺度は、尺度の回答値同士の足し算・引き算のみ可能です。Aさん・Bさん・Cさん3名分の平均値を出す場合、3名分の回答値を足してから、3で割ります。「3で割る」の「3」はデータの個数(人数)であり、尺度の値そのものではないため問題ありません。
[3] Wu, H., & Leung, S. O. (2017). Can Likert scales be treated as interval scales?: A Simulation study. Journal of Social Service Research, 43(4), 527-532.
[4] Aybek, E. C., & Toraman, C. (2022). How many response categories are sufficient for Likert type scales? An empirical study based on the Item Response Theory. International Journal of Assessment Tools in Education, 9(2), 534-547.
[5] t検定の詳細については、当社コラム「人事のためのデータ分析入門:「統計的に有意」とは何か(セミナーレポート)」をご覧ください。
[6] 分散分析の詳細については、こちらのコラム「一要因分散分析とは何か」をご覧ください。
[7] 相関分析については、当社コラム「人事のためのデータ分析入門:「相関」とは何か(セミナーレポート)」をご覧ください。
[8] カイ二乗検定については、当社コラム「カイ二乗検定とは何か」もご覧ください。
[9] なお、この分析では、「勤務時間」は製造部のほうが営業部よりも統計的有意に多く、「対人関係」は営業部のほうが製造部よりも有意に多いことも分かりました。
[10] 組織サーベイで良い分析を行うための準備について詳細に知りたい方は、当社セミナーレポート「エンゲージメント調査は「準備」が大事:実施前に押さえるべきポイント(セミナーレポート)」もご覧ください。
執筆者
小田切岳士
同志社大学心理学部卒業、京都文教大学大学院臨床心理学研究科博士課程(前期)修了。修士(臨床心理学)。公認心理師、臨床心理士。働く個人を対象にカウンセラーとしてのキャリアをスタートした後、現在は主な対象を企業や組織とし、臨床心理学や産業・組織心理学の知見をベースに経営学の観点を加えた「個人が健康に働き組織が活性化する」ための実践を行っている。特に、改正労働安全衛生法による「ストレスチェック」の集団分析結果に基づく職場環境改善コンサルティングや、職場活性化ワークショップの企画・ファシリテーションなどを多数実施している。