2025年4月23日
真値と誤差:心理測定の考え方
従業員の心理状態を測定することの重要性が増しています。近年注目を集めている組織サーベイは、組織の健康状態を把握し、施策を講じるための方法となっています。
しかし、人の心理を測定することには多くの課題があります。例えば、ある従業員の「仕事への熱意」を10点満点で測定しようとしたとき、その人の本当の熱意は何点でしょうか。今回8点という結果が出たとして、それはその人の本当の熱意を正確に表しているのでしょうか。
こうした問いに答えるために、心理測定における「真値」と「誤差」という概念を理解することが有用です。本コラムでは、エンゲージメントサーベイを例に取りながら、心理測定の基本的な考え方について解説します。
具体的には、測定値と真値の関係、そこに含まれる誤差の種類、そして測定の信頼性や妥当性との関連について説明していきます。
真値とは何か
心理測定における「真値」は、やや抽象的ですが、重要な考え方です。ある人が本質的に持っている真なる特性の強さ・大きさの程度があるはずです。しかしそれを測定するうえで、その程度を完璧に反映して測定できるわけではありません。
真値は、上記の「ある人が本質的に持っている真なる特性の強さ・大きさの程度」を指し、無限回の独立した測定を行った場合の測定値の期待値として定義されます。例えば、ある従業員の「仕事への熱意」を何度も測定した場合、個々の測定値は様々な要因の影響を受けて変動しますが、それらの測定値の平均が収束する値として真値を定義します。この定義によって、真値は観測可能な測定値との関係で操作的に定義され、統計的な処理が可能になります。
しかし、真値を直接測定することは不可能です。その理由はたくさんありますが、一つは、「仕事への熱意」という心理的な特性は、実体として目に見えるものではないからです。私たちは質問紙などを使って間接的に測定するしかありません。その人の内面に存在する抽象的な概念である「仕事への熱意」は、その人自身でさえ、自分の本当の熱意の強さを正確に把握することは難しいものです。
心理測定における真値とは、理論的・概念的には存在するものの、実際には直接観察することができない値です。これは心理測定という営みに本質的に備わっている特徴であり、どのような工夫をしても完全には克服できない性質です。
人の心理は直接目に見えないものである以上、私たちは常に間接的な方法で測定せざるを得ず、そこには必然的に誤差が含まれることになります。真値は、あくまでも理論的な概念として存在するものなのです。
誤差とは何か
心理測定における誤差は、測定値と真値との関係を理解する上で重要な概念です。ある人の測定値が、その人の本当の特性の強さ(真値)からどれだけずれているか、それが誤差です。心理測定におけるこの誤差は特に測定誤差と呼ばれ、測定値から真値を引いた差として定義できます[1]。
誤差は測定の不完全さによって生じる、真の値からのずれの大きさを表しています。この誤差には、「系統誤差」と「偶然誤差」という2種類があります[2]。
系統誤差は、測定値が真値から一定の方向にずれる傾向のことです。これは測定の方法や状況に起因する、一貫した誤差です。系統誤差の特徴は、同じような条件で測定を行うと、同じような方向(例えば、常に真値より高めになる、あるいは常に低めになる)にずれが生じる点です。
測定方法や測定状況に内在する要因によって引き起こされるため、その要因が改善されない限り、同じような誤差が生じることになります。
組織サーベイでは、「社会的望ましさ」による誤差が系統誤差の例です。多くの人は、会社が実施するサーベイにおいて、自分の本当の気持ちをそのまま回答することに躊躇を感じます。何となく会社に対してネガティブな回答をすることを避けたい、という気持ちが働きます。その結果、実際の気持ち(真値)よりも、ポジティブな方向に寄せた回答(測定値)をしがちです。そして、測定値が真値より一貫して高めになります。
他方で、偶然誤差は、測定のたびに、プラスの方向にもマイナスの方向にも生じる可能性がある、ランダムな誤差です。偶然誤差の特徴は、その発生が予測できないという点です。同じ人に同じ方法で測定を行っても、測定のたびに異なる大きさや方向の誤差が生じる可能性があります。測定時の様々な偶発的な要因によって引き起こされます。
例えば、組織サーベイでは、同じ従業員に対して同じ質問をしても、その時々の状況によって回答は変動します。朝から気分が良く、仕事も順調に進んでいる日であれば、普段よりも高めの評価をつけるかもしれません。逆に、通勤時に電車が遅延して気分が悪く、締切に追われてストレスを感じている日であれば、普段よりも低めの評価をつけるかもしれません。
回答時の環境も影響を与えるでしょう。静かな環境でじっくりと考えながら回答できる場合と、周囲が騒がしく気が散る環境で急いで回答する場合とでは、同じ質問に対する回答が異なる可能性があります。質問の解釈や理解の仕方も、その時々で微妙に異なるかもしれません。これらは偶然誤差の源となります。
測定値は真値と誤差から構成される
心理測定の考え方として、特に古典的テスト理論においては、「測定値=真値+誤差」という構成で捉えます[3]。この式は、単純に見えますが、心理測定の本質を理解する上で重要な意味を持っています。
私たちが観察できるのは測定値であり、測定値は、直接観察することのできない真値に、やはり直接観察することのできない誤差が加わったものとして理解できる、という考え方です。これは、心理測定という営みの特徴を表現しています。
組織サーベイを例に考えてみましょう。ある従業員の「仕事への熱意」の測定値が7点だったとします。この7点という測定値は、その従業員の本当の仕事への熱意(真値)に、様々な誤差が加わった結果として得られた値です。
例えば、真値が6点で、+1点の誤差(社会的望ましさによる系統誤差と、その日の気分による偶然誤差の合計)が生じた結果かもしれません。あるいは、真値が8点で、-1点の誤差が生じた結果かもしれません。
この式から導かれる示唆は、私たちが得る測定値には必ず誤差が含まれているという点です。心理測定において、完璧な測定は存在しません。誤差がまったくない状態で測定値を得ることは、理論的にも実践的にも不可能なのです。
これは、心理測定の制約であり、どのような工夫をしても完全には克服できない性質です。心理的特性は直接観察できないものである以上、私たちは何らかの指標を通じて間接的に測定するしかありません。そして、そのような間接的な測定には誤差が含まれることになります。
測定の信頼性との関係
信頼性は、心理測定において考慮に入れるべき概念の一つです。信頼性とは、測定値がどの程度安定しているか、あるいは一貫しているかを表します[4]。
安定性の観点からは、同じ人に対して同じ条件で複数回測定を行った場合に、どの程度似た結果が得られるかを示し、一貫性の観点からは、同じ特性を測定する複数の質問項目間で、どの程度似た回答パターンが得られるかを示します。信頼性は測定の精度や正確さを評価する上で、基本となります。
真値と誤差の観点から見ると、信頼性は誤差、特に偶然誤差の大きさと関係しています[5]。偶然誤差が小さい場合、同じ人に対する複数回の測定値は、その人の真値の周りでわずかにしか変動しません。要するに、測定値は真値に近い値で安定します。これは、測定が高い精度で行われていることを意味しており、信頼性が高い状態と言えます。
一方、偶然誤差が大きい場合、測定値は真値から大きく離れて変動することになります。ある時は真値よりもかなり高い値が出たり、別の時は真値よりもかなり低い値が出たりと、測定値が大きく変動します。このような場合、測定の信頼性は低いと判断されます。
組織サーベイにおいて、ある従業員に対して、1週間おきに3回、全く同じ質問でサーベイを実施したとします。その従業員の仕事への熱意の真値が7点だとして、1回目は7.2点、2回目は6.8点、3回目は7.1点という結果が得られました。
これらの測定値は真値である7点の周りでわずかにしか変動していません。このような場合、偶然誤差は小さく、測定の信頼性は高いと判断できます。
対して、同じ従業員に対する3回の測定で、1回目が5点、2回目が8点、3回目が9点というように大きく変動する結果が得られたとします。これらの測定値は大きくばらついており、その人の本当の熱意の強さ(真値)を推測することが難しい状態です。この場合、偶然誤差が大きく、測定の信頼性は低いと判断されます。
測定の妥当性との関係
妥当性とは、測定が本当に測定したいと考えている特性を測定できているかどうかを表します。測定値が測定対象の本質をどの程度正確に捉えているかを意味する指標です。
例えば「仕事への熱意」を測定したいと考えているとき、実際の測定値がその人の本当の「仕事への熱意」を正確に反映しているかどうかを指します。
表面的には測定できているように見えても、実際には「仕事への熱意」とは異なる特性を測定している可能性があります。この場合、その測定は妥当性が低いと判断されます。測定の妥当性が低いということは、測定したいものと実際に測定しているものとの間にずれが生じているということです。
真値と誤差の文脈に限定すれば、妥当性は偶然誤差に加えて、系統誤差とも関係しています[6]。測定したい特性と実際に測定している特性との間にずれがある場合、それは一種の系統誤差として捉えることができます。
このずれは、測定方法や測定指標の選択の問題に起因する、構造的なずれです。そして、このずれが大きいほど、測定の妥当性は低くなります。そのずれが大きければ大きいほど、測定値は本当に測定したかった特性の真の強さから離れていってしまうからです。
ある会社が従業員の「仕事への熱意」を測定するつもりで、「残業時間の長さ」を指標として使用したとします。一見すると、熱意のある従業員は長時間働く傾向があるように思えるかもしれません。
しかし、この測定方法には問題があります。残業時間が長い理由は様々で、必ずしも仕事への熱意の高さを反映しているとは限りません。仕事の効率が悪いために残業が必要になっている場合もありますし、上司からの強制的な指示で残業している場合もあります。あるいは、仕事量が過剰に多いために残業せざるを得ない状況かもしれません。残業時間という指標は、「仕事への熱意」という特性を正確に捉えているとは言えないのです。
こうした場合、測定値と真の「仕事への熱意」との間には系統誤差が存在することになります。言い換えれば、測定したいと考えている特性(仕事への熱意)と、実際に測定している特性(残業時間の長さ)との間には、本質的なずれが生じています[7]。
このずれは、個々の測定値の誤差というよりも、測定方法自体に内在する構造的な問題です。そのため、このような測定を繰り返し行っても、真の「仕事への熱意」を正確に把握することはできません。
脚注
[1] 誤差に関して、標準誤差と呼ばれる誤差も統計学ではよく登場しますが、心理測定において、標本誤差と測定誤差は異なります。標本誤差は、有限の標本から母集団の特性を推測する際に生じる不確実性を指し、標本サイズを大きくすることで減少させることができます。一方、測定誤差は個々の測定過程に内在する不確実性を表し、測定方法の改善や複数回の測定で部分的に対処できます。
組織サーベイでは、この2種類の誤差が複合的に存在します。例えば、従業員全体のエンゲージメントを推定する際には、回答者集団の代表性に関する標本誤差と、個々の回答に含まれる測定誤差の両方を考慮する必要があります。
[2] 系統誤差と偶然誤差の区別は概念的には明確ですが、実際の測定場面ではその境界は必ずしも明確ではない点に注意が必要です。例えば、社会的望ましさによる影響は、回答者の特性や測定状況によって表れ方が異なる可能性があり、純粋な系統誤差として扱うことは難しい場合もあります。また、一見偶然誤差に見える変動が、実は何らかの系統的な要因に起因している可能性もあります。
[3] 古典的テスト理論においては、誤差に関する前提があります;①誤差の期待値は0である。②真値と誤差は無相関である。③異なる測定機会における誤差は互いに独立である。④ある測定機会の誤差は、他のいかなる変数とも無相関である。
[4] 信頼性と妥当性について詳しくは当社コラムをご覧ください。
[5] 測定の信頼性は、分散の観点から定式化できます。測定値の分散σ²(X)は、真値の分散σ²(T)と誤差の分散σ²(E)の和として表現されます。すなわち「σ²(X)=σ²(T)+σ²(E)」ということです。信頼性係数はρ=σ²(T)/σ²(X)として定義され、これは全分散のうち真値の分散が占める割合を表します。測定値の分散のうち、どれだけが真の得点の個人差を反映しているかを意味します。
[6] 妥当性は、測定の質を評価する上で基本的な概念の一つです。妥当性の中には内容的妥当性、基準関連妥当性、構成概念妥当性などが含まれます。
内容的妥当性は、測定内容が測定したい特性を適切に代表しているかを示し、専門家による判断などに基づいて評価されます。基準関連妥当性は、他の確立された指標との関連の強さによって評価されます。構成概念妥当性は、測定値が理論的な構成概念をどの程度適切に反映しているかを示します。
測定値に含まれる系統誤差は、測定対象の構成概念からの体系的なずれを生み出し、妥当性を低下させる原因となります。例えば、測定方法に起因する系統誤差は、内容的妥当性を損なう可能性があり、また、測定対象とは異なる構成概念の影響による系統誤差は、構成概念妥当性を脅かします。もちろん、偶然誤差については、これを含みランダムに値がばらつきやすい測定値は概念を適切に反映しにくいため、妥当性は必然的に損なわれます。
[7] この問題について、より詳しくは当社コラムで解説しています。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。