こころという目には見えない存在を扱う心理学が科学として成立するために客観性と再現性をもたらすものが統計です。得られたデータを統計的に分析を行うことではじめて得られた知見が偶然起こったのではないと証明できるのです。
そして、その手法の1つにt検定と呼ばれる統計手法があります。それではこのt検定とはいったいどのような統計法なのでしょうか。そのやり方を具体例を交えながらわかりやすく解説していきます。
目次
t検定とは
t検定とは、条件の異なる2つの群において、それぞれの群の平均値の間の差が統計的に有意なものなのか、それとも偶然なのかを判定する手法のことです。
この統計を正しく行うためには次のような3つの条件をそろえる必要があります。
【t検定を行うための条件】
- 母集団の正規性:母集団が正規分布に従う
- 等分散性:比較を行う母集団間の分散が等しい
- 観測値の独立性:標本が母集団から無作為に抽出されている
母集団の正規性
母集団とは、その分析の結果が当てはめられる人全員が所属している集団のことを指します。
例えば、アメリカ人と日本人の学力の差を比較しようとする場合、それぞれの国の人全員に学力テストを行うことは人数があまりにも膨大になるため困難でしょう。
そのため、調査に必要な人数を抽出して調査を行うのです。
この時、アメリカ代表・日本代表として選ばれた人たちの集団を標本、そして、それぞれの国の国民を母集団を呼ぶのです。
そして、その母集団は正規分布に従っている必要があります正規分布とは、平均値を中心とし、左右に行くほど低くなっていく逆釣り鐘型をしたカーブを描く分布図です。
そのため、平均的な成績を残せる人があまりに少なかったり、多かったりするような分布図ではt検定を行うことはできません。
等分散性
データのばらつき具合を表す指標のことを分散といいます。この値は分布図の形に大きな影響を与えます。
先ほど、母集団の分布図が正規分布に従う形をとっている必要があると説明しましたが、分散が小さいとデータのばらつきが小さい、つまり、平均的な成績を収める人が大多数を占め、分布図は尖った形を示します。
逆に、分散が大きい場合は、データのばらつきが大きいことを示します。
そのため、データのばらつきが大きいということは平均値の人数が少なくなり、分布図は尖りのないなだらかなカーブとなってしまいます。
そのため、分散があまりにも大きい、もしくはあまりにも小さい場合、それは母集団の正規性を満たすことが出来ず、t検定を適用することが出来なくなってしまうのです。
観測値の独立性
標本を選ぶ際に、日本人は東大の学生を選出し(母集団の分散が小さい)、アメリカからはくじ引きで代表者を選ぶという方法(母集団の分散が大きい)で比較を行うとどうなるでしょうか。
おそらく、学力が高いと見込まれる東大生で構成された日本の方が学力が高いという結果が出るはずです。
しかし、この結果はアメリカ人と日本人に学力の差があると言える根拠とはなり得ず、あくまで調査の対象となる標本は無作為に選ばれる必要があるでしょう。
このような条件を満たして初めてt検定を行うことが出来るのです。
データの種類とt検定
t検定を選択する場合、統計処理を行うデータがどのようなものなのかにも注目しておく必要があります。
そのデータの種類は大きく質的データと量的データの2つに大別でき、それぞれがまた2つに分けれます。
【質的データ】
- 名義尺度:男と女など、単にデータが同じカテゴリーに入るかどうかを表すデータ
- 順序尺度:1位、2位、3位など大小関係を表すだけの性質をもつデータ
【量的データ】
- 間隔尺度:温度やテストの得点など大小関係があり、数値間の間隔が等しいデータのこと
- 比例尺度:間隔尺度の特徴に加え、絶対的な原点を持つデータのこと。身長や体重などが該当する
質的データを分析する統計手法のことをノンパラメトリック検定、量的データを扱う統計手法のことをパラメトリック検定と呼びます。
そして、t検定はパラメトリック検定に該当し、量的データを分析できるのです。
例えば、心理学研究で用いられる質問紙は、「○○の時、あなたはどのような気持ちになりますか」のような質問文に対し、「良くあてはまる」から「全く当てはまらない」のうち最も当てはまるものを選択するという形式を取ります。
このような回答方法をリッカート法と呼び、こうして得られたデータは間隔尺度として扱われるため、t検定を行って統計処理を行うことが出来るのです。
t検定の種類
実はt検定と言っても、厳密には次のような種類があります。
【t検定の種類】
- スチューデントのt検定(対応無し)
- ウェルチのt検定(対応無し)
- 対応のあるt検定
状況に応じて、適切なt検定を選択する必要があるため、それぞれの違いについてしっかりと学びましょう。
スチューデントのt検定
スチューデントのt検定は、対応のないt検定の1種です。
この対応がないというのは、異なる2つの集団から得られたデータを比較することを指しており、例えば、A高校とB高校の学力の差を検討するなどの場合は、対応のないデータということになります。
このt検定では、2つの母集団の分散が等しいと仮定できる時に実施することが出来ます。
ウェルチのt検定
ウェルチのt検定も対応のないデータを対象としたt検定です。
しかし、スチューデントのt検定は2つのデータ群の分散が等しいと仮定できる場合にのみ適用することが出来ます。
そのため、2つのデータ群の母分散が等しいとは限らない時に用いるt検定がウェルチのt検定です。
検定を行う前に2つのデータ群の母分散が等しいと仮定できるケースはそこまで多くないため、心理学研究の多くはウェルチのt検定を実施することが多いでしょう。
対応のあるt検定
スチューデントのt検定及びウェルチのt検定は、アメリカ人と日本人を比較するなどのように、それぞれのデータ群が異なる対象者によって構成されているときに行われるt検定でした。
それ以外にも、同一の被検者に対し、1回目と2回目の結果を比較するのような形で分析を行うことがあります。
このように、同一の被検者から得られる対応したデータに対しては対応のあるt検定を実施します。
t検定のやり方と具体例
それではt検定は実際にどのような流れで行われるのでしょうか。
実際にt検定を採用した、榎本(2020)の研究を追いながら、t検定がどのように行われるのかを見ていきましょう。
この研究では、大学を中退するリスクを測る指標として学生精神的健康調査改訂版のうち8項目の得点の評価が活用できるかを検討するために、大学を中退した89名の学生と進級した89名の学生の得点を比較検討しています。
帰無仮説、対立仮説の設定
t検定を含む、統計的仮説検定では、まず帰無仮説と呼ばれる仮説を設定します。
そして、その帰無仮説が統計的に否定された際に採用される仮説のことを対立仮説と呼ぶのです。
まず、この研究では、大学を中退した学生と大学に残り進級した学生という2群の比較を行っています。
そのため、帰無仮説と対立仮説は次のようになるでしょう。
【帰無仮説】
大学を中退した学生と大学に残り進級した学生の間で、学生精神的健康調査改訂版の得点に差はない(あっても誤差であり、偶然である)
【対立仮説】
大学を中退した学生と大学に残り進級した学生の間で、学生精神健康調査改訂版の得点に差がある
そして統計的仮説検定では、この帰無仮説を棄却することを目的としています。
つまり、自分が主張したい内容を他の人からも支持されるためには、それとは反対となる仮説が誤っていることの根拠を示す必要があるのです。
有意水準の設定
有意水準とは、その起こった出来事がどのくらいの確率で起こるほど珍しいのかを示す確率値であり、帰無仮説を棄却するために設定する基準のことです。
通常、この有意水準は5%もしくは1%に設定されます。
この研究の帰無仮説は「2群間に差がない」というものですが、この帰無仮説を棄却するためにはどうすれば良いでしょうか。
それは、帰無仮説が正しいとするならば、偶然得られたとは考えにくいほど珍しい確率で生じるものであるという結果を示し、帰無仮説を採用しないだけの根拠を示さなければなりません。
このような、あまりにも珍しい確率で生じる、つまり、何らかの意味(有意)があるために生じたのであろうとする基準のことが有意水準であり、一般的には5%や1%が珍しいとされる基準として設定されるのです。
t値の算出
t検定の検定統計量はt値と呼ばれており、それぞれの群の平均値Xと分散S²を求める必要があります。
そして、(X¹-X²)÷(両群の分散の合成値)×(√1/n¹+√1/n²)という数式によって求めることが出来るのです。
ただし、このような数式を用いて手計算によるt値の計算は非常に煩雑となるので、エクセルやSPSSのような統計ソフトに数値を入力すると自動でt値を算出してくれます。
p値の決定
t値を算出した後は、得られたデータがどれほど珍しいのかを表す確率値であるp値を求めます。
t分布表と呼ばれる表に得られたt値と自由度を当てはめることで、該当するp値を選び出すことができます。また、統計ソフトではこの工程も自動で行ってくれます。
なお、自由度というのは、データ数のうち、自由に数値が変動できる範囲を指します。
例えば、4つの数字の合計値が10となるようにしなければならない場合の自由度はいくつになるでしょうか。
1+2+3となっていた場合、合計値が10となるためには4以外の数字はあり得ませんし、-50+40+15というデータがある場合は最後の一つは5となります。
そのため、上記の例では4(データの数)-1で自由度は3となります。
なお、対応のないt検定では、次のような式で自由度を求めることが出来ます。
【対応のないt検定における自由度の算出】
対応のないt検定の自由度=(群①のデータ数+群➁のデータ数)-2
有意差の判定
こうしてp値が確定したら、それを有意水準と照らし合わせることによって、帰無仮説を棄却できるのかを判断することが出来ます。
この研究では、有意水準を1%と設定し、p値がそれ以下の値となったため、中退した学生の方が統計的に有意に学生精神的健康調査改訂版の得点が高くなっているということが示されました。
この得られたデータにより、中退した学生は精神的な健康度が低く、この調査が中退のリスクを予測する指標として利用できる可能性があるという知見がもたらされたのです。
t検定について学べる本
t検定について学べる本をまとめました。初学者の方でも手に取りやすい入門書をまとめてみましたので、気になる本があればぜひ手に取ってみてください。
実験心理学のための統計学[心理学のための統計学2]: t検定と分散分析
こころという目には見えない存在を科学的観点から論じるために、統計学は避けて通れません。
特に、実験条件と何も操作を行わない群の心理的な差を検討するような実験心理学ではt検定は必須でしょう。
ぜひ本書でt検定を深く学びましょう。
もう悩まない!論文が書ける統計
統計学の算式は非常に難解ですが、もっと難しいのは解き明かしたい疑問に対し、どのような統計法を用いれば良いのかを適切に選ぶことです。
本書は、それぞれの研究デザインにより適切な統計法を選べるようフローチャートをつけてあるので、実際に数あるt検定のうちどれを採用すれば良いのかも一目でわかるでしょう。
t検定はあくまで2群の平均値の比較
t検定で対象と出来るのはあくまで2群間の比較のみです。
3群以上の平均値を比較する場合には、t検定を行うことはできず、分散分析というい統計手法を適用しなければなりません。
ぜひ、t検定以外の統計手法についても詳しく学んでいきましょう。
【参考文献】
- 石田潤(2017)『心理学のデータ解析における統計法上の仮定について : t検定の場合を中心に』人文論集52, 33-40
- 井上俊哉(2005)『シリーズ臨床心理学研究と統計学 2. t検定の頑健性 -t検定を使える条件-』東京家政大学附属臨床相談センター紀要 (5), 91-97
- 南風原朝和(2002)『心理統計学の基礎―統合的理解のために (有斐閣アルマ)』有斐閣