t 分布
分布(t-distribution)はStudentの
分布とも呼ばれ、推測統計学では非常に重要な分布の一つです。いま、互いに独立な2つの変数
と
があって、
は標準正規分布
型分布をし、
は自由度
の
分布をするものとします。このとき、次式で与えられる変数
と
の結合変数
は標本平均について自由度
の
分布をすることがStudentというペンネームをもつ統計学者(W. S. Gosset)によって見い出されました。
この自由度
の
分布の確率密度関数
は次式で与えられます。
あるいは
ここで、
は次式で与えられるベータ関数です。
また、
や
などはガンマ関数と呼ばれ、次のような性質があります。
1)
2)
3)
4)
5)
分布は
分布と同じように自由度
によってその形は変わるが、
を中心にして左右対称であり、自由度
で標準正規分布
に一致します。
分布において、
がある
の値より大きくなる確率
は理論的に次式から求められ、この値を表にしたものが
分布です。
ここで、
は
中の条件下での確率です。
分布の期待値
と分散
は
となります。ただし、
では分散は無限大に発散してしまうため存在しません。
また、
の特殊な場合には、
分布は
となりますが、これはコーシー分布(Cauchy distribution)
あるいはローレンツ曲線(Lorenzian curve)と呼ばれる関数となります。コーシー分布を一般化した記号は
で表され、その密度関数
は
![]()
となり、下図のような形状の曲線になります。
コーシー分布には期待値
と分散
は存在しないことと、コーシー分布には中心極限定理が適用できないことには注意する必要があります。
互いに独立に標準正規分布
に従う確率変数
の比
はコーシー分布に従います。すなわち
となります。また、
が
の一様分布に従うとき、
はコーシ分布になります。すなわち
となります。
正規母集団
から大きさ
のランダム標本を抽出し、その平均
について規準化変数
を
のように表せば、この規準化変数
は標準正規分布
型分布をします。
一方、
は自由度
の
分布をするから、
分布に従うこの
の式を上述の標準正規分布
に従う
の式と比較すると、
の式は
の式の母標準偏差
を標本の不偏標準偏差
で置き換えたものになっています。したがって、この
の式には正規母集団
の母数である母平均
のみしか含まないので、
分布は母平均
を推定するのに適切で重要な分布です。
これに対し、
分布は
の式から明らかなように、正規母集団
の母数である母分散
のみしか含まないので、母分散
を推定するのに適切で重要な分布として知られています。
個の標本からなる
分布を使って母平均
を確率
の信頼限界で区間推定すると
のようになるので、母平均
の確率
での信頼区間は
のような両側検定によって求めることができます。
分布の特徴から次のような重要な定理が導かれます。すなわち、分散の等しい2つの正規母集団
と
からそれぞれ独立に大きさ
の任意標本を抽出し、それぞれの標本平均を
、不偏分散を
とすれば
は自由度
の
分布をするという定理です。この定理の根幹をなす部分は2つの母分散が等しいという「等分散の条件」ですが、現実の正規母集団においては等分散の条件が満たされる場合が多いこととたとえ多少満たされなくても上式が
分布からはずれることが少ないという理由から、2つの正規母集団の比較検定や推定に利用されること多い重要な定理です。
ところで、母分散
既知のときの母平均
に対する検定や推定を行う場合の統計量は
であり、母分散
未知のときの母平均
に対する検定や推定を行う場合の統計量は
でした。このことは形式的に
とみることができます。すなわち、
を
に置き換え、標準正規分布を
分布に置き換えることがスチューデントの見つけた重要な統計理論なのです。この
分布を利用すれば標本の統計量(標本平均
と不偏分散
)のみから母平均
を推定できるという重要な結論が得られます。
上述の論理を裏返すと、
分布の自由度
が十分大きく(
)なれば、この
分布は正規分布によって十分に近似されます。
また、自由度
の
分布に従う変数
の2乗は自由度
の
分布に従います。すなわち
という関係式が成立します。