データ構造による総平均の不確かさの違い
1)すべてのデータが与えられている場合
すべてのデータが1つの母集団を形成している場合の平均と分散をとと定義し、また、これらのデータを個のグループ(ただし各グループにはデータがそれぞれ個ずつあるものとする)に分けた時のそれぞれの母集団の平均をおよび分散をとします。また、個々のデータはグループ分けした場合を考慮しての記号で表記します。したがって、総平均は
となります。また、総分散は次のように定義されます。
一方、個にグループ分けされたデータ群をそれぞれ個の繰り返し観測データだとして、一元配置の分散分析を行い、その級間不偏分散を、また級内不偏分散をとする。ここで、級間変動の分散を、また級内変動の分散をとおけば、
となります。
不偏分散およびは
と定義されますので、上述の総分散の式を次のように書き表すことができます。
したがって、総平均の標準不確かさの2乗は
となります。
一方、グループ分けして一元配置の分散分析より求められる総平均の標準不確かさの2乗は
となります。
総平均の標準不確かさの2乗に関しては、1つの母集団としてデータの処理を行うか、またはグループ分けしたデータを一元配置の分散分析で処理するかの違いにより、下記のような差違が生ずることになるが、その差はもし級間変動に起因する分散が0であれば、総平均の標準不確かさの2乗は両定義で一致し、となります。
上式から差違は、が大きければに近似でき、またがかなり大きい場合は無視し得るほどその値は小さくなり、極限的には総平均の標準不確かさの2乗は偶然誤差に起因する成分のみになります。
BIPMのCCQMデータベースの基幹比較などにおいては、総平均(CCQMではで表示されている)の標準不確かさ(CCQMではで表示されている)は、上述のグループ分けした一元は位置の分散分析によって定義される値
が用いられています。
グループ分けしたデータの一元配置分散分析表(ANOVA)
偏差平方和
自由度
不偏分散(平均平方)
期待値
級間変動
級内変動
総変動
2)グループ分けした各グループの平均のみがわかっている場合
文献などで報告されているデータには個々のデータのすべてが記載されておらず、断片的なデータのみから総平均の標準不確かさを求めたい場合があります。いま、個々のデータはわからないがグループ分けした各グループの平均値だけがわかっている場合について、その標準不確かさを求めてみることにします。
総平均は、各グループの平均の算術平均であるから
となります。また、求めるべき総平均の標準不確かさの2乗は、各グループの平均の標本から得られる不偏分散を平均したものであるから
となります。そこでこの式をさらに変形すると
となり、これはグループ分けして一元配置の分散分析より求められる総平均の標準不確かさの2乗と一致します。
3)グループ分けした各グループの平均の標準不確かさのみがわかっている場合
このような場合には、総平均は、各グループの平均の算術平均であるから
となるので、これをと置き、について不確かさの伝搬即を適用すれば
となります。上式の右辺のは、各グループの標本平均の不偏分散の平均値である、すなわち
であるから、
となり、これは1)で検証したように、グループ間変動の分散が0の場合と合致しますから、グループ間変動の分散が小さいかグループ数がかなり大きい時にはよい近似値となります。