1次式回帰分析と重みについて

 

重みを考慮しない通常の回帰分析

 

通常私たちはデータの重みを意識することなく、1次式()回帰分析をExcelなどの統計ソフトで行い、回帰係数を求め、さらに回帰係数の分散およびあるいは共分散を正規方程式の係数行列式の逆行列式の対角項あるいは非対角項に回帰残差()の分散

 

 

を掛けた式

 

             

 

から求めています。ここで分母のは、観測方程式から導かれるパラメータについての連立1次方程式(正規方程式)

 

             

 

あるいは

 

             

 

すなわち

 

             

 

の係数行列式の値

 

             

 

であり、その逆行列式

 

             

 

です。

 

 

座標には不確かさはなく座標にのみ不確かさがある回帰分析

 

 ここまでの式の中にはデータの重みは一切入ってこなかったし、また顕わに考慮する必要も敢えてなかったわけです。しかしながら、1個1個のデータの信頼度(重み)が異なる場合には、上述のような観測方程式の係数行列式(ヤコビアンJacobian、関数行列式とも言います)では正しい回帰係数やその分散、共分散を求めることができず、ヤコビアンの中に重みを入れる必要があります。すなわち、正規方程式の係数行列は

 

             

 

となり、したがって係数行列式やその逆行列式

 

             

             

 

のように書き換える必要がります。このとき、最小二乗法を使って正規方程式を解くのに必要なデータは観測値以外にそのデータ(この場合簡単のために座標には不確かさはなく(すなわち重み=座標にのみによって異なる重みがあると仮定します)の重みを入力しなければなりませんが、その際の重みの定義式は

 

             

 

でなければなりません。ここで、分母のは観測点の母分散あるいはその推定値で代用される値です。ただし、は平均値を求めるのに使ったデータの個数です。また、分子の分散は単なる係数と考えてよく任意の数値を入れることが可能であり、またその次元も分母の母分散の次元に合わせてであると定義してもよく、あるいは単なる係数として無次元であると定義しても構いませんが、正規方程式を解く過程ではいずれかの次元および値にいつも一定に合わせておく必要があります。このように重みを定義すれば、求める回帰係数の分散およびあるいは共分散

 

             

 

と表記することができます。ただし係数行列式

 

             

 

です。

 

 したがって、通常の重みを考慮しない1次式()回帰分析においても、現実には座標の重みを考慮しているのだが、

 

             

 

となるような重みを定義しているため、回帰係数の分散およびあるいは共分散が、たまたま

 

             

             

 

のように、係数行列の逆行列式の対角要素に(この場合は結果的に回帰残差の分散に相当する)を掛けたものとして表記されることになるわけです。

 

 また、座標にのみによって異なる重みがある1次式回帰分析において、重みを、と置いて、

 

             

 

のように定義し直しすれば、求める回帰係数の分散およびあるいは共分散

 

             

             

 

のように、見かけ上、回帰残差の分散項は消失し、係数行列の逆行列式の対角要素そのものになってしまうことに注意する必要があります。これらの式の証明は正規方程式の解から得られる回帰係数の式をについて偏微分した感度係数を係数とする誤差伝搬則の公式

 

             

 

から直接導くことができます。

 

 たとえば、回帰係数は正規方程式の行列表現

 

 

すなわち

 

             

 

を使って

 

             

 

となります。したがって、回帰係数の誤差分散は誤差伝搬則

 

             

 

を使って以下のように求められます。ただし、重み

 

 

と定義します。ここで、は任意に選ばれる既知の比例定数、は観測値座標の番目の観測点の平均値の誤差分散、すなわち

 

             

 

です。よって求める回帰係数の分散および

 

 

 

のようにして回帰係数の分散の式が誤差伝搬則より導かれます。

 

 

両座標共に不確かさのある回帰分析(Deming近似計算法)

 

 両座標共に不確かさのある回帰分析すなわちDeming近似計算法においても、重みが座標だけでなく座標にもある場合に拡張しただけの話だから、残差すなわち回帰係数の近似値と対応する回帰係数の最確値(観測方程式上での計算値)との差)についての正規方程式の係数行列あるいは回帰残差の分散式において上述の座標のみの重みを新たな重み関数、すなわち

 

             

 

で置き換えるだけでよいのですが、の重みの定義の仕方を明確にしておかなければなりません。したがって、さきほどと同様にそれぞれの重みを一般化した式

 

             

 

と定義した場合には、重み関数は結局

 

             

 

となるので、求める回帰係数の分散およびあるいは共分散

 

             

 

となります。ただし係数行列式

 

             

 

です。

 

 したがって、上述の「座標には不確かさはなく座標にのみ不確かさがある回帰分析」の場合と同様に、重みの係数としてたまたま回帰残差の分散そのものを採用した場合には、求める分散式は

 

          

 

となり、と定義した場合の分散式は

 

             

 

となります。ちなみに、Deming近似計算法における正規方程式の行列表示は

 

             

 

です。ただし、観測方程式のテーラー展開の初項

 

 

のように、回帰係数の近似値および観測値を用いて表される値です。