*注意)この「べじぱみゅの学習メモ」のカテゴリー記事は、ワタクシ自身がこれまでに勉強したいろいろな項目について、テキストにあんまり書いてない内容などを勝手に妄想したメモです。
ワタクシ自身の備忘録のために書いており「初学者にわかりやすく説明する」というものではございません。
導入なしに唐突に話が始まり、おそらく意味不明な文章かもしれません。
しかし、せっかく考えたことなので、記事の内容がもし誰か1人でもお役に立てれば幸いです。

別方向の「拡張」


このブログではたびたび(私が個人的に好きなので)「
交互最小二乗法」を取り上げています。今更だけど、あの単純な?最小二乗法で複雑なデータ解析ができるってなかなか神秘だと思うわけですよ。

以前の記事でその「拡張」として「偏差の 2 乗以外を最小化」という話をしましたが、今回は別の「拡張」の話です。もともとの最少化の対象である「偏差の二乗和」に適当な関数を加えます。
 
 正則化

こういう具合です。R はデータを分解する行列 C, S の成分で決まる
ある関数で、その前にくっついている「λ」は「調整パラメータ」です。λは基本的に正の値で、後ろの R の「影響度合い」を表すものです。

この両者の合計を最小化することを考えます。そんなことして何の意味があるのかはおいおい説明いたします。 本題にどっぷり入る前に、そもそもの MCR ループの「意味」を考えてみます。
 
MCRループ式

この式です。これは「偏差の 2 乗和」を各パラメータで微分することで登場したもので、もちろんそれだけで存在意義があるのですが、この「操作そのもの」の意味を考えてみます。

「デジタル化」した分布

このまま一般的にいきなり論じるのは複雑なので、まず極めて単純な場合を考えてみます。仮に分布 C が「完全デジタル化」されているとします。つまりそれぞれの k 個の成分について、「ある領域ですべて値が 1」「それ以外の領域では 0」となっており、さらに互いの成分で「非ゼロのかぶり」がない、とします。
 
このとき「スペクトル」を算出する MCR ループの式 の意味はかなり明瞭になります。以下それを示してみます。 まず

デジタルCのCTC

となります。成分ごとに「かぶり」が無いので非対角成分はゼロとなり、対角成分はNkとなります。Nkはそれぞれの成分における非ゼロの要素の数です。これを用いて

デジタルCの3積

 となり、よって最終的には 

デジタルCのST結果

こうなります。これは K 行 I 列の行列と I 行 J 列の行列の積であり結果は K 行 J 列となりますが、その一般項(kj 成分)を考えると
 
デジタルCのST成分

となります。これは
生データ dij を、分布係数の重みづけで平均をとったもの、という意味になります。つまりスペクトルを求める MCR ループは、それぞれの成分 k が非ゼロの領域における「スペクトル」の平均値を算出することに対応します。

同様に、仮に「スペクトル」のほうが「完全デジタル化」されているときも、MCR ループはそれぞれの成分 k が非ゼロの「波長」における「強度」の平均値を算出することに相当します。

2成分ならなんとか

さすがにこれは単純化しすぎなので、次に一般的な場合を考えます。といっても複雑すぎるのでこれ以降 K=2 とします。(K=2 から一般の K への拡張はそれほどのハードルではありません。面倒なので書きませんけど)
 
K=2の場合

 このように、2 成分の「係数分布」「スペクトル」をそれぞれベクトルで表記します。このとき MCR ループは、「分布」Cについては位置 i ごとに、「スペクトル」S については波長 j ごとに書けて
 
K=2の場合のALSループ

こうなります。右辺最後のカッコにあるシグマの意味は明瞭で「データの重みづけ平均値」です。元データ dij を、スペクトルあるいは分布で重みづけして和をとったものです。

あとはその前にくっついている 2x2 の行列についてですが、たとえば C のループについて見ると、もし s1 と s2 が「直交」している(つまり非ゼロでかぶる波長がない)と非対角成分である内積がゼロとなり、ci1 は sj1 による重みづけのみ、ci2 は sj2 による重みづけのみで決まります。それぞれのスペクトルに関する重みづけをした後にその「大きさ」で割ったもの、と解釈できます。 

しかし一般に「化合物スペクトル」は複数の成分に同じ波長の成分が含まれるので「内積」はゼロでなく、その
内積の割合だけ、お互いの寄与を「交換」していることになります。K が 2 ではなく一般の値の場合も、式こそ複雑になりますが「異なる成分の内積が非ゼロの場合寄与を適度に交換する」という状況は同じです。

このノリで、次回から拡張の話をしていきます。


はっぴぃ理系らいふ、いぇい
ヽ(・ε・)人(・ε・)ノ キミモナカマニナロウゼ
   

【文責 べじぱみゅ