Hello,我是你們?nèi)艘娙藧刍ㄒ娀ㄩ_的小花。又和大家見面了,今天我們來聊一聊多視圖學(xué)習(xí)利器------CCA。
一 典型相關(guān)分析的基本思想
當(dāng)我們研究兩個(gè)變量x和y之間的相關(guān)關(guān)系的時(shí)候,相關(guān)系數(shù)(相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)是按積差方法計(jì)算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過兩個(gè)離差相乘來反映兩變量之間相關(guān)程度;著重研究線性的單相關(guān)系數(shù))是最常用的變量:其中Sxx為標(biāo)準(zhǔn)差。
那我們?nèi)绾窝芯績山M變量之間的相關(guān)關(guān)系呢?比如(X1,X2,X3)與(y1,y2)我們是不應(yīng)該計(jì)算如下矩陣:,這樣把每一個(gè)變量之間都求出來了。但是我們這樣計(jì)算的時(shí)候是不是有點(diǎn)繁瑣,而且總是會忽略問題的本質(zhì)?,F(xiàn)在我們?nèi)绻苷页鰞山M變量的各自的某個(gè)線性組合,討論線性組合之間的相關(guān)關(guān)系,那是不是更為簡潔?
現(xiàn)在我們利用主成分分析的思想,可以把多個(gè)變量與多個(gè)變量之間的相關(guān)轉(zhuǎn)化成兩個(gè)變量之間的相關(guān)。例如原來(X1,X2,X3)與(y1,y2)可以分別組合成兩個(gè)變量U,V.我們假設(shè):
另外。我們找出有最大可能的相關(guān)系數(shù)(a1,a2,a3)與(b1,b2),這就是典型相關(guān)系數(shù)。也就是使。
典型相關(guān)分析最樸素的思想:首先分別在每組變量中找出第一對典型變量,使其具有最大相關(guān)性,然后在每組變量中找出第二對典型變量,使其分別與本組內(nèi)的第一對典型變量不相關(guān),第二對本身具有次大的相關(guān)性。如此下去,直到進(jìn)行到R步,兩組變量的相關(guān)系被提取完為止,可以得到R組變量。
二 典型相關(guān)分析的數(shù)學(xué)表達(dá)
2,1 思考
現(xiàn)在考慮兩組變量的向量<