聚類分析方法包括:PCA 主成分分析、Loading 分析、LDA 線性判別分析。
主成分分析法(PCA)是將原始數(shù)據(jù)(十個(gè)傳感器的輸出)通過(guò)算法降維成兩個(gè)新的指標(biāo)主成分1(PC1)和主成分2(PC2)(二者沒(méi)有信息交叉,且指標(biāo)無(wú)量綱),在圖形上顯示分別為X 軸和Y 軸,性質(zhì)相似的樣品,經(jīng)過(guò)降維轉(zhuǎn)換后,距離上會(huì)很靠近,因此,可以用輸出的圖形來(lái)判斷組間的不同和比較組內(nèi)樣品的差異。通過(guò)PCA 可以使所有樣品差異Z大化,用X 軸和Y 軸來(lái)表示的圖形位置是新變量PC1 和PC2 的數(shù)值,值越高意味著,包含主要原始信息的量越大,如果兩個(gè)變量的總方差貢獻(xiàn)率不低于95%,基本上可以包含樣品的所有原始信息。
在文本窗口里,包含了模型文件和樣品以及樣品間的區(qū)分度,數(shù)值越接近于1,區(qū)分得越顯著。
該圖顯示的是棗花的Loading 分析圖,從圖中可以看出7 號(hào)傳感器W1W 對(duì)di一主成分貢獻(xiàn)率大,同理6 號(hào)傳感器W1S 對(duì)第二主成分貢獻(xiàn)率大。Loading 分析的算法與PCA 的算法相同,有很好的相關(guān)性,不同的是,PCA 是對(duì)樣品的分析,Loading 分析是對(duì)傳感器的分析,可以分析出傳感器區(qū)分樣品的能力。
分析結(jié)果時(shí),具有以下規(guī)則:
(1)傳感器在Loading 分析中所在的方向與PCA 方向一致。在同一軸方向的傳感器可以用PCA 思維來(lái)分析。數(shù)值在軸上較大的傳感器對(duì)于區(qū)分是有作用的。
(2)位于圖中央(0,0)附近的傳感器在PCA 結(jié)構(gòu)中對(duì)于樣品的區(qū)分作用較小。在當(dāng)前的模板文件中,Loading分析有利于識(shí)別對(duì)區(qū)分有用的傳感器。只要他們對(duì)區(qū)分過(guò)程有負(fù)面影響,單一傳感器就可以識(shí)別區(qū)分從而關(guān)閉分析。
LDA 線性判別分析是區(qū)分-應(yīng)用-分析的di一個(gè)步驟。LDA 計(jì)算出識(shí)別結(jié)果并且類似于PCA-----顯示培訓(xùn)數(shù)據(jù)設(shè)置的二維圖。在PCA 和LDA 的區(qū)別是:LDA 算法利用模型每組的信息,兼顧了組內(nèi)分布和它們間的距離。因此,LDA 收集了所有傳感器的信息盡力提高組間的差異,而PCA 不考慮組間的差異,盡可能使每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行Z大化地區(qū)分。
重要性:DFA/LDA 與PCA 相比,需要更多的數(shù)據(jù)。我們推薦數(shù)據(jù)點(diǎn)至少是所使用傳感器數(shù)量的6 倍(如10 傳感器就應(yīng)該對(duì)應(yīng)于至少60 個(gè)獨(dú)立數(shù)據(jù)點(diǎn))。
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來(lái)源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來(lái)源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。