PCA(Principal Component Analysis),即主成分分析,是一類常用的數(shù)據(jù)降維(dimensionality reduction)方法,是一種分析、發(fā)現(xiàn)多變量數(shù)據(jù)中的內(nèi)在聯(lián)系,并將原始變量轉(zhuǎn)換為一組新的變量,即主成分。
PCA模塊可以用來(lái)獲取主要的變量,并減少計(jì)算量、去除噪聲、提高計(jì)算效率、使計(jì)算結(jié)果更加具有可解釋性。財(cái)務(wù)管理軟件中可用來(lái)降維技術(shù)對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行處理和研究,如提取時(shí)間序列、確定特征變量等。
PCA運(yùn)算步驟:
1、準(zhǔn)備原始數(shù)據(jù),比如X矩陣,X中每一列描述一個(gè)特征;
2、令 X的每一列均值為0,也就是每一個(gè)特征減去自身均值;
3、求解令所有樣本協(xié)方差矩陣的特征值和特征向量;
4、以特征值排序,取前k個(gè)特征值對(duì)應(yīng)的特征向量構(gòu)成U矩陣;
5、用U矩陣對(duì)X矩陣進(jìn)行投影,即得到降維后的數(shù)據(jù)矩陣。
PCA是一種常用的財(cái)務(wù)數(shù)據(jù)處理方法,可以有效的提取數(shù)據(jù)中主要的特征,減少計(jì)算量,提高計(jì)算效率,進(jìn)而發(fā)現(xiàn)原始數(shù)據(jù)的內(nèi)在聯(lián)系,可應(yīng)用于財(cái)務(wù)會(huì)計(jì)等各方面,拓展知識(shí):PCA常和K-means聯(lián)合使用,以達(dá)到進(jìn)一步挖掘數(shù)據(jù)隱藏的信息,更加準(zhǔn)確的結(jié)果。