機械模型特征選擇是尋找眾多屬性的哪個子集合,能夠的解釋目標變量與各個自變量的關系的過程。
你可以根據多種標準選取有用的特征,例如:
所在領域知識:根據在此領域的經驗,可以選出對目標變量有更大影響的變量。
可視化:正如這名字所示,可視化讓變量間的關系可以被看見,使特征選擇的過程更輕松。
統(tǒng)計參數(shù):我們可以考慮 p 值,信息價值(information values)和其他統(tǒng)計參數(shù)來選擇正確的參數(shù)。
PCA:這種方法有助于在低維空間表現(xiàn)訓練集數(shù)據。這是一種降維技術。