降維演算法 — 主成分分析 (PCA)

最常用的維度降低技術,用於簡化資料並提取關鍵特徵

概述

主成分分析(Principal Component Analysis,PCA)是最常用的維度降低技術。在機器學習和資料分析中,高維資料往往包含冗餘資訊和雜訊,不僅增加計算成本,還可能導致過擬合。PCA 通過線性變換將原始高維資料投影到一個低維子空間,同時盡可能保留資料的變異性(資訊量)。

原理

PCA 的核心步驟如下:

  1. 標準化:將資料標準化(均值為 0,標準差為 1)
  2. 共變異數矩陣:計算特徵間的共變異數矩陣
  3. 特徵分解:對共變異數矩陣進行特徵值分解,找出特徵值和特徵向量
  4. 選擇主成分:選擇特徵值最大的 k 個特徵向量作為主成分
  5. 投影:將原始資料投影到選擇的主成分上,得到降維後的表示

優點與應用

其他降維方法

本課程範例

相關連結