非監督式學習 (Unsupervised Learning)

從未標籤資料中發現隱藏模式

什麼是非監督式學習?

非監督式學習是機器學習中不使用標籤資料進行訓練的學習範式。演算法需要自動發現資料中的規律、模式和結構。由於不需要人類標註標籤,非監督式學習可以處理大規模未標記的資料,在資料探索、異常檢測、資料壓縮等場景中非常有用。

核心任務

聚類(Clustering)

將相似資料點分為同一群組。常用演算法:K-Means(基於距離的硬分群)、DBSCAN(基於密度的分群)、GMM(軟分群)。應用:客戶細分、影像分割、社群網絡分析。

降維(Dimensionality Reduction)

將高維資料映射到低維空間,保留重要結構。常用演算法:PCA(主成分分析)、t-SNE(可視化)、UMAP。應用:資料可視化、雜訊過濾、特徵提取。

關聯規則學習

發現資料中變數之間的關聯關係。典型演算法是 Apriori,用於購物籃分析,發現「買尿布的人也買啤酒」這類規則。

異常檢測

識別與大多數資料顯著不同的異常點。應用:金融欺詐檢測、設備故障預警、網路入侵檢測。

與監督式學習的比較

特性監督式學習非監督式學習
訓練資料需要標籤 (x, y)不需要標籤 x
目標學習輸入到輸出的映射學習資料的內在結構
「老師」需要標籤指導自主探索發現
任務分類、迴歸聚類、降維、關聯規則
評估有明確指標(準確率等)無絕對標準(需內在評估)

應用場景

相關連結