Monthly Archive: 8 月 2020

[ML Notes] SVM:非线性模型

  前文假设样本是线性可分的。如果在原始样本空间内,不能存在能够正确划分两类样本的超平面,则可以将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。   假设将样本 $\boldsymbol{x}$ 映射到特征空间后,得到的特征向量为 $\phi(\boldsymbol{x})$,则在特征空间中的划分超平面对应的模型为 $$ f(\…
Read more

[ML Notes] SVM:线性模型

1. 基本型   对于给定样本集 $D = \{(\boldsymbol x_1, y_1), (\boldsymbol x_2, y_2), \dots, (\boldsymbol x_m, y_m)\}$,$y_i \in \{-1, +1\}$,SVM 试图在两类样本的正中间找到一个超平面,来将两类样本分开。所谓正中间指的是,样本集中距离超…
Read more

[ML Notes] PCA:最近重构性

  如前文所述,主成分分析通过将样本点投影到一个超平面上来实现降维,可以从最大可分性或最近重构性两个角度寻找理想的超平面。   从最近重构性的角度考虑,假设数据集有 $m$ 个 $n$ 维的样本点 $\boldsymbol x_1, \boldsymbol x_2, \dots, \boldsymbol x_m$,要将它们投影到 $d$ 维的超平面 $D$ …
Read more

[ML Notes] PCA:最大可分性

  主成分分析(Principal Component Analysis,PCA)通过将样本点投影到一个超平面上来实现降维。理想的超平面应当具有: 最大可分性:样本点在这个超平面上的投影能尽可能分开,即最大化投影方差,在投影后保留最多的信息; 最近重构性:样本点到这个超平面的距离足够近,即最小化平方误差,通过投影可以最准确地重构出原始样本点。   首先从最大…
Read more