SVM 最大间隔
能把两类点分开的直线有无数条,哪条最好?支持向量机(SVM)的回答很有道理:选那条让两边留白''最宽的——就像在两群点之间修一条尽量宽的马路,分界线走在马路正中央。决定这条路有多宽的,只是离得最近的那几个点,叫支持向量’‘。拖动任意一个点,看分界线和马路怎样跟着变。
黑线是分界线,两条虚线之间的淡蓝``马路''就是间隔。带金圈的是支持向量——只有它们顶着马路边,其余点远离、对结果没有影响。
间隔宽度 —
最宽的马路
分界线放在两类之间留白最宽处,离两边都尽量远,新样本更不容易判错。
只看支持向量
路宽只由最靠边的几个点决定;删掉远处的点,分界线纹丝不动。
泛化更稳
最大间隔等价于一种正则化,往往比``随便分开''的线在新数据上表现更好。