一、感知機算法收斂定理
由于感知機算法通過調整ω和b的值以使所有訓練樣本滿足設定條件,人們可能直觀感覺會出現當ω和b可使某一樣本滿足設定條件,就會使另一個樣本不滿足設定條件的情況,從而使感知機算法出現無限循環,無法終止的情況。
對于上述情況,弗蘭克·羅森布拉特(Frank Rosenblatt)證明了如下結論:只要訓練數據線性可分,感知機算法一定可以終止。該結論所對應的定理為感知機算法收斂定理。
在介紹感知機算法收斂定理前需先定義: 對于某一個Xi,其增廣向量Xiz為:
(1)若yi=+1,則Xiz=(Xi,1)T;
(2)若yi=-1,則Xiz=(Xi,-1)T。
上述定義可將原問題:尋找(ω,b),使得對i=1~N,有:
(1)若yi=+1,則ωTXi+b<0;
(2)若yi=-1,則ωTXi+b>0。
簡化為:尋找W=(ω,b)T,使得對i=1~N,有:WTXiz>0。
感知機算法收斂定理的表述如下:
對于N個增廣向量X1z,X2z,…,XNz,如果存在一個權重向量ωopt,使得對于每一個i=1~N,有: ωoptTXiz>0 則運用上述感知機算法在有限步內可找到一個ω,使得對于所有的i=1~N,有: WTXiz>0。
感知機算法收斂定理中,ωoptTXiz>0等價于樣本線性可分,且ω不一定與ωopt相等(如果存在一個超平面可將樣本分為兩類,則一定存在無數個超平面可將樣本分為兩類,ω和ωopt可以是無數個超平面權重向量中的兩個)。
二、感知機算法收斂定理的證明
假設:||ωopt||=1。
(該假設成立的原因是向量W和aW代表的是同一平面,因此,ωopt可被a加權調整為||ωopt||=1)
定義ω(k)為第k次改變后的權重向量值,則可能出現以下兩種情況:
(1)若ω(k)TXiz>0對所有i=1~N,則所有點已經達到平衡,感知機算法收斂。
(2)若存在i,使得ω(k)TXiz<0,則根據感知機算法:
ω(k+1)=ω(k)+Xiz
將上式兩邊同時減aωopt(aωopt與ωopt代表同一超平面的權重向量),得:
ω(k+1)-aωopt=ω(k)-aωopt+Xiz
上式兩邊取模的平方,可轉化為:
||ω(k+1)-aωopt||2=||ω(k)-aωopt+Xiz||2=||ω(k)-aωopt||2+2ω(k)TXiz-2aωoptTXiz+||Xiz||2
因為ω(k)TXiz<0,所以:
||ω(k+1)-aωopt||2≤||ω(k)-aωopt||2-2aωoptTXiz+||Xiz||2
又因為對任意的i=1~N,ωoptTXiz>0,且||Xiz||2是一個有界的值,所以當a的值足夠大時,可使
||Xiz||2-2aωoptTXiz≤-1
(課程中為||Xiz||2-2aωoptTXiz<-1)。 因此,||ω(k+1)-aωopt||2≤||ω(k)-aωopt||2-1,即W的值每更新一次(W=(ω,b)T),其距離aωopt的距離至少減少一個單位。
綜上,假設W的初值為ω(0),則至多經過||ω(0)-aωopt||2次迭代,ω將收斂于aωopt。
審核編輯:劉清
-
向量機
+關注
關注
0文章
166瀏覽量
20897 -
人工神經網絡
+關注
關注
1文章
120瀏覽量
14652 -
機器學習
+關注
關注
66文章
8435瀏覽量
132887
原文標題:機器學習相關介紹(24)——人工神經網絡(感知機算法)(下)
文章出處:【微信號:行業學習與研究,微信公眾號:行業學習與研究】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論