一、ROC曲線的含義
ROC曲線的英文名稱為Receiver Operating Characteristic Curve,中文譯為受試者工作特征曲線。
ROC曲線是基于混淆矩陣發(fā)展而來(lái)的系統(tǒng)識(shí)別的性能度量。如表一所示,在混淆矩陣中,若系統(tǒng)的TP增加,則該系統(tǒng)FP增加,即若開(kāi)發(fā)人員欲使機(jī)器學(xué)習(xí)系統(tǒng)將更多的正樣本識(shí)別為正樣本(TP增加),則該系統(tǒng)一定會(huì)將更多的負(fù)樣本識(shí)別為正樣本(FP增加)。
預(yù)測(cè) | |||
實(shí)際 | 正樣本 | 負(fù)樣本 | |
正樣本 | True Positive(TP) | False Negative(FN) | |
負(fù)樣本 | False Positive(FP) | True Negative(TN) |
表一,內(nèi)容來(lái)源:中國(guó)慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
對(duì)于支持向量機(jī)學(xué)習(xí)系統(tǒng),“若系統(tǒng)的TP增加,則該系統(tǒng)FP增加”的結(jié)論可基于支持向量機(jī)的判別公式理解。
支持向量機(jī)的判別公式為: 若∑αiyiK(Xi,X)+b≥0,則y=+1(判別為正樣本); 若∑αiyiK(Xi,X)+b<0,則y=-1(判別為負(fù)樣本)。
若將上述支持向量機(jī)的判別公式的閾值從“0”更改至“-1”為: 若∑αiyiK(Xi,X)+b≥-1,則y=+1(判別為正樣本); 若∑αiyiK(Xi,X)+b<-1,則y=-1(判別為負(fù)樣本)。
則不僅正樣本被判別為正樣本的數(shù)量增加,負(fù)樣本被判別為正樣本的數(shù)量也增加,即此機(jī)器向量機(jī)系統(tǒng)的TP和FP均增加。
因此,雖然支持向量機(jī)可通過(guò)改變判別式閾值增加TP,但此種方法也將導(dǎo)致FP增加,即簡(jiǎn)單改變判別式閾值不能有效提高系統(tǒng)的性能。可有效提高系統(tǒng)性能的方式是設(shè)計(jì)更優(yōu)的算法。
基于此,人們可通過(guò)系統(tǒng)TP與FP之間的關(guān)系,即繪制TP與FP曲線(ROC曲線)判別系統(tǒng)性性能的優(yōu)劣。
二、ROC曲線的繪制
圖一中的四條曲線均為ROC曲線,ROC曲線的橫坐標(biāo)為FP,縱坐標(biāo)為TP。
ROC曲線的繪制步驟如下:
(1)將每個(gè)測(cè)試樣本的值帶入至∑αiyiK(Xi,X)+b中計(jì)算;
(2)將第(1)步所計(jì)算出的值從小到大排序;
(3)將第(2)步完成排序的值作為判別式的閾值,并計(jì)算每個(gè)閾值下的TP和FP的值;
(4)將同一閾值下TP和FP的值作為一個(gè)點(diǎn)的縱坐標(biāo)和橫坐標(biāo),將所有點(diǎn)繪制于坐標(biāo)系中,所有點(diǎn)連接繪制的曲線即為ROC曲線。
圖一,圖片來(lái)源:中國(guó)慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
三、通過(guò)ROC曲線判別系統(tǒng)性能的方式
如圖一所示,坐標(biāo)系中包含四種算法的ROC曲線。根據(jù)圖一ROC曲線,此四種算法中,藍(lán)色ROC曲線所對(duì)應(yīng)的算法最優(yōu),紫色ROC曲線所對(duì)應(yīng)的算法最差,即越貼近左上角的ROC曲線性能越好。
該結(jié)論可通過(guò)以下方式理解:對(duì)于相同的FP,ROC曲線越貼近左上角,所對(duì)應(yīng)的算法的TP越大,即算法性能越好。
根據(jù)ROC曲線可衍生出系統(tǒng)識(shí)別的性能度量包括:AUC(AREA UNDER CURVE)和EER(EQUAL ERROR RATE)
(1)AUC AUC是指ROC曲線下方的面積,該指標(biāo)越大,系統(tǒng)性能越好。
圖片來(lái)源:中國(guó)慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
(2)EER
EER的中文翻譯為等錯(cuò)誤率,等錯(cuò)誤率為坐標(biāo)系中點(diǎn)(0,1)和點(diǎn)(1,0)的連線與ROC曲線交點(diǎn)的橫坐標(biāo),EER越小,系統(tǒng)性能越好。
圖片來(lái)源:中國(guó)慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
審核編輯:劉清
-
向量機(jī)
+關(guān)注
關(guān)注
0文章
166瀏覽量
21180 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8499瀏覽量
134330
原文標(biāo)題:機(jī)器學(xué)習(xí)相關(guān)介紹(19)——支持向量機(jī)(系統(tǒng)識(shí)別的性能度量之ROC曲線)
文章出處:【微信號(hào):行業(yè)學(xué)習(xí)與研究,微信公眾號(hào):行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
四種支持向量機(jī)用于函數(shù)擬合與模式識(shí)別的Matlab示例程序
支持向量機(jī)超聲缺陷識(shí)別法的研究
基于小波變換與支持向量機(jī)的虹膜識(shí)別新算法
采用因子分析和支持向量機(jī)的說(shuō)話人確認(rèn)系統(tǒng)
基于改進(jìn)支持向量機(jī)的貨幣識(shí)別研究
基于支持向量機(jī)的手勢(shì)識(shí)別研究
MATLAB的ROC曲線繪制比較研究
基于支持向量機(jī)的數(shù)字調(diào)制識(shí)別算法
支持向量機(jī)之SVM引導(dǎo)_《OpenCV3編程入門》書本配套源代碼
基于支持向量機(jī)的聯(lián)機(jī)手寫識(shí)別分析

評(píng)論