2014年3月4日起,“11日超日債“成為了我國首例違約公募債,從此債券違約的案例陸續出現。因此建立債券違約預警模型對穩定經濟的健康發展起著重要的作用,而選擇有效的檢測指標則可以提高模型的學習效率和準確率,從而加快檢測速度。11日超日債(圖片來源于網絡)
近日,本源量子團隊開發出量子mRMR算法(QmRMR),加速分析識別金融風控領域企業債務違約行為。在篩選預警模型中有效指標時,團隊利用量子近似優化算法(QAOA)對全局最優指標的選取進行平方級加速,改進了最大相關最小冗余(mRMR)算法,這一方法大大減少了債務監測中的冗余分析指標,將成功降低預測債券違約模型中的過擬合風險。
01mRMR算法減少債務信息“冗余”數據降維在金融數據分析中相當重要,當數據維度過高時,高維數據的各個維度間極易存在較強的相關性,容易產生大量冗余信息。這種情況下,我們無法直觀理解數據,在后續的數據挖掘、模型分析時也面臨困難。冗余的信息不僅使得模型難以收斂,內存消耗大,甚至會出現過擬合的現象,直接干擾后續分析的結論。
降維的方法多種多樣,經典的降維方法有主成分分析(PCA),奇異值分解(SVD)等方法。上面提到的兩種常見算法的優點是通用性強,效果明顯,而缺點則是線性組合的現存數據與歷史數據無法并存,僅通過現存數據無法全面分析,且不具有可解釋性。特別是在金融領域中,各種指標間的相關性較大,例如財務報表中形容償債能力的指標就有流動比,速動比,長期負債比等。
而最大相關最小冗余(mRMR)算法和以上列舉的算法不同,它可以直接選取和剔除指標。mRMR方法能夠在樣本指標與目標指標(債券是否違約的標簽)之間的交互信息達到最大的同時,使得選取指標內部的平均交互信息較少。而在選取指標之前,是無法預先知道能夠選取的指標個數,所以需要對mRMR模型進行改進,使得我們可以自由控制指標選取個數的同時還能夠將問題轉化為二次二值無約束的優化問題,也就是QUBO問題。并且我們在數學的原理證明了該改進的正確性。
02利用量子近似優化算法(QAOA)加速挖掘全局最優指標目前,原有的mRMR算法選取指標所使用的增量搜索方法往往只能得到一個局部最優結果。我們通過對算法的改進可以在無約束的情況下自由選取指標個數,在后續使用支持向量機進行債券違約效果檢驗時,發現改進后的QmRMR算法選取的指標能夠以高概率遍歷得出一樣的全局最優指標選取方案。在研究中,我們使用上市公司公開的財務報表作為分析指標,來預測該公司發行的債券是否違約。我們基于償債能力、盈利能力、現金流量、資本結構四個維度,利用改進后的量子mRMR方法,在財務報表中選取出20個樣本指標(將mRMR稍作改進,就可以自由控制選取指標的個數)。之后我們使用傳統的支持向量機來分類判斷后續的指標選取是否有效,以及債券是否違約。在控制不同的指標個數選取的情況下,分類的結果如下圖(其中各項指標都是衡量分類器的標準,越接近1說明該分類器的性能越好)。
在不同樣本指標個數下的分類結果:越接近1說明該分類器的性能越好上圖是在不同的指標選取個數的情況下,五個衡量分類器的指標的變換情況。綜合可以看出,我們在用量子mRMR選取8個最優指標時分類的效果達到最優。以該8個指標的選取過程為例,我們在實驗中與使用經典方法選取指標得到的遍歷結果進行對比,可以發現QAOA算法能夠以較高的概率得到和經典一致的結果。下圖則展示了在迭代到80層的情況下,運行量子線路得到最優選取方法的概率。可以看出,隨著迭代的次數的增加,該概率總體呈現上升的趨勢,并且最終可以在每次運行量子線路時都能夠以超過0.3的概率得到最優解。
隨著算法迭代次數變多,單次運行線路得到最優選取方法的概率在選取8個指標時達到較好的預測結果可以說明該8個指標和目標分類結果最大相關,且能夠從不同的維度來衡量是否會出現債券違約。我們在56次的實驗對比中發現,QAOA算法均能夠以較高的概率得到和經典遍歷一樣的結果,這證明了QAOA的穩定性。相比于經典計算,本源量子團隊在此次研究中開發出的QmRMR算法能夠為全局優化指標選取帶來二次加速,這對未來處理違約檢測等場景中的大規模金融數據有著重要的意義。
-
算法
+關注
關注
23文章
4617瀏覽量
93030 -
監測
+關注
關注
2文章
3619瀏覽量
44574 -
量子
+關注
關注
0文章
480瀏覽量
25510
發布評論請先 登錄
相關推薦
評論