我們攜手英特爾技術團隊,顯著降低了交易系統的延遲并解決了風控系統的瓶頸,尤其是英特爾 oneAPI 統一編程模型讓我們實現了跨架構的靈活性,一套代碼就能夠同時支持 CPU 并行和 GPU 并行兩種場景,讓開發效率得到顯著提升。我們將進一步攜手推進金證極速交易系統的優化,推進產品信息技術應用創新,賦能金融業高質量發展。
— 何萬剛
金證股份雙基石產品總部
機構交易產品線總經理
"概述
伴隨著改革開放金融體制的不斷更新和完善,證券行業呈現出高速發展的勢態,證券市場規模逐步擴大,投資者數量不斷增加,交易量屢創新高,同時,交易品種也不斷地豐富。在這一市場環境下,借助于金融衍生品策略的私募基金受到了普遍歡迎。這種金融衍生品交易策略常常涉及多品種、跨市場的交易,由于策略的復雜性,交易的實現常常依賴于程序化、量化交易等平臺,并且為了捕捉轉瞬即逝的套利機會,對交易速度要求非常高,需要運用先進的軟硬件技術,最大限度地提升交易通道的速度,協助套利策略的實現。
作為證券行業核心交易 IT 供應商,深圳市金證科技股份有限公司(以下簡稱:金證)推出了滿足業務技術發展、監管風控合規要求的先進、開放、穩定的金證極速交易系統。為了進一步提升交易系統的處理速度,金證與英特爾合作,將處理器升級為第四代英特爾 至強 可擴展處理器,并采用英特爾 oneAPI 中的 VTune Profiler 可視化性能分析工具消除性能瓶頸,將委托業務的延遲降低了超過 26%1 。同時,為了保證交易安全、提升風控效率,金證還使用英特爾 oneAPI DPC++ 進行代碼重構,實現風控指標的并行化處理,并應用 ICPX 編譯器調用 oneTBB 以及 AVX512 SIMD 指令集進行加速,取得風控效率提升最高超過 90 倍的效果2 。
金證極速交易系統
在開展策略交易的高端客戶中,以機構投資者為主,其中私募基金占了重要的比重。近年來,伴隨著金融市場的活躍,私募基金迎來了爆發式的增長。中國證券投資基金業協會發布的私募基金管理人登記及產品備案月報顯示,截至 2023 年 7 月末,私募基金管理總規模達到 20.82 萬億元3 ,較 6 月末的 20.77 萬億元4增長 500 億元,增幅為 0.24%5 。
同時,隨著投資工具的豐富,私募基金的投資策略多樣化起來,阿爾法策略、套利策略、相對價值策略、管理期貨策略等借助于金融衍生品的策略受到歡迎,并且在當今市場環境下取得了不錯的收益。要捕捉轉瞬即逝的交易機遇,就需要通過證券交易系統,執行程序化、量化交易。因此,證券交易系統的交易速度在很大程度上影響了套利策略的實現能力。
作為證券行業核心交易 IT 供應商,金證自 2012 年起開始投身于新一代極速交易系統研發中。金證推出的極速交易系統是針對需要做高頻率、極速交易的機構投資者而開發的一套極速交易系統。該系統基于交易與清算分離原則,采用全內存、低延時等核心技術,實現業務微秒級交易處理及交易查詢,提供訂單委托、委托撤單、成交回轉、實時委托查詢、實時成交查詢等高實時性的交易相關功能。該系統能夠支持程序化交易、算法交易、高頻交易等新型、專業化投資交易手段的便利接入。
金證極速交易系統整體基于金證微架構技術平臺開發,采用多活架構與組件化理念設計,可實現業務功能的靈活擴展;系統支持主備、多活等多種部署模式,基于 Raft 一致性算法,可實現主備、容災之間的自動切換,實現業務連續和系統多活。系統在原有技術架構基礎上,新增獨立的新極速模塊,新極速模塊僅完成委托申報和成交回轉功能,減少線程切換,性能實現突破性飛躍。
圖 1. 金證極速交易系統架構
挑戰:優化風控計算,提升交易速度
在證券交易中,性能對于交易速度、客戶體驗都帶來了重要影響,金證希望通過極速交易系統的性能優化,化解以下挑戰:
挑戰 1:如何進一步降低極速交易系統的延遲、加快交易速度
核心交易系統委托處理延遲越低,交易策略功能越強大,對券商系統競爭有極其重要的作用。金證極速交易系統通過新極速模塊的加入,在延遲上已經取得了很大的突破,為了進一步降低延遲,金證不斷探索新的軟硬件創新路徑。
從金證極速交易系統的極速訂單流程來看,其包含了接入、業務、報盤、內存庫等主要進程,這些進程對于 CPU 的性能非常敏感,通過提升 CPU 的性能,將有助于加快上述進程的處理速度,從而降低整體交易延遲。
挑戰 2:如何化解風控系統性能瓶頸,提升執行效率
金證發現,目前風控系統的性能瓶頸集中在風控指標計算方面。由于證券交易涉及到多種環節,因此系統速度的提升依賴于多種因素,其中很重要的一個環節是風控:出于監管要求,對于程序化交易用戶而言,交易指令都需要進行充分的業務檢查。除了驗資、驗券等基礎的風控檢查外,杜絕和防范異常交易行為也是風控的重要目標。
目前業界普遍采用 “軟件數據庫” 的風控方案,風控計算中,每個指標的計算量都很大,且大多采用的是串行計算模式。隨著風控規則指標越來越多、風控的執行效率越來越低,風控環節需要耗費較長的時間,有的指標耗時達到秒級甚至分鐘級別,不能及時、準確地進行風控。
要優化風控指標計算,存在架構約束 — 包含進程模型,數據結構模型以及持久化方式,其挑戰包括:
原風控計算程序會根據定時器的觸發計算風控指標,每次計算前會獲得計算循環次數,例如有多少個賬戶就循環多少次。在計算指標時,會訪問內存數據庫,計算過程和內存訪問都是串行執行的,因此性能較差。 跟原風控的串行相比,通過多線程的 CPU 并行優化有助于提升性能,但是,CPU 并行需要考慮對整個交易系統的影響,如風控服務不能影響交易服務,對于部分有數據依賴的指標,多線程并行計算存在潛在的危險。解決方案:基于英特爾 技術的金證極速交易系統優化方案
為進一步增強性能,金證持續對極速交易系統進行優化,該優化主要從降低極速交易系統的延遲、提升風控指標計算速度這兩方面進行。
優化 1:優化極速交易系統延遲
為降低極速交易系統的延遲,金證進行了軟硬件一體協同優化。在硬件方面,金證將極速交易系統服務器的處理器從第二代英特爾 至強 可擴展處理器升級為第四代英特爾 至強 可擴展處理器,以利用新一代處理器具備的卓越性能。在軟件方面,金證將極速交易系統升級到 3.5 版本,在極速模塊等方面進行了新的優化,隨后,金證還采用英特爾 VTune Profiler 對程序熱點 (hot spots) 進行分析,結合處理器的特性和架構進行深度調優。英特爾 VTune Profiler 用于收集軟件的性能信息,識別和分析調用棧 (call stacks) 中的熱點,以找到系統中存在的性能瓶頸,更大程度地提高性能。
第四代英特爾 至強 可擴展處理器通過創新架構增加了每個時鐘周期的指令,每個插槽多達 60 個核心,支持 8 通道 DDR5 內存,有效提升了內存帶寬與速度,并通過 PCIe 5.0(80 個通道)實現了更高的 PCIe 帶寬提升。第四代英特爾 至強 可擴展處理器提供了出色性能和安全性,可根據用戶的業務需求進行擴 展。借助內置的加速器,用戶可以在 AI、分析、云和微服務、網絡、數據庫、存儲等類型的工作負載中獲得優化的性能。通過與強大的生態系統相結合,第四代英特爾 至強 可擴展處理器能夠幫助用戶構建更加高效、安全的基礎設施。
在性能驗證中,金證極速交易系統采用了英特爾 至強 金牌 6444Y 處理器。該處理器提供了多達 16 個核心、32 個線程,使其將部分核心與交易服務綁定之外,還能夠有充足的核心分配給風控服務,保證性能的釋放。
本次驗證針對普通委托業務和查詢業務,完成了極速訂單性能測試。測試數據如圖 2 所示,對比采用第二代處理器的極速交易系統 3.0,采用新一代處理器的極速交易系統 3.5 通過版本迭代、 硬件升級與軟件調優,將委托業務的延遲降低超過 26%6 。
圖 2. 普通買入委托上行延遲性能比較 (TPS = 5000) 7
優化 2:通過并行計算提升風控計算效率
如上文所述,在原系統的風控計算中,計算過程和內存訪問都是串行執行的,因此性能較差。如果能將串行計算改為并行計算,同時減少對內存數據庫的訪問,那么性能會有望得到顯著提升。為此,金證決定重新設計程序內的執行流和數據流,更好地利用CPU 與 GPU 來實現并行的風控計算,這需要考慮如下限制:
首先,要能兼顧原風控邏輯。即使 GPU 風控計算程序失效,原風控程序仍然能生效; 其次,系統要能夠靈活使用 CPU 或 GPU 來運行風控計算,以滿足客戶的不同需求; 最后,要考慮代碼的可維護性,同一份代碼可兼顧 CPU 和GPU。綜合以上考慮,金證采用英特爾 oneAPI 庫進行新的風控計算開發工作。oneAPI 提供了一個適用于各類計算架構的統一編程模型,應用程序的開發者只需要開發一次代碼,就可以讓代碼在跨平臺的異構系統上執行,底層的硬件架構可以是 CPU、GPU、FPGA。這意味著,使用 oneAPI 開發新的風控計算,可以直接支持 CPU 并行和 GPU 并行兩種場景。
金證采用 oneAPI 庫來對風控計算的執行流和數據流進行優化。原風控服務的執行流和數據流都是簡單的串行,對每個指標計算,首先從內存數據庫讀取數據,然后計算,最后將結果寫入到內存數據庫。而新的風控服務則從以下三個步驟入手進行了優化:
(1)數據讀取新風控進程計算時不再訪問內存數據庫,而是同新極速進程一致,直接訪問共享內存,將共享內存的數據卸載到 GPU 設備上。針對硬件設備沒有足夠存儲空間容納風控數據的情況,系統提供了兩種卸載策略:第一種,如果存儲空間足夠,則將風控數據一次性卸載到 GPU 上計算;第二種,如果存儲空間不夠,則需要將數據分批次卸載到 GPU 上計算。
(2)并行計算使用 Data Parallel C++ (DPC++) 編程模型和 SYCL 模型,編寫并行代碼,通過使用特定的并行構造(如 parallel_for)來實現并行計算。此外,還可以使用向量化指令來利用硬件的 SIMD(單指令多數據)能力,從而在單個指令中處理多個數據項。
(3)結果處理新風控進程將計算的結果,寫到共享內存供新極速進程使用,寫到內存數據庫供原極速進程使用。
圖 3. 金證極速交易系統風控模塊實時觸發風險指標計算
金證極速交易系統 3.5 新風控進程的測試數據如圖 4 所示,使用CPU 并行策略之后,個股集中度指標計算時間最高可降低超過94%,效率提升超過 90 倍8。
圖 4. 個股集中度指標計算用時測試數據(100 客戶各持有1000 只證券)9
收益
在經過優化之后,金證極速交易系統有效提高了極速交易與風控計算的效率,為用戶帶來如下收益:
-
提升了全鏈路的交易速度,在瞬息萬變的證券市場環境中,幫助客戶敏銳抓住轉瞬即逝的市場機遇,推動獲利的最大化。
-
通過英特爾 oneAPI 的統一編程模型直接支持 CPU并行和 GPU 并行兩種場景,提升了方案的靈活性,能夠滿足不同客戶與場景的需求。
-
有效釋放了硬件潛力,特別是當升級到第四代英特爾至強 可擴展處理器之后,能夠將系統性能提升到新的高度。
展望
IDC 發布的《中國證券業 IT 解決方案市場份額,2021:市場永不眠,核心交易系統波瀾再起》報告顯示,2021 年,中國證券業 IT 解決方案市場規模約為 45 億元,中國證券業核心交易系統市場規模約為 11.72 億元10。金證股份作為證券業 IT 解決方案市場主要廠商之一,在中國證券業 IT 解決方案市場份額、中國證券業核心交易系統市場份額中占有率位居前列。
通過采用英特爾 oneAPI 統一編程模型進行優化,并搭載第四代英特爾 至強 可擴展處理器,金證極速交易系統的性能得以“更上一層樓”,能夠有效提升交易通道的速度,協助套利策略的實現。雙方將在未來進行深度合作,探索如何進一步利用第四代英特爾 至強 可擴展處理器搭載的創新技術,釋放硬件潛能,助力打造更加卓越的極速交易系統,幫助用戶獲得更高收益。
附錄:金證極速交易系統 3.5 |
|
處理器 |
英特爾 至強 金牌 6444Y 處理器 |
內存 |
256 GB |
網卡 |
低時延網卡 |
軟件 |
金證極速交易系統 3.5 |
參考資料:
1 金證科技截至 2023 年 7 月的內部測試結果。測試配置 — 基準配置:英特爾 至強 金牌 6250 處理器,128 GB 總內存,RHEL7.5;新配置:英特爾 至強 金牌 6444Y 處理器,256 GB 總內存,RHEL 7.5,通過比較 TPS = 5000 時兩種配置的普通買入委托上行延遲性能中位數結果得出。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。
2 金證科技截至 2023 年 7 月的內部測試結果。測試配置 — 原風控進程配置:英特爾 至強 金牌 6250 處理器,128 GB 總內存,RHEL 7.5;新風控進程配置:英特爾 至強 金牌 6444Y 處理器,256 GB 總內存,RHEL 7.5。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。
3https://www.amac.org.cn/researchstatistics/report/zgsmjjhysjbg/202308/P020230818629745714316.pdf
4https://www.amac.org.cn/researchstatistics/report/zgsmjjhysjbg/202307/P020230727632823396771.pdf
5 通過對比 2023 年 6 月和 7 月的數據計算得出。
6,7 金證科技截至 2023 年 7 月的內部測試結果。測試配置 — 基準配置:英特爾 至強 金牌 6250 處理器,128 GB 總內存,RHEL 7.5;新配置:英特爾 至強 金牌 6444Y 處理器,256 GB 總內存,RHEL 7.5,通過比較 TPS = 5000 時兩種配置的普通買入委托上行延遲性能中位數結果得出。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。
8,9 金證科技截至 2023 年 7 月的內部測試結果。測試配置 — 原風控進程配置:英特爾 至強 金牌 6250 處理器,128 GB 總內存,RHEL 7.5;新風控進程配置:英特爾 至強 金牌 6444Y 處理器,256 GB 總內存,RHEL 7.5。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。
10 數據援引自 IDC 發布《中國證券業 IT 解決方案市場份額,2021:市場永不眠,核心交易系統波瀾再起》。
-
英特爾
+關注
關注
61文章
10082瀏覽量
172897 -
cpu
+關注
關注
68文章
10951瀏覽量
213945
原文標題:英特爾? 軟硬件,讓金證極速交易系統“起飛”
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
讓x86再次偉大!英特爾AMD破天荒聯手,要搞定軟硬件兼容性

世紀大并購!傳高通有意整體收購英特爾,英特爾最新回應

請問OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯網企業版兼容?
英特爾2024產品年鑒:AI與軟硬件的融合發展

英特爾股票分析:英特爾的困境能否結束?

英特爾軟硬件構建模塊如何幫助優化RAG應用

英特爾帕特·基辛格:讓AI無處不在
英特爾即將完成談判 芯片巨頭將達成110億美元的工廠交易
金證極速交易系統搭載最新推出的第五代英特爾至強可擴展處理器

Intel Vision 2024大會: 英特爾發布全新軟硬件平臺,全速助力企業推進AI創新

英特爾宣布代工虧損70億美元
基于英特爾?至強?CPU Max系列的金證K-GPT產品方案推動投行技術創新
英特爾銳炫A系列顯卡為客戶提供了強大的性能和靈活性

評論