隨著復雜傳感器和大型數據庫技術的發展,城市系統中越來越多的時空數據被記錄和存儲。對這些時空數據的演化模式進行預測學習是城市計算中一個基本但重要的循環,可以更好地支持城市智能管理決策,特別是在交通、環境、安全、公共衛生等領域。由于傳統的統計學習和深度學習方法難以捕捉城市時空數據中的復雜關聯,近年來提出了時空圖神經網絡(STGNN)框架。STGNN通過整合圖神經網絡(GNNs)和各種時間學習方法,使復雜時空依賴關系的提取成為可能。然而,對于不同的預測學習任務,如何在STGNN框架中有效設計空間依賴學習模塊、時間依賴學習模塊和時空依賴融合方法,是一個具有挑戰性的問題。本文對城市計算中用于預測學習的STGNN技術的最新進展進行了全面的綜述。我們首先簡要介紹了時空圖數據的構建方法和stgnn中使用的流行深度學習模型。然后我們從現有文獻中梳理出主要的應用領域和具體的預測學習任務。接著分析了STGNN框架的設計方法以及近年來與一些先進技術的結合;最后總結了現有研究的局限性,并提出了一些潛在的方向。
1. 引言
隨著傳感和數據流處理技術的快速進步,城市系統中越來越多的數據被高效地收集和存儲,為城市計算時代的到來奠定了基礎。城市計算旨在從大數據爆發的不同應用領域(如交通、環境、安全等)了解城市的模式和動態。根據城市計算理論[1],基于這些海量城市數據的預測學習是最重要的循環,其中是智慧城市智能決策、調度和管理的基礎。此外,城市大數據的可預測性也可以為數字孿生、元宇宙[2]等一些新技術的發展提供可能。
大多數城市數據是時空數據,即它們不僅與空間位置相關,而且隨著時間的推移而變化。相關性和異質性是時空數據在城市系統[3]中普遍存在的屬性。相關性是指數據不僅在時間維度上而且在空間維度上具有自相關性的屬性;異質性是指數據在不同的時間或空間范圍內呈現出不同模式的屬性。為了更直觀地說明時空異質性,我們在圖1中給出了一個例子。如圖1(a)所示,給定的城市網絡中存在不同的區域,如住宅區、休閑區和商業區。圖1(b)顯示了不同區域在不同節點的人流統計情況。我們可以發現,雖然所有選取的節點都呈現出明顯的峰值模式,但不同區域節點的人群流量統計存在較大差異。但是,在相同的區域,即使在不同的節點,如節點3和節點4,人群流量的統計也是相似的。由于這些復雜的時空特性,增加了特征工程的難度,一些在傳統數據預測中表現良好的方法,如支持向量回歸(SVR)[4]、隨機森林(RF)[5]、梯度提升決策樹(GBDT)[6]等,難以取得更準確的預測結果。近十年來,由于深度學習技術的快速發展,一些基于卷積神經網絡(CNN)[7]和循環神經網絡(RNN)[8]的混合神經網絡,如ConvLSTM[9]、PredRNN[10]等,逐漸被應用于城市時空數據的預測學習,并獲得了顯著的優勢。然而,這些方法最大的局限性在于無法直接從存在于非歐氏空間的數據中進行學習,如交通網絡數據、傳感器網絡數據、語義網絡數據等。
近年來,以圖為代表的深度學習技術神經網絡(GNN)在非歐氏空間數據的表示學習方面取得了重大突破,為多樣化和復雜的城市數據的預測學習奠定了基礎。考慮到一些典型城市數據的時空特性,如交通網絡流量、環境監測數據等,之前的一些工作將圖神經網絡與各種時間學習網絡相結合,以捕獲空間和時間維度上的動態[3]。這種類型的混合神經網絡架構被統稱為時空圖神經網絡(STGNN)。通過過去五年的發展,時空圖神經網絡已經被廣泛應用于城市計算的預測學習場景,包括交通、環境、安全、公共衛生、能源、經濟等領域。基于谷歌學者搜索引擎,通過關鍵詞進行精準搜索,統計近5年相關論文的發表情況。如圖2所示,我們可以發現,關于STGNN的相關論文呈現逐年遞增的趨勢。2018年相關論文不足20篇,而2022年論文接近140篇。這一發展趨勢表明,與STGNN相關的應用已成為近年來的研究熱點。此外,過去五年的文獻大多集中在預測性學習任務上。
相關調研近年來,關于基于STGNN的預測學習技術在不同領域的應用已經有了一些相關調研。Wang et al.[3]綜述了截至2020年的時空數據挖掘深度學習方法,其中涉及到預測學習中的一些STGNN技術。之前的調查[11]-[13]都調查了應用于交通領域的STGNN技術。其中,[11]分析了多個實際問題,綜述了城市交通系統中預測、檢測和控制問題的相關工作。[12]和[13]重點介紹了STGNN在交通預測任務中的最新技術。工作[14]研究了生成式對抗技術在時空中的應用數據學習,包括一些與時空圖數據相結合的方法。
我們的貢獻與之前的調研相比,我們調查的貢獻總結為:
據我們所知,這是第一個全面的綜述,回顧了最近探索STGNN在城市計算中的預測性學習任務的工作。我們通過充分的文獻,主要從應用和方法的角度回顧了STGNN的進展。
我們首先根據現有文獻對STGNN在城市計算中的主要應用領域和特定預測學習任務進行了分類。此外,我們還整理了一些與之前關于STGNN的工作附帶的公開數據集。
對STGNN的時間依賴學習、空間依賴學習和時空依賴融合方法進行了深入分析。我們還回顧了近年來一些流行的與STGNN結合的先進方法。
我們總結了STGNN為城市計算中的預測性學習任務所分享的一些挑戰,并為解決這些具有挑戰性的問題提出了一些未來方向。
本調研的組織本調研的其余部分組織如下。第二節介紹了時空圖的構建。第三節概述了不同領域的各種預測性學習任務,這些任務可以通過STGNN來解決。第四節介紹了在STGNN框架中廣泛采用的基本深度學習架構。第五節深入分析了STGNN框架的神經架構設計方法和一些可以結合的流行先進技術。第V節討論了現有工作的局限性,并提出了未來的方向。最后,我們在第VI節中總結了這一調查。
時空圖神經網絡
在本節中,我們介紹STGNN的基本神經架構。如圖7所示,用于預測學習的STGNN的基本框架包含三個主要模塊——數據處理模塊(DPM)、時空圖學習模塊(STGLM)和任務感知預測模塊(TPM)。對于城市計算中的預測學習任務,DPM旨在從原始數據中構建時空圖數據,STGLM旨在從復雜社會系統中捕獲隱藏的時空依賴關系,TPM旨在將來自STGLM的時空隱藏表示映射到下游預測任務的空間中。STGLM是STGNN中最關鍵的部分,STGNN通常通過一定的時空融合神經架構將空間學習網絡和時間學習網絡有機結合。對于空間學習網絡,譜圖卷積網絡(spectral GCNs)、空間圖卷積網絡(spatial GCNs)和圖注意力網絡(GATs)都可以作為選擇對象。對于時間學習網絡,循環神經網絡(RNNs)、時間卷積網絡(TCNs)和時間自注意力網絡(tans)都可以作為替代方案。與STGLM相比,TPM是一個相對簡單的神經網絡,因此幾乎所有現有工作都集中在STGLM中神經架構的設計上
?
改進的STGNN時空依賴學習方法
在第四節中,我們介紹了STGNN的基本神經架構,增強了對STGNN中時空學習泛化范式的理解。然而,近年來出現了許多前沿方法來改進時空依賴關系的學習。在本節中,我們總結并分析了最近STGNN模型中一些改進的時空依賴學習方法。
挑戰和未來方向
我們研究了社會系統中預測學習的STGNN的應用,基本神經架構和最近的進展。雖然近年來STGNN模型取得了顯著的性能,但仍有一些具有挑戰性的問題有待解決,這些問題指向了潛在的未來研究方向。我們總結了這些挑戰并提出潛在可行的研究方向如下:
缺乏可解釋性: 到目前為止,絕大多數與stgnn相關的工作都專注于通過復雜的模型設計來提高預測性能。然而,關于模型可解釋性的研究一直相對缺乏,即我們無法清楚地了解哪些時空特征在提高預測性能方面起主導作用。在最近的工作中,STNSCM[241]提出構建因果圖來描述自行車流量預測,并分析時空特征與預測結果之間的因果關系。基于因果關系的時空圖建模可能是增強STGNN模型可解釋性的一個潛在方向。
缺乏校準方法: 不確定性量化對實際工業生產具有重要意義,它反映了對模型預測結果的信任程度。為了提高深度模型的可信度,需要適當的模型校準方法,近年來在圖像識別[242]和圖表示學習[243]中得到了廣泛應用。目前僅有works[244]、[245]對STGNN模型的不確定性進行了研究,對標定方法的研究較少。STGNN模型的校準需要同時考慮空間和時間的特性,因此比以往的相關工作更具挑戰性。
缺乏物理約束: 在之前的大多數工作中,STGNN模型通過深度神經網絡的集成來捕獲復雜的時空依賴關系,同時忽略了對不同應用領域物理約束的考慮,這使得模型在一些專業領域的認準度較低。近年來,雖然一些用于疫情預測的STGNN模型結合了專業微分方程作為物理約束[95]-[99],但這樣的工作仍然缺乏,在其他應用領域還需要改進。
缺乏預訓練技術: 近年來,預訓練技術在時間序列和圖表示學習領域得到了很大發展,但在STGNN相關工作中相對缺乏。在最近的工作中,STEP[246]提出了一種結合掩碼自編碼器(MAE)[247]架構的預訓練模型,以從非常長期的歷史時空圖數據中高效地學習時間模式。在未來,長程空間和長期時間學習的預訓練技術是必要的,這對STGNN模型的可擴展性和可部署性有很大價值。
分布轉移的障礙:?時空數據,如道路網絡上的交通流量,往往從不同的位置和時間段收集,導致訓練集、驗證集和測試集的分布存在顯著差異。這可能會給STGNNs帶來挑戰,因為由于分布偏移,在一個數據集上訓練模型可能在驗證集和測試集上表現不佳,這類似于域適應中的分布偏移問題(在訓練和測試階段之間,輸入和輸出的聯合分布不同)。盡管這一問題很重要,但在時空研究界受到的關注卻較少。雖然一些研究[248]調查擊敗了時間序列中的分布變化,但它們未能編碼位置之間的空間相關性。
探索新的訓練策略:之前的研究主要集中在引入具有復雜層或模塊的新型stgnn,以增強人類移動性分析。然而,另一個有希望的方向是研究新的訓練策略。例如,在交通預測任務中,每個位置都被平等對待,屬于這些位置的數據被聯合送入神經網絡。然而,對每個位置的時空相關性進行建模的復雜性可能會發生顯著變化,需要一種新的訓練策略,如課程學習。課程學習從更簡單的數據開始,在越來越困難的數據上訓練一個機器學習模型,并可能有效地解決這個問題。此外,STGNNs的其他潛在訓練策略包括多任務學習、遷移學習和持續學習。通過探索新的訓練策略,我們可以提高STGNNs的性能和精度,并使它們能夠處理更復雜的任務。
可擴展性問題:設計高效的STGNNs的一個特別具有挑戰性的案例是當傳感器網絡中的位置數量非常大時。例如,在PEMS系統中有超過10000個環路檢測器。在這種情況下,需要開發STGNNs,在保持高預測精度的同時,能夠高效地處理和分析網絡產生的大量時空數據。在這種情況下,更高效的AI解決方案是值得贊賞的,例如通過模型修剪/蒸餾、圖采樣技術,或探索具有高效率的下一代AI模型。也有一些研究探索了無圖方法[249],以在擴展到大規模傳感器網絡時減少計算成本。
結論
本文對城市計算中用于預測學習的時空圖神經網絡(STGNNs)進行了系統的綜述。我們首先從時空圖數據的基本形式和構建方法入手,然后總結城市計算中不同應用領域的STGNNs所涉及的預測學習任務。接下來,我們從基本神經網絡架構的角度出發,介紹構成STGNNs的空間學習網絡和時間學習網絡的基本組成部分,如圖神經網絡(GNNs)、循環神經網絡(RNNs)、時間卷積網絡(TCNs)、自注意力網絡(SANs)、并總結了這些時空神經網絡架構的基本融合形式。為了進一步追蹤STGNNs近年來的前沿進展,我們以空間依賴學習方法、時間依賴學習方法、時空依賴融合方法等可結合的先進技術為主線,總結了相關的典型工作。最后,總結了當前研究面臨的挑戰,并提出了一些潛在的方向。
編輯:黃飛
?
評論
查看更多