色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于多視圖協作學習的人崗匹配研究論文提要

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-11-05 09:32 ? 次閱讀

近日,第29屆國際計算機學會信息與知識管理大會(CIKM 2020)在線上召開,CIKM是CCF推薦的B類國際學術會議,是信息檢索和數據挖掘領域頂級學術會議之一。

本屆CIKM會議共收到920篇論文投稿,其中錄用論文193篇,錄取率約為21%。 而在眾多論文當中,一篇BOSS直聘和中國人民大學聯合發表的基于多視圖協作學習的人崗匹配研究吸引了我們的注意力。

論文題目:《Learning to Match Jobs with Resumes from Sparse Interaction Data using Multi-View Co-Teaching Network》。 論文鏈接:https://arxiv.org/abs/2009.13299 本論文針對求職者和招聘方的交互行為數據稀疏且帶有噪聲這一場景,基于多視圖協作學習,提出了一個新型匹配模型。 新型模型相比以往模型,增加了基于關系的匹配模塊,且將兩個匹配模塊融合進行協作訓練,優化了該場景下的人崗匹配效率。 CIKM大會評審反饋,該論文提出的多視圖協作學習網絡能夠解決人崗匹配系統的負樣本噪聲問題。同時,融合文本匹配模塊和關系匹配模塊進行的聯合表示學習有助于解決雙邊交互行為數據稀疏問題,突破了以往匹配模型需要大量有效樣本數據的限定條件。而該思路對于互聯網求職招聘場景以外領域的推薦系統研究也有一定指導意義。

1

背景介紹

近年來,隨著以BOSS直聘為代表的移動互聯網求職招聘平臺的興起,人崗匹配任務越來越受到學術界的關注。 針對該問題,常見的方法是將其轉化為一個有監督的文本匹配任務來解決,當標記樣本足夠充分時,此類方法往往能取得較好的效果。 然而,在真實的互聯網求職招聘平臺上,求職者和招聘方的交互行為數據往往是稀疏且帶有噪聲的,這嚴重影響著匹配算法的性能。 因此,本文提出了一種基于稀疏交互數據的多視圖協作學習模型,并將其應用于人崗匹配任務,取得了較好的效果。 該方法的思路如下: 我們設計了一種全新的匹配模型,包含基于文本的匹配模塊和基于關系的匹配模塊兩部分,這兩部分能捕獲不同視角下的語義信息,并相互補充。 此外,為了解決交互行為數據稀疏的問題,我們設計了兩種特定訓練策略來更好地融合這兩個匹配模塊: 一方面,兩個模塊共享學習參數和表示,可以增強每個模塊初始的表示; 另一方面,我們采用了一種協作學習的機制來減少噪聲數據對訓練的影響。核心思想是讓這兩個模塊通過選擇更置信的訓練實例來互相指導訓練。 這兩種策略可以更好地用于表示的增強和數據的增強。 與單純基于文本的匹配模型相比,我們所提出的方法能夠從有限甚至稀疏的交互數據中更好地學習數據的表示,在帶有噪聲的訓練數據上該方法也更具魯棒性。

2

問題定義

對于人崗匹配任務,給定職位文本數據集合

和簡歷文本數據集合

,以及匹配結果集合

。 其中,每一個職位j或簡歷r均由多句描述職位或簡歷的文本構成,代表簡歷和職位是否匹配。根據上述定義,我們的任務是學習一個預測函數

來預測未知的職位簡歷對的匹配結果。

3

方法描述

多視圖協作學習的人崗匹配模型圖 為了解決在線求職招聘場景下由于交互數據稀疏和采樣負例而帶來的噪聲問題,我們提出了一種基于多視圖協作學習的人崗匹配模型。

基于文本的匹配模塊近年來,基于預訓練語言模型的方法在各種自然語言處理任務上均取得了不錯的效果。 鑒于此,這里采用BERT編碼簡歷和職位的每一個句子表示,然后使用Transformer編碼表示整篇文檔表示。

j和r分別代表職位和簡歷文檔,和分別代表第層的輸入簡歷和職位的向量。

最后將職位表示和簡歷表示拼接后再接一個Sigmoid層輸出得到的作為候選簡歷和職位的匹配分。

基于關系的匹配模塊前文所述的匹配模塊主要關注文本語義上的匹配,但由于顯式交互數據是相對稀疏的,因此挖掘潛在的隱式關聯將有助于抽取出更多額外信息作為補充。 為此我們設計了基于關系的匹配模塊,該模塊包含構造職位-簡歷關系圖和學習職位簡歷的表示兩部分。構造職位-簡歷關系圖首先定義職位-簡歷關系圖

。其中,

代表職位和簡歷兩類節點,

代表關系集合。 由于有職位和簡歷兩類節點,所以共包含三種連接類型,即職位-職位,職位-簡歷和簡歷-簡歷。同時,采用如下兩種數據信號來刻畫節點間的連接關系:第一類是相同領域標簽的職位或者簡歷之間構建連接關系;第二類是根據職位描述或簡歷文本中抽取出的關鍵詞,職位或者簡歷之間出現了同樣的關鍵詞構建連接關系。職位簡歷的表示學習基于職位-簡歷關系圖,可以進一步捕捉圖上潛在的語義信息來學習節點上的特征表示(即職位和簡歷)。 圖神經網絡近年來已經成為學習圖節點特征表示的最流行的方法,由于在職位-簡歷關系圖中存在大量不同類別的關系連接,為了更好刻畫在這類帶有豐富關系的圖結構,這里采用關系圖卷積網絡(Relational Graph Convolutional Network)來刻畫不同關系和節點的表示。 第l層的節點學習到的表示的公式如下:

代表了第l層節點的表示,?代表節點的鄰接節點集合。由于每一種關系t對應一個特定的參數矩陣,所以能夠基于關系的語義信息學習到節點的表示。 通過在圖上學習的節點表示,最終得到簡歷和職位的表示,與之前的方法類似,通過拼接簡歷表示和職位表示計算最終匹配分。

多視圖的協作學習網絡接下來將介紹所設計的多視圖協作學習網絡,以及如何將基于文本和基于關系的匹配模塊集成到統一的訓練方法中。 首先,網絡會共享學習到的信息和參數,以增強每個模塊的原始表示;其次,針對如何減少訓練數據對噪聲的影響,我們借鑒了機器學習中協同學習的思想,通過選擇更可靠的訓練實例來讓這兩個組件相互幫助。接下來,介紹這兩種策略的細節。表示增強由于在匹配過程中包含文本表示和關系表示兩類表示方法,為了在初始表示學習的過程中互相增強,在初始學習文本模塊的表示時會拼接關系圖上節點的表示。

類似地,為了增強圖關系上節點的表示,會采用文本模塊學習到的表示作為關系圖訓練時的初始表示。

利用協作學習的數據增強這里的基本假設是,真實樣本通常在不同的模型視角下會得到相似的預測結果,而噪聲數據則會在不同視角下表現得不穩定。 在協作學習網絡中,文本匹配模塊和關系匹配模塊可以視為兩個對等的learner。用于訓練一個learner的樣本首先由另一個learner進行檢查,并且僅將標記為高置信度的實例保留在訓練過程中。 由于這兩個learner從不同視角對數據建模,學習的策略有所不同,因此他們可以互相幫助選擇高置信度的訓練樣本,從而提升模型效果。 具體訓練方法如下圖所示:

提出的co-teaching的算法流程圖 這里具體提出了兩種實現策略。(1)實例的重加權給定一個模型,其對等模型目的是在不同視角下,增加高置信度樣本的權重并降低不可靠樣本的權重。例如,對于模型B,假設在訓練過程中的一個batch中有K個實例。

讓其對等模型A為這個K個實例分配權重。其核心想法是根據樣本真實標簽信息與A的預測之間的一致程度對實例賦予權重:

這里的權重越高代表了該實例越可信。同時將這些權重結果傳遞給模型B并讓其進行模型參數的更新。(2)實例的篩選過濾除了對不同樣本重新加權外,還可以直接篩除相對較差的實例。直觀地,如果實例對應的損失較小,則它離決策邊界很遠,更有可能是可靠的樣本。可以通過以下公式建模:

實例重加權和篩選過濾方法都旨在為模型學習選擇更可靠的樣本。他們用不同的方法達到這個目的。 實例重新加權是一種相對“軟”的方法,其所有實例均保留,只不過不同實例具有不同的重要程度。而實例篩選過濾是一種相對“硬”的方法,會直接丟棄一些樣本。還有一種思路是通過在對樣本重新加權之前對樣本進行過濾來將這兩種方法結合起來。

4

實驗結果

數據集介紹本文基于在線招聘平臺BOSS直聘的數據集進行相關實驗。該數據集包括三個領域類別,便于測試我們的模型在不同領域下的穩定性。 表1總結了處理后的數據統計信息,可以看到:(1)所有數據集都很稀疏,無論是達成匹配或拒絕;(2)不同領域下的數據稀疏程度有所不同。例如,技術類規模較大但較稀疏,而銷售相對稠密;(3)對于每個領域類別,發生顯示拒絕(即不匹配)的數量要比達成匹配的數量少得多。

表1:數據集的統計信息

實驗結果對比方法1、DSSM [1]提出的深度結構語義匹配模型。 2、BPJFNN [2]提出的基于循環神經網絡的匹配模型。 3、PJFNN [3]提出的基于卷積神經網絡的匹配模型。 4、APJFNN [2]提出的基于層級注意力機制的匹配模型。 5、DGMN [4]提出的基于全局句子粒度交互的匹配模型。 6、JRMPM [5]提出的引入歷史交互作為記憶模塊的匹配模型。 7、UBD [6]用來解決噪聲數據帶來的影響,采用分歧的思想對分類器雙方產生不同結果的數據進行參數更新。 8、NFM [7]使用神經因子分解機來學習高階交互,使用文本和ID特征作為輸入。

表2:主實驗的結果 根據表2中的實驗結果,結論如下:1、首先,NFM很難在我們的任務上取得良好的效果。原因是該任務比傳統推薦場景數據更加稀疏;同時,DSSM在大多數情況下表現不佳,因為它無法捕獲文本信息中的時序信息;BPJFNN、PJFNN、APJFNN、JRMPM和DGMN之間的性能差異很小,并且針對不同指標或不同領域會有微小差別;此外,UBD是唯一訓練時解決噪聲問題的baseline,與其他baseline方法相比,該方法的效果有顯著提升,這也側面證實了該任務下處理噪聲數據的必要性。2、我們提出的模型在不同數據集的所有指標上均獲得了最佳性能。與其他方法相比,模型中的協作學習機制能夠識別更多信息量豐富且更可靠的樣本來學習參數,也更容易削弱噪聲數據帶來的影響,因此優于其他baseline方法。3、對比篩選過濾和重加權這兩種策略,我們發現后者在大多數情況下更優異。可能因為重新加權策略采用了“軟”降噪的方法,該方法在處理噪聲數據時會更魯棒。 除了上述主實驗結果分析外,我們也同時分析了不同模塊組件對最終效果的影響。 如表3所示,這里T代表文本匹配模塊、R代表關系匹配模塊、C代表協作學習網絡。 結果表明,所有這三個組件對提高人崗匹配的性能都有正向作用。尤其是文本匹配模塊和協作學習網絡給模型帶來的提升較大。 此外,一個有趣的觀察是,簡單地融合多視圖的數據可能不會導致良好的性能(即TR

表3:消融實驗結果

5

總結

本文提出了一種基于多視圖協同教學網絡,該網絡能夠在交互行為數據稀疏且帶有噪聲這一場景下進行學習,以進行人崗匹配。我們考慮融合文本匹配模塊和關系匹配模塊進行的聯合表示學習,該方法能夠結合各自模塊的優勢來更好的學習匹配表示。同時我們設計了兩種特定訓練策略來更好地融合這兩個匹配模塊,即表示增強和數據增強。一方面,兩個模塊共享學習參數和表示,可以增強每個模塊初始的表示; 另一方面,我們采用了一種協作學習的機制來減少噪聲數據對訓練的影響。大量實驗表明,與以往的方法對比,該方法能夠從數據稀疏且帶有噪聲的交互數據中獲得更好的匹配效果。在本文中,我們聚焦于宏觀的交互行為,例如接受或拒絕面試邀請這樣的行為。然而一些微觀交互也會對匹配產生一定的影響,例如單擊或停留時間。未來我還將考慮將此類信息融入進來以設計一個更加全面的匹配模型。此外,我們還將考慮將我們的方法應用于更多的領域類別,研究不同類別之間的領域自適應問題。

參考文獻

[1]Po-Sen Huang, Xiaodong He, Jianfeng Gao, Li Deng, Alex Acero, and Larry Heck. 2013. Learning deep structured semantic models for web search using clickthrough data. In Proceedings of the 22nd ACM international conference on Conference on information and knowledge management, pages 2333–2338. ACM.

[2]Chuan Qin, Hengshu Zhu, Tong Xu, Chen Zhu, Liang Jiang, Enhong Chen, and Hui Xiong. 2018. Enhancing person-job fit for talent recruitment: An ability-aware neural network approach. In In Proceedings of the 41st International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR-2018) , Ann Arbor, Michigan, USA. [3]Chen Zhu, Hengshu Zhu, Hui Xiong, Chao Ma, Fang Xie, Pengliang Ding, and Pan Li. 2018. Person-job fit: Adapting the right talent for the right job with joint representation learning. ACM Transactions on Management Information Systems ACM TMIS. [4]Shuqing Bian, Wayne Xin Zhao, Yang Song, Tao Zhang, and Ji-Rong Wen. 2019. Domain Adaptation for Person-Job Fit with Transferable Deep Global Match Network. In EMNLP-IJCNLP 2019. 4809–4819. [5]Rui Yan, Ran Le, Yang Song, Tao Zhang, Xiangliang Zhang, and Dongyan Zhao. 2019. Interview Choice Reveals Your Preference on the Market: To Improve Job-Resume Matching through Profiling Memories. In KDD 2019. 914–922. [6]Eran Malach and Shai Shalev-Shwartz. 2017. Decoupling "when to update" from "how to update". In NeurIPS 2017. 960–970. [7]XiangnanHe and Tat-SengChua. 2017.Neural Factorization Machines for Sparse Predictive Analytics. In SIGIR 2017. 355–364.

責任編輯:xj

原文標題:【CIKM 2020】基于多視圖協作學習的人崗匹配研究

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 噪聲
    +關注

    關注

    13

    文章

    1122

    瀏覽量

    47437
  • 數據
    +關注

    關注

    8

    文章

    7067

    瀏覽量

    89132
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121248
  • 協作學習系統

    關注

    0

    文章

    2

    瀏覽量

    1610

原文標題:【CIKM 2020】基于多視圖協作學習的人崗匹配研究

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    OpenHarmony程序分析框架論文入選ICSE 2025

    《ArkAnalyzer:The Static Analysis Framework for OpenHarmony》)被接收。這是OpenHarmony相關研究首次在ICSE發表論文,這篇文章的接收
    的頭像 發表于 01-02 13:41 ?77次閱讀
    OpenHarmony程序分析框架<b class='flag-5'>論文</b>入選ICSE 2025

    MVTRF:視圖特征預測SSD故障

    多任務隨機森林( MVTRF )方案。MVTRF基于從SSD的長期和短期監測數據中提取的視圖特征預測SSD故障。特別地,采用多任務學習,通過同一模型同時預測什么類型的故障以及何時發生。本文還提取了MVTRF的關鍵決策來分析為什
    的頭像 發表于 12-30 11:04 ?150次閱讀
    MVTRF:<b class='flag-5'>多</b><b class='flag-5'>視圖</b>特征預測SSD故障

    人員睡檢測 AI 算法攝像機

    在現代化的生產流程、管理體系以及監控環境里,在崗人員的狀態監測成為關鍵環節。特別是那些需要持續值守的崗位,像是保安室、中控室以及工廠生產線等處,人員睡問題猶如一顆不定時炸彈,可能導致生產效率滑坡
    的頭像 發表于 12-20 10:27 ?140次閱讀
    人員睡<b class='flag-5'>崗</b>檢測 AI 算法攝像機

    楊玉: 磁性元件行業如何尋找新出路?

    磁性元件領域專家聚首杭州學術年會,楊玉教授直擊磁性元件行業痛點:高頻化“攔路虎”下,我們如何破局,引領未來新風尚? 在近日于杭州舉辦的2024第11屆功率變換器與磁性元件聯合學術年會上,磁性元件
    的頭像 發表于 12-05 11:09 ?125次閱讀
    楊玉<b class='flag-5'>崗</b>: 磁性元件行業如何尋找新出路?

    協作機器人TM25S:高效人機協作改變傳統作業方式

    歐姆龍協作機器人改變了傳統工廠的工作方式,不再需要安全隔離柵,專為品種、小批量生產而設計,速度可與工人相媲美,實現高效人機協作。 ? 兼顧工人的安全和工廠的生產效率 TM25S協作
    的頭像 發表于 12-03 10:33 ?253次閱讀
    <b class='flag-5'>協作</b>機器人TM25S:高效人機<b class='flag-5'>協作</b>改變傳統作業方式

    經典圖神經網絡(GNNs)的基準分析研究

    本文簡要介紹了經典圖神經網絡(GNNs)的基準分析研究,發表在 NeurIPS 2024。 文章回顧了經典 GNNs 模型在節點分類任務上的表現,結果發現過去 SOTA 圖學習模型報告的性能優越
    的頭像 發表于 11-27 09:16 ?194次閱讀
    經典圖神經網絡(GNNs)的基準分析<b class='flag-5'>研究</b>

    建筑物邊緣感知和邊緣融合的視圖立體三維重建方法

    航空建筑深度估計是三維數字城市重建中的一項重要任務,基于深度學習視圖立體(MVS)方法在該領域取得了較好的成果。目前的主要方法通過修改MVS 框架實現建筑物的深度估計,缺乏對建筑物內在結構的考慮,易導致精度不足等問題。
    的頭像 發表于 11-07 10:16 ?236次閱讀
    建筑物邊緣感知和邊緣融合的<b class='flag-5'>多</b><b class='flag-5'>視圖</b>立體三維重建方法

    使用語義線索增強局部特征匹配

    視覺匹配是關鍵計算機視覺任務中的關鍵步驟,包括攝像機定位、圖像配準和運動結構。目前最有效的匹配關鍵點的技術包括使用經過學習的稀疏或密集匹配器,這需要成對的圖像。這些神經網絡對兩幅圖像的
    的頭像 發表于 10-28 09:57 ?264次閱讀
    使用語義線索增強局部特征<b class='flag-5'>匹配</b>

    【免費領取】AI人工智能學習資料(學習路線圖+100余講課程+虛擬仿真平臺體驗+項目源碼+AI論文

    想要深入學習AI人工智能嗎?現在機會來了!我們為初學者們準備了一份全面的資料包,包括學習路線、100余講視頻課程、AI在線實驗平合體驗、項目源碼、AI論文等,所有資料全部免費領取。01完整學習
    的頭像 發表于 09-27 15:50 ?382次閱讀
    【免費領取】AI人工智能<b class='flag-5'>學習</b>資料(<b class='flag-5'>學習</b>路線圖+100余講課程+虛擬仿真平臺體驗+項目源碼+AI<b class='flag-5'>論文</b>)

    PCB阻抗匹配過孔的多個因素你知道哪些?

    在高速PCB設計中,阻抗匹配是至關重要的。過孔作為連接不同層信號的關鍵元素,也需要進行阻抗匹配以確保信號的完整性。捷邦小編今天就與大家聊聊PCB阻抗匹配過孔~ 過孔是PCB上用于連接
    的頭像 發表于 07-04 17:39 ?1434次閱讀

    電路的阻抗如何匹配

    電路的阻抗匹配是指調整電路組件(包括源和負載)之間的阻抗,使電源能盡可能地傳遞能量,而不是產生反射。當源、傳輸線以及負載的阻抗都相等時,可以達到最佳的阻抗匹配,從而最大限度地減少信號的反射和損耗
    的頭像 發表于 06-28 08:29 ?2318次閱讀
    電路的阻抗如何<b class='flag-5'>匹配</b>

    微軟將在6月為Outlook日歷新增分屏視圖,提升工作效率

    在月度視圖中點擊選擇多個日歷后,用戶便可開啟分屏視圖功能,此時屏幕將會自動分成兩半,同時並列顯示個日曆。微軟承諾此功能將于 6 月份首先運用于Windows及Web版本的Outlook。
    的頭像 發表于 05-18 14:32 ?678次閱讀

    蘋果發布300億參數MM1模態大模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的模態大模型研究成果——MM1。這款具有高達300億參數的模態模型系列,由密集模型和混合專家(MoE)變體組
    的頭像 發表于 03-19 11:19 ?914次閱讀

    Coupa推出創新產品改善供應鏈購買體驗和協作

    領先的人工智能驅動平臺 Coupa 宣布推出創新產品,旨在優化整個供應鏈的購買體驗和協作效率。該公司長期致力于利用先進技術幫助企業做出更明智的采購、供應鏈和財務決策,以推動業務增長,并更好地匹配供需關系。
    的頭像 發表于 03-06 09:38 ?806次閱讀

    機總線通信時應該怎么設置阻抗匹配電阻?

    常見的總線通信協議,都需要在信號傳輸線終端設置匹配電阻,比如MODBUS是120歐的電阻,但是在機通信時,終端電阻應該怎么接?比如說現在總線接成星形,菊花形或者其他什么形狀,終端電阻在這些接法應該是怎樣的?比如說菊花形只在首尾接,星形都要接是這樣嗎?有什么理論依據?
    發表于 01-16 00:04
    主站蜘蛛池模板: 亚洲国产精品第一影院在线观看| 99re8久久热在线视频| 成人毛片在线播放| 日美欧韩一区二去三区| 国产白浆视频在线播放| 无限资源在线观看高清| 精品久久久久久久久免费影院| 在线视频 亚洲| 热久久国产欧美一区二区精品| 国产成人精品在视频| 亚洲中字幕永久在线观看| 尿孔 调教 扩张| 国产女合集小岁9三部| 中文字幕亚洲无线码在线| 青青涩射射| 含羞草完整视频在线播放免费 | 国产无线乱码一区二三区| 月夜直播免费观看全集| 青春草久久| 精品人伦一区二区三区潘金莲| 99久久久精品| 亚洲bt区| 强开乳罩摸双乳吃奶视频| 国产亚洲精品A久久777777| 99国产精品欲AV蜜桃臀麻豆| 羞羞答答dc视频| 欧美亚洲另类图片| 精品无码人妻一区二区免费AV| XXX国产麻豆HD真实乱| 亚洲色欲国产免费视频| 日本不卡一二三| 浪荡受自我调教纯肉BL| 国产麻豆AV伦| wwwwxxxx欧美| 中文字幕亚洲欧美在线视频| 亚洲 日韩 国产 制服 在线| 欧美一区二区三区激情视频| 九九热在线视频| 国产婷婷色一区二区三区在线| JEALOUSVUE成熟老师APP| 在线少女漫画|