擴散模型再下一城! 故事配圖這個活可以交給AI了
生成具有故事性的漫畫可不是那么簡單,不光要保證圖像質量,畫面的連貫性也占有非常重要的地位,如果生成的....
用于NAT的選擇性知識蒸餾框架
盡管NAT在擁有許多潛在的優勢,目前的工作中這類模型仍然在很大程度上依賴于句子級別的知識蒸餾(seq....
介紹四個為語言生成設計的預訓練模型
BERT: 只有Transformer Encoder部分,隨機MASK掉一些token,然后利用上....
為什么不同模態的embedding在表征空間中形成不同的簇
文中將一些經典的多模態對比學習模型中兩個模態的embedding,通過降維等方法映射到二維坐標系中。
一種將信息直接編碼到預訓練的語言模型中的結構
邊界信息的挖掘,對于NER的任務是非常重要的,這種類似于分詞的功能,能夠很好的挖掘到詞語,并且把一個....
如何使用CLM自身的embedding來得到OOD score?
如果直接套用classification任務中使用MSP作為OOD score的話,那么對于NLG問....
基于VQVAE的長文本生成 利用離散code來建模文本篇章結構的方法
寫在前面 近年來,多個大規模預訓練語言模型 GPT、BART、T5 等被提出,這些預訓練模型在自動文....
從統一視角看各類高效finetune方法實現最優tuning框架設計
Adaptor核心是在原Bert中增加參數量更小的子網絡,finetune時固定其他參數不變,只更新....
采用檢測框架CoP通過控制偏好檢測事實不一致
一致性評估的本質是衡量摘要Y受原文X支持的程度,也就是衡量X到Y的因果效應。直接使用常規推理過程的生....
基于本體的金融知識圖譜自動化構建技術
本評測任務參考 TAC KBP 中的 Cold Start 評測任務的方案,圍繞金融研報知識圖譜的自....
FRNet:上下文感知的特征強化模塊
現有的工作已經注意到了這個問題,例如 IFM、DIFM 等,但是他們僅僅在不同的實例中為相同特征賦予....
谷歌提出Flan-T5,一個模型解決所有NLP任務
這里的Flan指的是(Instruction finetuning),即"基于指令的微調";T5是2....
介紹兩種高效的參數更新方式LoRA與BitFit
NLP一個重要的范式包括在通用領域數據上的大規模預訓練和在特定任務或者領域上的微調。
圖模型在方面級情感分析任務中的應用
方面級情感分析(Aspect-based Sentiment Analysis, ABSA)是一項細....
一篇文章講清楚交叉熵和KL散度
什么情況下產生的平均驚喜最高呢?自然是不確定越高平均驚喜越高。對于給定均值和方差的連續分布,正態分布....
面向Aspect情感分析的自動生成離散意見樹結構
在本文中,我們探索了一種簡單的方法,為每個方面自動生成離散意見樹結構。用到了RL。
從預訓練語言模型看MLM預測任務
為了解決這一問題,本文主要從預訓練語言模型看MLM預測任務、引入prompt_template的ML....
用于中文縮略詞預測的序列生成模型研究
縮略詞是單詞或短語的縮寫形式。為了方便寫作和表達,在文本中提及某個實體時,人們傾向于使用縮寫名稱而不....
基于性別的暴力(GBV)的語言表達如何影響責任認知
不同的語言表達可以通過強調某些部分從不同的角度來概念化同一事件。該論文調查了一個具有社會后果的案例:....
求一種基于結構統一M叉編碼樹的求解器解決方案
數學問題 (英文叫Math Word Problem,簡稱MWP) 的求解要求給定一段描述文本,其中....
一種新型的雙流注意力增強型BERT來提高捕捉句子對中細微差異的能力
因此,該論文提出一種新型的雙流注意力增強型bert(DABERT,Dual Attention En....
幫助弱者讓你變得更強:利用多任務學習提升非自回歸翻譯質量
沿著這個思路,我們希望能夠為NAR模型提供更具信息量的學習信號,以便更好地捕獲目標端依賴。同時,最好....
列舉一些常見的數據問題以及解決方案
其次,有些數據集,和很多原因有關,無論是訓練集還是測試集,準確率可能都只是在六七十甚至更低,我們其實....
介紹大模型高效訓練所需要的主要技術
隨著BERT、GPT等預訓練模型取得成功,預訓-微調范式已經被運用在自然語言處理、計算機視覺、多模態....
建立計算模型來預測一個給定博文的抱怨強度
在計算語言學中,先前的研究主要集中在建立自動分類模型來識別抱怨是否存在。Jin提供了一個數據集,基于....
CogBERT:腦認知指導的預訓練語言模型
另一方面,從語言處理的角度來看,認知神經科學研究人類大腦中語言處理的生物和認知過程。研究人員專門設計....
基于使用對比學習和條件變分自編碼器的新穎框架ADS-Cap
在本文中,我們研究了圖像描述(Image Captioning)領域一個新興的問題——圖像風格化描述....
對話系統中的中文自然語言理解(NLU)(3.1)學術界中的方法(聯合訓練)
槽位填充任務(Slot Filling Task) 當模型聽懂人類的意圖之后,為了執行任務,模型便需....
摘要模型理解或捕獲輸入文本的要點
Abstract Intro ? 盡管基于預訓練的語言模型的摘要取得了成功,但一個尚未解決的問題是生....