文本生成模型已成為文本輸入方法(如聯想詞、語言檢查等)的重要技術支撐。然而,近期的一些生成模型(例如chatGPT和Galactica)能夠同時處理語言上和內容上的問題,也就是說它們能夠處理和生成足夠長的文本內容,使之看起來像是用戶自己的創作內容。這項技術進展促使學校、期刊、會議(例如ICML)去進一步更新作者署名政策。
由于這些工具來自我們自己的領域(NLP),所以我們是處理和解決這些潛在問題的最適合的群體,這包括模型輸出中的錯誤和模型訓練數據源的抄襲問題。在會議中,審稿人志愿獻出他們的時間來審稿,所以他們并不想額外花更多的時間去檢查上述問題。此外,還有關于作者署名的問題:ACL通常希望稿件內容是署名作者以及承認貢獻者的原創、未發表的工作。根據ACM抄襲定義,它不僅包括對他人作品的直接或近似復制,還包括故意復述他人作品的部分內容。
在與ACL執行委員會協商之后,ACL 2023在NAACL 2022的Resposible NLP Checklist基礎上進一步添加了有關使用寫作助手的問題。如果作者以任何方式使用了這些工具,作者必須詳細說明使用的范圍和性質。與其他關于提供代碼、數據、補償參與者以及獲得IRB許可類似,這些問題并不是為了進行自動拒稿。
與其他問題一樣,這些問題的目的是讓作者反思和建立研究規范。作者對清單中所有問題的回答都將會披露給審稿人,審稿人隨后可根據相關信息進行倫理審查。為了進一步提高NLP研究對于公眾的透明度,對于今年被錄用的論文,在公開論文時將同時公開Responsible NLP Checklist(作為附錄)。這與Nature期刊中的Reporting Summary相似。
LV1:純粹用于論文的語言輔助
當生成模型用于重新表述或潤色作者的原始內容,而不是為了提出新內容時,它們類似于Grammarly、拼寫檢查器、字典和同義詞典等工具,多年來一直被完全接受。如果作者的語言水平不夠流利,以至于無法注意到生成的內容與他們的預期不符,那么與其使用這些工具而不進行檢查,倒不如直接使用簡單準確的語言去敘述。使用像Grammarly或者拼寫檢查器這樣只協助語言表述的工具是不需要顯式說明的。
LV2:簡短的輸入協助
即使輸入法中的聯想詞或者像谷歌文檔中的智能編寫功能同樣是由生成式語言模型驅動的,但沒有人反對使用它們。因為幾乎沒有人會嘗試用它們來生成非常長、獨特且連貫的文本,因為這種方式生成出來的文本根本不具備實用價值。與上面使用語言輔助工具類似,在回答該類工具相關問題時,不需要進行顯式說明。
LV3:文獻檢索??
文本生成模型可能被用作搜索助手,例如查找相關文獻。然而,我們希望作者閱讀和討論這些參考文獻,就像通過常規搜索引擎或語義文獻推薦工具識別的參考文獻一樣。作者要注意引用的準確性和文獻綜述的全面性,并且要注意推薦引用中可能存在的偏差問題。
LV4:低創新性文本
有些作者可能認為描述廣為人知的概念是浪費時間,可以通過自動化的方法完成。在這種情況下,作者應該說明使用了這種文本的位置,并說服審稿人他們檢查了生成文本的準確性,并附有相關和適當的引用(例如,使用塊引用以表示復制原文)。如果生成的文本是直接從現有工作復制的文本,作者需要合理地進行引用:這既是文本的來源也是思想的來源。
LV5:新思路
如果模型輸出了新的研究思想,那么它們應該獲得該項工作的共同作者或致謝。如果作者在這基礎之上發展了這些理念(例如,討論的主題、問題的框架),我們建議聲明使用了這些模型,并檢查這些思路的已知來源以聲明和引用它們,這是因為很有可能這些思想來自其他人的工作。
LV6:新思路+新文本
我們認為同時提供思想和執行的貢獻者符合共同作者的定義,而模型不能成為共同作者。雖然業界正在建立關于使用生成式AI的相關規范,我們不鼓勵在ACL稿件中使用這種方法。如果你堅持認為這是合理的,你可以向審稿人證明這種操作的合理性,并且保證新內容的正確性、連貫性和原創性,并且沒有漏引相關文獻。需要注意的是,ICML同行指出:目前誰應該享有生成文本的相關權利是尚不清晰的,是模型的開發者,訓練數據的原作者,還是生成文本的用戶。
Extra:能用生成模型輔助寫代碼嗎?
另外一個獨立但相關的問題是借助生成模型寫代碼。ACL稿件可以附帶源代碼(被視為補充材料),審稿人不會被強制審閱這些材料,可以根據自己的需要去查看。使用代碼助手(例如Copilot)也是一種新興寫代碼的方式,并且相關準則還沒有完全建立起來。當下,我們要求作者明確指出使用這些助手的范圍,例如在README文件中進行備注。
我們還要求作者去檢查是否存在潛在的抄襲風險。需要注意的是Copilot現在正存在一項關于盜版的訴訟,并且可能向你推薦了不符合許可證的代碼片段。代碼助手的使用并不能免除作者確保其方法和結果正確性的要求。
關于AI輔助寫作:
1、僅用于語法糾錯、語言潤色為目的時無需聲明。
2、用于經典概念的描述、文獻檢索、提供新思路方面需要聲明使用范圍,且要確保相關表述是否來源于已有工作,注意相關引用。
3、ACL不鼓勵完全使用AI助手生成新思路和新文本。?
4、使用AI輔助生成代碼,需要在代碼描述文件中指出使用范圍。
審核編輯:劉清
-
ACL
+關注
關注
0文章
61瀏覽量
11982 -
nlp
+關注
關注
1文章
488瀏覽量
22049 -
ChatGPT
+關注
關注
29文章
1563瀏覽量
7747
原文標題:ACL2023論文寫作能否使用ChatGPT?
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論