天天操天天做,亚洲精品另类,在线中文字幕第一页

隨著對話系統和推薦系統的快速發展，新方向——對話推薦系統（Conversational Recommender System，簡稱CRS）也開始了蓬勃發展，其關注于如何通過基于自然語言的對話來獲得用戶的意圖和偏好，以實現精準推薦。但是現有的CRS相關數據集和模型在建模場景、最終目標和使用技術等方面存在一定差異，使得研究者們很難對這些模型進行統一的評測對比。對于科研新手來說，更是難以在這些模型和數據集中抉擇并快速搭建CRS系統。

為幫助各位道友“快樂+快速”上手研究對話推薦任務，我們（中國人民大學AI BOX團隊）推出了開源項目CRSLab——一個用于構建對話推薦系統（CRS）的開源工具包，在這里我們致力于幫您實現一鍵復現，快速開發，自動評測的一條龍服務，相關代碼和對應論文目前也已經開源。

目前為止，我們支持以下幾大功能，還有更多好玩的功能正在路上！

便捷的使用方法：新手別害怕，CRSLab提供了簡單而靈活的配置，快速調用分分鐘的事；

6個數據集和18個模型：各種數據預處理已幫您完成，各種新模型也適配完畢，任君取用；

多樣的評測方式：各個自動的評測指標都已經幫您實現，甚至還有人機交互的接口哦；

通用和可擴展的框架：還不滿意？框架給您搭好，函數接口給您安排上，想怎么玩就怎么玩；

論文地址：https://arxiv.org/pdf/2101.00939.pdf

項目GitHub地址：https://github.com/RUCAIBox/CRSLab

懶人一鍵安裝：pip install crslab

特性介紹

CRSLab完全基于 PyTorch 實現、主要面向研究者使用，其具有以下四大特性。

通用和可擴展的結構

我們設計了通用和可擴展的結構來統一各種對話推薦數據集和模型，并集成了多種內置接口和函數以便于快速開發。其具體框架如下所示：

圖片: CRSLab 的總體架構

其中Configuration模塊提供了針對用戶的接口，用戶可以通過簡單的命令行操作或修改給出的config文件，即可實現快速調用不同的CRS模型！Data，Model和Evaluator模塊中集成了多個現有的數據集，模型和評測方案，省去了用戶自行復現的時間。Utilities中集成了多個常用的功能函數，可以幫助用戶快速從新搭建一個新的對話推薦系統！

全面的基準模型和數據集

在CRSLab中，我們集成了常用的 6 個數據集和 18 個模型。這6個數據集均為常用的人工標注數據集，但是其在任務定義、領域等方面存在差異。我們對其進行了預處理以得到統一的格式，并努力使其支持更多的先進模型，這些預處理包括：推薦商品抽取、實體鏈接、BPE分詞等。我們提供了預處理后數據的下載鏈接以方便用戶使用，如下為這些數據集的統計數據：

Dataset	Dialogs	Utterances	Domains	Task Definition	Entity KG	Word KG
ReDial	10,006	182,150	Movie	--	DBpedia	ConceptNet
TG-ReDial	10,000	129,392	Movie	Topic Prediction	CN-DBpedia	HowNet
GoRecDial	9,125	170,904	Movie	Action Prediction	DBpedia	ConceptNet
DuRecDial	10,200	156,000	Movie, Music	Goal Planning	CN-DBpedia	HowNet
INSPIRED	1,001	35,811	Movie	Strategy Prediction	DBpedia	ConceptNet
OpenDialKG	13,802	91,209	Movie, Book	Path Generation	DBpedia	ConceptNet

我們將對話推薦任務主要拆分成三個子任務：推薦任務（生成推薦的商品），對話任務（生成對話的回復）和策略任務（規劃對話推薦的策略）。其中所有的對話推薦系統都具有對話和推薦任務，它們是對話推薦系統的核心功能，而策略任務是一個輔助任務，其致力于更好的控制對話推薦系統，在不同的模型中的實現也可能不同（如TG-ReDial采用一個主題預測模型，DuRecDial中采用一個對話規劃模型等）

在CRSLab中，我們實現了18 個模型，覆蓋CRS、推薦、對話和策略模型四種類別，其中CRS模型是指同時對推薦和對話任務（甚至策略任務）進行建模的融合模型，其可以利用這些任務以相互增強彼此的表現；而其他模型則只針對于某一個子任務。這些模型中還包括一些已經在CRS任務上表現較好的前沿模型，如圖神經網絡（GCN）和預訓練模型（BERT 和 GPT-2）。下表為這些模型的相關信息：

類別	模型	Graph Neural Network	Pre-training Model
CRS 模型	ReDial KBRD KGSF TG-ReDial	× √ √ ×	× × × √
推薦模型	Popularity GRU4Rec SASRec TextCNN R-GCN BERT	× × × × √ ×	× × × × × √
對話模型	HERD Transformer GPT-2	× × ×	× × √
策略模型	PMI MGCG Conv-BERT Topic-BERT Profile-BERT	× × × × ×	× × √ √ √

多樣的標準評測

我們支持一系列被廣泛使用的評估方式來測試和比較不同的 CRS。針對對話推薦中包含的各個子任務（推薦，對話，策略），我們分別設計了對應的評測方法，供直接用戶使用，如下表所示：

類別	指標
推薦任務	Hit@{1, 10, 50}, MRR@{1, 10, 50}, NDCG@{1, 10, 50}
對話任務	PPL, BLEU-{1, 2, 3, 4}, Embedding Average/Extreme/Greedy, Distinct-{1, 2, 3, 4}
策略任務	Accuracy, Hit@{1,3,5}

這里的推薦任務的若干指標均為常用的基于排序的指標；對話任務的指標包括評估概率分布（PPL），關聯度（BLEU，Embedding）和多樣性（Distinct）的指標；由于對話推薦系統中的策略往往不盡相同，這里我們采用常用的Accuracy和Hit來進行評估。

此外，我們還提供了人機交互接口，用戶可以直接通過特定的接口函數和命令和自己搭建的對話推薦系統進行交互，進而分析其中的的bad case等，也可以幫助初學者掌握系統的運行流程。

便捷的使用方法

我們為新手提供了簡單而靈活的配置，以快速啟動集成在 CRSLab 中的模型。對于已經集成的模型和數據集，可以直接使用命令行進行調用，使用以下命令，系統將依次完成數據的預處理，以及各模塊的訓練、驗證和測試，并得到指定的模型評測結果：

pythonrun_crslab.py--configconfig/kgsf/redial.yaml

如果您希望保存數據預處理結果與模型訓練結果，可以使用如下命令：

pythonrun_crslab.py--configconfig/kgsf/redial.yaml--save_data--save_system

總的來說，run_crslab.py有如下參數可供調用：

--config 或 -c：配置文件的相對路徑，以指定運行的模型與數據集。

--save_data 或 -sd：保存預處理的數據。

--restore_data 或 -rd：從文件讀取預處理的數據。

--save_system 或 -ss：保存訓練好的 CRS 系統。

--restore_system 或 -rs：從文件載入提前訓練好的系統。

--debug 或 -d：用驗證集代替訓練集以方便調試。

--interact 或 -i：與你的系統進行交互的對話。

如果希望調節模型或數據集的參數設置，可以直接對yaml文件進行更改，其提供了相比較于命令行更方便的編輯功能，具體的各項參數定義在文檔中已經給出。

安裝與使用

CRSLab 可以在以下幾種系統上運行：

Linux

Windows 10

macOS X

CRSLab 需要在 Python 3.6 或更高的環境下運行。CRSLab 要求 torch 版本在 1.4.0 及以上，如果用戶想在 GPU 上運行 CRSLab，請確保你的 CUDA 版本或者 CUDAToolkit 版本在 9.2 及以上。

提醒：因為用戶可能會因為未正確配置PyTorch，PyTorch Geometric等環境而導致無法使用，這里我們提供了詳細的從零開始的安裝流程，確保大家能夠順利安裝。

安裝 PyTorch

使用 PyTorch 本地安裝命令或者先前版本安裝命令安裝 PyTorch，比如在 Linux 和 Windows 下：

#CUDA10.1 pipinstalltorch==1.6.0+cu101torchvision==0.7.0+cu101-fhttps://download.pytorch.org/whl/torch_stable.html #CPUonly pipinstalltorch==1.6.0+cputorchvision==0.7.0+cpu-fhttps://download.pytorch.org/whl/torch_stable.html

安裝完成后，如果你想在 GPU 上運行 CRSLab，請確保如下命令輸出True：

$python-c"importtorch;print(torch.cuda.is_available())" >>>True

安裝 PyTorch Geometric

確保安裝的 PyTorch 版本至少為 1.4.0：

$python-c"importtorch;print(torch.__version__)" >>>1.6.0

找到安裝好的 PyTorch 對應的 CUDA 版本：

$python-c"importtorch;print(torch.version.cuda)" >>>10.1

安裝相關的包：

pipinstalltorch-scatter-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-sparse-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-cluster-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-spline-conv-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-geometric

其中${CUDA}和${TORCH}應使用確定的 CUDA 版本（cpu，cu92，cu101，cu102，cu110）和 PyTorch 版本（1.4.0，1.5.0，1.6.0，1.7.0）來分別替換。比如，對于 PyTorch 1.6.0 和 CUDA 10.1，輸入：

pipinstalltorch-scatter-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-sparse-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-cluster-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-spline-conv-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-geometric

安裝 CRSLab

gitclonehttps://github.com/RUCAIBox/CRSLab&&cdCRSLab pipinstall-e.

快速測試

從 GitHub 下載 CRSLab 后，可以使用提供的腳本進行簡單的測試：

pythonrun_crslab.py--configconfig/kgsf/redial.yaml

系統將依次完成數據的預處理，以及各模塊的訓練、驗證和測試，并得到指定的模型評測結果。

結果展示

我們在 TG-ReDial 數據集上對模型進行了訓練和測試，并記錄了在三個任務上的評測結果。其中效果最好的模型是基于圖神經網絡的KGSF和基于預訓練的TG-ReDial模型。

推薦任務

Model	Hit@1	Hit@10	Hit@50	MRR@1	MRR@10	MRR@50	NDCG@1	NDCG@10	NDCG@50
SASRec	0.000446	0.00134	0.0160	0.000446	0.000576	0.00114	0.000445	0.00075	0.00380
TextCNN	0.00267	0.0103	0.0236	0.00267	0.00434	0.00493	0.00267	0.00570	0.00860
BERT	0.00722	0.00490	0.0281	0.00722	0.0106	0.0124	0.00490	0.0147	0.0239
KBRD	0.00401	0.0254	0.0588	0.00401	0.00891	0.0103	0.00401	0.0127	0.0198
KGSF	0.00535	0.0285	0.0771	0.00535	0.0114	0.0135	0.00535	0.0154	0.0259
TG-ReDial	0.00793	0.0251	0.0524	0.00793	0.0122	0.0134	0.00793	0.0152	0.0211

生成任務

Model	BLEU@1	BLEU@2	BLEU@3	BLEU@4	Dist@1	Dist@2	Dist@3	Dist@4	Average	Extreme	Greedy	PPL
HERD	0.120	0.0141	0.00136	0.000350	0.181	0.369	0.847	1.30	0.697	0.382	0.639	472
Transformer	0.266	0.0440	0.0145	0.00651	0.324	0.837	2.02	3.06	0.879	0.438	0.680	30.9
GPT2	0.0858	0.0119	0.00377	0.0110	2.35	4.62	8.84	12.5	0.763	0.297	0.583	9.26
KBRD	0.267	0.0458	0.0134	0.00579	0.469	1.50	3.40	4.90	0.863	0.398	0.710	52.5
KGSF	0.383	0.115	0.0444	0.0200	0.340	0.910	3.50	6.20	0.888	0.477	0.767	50.1
TG-ReDial	0.125	0.0204	0.00354	0.000803	0.881	1.75	7.00	12.0	0.810	0.332	0.598	7.41

策略任務

Model	Hit@1	Hit@10	Hit@50	MRR@1	MRR@10	MRR@50	NDCG@1	NDCG@10	NDCG@50
MGCG	0.591	0.818	0.883	0.591	0.680	0.683	0.591	0.712	0.729
Conv-BERT	0.597	0.814	0.881	0.597	0.684	0.687	0.597	0.716	0.731
Topic-BERT	0.598	0.828	0.885	0.598	0.690	0.693	0.598	0.724	0.737
TG-ReDial	0.600	0.830	0.893	0.600	0.693	0.696	0.600	0.727	0.741

未來展望

對話推薦系統在未來肯定還會有更多工作，而且我們的CRSLab也有許多需要繼續完善的地方。我們AI BOX團隊將會持續開發維護CRSLab，保持版本穩定，并不斷加入更多更新的模型和數據集。期待各位讀者能夠提供寶貴意見。

責任編輯：xj

原文標題：CRSLab：可能是最適合你的對話推薦系統開源庫

文章出處：【微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

開源

開源

+關注

關注
3

文章
3363

瀏覽量
42532
深度學習

深度學習

+關注

關注
73

文章
5504

瀏覽量
121222
對話系統

對話系統

+關注

關注
0

文章
7

瀏覽量
2186

原文標題：CRSLab：可能是最適合你的對話推薦系統開源庫

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

開源AI模型庫是干嘛的

開源AI模型庫是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經過訓練，能夠執行特定的任務。以下，是對開源AI模型庫的詳細

發表于 12-14 10:33 ?197次閱讀

開源能帶我們走向何方

開源大模型、開源數據庫、開源框架、開源硬件......近些年，這些詞匯不絕于耳。雷軍說，好的代碼

發表于 12-06 17:09 ?451次閱讀

芯原股份與開源圖形庫LVGL達成戰略合作

芯原股份 (芯原，股票代碼：688521.SH) 今日宣布與嵌入式系統領域領先的開源圖形庫LVGL達成戰略合作，在LVGL庫中支持芯原的低功

發表于 11-29 09:20 ?364次閱讀

“小滿”V24.10源代碼在AtomGit開源

近日，由中國汽車工業協會指導，普華基礎軟件股份有限公司主辦的“小滿”安全車控操作系統開源發布會暨共建計劃說明會成功舉行。普華基礎軟件宣布將安全車控操作系統“小滿”(簡稱“小滿”)V24.10源

發表于 10-27 14:41 ?391次閱讀

人民郵電報：“開源”到底是什么？為啥熱度越來越高？

? ? ? 本文轉載自人民郵電報這些年，“開源”這個詞越來越火，開源AI大模型、開源數據庫、開源框架、

發表于 10-17 14:21 ?530次閱讀

開放原子開源數據庫生態論壇成功舉辦

以“開源生態筑基礎，數字經濟鑄未來”為主題的2024全球數字經濟大會——開放原子開源數據庫生態論壇在北京成功舉辦。開放原子開源基金會副秘書長辛曉華出席并致辭，北京市經濟和信息化局信息化

發表于 09-24 10:36 ?467次閱讀

Matepad pro12.2 已上市半個月，但是還沒有在開源網站看到該項目的開源信息，違背開源精神

任何該項目的開源計劃，違背開源精神按照開源社區 licsence和公共庫開源licsence要求，對應

發表于 08-27 17:25

阿里云與中興通訊達成開源數據庫合作

近日，阿里云與中興通訊宣布達成開源數據庫領域的深度合作。中興通訊正式加入PolarDB開源社區，并榮任首屆理事會成員單位，這一舉措標志著兩大科技巨頭在數據庫領域的合作邁向新的高度。

發表于 05-17 10:47 ?576次閱讀

阿里云與中興通訊達成開源數據庫合作，助推國產數據庫發展

據悉，阿里云與中興通訊于5月16日公布了開源數據庫合作事宜。中興通訊正式宣布加入PolarDB開源社區，并擔任首屆理事會成員單位。

發表于 05-16 16:34 ?467次閱讀

【開源鴻蒙】下載OpenHarmony 4.1 Release源代碼

本文介紹了如何下載開源鴻蒙（OpenHarmony）操作系統 4.1 Release版本的源代碼，該方法同樣可以用于下載OpenHarmony最新開發版本（master分支）或者4.0 Release、3.2 Release等發

發表于 04-27 23:16 ?949次閱讀

打造開源鴻蒙生態，國產操作系統迎“轉折之戰”？| 深圳衛視獨家對話深開鴻王成錄

作為正在崛起的國產操作系統，開源鴻蒙到底有哪些優勢？深圳衛視《大灣區會客廳》主持人何嘉琪獨家對話深開鴻CEO王成錄博士。探究為什么發展自主操作系統勢在必行？

發表于 04-20 08:32 ?512次閱讀

SDK5開源庫高頻注入的頭文件怎么沒有？

ST SDK5開源庫，高頻注入的頭文件怎么沒有？只有。c文件。怎么能夠獲得？

發表于 04-17 07:37

谷歌大型模型終于開放源代碼，遲到但重要的開源戰略

在人工智能領域，谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型，都基于谷歌在 2017 年發布的 Transformer 論文；谷歌的發布的 BERT、T5，都是最早的一批開源 AI 模型。

發表于 02-22 18:14 ?447次閱讀

一個成熟且可靠的開源實時操作系統

市場上有許多專有和開源實時操作系統（RTOS）。ThreadX已經以其對小代碼大小和高性能的關注而聞名。然而，它的競爭優勢遠遠超出了這些屬性。

發表于 02-20 12:26 ?890次閱讀

[開源]萬界星空開源MES系統，支持低代碼大屏設計

萬界星空科技免費MES、開源MES、商業開源MES、商業開源低代碼MES、市面上最好的開源MES、MES源

發表于 01-12 13:43 ?796次閱讀