如今,網絡營銷已是熱潮,其中提升用戶參與度的神器是什么呢?
是個性化服務。《哈佛商業評論》曾有報告指出,就市場營銷而言,用戶體驗的個性化可以讓投資回報率提升五至八倍,并將銷售額提高10%以上。
雖然個性化的內容可以建立更深的客戶關系并更好地了解用戶,但要實現有效的推薦背后需要超乎尋常的海量數據作為支撐。如今,借助先進的數據中心基礎架構以及高性能內存和存儲解決方案,人工智能(AI)引擎正在發揮作用。
當我們打開某寶,在首頁推薦瀏覽一番,展現的商品似乎正是我們所感興趣的,不難發現,這些推薦引擎已默默深入我們的日常生活,主導著人們的在線體驗。在中國, 阿里的“千人千面”系統助力 天貓在 2020 年雙 11 再創紀錄,總成交額達 4,982 億元。當然,搜索引擎的威力不僅僅體現在電子購物上,視頻網站會推薦觀眾感興趣的電影或節目,招聘網站會顯示適合用戶的職位,新聞和社交網站會推送用戶相關的內容。
以上一切的背后,是數據中心在創建這種高度個性化的互聯網,而先進的算法促成了系統推薦,從而成就了卓越的用戶體驗。當然,與許多其他的先進技術一樣,推薦引擎也離不開內存和存儲,而美光正是內存和存儲解決方案的主要提供商。
何為推薦引擎?
簡言之,推薦引擎是一種系統,該系統能夠基于用戶在某個內容上的評分或偏好設置來推薦信息。
這些引擎的出現是非常必要的。
人們每天產生2.5艾字節的數據,而全球 90% 的數據是在過去兩年中產生的。
微信 2019 年數據報告:微信平臺每天有450億次信息發送。
要篩選這些數據的難度可想而知 —— 不僅數量龐大,數據的種類和質量也是多種多樣。 每個人都多少有過經驗,感覺購物網站推薦的產品跟自己毫不相關或完全沒有吸引力。
那么,不好的推薦會有什么后果? 為什么會發生這樣的情況?
一切都與數據有關。就推薦引擎而言,數據越多,結果就越準確。用戶所收到的推薦通常是通過以下方式生成的:
通用推薦:這是最簡單的篩選方式,推薦與用戶過往搜索類似或最熱門的內容。
內容推薦:該類篩選會檢索用戶的瀏覽歷史、識別用戶曾經選擇過的內容的關鍵詞,然后推薦類似的內容。
協同推薦:根據用戶的瀏覽歷史,將其劃歸至某個群體,然后向用戶推薦該群體其他成員喜歡的內容。
綜合推薦:結合多種方式進行推薦。
以視頻平臺為例,為了做出精確的推薦,推薦引擎需要電影的類型、概要、演員和導演等各方面的數據、用戶的觀影記錄,以及與該用戶具有相似觀影習慣的一個龐大的用戶群的所有數據,還要考慮評論、社交平臺上的留言、甚至屏幕上顯示何種語言等等因素。數據量如此巨大,因此需要大量的內存和存儲來處理這些工作負載。
美光的內存和存儲技術如何賦能推薦引擎?
1數據收集
推薦的精確程度與數據量的大小成正比。在海量數據中篩選出數以億計的用戶行為并收集在一起。這需要具有靈活擴展能力的存儲產品,如四層單元(QLC)SSD。得益于 QLC NAND 內存技術的 SSD 能夠在容量、速度和成本之間實現平衡,幫助云服務供應商很好地控制總擁有成本(TCO)。
2篩選和預處理
機器學習系統會保存數以百萬計的用戶歷史記錄和行為,且系統會不斷更新。這些數據通常是以非結構化的形式被捕獲。要使用這些數據,首先必須對它們進行篩選,提煉出關鍵信息,然后以有效的方式進行組織。在非結構化數據中尋找所需的數據點非常困難,而解決數據整理這個難題通常是由 CPU 來完成,由服務器 DRAM(如 DDR5)提供支持。服務器 DRAM 會臨時保存正在預處理的數據,然后將其快速送入處理器。高速 NVMe SSD 會在數據得到處理并結構化后存儲這些數據,之后將其用于 AI 訓練。
3訓練
在這個階段,AI 將訓練推薦引擎對內容進行識別。例如,系統在“認識”小狗之前可能要分析幾十億張圖片。這需要訓練系統成百上千次地傳遞各個數據片段。隨著新的數據流入以及用戶的交互行為,系統會定期對模型進行再訓練。這個過程需要極其強大、靈活的數據中心來運行復雜的訓練算法。高帶寬的內存,如美光的超帶寬解決方案,能夠以超高速度不斷地將數據傳輸給 GPU(圖形處理器)或 CPU,后者通過邏輯連接創建 AI 算法。在訓練過程中,隨著數據量的增長和 AI 算法變得復雜,系統也需要更多的內存。此外,系統需要的不僅僅是更多的內存容量——為了實現更智能、更高速的 AI,它還需要新型的內存,例如,每次可以傳輸 2 比特數據或者可進行 3D 堆疊并放置到非常靠近處理器,甚至封裝在同一芯片中。美光正是開創這類新型存儲器創新技術的先鋒。
4推薦
接下來是推理。假設一個被訓練過的系統被問及電影里是否有小狗時,一旦識別到小狗,它就會做出推薦。可能會有不同的用戶在一分鐘內提出數百萬次這樣的需求,可能發生在數據中心,也可能發生在接近終端用戶的地方,或就在他們的手機或筆記本電腦上。高性能內存可以確保系統更快地做出對用戶有意義的推薦,同時為服務提供商帶來商機。
5優化
用戶與推薦之間的交互行為會被反饋到數據收集環節,被用以優化未來的推薦,使推薦引擎能夠學習并變得更加精確。
內存和存儲在推薦引擎處理程序的每個階段都發揮著作用,它們能縮短檢索和傳輸數據的時間、確保處理單元獲得所需的數據,以及存儲每天生成且不斷增長的海量數據。如果沒有像美光提供的這類先進的內存和存儲產品,推薦引擎就無從談起。
推薦引擎的未來
推薦引擎改變了在線服務的用戶體驗和商業模式。因此,各網站紛紛尋找新方法在其平臺上部署推薦引擎。
例如,亞馬遜機器學習科學家Ben Allison指出,用戶的每個瀏覽歷史并非同等重要。亞馬遜深知用戶的行為極為復雜,現在開始用神經網絡來辨別用戶行為的重要性(例如通過考慮上下文和發生的時間等因素),并它們打一個“注意力分”。 這些注意力分又成為一個更加復雜的推薦算法的關鍵組成部分。
此外,亞馬遜發現“可預測的”的預測結果并不理想,因此增加了一些“隨機性”功能,從而實現了讓所有購物者都能有 “意外發現”。 所以,亞馬遜現在給出的建議更多是來自人工智能的“決策”,并非只是原始的預測。
為了使算法更加精確,有些網站會讓人工與推薦引擎進行協作。例如,美國視頻網站 Hulu就有一個專門的內容專家團隊密切地合作,為觀眾創造更多個性化的精選系列。
直播網站也開始預測用戶今后可能會觀看什么內容,并將數據移動到離用戶物理距離更近的邊緣服務器,以提升直播速度。
對于當前和未來的推薦功能而言,提升數據量和數據速度至關重要。推薦引擎的數據存儲、AI 訓練和推理都需要高性能和低功耗的內存和存儲。
美光豐富的解決方案組合可以滿足推薦引擎的各種需求——從密集訓練所需的高帶寬內存和加速器,到用于推理的標準內存,再到應對各種數據的高容量存儲。當您在購物網站看到一件正合心意的商品,或在視頻網站被看到一個非常感興趣的節目,這背后很可能就有美光的內存和存儲解決方案在發揮作用。
編輯:lyn
-
數據
+關注
關注
8文章
7026瀏覽量
89026 -
推薦引擎
+關注
關注
0文章
2瀏覽量
1991
原文標題:揭秘推薦引擎——某寶某東為何如此懂你
文章出處:【微信號:gh_195c6bf0b140,微信公眾號:Micron美光科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論