视频一区在线免费观看,亚洲精品一区二区伦理,亚洲精品成人网久久久久久

最近有開發者自制了一套圖書推薦系統，使用Word2Vec算法將書目表示為向量，可以同時獲得幾種書籍的推薦結果，并獲得書籍的TSNE圖及相似度最高的推薦。圖書數據來自GoodReads上的評價最高的前10000本書。開發者表示，采用較小的batchsize和長度可變的窗口可提升推薦相似度。

近日，有開發人員自制了一套圖書推薦系統，使用Word2Vec算法將書目表示為向量，可以同時獲得幾種書籍的推薦，并獲得書籍的TSNE圖以及相似度最高的推薦信息。訓練數據來自GoodReads上的評價最高的前10000本書。

作者將這一系統在Reddit論壇上進行了算法介紹和推薦效果圖分享，引發廣泛討論。我們不妨來看看這個自制薦書系統是怎么做的。

以下是作者自己給出的系統展示和介紹，最后是技術實現環節的相關討論。

下面的圖片來自兩個2D TSNE生成的圖書嵌入圖。第一部分是數據中最常出現的3000本書的TNSE（已經過10000本書的數據訓練），第二部分是全部10000本書的TSNE。

我做了兩個TSNE圖，因為隨著書籍書目的增加，推薦的準確度趨于下降，所以我想查看最常出現的書籍的分布圖，然后再處理其余的書。

首先最常出現的3000本書的TSNE圖，先給出幾個局部放大圖，最后放上全圖。

下圖為作于最近30-40年間的奇幻/古典奇幻類書

中間的部分大部分是漫畫書，周圍是一些科學類書籍

宇宙科幻類：

喜劇類（主要是電視劇）

全圖

然后是全部10000本書的TSNE圖，同樣先給出幾個局部圖，最后是全圖。

歷史類書籍。圖左半部為美國史，右半部為世界通史

宇宙史和起源理論

兒童經典書目

食品科學和新聞類

Word2Vec薦書系統的技術實現

下面是一些技術上的實現要點，對機器學習感興趣的小伙伴們可以關注一下。

1、使用較小的batch size

訓練中使用batch size較小（32和64）對于確保所有書籍向量的穩健性非常重要。在更高的batch size（128、256和512）下，大多數向量具有相當的相似性，但似乎總是有一些書的向量不具備相似性。

以《哈利·波特》2-7部的推薦結果為例，如果直接查看數據，很容易知道與這些書相似度最高的書應該是該系列中的其他《哈利·波特》書，但最初推薦模型給出的相似圖書結果并非如此。但是，在把batch size設置為64后，推薦結果的相似度很快得到明顯改善。

由于平均窗口大小為112，并在20到200之間變化（取決于用戶閱讀的書籍數量），因此像《哈利·波特》這樣的系列叢書中的一些書，很可能會與其他書籍匹配為相似了。

假設某系列叢書中共有7本書，并且用戶對所有7本書都進行了評分，該用戶還評價了112本其他書，那么，其中一本《哈利·波特》書與另一本《哈利·波特》在該用戶的標簽下實現配對的概率是6/112。

在這種情況下，由于word2vec試圖一次性優化多個嵌入，因此對于窗口大小很小且恒定的情況，更高的batch size會比word2vec算法的應用對結果優化造成更加明顯的阻礙。

2、Softmax嵌入向量算術

到目前為止，上面的所有矢量算術示例都是我在書籍輸入嵌入上執行加法和/或減法，然后針對softmax嵌入對結果矢量執行相似性結果的情況。比結果向量與輸入嵌入進行比較要穩健得多。

3、可變長度窗口（VLW）

最初的Word2Vec Cbow算法使用固定的窗口大小的單詞用作特定目標的輸入。比如，如果窗口大小是目標詞左側和右側的2個單詞，那么在這句“The cat in the hat”中，如果目標詞（標簽）是“in”，那么單詞'The '，'cat'，'the'和'hat'將各自向量進行平均，并將得到的結果向量作為輸入。

而在這個薦書系統中，窗口大小不可能是固定的。對于特定數據點（輸入），由用戶輸入的所有對全部書籍的評價都可能作為潛在的輸入，而且每個用戶瀏覽過的書籍數量彼此存在很大差異，因此窗口大小不可能恒定。

盡管窗口大小不是恒定的，但是平均輸入向量的數量是保持不變的。所有提供的數據都使用兩個平均向量作為輸入，這樣向量的算術屬性的穩健性是最高的。改變輸入平均向量的數量，在相似性推薦屬性方面并沒有表現出明顯優勢。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4610

瀏覽量
92859
機器學習

機器學習

+關注

關注
66

文章
8414

瀏覽量
132607

原文標題：【Reddit今日最火】Lit2Vec圖書推薦系統，自動推薦適合你的AI好書！

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

二維碼掃描頭嵌入在圖書自助管理設備中的應用案例

在當今數字化時代，二維碼掃描技術已廣泛應用于各行各業，其中，在圖書自助管理設備中的嵌入應用尤為引人注目。這不僅極大地提升了圖書館的服務效率與用戶體驗，還實現了圖書管理流程的智能化與自動化。以下將詳細

發表于 12-19 16:22 ?94次閱讀

二維碼掃描頭嵌入在<b class='flag-5'>圖書</b>自助管理設備中的應用案例

如何保障圖書館用電安全？——安科瑞丁佳雯

一、圖書館的安全挑戰? 圖書館作為公共場所，其電氣系統復雜且龐大，包括照明、空調、電腦、電子閱讀設備等眾多用電設備。這些設備在長時間運行過程中，可能會因老化、接觸不良或設計缺陷等原因產生故障電弧

發表于 12-13 14:34 ?110次閱讀

如何保障<b class='flag-5'>圖書</b>館用電安全？——安科瑞丁佳雯

智慧圖書館能耗監測優化管理系統方案

優化管理系統方案，旨在通過智能化手段實現對圖書館能耗的全面監測、精準分析與高效管理，有效減少能耗成本并提高能源利用效率。通過在圖書館各區域配電室內部署物通博聯工業智能網關，實時采集智能電表數據，如電量、電壓

發表于 09-11 13:41 ?331次閱讀

聚徽-什么是智能圖書館

智能圖書館（Intelligent Library，簡稱 IL）是把智能技術運用在圖書館建設之中形成的一種現代化建筑，是智能建筑與高度自動化管理的數字圖書館的有機結合和創新。它應同時具備兩者的設計思想、基本要求、特征和功能。智能

發表于 08-05 09:51 ?245次閱讀

nlp自然語言處理模型有哪些

：詞嵌入（Word Embedding）詞嵌入是將詞匯映射到高維空間的向量表示，使得語義相近的詞在向量空間中的距離更近。常見的詞嵌入模型有： Word2Vec：由Mikolov等人于2013年提出

發表于 07-05 09:57 ?724次閱讀

雷拓科技云廣播助力江西省蘆溪縣新圖書館打造沉浸式觀展體驗！

?蘆溪縣圖書館新館位于江西省萍鄉市蘆溪縣古城山公園袁河西路，占地8畝，建筑面積1.1萬平方米，嚴格按照國家一級圖書館標準設計，集智能化、數字化、平臺化為一體，設立了自助辦證、借還一體機、智能書架

發表于 07-01 09:59 ?300次閱讀

雷拓科技云廣播助力江西省蘆溪縣新<b class='flag-5'>圖書</b>館打造沉浸式觀展體驗！

iPad版微軟Word新增頁面邊框功能，提升文檔美觀度

微軟公司今日宣布，啟動 Microsoft 365 Insider 項目的 iPad 版 Word 應用程序的新功能測試活動——頁面邊框功能開發完成。此項便利有用的功能有助于提升文檔整體美感。

發表于 05-18 14:05 ?572次閱讀

名單公布！【書籍評測活動NO.32】硬核科普書《計算》，豆瓣評分9.8，榮膺圖書界至高獎項

，它還被中國開發者評選為 2023年年度IT圖書！此外，本書在豆瓣上也收獲了大家眾多好評，獲得豆瓣評分9.8的高分！這到底是怎樣的一本書，如此備受專家和讀者共同推崇呢？我們為什么需要《計算

發表于 05-08 13:59

如果通過物聯網技術提升學校圖書館管理水平

、圖書借還情況和庫存情況，以確保安全和資源管理。 2.智能圖書定位與管理：在每本書上附加RFID標簽，通過RFID讀寫器實時跟蹤圖書位置和移動，提高

發表于 03-22 14:36 ?638次閱讀

RFID智能書架：圖書館智能化管理的新趨勢

智能書架，顧名思義，是一種集成了RFID技術的創新型書架。實現了圖書快速借還、快速盤點、查找、亂架圖書整理等功能，以RFID電子標簽作為信息存儲媒介并粘貼在圖書上，在RFID芯片中存儲該圖書

發表于 03-20 16:53 ?589次閱讀

AURIX Development Studio支持在線調試自制的最小系統嗎？

AURIX Development Studio支持在線調試自制的最小系統嗎？看到的都是調試英飛凌官方的board，沒見到其他的。

發表于 02-19 07:48

上海交通大學徐匯校區包兆龍圖書館修繕工程電氣火災監控系統 Acrelsale1

安科瑞程瑜? 基本信息：項目名稱：上海交通大學徐匯校區包兆龍圖書館修繕工程電氣火災監控系統項目地點：上海市徐匯區實施時間：2015年項目簡介：香港著名

發表于 02-05 14:47 ?360次閱讀

如何快速找到PCB中的GND？

如何快速找到PCB中的GND？? 在PCB設計和制作過程中，找到地線（GND）是非常關鍵的步驟。GND是電子電路中一個非常重要的參考面，它提供了電路中的參考電平，并在電路中提供低噪聲的當前路徑。因此

發表于 02-03 17:04 ?3736次閱讀

找到CAN總線（故障）節點的三種辦法

找到CAN總線（故障）節點的三種辦法? CAN總線是現代汽車電子系統中常見的通信協議，用于車載電子設備之間的數據傳輸。在汽車的CAN總線系統中，每個節點都扮演著重要的角色。然而，由于各種原因，有時候

發表于 02-02 10:35 ?1494次閱讀

求助，關于NANO120的FMC問題求解

看了fmc部分,有下面問題不太清楚,請斑竹答疑。謝謝! 其中有一個問題在上次NUC120的D版本不能進ISP中,但一直沒回復。不知是不是太簡單了還是手冊中有答案,我沒找到? 1.P348表格

發表于 01-16 07:17

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

自制Word2Vec圖書推薦系統，幫你找到最想看的書！

評論

二維碼掃描頭嵌入在圖書自助管理設備中的應用案例

如何保障圖書館用電安全？——安科瑞丁佳雯

智慧圖書館能耗監測優化管理系統方案

聚徽-什么是智能圖書館

nlp自然語言處理模型有哪些

雷拓科技云廣播助力江西省蘆溪縣新圖書館打造沉浸式觀展體驗！

iPad版微軟Word新增頁面邊框功能，提升文檔美觀度

名單公布！【書籍評測活動NO.32】硬核科普書《計算》，豆瓣評分9.8，榮膺圖書界至高獎項

如果通過物聯網技術提升學校圖書館管理水平

RFID智能書架：圖書館智能化管理的新趨勢

AURIX Development Studio支持在線調試自制的最小系統嗎？

上海交通大學徐匯校區包兆龍圖書館修繕工程電氣火災監控系統 Acrelsale1

如何快速找到PCB中的GND？

找到CAN總線（故障）節點的三種辦法

求助，關于NANO120的FMC問題求解