亚洲欧美日韩国产专区一区,一级毛片在线直接观看,伊人影院99

近年來，人工智能取得了巨大的飛躍，這主要歸功于大型語言模型（LLMs）。LLMs非常擅長理解和生成類似人類的文本，它們促成了多種新工具的創(chuàng)建，比如先進的聊天機器人和AI作家。

盡管LLMs在生成流暢且類似人類的文本方面表現(xiàn)出色，但它們有時在事實準確性上存在困難。當準確性非常重要時，這可能是一個巨大的問題。

那么，這個問題的解決方案是什么呢？答案是檢索增強型生成（RAG）系統(tǒng)。

RAG集成了像GPT這樣的模型的強大功能，并增加了從外部來源查找信息的能力，比如專有數(shù)據(jù)庫、文章和內(nèi)容。這有助于AI產(chǎn)生不僅寫得好，而且在事實和上下文正確性方面也更準確的文本。

通過結(jié)合生成文本的能力與查找和使用準確相關(guān)信息的力量，RAG開辟了許多新的可能性。它有助于彌合僅僅編寫文本的AI與能夠使用實際知識的AI之間的差距。

在這篇文章中，我們將更仔細地研究RAG，它是如何工作的，它在哪里被使用，以及它可能如何改變我們未來與AI的互動。

讓我們從一個正式的RAG定義開始：

檢索增強型生成（RAG）是一個AI框架，它通過將大型語言模型（LLMs）與外部知識庫連接起來來增強它們。這允許訪問最新的、準確的信息，提高其結(jié)果的相關(guān)性和事實準確性。

現(xiàn)在，讓我們用簡單的語言來解釋，以便容易理解。

我們都使用過像ChatGPT這樣的AI聊天機器人來回答我們的問題。這些由大型語言模型（LLMs）驅(qū)動，它們是在大量互聯(lián)網(wǎng)內(nèi)容/數(shù)據(jù)上訓練和構(gòu)建的。它們在幾乎所有主題上都能產(chǎn)生類似人類的文本，看起來它們似乎能夠完美地回答我們所有的問題，但并不總是這樣。它們有時分享的信息可能不準確，事實上不正確。

這就是RAG發(fā)揮作用的地方。以下是它的工作原理：

1.提出一個問題。

2.RAG搜索經(jīng)過策劃的知識庫中的可靠信息。

3.檢索相關(guān)信息。

4.將這些信息傳遞給LLM。

5.LLM使用這些準確信息作出回答。

這個過程的結(jié)果是得到由準確信息支持的回應。

讓我們用一個例子來理解這一點：想象你想知道國際航班的行李限額。一個傳統(tǒng)的LLM像ChatGPT可能會說：“通常，你可以托運一個重達50磅的行李和一個隨身行李。但具體請咨詢你的航空公司?！币粋€RAG增強系統(tǒng)會說：“對于X航空公司，經(jīng)濟艙乘客可以托運一個50磅的行李和一個17磅的隨身行李。商務(wù)艙可以獲得兩個70磅的行李。注意運動器材等特殊物品的規(guī)則，并總是在辦理登機手續(xù)時驗證?！?/p>

你注意到區(qū)別了嗎？RAG提供了針對實際航空公司政策的具體、更準確的信息?？傊琑AG使這些系統(tǒng)更可靠和值得信賴。在開發(fā)更適用于現(xiàn)實世界的AI系統(tǒng)方面非常重要。

RAG如何工作

現(xiàn)在我們已經(jīng)對RAG有了一個很好的了解，讓我們了解它是如何工作的。首先，讓我們從一個簡單的架構(gòu)圖開始。

RAG的關(guān)鍵組件

從上面的架構(gòu)圖中，從用戶問題到問題最終答案之間，有三個關(guān)鍵組件對RAG的工作至關(guān)重要。

1.知識庫

2.檢索器

3.生成器

現(xiàn)在，讓我們一個一個地了解它們。

知識庫

這是包含所有可以引用來回答所有問題的文檔、文章或數(shù)據(jù)的存儲庫。這需要不斷更新新的和相關(guān)信息，以便回應是準確的，并向用戶提供最相關(guān)和最新的信息。

從技術(shù)角度來看，這通常使用向量數(shù)據(jù)庫如Pinecone、FAISS等來存儲文本作為數(shù)值表示（嵌入），從而允許快速和高效的搜索。

檢索器

它負責找到與用戶問題相關(guān)的文檔或數(shù)據(jù)。當提出一個問題時，檢索器會快速搜索知識庫以找到最相關(guān)的信息。

從技術(shù)角度來看，這通常使用密集檢索方法，如Dense Passage Retrieval或BM25。這些方法將用戶問題轉(zhuǎn)換為知識庫中使用的那種數(shù)值表示，并與相關(guān)信息匹配。

生成器

它負責生成與用戶問題相關(guān)且上下文相關(guān)的連貫內(nèi)容。它從檢索器那里獲取信息，并用它來構(gòu)建回答這個問題的回應。

從技術(shù)角度來看，這由大型語言模型（LLM）如GPT-4或開源替代品如LLAMA或BERT提供動力。這些模型是在大量數(shù)據(jù)集上訓練的，可以根據(jù)它們接收的輸入生成類似人類的文本。

RAG的好處和應用

現(xiàn)在我們知道了RAG是什么以及它如何工作，讓我們探索它提供的一些好處以及RAG的應用。

RAG的好處

借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG

面對大量不斷迭代的新知識，大模型必須“終身學習”才能滿足實際應用的需求。RAG（Retrieval-augmented Generation，檢索增強生成）讓生成式大模型能夠利用外部的

發(fā)表于 12-19 14:32 ?155次閱讀

借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型<b class='flag-5'>RAG</b>

RAG的概念及工作原理

檢索增強型生成（RAG）系統(tǒng)正在重塑我們處理AI驅(qū)動信息的方式。作為架構(gòu)師，我們需要理解這些系統(tǒng)

發(fā)表于 12-17 13:41 ?144次閱讀

【書籍評測活動NO.52】基于大模型的RAG應用開發(fā)與優(yōu)化

Agenerated，檢索增強生成）與Agent（AI智能體）。本篇小棗君首先嘗試用通俗易懂的語言幫助大家認識RAG這一重要應用形式。 01 了解大模型的“幻覺” 在了解為什么出現(xiàn)RAG

發(fā)表于 12-04 10:50

浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

近日，浪潮信息發(fā)布 “源”Yuan-EB（Yuan-embedding-1.0，嵌入模型），在C-MTEB榜單中斬獲檢索任務(wù)第一名，以78.41的平均精度刷新大模型RAG檢索最高成績，將基于元腦企

發(fā)表于 11-26 13:54 ?179次閱讀

使用TMS320C6000增強型DMA的應用

電子發(fā)燒友網(wǎng)站提供《使用TMS320C6000增強型DMA的應用.pdf》資料免費下載

發(fā)表于 10-23 09:48 ?0次下載

使用OpenVINO和LlamaIndex構(gòu)建Agentic-RAG系統(tǒng)

RAG 系統(tǒng)的全稱是 Retrieval-augmented Generation，本質(zhì)上是 Prompt Engineering，通過在 Prompt 中注入檢索得到的外部數(shù)據(jù)，可以有效地

發(fā)表于 10-12 09:59 ?258次閱讀

CoolGaN和增強型GaN區(qū)別是什么

CoolGaN和增強型GaN（通常指的是增強型高電子遷移率晶體管，即e-mode HEMT）在概念上有所重疊，但具體來說，它們之間的區(qū)別主要體現(xiàn)在以下幾個方面：一、定義與范疇 CoolGaN

發(fā)表于 09-07 09:28 ?521次閱讀

增強型HotRod QFN封裝：實現(xiàn)低EMI性能

電子發(fā)燒友網(wǎng)站提供《增強型HotRod QFN封裝：實現(xiàn)低EMI性能.pdf》資料免費下載

發(fā)表于 08-26 11:37 ?0次下載

增強型MOS管的結(jié)構(gòu)解析

增強型MOS管（Enhancement MOSFET）是一種重要的場效應晶體管，具有高輸入阻抗、低輸入電流、高速開關(guān)和低噪聲等優(yōu)點，被廣泛應用于電子設(shè)備中。以下是對增強型MOS管結(jié)構(gòu)的詳細解析。

發(fā)表于 07-24 10:51 ?1510次閱讀

TaD+RAG-緩解大模型“幻覺”的組合新療法

TaD：任務(wù)感知解碼技術(shù)（Task-aware Decoding，簡稱TaD），京東聯(lián)合清華大學針對大語言模型幻覺問題提出的一項技術(shù)，成果收錄于IJCAI2024。 RAG：檢索增強生成技術(shù)

發(fā)表于 07-16 15:01 ?2044次閱讀

mos管增強型與耗盡型的區(qū)別是什么

MOSFET（金屬-氧化物-半導體場效應晶體管）是一種廣泛應用于電子設(shè)備中的半導體器件，具有高輸入阻抗、低驅(qū)動功率和良好的線性特性等優(yōu)點。根據(jù)導電溝道的形成方式，MOSFET可以分為增強型和耗盡型

發(fā)表于 07-14 11:32 ?3654次閱讀

如何手擼一個自有知識庫的RAG系統(tǒng)

RAG通常指的是"Retrieval-Augmented Generation"，即“檢索增強的生成”。這是一種結(jié)合了檢索（Retrieva

發(fā)表于 06-17 14:59 ?577次閱讀

什么是RAG，RAG學習和實踐經(jīng)驗

高級的RAG能很大程度優(yōu)化原始RAG的問題，在索引、檢索和生成上都有更多精細的優(yōu)化，主要的優(yōu)化點會集中在索引、向量模型優(yōu)化、檢索后處理等模塊

發(fā)表于 04-24 09:17 ?885次閱讀

檢索增強生成（RAG）如何助力企業(yè)為各種企業(yè)用例創(chuàng)建高質(zhì)量的內(nèi)容？

在生成式 AI 時代，機器不僅要從數(shù)據(jù)中學習，還要生成類似人類一樣的文本、圖像、視頻等。檢索增強生成（RAG）則是可以實現(xiàn)的一種突破性方法。

發(fā)表于 03-29 15:09 ?911次閱讀

阿里云推出企業(yè)級大模型RAG系統(tǒng)

在國際AI大數(shù)據(jù)峰會上，阿里云重磅推出了企業(yè)級大模型檢索增強生成（RAG）解決方案。這一解決方案旨在為企業(yè)提供更強大、更智能的大模型應用工具，幫助企業(yè)更有效地利用大數(shù)據(jù)和人工智能技術(shù)。

發(fā)表于 02-05 09:54 ?1176次閱讀