探索LangChain：構建專屬LLM應用的基石

一、LangChain是什么

LangChain是一個框架，用于開發由LLM驅動的應用程序?？梢院唵握J為是LLM領域的Spring，以及開源版的ChatGPT插件系統。核心的2個功能為：

1）可以將 LLM 模型與外部數據源進行連接。

2）允許與 LLM 模型與環境進行交互，通過Agent使用工具。

二、LangChain核心組件

LangChain提供了各種不同的組件幫助使用LLM，如下圖所示，核心組件有Models、Indexes、Chains、Memory以及Agent。

??2.1 Models

LangChain本身不提供LLM，提供通用的接口訪問LLM，可以很方便的更換底層的LLM以及自定義自己的LLM。主要有2大類的Models：

1）LLM：將文本字符串作為輸入并返回文本字符串的模型，類似OpenAI的text-davinci-003

2）Chat Models：由語言模型支持但將聊天消息列表作為輸入并返回聊天消息的模型。一般使用的ChatGPT以及Claude為Chat Models。

與模型交互的，基本上是通過給予Prompt的方式，LangChain通過PromptTemplate的方式方便我們構建以及復用Prompt。

from langchain import PromptTemplate


prompt_template = '''作為一個資深編輯，請針對 >>> 和 <<< 中間的文本寫一段摘要。 
>>> {text} <<<
'''


prompt = PromptTemplate(template=prompt_template, input_variables=["text"])
print(prompt.format_prompt(text="我愛北京天安門"))

2.2 Indexes

索引和外部數據進行集成，用于從外部數據獲取答案。如下圖所示，主要的步驟有

1）通過Document Loaders加載各種不同類型的數據源,

2）通過Text Splitters進行文本語義分割

3）通過Vectorstore進行非結構化數據的向量存儲

4）通過Retriever進行文檔數據檢索

2.2.1 Document Loaders

LangChain通過Loader加載外部的文檔，轉化為標準的Document類型。Document類型主要包含兩個屬性：page_content 包含該文檔的內容。meta_data 為文檔相關的描述性數據，類似文檔所在的路徑等。

??2.2.2 Text Splitters

LLM一般都會限制上下文窗口的大小，有4k、16k、32k等。針對大文本就需要進行文本分割，常用的文本分割器為RecursiveCharacterTextSplitter，可以通過separators指定分隔符。其先通過第一個分隔符進行分割，不滿足大小的情況下迭代分割。

文本分割主要有2個考慮：

1）將語義相關的句子放在一塊形成一個chunk。一般根據不同的文檔類型定義不同的分隔符，或者可以選擇通過模型進行分割。

2）chunk控制在一定的大小，可以通過函數去計算。默認通過len函數計算，模型內部一般都是使用token進行計算。token通常指的是將文本或序列數據劃分成的小的單元或符號，便于機器理解和處理。使用OpenAI相關的大模型，可以通過tiktoken包去計算其token大小。

from langchain.text_splitter import RecursiveCharacterTextSplitter


text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turb
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=7000,
    chunk_overlap=0
)
docs = text_splitter.create_documents(["文本在這里"])
print(docs)

2.2.3 Vectorstore

通過Text Embedding models，將文本轉為向量，可以進行語義搜索，在向量空間中找到最相似的文本片段。目前支持常用的向量存儲有Faiss、Chroma等。

Embedding模型支持OpenAIEmbeddings、HuggingFaceEmbeddings等。通過HuggingFaceEmbeddings加載本地模型可以節省embedding的調用費用。

#通過cache_folder加載本地模型
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="本地模型地址")


embeddings = embeddings_model.embed_documents(
    [
        "我愛北京天安門!",
        "Hello world!"
    ]
)

2.2.4 Retriever

Retriever接口用于根據非結構化的查詢獲取文檔，一般情況下是文檔存儲在向量數據庫中?？梢哉{用 get_relevant_documents 方法來檢索與查詢相關的文檔。

from langchain import FAISS
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter


loader = WebBaseLoader("https://in.m.jd.com/help/app/register_info.html")
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=800,
    chunk_overlap=0
)
docs = text_splitter.split_documents(data)
#通過cache_folder設置自己的本地模型路徑
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="models")
vectorstore = FAISS.from_documents(docs, embeddings)
result = vectorstore.as_retriever().get_relevant_documents("用戶注冊資格")
print(result)
print(len(result))

2.3 Chains

Langchain通過chain將各個組件進行鏈接，以及chain之間進行鏈接，用于簡化復雜應用程序的實現。其中主要有LLMChain、Sequential Chain以及Route Chain

2.3.1 LLMChain

最基本的鏈為LLMChain，由PromptTemplate、LLM和OutputParser組成。LLM的輸出一般為文本，OutputParser用于讓LLM結構化輸出并進行結果解析，方便后續的調用。

類似下面的示例，給評論進行關鍵詞提前以及情緒分析，通過LLMChain組合PromptTemplate、LLM以及OutputParser，可以很簡單的實現一個之前通過依賴小模型不斷需要調優的事情。

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.output_parsers import ResponseSchema, StructuredOutputParser
from azure_chat_llm import llm


#output parser
keyword_schema = ResponseSchema(name="keyword", description="評論的關鍵詞列表")
emotion_schema = ResponseSchema(name="emotion", description="評論的情緒，正向為1，中性為0，負向為-1")
response_schemas = [keyword_schema, emotion_schema]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)
format_instructions = output_parser.get_format_instructions()


#prompt template
prompt_template_txt = '''
作為資深客服，請針對 >>> 和 <<< 中間的文本識別其中的關鍵詞，以及包含的情緒是正向、負向還是中性。
>>> {text} <<<
RESPONSE:
{format_instructions}
'''


prompt = PromptTemplate(template=prompt_template_txt, input_variables=["text"],
                        partial_variables={"format_instructions": format_instructions})


#llmchain
llm_chain = LLMChain(prompt=prompt, llm=llm)
comment = "京東物流沒的說，速度態度都是杠杠滴！這款路由器顏值賊高，怎么說呢，就是泰褲辣！這線條，這質感，這速度，嘎嘎快！以后媽媽再也不用擔心家里的網速了！"
result = llm_chain.run(comment)
data = output_parser.parse(result)
print(f"type={type(data)}, keyword={data['keyword']}, emotion={data['emotion']}")

輸出：

2.3.2 Sequential Chain

SequentialChains是按預定義順序執行的鏈。SimpleSequentialChain為順序鏈的最簡單形式，其中每個步驟都有一個單一的輸入/輸出，一個步驟的輸出是下一個步驟的輸入。SequentialChain 為順序鏈更通用的形式，允許多個輸入/輸出。

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.chains import SimpleSequentialChain


first_prompt = PromptTemplate.from_template(
    "翻譯下面的內容到中文:"
    "

{content}"
)
# chain 1: 輸入：Review 輸出： 英文的 Review
chain_trans = LLMChain(llm=llm, prompt=first_prompt, output_key="content_zh")


second_prompt = PromptTemplate.from_template(
    "一句話總結下面的內容:"
    "

{content_zh}"
)


chain_summary = LLMChain(llm=llm, prompt=second_prompt)
overall_simple_chain = SimpleSequentialChain(chains=[chain_trans, chain_summary],verbose=True)
content = '''In a blog post authored back in 2011, Marc Andreessen warned that, “Software is eating the world.” Over a decade later, we are witnessing the emergence of a new type of technology that’s consuming the world with even greater voracity: generative artificial intelligence (AI). This innovative AI includes a unique class of large language models (LLM), derived from a decade of groundbreaking research, that are capable of out-performing humans at certain tasks. And you don’t have to have a PhD in machine learning to build with LLMs—developers are already building software with LLMs with basic HTTP requests and natural language prompts.
In this article, we’ll tell the story of GitHub’s work with LLMs to help other developers learn how to best make use of this technology. This post consists of two main sections: the first will describe at a high level how LLMs function and how to build LLM-based applications. The second will dig into an important example of an LLM-based application: GitHub Copilot code completions.
Others have done an impressive job of cataloging our work from the outside. Now, we’re excited to share some of the thought processes that have led to the ongoing success of GitHub Copilot.
'''
result = overall_simple_chain.run(content)
print(f'result={result}')

輸出：

2.3.3 Router Chain

RouterChain是根據輸入動態的選擇下一個鏈，每條鏈處理特定類型的輸入。

RouterChain由兩個組件組成：

1）路由器鏈本身，負責選擇要調用的下一個鏈，主要有2種RouterChain，其中LLMRouterChain通過LLM進行路由決策，EmbeddingRouterChain 通過向量搜索的方式進行路由決策。

2）目標鏈列表，路由器鏈可以路由到的子鏈。

初始化RouterChain以及destination_chains完成后，通過MultiPromptChain將兩者結合起來使用。

??2.3.4 Documents Chain

下面的4種Chain主要用于Document的處理，在基于文檔生成摘要、基于文檔的問答等場景中經常會用到，在后續的落地實踐里也會有所體現。

2.3.4.1 Stuff

StuffDocumentsChain這種鏈最簡單直接，是將所有獲取到的文檔作為context放入到Prompt中，傳遞到LLM獲取答案。

這種方式可以完整的保留上下文，調用LLM的次數也比較少，建議能使用stuff的就使用這種方式。其適合文檔拆分的比較小，一次獲取文檔比較少的場景，不然容易超過token的限制。

??2.3.4.2 Refine

RefineDocumentsChain是通過迭代更新的方式獲取答案。先處理第一個文檔，作為context傳遞給llm，獲取中間結果intermediate answer。然后將第一個文檔的中間結果以及第二個文檔發給llm進行處理，后續的文檔類似處理。

Refine這種方式能部分保留上下文，以及token的使用能控制在一定范圍。

??2.3.4.3 MapReduce

MapReduceDocumentsChain先通過LLM對每個document進行處理，然后將所有文檔的答案在通過LLM進行合并處理，得到最終的結果。

MapReduce的方式將每個document單獨處理，可以并發進行調用。但是每個文檔之間缺少上下文。

2.3.4.4 MapRerank

MapRerankDocumentsChain和MapReduceDocumentsChain類似，先通過LLM對每個document進行處理，每個答案都會返回一個score，最后選擇score最高的答案。

MapRerank和MapReduce類似，會大批量地調用LLM，每個document之間是獨立處理。

??2.4 Memory

正常情況下Chain無狀態的，每次交互都是獨立的，無法知道之前歷史交互的信息。LangChain使用Memory組件保存和管理歷史消息，這樣可以跨多輪進行對話，在當前會話中保留歷史會話的上下文。Memory組件支持多種存儲介質，可以與Monogo、Redis、SQLite等進行集成，以及簡單直接形式就是Buffer Memory。常用的Buffer Memory有

1）ConversationSummaryMemory ：以摘要的信息保存記錄

2）ConversationBufferWindowMemory：以原始形式保存最新的n條記錄

3）ConversationBufferMemory：以原始形式保存所有記錄

通過查看chain的prompt，可以發現{history}變量傳遞了從memory獲取的會話上下文。下面的示例演示了Memory的使用方式，可以很明細看到，答案是從之前的問題里獲取的。

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory


from azure_chat_llm import llm


memory = ConversationBufferMemory()
conversation = ConversationChain(llm=llm, memory=memory, verbose=True)
print(conversation.prompt)
print(conversation.predict(input="我的姓名是tiger"))
print(conversation.predict(input="1+1=?"))
print(conversation.predict(input="我的姓名是什么"))

輸出：

??2.5 Agent

Agent字面含義就是代理，如果說LLM是大腦，Agent就是代理大腦使用工具Tools。目前的大模型一般都存在知識過時、邏輯計算能力低等問題，通過Agent訪問工具，可以去解決這些問題。目前這個領域特別活躍，誕生了類似AutoGPT、BabyAGI、AgentGPT等一堆優秀的項目。傳統使用LLM，需要給定Prompt一步一步地達成目標，通過Agent是給定目標，其會自動規劃并達到目標。

2.5.1 Agent核心組件

Agent：代理，負責調用LLM以及決定下一步的Action。其中LLM的prompt必須包含agent_scratchpad變量，記錄執行的中間過程

Tools：工具，Agent可以調用的方法。LangChain已有很多內置的工具，也可以自定義工具。注意Tools的description屬性，LLM會通過描述決定是否使用該工具。

ToolKits：工具集，為特定目的的工具集合。類似Office365、Gmail工具集等

Agent Executor：Agent執行器，負責進行實際的執行。

2.5.2 Agent的類型

一般通過initialize_agent函數進行Agent的初始化，除了llm、tools等參數，還需要指定AgentType。

agent = initialize_agent(agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                tools=tools,
                llm=llm,
                verbose=True)
print(agent.agent.llm_chain.prompt.template)

該Agent為一個zero-shot-react-description類型的Agent，其中zero-shot表明只考慮當前的操作，不會記錄以及參考之前的操作。react表明通過ReAct框架進行推理，description表明通過工具的description進行是否使用的決策。

其他的類型還有chat-conversational-react-description、conversational-react-description、react-docstore、self-ask-with-search等，類似chat-conversational-react-description通過memory記錄之前的對話，應答會參考之前的操作。

可以通過agent.agent.llm_chain.prompt.template方法，獲取其推理決策所使用的模板。

2.5.3 自定義Tool

有多種方式可以自定義Tool，最簡單的方式是通過@tool裝飾器，將一個函數轉為Tool。注意函數必須得有docString，其為Tool的描述。

from azure_chat_llm import llm
from langchain.agents import load_tools, initialize_agent, tool
from langchain.agents.agent_types import AgentType
from datetime import date


@tool
def time(text: str) -> str:
    """
    返回今天的日期。
    """
    return str(date.today())




tools = load_tools(['llm-math'], llm=llm)
tools.append(time)
agent_math = initialize_agent(agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                                   tools=tools,
                                   llm=llm,
                                   verbose=True)
print(agent_math("計算45 * 54"))
print(agent_math("今天是哪天？"))

輸出為：

三、LangChain落地實踐

3.1 文檔生成總結

1）通過Loader加載遠程文檔

2）通過Splitter基于Token進行文檔拆分

3）加載summarize鏈，鏈類型為refine，迭代進行總結

from langchain.prompts import PromptTemplate
from langchain.document_loaders import PlaywrightURLLoader
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from azure_chat_llm import llm


loader = PlaywrightURLLoader(urls=["https://content.jr.jd.com/article/index.html?pageId=708258989"])
data = loader.load()


text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=7000,
    chunk_overlap=0
)


prompt_template = '''
作為一個資深編輯，請針對 >>> 和 <<< 中間的文本寫一段摘要。 
>>> {text} <<<
'''
refine_template = '''
作為一個資深編輯，基于已有的一段摘要：{existing_answer}，針對 >>> 和 <<< 中間的文本完善現有的摘要。 
>>> {text} <<<
'''


PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
REFINE_PROMPT = PromptTemplate(
    template=refine_template, input_variables=["existing_answer", "text"]
)


chain = load_summarize_chain(llm, chain_type="refine", question_prompt=PROMPT, refine_prompt=REFINE_PROMPT, verbose=False)


docs = text_splitter.split_documents(data)
result = chain.run(docs)
print(result)

3.2 基于外部文檔的問答

1）通過Loader加載遠程文檔

2）通過Splitter基于Token進行文檔拆分

3）通過FAISS向量存儲文檔，embedding加載HuggingFace的text2vec-base-chinese模型

4）自定義QA的prompt，通過RetrievalQA回答相關的問題

from langchain.chains import RetrievalQA
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.prompts import PromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import FAISS


from azure_chat_llm import llm


loader = WebBaseLoader("https://in.m.jd.com/help/app/register_info.html")
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=800,
    chunk_overlap=0
)
docs = text_splitter.split_documents(data)
#設置自己的模型路徑
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="model")
vectorstore = FAISS.from_documents(docs, embeddings)


template = """請使用下面提供的背景信息來回答最后的問題。 如果你不知道答案，請直接說不知道，不要試圖憑空編造答案。
回答時最多使用三個句子，保持回答盡可能簡潔。 回答結束時，請一定要說"謝謝你的提問！"
{context}
問題: {question}
有用的回答:"""
QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context", "question"], template=template)


qa_chain = RetrievalQA.from_chain_type(llm, retriever=vectorstore.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt": QA_CHAIN_PROMPT})


result = qa_chain({"query": "用戶注冊資格"})
print(result["result"])
print(len(result['source_documents']))

? ? 四、未來發展方向

隨著大模型的發展，LangChain應該是目前最火的LLM開發框架，能和外部數據源交互、能集成各種常用的組件等等，大大降低了LLM應用開發的門檻。其創始人Harrison Chase也和Andrew Ng聯合開發了2門短課程，幫忙大家快速掌握LangChain的使用。

目前大模型的迭代升級特別快，作為一個框架，LangChain也得保持特別快的迭代速度。其開發特別拼，每天都會提交大量的commit，基本隔幾天就會發布一個新版本，其Contributor也達到了1200多人，特別活躍。

個人認為，除了和業務結合落地LLM應用外，還有2個大的方向可以進一步去探索：

1）通過低代碼的形式進一步降低LLM應用的開發門檻。類似langflow這樣的可視化編排工具發展也很快

2）打造更加強大的Agent。Agent之于大模型，個人覺得類似SQL之于DB，能大幅度提升LLM的應用場景

審核編輯：黃飛

閱讀全文

ChatGPT(3870) ChatGPT(3870)
LLM(229) LLM(229)

【比特熊充電棧】實戰演練構建LLM對話引擎

Guardrails 與 Azure OpenAI 結合使用，構建更加安全可靠的 LLM 對話引擎？本期【比特熊充電棧】 NVIDIA 企業

2023-09-19 13:40:04

717

突破邊界：高性能計算引領LLM駛向通用人工智能AGI的創新紀元

ChatGPT的成功帶動整個AIGC產業的發展，尤其是LLM（大型語言模型，大語言模型）、NLP、高性能計算和深度學習等領域。LLM的發展將為全球和中國AI芯片、AI服務器市場的增長提供強勁動力，據估算，LLM將為全球和中國AI服務器帶來約891.2億美元和338.2億美元的市場空間。

2023-06-25 14:31:15

575

對比解碼在LLM上的應用

為了改進LLM的推理能力，University of California聯合Meta AI實驗室提出將Contrastive Decoding應用于多種任務的LLM方法。實驗表明，所提方法能有效改進LLM的推理能力。讓我們走進論文一探究竟吧！

2023-09-21 11:37:55

327

TensorRT-LLM初探（一）運行llama

TensorRT-LLM正式出來有半個月了，一直沒有時間玩，周末趁著有時間跑一下。

2023-11-16 17:39:34

772

基于ICL范式的LLM的最高置信度預測方案

本文假設不同的ICL為LLM提供了關于任務的不同知識，導致對相同數據的不同理解和預測。因此，一個直接的研究問題出現了:llm能否用多個ICL提示輸入來增強，以提供最可信的預測？為解決這個問題，本文提出上下文采樣(ICS)。ICS遵循三步流程:采樣、增強和驗證，如圖1所示。

2023-11-24 11:20:46

863

低比特量化技術如何幫助LLM提升性能

針對大語言模型 (LLM) 在部署過程中的性能需求，低比特量化技術一直是優化效果最佳的方案之一，本文將探討低比特量化技術如何幫助 LLM 提升性能，以及新版 OpenVINO 對于低比特量化技術的支持。

2023-12-08 15:26:45

554

基于OpenVINO和LangChain構建RAG問答系統

隨著生成式 AI 的興起，和大語言模型對話聊天的應用變得非常熱門，但這類應用往往只能簡單地和你“聊聊家常”，并不能針對某些特定的行業，給出非常專業和精準的答案。這也是由于大語言模型（以下簡稱 LLM

2023-12-25 11:10:42

505

使用基于Transformers的API在CPU上實現LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個創新工具包，可基于英特爾架構平臺，尤其是第四代英特爾至強可擴展處理器（代號 SapphireRapids，SPR）顯著加速基于Transformers的大語言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

探索者STM32F407

探索者STM32F407 DEVB_121X160MM 6~24V

2023-03-28 13:06:24

ArkUI開發趣味體驗，快來抽取限量HarmonyOS專屬頭像！

本次ArkUI開發趣味體驗活動，將手把手教大家如何在IDE里實操一個ArkUI程序，通過補充缺失代碼，成功運行程序開啟抽獎功能，抽取個人專屬頭像，做HarmonyOS第一批數字藏品家！同時本期提供

2022-12-08 17:20:47

DIY一款自己專屬的手柄

玩游戲的小伙伴都知道，有的游戲需要使用游戲手柄體驗才會更好，今天就我們來DIY一款自己專屬的手柄！1.設計思路電腦游戲手柄和鼠標鍵盤一樣屬于USBHID設備，Window系統和Linux系統和各種

2021-07-21 09:32:48

HarmonyOS 探索之路——電子書上線啦！

的你還不知道如何上手嗎？快來看看這本電子書下載地址：http://t.elecfans.com/ebook/118.html目錄HarmonyOS 探索之路（1）：開箱體驗HarmonyOS 探索之路

2021-01-28 15:03:07

HarmonyOS初步探索系列文章匯總

文章！鴻蒙初步探索系列：HarmonyOS初步探索01：下載安裝DevEco StudioHarmonyOS初步探索02：開發第一個HarmonyOS應用HarmonyOS初步探索03：DevEco

2020-12-15 14:56:20

IEC61850協議通信的“基石”是什么？

這里給大家介紹一下IEC61850協議通信的“基石”— ASN.1編碼。

2021-05-14 07:15:20

OPPO在5G標準、研發和應用探索方面有哪些布局？

11月15日，在重慶召開的《2018第二屆國際手機產業領袖峰會——5G新世界·AI云生態》論壇上，OPPO全球副總裁劉暢表示，5G可以催生出更多前所未有的應用場景，OPPO正積極構建自身的5G技術能力，并在標準、研發和應用探索全方面的布局。OPPO全球副總裁劉暢

2019-09-11 11:51:52

【下載】《構建嵌入式LINUX系統（第二版）》

Linux內核的*新版本做過*新，并且加入之前未介紹過的程序以便協助你： ·建立你自己的GNU development toolchain(開發工具鏈) ·為你的目標系統選用、設定、構建以及安裝專屬的內核

2018-04-10 18:00:43

便攜設備電源管理設計技巧與難點探索

和通信電源的應用工程師于相旭，帶我們走進電源管理技術的核心，一起探索便攜電源管理技術現在，未來。欲了解便攜設備電源管理技術，請點擊本期話題討論話題討論：構建低功耗不可或缺的電源管理技術嘉賓：Intersil 工業電源和通信電源的應用工程師于相旭{:4_99:}

2014-10-14 16:08:22

利用卷積調制構建一種新的ConvNet架構Conv2Former

1、利用卷積探索一種更高效的編碼空域特征的方式　　本文旨在通過充分利用卷積探索一種更高效的編碼空域特征的方式：通過組合ConvNet與ViT的設計理念，本文利用卷積調制操作對自注意力進行了簡化，進而

2022-12-19 17:37:34

如何使用Arm Compiler 5工具鏈構建一個簡單的C程序

使用Arm編譯器構建hello世界教程向您展示了如何使用Arm Compiler 5工具鏈構建一個簡單的C程序。本教程超越了基礎知識，探索Arm編譯器5工具鏈的一些更高級的功能。本教程假設您已經

2023-08-02 06:57:53

如何量身定做自己的專屬Beacon？

2021-05-20 06:39:17

打造專屬電源方案

錯開の折騰經歷：ESP8266 NodeMCU文章目錄前言一、準備1.材料清單2.設計思路二、焊接三、總結前言繼續之前的項目，現在任務就是將實現的空調控制器集成于一塊pcb板子上，并打造專屬電源方案

2021-11-11 06:39:48

數據探索與數據預處理

目錄1數據探索與數據預處理21.1 賽題回顧21.2 數據探索性分析與異常值處理21.3 相關性分析52特征工程82.1 光伏發電領域特征82.2 高階環境特征112.3 特征選擇113模型構建

2021-07-12 08:37:20

機器學習基石筆記

3）機器學習基石筆記 Lecture3：Types of Learning

2020-05-26 14:53:14

機器學習基石筆記分享

機器學習基石筆記01

2020-06-03 08:14:10

林軒田機器學習基石課程個人筆記

林軒田機器學習基石課程個人筆記-第二講

2020-05-22 07:35:12

正點原子STM32系列——探索者V3開發板評測報告聚合帖

】+I2C驅動OLED jinglixix 【正點原子STM32探索者V3開發板體驗】初識STM32F407開發板【正點原子STM32探索者V3開發板體驗】開發環境的構建與GPIO口的使用【正點

2023-05-10 15:52:16

物聯網的基石-MQTT協議初識

1、物聯網的基石-mqtt協議初識隨著 5G 時代的來臨，萬物互聯的偉大構想正在成為現實。聯網的物聯網設備在 2018 年已經達到了 70 億，在未來兩年，僅智能水電氣表就將超過10億。海量

2022-09-08 16:03:12

精通信號處理設計小Tips（3）：必須掌握的三大基石

，以及對應的硬件設計實現能力；具備通信物理層開發設計各個方面的實戰經驗...　　精通信號處理設計小Tips（3）：必須掌握的三大基石　　信號與信息處理涵蓋的內容相當廣泛，并和自動控制，計算機等其他

2013-12-09 22:25:24

選擇藍牙開發板啟動你的專屬Beacon！

2021-05-21 06:45:22

彩虹AA電池賓得彩色單反專屬

彩虹AA電池賓得彩色單反專屬 2009年11月16日17:59:24

2009-11-16 17:59:34

762

專屬iPhone的兩款時尚充電器

著名的蘋果配件生產商Bracketron公布了最新專屬iPhone 4和IPhone 4S打造的MetalDock充電設備。

2012-05-09 09:05:36

405

e絡盟推出專屬網站平臺，幫助用戶構建并推廣面向TI MCU LaunchPad的全新BoosterPack擴展板

2013年10月21日，e絡盟日前宣布推出全新專屬網站平臺‘構建你的BoosterPack’，為設計師創造自己獨有的BoosterPack提供資源支持。BoosterPack是一款針對TI微控制器

2013-10-22 12:00:58

869

這么萌還不買？紅米Note4X初音專屬配色圖賞

紅米Note 4X 多彩金屬，超長續航，這是我們對國民手機的全新定義。這一次也特地邀請到初音未來，帶來她的專屬配色款。極具特色的初音未來專屬配色，不僅使手機有了一個獨特的外觀，還代表著對未來的無限期待。

2017-03-28 14:34:20

2997

構建專屬于你的CAN-bus應用層協議

隨著CAN-bus相關芯片價格的下降，內置CAN控制器MCU的增多，CAN-bus當前已經進入了眾多早期由于成本問題無法使用的領域，成為極具生命力的現場總線，今天我們就來探討如何構建專屬自己的CAN-bus應用層協議。

2017-05-02 15:31:37

如何構建專屬自己的CAN-bus應用層協議

2017-05-04 15:39:05

954

存儲 IC——現代信息技術的基石

存儲器可以說是大數據時代的基石。

2019-06-06 11:23:32

7592

5G手機需專屬應用場景

本文主要講述了：若無專屬應用場景，5G手機或成為無米之炊

2019-08-15 10:50:37

5639

如何定義一個Blocklet基石程序

Blocklet（基石程序）是供開發者和社區用戶在ArcBlock平臺上創建事物的可重用構建模塊。簡單來說，Blocklet 可以是任何現成的組件、模塊、庫、前端視圖或其他簡化構建 dApp（去中心化應用）過程的工具。

2019-09-30 10:26:43

273

特斯拉Roadster車主的專屬服務

日前據外媒報道，特斯拉向Roadster車主發送了郵件，聲稱將為車主提供包括專屬的服務顧問在內的“專屬渠道”，以改善多年來特斯拉對Roadster車主的服務。并邀請Roadster車主用他們的舊車抵價購買新款特斯拉電動汽車，或者用于購買最新的Roadster跑車。

2019-12-05 16:35:51

2249

屬于使用Keil朋友的專屬文章

一篇屬于使用Keil朋友的專屬文章

2020-03-14 14:38:55

1326

英特爾構建智慧云基石，推動企業在數字經濟時代前進

“后新冠時代”，在線（云）上，人與人的交流變得更加容易。4月底，“英特爾構建智慧云基石”線上沙龍如約舉行，英特爾及合作伙伴的專家們，圍繞著“快捷上云、高效用云、輕松管云”三個核心點，又延展

2020-05-09 14:46:16

3205

高通安蒙：構建無線技術的未來，探索5G未來之路

“What’s Next in 5G”系列視頻迎來了最后一集，將由高通公司總裁兼候任CEO安蒙為大家解析高通將如何構建無線技術的未來，探索5G未來之路。以下為安蒙演講全文： 5G未來

2021-03-02 11:29:57

1512

浪潮存儲助力九寨溝構建智慧產業升級的數據基石

為游客營造信息對稱、安全、舒適、有序、交通順暢的旅游環境，九寨溝借助數字科技技術構建了智慧旅游大數據綜合管理平臺，在堅持以景區生態環境承載量為第一前提的“保護型發展”原則，打造兼顧人與自然

2021-12-30 11:31:22

999

汽車網絡安全左移實踐——基于信任構建汽車安全的探索

2023-02-06 15:06:56

611

LangChain：為你定制一個專屬的GPT

LangChain 可以輕松管理與語言模型的交互，將多個組件鏈接在一起，并集成額外的資源，例如 API 和數據庫。其組件包括了模型（各類LLM），提示模板（Prompts），索引，代理（Agent），記憶等等。

2023-04-24 11:27:23

980

如何利用LLM做多模態任務？

大型語言模型LLM（Large Language Model）具有很強的通用知識理解以及較強的邏輯推理能力，但其只能處理文本數據。雖然已經發布的GPT4具備圖片理解能力，但目前還未開放多模態輸入接口并且不會透露任何模型上技術細節。因此，現階段，如何利用LLM做一些多模態任務還是有一定的研究價值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模態任務

本文整理了近兩年來基于LLM做vision-lanuage任務的一些工作，并將其劃分為4個類別：

2023-05-17 15:02:35

575

LangChain簡介

對 ChatGPT 等應用著迷？想試驗他們背后的模型嗎？甚至開源/免費模型？不要再觀望……LangChain 是必經之路……

2023-05-22 09:14:56

7793

邱錫鵬團隊提出具有內生跨模態能力的SpeechGPT，為多模態LLM指明方向

大型語言模型（LLM）在各種自然語言處理任務上表現出驚人的能力。與此同時，多模態大型語言模型，如 GPT-4、PALM-E 和 LLaVA，已經探索了 LLM 理解多模態信息的能力。然而，當前

2023-05-22 14:38:06

417

LLM性能的主要因素

現在是2023年5月，截止目前，網絡上已經開源了眾多的LLM，如何用較低的成本，判斷LLM的基礎性能，選到適合自己任務的LLM，成為一個關鍵。本文會涉及以下幾個問題：影響LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模態任務？

大型語言模型LLM（Large Language Model）具有很強的通用知識理解以及較強的邏輯推理能力，但其只能處理文本數據。雖然已經發布的GPT4具備圖片理解能力，但目前還未開放多模態輸入接口

2023-05-22 15:57:33

466

如何最好地使用所有可用的 LLM 工具

鑒于價格和質量的廣泛差異，從業者可能很難決定如何最好地使用所有可用的 LLM 工具。此外，如果服務中斷，則依賴單個 API 提供者是不可靠的，這可能發生在意外高需求的情況下。

2023-05-23 17:22:30

525

LLM在各種情感分析任務中的表現如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務，特別是在zero-shot和few-shot方面表現出它們強大的性能。因此，情感分析(SA)領域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

微軟將向美國政府客戶提供OpenAI的GPT模型

微軟增加了對大型語言模型（llm）的支持。openai推出chatgpt后，llm的使用大幅增加，微軟持有openai的股份，許多類型的公司爭相在llm上構建功能。

2023-06-08 10:35:43

759

大型語言模型（LLM）的自定義訓練：包含代碼示例的詳細指南

近年來，像 GPT-4 這樣的大型語言模型（LLM）因其在自然語言理解和生成方面的驚人能力而受到廣泛關注。但是，要根據特定任務或領域定制LLM，定制培訓是必要的。本文提供了有關自定義訓練 LLM 的詳細分步指南，其中包含代碼示例和示例。

2023-06-12 09:35:43

1783

Macaw-LLM：具有圖像、音頻、視頻和文本集成的多模態語言建模

盡管指令調整的大型語言模型 (LLM) 在各種 NLP 任務中表現出卓越的能力，但它們在文本以外的其他數據模式上的有效性尚未得到充分研究。在這項工作中，我們提出了 Macaw-LLM，一種新穎的多模式 LLM，它無縫集成了視覺、音頻和文本信息。

2023-06-19 10:35:33

876

基于Transformer的大型語言模型（LLM）的內部機制

本文旨在更好地理解基于 Transformer 的大型語言模型（LLM）的內部機制，以提高它們的可靠性和可解釋性。隨著大型語言模型（LLM）在使用和部署方面的不斷增加，打開黑箱并了解它們的內部

2023-06-25 15:08:49

991

基于一個完整的 LLM 訓練流程

? ? 在這篇文章中，我們將盡可能詳細地梳理一個完整的 LLM 訓練流程。包括模型預訓練（Pretrain）、Tokenizer 訓練、指令微調（Instruction Tuning）等環節。文末

2023-06-29 10:08:59

1202

把LangChain跑起來的3個方法

使用 LangChain 開發 LLM 應用時，需要機器進行 GLM 部署，好多同學第一步就被勸退了，

2023-07-05 09:59:06

797

最新綜述！當大型語言模型（LLM）遇上知識圖譜：兩大技術優勢互補

LLM 是黑箱模型，缺乏可解釋性，因此備受批評。LLM 通過參數隱含地表示知識。因此，我們難以解釋和驗證 LLM 獲得的知識。此外，LLM 是通過概率模型執行推理，而這是一個非決斷性的過程。對于 LLM 用以得出預測結果和決策的具體模式和功能，人類難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

什么是LangChain？深入地了解一下LangChain

在日常生活中，我們通常致力于構建端到端的應用程序。有許多自動機器學習平臺和持續集成/持續交付（CI/CD）流水線可用于自動化我們的機器學習流程。我們還有像 Roboflow 和 Andrew N.G. 的 Landing AI 這樣的工具，可以自動化或創建端到端的計算機視覺應用程序。

2023-07-14 09:50:57

15274

適用于各種NLP任務的開源LLM的finetune教程~

ChatGLM2-6b是清華開源的小尺寸LLM，只需要一塊普通的顯卡(32G較穩妥)即可推理和微調，是目前社區非?；钴S的一個開源LLM。

2023-07-24 09:04:22

1311

LLM對程序員的沖擊和影響

LLM 對軟件研發的單點提效，我之前錄制過一段視頻，大家可以直接觀看，里面有詳細的演示，我在這里就不再贅述了。

2023-07-24 15:39:06

766

LLM的長度外推淺談

蘇神最早提出的擴展LLM的context方法，基于bayes啟發得到的公式

2023-07-28 17:37:43

1484

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺的需求，然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經支持的Raven系列模型的特殊之處。 MLC-LLM的編譯部署流程

2023-09-04 09:22:46

1569

檢索增強LLM的方案全面的介紹

分分享了 ChatGPT 這類模型是如何一步一步訓練的，后半部分主要分享了 LLM 模型的一些應用方向，其中就對檢索增強 LLM 這個應用方向做了簡單介紹。

2023-09-08 16:39:55

799

mlc-llm對大模型推理的流程及優化方案

在 MLC-LLM 部署RWKV World系列模型實戰（3B模型Mac M2解碼可達26tokens/s）中提到要使用mlc-llm部署模型首先需要一個編譯過程，將原始的基于Realx搭建的模型

2023-09-26 12:25:55

383

新型威脅：探索LLM攻擊對網絡安全的沖擊

最令人擔憂的也許是，目前尚不清楚 LLM 提供商是否能夠完全修復此類行為。在過去的 10 年里，在計算機視覺領域，類似的對抗性攻擊已經被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此，我們認為，在增加對此類人工智能模型的使用和依賴時，應該考慮到這些因素。

2023-10-11 16:28:37

482

Continuous Batching：解鎖LLM潛力！讓LLM推斷速度飆升23倍，降低延遲！

本文介紹一篇 LLM 推理加速技術相關的文章，值得讀一讀。 LLMs 在現實應用中的計算成本主要由服務成本所主導，但是傳統的批處理策略存在低效性。在這篇文章中，我們將告訴

2023-10-15 20:25:02

292

在線研討會 | 基于 Jetson 邊緣計算平臺構建 Azure OpenAI LLM 安全護欄

，并通過自定義方式響應用戶特定的請求，按照預定義的對話路徑進行操作，以及使用特定的語言風格進行回答等。它的核心價值在于通過 Colang 語言來編寫安全護欄，來指導、定義和控制 LLM 驅動的對話機器人在特定主題上的行為，從而構建可靠、安全的 LLM 對話系統。如何在

2023-10-21 16:35:03

215

Hugging Face LLM部署大語言模型到亞馬遜云科技Amazon SageMaker推理示例

?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開源LLMs，比如BLOOM大型語言模型部署到亞馬遜云科技Amazon SageMaker進行推理的示例。我們將部署12B

2023-11-01 17:48:42

422

LLM的Transformer是否可以直接處理視覺Token？

多種LLM Transformer都可以提升Visual Encoding。例如用LLaMA和OPT的不同Transformer層都會有提升，而且不同層之間也會體現不同的規律。

2023-11-03 14:10:15

181

NVIDIA AI Foundation Models：使用生產就緒型 LLM 構建自定義企業聊天機器人和智能副駕

? 系列基礎模型是一套功能強大的全新工具，可用于為企業構建生產就緒生成式 AI 應用，從而推動從客服 AI 聊天機器人到尖端 AI 產品的各種創新。這些新的基礎模型現已加入? NVIDIA NeMo 。這個端到端框架用于構建、自定義和部署專為企業定制的 LLM。企業現在可以使用這些工具快速

2023-11-17 21:35:01

469

LLM的幻覺問題最新綜述

幻覺被描述為無意義或不忠實于所提供源內容的生成內容。根據與源內容的矛盾，這些幻覺又進一步分為內在幻覺和外在幻覺。在LLMs中，幻覺的范圍包含了一個更廣泛、更全面的概念，主要集中在事實錯誤上。本文重新定義了幻覺的分類，為LLM應用程序提供了一個更定制的框架。

2023-11-22 17:40:41

467

基于單一LLM的情感分析方法的局限性

LLM的發展為情感分析任務帶來的新的解決方案。有研究人員使用LLM，在上下文學習(in-context learning, ICL)的范式下，僅使用少量的訓練示例就能夠實現與監督學習策略旗鼓相當的性能表現。

2023-11-23 11:14:27

322

基于Redis Enterprise，LangChain，OpenAI 構建一個電子商務聊天機器人

鑒于最近人工智能支持的API和網絡開發工具的激增，許多科技公司都在將聊天機器人集成到他們的應用程序中。LangChain是一種備受歡迎的新框架，近期引起了廣泛關注。該框架旨在簡化開發人員與語言模型

2023-11-25 08:04:13

178

專欄發布 | LLM圈走馬換將？微軟廣告“黑五”來襲！

過去一年并不平凡。從去年11月至今，LLM大型語言模型持續破圈、始終盤踞熱點話題之列。根據Adobe Analytics的最新在線購物預測，感恩節本土市場假日季的在線收入，或將有

2023-11-27 08:15:02

215

Long-Context下LLM模型架構全面介紹

隨著ChatGPT的快速發展，基于Transformer的大型語言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應用于知識庫、人機界面和動態代理等不同領域。然而，存在一個普遍

2023-11-27 17:37:36

440

Ambarella展示了在其CV3-AD芯片上運行LLM的能力

Ambarella前不久展示了在其CV3-AD芯片上運行LLM的能力。這款芯片是CV3系列中最強大的，專為自動駕駛設計。

2023-11-28 09:05:31

1192

怎樣使用Accelerate庫在多GPU上進行LLM推理呢？

大型語言模型(llm)已經徹底改變了自然語言處理領域。隨著這些模型在規模和復雜性上的增長，推理的計算需求也顯著增加。

2023-12-01 10:24:52

396

如何利用OpenVINO加速LangChain中LLM任務

LangChain 是一個高層級的開源的框架，從字面意義理解，LangChain 可以被用來構建 “語言處理任務的鏈條”，它可以讓AI開發人員把大型語言模型（LLM）的能力和外部數據結合起來，從而

2023-12-05 09:58:14

325

全面解析大語言模型（LLM）

internal feedback：使用LLM去預測生成的plan取得成功的概率、Tree of Thought去對比不同的plan（有點類似AlphaGo的蒙特卡諾搜索的意思）、對中間結果進行評估并作為長期記憶存儲

2023-12-05 14:49:47

857

一文詳解LLM模型基本架構

LLM 中非常重要的一個概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語言的基本單位，中文一般是詞或字（其實字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

優于10倍參數模型！微軟發布Orca 2 LLM

微軟發布 Orca 2 LLM，這是 Llama 2 的一個調優版本，性能與包含 10 倍參數的模型相當，甚至更好。

2023-12-26 14:23:16

247

LangChain 0.1版本正式發布

LangChain 由 Harrison Chase 于 2022 年 10 月推出，是一個開源編排框架，用于使用 LLM 開發應用程序，推出后迅速脫穎而出，截至 2023 年 6 月，它是 GitHub 上增長最快的開源項目。

2024-01-10 10:28:28

391

用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAIGPTs——一個構建定制化AI代理的無代碼“應用商店”，隨后LangChain開發了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架，專用

2024-01-13 08:03:59

521

虹科分享 | 用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAI GPTs——一個構建定制化AI代理的無代碼“應用商店”，隨后LangChain開發了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架，專用于構建定制化的人工智能代理。

2024-01-18 10:39:08

121

2023年LLM大模型研究進展

作為做LLM應用的副產品，我們提出了RLCD[11]，通過同時使用正例和負例prompt，自動生成帶標簽的生成樣本不需人工標注，然后可以接大模型微調，或者用于訓練reward models

2024-01-19 13:55:33

178

LLM推理加速新范式！推測解碼（Speculative Decoding）最新綜述

這個問題隨著LLM規模的增大愈發嚴重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個解碼步只能生成一個token。這導致GPU計算資源利用率

2024-01-29 15:54:24

261

100%在樹莓派上執行的LLM項目

ChatGPT的人性口語化回復相信許多人已體驗過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運作技術，但LLM運作需要龐大運算力，因此目前多是在云端（Cloud）上執行。

2024-02-29 16:29:59

476

基于NVIDIA Megatron Core的MOE LLM實現和訓練優化

本文將分享阿里云人工智能平臺 PAI 團隊與 NVIDIA Megatron-Core 團隊在 MoE (Mixture of Experts) 大語言模型（LLM）實現與訓練優化上的創新工作。

2024-03-22 09:50:37

已全部加載完成

搜索歷史

探索LangChain：構建專屬LLM應用的基石

評論