本文最初發布于 THENEWSTACK 博客。自 2022 年 11 月推出 ChatGPT 以來,OpenAI 一直受到知識工作者、開發人員以及幾乎所有互聯網和 Web 用戶的廣泛關注。但是,OpenAI 已經成立很長時間了,甚至在 ChatGPT 創建之前就已經存在了,而且為開發人員提供了許多令人興奮的服務。它是首批通過簡單 REST API 端點開放生成式 AI 的平臺公司之一。
下載鏈接:ChatGPT:AI模型框架研究(2023)華為AI盤古大模型研究框架(2023) 《70+篇半導體行業“研究框架”合集》 《人工智能AI大模型技術合集》信創從“芯”開始
這是 OpenAI 系列文章的第一篇,我們將探討 OpenAI 的總體情況及其平臺架構。通過這篇文章,我們將了解 OpenAI 平臺的基本原理和基本構建模塊。
OpenAI:生成式 AI 民主化
OpenAI 成立于 2015 年,是由 Ilya Sutskever、Greg Brockman、Trevor Blackwell、Vicki Cheung、Andrej Karpathy、Durk Kingma、John Schulman、Pamela Vagata 和 Wojciech Zaremba 等人創立的一家非營利性研究機構。Sam Altman 和 Elon Musk 是初始董事會成員。
微軟在 2019 年宣布投資 10 億美元,并在今年早些時候宣布了新一輪 100 億美元的投資,OpenAI 成了人們關注的焦點。企業投資者包括 Infosys 和 Khosla,個人投資者則包括 Reid Hoffman、Peter Thiel 和 Jessica Livingston。
雖然人們經常批評 OpenAI 從一家非營利性人工智能公司轉變為一家商業人工智能公司,但它一直處于生成式人工智能研究的前沿。得益于和微軟的合作伙伴關系,它獲得了由 Azure 計算服務提供支持的最先進的基礎設施。
關于 OpenAI 的歷史和發展情況,這里就不過多介紹了。現在我們看下該公司的現狀。
生成式人工智能模型使用大型數據集基于無監督學習(稱為基礎模型)進行訓練。在比較高的層面上,OpenAI 包括三個關鍵的基礎模型:GPT、DALL-E 和 Whisper。GPT 是訓練用來處理文本內容的最流行的模型之一。DALL-E 可以基于自然語言輸入生成圖像。最后,Whisper 是一個將語音轉換為文本并將一種語言翻譯成另一種語言的模型。
OpenAI 支持的所有用例和生成式 AI 場景都是圍繞著這三個基礎模型。其中,由于 ChatGPT 的成功,GPT 獲得的關注最多。ChatGPT 是基于 GPT 模型的最新版本 GPT-4 的。GPT 模型有多種變體,可以分別支持單詞補全、交互式聊天、校訂、改寫、摘要和文本分類等場景。類似地,DALL-E 可用于創建、編輯圖像及生成圖像變體。Whisper 模型可用于音頻文件的轉錄和翻譯。
為了方便開發人員嵌入生成式人工智能,OpenAI 已經公開了多個與應用場景對應的 API。為了集成 GPT 或 DALL-E 等模型,開發人員必須獲得 API 密鑰并使用它來訪問 Open AI REST 端點。
OpenAI API 使人們可以通過簡單的 REST 接口訪問最先進的語言和視覺模型,從而使生成式 AI 民主化。任何了解如何使用 API 的開發人員都可以將生成式 AI 的強大功能嵌入到其應用程序中。他們既不需要理解神經網絡背后的復雜數學運算,也不需要訪問基于高端 CPU 和 GPU 的強大的計算基礎設施。
OpenAI 的基礎模型可以通過自定義的私有數據集進行調優。然后,可以使用調優后的模型在私有數據上進行推理,大幅提高生成式人工智能的價值。OpenAI 已經將調優功能作為一個 API 公開,它可以接受基礎模型的變種和自定義數據集。
下圖概括了 OpenAI 平臺的架構。最底層由基礎模型組成,上面一層是各種模型變體,每一個都針對特定的用例做了優化。最上層是 REST API,它通過廣為人知的端點公開模型。
探索 OpenAI 生態系統
OpenAI 構建了面向開發人員和最終用戶的工具、SDK 和服務。ChatGPT 就是一個面向最終用戶的服務的示例。OpenAI 主要利用 ChatGPT 從用戶那里獲得交互式反饋,這對改進 GPT 模型有很大的幫助。它還利用輸入和提示來分析用戶與模型的交互方式。
OpenAI 為開發人員提供了一個操練場,可以作為 REST API 的交互界面,用于測試調優后的模型如何響應相同的輸入或提示。開發人員還可以用它來調整影響模型準確性和創造性的參數。
雖然使用 cURL 這樣的工具調用 REST API 很簡單,但 OpenAI 官方提供了一個 Python 庫,可以簡化 Jupyter Notebook 等環境中的 API 消費。對于那些喜歡使用 JavaScript 的人,官方還提供了一個 Node.js 庫工具。OSS 社區已經針對 C#、C++、Go、Kotlin 和 Swift 等語言構建了各種庫。
下圖展示了通過 cURL 調用 /vi/completions API:
同樣,也可以通過 OpenAI 官方維護的 Python 庫完成:
OpenAI 還發布了將消息轉換為詞元的工具和庫——那是 GPT 等大型語言模型的基本輸入單元。這些工具可以幫助開發人員評估使用 OpenAI API 所涉及的成本。當你通過 PIP 安裝 Python 庫時,還可以獲得一個方便的 API 測試 CLI。
如果你是微軟 Azure 開發人員,則可以注冊 Azure OpenAI 服務,它與微軟的云服務實現了緊密的集成,如活動目錄、虛擬網絡、基于角色的訪問控制等。
在本系列的下一篇文章中,我們將深入探討提示工程以及它在處理 GPT 方面的重要性。原文鏈接:https://thenewstack.io/beyond-chatgpt-exploring-the-openai-platform/
-
AI
+關注
關注
87文章
30758瀏覽量
268903 -
人工智能
+關注
關注
1791文章
47206瀏覽量
238278 -
OpenAI
+關注
關注
9文章
1082瀏覽量
6483
原文標題:探析OpenAI平臺架構
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論