色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

IBM 專家觀點:IBM 大模型揭秘

IBM中國 ? 來源:未知 ? 2023-11-21 20:40 ? 次閱讀

wKgaomVcplSAaJnSAAUH1WcibZI859.gifwKgaomVcplSAX_SdAAIo1cbXNhk545.png

作者:吳敏達,IBM 科技事業部 數據與人工智能資深技術專家

wKgaomVcplaAKmHiAAHF1HXPkWU495.png ? ? ? ? ? ? ? ? ?

作者簡介:吳敏達是 The Open Group 卓越級技術專家 (Distinguished Technical Specialist),同時擁有計算機技術與軟件專業系統架構設計師技術資格。他現在是 IBM 科技事業部數據與人工智能資深技術專家,擁有 20 多年數據分析軟件相關技術經驗,是 IBM 認證的大數據架構師和 Watson 開發者,專長是大數據、人工智能等領域。他是 IBM Developer 的大師級作者,已經發表了 40 余篇技術文章和教程?,F從事大數據、人工智能相關技術支持和架構設計工作。

wKgaomVcplaAPPFzAABIMULQipw365.png

引言

對企業用戶而言,擁有選擇權對于成功采用人工智能至關重要。對于生成式 AI ,并非所有大模型都是一樣的,一種模型并不適合所有情況:最好的模型將取決于行業、領域和用例。IBM watsonx 為客戶提供一系列模型選擇,包括 IBM 開發的基礎模型、開源模型以及來自第三方供應商的模型,在模型和部署環境兩個維度上提供選擇和靈活性。

更重要的是,模型并不總是越大越好,過大的模型推理成本太高,企業無法承擔運行

wKgaomVcplaAPp8gAADWwajMPko810.png

數據處理

為了支持企業級大模型的訓練,IBM 構建了一個來自學術界、互聯網、企業 (例如金融、法律) 和源代碼的非結構化語言數據的大數據集。這是非常罕見的,也表示了 IBM 對透明度和負責任的 AI 的承諾。

該預訓練數據集是替代開源數據集而創建的專有數據集,開源數據集因包含有毒、有害或盜版內容而受到批評。通過構建 IBM 預訓練數據語料庫解決以上提到的這些問題和其他隱含問題。IBM 大模型訓練中使用的數據集如下:

1. arXiv: 發布到 arXiv 的超過 180 萬篇科學論文預印本。

2. Common Crawl: 開放的可以被網絡爬蟲獲取的存儲庫。

3. DeepMind Mathematics: 數學問答數據。

4. Free Law: 來自美國聯邦和州法院的公共領域法律意見。

5. GitHub Clean: 來自 CodeParrot 的源代碼數據,涵蓋多種編碼語言。

6. Hacker News: 2007-2018 年產生的計算機科學與創業新聞。

7. OpenWeb Text: OpenAI 的 Web 文本語料庫的開源版本,包含到 2019 年的網頁。

8. Project Gutenberg (PG-19): 免費電子書庫,重點關注美國版權已過期的舊作品。

9. Pubmed Central: 生物醫學和生命科學論文。

10. SEC Filings: 美國證券交易委員會 (SEC)1934-2022 年的 10-K/Q 文件。

11. Stack Exchange: Stack Exchange 網絡上所有用戶貢獻內容的匿名集合,這是一個以用戶貢獻的問題和答案為中心的流行網站集合。

12. USPTO: 1975年至2023年5月授予的美國專利,不包括外觀設計專利。

13.Webhose: IBM 獲取的 Web 內容轉換為機器可讀數據集。

14. Wikimedia: 維基項目 (enwiki,enwikibooks,enwikinews,enwikiquote,enwikisource,en- wikiversity,enwikivoyage,enwiktionary)。包含從頁面和文章中提取的純文本。

IBM 精選的預訓練數據集正在不斷增長和發展,其他數據會定期審查并考慮添加到語料庫中。除了增加預訓練數據的大小和范圍外,還會定期生成和維護這些數據集的新版本,以反映增強的過濾功能 (例如,重復數據刪除以及仇恨和臟話檢測) 和改進的工具。

在 granite.13b 進行預訓練時,IBM 在預處理之前收集了 6.48 TB 的數據,在預處理后構建了 2.07 TB 的訓練數據。而 granite.20b.code 在預處理后構建了 100 多種不同編碼語言的 1.6T 的訓練數據,包括 Cobol 和 Ansible。

wKgaomVcpleAIkMNAAMLY9jC9Xk210.png

整個數據預處理管道的各種步驟為模型訓練做好準備,整個過程是在最大的可信企業級數據湖 watsonx.data 上完成的,這是建立在開放式湖倉一體架構之上。預處理過程由以下步驟組成:

1)文本提取

2)重復數據消除

3)語言識別

4)句子拆分

5)仇恨、辱罵和臟話檢測

6)文檔質量注釋

7)網址屏蔽列表注釋

8)過濾

9)標記化

wKgaomVcpleADoFXAAG45qmc9k8914.png

從訓練數據可以看出,IBM 模型為什么可以安全地供企業使用?

  • 根據 IBM 廣泛的數據治理實踐 (對應于數據清理和獲取)對模型進行了審查;文件質量檢查;預處理數據管道,包括標記化、重復數據刪除等。

  • Granite 模型根據 IBM 自己的 HAP (仇恨、辱罵和臟話)檢測器審查的數據進行訓練,以檢測并根除令人反感的內容,并以內部和公共模型為基準。

  • IBM 部署定期、持續的數據保護措施,包括監控以盜版或其他攻擊性材料聞名的網站,并避開這些網站。?

    ?

    ?

模型訓練

第一階段預訓練過程,granite.13b 基礎模型經過 30 萬次迭代訓練,批量大小為 4M 個 Token,總共 1 萬億個 Token。預訓練讓大模型根據輸入生成文本。

第二階段監督微調過程,使用來自不同來源的數據集混合執行監督微調,每個示例都包含一個提示和一個答案,執行3個周期獲得 granite.13b.instruct 模型。

第三階段對比微調過程,懲罰來自負數據分布的數據點概率,同時增加來自正數據分布的數據點的概率。換句話說,我們不鼓勵大模型為每個訓練提示生成錯對齊的答案 (例如有害的答案),同時鼓勵對齊的答案 (例如有用的答案)。通過防止模型輸出出現幻覺和錯位,最后獲得 granite.13b.chat 模型。

wKgaomVcpleAbjE5AAIoCXnHjqc886.png

IBM 用于訓練基礎模型的主要計算基礎設施是 AI 優化的云原生超級計算機 Vela [2],每個 Vela節點:

? 8 個 80GB A100 GPU

? 96 CPU

? 1.5TB 的 DRAM

? 4 個3.2TB NVMe 固態硬盤

? 600GBps GPU 高可用網絡連接

? 1.6TB 跨機架帶寬

wKgaomVcpleAGmxBAAOIrQN2WRI975.png

granite.13b.v1 大模型是在較舊的基礎設施上訓練的,使用了 256 個 A100 GPU,花費了 1056 GPU Hours。而 granite.20b.code 大模型是在更新的基礎設施上訓練的,使用了 768 個 A100 GPU。

應用場景

Granite 大模型支持所有 5 個 NLP 任務 (問答、生成、提取、總結、分類),這些任務針對跨多個領域的業務目標數據進行訓練,以提供最相關的見解。IBM 訓練的 AI 模型可以通過快速的工程技術進一步定制,以滿足特定的企業任務,從而在 watsonx.ai 中實現更高的準確性和實現價值的時間。最終可以使用企業數據針對獨特的下游任務調整模型,例如,針對正在進行的以 NLP 為中心的任務進行提示調整。

企業需要的模型一定是學到企業的專用知識,當使用 IBM 開發的模型來創建差異化的 AI 資產時,可以進一步定制 IBM 模型以滿足特定的下游任務。 通過提示工程和微調技術,客戶可以負責任地使用自己的企業數據來提高模型輸出的準確性,從而創造競爭優勢。watsonx.ai 可以進行本地部署,從而實現數據的合規和安全。

wKgaomVcpleAe84zAAGvMdDsx-w096.png

Granite 大模型采用了特定領域的企業數據,10% 的訓練數據來自法律和金融,這使得信用風險評估、保險 QA、對話式金融 QA 和總結等財務任務具有卓越的性能。因此,金融服務領域的客戶 (銀行、保險、金融)或有法律需求的客戶,Granite 是一個值得推薦的絕佳模型。另外 Granite.13b 需要更少的 GPU 資源實現金融任務的卓越性能,從而實現更高的性價比。基于 IBM Research 的初步評估和測試 ,涵蓋 11 種不同的金融任務,結果表明 granite-13b 是金融任務中表現最佳的模型之一,評估的任務包括:提供股票和財報電話會議記錄的情緒評分、對新聞標題進行分類、提取信用風險評估、總結金融長篇文本以及回答金融或保險相關問題。在測試中,granite-13b 的速度比業界 70b 的大模型快 3 倍,GPU 資源消耗減少 1/4。令人欣喜的是,granite.13b.v2 也正在緊鑼密鼓的開發訓練中,通過添加多語言的語料訓練,實現多語言支持。

在代碼領域,granite.20b.code 分為 cobol 和 ansible 的兩個變體,granite.20b.code.cobol 可在 IBM Z 上更快地將 COBOL 語言轉換為 Java 語言,從而提高開發人員的工作效率;而 granite.20b.ansible 旨在為 IT 運營自動化生成 ansible 劇本。

治理和管控

IBM 的 AI 開發方法以基于信任和透明度承諾的核心原則為指導,堅信要負責任地創建、部署和利用 AI 模型來推動業務創新。

在 Granite 模型開發中利用 watsonx.governance 進行基礎模型生命周期治理,通過基準測試評估模型質量,打包并標記通過測試的模型,創建模型名片,記錄模型細節,合并數據名片與模型名片,形成模型事實。支持大模型特定指標收集和警報,提升公平性和責任 (例如監控濫用和褻瀆行為),通過源屬性解釋大模型輸出,提供大模型使用指南和最佳實踐。

wKgaomVcpliAaRitAAF-pRiFt3A630.png

采用生成式 AI 的首要障礙是對數據血緣或來源的擔憂,為了更好地理解為其智能系統提供數據的數據,通過IBM 最新收購的數據血緣廠商 Manta[3],提高了 watsonx 內部的透明度,以便企業可以確定其 AI 模型和系統是否使用了正確的數據、數據的起源、演變方式以及數據流中的任何差異。

總結

考慮到開放和單一模型無法滿足每個業務用例的獨特需求,Granite 系列正在開發不同參數大小的模型。同時 IBM 定期從開源大模型中從性能、倫理、法律、數據等角度選擇和審查商業適用性最合適的更新到 watsonx 平臺中。借助這些模型和 watsonx,幫助企業成為 AI 價值創造者,可以將企業專有數據引入 IBM 大模型和開源模型,構建適合其業務和用例的獨特模型。

  • 面向平臺的方法:watsonx 是一個在 OpenShift 上運行的平臺,具有 AI 推理功能并運行 Ray 和 PyTorch 等開源技術。 客戶可以將其部署在自己選擇的基礎架構中,從而可以安全地與企業數據集成。采用私有化部署,無需額外擔心數據安全和主權。

  • 客戶保護: IBM 標準的知識產權保護 (與其為硬件和軟件產品提供的知識產權保護相類似) 將適用于由 IBM 開發的 watsonx 模型。IBM 為其基礎模型提供 IP 賠償 (合同保護),使其客戶能夠更有信心地使用他們的數據來構建 AI ,這是生成式 AI 競爭優勢之所在。客戶可以使用他們自己的數據和由 IBM 基礎模型所提供的客戶保護、準確性和信任來開發他們的 AI 應用程序。

  • 數據和人工智能治理:隨著監管人工智能,全球客戶面臨著利用人工智能安全創造價值的壓力。 IBM watsonx 擁有全面、領先的 AI 和數據治理產品組合,提供模型治理、監控,獨有的仇恨、辱罵和臟話檢測過濾器,支持管理監管要求,以便客戶能夠以負責任、安全和合乎道德的方式擴展 AI。

參考資料

[1] https://www.ibm.com/downloads/cas/X9W4O6BM

[2] https://research.ibm.com/blog/AI-supercomputer-Vela-GPU-cluster

[3]https://newsroom.ibm.com/IBM-acquires-Manta-Software-Inc-to-complement-data-and-AI-governance-capabilities


關于 IBM

IBM 是全球領先的混合云、人工智能及企業服務提供商,幫助超過 175 個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,并獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的超過 4000 家政府和企業實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業云解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。

了解更多信息,請訪問:https://www.ibm.com/cn-zh

END 往期回顧

→新發聲&強陣容|齊聚 IBM 企業數據合規治理研討會

制造企業采用 IBM App Connect 打敗應用集成“攔路虎”

wKgaomVcplmARvWxAAU4T0HTDmg558.gif

wKgaomVcplmAU9D1AAEa0eKWCBI781.gif ? ?

wKgaomVcplmACZZoAABAYCxzKA8111.gif

點擊“閱讀原文”,獲取更多內容


原文標題:IBM 專家觀點:IBM 大模型揭秘

文章出處:【微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1755

    瀏覽量

    74677

原文標題:IBM 專家觀點:IBM 大模型揭秘

文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    IBM TechXchange 2024精彩前瞻

    IBM TechXchange 大會是全球開發者和技術愛好者的年度盛會,為全世界的技術專家和業務人員提供針對其行業和專業的實踐學習。對于開發人員來說,這是一個深入了解 IBM 解決方案核心并保持其技能處于創新前沿的機會,每年在大
    的頭像 發表于 12-05 15:34 ?215次閱讀
    <b class='flag-5'>IBM</b> TechXchange 2024精彩前瞻

    IBM將在云平臺部署AMD加速器

    IBM與AMD近期宣布了一項重要合作協議,根據協議,IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業客戶在生成式AI模型方面的性能和能效,進一步推動AI技術的創新與應用。
    的頭像 發表于 11-19 16:24 ?213次閱讀

    IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器

    近日,全球領先的科技企業IBM與AMD共同宣布了一項重要合作。雙方計劃在IBM云上部署AMD的Instinct MI300X加速器服務,以滿足企業客戶對于高性能和高效能AI模型的需求。 據悉,這項
    的頭像 發表于 11-19 11:03 ?442次閱讀

    IBM推出高性能AI模型Granite 3.0

    在近日舉行的IBM年度TechXchange大會上,IBM正式推出了其最先進的AI模型家族——Granite 3.0。這款旗艦級語言模型代表了IBM
    的頭像 發表于 10-28 17:39 ?448次閱讀

    IBM發布Granite 3.0 AI模型家族

    IBM在近日舉行的年度TechXchange大會上,正式推出了其迄今為止最先進的AI模型家族——Granite 3.0。這一系列的發布標志著IBM在人工智能技術領域的又一次重大突破。
    的頭像 發表于 10-23 17:09 ?435次閱讀

    IBM發布面向企業的人工智能模型新版本

    近日,IBM正式發布了其面向企業的人工智能模型——Granite 3.0的最新版本,旨在抓住當前企業紛紛擁抱生成式AI技術的熱潮。與IBM Granite系列中的其他AI模型一樣,Gr
    的頭像 發表于 10-22 17:32 ?450次閱讀

    IBM關閉中國研發部門

    IBM近期宣布了一項重大戰略調整,決定將其在中國系統實驗室的基礎設施業務研發工作全面撤出,并轉移至海外其他IBM基礎設施基地。這一決定背后,是中國市場近年來基礎設施業務面臨的挑戰與下滑趨勢。為更好地把握全球市場機遇,IBM作出了
    的頭像 發表于 08-27 15:58 ?507次閱讀

    IBM Granite系列模型被Forrester評為“強勁表現者”

    近日,IBM 憑借其旗艦 Granite 系列模型,在 2024年第二季度的《Forrester Wave:語言 AI 基礎模型》報告中,被評為“強勁表現者”。
    的頭像 發表于 08-16 11:34 ?461次閱讀

    IBM開源AI模型,推動AI企業化應用

    IBM近日宣布,將把一系列先進的人工智能模型以開源軟件的形式發布,此舉標志著人工智能技術在企業應用上的新篇章。公司表示,隨著watsonx平臺推出滿一年,該平臺將迎來重大更新,新增的數據和自動化功能將使企業能夠更輕松地集成和部署AI技術。
    的頭像 發表于 05-22 09:25 ?487次閱讀

    紅帽發布RHEL AI開發者預覽版,集成IBM Granite模型,簡化AI開發流程

    RHEL AI依托InstructLab開源項目,結合IBM Research的開源授權Granite大型語言模型與InstructLab模型對齊工具,采用LAB(Large-scale Alignment for chatBo
    的頭像 發表于 05-08 15:01 ?485次閱讀

    IBM推出IBM Storage Assurance這一全新的IT生命周期管理模式

    近日,IBM 推出了 IBM Storage Assurance 這一全新的 IT 生命周期管理模式,旨在為客戶的數據中心提供靈活的選擇與控制,以最大程度提高性能。
    的頭像 發表于 05-08 14:09 ?418次閱讀

    IBM將收購軟件公司HashiCorp

    科技巨頭IBM近日宣布,將斥資64億美元以每股35美元的價格現金收購知名軟件公司HashiCorp。此次收購旨在進一步增強IBM在云計算和基礎架構管理領域的實力。
    的頭像 發表于 05-06 10:35 ?537次閱讀

    IBM已同意收購HashiCorp 估值64億美元

    IBM已同意收購HashiCorp 估值64億美元 IBM公司計劃以每股35美元的價格收購云軟件開發商HashiCorp,支付方式為現金,預計將在2024年底之前完成。這家總部位于舊金山
    的頭像 發表于 04-25 16:36 ?537次閱讀

    2023 “IBM 影響力”報告

    4月 11日,IBM 發布 2023年“IBM 影響力”報告。該報告總結了公司 2023年在環境、社會和治理 (ESG) 方面實施的舉措、合作伙伴以及投資情況,以便持續推進構建更加可持續未來的目標
    的頭像 發表于 04-21 09:36 ?607次閱讀

    IBM在watsonx上提供開源的Mistral AI模型

    IBM 提供 Mixtral-8x7B 的優化版本,該版本可將延遲時間最多縮短 75% IBM、第三方和開源模型的目錄不斷增加,為客戶提供更多選擇和靈活性 是 watsonx 人工智能與數據平臺
    的頭像 發表于 03-12 19:10 ?1327次閱讀
    主站蜘蛛池模板: 野花日本韩国视频免费高清观看| xxx暴力xxx| 色偷拍自怕亚洲在线| 精品国产在线手机在线| 99久久免费精品国产免费| 无遮18禁在线永久免费观看挡| 九九热在线观看视频| 国产精品久久久久久久久爆乳| 777ZYZ玖玖资源站最稳定网址| 亚洲精品不卡视频| 色欲精品久久人妻AV中文字幕| 久久精品热99看二| 九九热在线视频精品店 | 亚洲AV日韩AV欧美在线观看网| 秋霞三级理伦免费观看| 美女脱了内裤张开腿让男人桶到爽| 国产色欲一区二区精品久久呦| 99视频国产在线| 999资源站| 97午夜伦伦电影理论片| 在线国内自拍精品视频| 一级毛片西西人体44rt高清| 亚洲国产成人久久一区www妖精| 污污内射在线观看一区二区少妇 | 午夜影院费试看黄| 三级视频网站| 外国三级片名| 天天爽夜夜爽| 亚洲AV久久久噜噜噜噜| 亚洲精品卡2卡3卡4卡5卡区| 亚洲黄色片免费看| 孕妇高潮抽搐喷水30分钟| 影音先锋男人资源813.| 最新无码国产在线视频2020| 51成人精品午夜福利AV免费七| 992交通广播| 国产VA精品午夜福利视频| 国产欧美一区二区精品性色tv| 黑人寄宿羽月希产后奶水| 久久精品在现线观看免费15| 内射老妇BBX|