色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

再登Nature!DeepMind大模型突破60年數學難題,解法超出人類已有認知

智能感知與物聯網技術研究所 ? 來源:未知 ? 2023-12-24 21:40 ? 次閱讀

用大模型解決困擾數學家60多年的問題,谷歌DeepMind最新成果再登Nature。

作者之一、谷歌DeepMind研究副總裁Pushmeet Kohli表示:訓練數據中不會有這個方案,它之前甚至根本不為人類所知。wKgaomWINd2AezVoAAKzsiAJhHY279.png

論文鏈接:

https://www.nature.com/articles/s41586-023-06924-6這項技術名為FunSearch,其中的Fun是函數(Function)一詞的簡寫。利用大模型解決長期存在的科學難題,產生以前不存在可驗證有價值*的新信息。在Nature論文配套的新聞解讀中,DeepMind負責人稱“我們使用大模型的方式是當做創造力引擎”。這是第一次有人證明基于大模型的系統可以超越數學家和計算機科學家的認知。它不僅新穎,而且比當今存在的任何其他東西都更有效。wKgaomWINd2ATrXzAACn_ApD4vE962.png針對這項成果,有網友感慨:

如果這是真的,那可是人類自火之后最重要的發現了。

wKgaomWINd6AFdrTAAIyhtwYDJ0069.png

那么,FunSearch都解決了哪些問題呢?

wKgaomWINd6ALN2nAAAl6LOgh3c829.png

找到NP-hard問題更優解法

DeepMind具體展示了兩類問題,它們都屬于NP-hard問題。在學界看來,沒有而且可能永遠也不會有一種算法能在所有情況下都在多項式時間內找到NP-hard問題的精確解。面對這樣的問題,研究者通常會尋找近似解或適用于特定情況的有效算法。具體到FunSearch,它解決的第一類NP-hard問題是Cap set問題,是上限集問題的一種,它的描述是這樣的:在一個n維空間中的每個維度上都有等距的n個點(共n^n個,比如3維就是3*3*3),從中找出盡可能多的點構成一個集合,要求集合中任選3個點均不共線,這樣的集合中最多有多少個點?wKgaomWINd6AfWzhAAGVmc8zTCA668.png如果看上去有些難以理解,不妨再了解一下Cap set問題的前身——上世紀70年代遺傳學家Marsha Falco發明的一套卡牌游戲。這套卡牌游戲中一共有81張牌,每張牌中都有1至3個顏色圖案,同一張牌中的圖案顏色、形狀和陰影完都全相同。這套牌一共有3種顏色、3種形狀和3種陰影,加上圖案數量的不同,一共有3*3*3*3=81張,玩家需要翻開一些紙牌,找到3張牌的特殊組合。 如果把這種“特殊組合”的具體方式用離散幾何形式進行表達,就得到了Cap set問題。Cap set問題同樣誕生于70年代,由牛津大學數學家Ron Graham提出,而第一個重要結果直到90年代才出現。2007年,陶哲軒在一篇博客文章中提到,這是他最喜歡的開放式數學問題。wKgaomWINd6ANGmdAATRFNvFFsM883.png在FunSearch出現之前,Cap set問題最重大的突破是美國數學家Jordan Ellenberg和荷蘭數學家Dion Gijswijt于2016年提出的。通過多項式方法,Ellenberg和Gijswijt將n>6時(n≤6時可精確找到最大集合)此類問題解的上確界縮小到了2.756^n。wKgaomWINd-AMH1sAAGS1qWJbUU236.png同樣在n>6時,下確界的較新數字則是2.218^n,由布里斯托大學博士生Fred Tyrrell在2022年提出。但這個下確界僅僅存在于理論上——當n=8時,人類能構建出的最大集合中只有496個點,而按照Tyrrell的結論,點的數量應不少于585.7個。FunSearch則將集合規模擴大到了512個點——雖然和理論值依舊存在差距,但仍被視為20年來在此問題上最重大的突破wKgaomWINd-AXxlmAABalEG3QJs762.png同時,Cap set集合大小的下確界也被FunSearch提高到了2.2202^n。wKgaomWINd-AQXMeAAFk5UQIuSs213.png第二類是在線裝箱問題假設有一組容量為C的標準集裝箱和n個物品序列(物品大小不超過C),這些物品按一定順序到達。“在線”是指操作者無法事先看到所有的物品,但必須在物品到達時立刻決定將物品裝入哪個集裝箱。最終的目標,是使所用集裝箱數量盡可能小。在線裝箱問題引起廣泛研究是從上世紀70年代開始的,最早更是可以追溯到1831年高斯所研究的布局問題。 經過近200年的研究,仍然沒有成熟的理論和有效的數值計算方法。傳統上常用的貪心算法包括First Fit和Best Fit兩種:
  • First Fit是指將每個物品放入第一個能容納它的箱子中。
  • Best Fit則是將每個物品放入能容納它的且箱子中剩余空間最小的箱子。
而FunSearch則提出了新的算法,該算法在OR和Weibull兩個測試數據集中,所用集裝箱的數量均大幅下降。wKgaomWINd-AdgfgAAesLHq5nv8241.gif特別是在當測試集物品數目達到10萬時,FunSearch找到的方案,消耗集裝箱數量只比理論下界多出了0.03%。(下表中的數據表示與理論下界的差異,數字越小表現越好)wKgaomWINeCAU4KQAAFMoCupzj8777.png那么,FunSearch是如何實現的呢? wKgaomWINeCAVv2sAAAuhh9-KLM271.png搜索“程序”而不是“答案”整體上看,FunSearch的工作流程是一個迭代過程,核心是搜索能解決問題的程序,而不是問題答案本身。搜索,正是DeepMind自AlphaGo以來一直堅持探索的路線。聯合創始人Shane Legg曾在一次訪談中作出解釋:AlphaGo擊敗李世石的關鍵“第37步”從何而來?不是來自人類對弈數據,而是來自對概率空間的搜索。當前大模型只是模仿、混合不同的訓練數據,要想產生真正的創造力并超越目前的架構,就需要結合搜索。 回到最新成果FunSearch,系統當中有一個程序庫,每次迭代時,系統會從其中搜索初始程序并輸入大模型(實驗用PaLM2,其他只要支持代碼也兼容)。大模型在此基礎上構建生成新的程序,并交給自動評估系統,得分最高的程序會被加入程序庫,從而實現自我循環。wKgaomWINeCAcWR5AAGq8R37CCg920.png其中,評估系統會根據用戶的問題生成測試用例,然后判斷候選程序的輸出是否正確。根據復雜程度不同,判斷正誤的方法既包括直接檢查輸出值,也包括對相關函數進行調用。同時評估系統還設置有容錯邏輯,避免超時等問題影響整體流程。最終,系統會根據備選程序在這些測試用例上的行為給出整體評分,為結果生成和后續程序庫更新提供依據。論文合著者威斯康星大學麥迪遜分校的Jordan Ellenberg認為,FunSearch的一個重要特點是,人們可以看到AI產生的成功解決方案并從中學習,與之前AI的黑箱模式完全不同。對我來說最令人興奮的是建立人機協作的新模式,我不希望用它們來替代人類數學家,而是作為力量倍增器。 wKgaomWINeGAPe9GAAAC0jQz1zo609.svg

參考文獻

wKgaomWINeGAPe9GAAAC0jQz1zo609.svg ?

[1]https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/
[2]https://www.technologyreview.com/2023/12/14/1085318/google-deepmind-large-language-model-solve-unsolvable-math-problem-cap-set/
[3]https://www.nature.com/articles/d41586-023-04043-w

· ·


原文標題:再登Nature!DeepMind大模型突破60年數學難題,解法超出人類已有認知

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2909

    文章

    44557

    瀏覽量

    372789

原文標題:再登Nature!DeepMind大模型突破60年數學難題,解法超出人類已有認知

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【「大模型啟示錄」閱讀體驗】對大模型更深入的認知

    閱讀《大模型啟示錄》這本書,我得說,它徹底顛覆了我對大模型的理解。作為一個經常用KIMI和豆包這類AI工具來完成作業、整理資料的大學生,我原以為大模型就是這些工具背后的技術。但這本書讓我意識到
    發表于 12-20 15:46

    光電效應的數學模型及解析

    光電效應是指光照射在物質上,引起電子從物質表面逸出的現象。以下是光電效應的數學模型及詳細解析: 一、光電效應的基本數學模型 光子能量公式 : 表達式:E = hν 含義:E代表光子的能量,h是普朗克
    的頭像 發表于 11-25 13:46 ?616次閱讀

    Kimi發布新一代數學推理模型k0-math

    近日,Kimi正式推出了其新一代數學推理模型k0-math。據基準測試顯示,該模型數學能力可與全球領先的OpenAI o1系列中的o1-mini和o1-preview
    的頭像 發表于 11-18 11:38 ?418次閱讀

    具身智能與人類認知能力的關系

    在人工智能和認知科學的交匯點上,具身智能這一概念應運而生。它挑戰了傳統的以大腦為中心的認知模型,強調身體和環境在智能行為中的核心作用。 一、具身智能的定義與起源 具身智能的概念最早由心理學家
    的頭像 發表于 10-27 09:43 ?364次閱讀

    顛覆認知:大模型不可靠最新研究登上 Nature

    行業芯事行業資訊
    電子發燒友網官方
    發布于 :2024年09月27日 11:40:10

    數學建模神經網絡模型的優缺點有哪些

    數學建模神經網絡模型是一種基于人工神經網絡的數學建模方法,它通過模擬人腦神經元的連接和信息傳遞機制,對復雜系統進行建模和分析。神經網絡模型在許多領域得到了廣泛應用,如圖像識別、語音識別
    的頭像 發表于 07-02 11:36 ?896次閱讀

    清華類腦視覺芯片取得重大突破,“天眸芯”登上Nature封面

    突破了傳統視覺感知芯片在穩定性和安全性等方面的性能瓶頸。 ? 天眸芯:受人類視覺系統啟發的互補雙通路類腦視覺
    的頭像 發表于 06-01 00:54 ?4701次閱讀
    清華類腦視覺芯片取得重大<b class='flag-5'>突破</b>,“天眸芯”登上<b class='flag-5'>Nature</b>封面

    谷歌DeepMind發布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發現和疾病治療領域發揮巨大作用。
    的頭像 發表于 05-10 11:26 ?586次閱讀

    【大語言模型:原理與工程實踐】大語言模型的應用

    ,它通過抽象思考和邏輯推理,協助我們應對復雜的決策。 相應地,我們設計了兩類任務來檢驗大語言模型的能力。一類是感性的、無需理性能力的任務,類似于人類的系統1,如情感分析和抽取式問答等。大語言模型在這
    發表于 05-07 17:21

    【大語言模型:原理與工程實踐】大語言模型的評測

    在知識獲取、邏輯推理、代碼生成等方面的能力。這些評測基準包括語言建模能力、綜合知識能力、數學計算能力、代碼能力和垂直領域等多個維度。對于微調模型,對話能力的評測關注模型在對話任務中的全維度能力,而
    發表于 05-07 17:12

    三相SVPWM電壓型逆變器的數學模型

    通過前面得出的dq坐標系下的數學模型,進一步可以得到dq坐標系下的變壓器模型。通過這種模型可以幫助我們更好的去理解dq坐標系下的數學模型
    發表于 04-06 04:27 ?2998次閱讀
    三相SVPWM電壓型逆變器的<b class='flag-5'>數學模型</b>

    谷歌DeepMind推出SIMI通用AI智能體

    和視頻游戲中理解并遵循自然語言指令。這一突破性的技術成果標志著人工智能領域的一大步,使得機器能夠更好地理解和適應人類的各種需求。
    的頭像 發表于 03-18 11:39 ?953次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌DeepMind團隊開發的一款大型語言模型
    的頭像 發表于 03-01 16:20 ?651次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據報道,谷歌公司的DeepMind團隊近期發布了AI模型Genie,此模型擁有多達110億個參數,能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。
    的頭像 發表于 02-27 14:53 ?773次閱讀

    科大訊飛發布星火認知模型V3.5

    科大訊飛近日發布了星火認知模型V3.5版本,該版本基于全國產化算力底座“飛星一號”平臺進行訓練。與訊飛星火V3.0相比,V3.5在邏輯推理、文本生成、數學答題及小樣本學習能力等方面均實現了顯著提升。
    的頭像 發表于 01-31 14:40 ?890次閱讀
    主站蜘蛛池模板: 色欲人妻无码AV精品一区二区| 麻豆成人啪啪色婷婷久久| 国产在线精品亚洲另类| 和搜子的日子 在线观看| 娇小8一12xxxx第一次| 久久偷拍人| 欧美日韩高清一区二区三区| 全肉高H短篇合集| 无码AV毛片色欲欧洲美洲| 亚洲黄色高清| 最近日本字幕MV免费观看在线| 97午夜伦伦电影理论片| 成人无码精品1区2区3区免费看 | av在线色| 粉色视频午夜网站入口| 国产亚洲精品久久久久久一区二区 | 无码人妻少妇色欲AV一区二区| 羞羞一区二区三区四区片| 一本色道久久88综合日韩精品| 91看片淫黄大片.在线天堂| 大桥未久电影在线观看| 果冻传媒视频在线观看完整版免费| 久久久精品国产免费A片胖妇女 | 免费看 a一级毛片| 色怕怕| 一个色综合久久| 白丝美女被狂躁免费漫画| 国产小视频免费看| 美女扒开腿让男生桶免费看动态图| 日产国产欧美韩国在线| 亚洲日韩中文字幕日本有码| 99视频久九热精品| 国产午夜精品一区二区理论影院| 久久蜜视频| 挺弄抽插喷射HH| 748亚洲大胆国模人体| 国产国产成年在线视频区| 久亚洲AV无码专区A片| 婷婷精品国产亚洲AV在线观看 | 午夜免费福利| 97色伦图区97色伦综合图区|