導(dǎo)讀:ChatGPT發(fā)布五天內(nèi),該聊天機(jī)器人的用戶就超過了100萬人,F(xiàn)acebook用了10個月時間才達(dá)到這個里程碑。
1、關(guān)于ChatGPT背后的數(shù)據(jù)
本文開篇之前,先看一組關(guān)于ChatGPT爆紅背后的驚人數(shù)據(jù)。
圖來源:金十?dāng)?shù)據(jù)
2022年11月30日,人工智能領(lǐng)域可能迎來了關(guān)鍵時刻。舊金山人工智能公司OpenAI的CEO山姆·阿爾特曼,宣告了這個時刻的來臨。 OpenAI成立于2015年,得到了埃隆·馬斯克、彼得·泰爾和其他PayPal幫成員以及LinkedIn聯(lián)合創(chuàng)始人雷德·霍夫曼等一眾硅谷大佬的投資。 11月30日,公司成立約7年后,阿爾特曼發(fā)推文稱:“今天我們發(fā)布了ChatGPT。歡迎點(diǎn)擊這里與它聊天。”任何人通過推文中的鏈接注冊一個賬號,開始與OpenAI的新聊天機(jī)器人免費(fèi)聊天。
2、深入學(xué)習(xí)ChatGPT資源(可下載)
github.com/dalinvip/Awesome-ChatGPThttps://github.com/chenweiphd/ChatGPT-Hub
3、ChatGPT誕生背景介紹
通常在對用戶知之甚少的情況下,ChatGPT生成內(nèi)容只要大約一秒鐘時間,且它生成的許多內(nèi)容并沒有想象的那么糟糕。 ChatGPT發(fā)布五天內(nèi),該聊天機(jī)器人的用戶就超過了100萬人,F(xiàn)acebook用了10個月時間才達(dá)到這個里程碑。 ChatGPT是一股相關(guān)人工智能技術(shù)浪潮的一部分,這種技術(shù)被統(tǒng)稱為“生成式人工智能”,還囊括了Midjourney和Lensa等熱門藝術(shù)生成模型。 OpenAI位于科技行業(yè)“下一個大事件”的前沿,具備了一家傳奇初創(chuàng)公司的特征,包括全明星級別的團(tuán)隊(duì)和投資者的熱捧,該公司的估值據(jù)稱已經(jīng)達(dá)到290億美元。 該公司最近的突然躥紅引發(fā)了嫉妒、猜疑和恐慌。 谷歌(Google)利潤豐厚的搜索帝國可能受到影響。為了應(yīng)對ChatGPT,谷歌內(nèi)部已經(jīng)拉響了“紅色警報”。 OpenAI能成為超強(qiáng)科技公司俱樂部的成員,出乎人們的意料。幾年前,它甚至還不是一家公司,而是一家致力于學(xué)術(shù)研究的小型非營利性實(shí)驗(yàn)室。 “我認(rèn)為最好的情況好到令人難以想象……好到談?wù)撍娜藭钊擞X得這人是個瘋子。我認(rèn)為最糟糕的情況是,我們所有人都死去?!薄狾penAI聯(lián)合創(chuàng)始人兼CEO山姆·阿爾特曼 OpenAI與微軟(Microsoft)擴(kuò)大合作的消息于近日公布,微軟將向該公司投資高達(dá)100億美元,作為回報,未來幾年,該軟件業(yè)巨頭將獲得OpenAI的大部分利潤。 37歲的聯(lián)合創(chuàng)始人兼CEO阿爾特曼,充分體現(xiàn)了OpenAI謎一樣的特性。 作為一位資深科技創(chuàng)業(yè)者,阿爾特曼更為人們所熟知的是他出色的商業(yè)才能,而不是其工程技術(shù)成就。他是OpenAI估值暴漲的推手,也是給該技術(shù)潑冷水的主力。 他曾公開表示ChatGPT距離真正可靠仍有很大差距。同時,他認(rèn)為,該技術(shù)是實(shí)現(xiàn)公司使命的重要一步。 該公司有一個堂吉訶德式的使命,即開發(fā)一種計算機(jī)超級智能,又稱通用人工智能(AGI)。 對于一家營利性的企業(yè)而言,這種指導(dǎo)理念不同尋常,尤其是有些計算機(jī)科學(xué)家認(rèn)為阿爾特曼的執(zhí)念純屬幻想。 通過發(fā)布ChatGPT,阿爾特曼將OpenAI及其宏大的人工智能使命,變得令整個科技界為之著迷。 問題的關(guān)鍵在于,他與微軟的合作能否解決ChatGPT的缺點(diǎn),利用其先發(fā)優(yōu)勢改變整個科技行業(yè)。
谷歌和其他科技業(yè)巨頭紛紛在加大力氣開發(fā)各自的人工智能平臺;未來,更完善的軟件可能使ChatGPT看起來如同兒戲。 OpenAI總有一天可能會發(fā)現(xiàn),它的技術(shù)突破開啟了未來的大門,這個未來卻與它無關(guān)。
1
1月中旬一個星期四的晚上,阿爾特曼在舊金山罕見地公開露面。 他上身穿灰色針織衫,下身穿藍(lán)色牛仔褲,腳蹬一雙時髦的亮色扎染運(yùn)動鞋,走進(jìn)一個擠滿投資者、技術(shù)人員和記者的房間。 所有人都想收集與ChatGPT或近期融資有關(guān)的信息。
當(dāng)StrictlyVC創(chuàng)始人康妮·洛伊佐斯詢問他,對于公司引起媒體轟動的看法時,阿爾特曼回答稱:“我不看新聞,實(shí)際上我不太關(guān)注媒體的報道。” 活動在賽富時大廈(Salesforce Tower)的46層召開,房間內(nèi)座無虛席。阿爾特曼似乎有意在給這種熱烈的氛圍降溫。 他表示:“它們的表現(xiàn)令人印象深刻,卻并不可靠。所以你在使用第一版演示版的時候,會產(chǎn)生一種非常深刻的反應(yīng):‘哇,真是不可思議,我已經(jīng)迫不及待了’。在用過一百次之后,你就會發(fā)現(xiàn)它的缺點(diǎn)?!?這種謹(jǐn)慎似乎代表了OpenAI總部的官方態(tài)度。 該公司總部位于舊金山教會區(qū)的一家舊行李箱工廠。OpenAI在幾個月前,幾乎要叫停ChatGPT項(xiàng)目。 ChatGPT的聊天界面,支持用戶以簡單的英語(和其他多種語言)與人工智能對話,OpenAI最初的設(shè)想是,將這個界面作為完善其“大語言模型”(LLM)的一種方式。 大多數(shù)生成式人工智能系統(tǒng)核心,都有一個大語言模型。 大語言模型是將非常龐大的神經(jīng)網(wǎng)絡(luò),應(yīng)用于大量人為創(chuàng)建文本所生成的。 神經(jīng)網(wǎng)絡(luò)是大致基于人腦內(nèi)部神經(jīng)連接的一種人工智能。
模型從這個數(shù)據(jù)庫中學(xué)習(xí)一個復(fù)雜的統(tǒng)計學(xué)概率圖,代表了任何一組單詞在特定語境下相鄰出現(xiàn)的統(tǒng)計學(xué)概率。 這樣一來,大語言模型就可以執(zhí)行大量自然語言處理任務(wù),例如翻譯、總結(jié)或?qū)懽鞯取?OpenAI已經(jīng)創(chuàng)建了全世界最強(qiáng)大的大語言模型之一。
該模型名為GPT-3,由1750億個統(tǒng)計性聯(lián)系組成,在約2/3互聯(lián)網(wǎng)、整個維基百科和兩個大型圖書數(shù)據(jù)集中進(jìn)行訓(xùn)練。 OpenAI發(fā)現(xiàn),GPT-3很難準(zhǔn)確提供用戶想要的結(jié)果。 一個團(tuán)隊(duì)提議使用“強(qiáng)化學(xué)習(xí)”系統(tǒng)完善該模型,“強(qiáng)化學(xué)習(xí)”是從試錯中學(xué)習(xí)以取得最大化回報的人工智能系統(tǒng)。 2022年初,該團(tuán)隊(duì)開始開發(fā)這款聊天機(jī)器人,也就是后來的ChatGPT。 開發(fā)完成后,OpenAI邀請貝塔測試人員對其進(jìn)行了測試。
據(jù)OpenAI聯(lián)合創(chuàng)始人兼現(xiàn)任總裁格雷戈·布洛克曼表示,測試人員的反饋卻令OpenAI失望;人們不知道該與聊天機(jī)器人交流哪些內(nèi)容。 OpenAI一度改變了策略,嘗試開發(fā)專業(yè)聊天機(jī)器人,希望為特定領(lǐng)域的專業(yè)人員提供協(xié)助。
這個項(xiàng)目也遇到了問題,部分原因是OpenAI缺少訓(xùn)練專業(yè)聊天機(jī)器人的合適數(shù)據(jù)。 2022年10月25日,OpenAI首席技術(shù)官米拉·穆拉蒂參加《特雷弗·諾亞每日秀》 來源:COURTESY OF MATT WILSON/COMEDY CENTRAL’S “THE DAILY SHOW”
布洛克曼表示,OpenAI決定孤注一擲,對外發(fā)布ChatGPT,交給用戶使用,任其自由發(fā)展。布洛克曼表示:“我承認(rèn),我當(dāng)時的立場是,不知道它是否會成功?!?OpenAI的高管表示,這款聊天機(jī)器人的突然爆紅,令公司措手不及。 其CTO米拉·穆拉蒂表示:“這令我們非常驚訝?!痹谂f金山召開的風(fēng)險投資活動上,阿爾特曼表示,他的“預(yù)期可能要低一個量級——它所引起的熱度低一個量級?!?/p>
2
OpenAI還有更多創(chuàng)新蓄勢待發(fā)。 OpenAI在貝塔測試版GPT-4中采用了更強(qiáng)大的大語言模型,預(yù)計該版本將于今年甚至很快發(fā)布。阿爾特曼也表示,公司正在研發(fā)一款可根據(jù)文本描述生成視頻的系統(tǒng)。 在1月中旬,OpenAI表示其計劃發(fā)布ChatGPT的商業(yè)版。付費(fèi)用戶可通過一個界面使用聊天機(jī)器人,更容易將其整合到自己的產(chǎn)品和服務(wù)當(dāng)中。 可以確定的是,ChatGPT的出現(xiàn)攪動了一個鯊群出沒的水域。
它在風(fēng)投界掀起了一場狂熱的追逐,風(fēng)投公司希望利用OpenAI高管、員工和創(chuàng)始人非公開出售股權(quán)的機(jī)會,獲得該公司的股份。 同時,微軟將在該公司追加投資高達(dá)100億美元的消息,剛剛對外公布。 微軟在2016年開始與OpenAI合作,三年前與之建立戰(zhàn)略合作伙伴關(guān)系,并宣布投資10億美元。
山姆·阿爾特曼與微軟CEO薩蒂亞·納德拉在位于華盛頓州雷德蒙德的微軟總部合影 來源:IAN C. BATES—THE NEW YORK TIMES/REDUX
據(jù)知情人士透露,微軟通過一種不同尋常的投資結(jié)構(gòu),獲得了巨大的財務(wù)優(yōu)勢。 《財富》雜志掌握的文件顯示,在新投資完成且OpenAI的首批投資者收回初始資本后,微軟將有權(quán)獲得OpenAI 75%的利潤,直至其收回130億美元投資,其中包括OpenAI才披露的20億美元投資。 之后,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。 與此同時,其他風(fēng)險投資者和OpenAI的員工,將有權(quán)獲得該公司49%的利潤,直至利潤達(dá)到1500億美元為止。 利潤達(dá)到上述上限之后,微軟和投資者的股份,將重新歸還給OpenAI的非營利基金。 要收回投資和實(shí)現(xiàn)利潤上限目標(biāo),可能需要一段時間。 《財富》雜志掌握的文件顯示,到目前為止,OpenAI只有相對微薄的收入,依舊處在嚴(yán)重虧損狀態(tài)。 文件顯示,該公司去年的收入預(yù)計不足3000萬美元,計算和數(shù)據(jù)支出預(yù)計達(dá)到4.1645億美元,人工支出8931萬美元,其他非特定營業(yè)費(fèi)用為3875萬美元。 其在2022年的凈虧損總計為5.445億美元,不含員工股票期權(quán)。 OpenAI預(yù)測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長。該公司預(yù)測2023年收入2億美元,2024年收入預(yù)計超過10億美元。 OpenAI并未預(yù)測其支出的增長情況以及何時能夠扭虧為盈。 微軟已開始收獲雙方合作協(xié)議的成果。 微軟在其Azure Cloud平臺中,推出了一系列OpenAI品牌的工具和服務(wù),支持Azure客戶使用OpenAI的技術(shù),包括GPT和DALL-E工具。
例如,汽車交易平臺CarMax已經(jīng)推出了可在這些Azure工具上運(yùn)行的新服務(wù)。 微軟人工智能平臺企業(yè)副總裁埃里克·博伊德表示,滿足訓(xùn)練和運(yùn)行OpenAI大語言平臺的需求,推動了創(chuàng)新,將使所有Azure客戶受益。 例如,微軟為人工智能創(chuàng)建了其認(rèn)為全球最強(qiáng)大的超級計算集群,并開發(fā)了多種軟件創(chuàng)新,使在這些機(jī)器上訓(xùn)練和運(yùn)行大型人工智能模型變得更容易。 微軟正在將OpenAI的技術(shù)整合到其許多軟件當(dāng)中。微軟在其搜索引擎必應(yīng)(Bing)中推出了一款圖片創(chuàng)作工具以及一款新型設(shè)計師圖片設(shè)計工具,這兩款工具均由DALL-E驅(qū)動。 對微軟而言,更大的回報可能是在搜索領(lǐng)域。 科技媒體The Information最近報道稱,微軟計劃將ChatGPT整合到必應(yīng),使其能夠?yàn)橛脩舴答伜啙嵜髁说幕卮?,且使用戶可以通過與聊天機(jī)器人對話進(jìn)行深入探究,而不是逐一查看一列鏈接。 谷歌目前在搜索市場占據(jù)主導(dǎo)地位,其全球市場份額超過90%。必應(yīng)名列第二,市場份額僅有約3%。 在2022年前九個月,谷歌搜索業(yè)務(wù)的收入為1200億美元,約占谷歌總收入的60%。
ChatGPT或許為微軟動搖谷歌的霸主地位,提供了唯一一次真正的機(jī)會。 按照微軟的標(biāo)準(zhǔn),這些積極的回報非常劃算。
微軟在OpenAI的總投資額為130億美元,確實(shí)是一個天文數(shù)字,這筆投資占其過去12個月850億美元稅前利潤的15%,卻能獲得一項(xiàng)顛覆性技術(shù)的近期控制權(quán),是一筆成本相對較低的交易。 OpenAI和阿爾特曼卻可能要付出不同的代價:微軟的優(yōu)先任務(wù)可能對OpenAI自己的優(yōu)先任務(wù)產(chǎn)生排擠效應(yīng),使OpenAI更宏大的使命面臨風(fēng)險,并且降低助力公司成功的科學(xué)家們對其的歸屬感。
3
阿爾特曼從最開始就參與了OpenAI的創(chuàng)立,他直到2019年5月后才擔(dān)任該公司CEO。 該公司從一家研究實(shí)驗(yàn)室變成價值數(shù)十億美元的現(xiàn)象級企業(yè)的過程,充分顯示出阿爾特曼獨(dú)特的融資能力,以及以產(chǎn)品為導(dǎo)向的經(jīng)營理念。 作為OpenAI的領(lǐng)導(dǎo)人,從某種程度上來說,阿爾特曼就是硅谷的典型代表:
年輕的白人男性;堅(jiān)定專注;精通極客技術(shù);熱衷于效率和生產(chǎn)率最大化;致力于“改變世界”的工作狂。 阿爾特曼從斯坦福大學(xué)計算機(jī)科學(xué)專業(yè)肄業(yè),參與創(chuàng)建了一家社交媒體公司Loopt,該公司的應(yīng)用可以告知用戶好友所在的位置。 該公司在2005年,成為Y Combinator的首批初創(chuàng)公司,阿爾特曼出售該公司所得的收入,幫助他進(jìn)入了風(fēng)投界,他創(chuàng)建了一家小型風(fēng)險投資公司Hydrazine Capital,募資約2100萬美元。 阿爾特曼是一位創(chuàng)業(yè)者,而不是科學(xué)家或人工智能研究人員,他為人所津津樂道的是極其擅長進(jìn)行風(fēng)投融資。
據(jù)OpenAI的多位現(xiàn)任和前內(nèi)部人士爆料,隨著阿爾特曼掌管公司,公司開始轉(zhuǎn)移業(yè)務(wù)重心。曾經(jīng)廣泛的研發(fā)議題被精簡,主要專注于自然語言處理領(lǐng)域。 OpenAI首席科學(xué)家薩茨科爾和阿爾特曼辯稱,這種轉(zhuǎn)變的目的是,在目前似乎最有可能實(shí)現(xiàn)通用人工智能的研發(fā)領(lǐng)域,最大程度增加投入。
有前員工表示,部分原因是這些模型可以迅速投入商業(yè)應(yīng)用。 有員工抱怨,OpenAI創(chuàng)立的目的是不受企業(yè)影響,但它很快就變成了科技界巨頭的工具。
OpenAI也變得不再像以前那么開放。 該公司已經(jīng)開始以擔(dān)心其技術(shù)可能被濫用為由,收回此前做出的公開所有研究和將代碼開源的承諾。OpenAI僅通過API提供其先進(jìn)模型,保護(hù)了自己的知識產(chǎn)權(quán)和收入流。 OpenAI表示相比其他人工智能實(shí)驗(yàn)室,其會繼續(xù)公布更多研究成果。 公司還為重心向產(chǎn)品轉(zhuǎn)移的做法進(jìn)行辯護(hù)。CTO穆拉蒂說道:“你不能只在實(shí)驗(yàn)室里開發(fā)通用人工智能?!彼鲝垼l(fā)布產(chǎn)品是了解人們希望如何使用和濫用技術(shù)的唯一途徑。 她表示,直到發(fā)現(xiàn)人們使用GPT-3進(jìn)行編程,OpenAI才知道GPT-3最受歡迎的應(yīng)用是編寫軟件代碼。
同樣,OpenAI最擔(dān)心的問題是,人們利用GPT-3生成虛假的政治信息,但事實(shí)證明這只是杞人憂天。 穆拉蒂表示,OpenAI希望通過公開其技術(shù),“最大程度降低真正強(qiáng)大的技術(shù)可能對社會產(chǎn)生的沖擊。” 薩茨科爾也認(rèn)為,OpenAI與微軟的合作創(chuàng)造了一種全新的預(yù)期,“即我們需要利用我們的技術(shù)開發(fā)一種有用的產(chǎn)品”,他堅(jiān)持認(rèn)為,OpenAI文化的核心并未改變。 他說道,可以使用微軟的數(shù)據(jù)中心,對于OpenAI的發(fā)展至關(guān)重要。 布洛克曼也表示,與微軟的合作使OpenAI能夠創(chuàng)造收入,同時不必過多關(guān)注商業(yè)運(yùn)營,否則公司可能不得不在商業(yè)運(yùn)營方面投入更多精力。 他說道:“招聘數(shù)千名銷售人員,可能會改變這家公司,而與一家已經(jīng)擁有銷售團(tuán)隊(duì)的公司成為合作伙伴,實(shí)際上是非常好的策略?!?/p>
批評者表示,OpenAI以產(chǎn)品為導(dǎo)向開發(fā)先進(jìn)人工智能的做法是不負(fù)責(zé)任的,這相當(dāng)于向人們發(fā)放上膛的槍支,理由是,這是確定人們是否真的會相互射擊的最佳途徑。 紐約大學(xué)(New York University)認(rèn)知科學(xué)專業(yè)榮譽(yù)退休教授加里·馬庫斯,對以深度學(xué)習(xí)為中心的人工智能開發(fā)策略持懷疑態(tài)度。 他認(rèn)為,生成式人工智能“將對社會結(jié)構(gòu)產(chǎn)生切實(shí)的、迫在眉睫的威脅”。他表示,GPT-3和ChatGPT等系統(tǒng),將生成虛假信息的成本降低到接近于零,可能會掀起虛假信息泛濫的狂潮。 馬庫斯表示,我們甚至已經(jīng)看到了第一批受害者。 程序員發(fā)布和回答編程問題的網(wǎng)站Stack Overflow,已經(jīng)不得不禁止用戶提交ChatGPT生成的回答,這種貌似合理實(shí)則錯誤的回答已經(jīng)令該網(wǎng)站疲于應(yīng)付。
科技資訊網(wǎng)站CNET開始使用ChatGPT生成資訊文章,后來發(fā)現(xiàn),許多文章存在事實(shí)性錯誤。 對有些人而言,真正的風(fēng)險是ChatGPT能夠編寫準(zhǔn)確的代碼。 網(wǎng)絡(luò)安全公司Check Point的研究副總裁瑪雅·霍洛維茨表示,她的團(tuán)隊(duì)可以用ChatGPT設(shè)計每一個階段的網(wǎng)絡(luò)攻擊,包括杜撰一封令人信服的釣魚郵件,編寫惡意代碼,以及逃避常見的網(wǎng)絡(luò)安全檢查等。 她警告稱,ChatGPT基本可以讓不懂編程的人成為網(wǎng)絡(luò)罪犯。 有無數(shù)批評者和教育工作者痛斥,學(xué)生很容易使用ChatGPT作弊。
紐約、巴爾的摩和洛杉磯的校區(qū)均禁止學(xué)校管理的網(wǎng)絡(luò)訪問聊天機(jī)器人,澳大利亞的一些高校表示,將轉(zhuǎn)為通過有專人監(jiān)考的書面考試評估學(xué)生。 OpenAI未來能否維持其在語言人工智能領(lǐng)域的主導(dǎo)地位,仍是個未知數(shù)。 倫敦人工智能公司Faculty的創(chuàng)始人兼CEO馬克·華納表示:“歷史上,對于這種高度通用的算法,我們所看到的是,它們并沒有達(dá)到足夠可靠的程度,能夠保證一家公司獨(dú)占全部回報?!?例如,面部識別和圖像識別技術(shù)最早的開發(fā)者是谷歌和英偉達(dá)(Nvidia)等科技巨頭,現(xiàn)在它們已經(jīng)無處不在。 法院和監(jiān)管部門,也可能對生成式人工智能所依賴的數(shù)據(jù)飛輪橫插一腳。
同時,OpenAI的競爭對手并沒有坐以待斃。 據(jù)《紐約時報》(New York Times)報道,失去搜索領(lǐng)域主導(dǎo)地位的可能性,已經(jīng)促使谷歌高管發(fā)布了“紅色警報”。 谷歌CEO桑達(dá)爾·皮查伊已經(jīng)多次召開會議,重新制定公司的人工智能策略,計劃發(fā)布20款支持人工智能的新產(chǎn)品,并將在今年發(fā)布搜索聊天界面的演示版本。 谷歌擁有一款強(qiáng)大的聊天機(jī)器人LaMDA,由于擔(dān)心一旦該產(chǎn)品被濫用可能影響公司信譽(yù),因此一直未對外發(fā)布。
據(jù)《時代》雜志稱,現(xiàn)在,公司計劃以ChatGPT為標(biāo)桿“重新評估”其風(fēng)險承受能力。 該雜志報道稱,谷歌還在開發(fā)一款文本轉(zhuǎn)圖片的生成系統(tǒng),與OpenAI的DALL-E等產(chǎn)品競爭。 當(dāng)然,目前尚不確定聊天機(jī)器人是否代表了搜索行業(yè)的未來。
ChatGPT經(jīng)常會杜撰信息,這種現(xiàn)象被人工智能研究人員稱為“幻覺”。它無法可靠地引用其信息來源,或簡單地提供鏈接。現(xiàn)有版本無法訪問互聯(lián)網(wǎng),因此無法提供最新信息。 OpenAI已經(jīng)公布了對另外一個版本GPT的研究。 該版本名為WebGPT,可以通過查詢搜索引擎和匯總查詢到的信息來回答問題,包括對相關(guān)來源的注釋。 阿爾特曼極少在公開場合熱烈討論人工智能。在談到人工智能的時候,他可能聽上去像是一位幻想思想家。 在舊金山舉辦的風(fēng)險投資活動上,當(dāng)被問到人工智能的最佳狀況時,他夸張地說道:
“我認(rèn)為最好的情況好到令人難以想象……好到談?wù)撍娜藭钊擞X得這人是個瘋子。”
編輯:黃飛
評論
查看更多