現(xiàn)在,GPT-3.5 Turbo支持自定義微調(diào)了!
只需上傳自己的數(shù)據(jù),就可以運(yùn)行專(zhuān)屬的定制大模型。
開(kāi)發(fā)者狂喜!不少人驚呼:Awesome!
早期測(cè)試表明,經(jīng)過(guò)微調(diào)的GPT-3.5 Turbo版本在某些任務(wù)中甚至可以超越GPT-4。
更新之余,OpenAI還直接明示了定價(jià)計(jì)劃,微調(diào)費(fèi)用主要分為初始訓(xùn)練費(fèi)用和使用費(fèi)用。
一個(gè)具有10萬(wàn)tokens訓(xùn)練數(shù)據(jù)集的微調(diào)工作(3個(gè)epoch訓(xùn)練)成本大概在2.40美元。
此外,OpenAI還透露了GPT-4微調(diào)將于今年秋天推出。
不過(guò)也有人不吃這套,吐槽微調(diào)成本太高,其生成成本是基礎(chǔ)模型的8倍,必須要按照他們所說(shuō)“將提示大小減小90%”,才能從中獲取效益。
開(kāi)發(fā)者自己進(jìn)行監(jiān)督微調(diào)
OpenAI首先給出了指南手冊(cè),微調(diào)可以用來(lái)改進(jìn)這些模型性能。
-
可操縱性的改進(jìn),模型能夠更好地遵循指令。比如輸出簡(jiǎn)潔回答或始終以給定的語(yǔ)言響應(yīng)。
-
一致的格式化響應(yīng),開(kāi)發(fā)人員可用微調(diào)將用戶(hù)提示轉(zhuǎn)換為高質(zhì)量JSON代碼片段,隨后用于自己的系統(tǒng)。
-
定制語(yǔ)氣,微調(diào)可以更好磨煉模型輸出的質(zhì)感,比如語(yǔ)氣,讓它更適合企業(yè)品牌的聲音。
除了提高性能之外,還能縮短提示時(shí)間,確保類(lèi)似性能。另外,微調(diào)目前僅支持處理4000 tokens,這也是此前微調(diào)型號(hào)的兩倍。16k tokens微調(diào)將于今年秋季推出。
早期測(cè)試人員通過(guò)對(duì)模型本身指令進(jìn)行微調(diào),加快了API調(diào)用還降低成本,讓prompt減少了90%。
對(duì)函數(shù)調(diào)用結(jié)合和 gpt-3.5-turbo-16k的微調(diào)支持將在今年秋季晚些時(shí)候推出。
具體微調(diào)步驟,分為四步:
準(zhǔn)備數(shù)據(jù)
{
"messages":[
{"role":"system","content":"Youareanassistantthatoccasionallymisspellswords"},
{"role":"user","content":"Tellmeastory."},
{"role":"assistant","content":"Onedayastudentwenttoschoool."}
]
上傳文件
curl-https://api.openai.com/v1/files
-H"Authorization:Bearer$OPENAI_API_KEY"
-F"purpose=fine-tune"
-F"file=@path_to_your_file"
創(chuàng)建微調(diào)作業(yè)
curlhttps://api.openai.com/v1/fine_tuning/jobs
-H"Content-Type:application/json"
-H"Authorization:Bearer$OPENAI_API_KEY"
-d'{
"training_file":"TRAINING_FILE_ID",
"model":"gpt-3.5-turbo-0613",
}'
使用微調(diào)模型
curlhttps://api.openai.com/v1/chat/completions
-H"Content-Type:application/json"
-H"Authorization:Bearer$OPENAI_API_KEY"
-d'{
"model":"ftorg_id",
"messages":[
{
"role":"system",
"content":"Youareanassistantthatoccasionallymisspellswords"
},
{
"role":"user",
"content":"Hello!Whatisfine-tuning?"
}
]
}'
OpenAI透露,未來(lái)他們將推出微調(diào)UI,這樣輕松訪問(wèn)正在進(jìn)行中的工作。
定價(jià)方面,分為訓(xùn)練成本和使用成本。
-
訓(xùn)練:0.008美元/1000 tokens;
-
使用輸入:0.012美元/1000 tokens;
-
使用輸出:0.016 美元/1000 tokens。
不過(guò)可以看到的是,價(jià)格確實(shí)比基礎(chǔ)模型高了不少。
更新了GPT-3模型
與此同時(shí),OpenAI還在API端口更新了GPT-3模型:babbage-002 和 davinci-002。
這些模型都可以用新的API端點(diǎn)進(jìn)行微調(diào)。
原始基礎(chǔ)模型 (ada, babbage, curie, 和 davinci)將于明年*(2024年)1月4日關(guān)閉。
好了,感興趣的朋友可以開(kāi)始定制自己的GPT-3.5Turbo了。
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1222瀏覽量
25268 -
OpenAI
+關(guān)注
關(guān)注
9文章
1201瀏覽量
8623 -
大模型
+關(guān)注
關(guān)注
2文章
3020瀏覽量
3799
原文標(biāo)題:OpenAI開(kāi)放大模型微調(diào)功能!上傳自己數(shù)據(jù)就可定制GPT-3.5Turbo,開(kāi)發(fā)者狂喜
文章出處:【微信號(hào):玩轉(zhuǎn)VS Code,微信公眾號(hào):玩轉(zhuǎn)VS Code】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來(lái)了
【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+大模型微調(diào)技術(shù)解讀
怎么建立開(kāi)放數(shù)控系統(tǒng)模型?
OpenAI官宣把ChatGPT API開(kāi)放

iPhone都能微調(diào)大模型了嘛

最新、最強(qiáng)大的模型GPT-4將向美國(guó)政府機(jī)構(gòu)開(kāi)放
OpenAI開(kāi)放大模型微調(diào)功能 GPT-3.5可以打造專(zhuān)屬ChatGPT
四種微調(diào)大模型的方法介紹

評(píng)論