在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<tt id="mghlh"></tt>

<dfn id="mghlh"></dfn>

又一開(kāi)源替代品！Guanaco性能達(dá)ChatGPT級(jí)別在單個(gè)GPU上訓(xùn)練一天就能搞定

用戶投稿 ? 2023年5月26日 15:25 ? 熱點(diǎn)

極客號(hào)（Daydx.com）5月26日消息:有一種名為 QLoRA 的新方法可以在單個(gè) GPU 上微調(diào)大型語(yǔ)言模型。目前已經(jīng)有研究人員用它來(lái)訓(xùn)練 Guanaco，這是一個(gè)性能效果99% 接近ChatGPT的聊天機(jī)器人。

華盛頓大學(xué)的研究人員提出了微調(diào)大型語(yǔ)言模型的方法 QLoRA。該團(tuán)隊(duì)利用 QLoRA 發(fā)布了 Guanaco，這是一個(gè)基于meta 的 LLaMA模型的聊天機(jī)器人系列。最大的 Guanaco 變體具有650億個(gè)參數(shù)，在與GPT-4的基準(zhǔn)測(cè)試中實(shí)現(xiàn)了ChatGPT （ GPT-3.5-turbo ）99% 以上的性能。

微調(diào)大型語(yǔ)言模型是提高其性能和訓(xùn)練的最重要技術(shù)之一。然而，這個(gè)過(guò)程對(duì)于大型模型來(lái)說(shuō)計(jì)算量非常大，例如 LLaMA65B ，在這種情況下需要超過(guò)780GB 的 GPU RAM。雖然開(kāi)源社區(qū)使用各種量化方法將16位模型簡(jiǎn)化為4位模型，從而大大減少了推理所需的內(nèi)存，但類(lèi)似的方法還沒(méi)有用于微調(diào)。

QLoRA 允許在單個(gè) GPU 上微調(diào)650億個(gè)參數(shù) LLM

通過(guò) QLoRA，該團(tuán)隊(duì)展示了一種方法，允許將 LLaMA 等模型量化為4位，并添加LORA模型，然后通過(guò)反向傳播進(jìn)行訓(xùn)練。通過(guò)這種方式，該方法可以實(shí)現(xiàn)4位模型的微調(diào)，并將650億參數(shù)模型的內(nèi)存需求從超過(guò)780GB 降低到不到48GB 的 GPU 內(nèi)存，其結(jié)果與微調(diào)16位模型相同。

“這標(biāo)志著LLM微調(diào)的可訪問(wèn)性發(fā)生了重大轉(zhuǎn)變:現(xiàn)在是迄今為止在單個(gè)GPU上微調(diào)的最大公開(kāi)可用模型，”該團(tuán)隊(duì)說(shuō)。

為了測(cè)試 QLoRA 和不同微調(diào)數(shù)據(jù)集的影響，該團(tuán)隊(duì)在八個(gè)不同的數(shù)據(jù)集上訓(xùn)練了1，000多個(gè)模型。一個(gè)關(guān)鍵發(fā)現(xiàn):數(shù)據(jù)的質(zhì)量比任務(wù)的數(shù)量更重要。例如，在OpenAssistant 的9，000個(gè)人類(lèi)樣本上訓(xùn)練的模型比在 FLANv2的100萬(wàn)個(gè)樣本上訓(xùn)練的模型更適合聊天機(jī)器人。因此，對(duì)于 Guanaco，該團(tuán)隊(duì)依賴于 OpenAssistant 數(shù)據(jù)。

開(kāi)源模型 Guanaco 達(dá)到 ChatGPT 級(jí)別

該團(tuán)隊(duì)使用 QLoRA 訓(xùn)練了 Guanaco 系列模型，表現(xiàn)第二好的模型在基準(zhǔn)測(cè)試中以330億個(gè)參數(shù)實(shí)現(xiàn)了 ChatGPT 性能的97.8%，同時(shí)在不到12小時(shí)的時(shí)間內(nèi)在單個(gè)普通的 GPU 上對(duì)其進(jìn)行了訓(xùn)練。在專業(yè) GPU 上，該團(tuán)隊(duì)僅用24小時(shí)就訓(xùn)練了具有650億個(gè)參數(shù)的最大模型，并達(dá)到了ChatGPT 性能的99.3% 。

最小的 Guanaco 模型具有70億個(gè)參數(shù)，僅需要5GB 的 GPU 內(nèi)存，并且在 Vicuna 基準(zhǔn)測(cè)試中比26GB 的羊駝模型高出20個(gè)百分點(diǎn)以上。

除了 QLoRA 和 Guanaco，該團(tuán)隊(duì)還發(fā)布了 OpenAssistant 基準(zhǔn)測(cè)試，該基準(zhǔn)測(cè)試在953個(gè)提示示例中讓模型相互競(jìng)爭(zhēng)。然后可以由人類(lèi)或 GPT-4對(duì)結(jié)果進(jìn)行評(píng)分。

Guanaco數(shù)學(xué)不好，QLoRA可用于移動(dòng)微調(diào)

不過(guò)，該團(tuán)隊(duì)引用數(shù)學(xué)能力和4位推理目前非常慢。接下來(lái)，該團(tuán)隊(duì)希望提高推理能力，預(yù)計(jì)速度提升8至16倍。

由于微調(diào)是將大型語(yǔ)言模型轉(zhuǎn)變?yōu)轭?lèi)似 ChatGPT 的聊天機(jī)器人的重要工具，該團(tuán)隊(duì)相信 QLoRA 方法將使微調(diào)更容易獲得——尤其是對(duì)于資源較少的研究人員而言。他們認(rèn)為，這對(duì)于自然語(yǔ)言處理領(lǐng)域尖端技術(shù)的可訪問(wèn)性來(lái)說(shuō)是一個(gè)巨大的勝利。

論文指出:“QLORA 可以被視為一個(gè)平衡因素，有助于縮小大型企業(yè)與擁有消費(fèi)類(lèi) GPU 的小型團(tuán)隊(duì)之間的資源差距。這也意味著，小企業(yè)可以通過(guò)像 Colab 這樣的云服務(wù)進(jìn)行微調(diào)大模型。

除了微調(diào)當(dāng)今最大的語(yǔ)言模型外，該團(tuán)隊(duì)還看到了私有模型在移動(dòng)硬件上的應(yīng)用。“QLoRA 還將在您的手機(jī)上啟用隱私保護(hù)微調(diào)。我們估計(jì)您每晚可以使用 iPhone12Plus 微調(diào)300萬(wàn)個(gè)單詞。這意味著，很快我們將在手機(jī)上擁有專門(mén)針對(duì)每個(gè)應(yīng)用程序的LLM?！钡谝蛔髡?Tim Dettmers 在 Twitter 上說(shuō)。

關(guān)于Guanaco-33B 更多信息和代碼可到 GitHub 查看。

參考網(wǎng)址:

https://github.com/artidoro/qlora

相關(guān)產(chǎn)品可訪問(wèn)《有哪些類(lèi)似chatgpt產(chǎn)品? 17 個(gè)ChatGPT/GPT4 開(kāi)源替代品推薦（附網(wǎng)址）》一文了解。

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場(chǎng)，版權(quán)歸原作者所有，如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。

格局打開(kāi) 特斯拉向福特開(kāi)放1.2萬(wàn)個(gè)超充站：未來(lái)將不需適配器直連

上一篇 2023年5月26日 15:25

李彥宏：百度很快會(huì)正式推出文心大模型3.5版本

下一篇 2023年5月26日 15:26

日本電視劇收視率歷史排名(電視劇收視率歷史排名)
收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時(shí)候總會(huì)去看，好像如果這個(gè)夏天沒(méi)有看這個(gè)電視劇，夏天好像就沒(méi)有到來(lái)?？梢?jiàn)這部電視劇對(duì)于…
2024年1月24日
0
液壓機(jī)械缸鍛造廠家品質(zhì)好的有哪些值得推薦？
液壓機(jī)是一種以液體為工作介質(zhì)的重要機(jī)械設(shè)備，其核心功能是傳遞能量，實(shí)現(xiàn)各種工藝流程。除了在鍛壓成形方面的應(yīng)用，液壓機(jī)還廣泛應(yīng)用于矯正、壓裝、打包、壓塊和壓板等領(lǐng)域。根據(jù)工作介質(zhì)的不…
2024年1月24日
0
湖南暴雪已致1萬(wàn)多人受災(zāi)
據(jù)@湖南氣象，22日7時(shí)至23日7時(shí)，湘中、湘南出現(xiàn)大到暴雪，長(zhǎng)沙（瀏陽(yáng)）、株洲（醴陵、茶陵）等13個(gè)縣市區(qū)出現(xiàn)大暴雪，郴州（北湖區(qū)）、株洲（荷塘區(qū)）出現(xiàn)特大暴雪；全省23個(gè)縣市…
2024年1月24日
0
落馬貪官退贓像“割肉”，詢問(wèn)能不能少交點(diǎn)
“就像割我身上的肉一般，會(huì)讓我痛不欲生。” 24日，中央紀(jì)委國(guó)家監(jiān)委網(wǎng)站發(fā)布了針對(duì)云南省文山州住房和城鄉(xiāng)建設(shè)局原黨組成員、副局長(zhǎng)李慶明嚴(yán)重違紀(jì)違法案的剖析。信奉金錢(qián)至上的李慶明惜財(cái)…
2024年1月24日
0
中國(guó)gdp排行榜城市(中國(guó)gdp排行榜)
中國(guó)各省gdp排名 1、根據(jù)查詢國(guó)家統(tǒng)計(jì)局官網(wǎng)信息顯示，2023年各省排名，廣東：GDP為1243667億。江蘇：GDP為116362億。山東：GDP為83099億。浙江：GDP為…
2024年1月24日
0
SK-II大中華區(qū)季度銷(xiāo)售額暴跌34%，寶潔：日本核污水排海是主因
財(cái)聯(lián)社1月24日訊（編輯卞純）全球日用消費(fèi)品巨頭寶潔公司（ProcterGamble）周二表示，在截至12月底的第二財(cái)季，其高端護(hù)膚品牌SK-II在大中華區(qū)的銷(xiāo)售額下降了34%，…
2024年1月24日
0
呼和浩特白塔機(jī)場(chǎng)通報(bào)“保潔員占母嬰室吃飯”：涉事人已被辭退
呼和浩特白塔機(jī)場(chǎng)通報(bào)“保潔員占母嬰室吃飯”：涉事人已被辭退原標(biāo)題：呼和浩特白塔機(jī)場(chǎng)通報(bào)“保潔員占母嬰室吃飯”：涉事人已被辭退央視網(wǎng)消息：據(jù)@呼和浩特白塔國(guó)際機(jī)場(chǎng) 消息，呼和浩…
2024年1月24日
0
退休職工舉報(bào)局長(zhǎng)被判刑，被舉報(bào)人卻提級(jí)退休把人看懵了
文|龍之朱又見(jiàn)錯(cuò)抓錯(cuò)判上了熱搜。據(jù)媒體報(bào)道，從2016年3月起，安徽宿州市碭山縣農(nóng)機(jī)局退休職工李平實(shí)名向紀(jì)檢部門(mén)舉報(bào)局長(zhǎng)王超經(jīng)濟(jì)問(wèn)題，均石沉大海。 2017年7月，李平夫婦及親…
2024年1月24日
0
6寸蛋糕用5斤車(chē)?yán)遄拥昙业狼?
【#6寸蛋糕用5斤車(chē)?yán)遄拥昙业狼?：客服能力不足，多報(bào)了2斤車(chē)?yán)遄印?遇到商家虛假宣傳你會(huì)怎么辦# 近日，有網(wǎng)友發(fā)帖稱做六寸蛋糕需要5斤車(chē)?yán)遄右裏嶙h。 1月22日，涉事店家就“6寸…
2024年1月24日
0
格蘭芬多院徽簡(jiǎn)筆畫(huà)(格蘭芬多院徽)
哈利波特的霍格沃茨學(xué)校分別是哪些學(xué)院? 1、《哈利波特》電影中的霍格沃茨學(xué)院，一共分為四個(gè)學(xué)院，分別是：格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學(xué)院共有格蘭芬多、…
2024年1月24日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時(shí)間：周一至周五，10:30-18:30，節(jié)假日休息

<em id="j1xzo"></em>

<pre id="j1xzo"></pre>