在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

exllamav2：一個用于在現(xiàn)代消費 GPU 上運行本地 LLM 的推理庫

用戶投稿 ? 2023年9月15日 12:18 ? 熱點

極客號（Daydx.com）9月15日消息:exllamav2是一個用于在現(xiàn)代消費級GPU上本地運行大型語言模型（LLM）的快速推理庫。它能夠利用最新的GPU技術(shù)，在不犧牲太多質(zhì)量的情況下，以非?？斓乃俣葘薮蟮纳窠?jīng)網(wǎng)絡(luò)進行推理。

項目地址:https://github.com/turboderp/exllamav2

這個庫采用了全新的代碼庫和內(nèi)核實現(xiàn)，相比之前的版本獲得了顯著的性能提升。ExLlamaV2支持與 V1相同的4位 GPTQ 模型，但也支持新的“EXL2”格式。EXL2基于與GPTQ相同的優(yōu)化方法，支持2、3、4、5、6和8位量化。該格式允許在模型內(nèi)混合量化級別，以實現(xiàn)每個權(quán)重2到8位之間的任何平均比特率。這樣既可以充分利用GPU的計算能力，又可以控制模型大小，適應不同的顯存限制。

在測試中，利用EXL2格式，一個70B參數(shù)的模型可以在單塊24GB顯存的GPU上運行，一個13B參數(shù)的模型也可以在8GB顯存中順暢地進行推理。這為在普通的臺式機上本地運行大模型打開了可能性。相比之前的版本，新的內(nèi)核和代碼架構(gòu)也帶來了1.5-2倍的速度提升。

這個庫還集成了與HuggingFace模型的兼容性，提供了文字生成的交互式示例，以及將模型轉(zhuǎn)換為量化格式的腳本。它的目標是成為一個易于入門和使用的LLM推理解決方案，讓更多的人可以無障礙地體驗和應用LLM帶來的強大能力。

總之，exllamav2是一個非常有前景的LLM推理庫。它為利用家用GPU資源運行大模型提供了一個切實可行的途徑。隨著它的不斷發(fā)展和優(yōu)化，相信它一定會讓LLM的應用變得更加普及。

核心功能:

– 支持4位GPTQ模型

– 支持新的EXL22-8比特可調(diào)量化格式

– 大幅提升的推理性能

– 易于安裝和使用

– 支持HuggingFace模型轉(zhuǎn)換

– 提供交互式示例

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

贊 (0)

5999元起蘋果iPhone 15系列今晚8點開啟預定

上一篇 2023年9月15日 12:17

iQOO產(chǎn)品經(jīng)理宋紫薇微博消失暗示已離職

下一篇 2023年9月15日 12:18

微信退出后不保留賬號(微信怎么退出登錄)
今天在外辦事，因需要傳遞一圖片給別人，被要求掃他們的電腦上二維碼，然后才知我的微信已在他們電腦上登陸，把照片在自己手機上微信里“文件傳輸”后，他們馬上在電腦上把照片打印出來了。但是…
2022年11月30日
0
微信互推是什么意思（微信怎么大量添加好友）
一、關(guān)于微信互推關(guān)于微信互推，相信無論是做互聯(lián)網(wǎng)行業(yè)的朋友，還是做傳統(tǒng)行業(yè)的朋友，應該都見過或者實踐過。對于微信號漲粉以及后續(xù)的粉絲流量變現(xiàn)，微信互推都稱得上是一種很好的營銷推…
2022年4月19日
0
香港好用的面膜(香港面膜排行榜)
去粉刺面膜十大品牌排行榜有哪些面膜排行榜前十名的有歐萊雅、高夫、一葉子、珀萊雅、自然堂、御泥坊、杰威爾、WIS、曼秀雷敦、碧歐泉。 SK-II面膜。這款面膜的銷量都比較高，里面含…
2023年11月28日
0
海南海花島39棟違章樓被責令拆除屆滿首日：樓還在，周邊道路被堵截外人難入內(nèi)
2021年末，深陷資金周轉(zhuǎn)問題的恒大又迎“風波”。 2021年12月30日，海南省儋州市綜合行政執(zhí)法局對恒大童世界集團旗下的儋州信恒旅游開發(fā)有限公司，作出《行政處罰（限期拆除）決定…
2022年5月10日
0
復活的BLG戰(zhàn)勝IG晉級四強！Zeka：中單是隊伍的靈魂
1.BLG戰(zhàn)勝IG晉級德杯四強 2022德瑪西亞杯16進4的環(huán)節(jié)，BLG輸給TT，卻因TES全員身體不適退賽而復活進入八強，并在八強迎戰(zhàn)IG。八強BO5環(huán)節(jié)，BLG全員發(fā)力，Ya…
2023年1月17日
0
店員誤將19件黃金耳飾當廢品贈送：價值6萬急出冷汗
7月16日消息，安徽六安一黃金店店員在整理雜物時，誤將19件黃金耳飾當廢品，贈送給一位老大爺，店鋪打烊進行清點時才發(fā)現(xiàn)，店員直接嚇出一身冷汗。據(jù)了解，這19件黃金耳飾總價值超過6…
2023年7月17日
0
日本女星排行榜2023年免冠引咎,積誠動天(日本女星排行榜)
日本有哪些漂亮的女明星呢? 1、日本長的好看的明星：新垣結(jié)衣、石原里美、深田恭子、長澤雅美、綾瀨遙。新垣結(jié)衣，1988年6月11日出生于日本沖繩縣那霸市。2001年，她參加《nic…
2024年1月23日
0
北京大興出現(xiàn)一只一米長巨型蜥蜴背后的真相讓人驚愕
近日，在北京大興，一名市民在出行的過程中，發(fā)現(xiàn)一只一米長巨型蜥蜴。因為害怕蜥蜴?zhèn)?，張先生選擇了報警。民警到達現(xiàn)場后，抓住蜥蜴，帶來派出所，并聯(lián)系了大興區(qū)園林綠化局。專家到現(xiàn)場后…
2023年8月23日
0
「奔流·追蹤」爭了光、添了彩！甘肅省市足協(xié)等發(fā)賀信祝賀涇川文匯足球隊
「奔流·追蹤」爭了光、添了彩！甘肅省市足協(xié)等發(fā)賀信祝賀涇川文匯足球隊 “欣聞涇川縣文匯足球俱樂部于11月17日在2022年中國足協(xié)杯第二輪比賽中，通過點球大戰(zhàn)以7:5爆冷淘汰勁敵北…
2022年11月20日
0
華為安全模式退出方法(華為安全模式)
今天小編給各位分享華為安全模式的知識，其中也會對華為安全模式退出方法進行解釋，如果能碰巧解決你現(xiàn)在面臨的問題，別忘了關(guān)注本站，現(xiàn)在開始吧！華為手機如何進入安全模式華為手機安全?！?/p>
2023年6月9日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息