在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<ruby id="3tlrp"><dl id="3tlrp"></dl></ruby>

<dfn id="3tlrp"><ul id="3tlrp"><source id="3tlrp"></source></ul></dfn>

多模態(tài)大模型MMICL霸榜支持文本圖像視頻輸入

用戶投稿 ? 2023年9月19日 18:15 ? 熱點(diǎn)

極客號（Daydx.com）9月19日消息:最近，北京交通大學(xué)等機(jī)構(gòu)聯(lián)合推出了新多模態(tài)大模型MMICL。它支持文本、圖像、視頻三種模態(tài)的混合輸入，在多項(xiàng)多模態(tài)能力評測中表現(xiàn)搶眼。

MMICL在MMBench和MME兩項(xiàng)多模態(tài)測評中均獲得不俗的成績。它采用Flan-T5XXL作為基礎(chǔ)模型，通過兩階段訓(xùn)練完成。第一階段是預(yù)訓(xùn)練，使用大規(guī)模數(shù)據(jù)集;第二階段是多模態(tài)上下文微調(diào)，使用自建包含豐富多模態(tài)樣本的MIC數(shù)據(jù)集。這種訓(xùn)練方式讓MMICL既具備強(qiáng)大的語義理解能力，又特別適合處理復(fù)雜的多模態(tài)輸入。

項(xiàng)目地址:https://github.com/HaozheZhao/MIC

MMICL使用了VCR、VQAv2、GQA、COCO、NLVR2等多種數(shù)據(jù)源。研究人員將這些數(shù)據(jù)轉(zhuǎn)換成了少樣本式數(shù)據(jù)，存儲在jsonl文件中，形成了帶有0到少樣本的多指令式數(shù)據(jù)。研究使用python數(shù)據(jù)預(yù)處理腳本，將數(shù)據(jù)轉(zhuǎn)換為后續(xù)訓(xùn)練的原始化數(shù)據(jù)。數(shù)據(jù)格式支持交錯的圖像文字輸入，相關(guān)圖像輸入以及語境示范輸入。

MMICL最大的特色在于同時接受文本和圖像的交錯輸入，就像微信聊天一樣自然。它可以分析兩張圖像的關(guān)系，也可以從視頻中提取時空信息。如果給它一些示例，MMICL還能進(jìn)行“現(xiàn)學(xué)現(xiàn)賣”，對未知知識進(jìn)行類比和推理。研究團(tuán)隊表示，MMICL成功緩解了視覺語言模型中的語言偏見問題，避免在大量文本輸入時忽視視覺信息。

MMICL的核心功能包括:

1）理解并推理多幅圖像之間的關(guān)系;

2）人工構(gòu)建的語境訓(xùn)練數(shù)據(jù)，支持語境學(xué)習(xí);

3）狀態(tài)最先進(jìn)的多模態(tài)建模能力。

目前，MMICL已開源兩個版本，分別基于FlanT5XL和Vicuna模型，可滿足商用和科研需求。該模型支持多種互動方式，開發(fā)者可以通過GitHub獲取代碼和模型進(jìn)行試用。諸如圖像分類、視頻理解等多模態(tài)任務(wù)，都可以基于MMICL得到進(jìn)一步提升。

總體來說，MMICL是新興的多模態(tài)預(yù)訓(xùn)練模型中的佼佼者。它具備處理復(fù)雜多模態(tài)輸入的能力，支持各種多模態(tài)任務(wù)精調(diào)。MMICL的開源發(fā)布為多模態(tài)AI的研究和應(yīng)用提供了新的選擇。隨著其性能和適用場景的不斷優(yōu)化，MMICL有望成為多模態(tài)領(lǐng)域的新寵。

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

贊 (0)

美腕回應(yīng)李佳琦抖音認(rèn)證消失黃V失效后沒有續(xù)簽

上一篇 2023年9月19日 18:15

73.2天超長待機(jī)！Redmi Pad SE核心配置揭曉：11英寸大屏、8000mAh電池

下一篇 2023年9月19日 18:15

免費(fèi)油管加速器推薦(免費(fèi)油管加速器)
youtube系統(tǒng)已隱藏?zé)o法播放 1、首先下載一個免費(fèi)的youtube加速器，CycloneAccelerator。其次進(jìn)行注冊登錄。最后打開加速器，點(diǎn)擊一鍵加速youtube即可…
2023年9月26日
0
微信朋友圈廣告文案應(yīng)該怎么寫（微信朋友圈廣告文案）
提起微信朋友圈廣告文案，大家都知道，有人問微信朋友圈廣告文案應(yīng)該怎么寫，你知道這是怎么回事？其實(shí)微信朋友圈廣告文案應(yīng)該怎么寫，下面就一起來看看微信朋友圈廣告文案，希望能夠幫助到大家…
2023年4月19日
0
蘋果稱不送充電器很值，為地球節(jié)省55萬噸礦！網(wǎng)友：數(shù)據(jù)線才要命
最近，蘋果又雙叒叕上熱搜了！這次的話題是 #蘋果稱不送充電器已節(jié)省 55萬噸礦石# 原來，在4月22日“世界地球日”當(dāng)天，蘋果官方曬出了一份環(huán)保成績單。這份成績單列舉了蘋果近兩年…
2022年6月28日
0
拼多多新用戶專享聚寶盆領(lǐng)88元是真的嗎(拼多多新用戶專享入口)
在拼多多平臺上經(jīng)常會有一些福利活動推出，比如新用戶專享聚寶盆領(lǐng)取88元紅包，這是一個非常受歡迎的活動。在這個活動中，新用戶可以領(lǐng)取一定金額的紅包或優(yōu)惠券。不過，也有許多人懷疑這樣的…
2023年11月24日
0
Z世代眼中的數(shù)字遺產(chǎn)：社死前，財產(chǎn)留給親人，賬號必須注銷
日前中華遺囑庫發(fā)布了《中華遺囑庫白皮書》，截至2021年12月31日，中華遺囑庫最年輕的遺囑人是 17 周歲。截至2021 年底，90 后立遺囑總?cè)藬?shù)達(dá)到 1204 人。越來越多的…
2022年5月22日
0
2022西藏中考時間具體科目安排表西藏中考時間2022年具體時間
西藏中考安排出來了，家中有初三學(xué)子的朋友可要好好來查看小編帶來的2022西藏中考時間具體科目安排表，提前了解西藏中考時間2022年具體時間，對自己和孩子都有幫助哦，可以幫助孩子好好…
2022年7月28日
0
力度+溫度！呼和浩特全力推進(jìn)老年人疫苗接種
連日來，在堅持知情、同意、自愿的原則下，我市穩(wěn)步推進(jìn)老年人新冠疫苗接種工作。街道、社區(qū)、基層醫(yī)療部門積極聯(lián)動，加快構(gòu)筑老年人免疫屏障。加快老年人接種新冠疫苗 12月15日上午，回…
2023年1月24日
0
所有系統(tǒng)全部啟動啟動啟動是什么梗(所有系統(tǒng)全部啟動啟動啟動啟動)
近期在各大短視頻平臺上都有關(guān)于“所有系統(tǒng)全部啟動啟動啟動”的玩梗熱潮，據(jù)了解，這句話本是動畫片《超級飛俠》里的經(jīng)典臺詞，那為何會被用來玩梗呢？所有系統(tǒng)全部啟動啟動啟動具體是什么梗呢…
2023年3月28日
0
20日起可陸續(xù)查錄取結(jié)果
南方日報訊（記者/馬立敏）7月16日，廣東省教育考試院發(fā)布消息，廣東高考本科批次19日正式投檔，20日起考生可陸續(xù)查詢錄取結(jié)果。目前，廣東高考提前批本科征集志愿錄取工作已順利結(jié)…
2023年7月28日
0
雙十一好物分享、華為索尼TCL各家都有，錯過雙十一就要等明年了！
今年雙十一還是格外熱鬧，各大平臺的品牌都宣稱自己是更值得買的。而這對于我們消費(fèi)者而言，花更少錢買心儀的東西肯定別提多開心了，所以都是在祈禱這些品牌繼續(xù)加大力度。尤其對于各項(xiàng)數(shù)碼產(chǎn)品…
2023年11月15日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息