在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<address id="suo8x"></address>

<dfn id="suo8x"><var id="suo8x"><ruby id="suo8x"></ruby></var></dfn>

<pre id="suo8x"><tt id="suo8x"></tt></pre>

<menu id="suo8x"></menu>

蘋果研究人員推出Ferret:一種用于高級圖像理解和描述突破性多模態(tài)語言模型

用戶投稿 ? 2023年10月30日 18:14 ? 熱點

極客號（Daydx.com）10月30日消息:研究人員在最新的一項研究中介紹了Ferret，這是一款多模式語言模型，旨在實現(xiàn)高級圖像理解和描述。該研究聚焦于視覺-語言學(xué)習(xí)中的關(guān)鍵問題，即如何融合地理信息和語義知識，以便模型能夠同時引用和定位圖像中的元素。研究指出，引用和定位是兩項關(guān)鍵的能力，前者要求模型理解語義描述，后者要求模型在圖像中定位相關(guān)區(qū)域。

為了解決這一問題，哥倫比亞大學(xué)和 Apple 的研究人員提出了Ferret模型，這是一款基于MLLM（多模式大語言模型）的新型模型，具備強大的全局理解能力。

Ferret模型的關(guān)鍵特點在于它可以同時處理自由文本和引用區(qū)域。它采用了一種混合區(qū)域表示方法，結(jié)合了離散坐標(biāo)和連續(xù)視覺特征，以處理不同形狀的區(qū)域，如點、框、涂鴉和復(fù)雜多邊形。這種靈活性使Ferret能夠更準(zhǔn)確地理解和描述圖像中的元素，提高了人機交互的全面性。

為了訓(xùn)練Ferret模型，研究人員創(chuàng)建了GRIT（Ground-and-Refer Instruction-Tuning）數(shù)據(jù)集，其中包括1.1百萬個樣本，用于指導(dǎo)模型進行引用和定位。該數(shù)據(jù)集包含了不同層次的空間知識，包括區(qū)域描述、連接、物體和復(fù)雜的推理。通過精心設(shè)計的模板，大部分?jǐn)?shù)據(jù)從當(dāng)前的視覺-語言任務(wù)中轉(zhuǎn)化而來，如對象識別和短語定位，以用于指導(dǎo)模型。

研究人員還利用ChatGPT/GPT-4等工具，收集了34，000多個引用和定位對話，以幫助模型進行訓(xùn)練。他們還進行了空間感知的負數(shù)據(jù)挖掘，以增強模型的魯棒性。Ferret模型表現(xiàn)出高度的開放式空間感知和定位能力，能夠在引用和定位任務(wù)上表現(xiàn)優(yōu)于傳統(tǒng)模型。此外，研究人員認為引用和定位能力應(yīng)該融入日常人機交流中，以實現(xiàn)更廣泛的應(yīng)用。

為了評估Ferret模型的性能，研究人員創(chuàng)建了Ferret-Bench，包括三種新類型的任務(wù):引用描述、引用推理和對話中的定位。他們將Ferret與目前使用的最佳MLLM模型進行比較，發(fā)現(xiàn)Ferret的性能平均優(yōu)于它們20.4%。此外，F(xiàn)erret還具有減少對象幻覺的顯著能力。

Ferret模型，它具備了在MLLM中進行精細和開放式引用和定位的能力。Ferret采用了一種混合區(qū)域表示方法，配備了獨特的空間感知視覺采樣器。此外，他們創(chuàng)建了GRIT數(shù)據(jù)集，用于模型訓(xùn)練，并評估了Ferret在不同任務(wù)中的性能。這一研究為多模式語言模型領(lǐng)域帶來了突破性進展，為圖像理解和描述提供了新的可能性。

項目網(wǎng)址:https://github.com/apple/ml-ferret

論文網(wǎng)址:https://arxiv.org/abs/2310.07704v1

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

淘寶幻想島一共多少級

上一篇 2023年10月30日 18:14

華為宣布HarmonyOS 4升級設(shè)備數(shù)量突破1億

下一篇 2023年10月30日 18:14

日本電視劇收視率歷史排名(電視劇收視率歷史排名)
收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時候總會去看，好像如果這個夏天沒有看這個電視劇，夏天好像就沒有到來?？梢娺@部電視劇對于…
2024年1月24日
0
液壓機械缸鍛造廠家品質(zhì)好的有哪些值得推薦？
液壓機是一種以液體為工作介質(zhì)的重要機械設(shè)備，其核心功能是傳遞能量，實現(xiàn)各種工藝流程。除了在鍛壓成形方面的應(yīng)用，液壓機還廣泛應(yīng)用于矯正、壓裝、打包、壓塊和壓板等領(lǐng)域。根據(jù)工作介質(zhì)的不…
2024年1月24日
0
湖南暴雪已致1萬多人受災(zāi)
據(jù)@湖南氣象，22日7時至23日7時，湘中、湘南出現(xiàn)大到暴雪，長沙（瀏陽）、株洲（醴陵、茶陵）等13個縣市區(qū)出現(xiàn)大暴雪，郴州（北湖區(qū)）、株洲（荷塘區(qū)）出現(xiàn)特大暴雪；全省23個縣市…
2024年1月24日
0
落馬貪官退贓像“割肉”，詢問能不能少交點
“就像割我身上的肉一般，會讓我痛不欲生?！?24日，中央紀(jì)委國家監(jiān)委網(wǎng)站發(fā)布了針對云南省文山州住房和城鄉(xiāng)建設(shè)局原黨組成員、副局長李慶明嚴(yán)重違紀(jì)違法案的剖析。信奉金錢至上的李慶明惜財…
2024年1月24日
0
中國gdp排行榜城市(中國gdp排行榜)
中國各省gdp排名 1、根據(jù)查詢國家統(tǒng)計局官網(wǎng)信息顯示，2023年各省排名，廣東：GDP為1243667億。江蘇：GDP為116362億。山東：GDP為83099億。浙江：GDP為…
2024年1月24日
0
SK-II大中華區(qū)季度銷售額暴跌34%，寶潔：日本核污水排海是主因
財聯(lián)社1月24日訊（編輯卞純）全球日用消費品巨頭寶潔公司（ProcterGamble）周二表示，在截至12月底的第二財季，其高端護膚品牌SK-II在大中華區(qū)的銷售額下降了34%，…
2024年1月24日
0
呼和浩特白塔機場通報“保潔員占母嬰室吃飯”：涉事人已被辭退
呼和浩特白塔機場通報“保潔員占母嬰室吃飯”：涉事人已被辭退原標(biāo)題：呼和浩特白塔機場通報“保潔員占母嬰室吃飯”：涉事人已被辭退央視網(wǎng)消息：據(jù)@呼和浩特白塔國際機場消息，呼和浩…
2024年1月24日
0
退休職工舉報局長被判刑，被舉報人卻提級退休把人看懵了
文|龍之朱又見錯抓錯判上了熱搜。據(jù)媒體報道，從2016年3月起，安徽宿州市碭山縣農(nóng)機局退休職工李平實名向紀(jì)檢部門舉報局長王超經(jīng)濟問題，均石沉大海。 2017年7月，李平夫婦及親…
2024年1月24日
0
6寸蛋糕用5斤車?yán)遄拥昙业狼?
【#6寸蛋糕用5斤車?yán)遄拥昙业狼?：客服能力不足，多報了2斤車?yán)遄印?遇到商家虛假宣傳你會怎么辦# 近日，有網(wǎng)友發(fā)帖稱做六寸蛋糕需要5斤車?yán)遄右裏嶙h。 1月22日，涉事店家就“6寸…
2024年1月24日
0
格蘭芬多院徽簡筆畫(格蘭芬多院徽)
哈利波特的霍格沃茨學(xué)校分別是哪些學(xué)院? 1、《哈利波特》電影中的霍格沃茨學(xué)院，一共分為四個學(xué)院，分別是：格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學(xué)院共有格蘭芬多、…
2024年1月24日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息

<address id="7dgav"><ul id="7dgav"><strike id="7dgav"></strike></ul></address>

<ruby id="7dgav"><dl id="7dgav"><video id="7dgav"></video></dl></ruby>