在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    CAP:多重注意力機(jī)制,有趣的細(xì)粒度分類方案 – AAAI 2021

    CAP:多重注意力機(jī)制,有趣的細(xì)粒度分類方案 - AAAI 2021

    論文提出細(xì)粒度分類解決方案CAP,通過上下文感知的注意力機(jī)制來幫助模型發(fā)現(xiàn)細(xì)微的特征變化。除了像素級別的注意力機(jī)制,還有區(qū)域級別的注意力機(jī)制以及局部特征編碼方法,與以往的視覺方案很不同,值得一看

    來源:曉飛的算法工程筆記 公眾號

    論文: Context-aware Attentional Pooling (CAP) for Fine-grained Visual Classification

    • 論文地址:https://arxiv.org/abs/2101.06635
    • 論文代碼:https://github.com/ArdhenduBehera/cap

    Introduction


    ? 論文認(rèn)為大多數(shù)優(yōu)秀的細(xì)粒度圖像識別方法通過發(fā)掘目標(biāo)的局部特征來輔助識別,卻沒有對局部信息進(jìn)行標(biāo)注,而是采取弱監(jiān)督或無監(jiān)督的方式來定位局部特征位置。而且大部分的方法采用預(yù)訓(xùn)練的檢測器,無法很好地捕捉目標(biāo)與局部特征的關(guān)系。為了能夠更好地描述圖片內(nèi)容,需要更細(xì)致地考慮從像素到目標(biāo)到場景的信息,不僅要定位局部特征/目標(biāo)的位置,還要從多個維度描述其豐富且互補的特征,從而得出完整圖片/目標(biāo)的內(nèi)容。? 論文從卷積網(wǎng)絡(luò)的角度考慮如何描述目標(biāo),提出了context-aware attentional pooling(CAP)模塊,能夠高效地編碼局部特征的位置信息和外觀信息。該模塊將卷積網(wǎng)絡(luò)輸出的特征作為輸入,學(xué)習(xí)調(diào)整特征中不同區(qū)域的重要性,從而得出局部區(qū)域的豐富的外觀特征及其空間特征,進(jìn)而進(jìn)行準(zhǔn)確的分類。? 論文的主要貢獻(xiàn)如下:

    • 提出在細(xì)粒度圖像識別領(lǐng)域的擴(kuò)展模塊CAP,能夠簡單地應(yīng)用到各種卷積網(wǎng)絡(luò)中,帶來可觀的細(xì)粒度分類性能提升。
    • 為了捕捉目標(biāo)/場景間的細(xì)微差別,提出由區(qū)域特征引導(dǎo)的上下文相關(guān)的attention特征。
    • 提出可學(xué)習(xí)的池化操作,用于自動選擇循環(huán)網(wǎng)絡(luò)的隱藏狀態(tài)構(gòu)成空間和外觀特征。
    • 將提出的算法在8個細(xì)粒度數(shù)據(jù)集上進(jìn)行測試,獲得SOTA結(jié)果。
    • 分析不同的基礎(chǔ)網(wǎng)絡(luò),擴(kuò)大CAP模塊的應(yīng)用范圍。

    Proposed Approach


    ? 論文算法的整體流程如上圖所示,輸入圖片,輸出具體從屬類別,包含3個組件(3組參數(shù)):

    • 基礎(chǔ)CNN網(wǎng)絡(luò)
    • CAP模塊
    • 分類模塊

    Context-aware attentional pooling (CAP)

    ? 定義卷積網(wǎng)絡(luò)輸出的特征為,CAP的模塊綜合考慮像素級特征、小區(qū)域特征、大區(qū)域特征以及圖片級特征的上下文信息進(jìn)行分類。

    • pixel-level contextual information

    ? 像素級特征的上下文信息主要學(xué)習(xí)像素間的關(guān)聯(lián)度,在計算位置的輸出時根據(jù)關(guān)聯(lián)度綜合所有其他像素特征,直接使用self-attention實現(xiàn),特征轉(zhuǎn)化使用卷積。這一步直接對主干網(wǎng)絡(luò)輸出的特征進(jìn)行操作,但沒在整體流程圖中體現(xiàn)。

    • Proposing integral regions

    ? 為了更高效地學(xué)習(xí)上下文信息,論文在特征圖上定義不同粒度級別的基本區(qū)域,粒度級別由區(qū)域的大小決定。假設(shè)位置上的最小的區(qū)域為為例,可通過放大寬高衍生出一系列區(qū)域,,。在不同的位置產(chǎn)生相似的區(qū)域合集,得到最終的區(qū)域合集。覆蓋了所有的位置的不同寬高比區(qū)域,可以提供全面的上下文信息,幫助在圖片的不同層級提供細(xì)微特征。

    • Bilinear pooling

    ? 按照上一步,在特征圖上得到個區(qū)域,大小從最小的到最大的,論文的目標(biāo)是將不同大小的區(qū)域表示為固定大小的特征,主要采用了雙線性插值。定義為坐標(biāo)轉(zhuǎn)換函數(shù),為區(qū)域坐標(biāo),對應(yīng)的特征值為,則轉(zhuǎn)換后的圖片的坐標(biāo)上的值為:

    ? 為采樣函數(shù),為核函數(shù),這里采用的是最原始的方法,將目標(biāo)坐標(biāo)映射回原圖,取最近的四個點,按距離進(jìn)行輸出,最終得到池化后的固定特征。

    • Context-aware attention

    ? 這里,論文使用全新的注意力機(jī)制來獲取上下文信息,根據(jù)與其他特征的相似性進(jìn)行加權(quán)輸出,使得模型能夠選擇性地關(guān)注更相關(guān)的區(qū)域,從而產(chǎn)生更全面的上下文信息。以查詢項和一組關(guān)鍵詞項,輸出上下文向量:

    ? 參數(shù)矩陣和用來將輸入特征轉(zhuǎn)換為查詢項核關(guān)鍵項,為非線性組合,和為偏置項,整體的可學(xué)習(xí)參數(shù)為,而注意力項則代表兩個特征之間的相似性。這樣,上下文向量能夠代表區(qū)域蘊含的上下文信息,這些信息是根據(jù)其與其他區(qū)域的相關(guān)程度獲得的,整體的計算思想跟self-attention基本相似。

    • Spatial structure encoding

    ? 上下文向量描述了區(qū)域的關(guān)鍵程度和特點,為了進(jìn)一步加入空間排列相關(guān)的結(jié)構(gòu)信息,論文將區(qū)域的上下文向量轉(zhuǎn)為區(qū)域序列(論文按上到下、左到右的順序),輸入到循環(huán)神經(jīng)網(wǎng)絡(luò)中,使用循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏單元來表達(dá)結(jié)構(gòu)特征。? 區(qū)域的中間特征可表示為,采用LSTM,包含LSTM的相關(guān)參數(shù)。為了增加泛化能力和減少計算量,上下文特征由進(jìn)行全局平均池化得到,最終輸出上下文特征序列對應(yīng)的隱藏狀態(tài)序列,后續(xù)用于分類模塊中。

    Classification

    ? 為了進(jìn)一步引導(dǎo)模型分辨細(xì)微的變化,論文提出可學(xué)習(xí)的池化操作,能夠通過組合響應(yīng)相似的隱藏層來整合特征信息。論文借鑒NetVLAD的思想,用可導(dǎo)的聚類方法來對隱藏層的響應(yīng)值進(jìn)行轉(zhuǎn)換,首先計算隱藏層響應(yīng)對類簇的相關(guān)性,再加權(quán)到類簇的VLAD encoding中:

    ? 每個類簇都有其可學(xué)習(xí)的參數(shù)和,整體思想基于softmax,將隱藏層的響應(yīng)值按softmax的權(quán)重分配到不同的類簇中。在得到所有類簇的encoding向量后,使用可學(xué)習(xí)的權(quán)值和softmax進(jìn)行歸一化。因此,分類模塊的可學(xué)習(xí)參數(shù)為。

    Experiments and Discussion


    ? 在不同的數(shù)據(jù)集上,對不同方法進(jìn)行對比。

    ? 不同主干網(wǎng)絡(luò)下的準(zhǔn)確率對比。

    ? 不同模塊輸出特征的可視化,圖b是加入CAP后,主干網(wǎng)絡(luò)輸出的特征。

    Conclusion


    ? 論文提出細(xì)粒度分類解決方案CAP,通過上下文感知的注意力機(jī)制來幫助模型發(fā)現(xiàn)目標(biāo)的細(xì)微特征變化。除了像素級別的注意力機(jī)制,還有區(qū)域級別的注意力機(jī)制以及局部特征編碼方法,與以往的視覺方案很不同,值得一看。

    ???

    如果本文對你有幫助,麻煩點個贊或在看唄 更多內(nèi)容請關(guān)注 微信公眾號【曉飛的算法工程筆記】

    work-life balance.

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2022年6月27日 06:35
    下一篇 2022年6月27日 06:35

    相關(guān)推薦

    • 11月26日烏魯木齊風(fēng)險等級調(diào)整名單

      根據(jù)當(dāng)前疫情防控工作需要,按照《新型冠狀病毒肺炎防控方案(第九版)》、國務(wù)院聯(lián)防聯(lián)控機(jī)制綜合組《關(guān)于進(jìn)一步優(yōu)化新冠肺炎疫情防控措施科學(xué)精準(zhǔn)做好防控工作的通知》《新冠肺炎疫情風(fēng)險區(qū)劃…

      2022年11月26日
    • 計算機(jī)網(wǎng)絡(luò)技術(shù)論文(計算機(jī)網(wǎng)絡(luò)技術(shù)論文七千字)

      今天小編給各位分享計算機(jī)網(wǎng)絡(luò)技術(shù)論文的知識,其中也會對計算機(jī)網(wǎng)絡(luò)技術(shù)論文七千字進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧! 計算機(jī)網(wǎng)絡(luò)方面的論文3000字…

      2022年11月26日
    • 廣州白云區(qū)疫情反彈原因是什么(白云區(qū)疫情風(fēng)險等級)

      關(guān)注廣州疫情的小伙伴可能有注意到,最近白云區(qū)的疫情好像又反彈了。據(jù)悉,近期廣州每日新增陽性感染者持續(xù)徘徊在高位平臺,疫情多點散發(fā)與局部聚集并存,本地疫情與外地輸入交織疊加,防外溢壓…

      2022年11月25日
    • 什么是內(nèi)容營銷策略如何策劃一套成功的內(nèi)容營銷策略

      很多時候,營銷人員會在創(chuàng)作營銷內(nèi)容時感到沮喪,這也是很多企業(yè)至今沒用好數(shù)字化營銷工具的重要原因之一。 舉個例子,您可能會花上數(shù)小時期待制作一些令人驚嘆的東西,實際卻是得到很少的受眾…

      2022年11月25日
    • 直播帶貨詳細(xì)腳本(直播文案策劃怎么寫)

      短視頻運營策劃方案怎么寫?涉及哪幾個方面? 我在網(wǎng)上看到好多千篇一律的文章,關(guān)于【短視頻運營策劃方案】這一塊,基本都是在講賬號的內(nèi)容本身。 你內(nèi)容做得再好,卻不掌握算法的規(guī)律,能有…

      2022年11月25日
    • 前三季度,市場規(guī)模超過五萬億元 信息消費展現(xiàn)蓬勃生機(jī)

      家居企業(yè)個性化全屋定制系統(tǒng),備受消費者青睞;主打?qū)I(yè)電競的新款高性能便攜式計算機(jī),銷量表現(xiàn)創(chuàng)新高;物流企業(yè)推出數(shù)智化供應(yīng)鏈興農(nóng)服務(wù)項目,助力優(yōu)質(zhì)農(nóng)產(chǎn)品出深山…… 不久前,工信部發(fā)布…

      2022年11月24日
    • 大疆發(fā)布DJI O3 Air Unit圖傳解決方案 售價1499元

      大疆日前發(fā)布了最新的DJI O3 Air Unit 數(shù)字圖傳解決方案,該方案將DJI O3+ 圖傳與1/1.7 英寸影像傳感器相機(jī)模塊集于一身,具有高畫質(zhì)、低延時、遠(yuǎn)距離等特點。 …

      2022年11月23日
    • 高風(fēng)險區(qū)域多久能解除

      高風(fēng)險區(qū)的解除依據(jù)是什么? 高風(fēng)險區(qū)連續(xù)5天沒有發(fā)現(xiàn)新增感染者降為低風(fēng)險區(qū),做這樣的調(diào)整主要是基于第九版防控方案實踐評估數(shù)據(jù)以及風(fēng)險研判證據(jù)。也就是說,在核酸檢測陽性人員及其密切接…

      2022年11月23日
    • 國家衛(wèi)健委:各地進(jìn)一步加大層層加碼整治力度

      據(jù)央視新聞,國家疾控局傳防司二級巡視員胡翔22日在國務(wù)院聯(lián)防聯(lián)控機(jī)制新聞發(fā)布會上介紹,近期,國務(wù)院聯(lián)防聯(lián)控機(jī)制綜合組通過視頻會商、調(diào)度和培訓(xùn)等多種方式,部署調(diào)度各地盡快推進(jìn)二十條優(yōu)…

      2022年11月23日
    • 廣州白云區(qū)靜默什么時候解封(廣州市白云區(qū)靜默管理)

      最近一段時間廣州疫情是全國最為嚴(yán)重的城市,多個區(qū)域都有新增病例,其中白云區(qū)也有疫情,為了疫情防控,當(dāng)?shù)?1日起將實行靜默管控,大家都想早點解封,那么廣州白云區(qū)靜默什么時候解封?下面…

      2022年11月23日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時間:周一至周五,10:30-18:30,節(jié)假日休息