在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    論文讀不懂怎么辦?

    悄悄告訴你幾個(gè)竅門。

    論文讀不懂怎么辦?

    痛苦

    做科研,不能不讀論文。

    但是,我見過不少研究生,論文都讀得愁眉苦臉的。

    這其中,自然有因?yàn)橥涎拥年P(guān)系。例如教授布置了 2 周后討論論文,你原本可以每天抽出時(shí)間,慢慢消化??赡惴堑猛系浇刂谷掌诘那耙惶焱砩喜糯蜷_看,希望畢其功于一役…… 這顯然是態(tài)度問題。

    但是,不可忽略的,有些同學(xué),卻真的不是態(tài)度問題,而是方法不當(dāng)。

    他們喜歡跟論文死磕。

    讀不懂,就一遍一遍反復(fù)讀,試圖從字里行間,悟出精髓。

    這可能是為了遵從那句古訓(xùn):

    書讀百遍,其義自見。

    且不說這樣是不是最終能走通。只論這個(gè)過程,就很痛苦,而且事倍功半。

    有的同學(xué)對(duì)著一篇論文發(fā)憤了幾天甚至是幾周,依然看不懂。那種挫折、沮喪,別人看著都難受。

    問題出在哪里呢?

    困難

    我在《如何與導(dǎo)師有效溝通你的論文選題?》一文給你講過,一篇合格的論文,就是傳遞認(rèn)知差的載體。

    更進(jìn)一步,不斷涌現(xiàn)的論文,其實(shí)就是學(xué)術(shù)界的升級(jí)安裝包。

    你不斷讀論文,就是為了跟學(xué)術(shù)共同體保持同步。但是,只有你跟這篇論文所依賴的那些基礎(chǔ)知識(shí)同步以后,安裝這個(gè)升級(jí)包才有意義,也才能水到渠成。

    而對(duì)著論文犯愁的你,不管出于什么原因,顯然不大具備這個(gè)新包兒(論文)的安裝條件。

    所以,你需要做的,不是跟這篇論文自身較勁。而是應(yīng)該盡快補(bǔ)充調(diào)整自己的知識(shí)架構(gòu),使得這篇論文對(duì)你而言,是可以兼容,并且升級(jí)的。

    論文羅列的參考文獻(xiàn),可以作為你補(bǔ)充基礎(chǔ)知識(shí)的一個(gè)有效手段。畢竟,作者親自在這里為你指明的路徑,如同給了你一張寫有路標(biāo)的迷宮地圖。

    這就是為什么,許多優(yōu)秀的博士,都是要讀數(shù)百篇文獻(xiàn)的。

    讀過那些文獻(xiàn)以后,再看什么新文獻(xiàn),都會(huì)很有感覺,一下子就能找到方向,看到論文的優(yōu)勢和弱點(diǎn)。

    這時(shí)候,你就已經(jīng)是個(gè)專業(yè)人士了。

    但是,對(duì)于初學(xué)者而言,你得先讓自己樹立自信。而不是用一種近乎于閉卷考試的方法挑戰(zhàn)自己。

    做買賣不怕賠錢,但是怕剛開張的時(shí)候賠錢。這是有道理的,因?yàn)?“貧窮陷阱” 曲線有多個(gè)均衡。

    論文讀不懂怎么辦?

    同樣,做科研也不怕面對(duì)困難。但是初始階段,還是得給自己降低一些難度。

    許多時(shí)候,你要讀的論文來自陌生領(lǐng)域,你并沒有那么多的時(shí)間,一篇篇文獻(xiàn)去啃、去挖掘。

    舉個(gè)例子,假設(shè)你的研究方向,不是自然語言處理或者深度神經(jīng)網(wǎng)絡(luò)。但是你最近在學(xué)術(shù)研討會(huì)上聽說了一個(gè)神奇的東西,叫做 BERT 。

    你自己學(xué)科里面的很多人,都在談?wù)撍?。他們用上?BERT ,所以可以高精度、自動(dòng)化處理很多從前只有人類才能做好的文本處理工作,例如情感分析,例如智能問答等。

    見他們發(fā)了很好的論文,你也想一探究竟。

    你找到了 BERT 的原始論文,它就在預(yù)印本平臺(tái) arxiv 上面。

    論文讀不懂怎么辦?

    但是一打開,你就暈了。

    論文讀不懂怎么辦?

    這些術(shù)語(例如 “fine-tuning”),這些圖,都是什么意思???一點(diǎn)頭緒都沒有。

    怎么辦?

    好在,要讀懂論文,是有不少竅門的。你可以善用許多從前忽視的資源,幫助自己消化和理解論文中令你感到困惑的部分。

    下面我一一講給你聽。

    幻燈

    俗話說,解鈴還須系鈴人。

    如果你覺得一個(gè)作者在論文中使用了很多公式,而且表達(dá)晦澀,那是因?yàn)橐l(fā)表,他只需要顧及審稿人和領(lǐng)域內(nèi)小圈子專業(yè)人士的感覺就可以了。

    為了表達(dá)效率高,他就得用術(shù)語。為了表達(dá)精準(zhǔn),他就得用公式。

    用術(shù)語,就是壓縮;用公式,就是加密。

    所以,論文其實(shí)就是一個(gè)加密壓縮包。

    它安全,只有內(nèi)行看得懂,不會(huì)引來很多外行抬杠。

    它高效,壓縮了所有冗余的信息。

    但這搞得你這個(gè)初學(xué)者讀不懂,很不愉快。

    你得先解密再解壓縮,然后才能看懂??赡惆Y結(jié)在于,你不具備解密和解壓的能力。

    好在,每一個(gè)作者,都要同時(shí)面對(duì)兩個(gè)問題 —— 共識(shí)與知名度。

    共識(shí)是說,別人承認(rèn)他;知名度是說,別人喜歡他。

    要提升知名度,他就不能只悶頭寫論文。還得出席一些會(huì)議,做做報(bào)告和講座什么的。

    面對(duì)大領(lǐng)域同行,他要把一個(gè)事兒說清楚,就不能再用那么多的術(shù)語了,而必須考慮到聽眾的感受。

    這時(shí)候,他可能更多使用描述性語言,生動(dòng)的例子,甚至更吸引人的內(nèi)容,例如視頻或者動(dòng)圖。

    這些會(huì)議的幻燈,很多都是公開發(fā)布的。所以你不妨搜搜看。

    例如說,你在搜索引擎里面搜索 BERT 那篇論文的第一作者,加上 BERT 這個(gè)關(guān)鍵詞,以及把資源類型指定為 ppt 之后,你就能看見很有趣的搜索結(jié)果了。

    論文讀不懂怎么辦?

    點(diǎn)開看看?

    論文讀不懂怎么辦?

    原來是 Jacob Devlin 在斯坦福大學(xué)一次演講的幻燈。

    這里面,清晰地定義了問題,并且梳理了各種疑問的解答。

    論文讀不懂怎么辦?

    特別地,還使用了更多的圖形,來對(duì)比 BERT 和現(xiàn)有技術(shù)之間的差異。

    論文讀不懂怎么辦?

    通過幻燈,你可以把論文中很多沒有能夠展開的問題,或者許多作者認(rèn)為小領(lǐng)域同行默知默會(huì)的知識(shí)點(diǎn),都詳細(xì)論述。

    有了這些補(bǔ)充資源,再回去讀論文,是不是更加清晰了?

    博客

    如果找不到作者的演示幻燈,或者看了作者的幻燈之后,你還是沒能很好理解論文的內(nèi)容,也不必氣餒。

    我們前面說的,只是通則。

    例如我們假定,作者面對(duì)一群不同背景的聽眾時(shí),他的幻燈會(huì)做得更加深入淺出,以調(diào)眾口。

    但是,有些學(xué)者,就是不分場合跟你展示數(shù)學(xué)功底。指著一個(gè)包含超過 30 個(gè)數(shù)學(xué)符號(hào)的長式子興奮地說:

    看,就是那么顯而易見……!

    這種情況下,如果他的工作足夠重要,你不必?fù)?dān)心,會(huì)有人站出來幫忙做解密和解壓,也就是 “科普” 這件事兒的。

    目前學(xué)術(shù)界有幾個(gè)科普文和教程聚居地。

    其中我最喜歡的一個(gè),是 medium.com 。

    BERT 論文出來之后不久,你就可以在 Medium 上面查到這篇博文。

    論文讀不懂怎么辦?

    博文寫得如何?看看點(diǎn)贊(clap)次數(shù)也就知道了。

    論文讀不懂怎么辦?

    標(biāo)紅的地方顯示,已經(jīng)有超過 3800 人點(diǎn)贊了。這在 Medium 平臺(tái)的學(xué)術(shù)科普類文章里,算是非常受歡迎了。

    之后過了半個(gè)月,又有人寫了這篇。

    論文讀不懂怎么辦?

    隨后,因?yàn)樵S多與 BERT 類似的 Transformers 模型競相出現(xiàn),所以 medium 平臺(tái)上的相關(guān)系列教程,也層出不窮。

    論文讀不懂怎么辦?

    例如發(fā)布在 2019 年 2 月 “How the Embedding Layers in BERT Were Implemented” 一文中的這張手繪圖形,就把 BERT 為什么使用 3 種不同的嵌入層,講得一清二楚。

    論文讀不懂怎么辦?

    這些文章,可以讓你從一個(gè)感興趣的旁觀者角度,迅速建立相關(guān)概念。有了這些基礎(chǔ)之后,再去讀論文,你的感覺會(huì)輕松許多。

    視頻

    如果你足夠幸運(yùn)的話,還能找到很好的視頻教程,作為補(bǔ)充資源。

    其中許多視頻,還是免費(fèi)的。

    例如 BERT ,就有不少人一言不合發(fā)視頻給大家講講清楚。

    論文讀不懂怎么辦?

    中英文視頻都有。而且排名靠前的這些教程,往往都做得品質(zhì)精良,讓你迅速了解 BERT 的來龍去脈。

    我個(gè)人比較推薦那些大學(xué)老師做的視頻。當(dāng)老師受到的最寶貴訓(xùn)練,絕不是什么師資班的培訓(xùn),而是上課的時(shí)候收獲的學(xué)生反饋。

    因?yàn)榭偸墙o學(xué)生上課,他會(huì)明白學(xué)生的關(guān)注點(diǎn)在哪里,會(huì)忽視或者錯(cuò)誤理解什么,從而可以有的放矢強(qiáng)調(diào)某些東西,讓你輕易避開很多認(rèn)知誤區(qū)陷阱。

    例如說李宏毅老師講的 BERT 介紹,就可稱得上是深入淺出,形象生動(dòng)。

    論文讀不懂怎么辦?

    何況,還是中文的。

    課程

    有的時(shí)候,你會(huì)發(fā)現(xiàn),雖然某些令許多人關(guān)注的焦點(diǎn)內(nèi)容(例如 BERT )會(huì)有這樣多的視頻可供觀賞,但是若你想仔細(xì)了解一下論文里出現(xiàn)的其他技術(shù),以便對(duì)比,就未必有這么好的運(yùn)氣了。

    在視頻平臺(tái)上搜尋,也許很難有收獲,甚至還會(huì)找到很多噪聲。

    這時(shí)候,你也不要?dú)怵H。雖然你想看視頻教程,但如果只在某個(gè)視頻平臺(tái)搜索,那就如同魚在坑的東邊,你卻非得在坑西邊釣一樣。

    系統(tǒng)化了的知識(shí),你沒有必要東奔西走地查找。而是可以通過在線課程來快速概覽。這樣不僅選擇成本低,而且學(xué)習(xí)效率更高。

    有的同學(xué)天然把課程等同于幾大 MOOC 平臺(tái)。實(shí)際上,這也是一種誤解。

    例如你打算回顧一下,自然語言處理近幾年的發(fā)展與技術(shù)應(yīng)用。那么,選擇 Coursera 或者 Udacity 課程,自然也是一種辦法。

    但你如果喜歡更靈活地學(xué)習(xí),可以直接到 fast.ai 上面。因?yàn)檫@里的特點(diǎn)是快速迭代,緊貼前沿,而且剛好就有一門 NLP 課程,內(nèi)容非常新穎。

    論文讀不懂怎么辦?

    課程內(nèi)容里,自然也包括 BERT 。

    論文讀不懂怎么辦?

    而與此同時(shí),它也囊括了 ULMfit, GPT-2 和 XLNet 等相關(guān)技術(shù)。以寫代碼來理解不同技術(shù)的進(jìn)展,邏輯清晰,讓你一站式了解領(lǐng)域里面最重要的內(nèi)容有哪些,特別是最近發(fā)生了什么有意思的事兒。

    論文讀不懂怎么辦?

    代碼

    提到了代碼,咱們就多說幾句。

    Jeremy Howard 在他的課程里面一直強(qiáng)調(diào),對(duì)于技術(shù)類的問題,代碼比公式更重要。

    論文讀不懂怎么辦?

    描述一個(gè)算法,你用公式當(dāng)然沒有問題。但如你能把它寫成代碼,而且正確運(yùn)行,那想必你是真的懂了。

    同樣,現(xiàn)在我們看很多論文,都配有代碼。

    論文讀不懂怎么辦?

    如果你讀論文的時(shí)候,只閱讀公式看算法,搞不懂究竟是怎么回事兒,則完全可以去看看那簡單的 Python 代碼。

    例如說 BERT ,你雖然看到各種圖片,但是可能還是不知道,如果你打算做一個(gè)分類下游任務(wù),該怎么給你的輸入文本做編碼呢?

    這時(shí)候,如果你讀代碼,效果就大不相同了。

    當(dāng)然,這里不是讓你去讀最初論文的代碼。那是基于 Tensorflow 1.x 版本寫的?;仡櫼幌拢以凇度?span id="sjz0hdh" class="wpcom_tag_link">何用 Python 和 BERT 做中文文本二元分類?》里面,跟你介紹過 Tensorflow 1.x 設(shè)計(jì)上的反人性。

    你完全可以去讀 PyTorch 代碼。至少讀起來,更像是人話。

    有好事者,就把 Tensorflow 上的各種 Transformer 模型,都搬到了 PyTorch 上。目前這個(gè)叫做 Transformer 2.0 項(xiàng)目,在 github 上已經(jīng)有了 16300 顆星。

    論文讀不懂怎么辦?

    在論文里, BERT 模型輸入文本的預(yù)處理,是這個(gè)樣子的。你可能會(huì)很疑惑,特殊的 token (例如論文中出現(xiàn)的 [CLS] 和 [SEP] ),究竟如何設(shè)置,如何起作用?

    論文讀不懂怎么辦?

    這里,看一下代碼示例。你會(huì)發(fā)現(xiàn),原來你該這樣把它們加入進(jìn)去。

    論文讀不懂怎么辦?

    而且,只有真正看了代碼倉庫里面的示例,你才會(huì)了解, transformers 這個(gè)項(xiàng)目,為什么會(huì)這么火。

    因?yàn)?,你可以僅僅用 10 幾條語句,就完成一個(gè)經(jīng)典的文本分類任務(wù)。

    論文讀不懂怎么辦?

    于是,你也就明白,在自己的研究任務(wù)里面,用上最前沿的自然語言處理技術(shù),根本就沒有預(yù)想得那么困難。

    小結(jié)

    本文我們以 BERT 為例,為你講述了當(dāng)直接閱讀科研論文時(shí)遭遇困難的原因,以及你可以求助的免費(fèi)資源和路徑,它們包括但不限于:

    幻燈。作者用幻燈和聽眾溝通的時(shí)候,是要在一定程度上,放棄術(shù)語和公式的便利的。這就給你一個(gè)聽懂的機(jī)會(huì)。博客。對(duì)于一個(gè)大家都認(rèn)為有用,但是學(xué)起來很困難的知識(shí)點(diǎn)。你可以在主流技術(shù)博客平臺(tái)上找一找,很可能會(huì)有驚喜。視頻。視頻教程的好處,是可以用更為形象生動(dòng)的方式,給你展現(xiàn)動(dòng)態(tài)的過程。而且,有時(shí)你還能直接感受到講者的幽默。課程。如果你需要形成知識(shí)基礎(chǔ),系統(tǒng)化的課程可以讓這一過程快捷高效。代碼。對(duì)于那些技術(shù)性的問題,數(shù)學(xué)描述算法有時(shí)候會(huì)讓人有疑惑。這時(shí)候,閱讀源代碼,甚至編程實(shí)踐出來,會(huì)極大提升你的理解程度。當(dāng)然,這不是全部。

    最好的方式,當(dāng)然是與專家甚至是作者本人,做面對(duì)面的高效溝通反饋。當(dāng)然,這樣的機(jī)會(huì)很稀缺。如果你遇到,一定要抓住。

    專欄

    我的第一個(gè)訂閱專欄《科研新手全面入坑指南》已正式上線了。

    論文讀不懂怎么辦?

    我用 20 多篇教程,為你介紹初窺研究門徑的研究生與高年級(jí)的本科生,很需要了解的一些科研基礎(chǔ)知識(shí)。包括但不限于如何選題、如何讀文獻(xiàn)、如何快速寫初稿…… 這些知識(shí),你的導(dǎo)師大約會(huì)默認(rèn)你已經(jīng)學(xué)會(huì),因此不會(huì)手把手教給你。但是你若做不到,導(dǎo)師很可能會(huì)覺得你基礎(chǔ)不牢,或者不用心。你唯一能做的,就是盡快把它們補(bǔ)充齊備,以便減輕剛剛走上科研之路時(shí)的痛苦,保護(hù)好你的好奇心與成就感。

    除了方法,我還介紹一些工具給你。例如 VosViewer 。 它可以幫助你快速掃描中英文領(lǐng)域文獻(xiàn),發(fā)現(xiàn)作者、主題之間的微妙關(guān)聯(lián)。由此,你就可以快速識(shí)別已有研究的盲點(diǎn)、盲區(qū),甚至是盲維,從而有的放矢地找到自己研究的獨(dú)特定位與價(jià)值。

    愿熱愛學(xué)習(xí)的你,科研之路從此走得更加扎實(shí)與順暢。

    讀過本文,如果覺得有收獲,請(qǐng)點(diǎn)贊。

    要讀更多的文章,微信關(guān)注我的公眾號(hào) “玉樹芝蘭”(nkwangshuyi)。別忘了加星標(biāo),以免錯(cuò)過新推送提示。

    如果本文對(duì)你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。

    延伸閱讀你可能也會(huì)對(duì)以下話題感興趣。點(diǎn)擊鏈接就可以查看。

    如何用 Python 和深度遷移學(xué)習(xí)做文本分類?如何用 Python 和 BERT 做中文文本二元分類?如何用 Python 和 BERT 做中文文本二元分類?如何用 Python 和 BERT 做多標(biāo)簽(multi-label)文本分類?如何在 fast.ai 用 BERT 做中文文本分類?題圖: Photo by Tim Gouw from Pexels

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
    (0)
    用戶投稿
    上一篇 2022年5月28日 16:15
    下一篇 2022年5月28日 16:40

    相關(guān)推薦

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息