卷首語(yǔ)
一個(gè)世紀(jì)以來(lái),數(shù)字科技的演進(jìn)推動(dòng)了人類(lèi)的技術(shù)進(jìn)步與產(chǎn)業(yè)發(fā)展。我們當(dāng)前正在經(jīng)歷數(shù)字科技最快發(fā)展的階段,數(shù)字化、網(wǎng)絡(luò)化、智能化讓數(shù)字世界與物理世界的融合與協(xié)同更加緊密。
從現(xiàn)實(shí)世界走向虛實(shí)融合的世界。云網(wǎng)端的協(xié)同發(fā)展下,端側(cè)將誕生更多繁榮的新物種,比如以 VR、AR 為代表的虛擬現(xiàn)實(shí)技術(shù)相結(jié)合的多種終端,將在下一代互聯(lián)網(wǎng)的催化下,改變?nèi)伺c科技互動(dòng)的方式。通過(guò)模擬真實(shí)世界的時(shí)空,解決真實(shí)世界的需求,如遠(yuǎn)程教育、遠(yuǎn)程醫(yī)療、遠(yuǎn)程辦公等,消除地理空間的限制。
從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用。以云為核心的數(shù)字技術(shù)體系,將 AI、大數(shù)據(jù)、大規(guī)模算力等技術(shù)與資源集成在一起,并通過(guò)云這個(gè)數(shù)字化的操作系統(tǒng),讓個(gè)體、企業(yè)、科研院所都可以低門(mén)檻、普惠的方式快速的調(diào)用技術(shù)資源。讓各類(lèi)前沿技術(shù)從實(shí)驗(yàn)室通過(guò)云走到現(xiàn)實(shí)中,如 AI 工程化、AI for Science、預(yù)訓(xùn)練模型都在原有的基礎(chǔ)上,將人工智能運(yùn)用到生物醫(yī)藥、天文氣象、工業(yè)制造等各行各業(yè)的實(shí)際問(wèn)題中。
共同走向可持續(xù)發(fā)展的未來(lái)。全球正面臨日益緊迫的環(huán)境保護(hù)問(wèn)題,每一個(gè)人都需要深刻的意識(shí)到,綠色低碳需要在人們的生活點(diǎn)滴、生產(chǎn)的各個(gè)環(huán)節(jié)去推動(dòng)節(jié)能減排,而數(shù)字科技是這過(guò)程中必不可少力量,包括從無(wú)紙化辦公、數(shù)據(jù)中心節(jié)能技術(shù)、到工業(yè)生產(chǎn)能耗優(yōu)化等多個(gè)方面去努力。
以科技,達(dá)到我們共同美好的未來(lái)。
序言一
數(shù)百年來(lái),以數(shù)據(jù)驅(qū)動(dòng)的開(kāi)普勒范式和以第一性原理驅(qū)動(dòng)的牛頓范式是科學(xué)研究的兩大基本范式。當(dāng)下正在蓬勃興起的 AI for Science 有可能促使兩種既有范式的深度融合,激發(fā)一場(chǎng)新的科學(xué)革命?!?span id="ranmjvl" class="wpcom_tag_link">達(dá)摩院 2022 十大科技趨勢(shì)》將 AI for Science 列為重要趨勢(shì),無(wú)疑是看到了人工智能和傳統(tǒng)科研結(jié)合帶來(lái)的巨大潛能。我希望它能幫助推動(dòng)更多科研工作者投身其中,加速這場(chǎng)科學(xué)革命的進(jìn)程。
科學(xué)研究有兩大基本目的:一是尋求基本規(guī)律,二是解決實(shí)際問(wèn)題。在量子力學(xué)建立之時(shí),狄拉克就預(yù)言說(shuō)尋求基本規(guī)律的任務(wù)已大體完成,但因?yàn)槠鋽?shù)學(xué)問(wèn)題太復(fù)雜,用基本原理來(lái)解決實(shí)際問(wèn)題非常困難。直到上世紀(jì) 50 年代電子計(jì)算機(jī)開(kāi)始投入使用,以及微分方程數(shù)值方法的出現(xiàn),人類(lèi)才第一次大規(guī)模實(shí)現(xiàn)了從基本原理出發(fā)解決實(shí)際問(wèn)題的能力,并由此構(gòu)建起了現(xiàn)代工業(yè)和技術(shù)賴(lài)以生存的基礎(chǔ)。
但很多問(wèn)題依然非常難以求解,比方說(shuō)各類(lèi)多體問(wèn)題,藥物和材料設(shè)計(jì)、蛋白質(zhì)折疊、湍流、塑性力學(xué)和非牛頓流體力學(xué)等。這些難題的根本根源是“維數(shù)災(zāi)難”:隨著自由度的增多,問(wèn)題的復(fù)雜度呈指數(shù)級(jí)增長(zhǎng)。
我從 80 年代開(kāi)始研究算法,一直在嘗試解決這些問(wèn)題。尤其是在多尺度模型和算法方面,我持續(xù)了多年的努力,但總是覺(jué)得難以找到真正的突破口。2011 年我寫(xiě)了一本多尺度模型方面的書(shū)。本來(lái)是想在山窮水盡之際轉(zhuǎn)行到更需要科研人力投入的大數(shù)據(jù)領(lǐng)域,但我沒(méi)想到的是,機(jī)器學(xué)習(xí)恰恰是我們過(guò)去缺乏的工具。從 2014 年起,我即投身于機(jī)器學(xué)習(xí)與科學(xué)計(jì)算的結(jié)合。去年我們一個(gè)以年輕人為主力的團(tuán)隊(duì)利用機(jī)器學(xué)習(xí)方法在量子力學(xué)精度的分子動(dòng)力學(xué)模擬方面取得了重大突破,把可處理體系的規(guī)模從 1000 個(gè)原子提高到 1 億個(gè)原子,并因此獲得了 2020 年戈登貝爾獎(jiǎng)。這是我們第一次看到機(jī)器學(xué)習(xí)、科學(xué)計(jì)算、高性能計(jì)算三大工具的結(jié)合所帶來(lái)的廣闊空間。AlphaFold 2的成功,更是讓我們看到了數(shù)據(jù)驅(qū)動(dòng)的方法所能帶來(lái)的革命性的改變。
這個(gè)空間和改變給我們帶來(lái)的將是新的科學(xué)工具的發(fā)展和新的科研模式的構(gòu)建。它也將推動(dòng)科學(xué)研究從小農(nóng)作坊模式轉(zhuǎn)變到大平臺(tái)模式,即由整個(gè)科學(xué)家群體共同努力構(gòu)建基礎(chǔ)模型、基礎(chǔ)算法和工具。這樣的大平臺(tái)將極大地提升整體科研的效率。在這一方面,DeepModeling 開(kāi)源社區(qū)已經(jīng)邁開(kāi)了非??上驳囊徊?。
AI for Science 帶來(lái)的不僅僅是幾個(gè)點(diǎn)上的突破,而是科研方法的全面改變。要適應(yīng)這樣一個(gè)新的環(huán)境,科學(xué)家們需要更深入地了解 AI,才有可能用好 AI。企業(yè)積累了大量 AI 研發(fā)能力和資源。它們不僅可以提供學(xué)界所急缺的計(jì)算資源,還能夠幫助打造基礎(chǔ)科研工具。無(wú)疑,學(xué)界和業(yè)界需要更多協(xié)作,秉持開(kāi)源開(kāi)放的精神,消除門(mén)戶之見(jiàn),打造 AI for Science 的科研共同體。
達(dá)摩院十大科技趨勢(shì)或許就是這種努力之一。我期待達(dá)摩院牽頭的這種努力,能夠加快信息科學(xué)和傳統(tǒng)科學(xué)的深度融合。也期待 AI for Science 不只是一個(gè)新的浪潮,而是一個(gè)全新的科學(xué)時(shí)代。
序言二
著名物理學(xué)家盧瑟福提到“科學(xué)家不是依賴(lài)于個(gè)人的思想,而是綜合了幾千人的智慧,所有的人想一個(gè)問(wèn)題,并且每人做它的部分工作,添加到正建立起來(lái)的偉大知識(shí)大廈之中?!笨茖W(xué)不應(yīng)該是束之高閣的學(xué)問(wèn),應(yīng)該讓更多有志者能夠理解、能夠共同參與進(jìn)來(lái),讓科學(xué)變成科技,讓科技變成產(chǎn)品,真實(shí)地改善人類(lèi)生活的方方面面。
達(dá)摩院作為企業(yè)的研發(fā)機(jī)構(gòu),關(guān)注的科學(xué)課題都更加接近實(shí)際問(wèn)題,在今年達(dá)摩院發(fā)布的十大科技趨勢(shì)中可見(jiàn)一斑,有離生活更近的趨勢(shì),譬如人工智能改變醫(yī)療的方式,讓一般人能夠享受到精度更高、體驗(yàn)更好的醫(yī)療服務(wù);也有離產(chǎn)業(yè)更近的趨勢(shì),譬如柔性感知機(jī)器人的產(chǎn)業(yè)化,讓機(jī)器人技術(shù)能夠被使用到更廣泛的場(chǎng)景中。這些科技趨勢(shì)讓大眾了解到科技正在解決什么問(wèn)題,而這些解決實(shí)際問(wèn)題的科技發(fā)展,讓大眾更能直接感受科技帶來(lái)的美好。
科幻成真總是激動(dòng)人心的,如同《回到過(guò)去》電影中預(yù)言的視頻通話、3D 眼鏡、指紋辨識(shí)等技術(shù),在今天已經(jīng)真切地改變?nèi)祟?lèi)的生活。同樣地,達(dá)摩院十大科技趨勢(shì)在今天看來(lái)只是預(yù)測(cè),我衷心希望在未來(lái)群策群力的努力下,這些預(yù)測(cè)都能成為現(xiàn)實(shí),讓科技成為社會(huì)進(jìn)步的重要力量。
方法論闡述
《達(dá)摩院 2022 十大科技趨勢(shì)》采用了“定量發(fā)散,定性收斂”的分析方法,整個(gè)分析流程分為兩部分:“定量發(fā)散”是對(duì)科學(xué)領(lǐng)域做廣泛而全面的定量分析,抽取其中的熱點(diǎn)領(lǐng)域并挖掘重點(diǎn)突破的技術(shù);“定性收斂”是對(duì)突破的技術(shù)點(diǎn)進(jìn)行梳理,通過(guò)與領(lǐng)域?qū)<页浞值恼撟C,找出多個(gè)技術(shù)點(diǎn)代表的趨勢(shì),總結(jié)對(duì)未來(lái)的預(yù)判。
一 定量發(fā)散
以公開(kāi)論文庫(kù)和公開(kāi)專(zhuān)利庫(kù)作為基礎(chǔ)數(shù)據(jù)進(jìn)行分析,從 236 個(gè)領(lǐng)域中篩選出 159 個(gè)應(yīng)用與基礎(chǔ)科學(xué)領(lǐng)域,基于論文與專(zhuān)利數(shù)量的絕對(duì)值與增長(zhǎng)率,篩選出在學(xué)界與產(chǎn)業(yè)界需要重點(diǎn)關(guān)注的領(lǐng)域。本次總計(jì)分析了 770 萬(wàn)篇論文及 8.5 萬(wàn)份專(zhuān)利,時(shí)間跨度為 2018 年 1 月到 2021 年 10 月。
在篩選出的重點(diǎn)領(lǐng)域中運(yùn)用 NLP 技術(shù)分析相關(guān)領(lǐng)域論文(特別是被高頻引用的論文)內(nèi)容,找出過(guò)去 12 個(gè)月內(nèi)被高頻提及的關(guān)鍵詞,并調(diào)查關(guān)鍵詞背后的代表技術(shù),挖掘可能驅(qū)動(dòng)技術(shù)發(fā)展的關(guān)鍵要素,以此作為下一階段分析的重要基礎(chǔ)。
二 定性收斂
通過(guò)訪談專(zhuān)家和組織研討會(huì),對(duì)熱點(diǎn)領(lǐng)域內(nèi)的技術(shù)發(fā)展方向進(jìn)行討論總結(jié),最后結(jié)合專(zhuān)家觀點(diǎn)與技術(shù)情報(bào)提煉科技趨勢(shì)候選清單。本次共計(jì)訪談了近百位產(chǎn)、學(xué)、研、用領(lǐng)域的專(zhuān)家和戰(zhàn)略科學(xué)家。
最后,達(dá)摩院專(zhuān)家委員會(huì)組織了多輪討論,基于影響力、技術(shù)可行性、社會(huì)價(jià)值等因素的綜合考量,最終選出了代表 2022 的十大科技趨勢(shì)。
AI for Science
人工智能成為科學(xué)家的新生產(chǎn)工具,催生科研新范式
概要
實(shí)驗(yàn)科學(xué)和理論科學(xué)是數(shù)百年來(lái)科學(xué)界的兩大基礎(chǔ)范式,而人工智能正在催生新的科研范式。機(jī)器學(xué)習(xí)能夠處理多維、多模態(tài)的海量數(shù)據(jù),解決復(fù)雜場(chǎng)景下的科學(xué)難題,帶領(lǐng)科學(xué)探索抵達(dá)過(guò)去無(wú)法觸及的新領(lǐng)域。人工智能不僅將加速科研流程,還將幫助發(fā)現(xiàn)新的科學(xué)規(guī)律。預(yù)計(jì)未來(lái)三年,人工智能將在應(yīng)用科學(xué)中得到普遍應(yīng)用,在部分基礎(chǔ)科學(xué)中開(kāi)始成為科學(xué)家的生產(chǎn)工具。
趨勢(shì)解讀
科學(xué)研究是在星辰大海里探索未知,科學(xué)發(fā)現(xiàn)漫長(zhǎng)而偶然,重大突破仰賴(lài)大科學(xué)家的貢獻(xiàn),如牛頓、愛(ài)因斯坦、楊振寧等,盡管眾多科學(xué)家不懈投入,科學(xué)發(fā)展的速度仍受到一定限制。計(jì)算機(jī)科學(xué)改變科研的路徑是從下游逐漸走向上游。起初計(jì)算機(jī)主要用來(lái)做實(shí)驗(yàn)數(shù)據(jù)的分析與歸納。后來(lái)科學(xué)計(jì)算改變了科學(xué)實(shí)驗(yàn)的方式,人工智能結(jié)合高性能計(jì)算,在實(shí)驗(yàn)成本與難度較高的領(lǐng)域開(kāi)始用計(jì)算機(jī)進(jìn)行實(shí)驗(yàn)的模擬,驗(yàn)證科學(xué)家 的 假 設(shè) , 加速科研成果的產(chǎn)出,如核能實(shí)驗(yàn)的數(shù)字反應(yīng)堆,能夠降低實(shí)驗(yàn)成本、提高安全性、減少核廢料產(chǎn)生。近年,人工智能被證明能做科學(xué)規(guī)律發(fā)現(xiàn),不僅在應(yīng)用科學(xué)領(lǐng)域,也能在基礎(chǔ)科學(xué)領(lǐng)域發(fā)揮作用,如 DeepMind 使用人工智能來(lái)幫助證明或提出新的數(shù)學(xué)定理,輔助數(shù)學(xué)家形成對(duì)復(fù)雜數(shù)學(xué)的直覺(jué)。
人工智能將成為科學(xué)家繼計(jì)算機(jī)之后的新生產(chǎn)工具,一是帶來(lái)效率的顯著提升,人工智能將伴隨科研的全流程,從假設(shè)、實(shí)驗(yàn)到歸納總結(jié),讓科學(xué)家不需要像過(guò)去一樣十年寒窗才能產(chǎn)出科學(xué)成果,而是能在一生中保持高產(chǎn);二是讓科學(xué)不再依賴(lài)少數(shù)天才,人工智能對(duì)科學(xué)研究產(chǎn)生猜想,讓科學(xué)家就其中有意義有價(jià)值的部分進(jìn)行實(shí)驗(yàn)與證明,讓更多人能夠參與到科學(xué)研究中。
人工智能在各科研領(lǐng)域中的應(yīng)用節(jié)奏將有所區(qū)別,在數(shù)字化程度高、數(shù)據(jù)積累好、問(wèn)題已經(jīng)被清晰定義的領(lǐng)域中將推進(jìn)地更快,如生命科學(xué)領(lǐng)域,AlphaFold2 運(yùn)用生命科學(xué)積累的大量數(shù)據(jù),通過(guò)基因序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),對(duì)泛生命科學(xué)領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響。另一方面,在復(fù)雜性高、變量因子趨勢(shì)解讀多的領(lǐng)域,人腦難以歸納總結(jié),機(jī)器學(xué)習(xí)可發(fā)揮優(yōu)勢(shì)在海量多維的數(shù)據(jù)中找到科學(xué)規(guī)律,如流體力學(xué)等。
人工智能與科研深度結(jié)合仍然需要解決三個(gè)挑戰(zhàn),一是人機(jī)交互問(wèn)題,人工智能與科學(xué)家在科研流程上的協(xié)作機(jī)制與分工需要更加明確,形成緊密的互動(dòng)關(guān)系;二是人工智能的可解釋性,科學(xué)家需要明確的因果關(guān)系來(lái)形成科學(xué)理論,人工智能需要更容易被理解,以建立科學(xué)與人工智能之間的信任關(guān)系;三是交叉學(xué)科人才, 專(zhuān) 業(yè) 領(lǐng) 域科學(xué)家與人工智能專(zhuān)家的相互理解程度低,彼此互相促進(jìn)的障礙仍然較高。我們預(yù)測(cè)在未來(lái)的三年內(nèi),人工智能技術(shù)在應(yīng)用科學(xué)中將得到普遍應(yīng)用,在部分基礎(chǔ)科學(xué)中開(kāi)始成為研究工具。