本報記者 李玉洋 李正豪 上海報道
金秋九月,推遲兩月的2022世界人工智能大會(WAIC)在上海舉行。在美國剛剛對華限售英偉達和AMD高端GPU(圖形處理器)的背景下,AI/GPU成為本屆大會除元宇宙之外的另一大“流量密碼”。
芯片是AI的基石。在“WAIC 2022”評選出來的八大“鎮(zhèn)館之寶”中,上海天數(shù)智芯的“智鎧100”和壁仞科技的通用GPU芯片BR100系列入選其中,成為業(yè)界關(guān)注的焦點。
《中國經(jīng)營報》記者注意到,不只寒武紀(jì)、壁仞科技、燧原科技、瀚博半導(dǎo)體等這些AI芯片公司展示了最新的芯片產(chǎn)品,百度、華為等科技大佬也展示出了AI相關(guān)的硬件。
另外,在全民關(guān)“芯”的背景下,記者在一些AI芯片論壇上注意到,國內(nèi)AI芯片公司已不止于對外宣揚算力理論峰值和未來愿景了,而把重點更多地放在了算力密度、能源效率、生態(tài)合作等話題上。
資深產(chǎn)業(yè)分析師黃燁鋒表示:“從今年的新品和生態(tài)更新中,能看到國產(chǎn)GPU/AI芯片企業(yè)在走向成熟。發(fā)布POD(智算機)、集群,強調(diào)系統(tǒng)和軟件生態(tài)的重要性,并將其落地轉(zhuǎn)化為生產(chǎn)力,無一不體現(xiàn)著現(xiàn)在的國產(chǎn)AI芯片企業(yè)已經(jīng)脫離了過去講故事、賣情懷、談愿景的初期階段,朝著更具切實意義的方向邁進?!?/p>
算力不是看理論峰值
據(jù)了解,壁仞科技通用GPU芯片BR100采用了臺積電7nm制程,單芯片峰值算力可達每秒千萬億次浮點運算,打破了全球通用GPU算力紀(jì)錄;同樣采用7nm工藝的天數(shù)智芯首款云端推理通用GPU產(chǎn)品——“智鎧100”,于今年5月成功點亮,經(jīng)后續(xù)測試修正后即可量產(chǎn);成立于2018年的瀚博半導(dǎo)體則展示了國產(chǎn)云端7nm GPU芯片SG100,據(jù)悉該芯片是集渲染、AI于一體的全功能GPU,而云游戲、云手機、云桌面、云計算等元宇宙關(guān)鍵性應(yīng)用場景正是其所要發(fā)力的重點領(lǐng)域。
值得一提的是,專注云端算力的人工智能公司燧原科技發(fā)布了高性能AI加速集群服務(wù)器產(chǎn)品云燧智算機(CloudBlazer POD),里面內(nèi)置了云端AI訓(xùn)練芯片“邃思1.0”和“邃思2.0”,云燧智算機及集群方案的誕生,也讓燧原完成了芯片、板卡、服務(wù)器、集群算力中心解決方案的覆蓋。
燧原科技創(chuàng)始人兼COO張亞林對記者表示,從前些年開始,AI模型參數(shù)規(guī)模就以每3個月提高一倍的速度在發(fā)展,如今模型參數(shù)已經(jīng)發(fā)展到了千億,甚至萬億級規(guī)模了?!按笠?guī)模集群是AI計算的必需品。”他指出,“算力底座不僅是芯片,還有板卡、軟件,更重要的是系統(tǒng)一體化。而這塊除了美國友商之外,中國國內(nèi)能實現(xiàn)的還非常罕見?!?/p>
張亞林還指出,如何通過集群和系統(tǒng)的方式使AI大模型達成更高的生產(chǎn)力,已經(jīng)成為一個關(guān)鍵問題。“我國東數(shù)西算工程的落地,不僅對能效、算力密度有要求,還在部署、運維、集成等方面提出了非常高的交鑰匙一體化需求?!彼f,這是云燧智算機和集群誕生的背景。
“在AI技術(shù)、AI芯片發(fā)展到一定階段后,有越來越多的芯片企業(yè)開始強調(diào)有效算力、算力效率、算力密度之類的概念,且從端到云的不同企業(yè)都在談這些事?!秉S燁鋒注意到,今年WAIC不止一家企業(yè)用PUE(Power Usage Effectiveness,數(shù)據(jù)中心總能耗/IT設(shè)備能耗)來衡量能源效率,這是一個更偏系統(tǒng)層面的指標(biāo)。
而在單個AI芯片層面,瀚博半導(dǎo)體創(chuàng)始人兼CEO錢軍則在人工智能大芯片產(chǎn)業(yè)落地論壇上指出“評價算力,不能只看它的絕對值”,并提出了“算力密度”的概念,該概念可用來衡量一家芯片企業(yè)的實力。
如何理解算力密度?錢軍將其分為兩個部分:一是芯片單位面積內(nèi)可達成的算力,比如一平方毫米芯片的算力如何;二是每瓦性能(Perf/W),即每瓦功耗能夠提供多大的算力。而算力密度在具體業(yè)務(wù)中的性能表現(xiàn)可從最大吞吐率、最大吞吐率下的時延和超低時延下的吞吐率這三個指標(biāo)的對比中得出。
與算力密度相關(guān)的還有“算力網(wǎng)絡(luò)”?!艾F(xiàn)在,我國數(shù)據(jù)中心能耗每年都有10%以上的增長,每年的電費有近3%是服務(wù)于數(shù)據(jù)中心的?!敝袊苿樱ㄉ虾#┊a(chǎn)業(yè)研究院技術(shù)部總經(jīng)理陰啟明指出,“算力網(wǎng)絡(luò)是將不同的算力孤島做連接,降低算力成本、提高算力可用性,如將東數(shù)西算工程與‘雙碳’目標(biāo)匹配?!?/p>
“從企業(yè)的角度來看,更低的TCO(總擁有成本)才是追求算力密度的實際目的:以更低的成本獲得相同的有效算力,并且散熱、電費、運維之類的成本也需要足夠低。國家與企業(yè)兩者有著異曲同工的目標(biāo),都要求芯片能達成更高的算力效率和算力密度,這應(yīng)當(dāng)是這兩年的共識了?!秉S燁鋒說。
國產(chǎn)AI芯片企業(yè)走向成熟
在錢軍看來,芯片及其衍生的產(chǎn)品從來不是“單打獨斗”的存在。對此,黃燁鋒持有類似觀點。“當(dāng)我們到具體業(yè)務(wù)中去看算力和效率的時候,就不是拼芯片堆料的事情了,還涉及到系統(tǒng)級硬件、軟件框架、庫、工具鏈、生態(tài)這種難度顯著增大的組成部分?!彼f。
在這些方面的建設(shè)上,英偉達是座高山,其余AI芯片公司目前只能望其項背,國內(nèi)同行都對英偉達的生態(tài)建設(shè)水平感到有些無奈。英偉達CEO黃仁勛曾表示,開發(fā)者是英偉達的重要財富,目前英偉達全球開發(fā)者近300萬,在其CUDA(英偉達推出的通用并行計算架構(gòu),該架構(gòu)使GPU能夠解決復(fù)雜的計算問題)計算架構(gòu)平臺上有超過50萬個開發(fā)者,其中包含了百度、騰訊、阿里巴巴等大型跨國企業(yè)。
復(fù)旦大學(xué)芯片與系統(tǒng)前沿技術(shù)研究院副研究員陳遲曉則用了通俗易懂的話語闡述了生態(tài)對開發(fā)者的重要性和凝聚作用,他說學(xué)生在使用CUDA時碰到bug,網(wǎng)上一搜就能找到不少人也遇到了相同問題和解決方法,慶幸的是國內(nèi)AI企業(yè)也在重視生態(tài)方面的建設(shè)了。
為破解硬件性能上的“單打獨斗”并不能將芯片功力全部發(fā)揮出來的問題,瀚博半導(dǎo)體更新和完善了軟件平臺VastStream,其不僅能加速各類AI應(yīng)用的部署,例如計算機視覺、視頻處理、自然語言處理、搜索與推薦、算子自定義擴展等,還提供了系統(tǒng)管理等三大管理工具,方便客戶部署。同時,VastStream的基礎(chǔ)軟件棧功能也變得更加豐富。
壁仞科技也發(fā)布了類似的BIRENSUPA軟件全棧,從驅(qū)動、硬件抽象層、編程平臺、框架,到具體的解決方案和應(yīng)用。除了壁仞GPU自身架構(gòu)特性相關(guān)的接口外,BIRENSUPA框架層支持PyTorch、TensorFlow和百度飛槳PaddlePaddle,證明了產(chǎn)品兼容性。
要真正釋放集群作為生產(chǎn)力工具的價值,燧原科技認為軟件是關(guān)鍵要素。燧池智算平臺是燧原科技的軟件和生態(tài)平臺,其結(jié)合強大的云燧AI算力集群和先進的大規(guī)模算力資源調(diào)度,能為用戶提供人工智能模型生產(chǎn)及應(yīng)用發(fā)布的全流程服務(wù),能夠一站式滿足復(fù)雜的人工智能業(yè)務(wù)場景對人工智能服務(wù)的需求。
“從底層硬件(芯片到板卡,再到服務(wù)器與集群),到中間層的燧池軟件平臺,以及上層的應(yīng)用,包括各種網(wǎng)絡(luò)模型,如視覺模型、語音模型、推薦模型、多模態(tài)大模型等。今年不少國產(chǎn)AI芯片企業(yè)都開始強調(diào)自家的‘一體化方案’,而著墨于系統(tǒng)和軟件平臺,體現(xiàn)的也是芯片的真正落地?!秉S燁鋒說。
國內(nèi)這些AI芯片企業(yè)雖然一直都在做軟件,但在今年更加注重落地的WAIC上,軟件、生態(tài)等的重要性更加凸顯了出來。黃燁鋒認為,軟件及各種框架、庫、中間件的完善程度才是一家AI芯片/GPU企業(yè)是否走向成熟的最直觀表現(xiàn)。
芯謀咨詢研究總監(jiān)王笑龍也認為,“(AI芯片)設(shè)計得再好再花樣多,大家都不用,這搞出來有啥意義?所以關(guān)鍵還是要有合適的應(yīng)用場景,讓大家都用起來?!?/p>
“發(fā)布POD、集群,強調(diào)系統(tǒng)和軟件生態(tài)的重要性,并將其落地轉(zhuǎn)化為生產(chǎn)力,無一不體現(xiàn)著現(xiàn)在的國產(chǎn)AI芯片企業(yè)已經(jīng)脫離了過去講故事、賣情懷、談愿景的初期階段,朝著更具切實意義的方向邁進。或許對于整個行業(yè)而言,這些都是AI芯片從初期步入成熟期的開端?!秉S燁鋒說。