來源:獵云精選;文/邵延港
當(dāng)大家還在討論“AI孫燕姿”時(shí),在云知聲闊別多年的發(fā)布會(huì)現(xiàn)場(chǎng),AI模仿網(wǎng)絡(luò)電臺(tái)主播程一的聲音讀了一段AI生成的文案,語氣深情浪漫,音色富有磁性,塑造了一個(gè)讓程一本人都驚訝的“AI程一”。毋庸置疑,這又是出自大模型的“作品”。
去年12月,入行十年的中國AI廠商云知聲創(chuàng)始人黃偉第一次見到ChatGPT時(shí),在震撼之余感受到的卻是沮喪,一瞬間覺得自己創(chuàng)業(yè)十年來,所積累的技能以及自己安身立命的東西,似乎變得毫無價(jià)值。
黃偉和程一的感受類似,都覺得職業(yè)生涯將遭受沖擊。黃偉在之后用了一周的時(shí)間去研究“ChatGPT到底是什么”,后來發(fā)現(xiàn)“好像也沒什么”,ChatGPT只是把模型做得更大而已,以云知聲團(tuán)隊(duì)的技術(shù)實(shí)力和工程化經(jīng)驗(yàn)也可以做出來。
于是,云知聲公司內(nèi)部在去年12月中下旬組建團(tuán)隊(duì),在今年2月底就拿出來屬于自己的第一版大模型,并將其取名“山?!薄v經(jīng)優(yōu)化和打磨后,5月24日,云知聲正式對(duì)外發(fā)布山海大模型,便出現(xiàn)了文章開頭那一幕。
云知聲創(chuàng)始人、CEO 黃偉
云知聲不是第一家發(fā)布大模型的人工智能廠商,當(dāng)然也不會(huì)是最后一個(gè)。ChatGPT帶來的大模型競(jìng)賽的背后,其實(shí)是人工智能產(chǎn)業(yè)多年來飽受爭(zhēng)議和不理解后的爆發(fā)。市場(chǎng)從未像今天一樣對(duì)人工智能如此充滿期待,大模型開辟了通往AGI(通用人工智能)時(shí)代的新范式,云知聲在十余年后站上了AI 2.0時(shí)代的新起點(diǎn)。
山海大模型——云知聲奔向AGI時(shí)代的“光”
對(duì)于時(shí)常因商業(yè)化不及預(yù)期而被詬病的AI產(chǎn)業(yè)來說,大模型的出現(xiàn)仿佛就是光。
所謂大模型,是新技術(shù)范式,而非新發(fā)明。深度學(xué)習(xí)算法經(jīng)過十多年的積累,在Open AI的整合下,調(diào)校出轟動(dòng)世界的ChatGPT。這種新的技術(shù)范式,讓人類看到AGI時(shí)代到來的愿景。山海大模型,正是云知聲基于已有算法和知識(shí)做的一次工程革命。
在曾經(jīng)“AI產(chǎn)品跟著客戶需求走”的時(shí)代里,云知聲等人工智能廠商提供專用系統(tǒng)+智能模塊的方式,為客戶提供鑒別式的人工智能,即運(yùn)用已有的數(shù)據(jù)訓(xùn)練模型,完成特定任務(wù),回答是或否來提高決策效率。大模型出現(xiàn)后,其深度理解能力能夠生成高質(zhì)量、創(chuàng)造性的結(jié)果,人機(jī)交互模式和質(zhì)量也產(chǎn)生了質(zhì)變。
云知聲在作出研發(fā)大模型的決定后,隨即組建了一支靈活的團(tuán)隊(duì),用時(shí)兩個(gè)半月后便拿出來第一版,并將其命名為“山海”。據(jù)介紹,“山”是高山仰止,是大智知止;“?!笔呛<{百川,有容乃大;“山海”還代表著云知聲的堅(jiān)持,所愛隔山海,山海皆可平,“山?!钡拿闳∽云渲?。
有GPT珠玉在前,云知聲為山海大模型賦予的使命是以通用人工智能,創(chuàng)造一個(gè)互聯(lián)、直觀的世界。有了山海大模型,云知聲將不再是5個(gè)月前的云知聲。
在發(fā)布會(huì)現(xiàn)場(chǎng),云知聲現(xiàn)場(chǎng)展示了山海大模型的十項(xiàng)核心能力,其中包括語言生成、語言理解、知識(shí)問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項(xiàng)通用能力及插件擴(kuò)展、領(lǐng)域增強(qiáng)、企業(yè)定制三項(xiàng)行業(yè)落地能力,云知聲通過語音輸入、實(shí)時(shí)互動(dòng)的方式進(jìn)行講解演示,在展示過程中也看到山海大模型在某些行業(yè)的表現(xiàn)要明顯優(yōu)于GPT4。
山海大模型語言理解能力現(xiàn)場(chǎng)演示
作為云知聲5個(gè)多月的作品,山海大模型并非只有這十項(xiàng)技能,云知聲也不會(huì)滿足只有十項(xiàng)能力。云知聲需要山海大模型具備更多能力來適應(yīng)客戶需求,以打造奔向AGI時(shí)代路上的基礎(chǔ)實(shí)力。
五個(gè)月就發(fā)布的大模型,云知聲籌備了十年
盡管有人認(rèn)為大模型是巨頭的專利,但云知聲沒有放棄。從2012年入局深度學(xué)習(xí),到后來搭建AI全棧能力,再到大模型角力,過去十年里,云知聲經(jīng)歷了一輪輪市場(chǎng)洗禮與自我變革。云知聲能夠成為第一批發(fā)布大模型的人工智能公司之一,離不開其在十余年中的每一個(gè)堅(jiān)定步伐。
在過去十年里,云知聲有過三次技術(shù)躍遷,被稱作云知聲的AI三級(jí)跳:
第一次是云知聲創(chuàng)立時(shí),深度學(xué)習(xí)之父辛頓帶領(lǐng)團(tuán)隊(duì)拿下2012年的ImageNet視覺識(shí)別挑戰(zhàn)賽冠軍,云知聲緊跟深度學(xué)習(xí)興起的浪潮;
第二次是在2016年,谷歌阿爾法狗擊敗人類圍棋冠軍李世石,云知聲開始重視算力;
第三次即眼下大模型的爆發(fā),云知聲迅速跟進(jìn),拿到一張通往AGI時(shí)代的船票。
縱觀云知聲的發(fā)展歷程:2012年,云知聲成立時(shí)以深度學(xué)習(xí)切入,構(gòu)建了深度學(xué)習(xí)、大數(shù)據(jù)、超算為核心的AI三駕馬車的發(fā)展戰(zhàn)略;2016年布局了Atlas超算平臺(tái)及全棧AI技術(shù),發(fā)布語用計(jì)算平臺(tái),2017 年布局行業(yè)知識(shí)圖譜,構(gòu)建認(rèn)知技術(shù)體系,2018年提出U+X 戰(zhàn)略,即以 U(AI 架構(gòu)及全棧技術(shù)),深度結(jié)合 X(行業(yè)應(yīng)用場(chǎng)景),解決行業(yè)深層問題,向規(guī)模化AI進(jìn)發(fā)。
大模型是從小模型、中模型基于算力、算法和數(shù)據(jù)開始鍛造出來。云知聲通過可彈性擴(kuò)容的算力工程Atlas、自研大模型訓(xùn)練和推理一體化框架的算法工程Uniscale、以及歷經(jīng)十年積累到600T行業(yè)數(shù)據(jù)的數(shù)據(jù)工程UniDataOps,三者結(jié)合大力出奇跡,打造了山海之功。
在云知聲一直深耕的醫(yī)療領(lǐng)域,山海大模型已經(jīng)調(diào)校出極高的行業(yè)水準(zhǔn)。據(jù)云知聲介紹,在MedQA測(cè)評(píng)中,山海大模型、GPT4、Med-PalM、GPT3.5的水平分別達(dá)到81.56%、71.07%、67.6%、40.31%;在臨床執(zhí)業(yè)醫(yī)師資格考試中,山海大模型、SOTA分別達(dá)到511分、456分,遠(yuǎn)超365分的平均分和360分的及格線。在醫(yī)療領(lǐng)域,山海大模型的表現(xiàn)甚至優(yōu)于GPT-4中文水平。
在過去的十年里,云知聲從數(shù)據(jù)算法算力的建設(shè)、工程化落地能力以及商業(yè)化場(chǎng)景能力均有規(guī)劃,這才有了云知聲發(fā)布山海大模型的“底蘊(yùn)”,以及黃偉發(fā)出對(duì)“云知聲過去的十年仿佛都是為山海而生”的感慨。
商業(yè)化思路更明晰,云知聲U+X戰(zhàn)略提速
當(dāng)被問及:是不是有了大模型,人工智能廠商的場(chǎng)景落地和商業(yè)化就會(huì)變得容易了?黃偉稱,這個(gè)問題到今天應(yīng)該有個(gè)明確的答案了。有了大模型,AI廠商具備了更強(qiáng)大的能力,能夠更好得滿足客戶需求,也能更容易地去商業(yè)化落地。
在AI 1.0時(shí)代,雖然基于深度學(xué)習(xí),每家都有強(qiáng)大的技術(shù),但整體上并沒有本質(zhì)改變AI用于分類的任務(wù),分類種類的增加仍然處在量變階段,限制了AI創(chuàng)造價(jià)值的上限。到了AI 2.0時(shí)代,大模型為人工智能帶來了更多的能力,可以打造更多新的產(chǎn)品,滿足客戶更多的需求。
山海大模型能做什么?黃偉表示,云知聲將以山海大模型為基礎(chǔ),打造MaaS 模式的AI 2.0解決方案,在通用能力基礎(chǔ)上,增強(qiáng)物聯(lián)、醫(yī)療等行業(yè)能力,為客戶提供更智能、更靈活的解決方案,打開更大的AI技術(shù)產(chǎn)業(yè)化商業(yè)空間。
AI只有落地應(yīng)用才能實(shí)現(xiàn)價(jià)值,這句話至今依然適用。云知聲將大模型視為人工智能2.0時(shí)代的發(fā)電廠,可以更充分地利用數(shù)據(jù)的價(jià)值。黃偉認(rèn)為,誰掌握了大模型,也就會(huì)具備更大的商業(yè)價(jià)值。
在發(fā)布會(huì)現(xiàn)場(chǎng),云知聲圍繞著十大核心能力,與具體場(chǎng)景做融合。作為云知聲的核心業(yè)務(wù)場(chǎng)景,山海大模型在MedQA和臨床執(zhí)業(yè)醫(yī)師資格考試中強(qiáng)于GRT4的結(jié)果,振奮了山海大模型的研發(fā)團(tuán)隊(duì)。在智慧醫(yī)療領(lǐng)域,有了山海大模型加持,原產(chǎn)品最新融入了手術(shù)病歷撰寫助手、門診病歷生成系統(tǒng)、商保智能理賠系統(tǒng)三大醫(yī)療產(chǎn)品應(yīng)用。
如手術(shù)病歷撰寫助手,在外科醫(yī)生手術(shù)過程的語音已經(jīng)錄入的情況下,山海大模型通過理解和分析能力,過濾掉無關(guān)內(nèi)容,將醫(yī)生在整個(gè)手術(shù)過程中零散的口頭化的語音信息進(jìn)行理解標(biāo)化成信息摘要,形成手術(shù)記錄所需要的關(guān)鍵信息。人工審核完成后,最終幫助醫(yī)生撰寫一篇五百到一千字的手術(shù)記錄,解決醫(yī)生費(fèi)時(shí)費(fèi)心撰寫手術(shù)記錄的痛點(diǎn)。
山海大模型 門診病歷撰寫助手應(yīng)用
在云知聲重點(diǎn)布局的智慧物聯(lián)場(chǎng)景中,山海大模型也將會(huì)進(jìn)行場(chǎng)景融合,塑造出一個(gè)真正的隨身管家,使其在方方面面從只能進(jìn)行指令交互升級(jí)為類人對(duì)話,真正聯(lián)動(dòng)IoT生態(tài)和服務(wù)。
此外,在銷售、知識(shí)管理和教育場(chǎng)景中,云知聲也會(huì)基于山海大模型,對(duì)產(chǎn)品進(jìn)行升級(jí),讓信息反饋更精準(zhǔn),以滿足用戶更深層次的需求。
但山海大模型的意義不只是未來升級(jí)現(xiàn)有的場(chǎng)景應(yīng)用能力,不斷拓展其作為AGI的邊界才是真正使命。
山海大模型目前仍在升級(jí)中,5月24日發(fā)布的版本已經(jīng)在模型參數(shù)和量化方面,進(jìn)行了很多工程優(yōu)化,相比二月底的版本,在推理速度方面提升了五倍。云知聲的目標(biāo)是在2023年內(nèi)將山海大模型的通用能力比肩ChatGPT,并在醫(yī)療、物聯(lián)、教育等多個(gè)垂直領(lǐng)域能力超越GPT4。
在商業(yè)化拓展的規(guī)劃上,云知聲稱會(huì)繼續(xù)施行U+X戰(zhàn)略,構(gòu)建AGI+Industry生態(tài),繼續(xù)賦能百業(yè)。在發(fā)布會(huì)上,云知聲與中建電子、京東科技、360簽署戰(zhàn)略合作協(xié)議,深度合作形成生態(tài),推動(dòng)山海大模型在各領(lǐng)域的落地應(yīng)用。
黃偉說:“我相信,山海將成為連接世界、拓寬人類認(rèn)知邊界的橋梁。在未來的探索與發(fā)展中,云知聲將一如既往地秉持創(chuàng)新、開放、合作的精神,與合作伙伴共同努力,推動(dòng)人工智能技術(shù)的發(fā)展,為人類的未來注入無限活力?!?/p>
在AGI時(shí)代里,暫時(shí)無法去定義大模型的邊界在哪里,對(duì)于AI從業(yè)者來說,當(dāng)前的確是到了AI落地應(yīng)用得更好的時(shí)代。山海大模型的能力在增強(qiáng),未來也將在一次次的未知中探索更精妙的答案。