在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<strike id="bdbsc"><th id="bdbsc"></th></strike>

<div id="bdbsc"><small id="bdbsc"></small></div>

幻覺(jué)處理國(guó)內(nèi)最優(yōu)！530億參數(shù)Baichuan2推理能力飆升100%，首次開(kāi)放API商用

用戶投稿 ? 2023年9月26日 15:11 ? 熱點(diǎn)

【新智元導(dǎo)讀】昨天，Baichuan2-53B正式發(fā)布!首次開(kāi)放API，意味著百川大模型開(kāi)始正式進(jìn)軍商用了。另外，模型的數(shù)學(xué)和邏輯推理能力都大幅飆升，對(duì)于幻覺(jué)的處理，已經(jīng)在國(guó)內(nèi)遙遙領(lǐng)先。

百川大模型，昨日全面升級(jí)!

就在9月25日，百川智能正式發(fā)布了全新升級(jí)的530億參數(shù)大模型——Baichuan2-53B。

體驗(yàn)地址:https://www.baichuan-ai.com/home

這一次，它的數(shù)學(xué)和邏輯推理能力顯著提升。

更重要的是，通過(guò)高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)，Baichuan2-53B的幻覺(jué)大大降低，是目前國(guó)內(nèi)幻覺(jué)問(wèn)題最低的大模型。

不僅如此，作為首批通過(guò)備案的大模型企業(yè)，百川智能還開(kāi)放了Baichuan2-53B API接口。

這意味著，百川智能正式進(jìn)軍To B領(lǐng)域，從此將開(kāi)啟商業(yè)化進(jìn)程。

幻覺(jué)處理，國(guó)內(nèi)遙遙領(lǐng)先

最值得一提的是，新升級(jí)的Baichuan2-53B，在「幻覺(jué)」處理上已經(jīng)在國(guó)內(nèi)行業(yè)遙遙領(lǐng)先了。

簡(jiǎn)單講，「幻覺(jué)」就是LLM在沒(méi)有任何已知事實(shí)支撐下，常常會(huì)一本正經(jīng)地胡說(shuō)八道。

別看GPT-4在多種任務(wù)上表現(xiàn)突出，但也無(wú)法逃過(guò)這一詛咒。

那么，為什么大模型會(huì)出現(xiàn)「幻覺(jué)」?

4月，OpenAI聯(lián)合創(chuàng)始人兼研究科學(xué)家John Schulman在UC伯克利的演講中，詳細(xì)闡述了大模型難以攻克的難題。

在Schulman看來(lái)，LLM黑盒內(nèi)部隱藏著一個(gè)「知識(shí)圖譜」。如果這個(gè)架構(gòu)中沒(méi)有的知識(shí)，僅通過(guò)SFT教大模型（即行為克?。┲R(shí)，實(shí)則在教它輸出幻覺(jué)。

針對(duì)這一難題，百川智能又是如何在大模型的「幻覺(jué)處理」上，做到業(yè)內(nèi)領(lǐng)先的呢?

在高質(zhì)量數(shù)據(jù)構(gòu)建上，Baichuan2-53B獨(dú)創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。

以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類，確保Baichuan2-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。

另外，在信息獲取方面，Baichuan2-53B對(duì)多個(gè)模塊進(jìn)行了升級(jí)，包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。

這一綜合體系通過(guò)深入理解用戶指令，精確驅(qū)動(dòng)查詢?cè)~的搜索，最終結(jié)合大語(yǔ)言模型技術(shù)，優(yōu)化模型結(jié)果生成的可靠性，實(shí)現(xiàn)更精確、更智能的模型回答結(jié)果，減少模型幻覺(jué)。

比如，在解釋「勾三股四弦五」這個(gè)問(wèn)題上，GPT-4顯然是在胡說(shuō)八道。

相比之下，Baichuan2-53B一次就給出了正確的回答。

再比如，「周樹(shù)人和魯迅是不是同一個(gè)人」這道經(jīng)典問(wèn)題，Baichuan2-53B的回答既全面又準(zhǔn)確。

可以看到，通過(guò)構(gòu)建高質(zhì)量數(shù)據(jù)體系，以及搜索增強(qiáng)技術(shù)兩個(gè)方面的優(yōu)化，Baichuan2-53B有效降低了模型幻覺(jué)。

經(jīng)過(guò)FacTool評(píng)測(cè)后的結(jié)果顯示，Baichuan2-53B的綜合得分為140.5，在主流基礎(chǔ)大模型中僅排在GPT-4之后，處于國(guó)內(nèi)領(lǐng)先水平。

FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架，能夠查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性（也能查核一般性內(nèi)容的事實(shí)準(zhǔn)確性）。

項(xiàng)目地址:https://github.com/GAIR-NLP/factool

能力升級(jí)，推理100% up

其實(shí)，Baichuan2-53B已經(jīng)是百川智能發(fā)布的第6款大模型了。

4月10日百川智能成立后，就一直在以驚人的速度創(chuàng)新，迭代的速度竟然達(dá)到了平均每28天就推出一款大模型!

早在8月8日Baichuan2-53B剛發(fā)布時(shí)，它就表現(xiàn)出了優(yōu)異的知識(shí)問(wèn)答、文學(xué)創(chuàng)作才能。

如果要問(wèn)，評(píng)價(jià)一款大模型是否領(lǐng)先的重要指標(biāo)是什么，相信「數(shù)學(xué)和邏輯推理能力」，會(huì)是諸多業(yè)內(nèi)人士給出的答案。

這次，在Baichuan-53B的基礎(chǔ)上，Baichuan2-53B就重點(diǎn)強(qiáng)化了數(shù)學(xué)和邏輯推理的能力，并且，還對(duì)整體能力進(jìn)行了全面升級(jí)。

具體來(lái)說(shuō)，它的邏輯推理能力提升100%，數(shù)學(xué)能力提升31%，語(yǔ)言理解能力提升29%，文本創(chuàng)作提升18%，知識(shí)問(wèn)答提升9%。

數(shù)學(xué)推理

數(shù)學(xué)能力大升級(jí)的Baichuan2-53B，做起數(shù)學(xué)應(yīng)用題來(lái)當(dāng)然是不在話下。

比如，兩個(gè)數(shù)的和是572，其中一個(gè)加數(shù)個(gè)位上是0，去掉0后，就與第二個(gè)加數(shù)相同。那么，這兩個(gè)數(shù)分別是?

Baichuan2-53B列出了方程式，假設(shè)一個(gè)加數(shù)是10A，另一個(gè)為B，然后根據(jù)已知條件，得出正解。

再比如下題中，Baichuan2-53B先計(jì)算出來(lái)了總運(yùn)輸收入，然后除以每箱玻璃虧損的錢(qián)，就得到了損壞的玻璃箱數(shù)。

再來(lái)個(gè)經(jīng)典的「兩地相距多少千米」的問(wèn)題，Baichuan2-53B通過(guò)分步計(jì)算，得出了正確答案。

推理方面，先來(lái)個(gè)簡(jiǎn)單的問(wèn)題:天氣預(yù)報(bào)本周三會(huì)下雨，昨天果然下雨了，今天是星期幾?

Baichuan2-53B毫不費(fèi)力，直接得出「星期四」!

接下來(lái)，推理難度稍微升級(jí)一下:假設(shè)有一個(gè)池塘，里面有無(wú)窮多的水。

現(xiàn)有兩個(gè)空水壺，容積分別為5升和6升。問(wèn)如何只有這2個(gè)水壺，從池塘里取得3升的水?

Baichuan2-53B行云流水地開(kāi)始作答，6步內(nèi)給出了正確答案。

經(jīng)過(guò)多輪的測(cè)試可以發(fā)現(xiàn)，升級(jí)后的Baichuan2-53B的數(shù)學(xué)和邏輯推理能力，果然不可同日而語(yǔ)。在曾經(jīng)不太擅長(zhǎng)的題目上，它都有了大幅提升。

時(shí)效問(wèn)題

而在時(shí)效性這方面，Baichuan2-53B的表現(xiàn)可謂十分優(yōu)異。

杭州亞運(yùn)會(huì)剛剛開(kāi)幕，年齡最小的選手竟然僅有9歲。Baichuan2-53B在最新的問(wèn)題上，也答對(duì)了。

甚至，Baichuan2-53B準(zhǔn)確地解釋了，特斯拉剛剛公布的人形機(jī)器人Optimus背后神經(jīng)網(wǎng)絡(luò)原理。

再比如，今年9月上旬，第80屆威尼斯電影節(jié)在意大利落幕。

此次電影節(jié)，是否有中國(guó)電影和演員獲獎(jiǎng)?

Baichuan2-53B立刻回答出，李鴻其的《愛(ài)是一把槍》獲得了最佳長(zhǎng)片首作，梁朝偉獲得了終身成就金獅獎(jiǎng)。

梅老板與大巴黎的合約今年6月底到期，在7月正式加盟邁阿密國(guó)際。

對(duì)此，Baichuan2-53B也是了如指掌。

同樣，它還可以準(zhǔn)確地告訴你小德一共拿了24次大滿貫，包括2023年的這一次。

開(kāi)放API，正式進(jìn)軍商用

不僅如此，這次Baichuan2-53B還正式開(kāi)放了API接口，可以讓企業(yè)和開(kāi)發(fā)者將模型集成到自己的應(yīng)用和服務(wù)中。

API地址:https://platform.baichuan-ai.com

這項(xiàng)服務(wù)是否有門(mén)檻呢?

可以說(shuō)，幾乎沒(méi)有。Baichuan2-53B的API接口相當(dāng)便捷易用，只需要簡(jiǎn)單的配置和集成，就可以接入了。

而且，它對(duì)OpenAI的接口高度兼容，這樣就可以讓客戶快速遷移，無(wú)論是模型的部署成本還是轉(zhuǎn)換成本，都大大降低。

總之，現(xiàn)在無(wú)論是智能客服、智能寫(xiě)作還是智能推薦，都能得到大模型的能力加持。

要說(shuō)企業(yè)用戶最關(guān)注的，莫過(guò)于安全合規(guī)問(wèn)題了。

對(duì)此也無(wú)需擔(dān)心。

作為首批通過(guò)《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè)，百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng)，可以說(shuō)，全流程都在安全保障之下。

而借助著B(niǎo)aichuan2-53B豐富強(qiáng)大的模型能力，企業(yè)用戶不僅可以讓已有業(yè)務(wù)升級(jí)、減低成本，還能探索更多的應(yīng)用場(chǎng)景。

可以相信，就在此刻，已經(jīng)有一大波令人印象深刻的創(chuàng)新，正在土壤中被醞釀了。

參考資料:

https://www.baichuan-ai.com/home

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場(chǎng)，版權(quán)歸原作者所有，如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。

贊 (0)

合肥教育網(wǎng)官網(wǎng)教師資格證(合肥教育網(wǎng)官網(wǎng))

上一篇 2023年9月26日 14:00

中國(guó)空調(diào)銷量排名前十(中國(guó)空調(diào)銷量排名)

下一篇 2023年9月26日 18:06

父親早逝，母親失明，侄兒失怙，旅伴病逝，看武威舉人王曰慎咋辦
父親早逝，母親失明，侄兒失怙，旅伴病逝，看清代武威縣舉人王曰慎怎么辦涼州賢孝博覽館趙大泰人生之事，不如意者十之八九，然而父親早逝，母親失明，侄兒失怙，旅伴病逝，災(zāi)難接踵而來(lái)卻…
2023年2月24日
0
孩子嚴(yán)重燙傷9天才送醫(yī)：家長(zhǎng)用偏方自行治療驚呆醫(yī)生
孩子嚴(yán)重燙傷9天才送醫(yī)：家長(zhǎng)用偏方自行治療驚呆醫(yī)生如果孩子被燙傷，作為家長(zhǎng)你會(huì)怎么治療？想必大多數(shù)人第一反應(yīng)都是去醫(yī)院，找醫(yī)生。但總有一些家長(zhǎng)因?yàn)槊孕牌剑x擇涂牙膏、抹香油等奇…
2023年6月5日
0
#高考后才發(fā)現(xiàn)被媽媽騙了#，這事當(dāng)媽前打死不干，當(dāng)媽后啪啪打臉
上禮拜看到一個(gè)新聞 #高考結(jié)束發(fā)現(xiàn)被媽媽騙了#，我心想發(fā)生啥事了。于是懷著一顆能不能挖掘點(diǎn)素材的心點(diǎn)進(jìn)去看了。是這么個(gè)事，高考前媽媽答應(yīng)了某些要求，考完就變卦了。沒(méi)點(diǎn)開(kāi)小圖前…
2023年6月26日
0
曝英偉達(dá)停產(chǎn)兩款RTX 40系GPU 被RTX 40 Super系列取代
此前的消息表明，英偉達(dá)即將在明年初的CES 2024上發(fā)布全新的RTX 40 Super系列顯卡，并將會(huì)取代現(xiàn)有的部分RTX 40系列產(chǎn)品。而根據(jù)博板堂的最新消息表明，英偉達(dá)目前已…
2023年12月23日
0
共享充電寶電用完只充了30% 價(jià)格高也被吐槽
杭州市消保委一項(xiàng)調(diào)查顯示，84.7%受訪者感覺(jué)近幾年充電寶的計(jì)費(fèi)價(jià)格漲幅很大，56.0%受訪者表示遇到過(guò)在不同場(chǎng)景收費(fèi)標(biāo)準(zhǔn)不同的問(wèn)題。 26.7%的受訪者表示共享充電寶存在未告知或…
2023年7月10日
0
“連花清瘟”藥方能自己配？以嶺藥業(yè)緊急澄清！成都官宣：提前放假！張文宏發(fā)聲：這件事能“救命”！
12月21日晚間，復(fù)旦大學(xué)附屬華山醫(yī)院感染科主任張文宏在《呼吸界》的“解密不一樣的流感”系列講座中談到新冠重癥救治時(shí)候表示，重癥救治的時(shí)間前移在大流行期間是非?！熬让钡?。基層醫(yī)院…
2023年1月31日
0
義烏拿貨擺地?cái)傔M(jìn)什么好賣(擺地?cái)偭x烏購(gòu)拿貨)
現(xiàn)在擺地?cái)偟娜撕芏?，許多都是選擇賣一些小商品，而義烏的小商品貨源就價(jià)格方面是非常適合地?cái)偵碳仪皝?lái)拿貨的，不少地?cái)偵碳叶紩?huì)選擇去義烏批發(fā)進(jìn)貨。義烏小商品貨源種類非常多，那么，義烏拿貨…
2023年6月13日
0
太陽(yáng)熄滅后人類多久能察覺(jué)到如果太陽(yáng)熄滅，人類多久才能感知到？8分鐘后？準(zhǔn)確來(lái)說(shuō)是10000年
根據(jù)科學(xué)家對(duì)太陽(yáng)的觀察推測(cè)，現(xiàn)在我們已經(jīng)知道太陽(yáng)在未來(lái)至少還有50億年的時(shí)間。太陽(yáng)與星球當(dāng)它成為紅巨星時(shí)，一切都會(huì)被摧毀，并且吞噬掉臨近的所有行星，就連木星也不能避免被太陽(yáng)“燒…
2022年6月28日
0
人販子一審被判5年，孫海洋：正式申請(qǐng)抗訴！
孫卓被拐案一審宣判，人販子吳飛龍因拐騙罪被判刑5年，孫卓父親孫海洋對(duì)此表示失望。10月18日，孫海洋告訴記者，他和律師數(shù)日來(lái)整理了大量抗訴申請(qǐng)資料，已當(dāng)面遞交檢察院，他主張拐騙拐賣…
2023年10月19日
0
滄州多地目擊到不明飛行物！到底是啥？/注意！請(qǐng)遠(yuǎn)離這些地方！/滄州一私家車失蹤數(shù)月被發(fā)現(xiàn)沉塘！司機(jī)已身亡！
今天是2022/12/21，星期三。1879年12月21日斯大林出生。 1997年12月21日我國(guó)建成亞洲最大跨聲速風(fēng)洞。接下來(lái)讓我們來(lái)看看最近滄州都發(fā)生了什么事情吧！滄州…
2023年1月13日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時(shí)間：周一至周五，10:30-18:30，節(jié)假日休息

<b id="ddzek"></b>