將總部位于舊金山的初創(chuàng)公司OpenAI開發(fā)的免費文本生成AI稱為ChatGPT,成功是一個巨大的輕描淡寫。
截至 12 月,ChatGPT 的月活躍用戶估計超過 1 億。它吸引了各大媒體的關注,并在社交媒體上計劃了無數(shù)的模因。它已被用于在亞馬遜的Kindle商店中編寫數(shù)百本電子書。它被認為與人合著了至少一篇科學論文。
但OpenAI作為一家企業(yè)——盡管利潤有限——必須以某種方式將ChatGPT貨幣化,以免投資者感到煩躁。隨著二月份推出高級服務ChatGPT Plus,它朝著這一方向邁出了一步。它今天邁出了更大的一步,引入了一個API,允許任何企業(yè)將ChatGPT技術構建到他們的應用程序,網站,產品和服務中。
API 始終是計劃。這是OpenAI總裁兼董事長Greg Brockman(也是聯(lián)合創(chuàng)始人之一)的說法。昨天下午,在 ChatGPT API 發(fā)布之前,他通過視頻通話與我進行了交談。
“我們需要一段時間才能使這些API達到一定的質量水平,”Brockman說?!拔艺J為這有點像,只是能夠滿足需求和規(guī)模。
Brockman表示,ChatGPT API由OpenAI廣受歡迎的ChatGPT背后的AI模型提供支持,該模型被稱為“gpt-3.5-turbo”。GPT-3.5 是 OpenAI 目前通過其 API 套件提供的最強大的文本生成模型;“turbo”綽號指的是 GPT-3.5 的優(yōu)化、響應速度更快的版本,OpenAI 一直在悄悄地為 ChatGPT 進行測試。
Brockman的價格為每1000個代幣0.002美元,或約750個單詞,聲稱API可以驅動一系列體驗,包括“非聊天”應用程序。Snap,Quizlet,Instacart和Shopify是早期采用者。
開發(fā)gpt-3.5-turbo的最初動機可能是降低ChatGPT龐大的計算成本。OpenAI首席執(zhí)行官Sam Altman曾稱ChatGPT的費用“令人瞠目結舌”,估計每次聊天的計算成本為幾美分。(擁有超過一百萬的用戶,這大概會很快增加。
但布羅克曼說,gpt-3.5渦輪增壓器在其他方面得到了改進。
“如果你正在建立一個人工智能驅動的導師,你永遠不希望導師只是給學生一個答案。你希望它總是解釋它并幫助他們學習 – 這是你應該能夠[使用API]構建的系統(tǒng)類型的一個例子,“Brockman說?!拔覀冋J為這將使API更加可用和可訪問。
ChatGPT API支持My AI,Snap最近宣布的面向Snapchat+訂閱者的聊天機器人,以及Quizlet新的Q-Chat虛擬導師功能。Shopify使用ChatGPT API為購物推薦構建了一個個性化的助手,而Instacart則利用它創(chuàng)建了Ask Instacart,這是一個即將到來的收費項目,允許Instacart客戶詢問食物,并從公司零售合作伙伴的產品數(shù)據(jù)中獲得“可購物”的答案。
“雜貨店購物可能需要很大的精神負擔,有很多因素在起作用,比如預算、健康和營養(yǎng)、個人口味、季節(jié)性、烹飪技巧、準備時間和食譜靈感,”Instacart首席架構師JJ Zhuang通過電子郵件告訴我?!叭绻斯ぶ悄苣軌虺袚@種精神負擔,我們可以幫助通常負責雜貨店購物、膳食計劃和將食物放在餐桌上的家庭領導者——并真正讓雜貨店購物真正有趣?Instacart的AI系統(tǒng)與OpenAI的ChatGPT集成后,將使我們能夠做到這一點,我們很高興開始嘗試Instacart應用程序中的可能性。
不過,那些一直密切關注 ChatGPT 傳奇的人可能想知道它是否已經時尚,可以發(fā)布——這是正確的。
早期,用戶能夠提示 ChatGPT 以種族主義和性別歧視的方式回答問題,這反映了 ChatGPT 最初訓練的偏見數(shù)據(jù)。(ChatGPT的訓練數(shù)據(jù)包括廣泛的互聯(lián)網內容,即電子書,Reddit帖子和維基百科小哥。ChatGPT還發(fā)明了事實,但沒有透露它正在這樣做,這種現(xiàn)象在人工智能中被稱為幻覺。
ChatGPT – 以及類似的系統(tǒng) – 也容易受到基于提示的攻擊,或者惡意對抗性提示,讓他們執(zhí)行不屬于其原始目標的任務。Reddit上的整個社區(qū)都圍繞著尋找“越獄”ChatGPT并繞過OpenAI實施的任何保護措施的方法而形成。在一個不那么令人反感的例子中,初創(chuàng)公司Scale AI的一名工作人員能夠讓ChatGPT透露有關其內部技術運作的信息。
毫無疑問,品牌不想成為眾矢之的。布羅克曼堅持認為他們不會。為什么會這樣?他說,其中一個原因是后端的持續(xù)改進——在某些情況下,以犧牲肯尼亞合同工為代價。但布羅克曼強調了一種新的(而且爭議較少的)方法,OpenAI稱之為聊天標記語言或ChatML。ChatML 將文本作為一系列消息與元數(shù)據(jù)一起提供給 ChatGPT API。這與標準的 ChatGPT 相反,后者使用表示為一系列令牌的原始文本。(例如,“太棒了”這個詞將被拆分為“fan”,“tas”和“tic”的標記。
例如,給定提示“我的30歲生日有哪些有趣的派對創(chuàng)意?”開發(fā)人員可以選擇在該提示后附加附加其他提示,例如“你是一個有趣的對話聊天機器人,旨在幫助用戶解決他們提出的問題。在讓 ChatGPT API 處理它之前,你應該以有趣的方式如實回答!“或”你是一個機器人”。根據(jù)Brockman的說法,這些說明有助于更好地定制和過濾ChatGPT模型的響應。
“我們正在轉向更高級別的API。如果你有一種更結構化的方式來表示系統(tǒng)的輸入,你說,“這是來自開發(fā)人員”或“這是來自用戶”……我應該期望,作為一名開發(fā)人員,你實際上可以更強大地[使用ChatML]來抵御這些類型的即時攻擊,“Brockman說。
另一個(希望)可以防止意外的 ChatGPT 行為的變化是更頻繁的模型更新。隨著gpt-3.5-turbo的發(fā)布,開發(fā)人員將默認自動升級到OpenAI的最新穩(wěn)定模型,Brockman說,從gpt-3.5-turbo-0301(今天發(fā)布)開始。但是,如果開發(fā)人員愿意,他們可以選擇保留舊模型,這可能會在某種程度上抵消好處。
Brockman指出,無論他們是否選擇更新到最新型號,一些客戶(主要是預算相應的大型企業(yè))將通過引入專用容量計劃對系統(tǒng)性能進行更深入的控制。本月早些時候泄露的文檔中首次詳細說明了OpenAI的專用容量計劃,該計劃允許客戶為運行OpenAI模型(例如gpt-3.5-turbo)的計算基礎設施分配付費。(順便說一下,后端是Azure。
除了對實例負載的“完全控制”(通常,對 OpenAI API 的調用發(fā)生在共享計算資源上)之外,專用容量還使客戶能夠啟用更長的上下文限制等功能。上下文限制是指模型在生成其他文本之前考慮的文本;較長的上下文限制允許模型基本上“記住”更多文本。雖然更高的上下文限制可能無法解決所有偏差和毒性問題,但它們可能會導致像gpt-3.5-turbo這樣的模型產生更少的幻覺。
Brockman表示,專用容量客戶可以期待具有高達16k上下文窗口的gpt-3.5-turbo模型,這意味著他們可以接受標準ChatGPT模型四倍的令牌。這可能會讓某人粘貼一頁又一頁的稅碼,并從模型中得到合理的答案,比如說——這在今天是不可能的。
布羅克曼暗示未來會全面發(fā)布,但不會很快。
“上下文窗口開始爬升,我們現(xiàn)在只為專用容量客戶提供的部分原因是因為我們這邊有很多性能權衡,”Brockman 說。“我們最終可能能夠提供相同事物的按需版本。
鑒于OpenAI在微軟投資數(shù)十億美元后扭虧為盈的壓力越來越大,這并不奇怪。
#與ChatGPT的有趣對話#
#OpenAI#
#讓AI觸手可及#