能打敗GPT的只有OpenAI自己!
ChatGPT火遍全球才四個(gè)月,OpenAI就帶來了更強(qiáng)大的GPT-4。
目前來看主要特點(diǎn)是:
- 邏輯推理更強(qiáng),能代替你考律師證
- 文字輸入更多,限制提升至 2.5 萬字
- 識(shí)圖能力,甚至可以給你講個(gè)笑話
- 更聰明,很難PUA它了
- 更安全,忽悠它越獄更難了
除此之外,更重要的是,OpenAI還開放了GPT-4的API,這意味著基于GPT-4會(huì)衍生出各種各樣的APP和花樣功能。
微軟營(yíng)銷主管在GPT-4發(fā)布后第一時(shí)間證實(shí),微軟的新必應(yīng)已經(jīng)用上了GPT-4。
此外,基于GPT-4的軟件也開始涌現(xiàn)出來,有幫助盲人和低視力用戶提升視覺能力的。
來源:Open AI
也有基于GPT-4打造的教育、編程軟件,他們甚至開始用GPT-4打起廣告招募學(xué)員了...
來源:Open AI
而GPT-4的商業(yè)前景并不止這些,玩梗講故事、寫代碼、考試等,各種專業(yè)和學(xué)術(shù)水準(zhǔn),直接和人類相當(dāng)!
01
能力超90%人類
你能想象10秒生成一個(gè)網(wǎng)站,速成一篇論文,標(biāo)準(zhǔn)化考試始終名列前茅的大佬嗎?GPT-4就是傳說中“別人家的孩子”。
與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,且回復(fù)的準(zhǔn)確性有所提高。
而且一本正經(jīng)胡說八道的情況,基本不會(huì)再出現(xiàn)了。
通俗來講,GPT-4提高了ChatGPT的核心技術(shù),相比此前版本,具有更廣泛的一般知識(shí)和解決問題的能力,使得聊天軟件能夠以更高的準(zhǔn)確度解決更難的問題。
OpenAI表示,新模型產(chǎn)生的錯(cuò)誤答案更少,將更少地偏離談話軌道,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好?!爱?dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就會(huì)出現(xiàn)”,GPT-4更可靠、更有創(chuàng)意,并且能夠處理更細(xì)微的指令?!?/p>
表現(xiàn)究竟有多好?
考試基本全過
據(jù)OpenAI 透露,GPT-4 通過了所有基礎(chǔ)考試,而且還是高分通過。
比如,GPT-4在模擬律師資格考試的成績(jī)?cè)诳忌信琶?10% 左右,在 SAT 閱讀考試中排名前7%左右,在SAT數(shù)學(xué)考試中排名前11% 左右。
來源:Open AI
相比之下,原先的最強(qiáng)產(chǎn)品GPT-3.5 ,真實(shí)得分在倒數(shù)10%左右,GPT-4 的強(qiáng)大可想而知。而且滿分為800分的 SAT Math,它從590 分提升到了700 分。
來源:Open AI
看圖玩梗
OpenAI 花了 6 個(gè)月的時(shí)間使用對(duì)抗性測(cè)試程序和 ChatGPT 的經(jīng)驗(yàn)教訓(xùn)對(duì) GPT-4 進(jìn)行迭代調(diào)整 ,從而在真實(shí)性、可控性等方面取得了有史以來最好的結(jié)果。
GPT-4使用了第四代大型語言模型,與之前的GPT系列相比,GPT4最重大的突破就是實(shí)現(xiàn)了多模態(tài)化。
具體來說,就是可以接受文本和圖像形式的提問了,新能力與純文本設(shè)置并行,允許用戶指定任何視覺或語言任務(wù)。
不光能識(shí)圖還能根據(jù)文本創(chuàng)造的語境來理解圖片,通過穿插的文本和圖像組成的輸入,它能夠生成自然語言、代碼等文本輸出。此外,還能一秒識(shí)梗,還能解釋梗在哪里,為什么會(huì)有這個(gè)梗。
它的讀圖能力不僅能用于理解幽默,還可以用于進(jìn)行更學(xué)術(shù)的應(yīng)用。處理更復(fù)雜的圖像信息,包括表格、考試題目截圖、論文截圖。
比如在提供一張柱狀圖時(shí),它可以從中抓取關(guān)鍵信息,做出總結(jié)并進(jìn)行進(jìn)一步的計(jì)算分析;而當(dāng)提供一些論文的截圖時(shí),它還能處理圖片中的文字和圖中圖,精煉其中的要點(diǎn),并歸納出論文圖片里的主旨大意。
來源:Open AI
不過Open AI表示,目前圖像輸入仍處于研究預(yù)覽階段,暫不公開。但Open AI公司已經(jīng)在其官網(wǎng)上為大家展示了些圖像輸入的例子。
比如當(dāng)用戶問到這張圖片有什么好笑的,它是這么回答:
來源:Open AI
GPT:圖片顯示了一個(gè)“閃電電纜”適配器的包,有三個(gè)面板。
1:智能手機(jī),VGA接口(一個(gè)大的,藍(lán)色的,通常用于電腦顯示器)插入充電端口。
2:“閃電電纜”適配器的包裝上有一個(gè)VGA連接器的圖片。
3:VGA連接器的特寫,末端有一個(gè)小的Lightning連接器(用于給iphone和其他蘋果設(shè)備充電)。
這幅圖的幽默之處在于,把一個(gè)大而過時(shí)的VGA接口,插入一個(gè)小而現(xiàn)代的智能手機(jī)充電端口是荒謬的。
再比如,當(dāng)用戶問你能解釋一下這個(gè)圖片的梗嗎?
GPT-4:這張圖片是把兩件不相關(guān)的事情結(jié)合在一起的笑話:來自太空的地球圖片和雞塊。
這個(gè)表情包中的幽默來自于文字和圖像的意外并置,文本設(shè)定了對(duì)地球宏偉形象的期望,但這個(gè)形象實(shí)際上卻是炸雞塊。
雖然一本正經(jīng)解釋梗的感覺有點(diǎn)怪,但GPT-4顯然是理解了圖片之后才能有這番解釋出現(xiàn),就是GPT系列模型進(jìn)步最大的地方,
除此之外,GPT-4 的長(zhǎng)度限制提升到 32K tokens,即能處理超過 25000 個(gè)單詞的文本,并且可以使用長(zhǎng)格式內(nèi)容創(chuàng)建、擴(kuò)展對(duì)話、文檔搜索和分析等。
OpenAI 還貼心地發(fā)布了 GPT-4 開發(fā)者視頻,手把手教你如何自己當(dāng)程序員、檢查錯(cuò)誤信息、報(bào)稅。
關(guān)于“胡編亂造”和“有害答案”
OpenAI稱,該公司花費(fèi)6個(gè)月的時(shí)間,利用對(duì)抗性測(cè)試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)迭代調(diào)整GPT-4,從而在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。
在公司內(nèi)部的對(duì)抗性真實(shí)性評(píng)估中,GPT-4的得分比最新的GPT-3.5高出40%,相應(yīng)的“不允許內(nèi)容請(qǐng)求的傾向”降低了 82%,根據(jù)政策響應(yīng)敏感請(qǐng)求(如醫(yī)療建議和自我傷害)的頻率提高了29%。
Open AI也表示“至少對(duì)我們而言,GPT-4訓(xùn)練運(yùn)行前所未有地穩(wěn)定,成為首個(gè)能夠提前準(zhǔn)確預(yù)測(cè)其訓(xùn)練性能的大型模型?!?/p>
該模型在多種語言方面均表現(xiàn)出優(yōu)越性。OpenAI稱,在測(cè)試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5以及其他大語言模型語言性能表現(xiàn)。其中還包括了像拉脫維亞語、威爾士語、斯瓦希里語這些冷門到邪門的語言。
來源:Open AI
其中GPT-4的中文能夠達(dá)到80.1%的準(zhǔn)確性,而GPT-3.5的英文準(zhǔn)確性僅為70.1%,目前GPT-4英文準(zhǔn)確性提高到了85.5%。
也需要改進(jìn)
當(dāng)然Open AI的新孩子也并不全然都是優(yōu)點(diǎn),在推特上就有用戶連夜寫出了自己的一份心得測(cè)評(píng)說,GPT-4還是和以前一樣,不太會(huì)幻想未來;仍然回避一些敏感的話題。
此外,GPT4對(duì)于這種非文本輸入的處理能力還是有限,比如GPT-4在GRE數(shù)學(xué)部分上只取得了55分,在SAT的數(shù)學(xué)部分上只有52.6分的成績(jī)。
02
通用人工智能時(shí)代來了
在ChatGPT憑借一己之力,在極短的時(shí)間內(nèi)引爆全球AI產(chǎn)業(yè)變革的時(shí)候,微軟、谷歌等科技巨頭有了危機(jī)感,準(zhǔn)備先下手為強(qiáng),搶奪市場(chǎng)。
來源:Open AI
微軟大張旗鼓的表示新版必應(yīng)已搭載GPT-4,谷歌也發(fā)布了Big Bard,其內(nèi)部正在測(cè)試一款名為“Apprentice Bard“的 AI 模型,它基于一種”突破性的對(duì)話技術(shù)”——LaMDA ,可提供問答搜索能力。甚至連布林本人都親自來改代碼了,只為與ChatGPT競(jìng)爭(zhēng)。
首富馬斯克也想分一杯羹,馬老板頻頻與一位曾在OpenAI短暫工作的兩年的員工建立聯(lián)系,試圖成立AI實(shí)驗(yàn)室,開發(fā)出ChatGPT的替代品。
針對(duì)微軟和OpenAI的合作,谷歌也完全復(fù)制了這個(gè)模式,支持了一家由前OpenAI員工組成的初創(chuàng)公司——Anthropic,打造了一款ChatGPT的最強(qiáng)競(jìng)品,目前還在優(yōu)化構(gòu)建方面。
在中國(guó)市場(chǎng),也有一些大語言模型可以期待,比如百度的文心一言,將會(huì)在明天發(fā)布。原美團(tuán)聯(lián)合創(chuàng)始人王慧文的創(chuàng)業(yè)公司“光年之外”也是如火如荼。
隨著這些AI大模型的落地,我們距離通用人工智能也越來越近了。
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。