日韩Vedios一区二区三区,国产精品主播免费,91婷婷韩国欧美

能打敗GPT的只有OpenAI自己！

ChatGPT火遍全球才四個月，OpenAI就帶來了更強(qiáng)大的GPT-4。

目前來看主要特點(diǎn)是：

邏輯推理更強(qiáng)，能代替你考律師證
文字輸入更多，限制提升至 2.5 萬字
識圖能力，甚至可以給你講個笑話
更聰明，很難PUA它了
更安全，忽悠它越獄更難了

除此之外，更重要的是，OpenAI還開放了GPT-4的API，這意味著基于GPT-4會衍生出各種各樣的APP和花樣功能。

微軟營銷主管在GPT-4發(fā)布后第一時間證實，微軟的新必應(yīng)已經(jīng)用上了GPT-4。

此外，基于GPT-4的軟件也開始涌現(xiàn)出來，有幫助盲人和低視力用戶提升視覺能力的。

來源:Open AI

也有基于GPT-4打造的教育、編程軟件，他們甚至開始用GPT-4打起廣告招募學(xué)員了...

來源:Open AI

而GPT-4的商業(yè)前景并不止這些，玩梗講故事、寫代碼、考試等，各種專業(yè)和學(xué)術(shù)水準(zhǔn)，直接和人類相當(dāng)！

01 能力超90%人類

你能想象10秒生成一個網(wǎng)站，速成一篇論文，標(biāo)準(zhǔn)化考試始終名列前茅的大佬嗎？GPT-4就是傳說中“別人家的孩子”。

與ChatGPT所用的模型相比，GPT-4不僅能夠處理圖像內(nèi)容，且回復(fù)的準(zhǔn)確性有所提高。

而且一本正經(jīng)胡說八道的情況，基本不會再出現(xiàn)了。

通俗來講，GPT-4提高了ChatGPT的核心技術(shù)，相比此前版本，具有更廣泛的一般知識和解決問題的能力，使得聊天軟件能夠以更高的準(zhǔn)確度解決更難的問題。

OpenAI表示，新模型產(chǎn)生的錯誤答案更少，將更少地偏離談話軌道，更少地談?wù)摻稍掝}，甚至在許多標(biāo)準(zhǔn)化測試中比人類表現(xiàn)得更好。“當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時，差異就會出現(xiàn)”，GPT-4更可靠、更有創(chuàng)意，并且能夠處理更細(xì)微的指令。“

表現(xiàn)究竟有多好？

考試基本全過

據(jù)OpenAI 透露，GPT-4 通過了所有基礎(chǔ)考試，而且還是高分通過。

比如，GPT-4在模擬律師資格考試的成績在考生中排名前 10% 左右，在 SAT 閱讀考試中排名前7%左右，在SAT數(shù)學(xué)考試中排名前11% 左右。

來源:Open AI

相比之下，原先的最強(qiáng)產(chǎn)品GPT-3.5 ，真實得分在倒數(shù)10%左右，GPT-4 的強(qiáng)大可想而知。而且滿分為800分的 SAT Math，它從590 分提升到了700 分。

來源:Open AI

看圖玩梗

OpenAI 花了 6 個月的時間使用對抗性測試程序和 ChatGPT 的經(jīng)驗教訓(xùn)對 GPT-4 進(jìn)行迭代調(diào)整，從而在真實性、可控性等方面取得了有史以來最好的結(jié)果。

GPT-4使用了第四代大型語言模型，與之前的GPT系列相比，GPT4最重大的突破就是實現(xiàn)了多模態(tài)化。

具體來說，就是可以接受文本和圖像形式的提問了，新能力與純文本設(shè)置并行，允許用戶指定任何視覺或語言任務(wù)。

不光能識圖還能根據(jù)文本創(chuàng)造的語境來理解圖片，通過穿插的文本和圖像組成的輸入，它能夠生成自然語言、代碼等文本輸出。此外，還能一秒識梗，還能解釋梗在哪里，為什么會有這個梗。

它的讀圖能力不僅能用于理解幽默，還可以用于進(jìn)行更學(xué)術(shù)的應(yīng)用。處理更復(fù)雜的圖像信息，包括表格、考試題目截圖、論文截圖。

比如在提供一張柱狀圖時，它可以從中抓取關(guān)鍵信息，做出總結(jié)并進(jìn)行進(jìn)一步的計算分析；而當(dāng)提供一些論文的截圖時，它還能處理圖片中的文字和圖中圖，精煉其中的要點(diǎn)，并歸納出論文圖片里的主旨大意。

來源:Open AI

不過Open AI表示，目前圖像輸入仍處于研究預(yù)覽階段，暫不公開。但Open AI公司已經(jīng)在其官網(wǎng)上為大家展示了些圖像輸入的例子。

比如當(dāng)用戶問到這張圖片有什么好笑的，它是這么回答：

來源:Open AI

GPT：圖片顯示了一個“閃電電纜”適配器的包，有三個面板。

1:智能手機(jī)，VGA接口(一個大的，藍(lán)色的，通常用于電腦顯示器)插入充電端口。

2:“閃電電纜”適配器的包裝上有一個VGA連接器的圖片。

3:VGA連接器的特寫，末端有一個小的Lightning連接器(用于給iphone和其他蘋果設(shè)備充電)。

這幅圖的幽默之處在于，把一個大而過時的VGA接口，插入一個小而現(xiàn)代的智能手機(jī)充電端口是荒謬的。

再比如，當(dāng)用戶問你能解釋一下這個圖片的梗嗎?

GPT-4：這張圖片是把兩件不相關(guān)的事情結(jié)合在一起的笑話:來自太空的地球圖片和雞塊。

這個表情包中的幽默來自于文字和圖像的意外并置，文本設(shè)定了對地球宏偉形象的期望，但這個形象實際上卻是炸雞塊。

雖然一本正經(jīng)解釋梗的感覺有點(diǎn)怪，但GPT-4顯然是理解了圖片之后才能有這番解釋出現(xiàn)，就是GPT系列模型進(jìn)步最大的地方，

除此之外，GPT-4 的長度限制提升到 32K tokens，即能處理超過 25000 個單詞的文本，并且可以使用長格式內(nèi)容創(chuàng)建、擴(kuò)展對話、文檔搜索和分析等。

OpenAI 還貼心地發(fā)布了 GPT-4 開發(fā)者視頻，手把手教你如何自己當(dāng)程序員、檢查錯誤信息、報稅。

關(guān)于“胡編亂造”和“有害答案”

OpenAI稱，該公司花費(fèi)6個月的時間，利用對抗性測試程序和ChatGPT的經(jīng)驗教訓(xùn)迭代調(diào)整GPT-4，從而在真實性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。

在公司內(nèi)部的對抗性真實性評估中，GPT-4的得分比最新的GPT-3.5高出40%，相應(yīng)的“不允許內(nèi)容請求的傾向”降低了 82%，根據(jù)政策響應(yīng)敏感請求（如醫(yī)療建議和自我傷害）的頻率提高了29%。

Open AI也表示“至少對我們而言，GPT-4訓(xùn)練運(yùn)行前所未有地穩(wěn)定，成為首個能夠提前準(zhǔn)確預(yù)測其訓(xùn)練性能的大型模型?！?/p>

該模型在多種語言方面均表現(xiàn)出優(yōu)越性。OpenAI稱，在測試的26種語言中，GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5以及其他大語言模型語言性能表現(xiàn)。其中還包括了像拉脫維亞語、威爾士語、斯瓦希里語這些冷門到邪門的語言。

來源:Open AI

其中GPT-4的中文能夠達(dá)到80.1%的準(zhǔn)確性，而GPT-3.5的英文準(zhǔn)確性僅為70.1%，目前GPT-4英文準(zhǔn)確性提高到了85.5%。

也需要改進(jìn)

當(dāng)然Open AI的新孩子也并不全然都是優(yōu)點(diǎn)，在推特上就有用戶連夜寫出了自己的一份心得測評說，GPT-4還是和以前一樣，不太會幻想未來；仍然回避一些敏感的話題。

此外，GPT4對于這種非文本輸入的處理能力還是有限，比如GPT-4在GRE數(shù)學(xué)部分上只取得了55分，在SAT的數(shù)學(xué)部分上只有52.6分的成績。

02 通用人工智能時代來了

在ChatGPT憑借一己之力，在極短的時間內(nèi)引爆全球AI產(chǎn)業(yè)變革的時候，微軟、谷歌等科技巨頭有了危機(jī)感，準(zhǔn)備先下手為強(qiáng)，搶奪市場。

來源:Open AI

微軟大張旗鼓的表示新版必應(yīng)已搭載GPT-4，谷歌也發(fā)布了Big Bard，其內(nèi)部正在測試一款名為“Apprentice Bard“的 AI 模型，它基于一種”突破性的對話技術(shù)”——LaMDA ，可提供問答搜索能力。甚至連布林本人都親自來改代碼了，只為與ChatGPT競爭。

首富馬斯克也想分一杯羹，馬老板頻頻與一位曾在OpenAI短暫工作的兩年的員工建立聯(lián)系，試圖成立AI實驗室，開發(fā)出ChatGPT的替代品。

針對微軟和OpenAI的合作，谷歌也完全復(fù)制了這個模式，支持了一家由前OpenAI員工組成的初創(chuàng)公司——Anthropic，打造了一款ChatGPT的最強(qiáng)競品，目前還在優(yōu)化構(gòu)建方面。

在中國市場，也有一些大語言模型可以期待，比如百度的文心一言，將會在明天發(fā)布。原美團(tuán)聯(lián)合創(chuàng)始人王慧文的創(chuàng)業(yè)公司“光年之外”也是如火如荼。

隨著這些AI大模型的落地，我們距離通用人工智能也越來越近了。

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請聯(lián)系原著作權(quán)人。