考試能力超過 90% 人類,更多人要擔心OpenAI GPT-4 把工作搶走了

考試能力超過 90% 人類,更多人要擔心OpenAI GPT-4 把工作搶走了

GPT-4 實現了以下幾個方面的飛躍式提升:更聰明,做題水平越來越好;支援圖像輸入,擁有強大的識圖能力,但目前只限內部測試;更長的上下文,文字輸入限制提升至 2.5 萬字;回答精準性顯著提高;更安全,有害資訊更少。

GPT-4 到底有多強多聰明?

據 OpenAI 透露,GPT-4 通過了所有基礎考試而且是高分通過。例如,GPT-4 在模擬律師資格考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數學考試中排名前 11% 左右。相比之下,曾經令人震撼的 GPT-3.5 ,真實得分在倒數 10% 左右,GPT-4 的強大已經可想而知。

有網友表示:如果真如報告說的那樣就太可怕了,我感覺能力已經遠遠超過我了。

也有網友逆向思考:我躺好了!我生在了適合我的時代!

最多的聲音則是對未來工作不保的擔憂:還有哪個行業可以不被替代?

比以前的版本更大,也更燒錢

OpenAI 稱,GPT-4 比以前的版本「更大」,這意味著其已經在更多的資料上進行了訓練,並且在模型檔案中有更多的權重,這使得它的運行成本更高。

同時,OpenAI 並未公佈這個模型的參數量有多少。

OpenAI 表示,它使用的是微軟 (MSFT.US) Azure 訓練模型,微軟已經向這家初創公司投資了數十億美元。OpenAI 沒有公佈模型大小的細節,也沒有公佈用來訓練模型的硬體,理由是「競爭情況」。

目前,此領域的許多研究人員認為,人工智慧領域的許多最新進展,都來自於在數千台超級電腦上運行越來越大的模型,這些模型的訓練過程可能耗資數千萬美元。

為了不斷提高 GPT-4 性能,OpenAI 還為其研發大搞基礎建設。

在過去的兩年內,OpenAI 重建了整個深度學習堆疊,並與 Azure 一起為其工作負載從頭開始設計了一台超級電腦。一年前,OpenAI 在訓練 GPT-3.5 時第一次嘗試運行了該超級運算系統,之後他們又陸續發現並修復了一些錯誤,改進了其理論基礎。這些改進的結果是 GPT-4 的訓練運行獲得了前所未有的穩定。

OpenAI 聯合創始人兼總裁格雷格・布羅克曼(Greg Brockman)表示,OpenAI 預計,未來將由投資十億美元超級電腦的公司開發尖端模型,一些最先進的工具將帶有風險。OpenAI 希望對他們工作的某些部分保密,以給初創公司「一些喘息的空間,以真正關注安全並做好它。」

延伸閱讀:你不需要GPT-4,Notion AI才是你需要的實戰工具!費用、申請教學以及實用攻略

 

GPT-4 仍然不完全可靠

儘管功能已經非常強大,但 GPT-4 仍與早期的 GPT 模型具有相似的侷限性,其中最重要的一點是它仍然不完全可靠,也就是還有可能胡說八道。

OpenAI 也警告稱,GPT-4 還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4 仍有許多已知的侷限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。”

總的來說,GPT-4 相對於以前的模型(經過多次迭代和改進)已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%。

同時,GPT-4 訓練資料還是截止到 2021 年 9 月份。這也意味著,GPT-4 對於這個時間點以後的資訊,缺乏足夠的瞭解,也不會從其經驗中學習。

在 GPT-4 發佈之後,OpenAI 創始人阿爾特曼發推文表示:「它仍然是有缺陷的,仍然是有限的,在你花了更多的時間第一次使用它時,它似乎比實際情況更令人印象深刻。」

最令人震驚的在於,按照 OpenAI 工程師們的說法,GPT-4 的訓練在去年 8 月就已經完成,剩下的時間都在進行微調提升,以及最重要的去除危險內容生成的工作。

這也意味著,OpenAI 內部技術,比大家想像中的領先外界更多年。更可怕的是,OpenAI 還一口氣開放了 API 介面和相關論文!這讓其它對手們還怎麼追? 

但隨著更強大的 GPT-4 發佈,OpenAI 的技術能力顯然仍在不斷進步,且進展速度遠比追的速度還要快。 

與此同時,在該模型的應用方面,OpenAI 也有了最新進展。

新模型將提供給 ChatGPT 的付費使用者,也將作為 API 的一部分提供,允許程式設計師將 AI 內建到他們的應用程式中。OpenAI 將對 750 字左右的指令資訊收費 3 美分,對 750 字左右的響應資訊收費 6 美分。

OpenAI 還表示,目前摩根史坦利正在使用 GPT-4 來組織資料,而電子支付公司 Stripe 正在測試 GPT-4 是否有助於打擊欺詐。其他客戶還包括語言學習公司 Duolingo、Khan Academy 和冰島政府。

 延伸閱讀:Google發佈 ChatGPT 競品BARD過程為何猶猶豫豫?Alphabet 董事會主席透露原因

 

NetEase
作者

網易科技,有態度的科技門戶!關注微信公眾號(tech_163),看有態度的深度內容。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則