OpenAI申請註冊GPT-5商標,將具備語音理解與生成的能力

OpenAI申請註冊GPT-5商標,將具備語音理解與生成的能力

ADVERTISEMENT

最近,美國專利商標局 (USPTO) 一份檔顯示:OpenAI 於 7 月 18 日提交了「GPT-5」的商標申請,並且已經被 USPTO Office 接收(滿足最低申請要求),後續將由負責人員進一步審查。

文件網址:https://uspto.report/TM/98089548

OpenAI 在這份商標申請中提及了 GPT-5 的基本資訊。GPT-5 將是一個用於自然語言處理、生成、理解和分析的大型語言模型(LLM)。值得注意的是,除了文本,GPT-5 還將具備語音理解與生成的能力。 

OpenAI申請註冊GPT-5商標,將具備語音理解與生成的能力

具體來說,GPT-5 的功能包括把文本或語音從一種語言翻譯成另一種語言、語音辨識、產生文本和語音等。此外,GPT-5 可能還具備學習、分析、分類和回應資料的能力。 

有趣的是,今年上半年已經機器學習領域的專家、學者已經多次聯合發表公開信,呼籲人們重視生成式 AI 的潛在風險,並限制構建生成式 AI 大模型。其中,圖靈獎得主 Geoffrey Hinton 更是在 4 月從Google離職,警告人們生成式 AI 將「對人類構成威脅」。OpenAI 作為 ChatGPT、GPT-4 等大模型背後的公司,無疑被推上了風口浪尖。 

當時,OpenAI 表示將會專注於改進 GPT-4 版本,GPT-5 不在其近期計畫內。 

現在,雖然 OpenAI 已經提交了商標申請,但 GPT-5 也不會很快到來。OpenAI CEO Sam Altman 曾在 6 月也說明過這一點。 

OpenAI CEO Sam Altman

一般來說,科技公司會為尚未開發的概念申請商標,以保證其領先於競爭對手,並保護智慧財產權。申請中說明的 GPT-5 功能大部分 GPT-4 已經具備,在一定程度上 GPT-5 是 GPT-4 的改進版本。 

GPT-4 發表之後,學界和業界對大模型有了更加深入的研究和探討。ChatGPT 和 GPT-4 強大的性能讓人們看到了大模型巨大的潛力,因而對 GPT-5 抱有很多期待。 

首先在多模態能力方面,目前 GPT-4 只能處理文本和圖像兩種類型的資料,人們希望 GPT-5 能夠在語音、影片等其他模態上有所突破。

其次,在運算效率與成本上,GPT-4 的定價是每 1k 個 prompt token 0.03 美元,預設速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。而 GPT-3.5-turbo 的定價是每 1k 個 token 0.002 美元,只有 GPT-4 的 1/15。GPT-5 的價格或許會比 GPT-4 更高。

最後,ChatGPT、GPT-4 等大型語言模型都固有一些問題,包括「幻覺」、「偏見」等等,這些問題讓大模型難以直接實際應用。GPT-4 相對於以前的模型已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%:

OpenAI申請註冊GPT-5商標,將具備語音理解與生成的能力

我們期待 GPT-5 在「幻覺」和「對齊」方面能夠進一步改善。 

此外,近期一些新模型在上下文視窗方面有了新的突破,例如 Anthropic 將 Claude 2 的上下文視窗擴充至 200K token(目前發表版本僅支持 100K token),將大幅提升模型長文閱讀的能力。這也給以後發表的 LLM 帶來了新的壓力,包括 GPT-5。 

當然,GPT-5 實際會具備哪些能力,還要等到它問世那一天才能揭曉謎底,我們拭目以待。 

資料來源:

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則