GPT-3.5 Turbo支持微調了，開發人員可以打造專屬ChatGPT

OpenAI 又迎來了一次新的產品升級。

現在企業客戶終於可以對 GPT-3.5 Turbo 進行微調了。這樣一來，開發人員能夠得到在自己的使用案例上表現更好的自訂模型，並大規模地運行這些模型。

至於實際效果，早期測試已經證明，GPT-3.5 Turbo 微調版本的能力在一些小範圍任務上可以媲美甚至超越基礎 GPT-4 模型。

OpenAI 表示，此次微調 API 的傳入和導出資料完全歸客戶所有，它自己或任何其他機構都不能使用這些資料來訓練其他模型。這一做法確保客戶資料的安全性和隱私性。

We've just launched fine-tuning for GPT-3.5 Turbo! Fine-tuning lets you train the model on your company's data and run it at scale. Early tests have shown that fine-tuned GPT-3.5 Turbo can match or exceed GPT-4 on narrow tasks: https://t.co/VaageW9Kaw pic.twitter.com/nndOyxS2xs
— OpenAI (@OpenAI) August 22, 2023

對於 GPT-3.5 Turbo 支持微調功能，英偉達 AI 科學家 Jim Fan 表示，這是 OpenAI 自 APP Store 之後最重要的產品升級。

OpenAI’s most significant product update since the App Store: GPT-3.5 finetuning API. This will be the largest LoRA-as-a-service ever. GPT-4 ft is coming in a few months.

Pricing: inference (output tokens) is 2x more expensive than training tokens.

API is quite simple: submit a… pic.twitter.com/RlBhjC02gA
— Jim Fan (@DrJimFan) August 22, 2023

微調後性能更強、提示更短、速度更快

自 GPT-3.5 Turbo 推出以來，開發人員和企業一直要求可以自訂該模型，以此創建獨特和差異化的使用者體驗。

隨著 OpenAI 宣佈支援微調功能，開發人員現在可以運行監督微調，使得 GPT-3.5 Turbo 在一些常見使用案例上輸出更好的結果。

首先增強了可控性。微調後的模型可以更好地遵循指令，比如輸出簡潔或者使用給定語言進行回應。舉個例子，開發人員可以利用微調保證在提示使用德語時，始終以德語進行回答。

其次保證可靠的輸出格式。微調提升了模型輸出一致性格式的能力，這對於程式碼補全或生成 API 調用等要求特定回應格式的應用來說很重要。開發人員可以通過微調更可靠地將使用者提示轉換為高品質的 JSON 程式碼片段，以供自己的系統使用。

最後是自訂語氣。微調是「磨煉」模型輸出語氣的好方法，以此更適合企業品牌聲音。擁有知名品牌聲音的企業可以透過微調，讓模型輸出與自身調性更加一致。

除了性能更強，微調後的 GPT-3.5 Turbo 模型可以在縮短提示的同時保證性能不會大變。此外微調後可以處理 4k token，這是 OpenAI 以往微調模型的兩倍。早期測試人員在對模型指令進行微調時，提示大小最高可以縮短 90%，進而加快了每個 API 調用的速度，減少了成本。

當與提示工程、資訊檢索和函式呼叫等其他技術結合使用時，微調將變成超級強大的工具。OpenAI 還表示，今天秋季還將支援對函式呼叫和 gpt-3.5-turbo-16k 的微調。

微調一般分為四步完成：準備資料、上傳檔案、創建一個微調任務和使用一個微調模型。

安全性也非常重要。為了在微調過程中保證預設模型的安全性，微調訓練資料通過了 OpenAI 的審核 API 和 GPT-4 支援的審核系統，進而檢測出與其安全標準相衝突的不安全訓練資料。

價格有點貴

GPT-3.5 Turbo 的微調成本分為兩部分，包括初始訓練成本和使用成本。其中：

訓練階段：1K Tokens 要 0.008 美元
使用輸入：1K Tokens 要 0.012 美元
使用輸出：1K Tokens 要 0.016 美元

舉個例子，如果要對 10 萬 tokens 的訓練檔進行微調，並訓練 3 個 epochs，則預計成本為 2.40 美元。

對此，有人表示，價格有點小貴，是基礎 GPT-3.5 模型的 4 倍了。

資料來源：

GPT-3.5 Turbo fine-tuning and API updates