2025.04.17 16:15

OpenAI 發表全新 AI 模型 o3:可「用圖像思考」,理解手繪草圖與圖表資訊

ADVERTISEMENT

OpenAI 宣布推出旗下最新一代推理型人工智慧模型 o3,具備分析圖像的能力,能夠理解如白板筆記、草圖、圖表等視覺內容,甚至能將這些圖像納入推理過程中。這意味著 AI 不再只是「看懂圖」,而是能真正「用圖像進行思考」。

o3 與 o4-mini 同步登場,進一步整合 ChatGPT 多種工具

與 o3 一同發表的,還有運算效能較輕巧、反應速度更快的 o4-mini 模型。兩款模型已針對數學、程式編碼、科學推理與圖像理解進行最佳化,並可讓 ChatGPT 用戶上傳圖像供 AI 分析討論,甚至進行旋轉、縮放與視覺標註等操作。

根據 OpenAI 說法,o3 是首批能同時調用 ChatGPT 所有工具 的模型,包括:

ADVERTISEMENT

  • 網頁搜尋工具(Browse)

  • Python 程式執行環境(Code Interpreter)

  • 圖像理解與圖像生成(DALL·E)

這些能力的結合,使 AI 能獨立處理多步驟、跨模態的複雜任務,朝向具備主動決策能力的「AI 代理人」邁進。

圖像理解進化:從「看圖」到「融入推理鏈」

OpenAI 強調,這些模型的進展不只是能看懂圖像,更能將視覺資訊納入邏輯推理流程中。這種「圖像思考」能力,對於科學研究、工程設計、教育應用、甚至創意產業來說,都將開啟更多想像空間。

舉例來說,使用者可上傳一張數學草圖、流程圖或白板筆記,讓 AI 不僅描述圖中內容,還能進一步針對邏輯進行解釋與延伸討論。

ADVERTISEMENT

目前已開放給 ChatGPT Plus、Pro 與 Team 用戶

從本週三起,o3 與 o4-mini 已開放給 ChatGPT Plus(每月 20 美元)、Pro 與企業級 Team 用戶使用。Free 用戶則尚未支援。

此外,OpenAI 也再次被問到命名問題,CEO 山姆・奧特曼(Sam Altman)笑稱:「我們夏天前會處理命名問題,之後大家有幾個月可以盡情吐槽我們,這是我們活該的。」

ADVERTISEMENT

安全機制更新惹議,OpenAI 表示「保留應變權利」

針對近期 AI 安全爭議,OpenAI 表示 o3 與 o4-mini 都經過公司史上最嚴格的安全測試,並採用新版「準備框架(Preparedness Framework)」。但同時,OpenAI 也修改了部分政策,例如不再為部分微調模型進行預先測試,並未對最新 GPT-4.1 模型發布詳細的模型卡(model card)文件,引起部分社群關注。

該公司補充指出,若有其他公司推出高風險且缺乏安全機制的 AI 系統,OpenAI 保留調整自家安全政策的彈性空間。

ADVERTISEMENT

 

ADVERTISEMENT