OpenAI 發表全新 AI 模型 o3：可「用圖像思考」，理解手繪草圖與圖表資訊

OpenAI 宣布推出旗下最新一代推理型人工智慧模型 o3，具備分析圖像的能力，能夠理解如白板筆記、草圖、圖表等視覺內容，甚至能將這些圖像納入推理過程中。這意味著 AI 不再只是「看懂圖」，而是能真正「用圖像進行思考」。

o3 與 o4-mini 同步登場，進一步整合 ChatGPT 多種工具

與 o3 一同發表的，還有運算效能較輕巧、反應速度更快的 o4-mini 模型。兩款模型已針對數學、程式編碼、科學推理與圖像理解進行最佳化，並可讓 ChatGPT 用戶上傳圖像供 AI 分析討論，甚至進行旋轉、縮放與視覺標註等操作。

根據 OpenAI 說法，o3 是首批能同時調用 ChatGPT 所有工具 的模型，包括：

網頁搜尋工具（Browse）
Python 程式執行環境（Code Interpreter）
圖像理解與圖像生成（DALL·E）

這些能力的結合，使 AI 能獨立處理多步驟、跨模態的複雜任務，朝向具備主動決策能力的「AI 代理人」邁進。

圖像理解進化：從「看圖」到「融入推理鏈」

OpenAI 強調，這些模型的進展不只是能看懂圖像，更能將視覺資訊納入邏輯推理流程中。這種「圖像思考」能力，對於科學研究、工程設計、教育應用、甚至創意產業來說，都將開啟更多想像空間。

舉例來說，使用者可上傳一張數學草圖、流程圖或白板筆記，讓 AI 不僅描述圖中內容，還能進一步針對邏輯進行解釋與延伸討論。

目前已開放給 ChatGPT Plus、Pro 與 Team 用戶

從本週三起，o3 與 o4-mini 已開放給 ChatGPT Plus（每月 20 美元）、Pro 與企業級 Team 用戶使用。Free 用戶則尚未支援。

此外，OpenAI 也再次被問到命名問題，CEO 山姆・奧特曼（Sam Altman）笑稱：「我們夏天前會處理命名問題，之後大家有幾個月可以盡情吐槽我們，這是我們活該的。」

安全機制更新惹議，OpenAI 表示「保留應變權利」

針對近期 AI 安全爭議，OpenAI 表示 o3 與 o4-mini 都經過公司史上最嚴格的安全測試，並採用新版「準備框架（Preparedness Framework）」。但同時，OpenAI 也修改了部分政策，例如不再為部分微調模型進行預先測試，並未對最新 GPT-4.1 模型發布詳細的模型卡（model card）文件，引起部分社群關注。

該公司補充指出，若有其他公司推出高風險且缺乏安全機制的 AI 系統，OpenAI 保留調整自家安全政策的彈性空間。