FB 建議貼文

選取貼文複製成功(包含文章連結)!

AI 傳奇 Andrej Karpathy 宣佈加盟 Anthropic!重返預訓練第一線

AI 傳奇 Andrej Karpathy 宣佈加盟 Anthropic!重返預訓練第一線

 

卡帕西(Andrej Karpathy)作為現代人工智慧領域最具影響力的傳奇研究員與 OpenAI 共同創始成員,近日在社群平台 X 上宣布正式加盟 Anthropic,專注於大型語言模型(LLM)的預訓練與核心研究。

這項指標性的人事變動,不僅象徵著這位曾主導特斯拉自動駕駛視覺團隊的技術大師重返大模型研發一線,更在 OpenAI、Google DeepMind、Meta 與 xAI 的巨頭混戰中,為 Anthropic 注入了一劑強心針。

AI 傳奇 Andrej Karpathy 宣佈加盟 Anthropic!重返預訓練第一線

從 OpenAI、特斯拉到 Anthropic 

卡帕西的職業生涯堪稱現代 AI 演進史的縮影。作為 OpenAI 的早期共同創始成員,他在影像描述(Image Captioning)與視覺—語義對齊等電腦視覺領域奠定了深厚基礎。

隨後,他被埃隆·馬斯克(Elon Musk)延攬至特斯拉(Tesla)擔任 AI 總監,主導 Autopilot 視覺團隊,成為推動特斯拉捨棄雷達、堅定走向「純視覺(Camera-only)」自動駕駛路線的核心人物。

2022 年離開特斯拉後,卡帕西於 2023 年重返 OpenAI 參與 ChatGPT 相關的核心研發,並於 2024 年再度離職創辦專注 AI 原生教育的新創公司 Eureka Labs。如今加盟 Anthropic,他將加入由 Nick Joseph 領導的預訓練團隊。這項決定意味著他將暫時擱置教育創業項目,重新將全部精力投入到最具變革性的前沿模型開發中。

決戰預訓練關卡:頂級科學家為何回歸「模型工廠」最底層?

在大型語言模型的開發流程中,「預訓練(Pre-training)」是最耗費算力、資金與技術資源的初始關鍵環節。

在這個階段,模型需要接觸並消化海量的原始數據,從中學習人類語言的語法結構、邏輯關聯以及對物理世界的常識認知,這直接決定了模型的「智商天花板」,隨後的微調(Fine-tuning)與人類回饋強化學習(RLHF)對齊(Alignment)都只是在這個底座上進行修飾。

卡帕西選擇回歸預訓練一線,反映了頂尖科學家對目前 AI 技術瓶頸的共識——現有模型的潛力釋放已接近極限,唯有在最底層的預訓練架構、多模態融合與數據質量上取得突破,才能催生出下一代真正具備推理能力的 AI 代理(AI Agent)。

卡帕西在電腦視覺與深度學習的雙重背景,將使他在 Anthropic 預訓練多模態模型時展現無可替代的技術優勢。

OpenAI 內部人士對於卡帕西轉投對手陣營,給予了溫和祝福,聲稱各家實驗室都在共同推進人類科技。然而,這種外交辭令無法掩蓋目前矽谷對頂級 AI 研究員極度慘烈的爭奪戰。能夠真正理解並主導千億級參數模型預訓練的頂尖人才,在全球不超過數百人,他們每一次的流向,都可能直接顛覆科技巨頭之間的攻守勢態。

卡帕西選擇 Anthropic 而非重返 OpenAI,除了技術研發的考量外,更隱含了對企業組織治理的考量。

在 OpenAI 經歷了多次管理層動盪、安全團隊集體出走以及商業化與安全性的內部撕裂後,以「安全與可信賴 AI」為宗旨、組織文化相對低調務實的 Anthropic,顯然為追求純粹研究的科學家提供了更具吸引力的「避風港」。

 

 

 

KKJ
作者

快科技成立於1998年,是驅動之家旗下科技媒體業務,中國極具影響力的泛科技領域媒體平台之一。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則